fotoğraf 19.jpg
Felix Yanwei Wang - MIT Elektrik Mühendisliği ve Bilgisayar Bilimleri (EECS) alanında doktora öğrencisi. Kaynak: MIT Haberleri

Bir robotun bulaşıkları yıkamanıza yardım ettiğini düşünün. Lavabodan bir kase sabun almasını söylüyorsunuz, ancak tutucusu tam olarak tutması gereken yeri tutmuyor.

MIT ve NVIDIA araştırmacıları tarafından geliştirilen yeni bir çerçeveyle, bir robotun davranışlarını basit hareketlerle kontrol edebilirsiniz. Bir kaseyi işaret edebilir, ekranda bir yol çizebilir veya robotun kolunu doğru yöne doğru itebilirsiniz.

Robot davranışını değiştirmeye yönelik diğer yaklaşımların aksine, bu teknik kullanıcının yeni veri toplamasını ve robotu kontrol eden makine öğrenimi modelini yeniden eğitmesini gerektirmez. Bunun yerine, robotun kullanıcının amacına en uygun eylem sırasını seçmek için gerçek zamanlı, görsel insan geri bildirimini kullanmasına olanak tanır.

Araştırmacılar bu çerçeveyi test ettiğinde, başarı oranının insan müdahalesini kullanmayan alternatif bir yaklaşıma göre %21 daha yüksek olduğu görüldü.

Gelecekte bu çerçeve, bir kullanıcının fabrikada eğitilmiş bir robota, daha önce hiç ortamı veya evdeki nesneleri görmemiş olsa bile, çeşitli ev işlerini yapması için talimat vermesini kolaylaştırabilir.

"Sıradan kullanıcıların veri toplayıp bir sinir ağı modelini ince ayar yapmasını bekleyemeyiz. Robotun kutudan çıktığı gibi çalışmasını ve bir sorun çıkarsa, bunu düzeltmek için sezgisel bir mekanizmaya ihtiyaç duymalarını bekliyorlar. Bu makalede ele aldığımız zorluk da buydu," diyor MIT Elektrik Mühendisliği ve Bilgisayar Bilimleri (EECS) bölümünde lisansüstü öğrencisi ve çalışmanın başyazarı Felix Yanwei Wang.

Sapmayı en aza indirin

Son zamanlarda araştırmacılar, bir robotun bir görevi tamamlamak için izlediği bir dizi kural olan "politikayı" öğrenmek için önceden eğitilmiş üretken yapay zeka modellerini kullandılar. Bu modeller birçok karmaşık görevi çözebilir.

Eğitim sırasında modele yalnızca geçerli robot hareketleri gösteriliyor, böylece uygun hareket yörüngeleri üretmeyi öğreniyor.

Ancak bu, bir robotun gerçekleştirdiği her eylemin kullanıcının gerçek beklentileriyle uyuşacağı anlamına gelmez. Örneğin, bir robot bir raftaki kutuları devirmeden almak üzere eğitilebilir, ancak birinin kitaplığındaki bir kutuya, kitaplık düzeni eğitim sırasında gördüğünden farklıysa, ulaşamayabilir.

Bu tür hataları düzeltmek için mühendisler genellikle yeni görevler hakkında ek veri toplar ve modeli yeniden eğitir; bu da makine öğrenimi uzmanlığı gerektiren maliyetli ve zaman alıcı bir süreçtir.

MIT ekibi ise bunun yerine kullanıcıların robotun hata yaptığı anda davranışını ayarlamasına olanak tanımak istiyor.

Ancak, bir insan robotun karar alma sürecine müdahale ederse, üretken modelin yanlışlıkla geçersiz bir eylem seçmesine neden olabilir. Robot, insanın istediği kutuyu alabilir, ancak bu sırada raftaki kitapları devirebilir.

Felix Yanwei Wang, "Kullanıcıların robotla bu tür hatalar yapmadan etkileşime girmesini istiyoruz. Böylece, geçerlilik ve uygulanabilirliği sağlarken, kullanıcının niyetleriyle daha iyi eşleşen davranışlar elde etmek istiyoruz" dedi.

Karar verme yeteneğini geliştirin

Bu etkileşimlerin robotun geçersiz eylemler gerçekleştirmesine neden olmamasını sağlamak için ekip, özel bir örnekleme prosedürü kullanıyor. Bu teknik, modelin geçerli seçenekler arasından kullanıcının hedeflerine en uygun eylemi seçmesine yardımcı oluyor.

Felix Yanwei Wang, "Kullanıcının niyetlerini dayatmak yerine, robotun niyetlerini anlamasına yardımcı oluyoruz ve örnekleme sürecinin öğrendiği davranışlar etrafında dalgalanmasına izin veriyoruz" dedi.

Bu yaklaşım sayesinde araştırma çerçeveleri, simülasyon deneylerinde ve gerçek bir robotik kolla model mutfakta yapılan testlerde diğer yöntemlerden daha iyi performans gösterdi.

Bu yöntem her zaman görevi anında tamamlamasa da kullanıcı için büyük bir avantaja sahip: Robotun görevi tamamlamasını bekleyip yeni talimatlar vermek yerine, bir hata tespit ettikleri anda robotu düzeltebiliyorlar.

Ayrıca, kullanıcı robotu doğru kaseyi alması için birkaç kez hafifçe dürttüğünde, robot bu düzeltmeyi hatırlayabilir ve bunu gelecekteki öğrenmeye dahil edebilir, böylece ertesi gün robot tekrar yönlendirilmeye ihtiyaç duymadan doğru kaseyi alabilir.

Felix Yanwei Wang, "Ancak bu sürekli iyileştirmenin anahtarı, kullanıcıların robotla etkileşime girmesini sağlayacak bir mekanizmaya sahip olmaktır ve bu çalışmada tam olarak bunu gösterdik" dedi.

Ekip, gelecekte performansı korurken veya iyileştirirken örnekleme sürecini hızlandırmayı hedefliyor. Ayrıca, robotun uyum kabiliyetini değerlendirmek için yöntemi yeni ortamlarda test etmek istiyorlar.

(Kaynak: MIT Haberleri)