Yeni araştırmalar, insanların tıpkı başka bir insana geri bildirim verir gibi, robotların hareketlerini gerçek zamanlı olarak ayarlamalarına olanak tanıyor.

Bulaşık yıkamanıza yardım eden bir robot hayal edin. Ondan lavabodan bir kase sabun almasını istiyorsunuz, ancak tutucuları tam olarak gereken yerden sabunu kavrayamıyor.
MIT ve NVIDIA'daki araştırmacılar tarafından geliştirilen yeni bir metodoloji çerçevesiyle, robotun davranışını basit hareketlerle kontrol edebilirsiniz. Kaseye işaret edebilir, ekranda bir yol çizebilir veya robotun kolunu doğru yöne doğru hafifçe itebilirsiniz.
Diğer robot davranış değiştirme yöntemlerinden farklı olarak, bu teknik kullanıcıların yeni veri toplamalarını ve robotu kontrol eden makine öğrenme modelini yeniden eğitmelerini gerektirmez. Bunun yerine, robotun gerçek zamanlı, sezgisel insan geri bildirimini kullanarak kullanıcının niyetleriyle en iyi şekilde uyumlu eylem dizisini seçmesine olanak tanır.
Araştırmacılar bu metodolojik çerçeveyi test ettiklerinde, başarı oranının insan müdahalesi kullanmayan alternatif bir yönteme göre %21 daha yüksek olduğunu tespit ettiler.
Gelecekte, bu metodoloji çerçevesi, kullanıcıların fabrikada eğitilmiş bir robotu, robot daha önce o evin ortamını veya içindeki nesneleri hiç görmemiş olsa bile, çeşitli ev işlerini yapması için yönlendirmelerini kolaylaştırabilir.
MIT Elektrik Mühendisliği ve Bilgisayar Bilimleri (EECS) yüksek lisans öğrencisi ve çalışmanın baş yazarı Felix Yanwei Wang, “Ortalama bir kullanıcının verileri manuel olarak toplaması ve bir sinir ağı modelini ince ayar yapmasını bekleyemeyiz. Robotun kutudan çıkar çıkmaz çalışmasını bekleyecekler ve bir hata oluşursa, bunu düzeltmek için sezgisel bir mekanizmaya ihtiyaç duyacaklar. Bu araştırmada ele aldığımız zorluk buydu” dedi.
Sapmaları en aza indirin
Son zamanlarda araştırmacılar, robotların bir görevi tamamlamak için izlediği bir dizi kural olan "politika"yı öğrenmek amacıyla önceden eğitilmiş üretken yapay zeka modelleri kullanıyorlar. Bu modeller birçok karmaşık görevi çözebiliyor.
Eğitim sırasında model yalnızca geçerli robot hareketlerine maruz bırakılır, böylece uygun yörüngeler oluşturmayı öğrenir.
Ancak bu, robotun her eyleminin gerçek hayatta kullanıcının istekleriyle örtüşeceği anlamına gelmez. Örneğin, bir robot kutuları devirmeden raftan alacak şekilde eğitilmiş olabilir, ancak kitaplığın düzeni eğitim sırasında gördüğünden farklıysa, birinin kitaplığındaki bir kutuya ulaşamayabilir.
Bu tür hataların üstesinden gelmek için mühendisler genellikle yeni görevle ilgili daha fazla veri toplar ve modeli yeniden eğitirler; bu, makine öğrenimi konusunda uzmanlık gerektiren, maliyetli ve zaman alıcı bir süreçtir.
Bunun yerine, MIT'deki araştırma ekibi, kullanıcıların robot hata yapar yapmaz davranışını ayarlamasına olanak tanımak istiyor.
Ancak, eğer insanlar robotun karar verme sürecine müdahale ederse, bu durum istemeden de olsa üretken modelin geçersiz bir eylem seçmesine neden olabilir. Robot kullanıcının istediği kutuyu alabilir, ancak bu sırada raftaki kitapları devirebilir.
Felix Yanwei Wang, "Kullanıcıların bu tür hatalar yapmadan robotla etkileşim kurmasını, böylece geçerlilik ve uygulanabilirliği sağlarken kullanıcı amacına daha uygun bir davranış elde etmesini istiyoruz," dedi.
Karar verme yeteneklerini geliştirin
Bu etkileşimlerin robotun geçersiz eylemler gerçekleştirmesine neden olmamasını sağlamak için araştırma ekibi özel bir örnekleme süreci kullandı. Bu teknik, modelin kullanıcının amacına en uygun eylemi geçerli seçenekler kümesinden seçmesine yardımcı olur.
Felix Yanwei Wang, "Kullanıcıya kendi irademizi dayatmak yerine, robotun niyetlerini anlamasına yardımcı oluyor ve örnekleme sürecinin, öğrendiği davranışlar etrafında dalgalanmasına izin veriyoruz," dedi.
Bu yöntem sayesinde, araştırma çerçeveleri hem simülasyon deneylerinde hem de model bir mutfakta gerçek robot kollarıyla yapılan testlerde diğer yöntemlerden daha iyi performans gösterdi.
Bu yöntem görevi her zaman anında tamamlamasa da, kullanıcılara önemli bir avantaj sunuyor: Robotun görevi tamamlamasını beklemeden, bir arıza tespit ettikleri anda robotu düzeltebiliyorlar.
Dahası, kullanıcı robotu doğru kaseyi alması için birkaç kez hafifçe ittikten sonra, robot bu düzeltici hareketi hatırlayabilir ve gelecekteki öğrenme sürecine entegre edebilir. Sonuç olarak, ertesi gün robot, ek bir talimata ihtiyaç duymadan doğru kaseyi alabilir.
"Ancak bu sürekli gelişmenin anahtarı, kullanıcıların robotla etkileşim kurabileceği bir mekanizmaya sahip olmaktır ve bu araştırmada tam olarak bunu gösterdik," dedi Felix Yanwei Wang.
Araştırma ekibi gelecekte, verimliliği korurken veya iyileştirirken örnekleme sürecinin hızını artırmayı hedefliyor. Ayrıca robotun uyarlanabilirliğini değerlendirmek için bu yöntemi yeni ortamlarda test etmek istiyorlar.
(Kaynak: MIT Haberleri)
[reklam_2]
Kaynak: https://vietnamnet.vn/ung-dung-ai-tao-sinh-giup-robot-tuong-tac-thong-minh-hon-2381531.html






Yorum (0)