งานวิจัยใหม่นี้ทำให้มนุษย์สามารถปรับการกระทำของหุ่นยนต์ได้แบบเรียลไทม์ คล้ายกับการที่มนุษย์ให้คำติชมแก่บุคคลอื่น

ลองนึกภาพหุ่นยนต์ช่วยคุณล้างจาน คุณสั่งให้มันไปหยิบชามสบู่จากอ่างล้างจาน แต่แขนจับของมันกลับจับไม่ตรงจุดที่ต้องการ
ด้วยกรอบวิธีการใหม่ที่พัฒนาโดยนักวิจัยจาก MIT และ NVIDIA คุณสามารถควบคุมพฤติกรรมของหุ่นยนต์ได้ด้วยท่าทางง่ายๆ คุณสามารถชี้ไปที่ชามหรือวาดเส้นทางบนหน้าจอ หรือเพียงแค่ดันแขนของหุ่นยนต์ไปในทิศทางที่ถูกต้องเบาๆ
แตกต่างจากวิธีการปรับเปลี่ยนพฤติกรรมหุ่นยนต์แบบอื่น เทคนิคนี้ไม่จำเป็นต้องให้ผู้ใช้รวบรวมข้อมูลใหม่และฝึกฝนโมเดลการเรียนรู้ของเครื่องจักรที่ควบคุมหุ่นยนต์ใหม่ แต่จะช่วยให้หุ่นยนต์สามารถใช้ข้อมูลป้อนกลับจากมนุษย์แบบเรียลไทม์และเลือกชุดการกระทำที่สอดคล้องกับความตั้งใจของผู้ใช้ได้ดีที่สุด
เมื่อนักวิจัยทดสอบกรอบวิธีการนี้ อัตราความสำเร็จสูงกว่าวิธีการอื่นที่ไม่ใช้การแทรกแซงจากมนุษย์ถึง 21%
ในอนาคต กรอบวิธีการนี้อาจช่วยให้ผู้ใช้สามารถควบคุมหุ่นยนต์ที่ได้รับการฝึกฝนจากโรงงานให้ทำงานบ้านต่างๆ ได้ง่ายขึ้น แม้ว่าหุ่นยนต์จะไม่เคยเห็นสภาพแวดล้อมหรือสิ่งของในบ้านหลังนั้นมาก่อนก็ตาม
“เราไม่สามารถคาดหวังให้ผู้ใช้ทั่วไปรวบรวมข้อมูลและปรับแต่งแบบจำลองเครือข่ายประสาทเทียมด้วยตนเองได้ พวกเขาคาดหวังว่าหุ่นยนต์จะทำงานได้ทันที และหากเกิดข้อผิดพลาด พวกเขาต้องการกลไกที่ใช้งานง่ายเพื่อปรับแก้ไข นี่คือความท้าทายที่เราได้ศึกษาในงานวิจัยนี้” เฟลิกซ์ ยานเหว่ย หวัง นักศึกษาปริญญาโทสาขาวิศวกรรมไฟฟ้าและวิทยาการคอมพิวเตอร์ (EECS) จาก MIT และผู้เขียนหลักของการศึกษา กล่าว
ลดความคลาดเคลื่อนให้น้อยที่สุด
เมื่อไม่นานมานี้ นักวิจัยได้ใช้โมเดล AI แบบสร้างข้อมูลล่วงหน้าเพื่อเรียนรู้ "นโยบาย" ซึ่งเป็นชุดกฎที่หุ่นยนต์ปฏิบัติตามเพื่อทำงานให้สำเร็จ โมเดลเหล่านี้สามารถแก้ปัญหาที่ซับซ้อนได้มากมาย
ในระหว่างการฝึกฝน โมเดลจะได้รับข้อมูลเฉพาะการเคลื่อนไหวของหุ่นยนต์ที่ถูกต้องเท่านั้น ดังนั้นมันจึงเรียนรู้ที่จะสร้างวิถีการเคลื่อนที่ที่เหมาะสม
อย่างไรก็ตาม นี่ไม่ได้หมายความว่าทุกการกระทำของหุ่นยนต์จะสอดคล้องกับความต้องการของผู้ใช้ในความเป็นจริงเสมอไป ตัวอย่างเช่น หุ่นยนต์อาจได้รับการฝึกฝนให้หยิบกล่องจากชั้นวางโดยไม่ทำให้กล่องล้ม แต่ก็อาจไม่สามารถหยิบกล่องบนชั้นหนังสือของใครบางคนได้ หากรูปแบบของชั้นหนังสือแตกต่างจากที่มันเห็นระหว่างการฝึกฝน
เพื่อแก้ไขข้อผิดพลาดดังกล่าว วิศวกรจึงมักรวบรวมข้อมูลเพิ่มเติมเกี่ยวกับงานใหม่และฝึกฝนโมเดลใหม่ ซึ่งเป็นกระบวนการที่มีค่าใช้จ่ายสูงและใช้เวลานาน อีกทั้งยังต้องอาศัยความเชี่ยวชาญด้านการเรียนรู้ของเครื่องจักร
แต่ในทางกลับกัน ทีมวิจัยที่ MIT ต้องการให้ผู้ใช้สามารถปรับเปลี่ยนพฤติกรรมของหุ่นยนต์ได้ทันทีที่มันทำผิดพลาด
อย่างไรก็ตาม หากมนุษย์เข้าไปแทรกแซงกระบวนการตัดสินใจของหุ่นยนต์ อาจทำให้แบบจำลองสร้างข้อมูลเลือกการกระทำที่ไม่ถูกต้องโดยไม่ตั้งใจได้ หุ่นยนต์อาจหยิบกล่องที่ผู้ใช้ต้องการ แต่ก็อาจทำให้หนังสือบนชั้นวางล้มลงในระหว่างนั้นได้
"เราต้องการให้ผู้ใช้โต้ตอบกับหุ่นยนต์โดยไม่ทำผิดพลาดเช่นนั้น ซึ่งจะทำให้พฤติกรรมสอดคล้องกับความตั้งใจของผู้ใช้มากขึ้น ในขณะเดียวกันก็ยังคงรักษาความถูกต้องและความเป็นไปได้ไว้" เฟลิกซ์ ยานเหว่ย หวัง กล่าว
เสริมสร้างศักยภาพในการตัดสินใจ
เพื่อให้แน่ใจว่าการโต้ตอบเหล่านี้จะไม่ทำให้หุ่นยนต์กระทำการที่ไม่ถูกต้อง ทีมวิจัยจึงใช้กระบวนการสุ่มตัวอย่างแบบพิเศษ เทคนิคนี้ช่วยให้แบบจำลองเลือกการกระทำจากชุดตัวเลือกที่ถูกต้องซึ่งเหมาะสมกับเป้าหมายของผู้ใช้มากที่สุด
"แทนที่จะบังคับให้ผู้ใช้ทำตามความต้องการของเรา เราช่วยให้หุ่นยนต์เข้าใจเจตนาของพวกเขา และปล่อยให้กระบวนการสุ่มตัวอย่างผันผวนไปตามพฤติกรรมที่หุ่นยนต์ได้เรียนรู้มา" เฟลิกซ์ ยานเหว่ย หวัง กล่าว
ด้วยวิธีการนี้ กรอบงานวิจัยของพวกเขาจึงมีประสิทธิภาพเหนือกว่าวิธีการอื่นๆ ทั้งในการทดลองจำลองและการทดสอบกับแขนหุ่นยนต์จริงในแบบจำลองห้องครัว
แม้ว่าวิธีการนี้จะไม่สามารถแก้ไขปัญหาได้ทันทีเสมอไป แต่ก็มีข้อดีอย่างมากสำหรับผู้ใช้ คือ พวกเขาสามารถแก้ไขหุ่นยนต์ได้ทันทีที่ตรวจพบข้อผิดพลาด แทนที่จะต้องรอให้หุ่นยนต์ทำงานเสร็จก่อนจึงจะสั่งการใหม่ได้
นอกจากนี้ หลังจากที่ผู้ใช้ผลักหุ่นยนต์เบาๆ สองสามครั้งเพื่อนำทางให้หุ่นยนต์หยิบชามที่ถูกต้อง หุ่นยนต์จะสามารถจดจำการกระทำแก้ไขนั้นและนำไปใช้ในกระบวนการเรียนรู้ในอนาคตได้ ส่งผลให้ในวันถัดไป หุ่นยนต์สามารถหยิบชามที่ถูกต้องได้โดยไม่ต้องมีคำแนะนำเพิ่มเติม
"แต่กุญแจสำคัญของการพัฒนาอย่างต่อเนื่องนี้คือการมีกลไกให้ผู้ใช้สามารถโต้ตอบกับหุ่นยนต์ได้ และนั่นคือสิ่งที่เราได้แสดงให้เห็นในงานวิจัยนี้" เฟลิกซ์ ยานเหว่ย หวัง กล่าว
ในอนาคต ทีมวิจัยตั้งเป้าที่จะเพิ่มความเร็วของกระบวนการเก็บตัวอย่าง ในขณะที่ยังคงรักษาหรือปรับปรุงประสิทธิภาพให้ดียิ่งขึ้น นอกจากนี้ พวกเขายังต้องการทดสอบวิธีการนี้ในสภาพแวดล้อมใหม่ ๆ เพื่อประเมินความสามารถในการปรับตัวของหุ่นยนต์
(ที่มา: ข่าวจาก MIT)
[โฆษณา_2]
ที่มา: https://vietnamnet.vn/ung-dung-ai-tao-sinh-giup-robot-tuong-tac-thong-minh-hon-2381531.html






การแสดงความคิดเห็น (0)