(CLO) Meta บริษัทแม่ของ Facebook ประกาศเมื่อวันศุกร์ว่าบริษัทกำลังเปิดตัวโมเดล AI ใหม่หลายชุด รวมถึง "Self-Learning Evaluator" ที่สามารถลดการแทรกแซงของมนุษย์ในกระบวนการพัฒนา AI ได้
การประกาศนี้เกิดขึ้นหลังจากที่ Meta ได้นำเสนอเครื่องมือนี้ในรายงานวิจัยเมื่อเดือนสิงหาคม โดยอธิบายถึงวิธีการใช้เทคนิค “ห่วงโซ่ความคิด” ที่คล้ายกับแบบจำลองใหม่ของ OpenAI เพื่อตัดสินการตอบสนองของแบบจำลอง AI ได้อย่างแม่นยำ เทคนิคนี้จะแบ่งปัญหาที่ซับซ้อนออกเป็นขั้นตอนเชิงตรรกะที่ง่ายขึ้น ช่วยปรับปรุงความแม่นยำในสาขาต่างๆ เช่น วิทยาศาสตร์ การเขียนโปรแกรม และคณิตศาสตร์
ไอคอน Meta AI ภาพ: รอยเตอร์
นักวิจัยด้าน Meta ได้ใช้ข้อมูลที่สร้างโดย AI ทั้งหมดเพื่อฝึกโมเดลการให้คะแนนนี้ โดยขจัดการแทรกแซงของมนุษย์ออกไปโดยสิ้นเชิงในขั้นตอนนั้น
ความสามารถในการใช้ AI เพื่อประเมิน AI เองแสดงให้เห็นถึงศักยภาพในการพัฒนาตัวแทน AI อัตโนมัติที่สามารถเรียนรู้จากข้อผิดพลาดของตัวเองได้ ตามที่นักวิจัยสองคนของ Meta กล่าว
ผู้เชี่ยวชาญหลายคนในสาขา AI มองว่าตัวแทนดิจิทัลอัจฉริยะเหล่านี้จะเป็นผู้ช่วยดิจิทัลที่มีความสามารถในการทำงานต่างๆ มากมายโดยไม่ต้องมีการแทรกแซงจากมนุษย์
แบบจำลองการพัฒนาตนเองอาจช่วยลดความจำเป็นในการใช้กระบวนการ “การเรียนรู้แบบเสริมแรงจากข้อเสนอแนะของมนุษย์” ซึ่งต้องใช้ผู้เชี่ยวชาญที่มีทักษะสูงในการจำแนกข้อมูลและตรวจสอบความถูกต้องของคำตอบทางคณิตศาสตร์และคำตอบที่เป็นลายลักษณ์อักษรที่ซับซ้อน ปัจจุบันกระบวนการนี้มีค่าใช้จ่ายสูงและไม่มีประสิทธิภาพ
“เราหวังว่าเมื่อ AI มีความสามารถเหนือกว่ามนุษย์มากขึ้นเรื่อยๆ มันจะตรวจสอบงานของตัวเองได้ดีขึ้น แม้กระทั่งแซงหน้าความชำนาญของมนุษย์” เจสัน เวสตัน หนึ่งในนักวิจัยของโครงการกล่าว
“ความสามารถในการเรียนรู้และประเมินตนเองเป็นกุญแจสำคัญในการพัฒนา AI ไปสู่ระดับเหนือมนุษย์” เขากล่าวเสริม
นอกจาก Meta แล้ว บริษัทอื่นๆ เช่น Google และ Anthropic ยังได้เผยแพร่ผลงานวิจัยเกี่ยวกับแนวคิด RLAIF หรือ “การเรียนรู้แบบเสริมแรงจาก AI เชิงป้อนกลับ” อีกด้วย อย่างไรก็ตาม ต่างจาก Meta บริษัทเหล่านี้แทบจะไม่เคยเผยแพร่โมเดลของตนให้สาธารณชนได้ใช้งานเลย
กาว ฟอง (ตามรายงานของรอยเตอร์)
ที่มา: https://www.congluan.vn/meta-phat-hanh-mo-hinh-ai-co-the-tu-hoc-va-tu-phat-trien-post317675.html
การแสดงความคิดเห็น (0)