Tongyi Lab ของ Alibaba เปิดตัวโมเดล R1-Omni เป็นโอเพ่นซอร์สเมื่อวันอังคาร (11 มีนาคม) นี่ถือเป็นโมเดลภาษามัลติโหมดที่ครอบคลุมรุ่นแรก ซึ่งใช้การเรียนรู้เชิงเสริมแรงด้วยรางวัลที่ตรวจสอบได้ (RLVR) ซึ่งเป็นเทคโนโลยีที่สัญญาว่าจะปรับปรุงความสามารถของ AI ในการใช้เหตุผลและวิเคราะห์อารมณ์
ทีมพัฒนาได้กล่าวว่าพวกเขาใช้ RLVR เพื่อเพิ่มประสิทธิภาพให้กับโมเดลโอเพนซอร์ส HumanOmni 0.5B โดยปรับปรุงปัจจัยสำคัญ 3 ประการอย่างมีนัยสำคัญ ได้แก่ ความสามารถในการอนุมาน ความแม่นยำในการจดจำอารมณ์ และความสามารถในการสรุปทั่วไป มีรายงานว่า R1-Omni สามารถเข้าใจได้ดีขึ้นว่าข้อมูลภาพและการได้ยินช่วยในการจดจำอารมณ์ได้อย่างไร และระบุปัจจัยที่มีบทบาทสำคัญยิ่งกว่าในการประเมินอารมณ์แต่ละอย่าง
ใน วิดีโอ ทดสอบ R1-Omni สามารถระบุสถานะอารมณ์ของบุคคลได้ผ่านวิดีโอ รวมถึงบรรยายเสื้อผ้าและสภาพแวดล้อมของตัวละครได้ด้วย นี่ถือเป็นก้าวสำคัญในสาขาการมองเห็นคอมพิวเตอร์
เทคโนโลยีการจดจำอารมณ์ด้วย AI กำลังกลายเป็นกระแสสำคัญในอุตสาหกรรมเทคโนโลยี มักพบเห็นเทคโนโลยีนี้ในแอปพลิเคชันในโลกแห่งความเป็นจริง เช่น แชทบอทสนับสนุนลูกค้า หรือระบบตรวจสอบที่ตรวจจับสัญญาณของความเหนื่อยล้าของผู้ขับขี่เมื่อขับรถยนต์ไฟฟ้า Tesla
ด้วยการเปิดตัวโมเดล R1-Omni อาลีบาบากำลังเร่งขับเคลื่อนในการแข่งขัน AI และท้าทายตำแหน่งของ OpenAI ในขณะที่ OpenAI ได้เปิดตัว GPT-4.5 ซึ่งสามารถจดจำและตอบสนองต่อสัญญาณที่ละเอียดอ่อนในคำถามของผู้ใช้ ด้วยราคาสูงถึง 200 ดอลลาร์สหรัฐต่อเดือน ทาง Alibaba เสนอ R1-Omni ให้ใช้งานฟรีบนแพลตฟอร์ม Hugging Face
แม้ว่าปัจจุบัน R1-Omni สามารถจดจำได้เฉพาะอารมณ์พื้นฐาน เช่น "มีความสุข" หรือ "โกรธ" เท่านั้น แต่ Wu Yongming ซีอีโอของ Alibaba กล่าวว่า ปัญญาประดิษฐ์ทั่วไป (AGI) ถือเป็นเป้าหมายสูงสุดของบริษัท และการพัฒนาปัญญาทางอารมณ์สำหรับ AI ถือเป็นก้าวสำคัญไปข้างหน้า
การแสดงความคิดเห็น (0)