เมื่อวันอังคาร (11 มีนาคม) บริษัท Tongyi Lab ของ Alibaba ได้เปิดตัว R1-Omni ซึ่งเป็นโมเดลภาษามัลติโมดัลแบบครอบคลุมตัวแรกที่ใช้การเรียนรู้แบบเสริมแรงพร้อมรางวัลที่ตรวจสอบได้ (RLVR) ซึ่งเป็นเทคโนโลยีที่สัญญาว่าจะปรับปรุงความสามารถของ AI ในการใช้เหตุผลและวิเคราะห์อารมณ์
ทีมวิจัยกล่าวว่าพวกเขาใช้ RLVR เพื่อปรับแต่งโมเดล HumanOmni 0.5B แบบโอเพนซอร์ส ซึ่งช่วยปรับปรุงตัวชี้วัดสำคัญสามประการ ได้แก่ การอนุมาน ความแม่นยำในการรู้จำอารมณ์ และการสรุปผล รายงานระบุว่า R1-Omni สามารถเข้าใจได้ดีขึ้นว่าข้อมูลภาพและเสียงสนับสนุนการรู้จำอารมณ์อย่างไร และระบุปัจจัยที่มีบทบาทสำคัญกว่าในการประเมินอารมณ์แต่ละอย่างได้อย่างชัดเจน
ใน วิดีโอ ทดสอบ R1-Omni สามารถระบุสภาวะอารมณ์ของบุคคลผ่านวิดีโอ รวมถึงอธิบายเสื้อผ้าและสภาพแวดล้อมของตัวละครได้ ซึ่งถือเป็นก้าวสำคัญในสาขาวิทัศน์คอมพิวเตอร์
เทคโนโลยี AI จดจำอารมณ์กำลังกลายเป็นเทรนด์สำคัญในอุตสาหกรรมเทคโนโลยี เทคโนโลยีนี้มักพบเห็นในการใช้งานจริง เช่น แชทบอทสนับสนุนลูกค้า หรือระบบตรวจสอบที่ตรวจจับสัญญาณความเหนื่อยล้าของผู้ขับขี่ขณะขับรถยนต์ไฟฟ้า Tesla
ด้วยการเปิดตัวโมเดล R1-Omni อาลีบาบากำลังเร่งพัฒนา AI และท้าทายตำแหน่งของ OpenAI ขณะที่ OpenAI ได้เปิดตัว GPT-4.5 ซึ่งสามารถจดจำและตอบสนองต่อสัญญาณที่ละเอียดอ่อนในคำถามของผู้ใช้ ในราคาสูงสุด 200 ดอลลาร์สหรัฐ/เดือน อาลีบาบายังเสนอ R1-Omni ฟรีบนแพลตฟอร์ม Hugging Face
แม้ว่าปัจจุบัน R1-Omni จะจดจำได้เฉพาะอารมณ์พื้นฐาน เช่น "มีความสุข" หรือ "โกรธ" เท่านั้น แต่ Wu Yongming ซีอีโอของ Alibaba กล่าวว่า ปัญญาประดิษฐ์ทั่วไป (AGI) ถือเป็นเป้าหมายสูงสุดของบริษัท และการพัฒนาปัญญาประดิษฐ์ทางอารมณ์สำหรับ AI ถือเป็นก้าวสำคัญไปข้างหน้า
การแสดงความคิดเห็น (0)