อาลีบาบาเปิดตัวโมเดล AI โอเพ่นซอร์สที่สามารถวิเคราะห์อารมณ์ของมนุษย์ผ่านวิดีโอ

VOV.VN - กลุ่มอาลีบาบาของจีนเพิ่งเปิดตัวโมเดลปัญญาประดิษฐ์ (AI) ใหม่ ซึ่งว่ากันว่ามีความสามารถในการรับรู้ความรู้สึกของมนุษย์ผ่านวิดีโอ โดยมีเป้าหมายที่จะแซงหน้าโมเดลใหม่ล่าสุดของ OpenAI

Báo điện tử VOV•13/03/2025

เมื่อวันอังคาร (11 มีนาคม) บริษัท Tongyi Lab ของ Alibaba ได้เปิดตัว R1-Omni ซึ่งเป็นโมเดลภาษามัลติโมดัลแบบครอบคลุมตัวแรกที่ใช้การเรียนรู้แบบเสริมแรงพร้อมรางวัลที่ตรวจสอบได้ (RLVR) ซึ่งเป็นเทคโนโลยีที่สัญญาว่าจะปรับปรุงความสามารถของ AI ในการใช้เหตุผลและวิเคราะห์อารมณ์

ทีมวิจัยกล่าวว่าพวกเขาใช้ RLVR เพื่อปรับแต่งโมเดล HumanOmni 0.5B แบบโอเพนซอร์ส ซึ่งช่วยปรับปรุงตัวชี้วัดสำคัญสามประการ ได้แก่ การอนุมาน ความแม่นยำในการรู้จำอารมณ์ และการสรุปผล รายงานระบุว่า R1-Omni สามารถเข้าใจได้ดีขึ้นว่าข้อมูลภาพและเสียงสนับสนุนการรู้จำอารมณ์อย่างไร และระบุปัจจัยที่มีบทบาทสำคัญกว่าในการประเมินอารมณ์แต่ละอย่างได้อย่างชัดเจน

alibaba ra mat mo hinh ai ma nguon mo co the phan tich cam xuc con nguoi qua video hinh anh 1 — กลุ่มอาลีบาบาของจีนเพิ่งเปิดตัวโมเดลปัญญาประดิษฐ์ (AI) ใหม่ - ภาพ: Bloomberg

ใน วิดีโอ ทดสอบ R1-Omni สามารถระบุสภาวะอารมณ์ของบุคคลผ่านวิดีโอ รวมถึงอธิบายเสื้อผ้าและสภาพแวดล้อมของตัวละครได้ ซึ่งถือเป็นก้าวสำคัญในสาขาวิทัศน์คอมพิวเตอร์

เทคโนโลยี AI จดจำอารมณ์กำลังกลายเป็นเทรนด์สำคัญในอุตสาหกรรมเทคโนโลยี เทคโนโลยีนี้มักพบเห็นในการใช้งานจริง เช่น แชทบอทสนับสนุนลูกค้า หรือระบบตรวจสอบที่ตรวจจับสัญญาณความเหนื่อยล้าของผู้ขับขี่ขณะขับรถยนต์ไฟฟ้า Tesla

ด้วยการเปิดตัวโมเดล R1-Omni อาลีบาบากำลังเร่งพัฒนา AI และท้าทายตำแหน่งของ OpenAI ขณะที่ OpenAI ได้เปิดตัว GPT-4.5 ซึ่งสามารถจดจำและตอบสนองต่อสัญญาณที่ละเอียดอ่อนในคำถามของผู้ใช้ ในราคาสูงสุด 200 ดอลลาร์สหรัฐ/เดือน อาลีบาบายังเสนอ R1-Omni ฟรีบนแพลตฟอร์ม Hugging Face

แม้ว่าปัจจุบัน R1-Omni จะจดจำได้เฉพาะอารมณ์พื้นฐาน เช่น "มีความสุข" หรือ "โกรธ" เท่านั้น แต่ Wu Yongming ซีอีโอของ Alibaba กล่าวว่า ปัญญาประดิษฐ์ทั่วไป (AGI) ถือเป็นเป้าหมายสูงสุดของบริษัท และการพัฒนาปัญญาประดิษฐ์ทางอารมณ์สำหรับ AI ถือเป็นก้าวสำคัญไปข้างหน้า

การแสดงความคิดเห็น (0)