โมเดล R1-Omni ของ Alibaba สามารถอนุมานภาวะอารมณ์ของบุคคลได้จาก วิดีโอ รูปภาพ: Xpert.Digital |
ตามรายงานของ Bloomberg บริษัท Tongyi Lab ของ Alibaba เปิดตัวโมเดล R1-Omni เป็นโอเพ่นซอร์สเมื่อวันที่ 11 มีนาคม
คุณสมบัติที่โดดเด่นที่สุดของโมเดลนี้คือสามารถแสดงถึงสภาวะอารมณ์ของบุคคลในวิดีโอได้ ขณะเดียวกันยังสามารถบรรยายถึงเสื้อผ้าและสภาพแวดล้อมได้อีกด้วย
นับเป็นก้าวสำคัญในด้านวิสัยทัศน์คอมพิวเตอร์และเป็นเวอร์ชันอัปเกรดของโมเดลโอเพนซอร์ส HumanOmni รุ่นก่อนหน้า ซึ่งพัฒนาโดยนักวิจัยหลักของ Alibaba คนเดิม คือ Jiaxing Zhao กล่าวโดยเฉพาะอย่างยิ่ง Alibaba ได้เปิดตัว R1-Omni ให้ดาวน์โหลดฟรีบนแพลตฟอร์ม Hugging Face
รายงานการวิจัยแสดงให้เห็นว่า R1-Omni สามารถเข้าใจได้ดีขึ้นว่าข้อมูลภาพและเสียงสนับสนุนการจดจำอารมณ์อย่างไร นอกจากนี้ เพื่อปรับปรุงการจดจำอารมณ์ทั้งในรูปแบบภาพและเสียง โมเดลนี้ยังปรับปรุงระบบ AI ผ่านอัลกอริทึมการเรียนรู้เสริมแรงอีกด้วย
การเรียนรู้แบบเสริมแรงเป็นกระบวนการเรียนรู้ของเครื่องจักรประเภทหนึ่งที่มุ่งเน้นไปที่การตัดสินใจโดยตัวแทนอัตโนมัติ รวมถึงซอฟต์แวร์ AI ขั้นสูง หุ่นยนต์ และรถยนต์ขับเคลื่อนอัตโนมัติ
ตัวแทนอัตโนมัติเหล่านี้เรียนรู้การทำงานผ่านการลองผิดลองถูกโดยไม่มีคำแนะนำจากมนุษย์ เทคนิคนี้ถือเป็นองค์ประกอบสำคัญในการพัฒนาโมเดล AI เนื่องจากช่วยแก้ปัญหาการตัดสินใจตามลำดับในสภาพแวดล้อมที่ไม่แน่นอน
ผลการศึกษาแสดงให้เห็นว่าโมเดล R1-Omni มีความสามารถในการให้เหตุผล การมองเห็นเชิงลึก และการสรุปทั่วไปที่แข็งแกร่งกว่าโมเดลอื่น
ที่มา: https://znews.vn/ai-trung-quoc-doc-duoc-cam-xuc-con-nguoi-post1537948.html
การแสดงความคิดเห็น (0)