Le laboratoire Tongyi d'Alibaba a publié le modèle R1-Omni en open source mardi (11 mars). Il s'agit du premier modèle de langage multimodal complet, appliquant l'apprentissage par renforcement avec récompenses vérifiables (RLVR) – une technologie qui promet d'améliorer la capacité de l'IA à raisonner et à analyser les émotions.
L'équipe de développement a déclaré avoir utilisé RLVR pour optimiser le modèle open source HumanOmni 0.5B, améliorant considérablement trois facteurs importants, notamment la capacité d'inférence, la précision de la reconnaissance des émotions et la capacité de généralisation. R1-Omni aurait été capable de mieux comprendre comment les informations visuelles et auditives aident à la reconnaissance des émotions et d’identifier les facteurs qui jouent un rôle plus important dans l’évaluation de chaque émotion.
Dans les vidéos de test, R1-Omni a pu identifier l'état émotionnel d'une personne à travers la vidéo, ainsi que décrire les vêtements et l'environnement du personnage. Cela marque une avancée majeure dans le domaine de la vision par ordinateur.
La technologie de reconnaissance des émotions par l’IA devient progressivement une tendance importante dans l’industrie technologique. Cette technologie est souvent utilisée dans des applications réelles, telles que les chatbots de support client ou les systèmes de surveillance qui détectent les signes de fatigue du conducteur lors de la conduite de voitures électriques Tesla.
Avec le lancement du modèle R1-Omni, Alibaba accélère dans la course à l'IA et défie la position d'OpenAI. Alors qu'OpenAI a lancé GPT-4.5, qui peut reconnaître et répondre aux signaux subtils dans les questions des utilisateurs, pour un prix allant jusqu'à 200 $/mois, Alibaba propose R1-Omni entièrement gratuit sur la plateforme Hugging Face.
Bien que R1-Omni ne reconnaisse actuellement que les émotions de base comme « heureux » ou « en colère », selon le PDG d'Alibaba, Wu Yongming, l'intelligence artificielle générale (AGI) est l'objectif principal de l'entreprise, et le développement de l'intelligence émotionnelle pour l'IA est une étape importante en avant.
Comment (0)