Vietnam.vn - Nền tảng quảng bá Việt Nam

Alibaba lance un modèle d'IA open source capable d'analyser les émotions humaines grâce à la vidéo

VOV.VN - Le groupe chinois Alibaba vient de lancer un nouveau modèle d'intelligence artificielle (IA), qui serait capable de reconnaître les émotions humaines à travers des vidéos, avec l'ambition de surpasser le dernier modèle d'OpenAI.

Báo điện tử VOVBáo điện tử VOV13/03/2025


Le laboratoire Tongyi d'Alibaba a publié le modèle R1-Omni en open source mardi (11 mars). Il s'agit du premier modèle de langage multimodal complet, appliquant l'apprentissage par renforcement avec récompenses vérifiables (RLVR) – une technologie qui promet d'améliorer la capacité de l'IA à raisonner et à analyser les émotions.

L'équipe de développement a déclaré avoir utilisé RLVR pour optimiser le modèle open source HumanOmni 0.5B, améliorant considérablement trois facteurs importants, notamment la capacité d'inférence, la précision de la reconnaissance des émotions et la capacité de généralisation. R1-Omni aurait été capable de mieux comprendre comment les informations visuelles et auditives aident à la reconnaissance des émotions et d’identifier les facteurs qui jouent un rôle plus important dans l’évaluation de chaque émotion.

Dans les vidéos de test, R1-Omni a pu identifier l'état émotionnel d'une personne à travers la vidéo, ainsi que décrire les vêtements et l'environnement du personnage. Cela marque une avancée majeure dans le domaine de la vision par ordinateur.

La technologie de reconnaissance des émotions par l’IA devient progressivement une tendance importante dans l’industrie technologique. Cette technologie est souvent utilisée dans des applications réelles, telles que les chatbots de support client ou les systèmes de surveillance qui détectent les signes de fatigue du conducteur lors de la conduite de voitures électriques Tesla.

Avec le lancement du modèle R1-Omni, Alibaba accélère dans la course à l'IA et défie la position d'OpenAI. Alors qu'OpenAI a lancé GPT-4.5, qui peut reconnaître et répondre aux signaux subtils dans les questions des utilisateurs, pour un prix allant jusqu'à 200 $/mois, Alibaba propose R1-Omni entièrement gratuit sur la plateforme Hugging Face.

Bien que R1-Omni ne reconnaisse actuellement que les émotions de base comme « heureux » ou « en colère », selon le PDG d'Alibaba, Wu Yongming, l'intelligence artificielle générale (AGI) est l'objectif principal de l'entreprise, et le développement de l'intelligence émotionnelle pour l'IA est une étape importante en avant.


Comment (0)

No data
No data

Même catégorie

Voyage durable sur le plateau de pierre
Cat Ba - Symphonie de l'été
Trouvez votre propre Nord-Ouest
La faune de l'île de Cat Ba

Même auteur

Patrimoine

Chiffre

Entreprise

No videos available

Nouvelles

Système politique

Locale

Produit