La technologie de « sous-titrage mental » surprend le monde scientifique en transformant les signaux cérébraux en descriptions précises d'images ou de scènes auxquelles les gens pensent. Cette nouvelle technologie, annoncée par un groupe de scientifiques américains, représente une avancée remarquable dans le domaine de l'intelligence artificielle et des neurosciences.
Ce système peut décoder l'activité cérébrale et convertir ce qu'une personne voit ou imagine en une description écrite avec une précision étonnante.
Ces travaux, publiés dans la revue Science Advances, ouvrent de nouvelles perspectives sur la compréhension de la manière dont le cerveau humain interprète le monde qui l'entoure. Parallèlement, cette nouvelle technologie laisse entrevoir des applications potentielles pour accompagner les personnes souffrant de troubles du langage, notamment après un AVC.

La technologie de transcription mentale permet de décoder l'activité cérébrale et de convertir avec une grande précision ce que les gens voient ou imaginent en descriptions textuelles. (Photo : Nature.com)
D'après une équipe de recherche de l'Université de Californie à Berkeley (États-Unis), cette technique utilise l'imagerie cérébrale non invasive pour enregistrer l'activité neuronale. Les scientifiques ont ensuite recours à des modèles de langage d'intelligence artificielle avancés pour prédire et décrire avec précision ce que le participant voit ou imagine.
« Le système peut prédire avec un niveau de détail très élevé ce qu'une personne voit, ce qui est sans précédent », déclare le neuroscientifique computationnel Alex Huth.
Depuis plus d'une décennie, les chercheurs tentent de prédire des images ou des sons à partir des signaux cérébraux. Cependant, la « traduction » de contenus complexes tels que des vidéos ou des formes abstraites en langage reste un défi majeur.
Les méthodes précédentes ne reconnaissaient que des mots-clés isolés au lieu du contexte complet tel que le sujet, l'action et l'environnement.
Pour pallier cette limitation, l'équipe de recherche de Tomoyasu Horikawa, neuroscientifique aux laboratoires scientifiques de NTT Communications (Japon), a développé un modèle d'intelligence artificielle de traitement du langage naturel. Dans un premier temps, ils ont utilisé ce modèle pour analyser les sous-titres de plus de 2 000 vidéos, convertissant chaque segment en une « signature sémantique » – un graphique numérique représentant le contenu vidéo.
L'équipe a ensuite entraîné un autre système d'IA à reconnaître le lien entre ces « signatures de signification » et l'activité cérébrale de six participants pendant qu'ils regardaient les vidéos.
Les résultats ont montré que l'IA pouvait « traduire » avec précision ce que les participants voyaient ou imaginaient en phrases descriptives complètes, et non pas seulement en listes de mots-clés.
Les experts affirment que la technologie de « transcription mentale » représente non seulement une avancée majeure dans la recherche en neurosciences, mais ouvre également la voie à de nombreuses applications pratiques. À l'avenir, cette technique pourrait aider les personnes ayant perdu la parole à communiquer par le biais de signaux cérébraux.
Bien qu'encore à ses débuts, la « transcription mentale » représente un grand pas en avant dans le décodage du langage de la pensée humaine, rapprochant de la réalité la perspective de la « lecture de pensée » qui n'existait auparavant que dans les films de science-fiction.
Source : https://vtcnews.vn/cong-nghe-dot-pha-tri-tue-nhan-tao-doc-duoc-suy-nghi-con-nguoi-ar985947.html






Comment (0)