VinBigdata a annoncé le 21 août la construction réussie d'un vaste modèle de langue vietnamienne, jetant ainsi les bases de la maîtrise de la technologie d'IA générative.
Les grands modèles de langage (LLM) sont des modèles entraînés à l'aide de techniques d'apprentissage profond sur d'immenses ensembles de textes ou d'images. Ces modèles sont capables de comprendre des connaissances, de générer du texte et d'effectuer diverses tâches de traitement automatique du langage naturel. Ils sont considérés comme la clé du développement de l'intelligence artificielle générative, capable de générer de nouveaux contenus et idées sous de nombreuses formes (texte, images, sons, etc.).
Grâce à la construction réussie d'un vaste modèle de langue vietnamienne, VinBigdata intégrera cette technologie pour faire de VinBase (une plateforme d'intelligence artificielle multicognitive complète) une plateforme d'IA générative au Vietnam, tout en fournissant des solutions de développement basées sur cette technologie telles que des chatbots d'IA générative, des callbots ou l'assistant virtuel ViVi de nouvelle génération... Cette technologie contribue à accroître le naturel de la communication machine, tout en aidant les utilisateurs à rechercher et à synthétiser des informations plus rapidement et plus simplement qu'auparavant.
Professeur Vu Ha Van - Directeur scientifique de la société VinBigdata. Photo : VinBigdata
Le professeur Vu Ha Van, directeur scientifique de VinBigdata, a déclaré que plusieurs grandes entreprises internationales ont développé et commercialisé avec succès des produits basés sur des modèles de langage complexes, à l'instar d'OpenAI avec ChatGPT ou de Google avec Bard. Au Vietnam, VinBigdata, filiale du groupe Vingroup, a pour objectif de construire un modèle de langage vietnamien de grande envergure. Selon M. Van, ce modèle vise à résoudre trois problèmes fondamentaux : améliorer la précision, réduire les coûts d'infrastructure et garantir la sécurité.
« Au lieu d'avoir besoin d'environ 175 milliards de paramètres comme ChatGPT, VinBigdata peut créer un modèle de langage de grande envergure avec plusieurs milliards de paramètres tout en conservant la capacité de générer des documents hautement authentiques, en se concentrant sur les données et les connaissances vietnamiennes », a déclaré le responsable de l'unité.
La maîtrise de la technologie, l'auto-développement dès les premières étapes et la création d'un vaste modèle de langue vietnamienne constituent un pas en avant pour VinBigdata, qui souhaite intégrer l'intelligence artificielle générative à son écosystème de produits et services. L'entreprise a d'abord appliqué cette nouvelle technologie à sa gamme de produits VinBase KB (portail de base de connaissances VinBase). Ce produit permet d'extraire des informations et de générer automatiquement des réponses à partir des données collectées dans d'immenses ensembles de données du système de connaissances.
Un représentant de VinBigdata a pris la parole lors de l'événement annonçant l'intelligence artificielle générative. Photo : VinBigdata
Il est prévu qu'en décembre prochain, les membres de Vingroup lancent deux gammes de produits principales : VinBase 2.0 et l'application ViGPT. VinBase 2.0 est une plateforme d'IA qui offre de multiples perspectives grâce à des solutions destinées aux entreprises et aux organismes gouvernementaux . L'application ViGPT, quant à elle, est présentée par l'entreprise comme la « version vietnamienne de ChatGPT » et est accessible à tous pour des tests. Avec ViGPT, les utilisateurs peuvent poser des questions et obtenir des réponses sur des informations spécifiques au Vietnam (réglementations, documents juridiques) ou sur des informations locales (histoire, littérature, sites touristiques, spécialités locales).
La société par actions VinBigdata dispose d'un système de base de données d'une capacité de 3 500 téraoctets. Ce système contient des centaines de milliers d'heures de données vocales, d'images et d'informations qui sont nettoyées, traitées, classées et utilisées pour l'entraînement de l'IA et l'infrastructure de R&D. Cette infrastructure comprend des dizaines de clusters de serveurs Nvidia DGX A100. L'entreprise emploie également une équipe de professeurs, de scientifiques et d'experts en technologies vietnamiens du monde entier.
Hoai Phuong
Lien source






Comment (0)