Le commentaire ci-dessus a été fait par M. Nguyen Kim Anh, directeur des produits (CPO) de VinBigdata, lors d'une conversation avec VietNamNet à propos du modèle de langue vietnamienne que VinBigdata a annoncé avoir développé avec succès le 21 août. VietNamNet aimerait envoyer aux lecteurs le contenu de cette interview.
Pouvez-vous nous parler de l’application actuelle de l’IA au Vietnam ?
M. Nguyen Kim Anh : L’IA est l’un des mots-clés les plus populaires au monde ces dernières années. Au Vietnam, nous avons également discuté de ce sujet sur de nombreux forums différents. Cependant, la réalité montre que le déploiement de l’IA au Vietnam est encore confronté à de nombreux défis tels que les limitations en termes de ressources, d’infrastructures, de ressources humaines spécialisées, etc.
Le rapport 2022 sur l'indice de préparation à l'intelligence artificielle (IA) montre que le Vietnam est classé 55e au niveau mondial, tandis que Singapour est classé 2e, la Malaisie 29e et la Thaïlande 31e. On peut constater que le Vietnam doit encore faire preuve de plus de détermination dans la promotion de la recherche et de l’application de l’IA.
Je pense que nous avons beaucoup d’avantages à prendre des raccourcis, car le Vietnam dispose d’une main-d’œuvre jeune avec de très bonnes bases en mathématiques et en ingénierie. C’est un avantage important à saisir. Avec le soutien et la coopération du gouvernement et des entreprises, je crois que nous saisirons rapidement le potentiel de développement de l’industrie de l’IA pour contribuer au développement socio-économique du pays.
Pourquoi VinBigdata a-t-il décidé de développer le modèle de langue vietnamienne récemment lancé ?
M. Nguyen Kim Anh : Les grands modèles de langage constituent une base solide pour la naissance de produits d'application d'IA, tels que ChatGPT d'Open AI ou Bard de Google. Cependant, pour les produits en provenance de l’étranger, le vietnamien ne fait pas partie du groupe linguistique principal. Cela affecte plus ou moins la qualité du contenu renvoyé aux utilisateurs.
Si vous demandez des informations détaillées spécifiques aux Vietnamiens, le risque d’erreur est assez élevé. Plus sérieusement, si les utilisateurs utilisent cet outil pour rechercher des informations et mettre à jour les actualités, cela pourrait à l’avenir entraîner des conséquences telles que la distorsion des connaissances de base d’une partie de la population vietnamienne, en particulier des jeunes.
Il est donc nécessaire de construire un grand modèle linguistique vietnamien pour développer des produits adaptés et répondre au mieux aux besoins du peuple vietnamien. Dès le début de sa création, VinBigdata a identifié les « données » comme le facteur essentiel et le plus important pour la recherche et le lancement de produits d’IA destinés au marché.
C’est aussi la raison pour laquelle nous pouvons être les premiers à achever rapidement la construction d’un grand modèle de langue vietnamienne. Au lieu de devoir utiliser jusqu'à 175 milliards de paramètres comme ChatGPT, nous n'avons besoin que de quelques milliards de paramètres. Cela n’est pas seulement significatif en termes d’application, mais aussi significatif pour la société lorsque la tendance est que de plus en plus de personnes utilisent l’IA artificielle comme outil pour étudier, travailler, rechercher des informations…
Avec le nouveau modèle de langue vietnamienne annoncé, comment VinBigdata va-t-il l'appliquer, monsieur ?
M. Nguyen Kim Anh : Maîtriser complètement la technologie, s'auto-développer dès les premières étapes et réussir à construire un grand modèle de langue vietnamienne est considéré comme une étape importante pour aider VinBigdata à introduire la technologie d'IA générative dans l'écosystème de produits et services qui ont été et sont fournis au marché.
Nous avons défini une feuille de route spécifique pour mettre en pratique les résultats de la recherche. Concrètement, VinBigdata présentera deux versions de l’application aux consommateurs, la première destinée aux entreprises et la seconde à la communauté.
Avec la version entreprise, VinBigdata intégrera la technologie pour faire de VinBase (une plate-forme complète d'intelligence artificielle multicognitive) la première plate-forme d'IA générative au Vietnam, tout en fournissant des solutions de développement basées sur la technologie d'IA générative telles que le chatbot IA générative, le callbot ou l'assistant virtuel ViVi de nouvelle génération...
Cette technologie contribuera à accroître le caractère naturel de la communication entre machines, tout en aidant les utilisateurs à rechercher et à synthétiser des informations beaucoup plus rapidement et plus simplement qu’auparavant.
Actuellement, VinBigdata a initialement appliqué avec succès une nouvelle technologie sur la gamme de produits VinBase KB (portail de base de connaissances VinBase). Le produit est capable de récupérer des informations et de générer automatiquement des réponses basées sur des informations collectées à partir d’ensembles de données extrêmement volumineux dans le système de connaissances.
Selon notre plan, d'ici fin décembre 2023, VinBigdata lancera le produit ViGPT - « version vietnamienne de ChatGPT », ouvert à la communauté pour un accès et des tests entièrement gratuits. Avec ViGPT, les utilisateurs peuvent poser et répondre à des questions sur des informations spécifiques au Vietnam (réglementations, documents juridiques, etc.), ou des informations de nature spécifique (histoire, géographie, littérature, etc.).
Il s’agit d’un projet d’une grande importance pour la communauté et la société, qui devrait devenir un outil utile, soutenant efficacement les Vietnamiens dans le processus d’études et de travail.
VinBigdata a-t-il l’intention de partager ce grand modèle de langue vietnamienne avec les parties intéressées ?
M. Nguyen Kim Anh : La construction réussie d’un grand modèle linguistique vietnamien n’est pas seulement importante pour VinBigdata, mais également importante pour la société et la communauté scientifique et technologique au Vietnam. La plateforme VinBase est intégrée à l'IA générative, permettant aux entreprises d'utiliser pleinement cette technologie de base pour l'appliquer à leurs propres produits de marque.
Avec ce modèle, VinBigdata espère que les entreprises vietnamiennes auront davantage d’opportunités d’accéder à la technologie de l’IA pour créer ou hériter des réalisations du modèle linguistique vietnamien que nous avons développé.
De plus, avec ViGPT, les Vietnamiens auront également leur propre « version vietnamienne de ChatGPT », à partir de laquelle ils pourront facilement rechercher des sources d'information de manière rapide, précise et fiable.
La sécurité et le droit d’auteur sont des facteurs importants lors du développement de l’IA générative. Avec le nouveau modèle de langue vietnamienne lancé, comment VinBigdata a-t-il géré ce problème, monsieur ?
M. Nguyen Kim Anh : En tant qu'unité de recherche sur le big data et l'intelligence artificielle, VinBigdata respecte toujours la sécurité des données en élaborant des processus stricts et en se conformant strictement aux réglementations en matière de sécurité des données. Plus précisément, pour garantir les droits des utilisateurs, VinBigdata essaie de créer de la transparence dans le processus de collecte et d'utilisation des données, en particulier avec les données personnelles.
Dans le même temps, nous élaborons toujours de manière proactive des mesures de sécurité multicouches, des processus stricts de contrôle du cycle de vie des données et une autorisation d'utilisation des données appropriée (qui a le droit d'accéder et d'utiliser quelles données ?) pour empêcher les fuites d'informations. Il existe des réglementations et des normes en matière de sécurité des données dans le monde et au Vietnam, et VinBigdata se conforme toujours à ces principes.
En outre, la question du droit d’auteur est également devenue un sujet assez douloureux après le fort développement de l’IA artificielle récemment. Conscient de cela, VinBigdata se concentre sur le développement de produits visant à fournir des informations spécifiques, localisées et spécifiques au Vietnam et dans chaque domaine spécifique, plutôt que de les diffuser pour éviter la désinformation.
Grâce à cette orientation initiale, VinBigdata peut créer en toute confiance des produits qui fournissent des connaissances plus précises que ChatGPT dans des domaines spécialisés spécifiques tels que la finance et la banque, le droit, la médecine, etc. et avec des informations indigènes au Vietnam telles que l'histoire, la géographie, la littérature, etc.
Selon vous, est-il temps d’appliquer l’IA dans la pratique au Vietnam ?
M. Nguyen Kim Anh : Je pense que nous devons accélérer davantage la course à l’intelligence artificielle. Parce que les grands pays et les grandes entreprises du monde ont déjà une certaine longueur d’avance sur nous.
À l’heure actuelle, on peut dire que le Vietnam n’a pas vraiment mis l’IA en pratique et n’en est qu’aux débuts.
Cependant, je crois qu’avec les efforts et la coopération de tous les niveaux, combinés à des ressources humaines en IA de haute qualité au Vietnam aujourd’hui, nous pouvons saisir l’opportunité de faire un bond en avant !
Source
Comment (0)