Le message ci-dessus a été partagé par M. Ha Jung Woo, responsable du département d'innovation cloud de la société Naver (Corée), lors de la Journée de l'intelligence artificielle du Vietnam (AI4VN) 2023, qui s'est tenue à Ho Chi Minh-Ville le 22 septembre.
L'IA générative est une forme d'intelligence artificielle capable de générer de nouveaux contenus et idées sous diverses formes, telles que du texte, des images, des vidéos et de la musique . L'IA peut ainsi créer de nouvelles chansons, des drogues, des films et des jeux, grâce à de grands modèles de langage (MLM).
Selon une récente estimation de McKinsey, l'IA générative pourrait contribuer à hauteur de 4 400 milliards de dollars à l' économie mondiale. L'étude s'appuie sur 60 000 applications de l'IA générative dans différents secteurs.
Selon M. Ha Jung Woo, les principaux modèles linguistiques pour le développement de l'IA générative utilisent actuellement l'anglais. Par conséquent, lorsque le modèle s'exécute dans d'autres langues, il sera incomplet et comportera des erreurs. De plus, comme il est en anglais, lorsqu'il est utilisé, il crée des biais inutiles, notamment des biais culturels.
Il estime donc que la maîtrise des données et des technologies est un facteur important que de nombreux pays prendront en compte à l'avenir, afin de surmonter le risque de dépendance vis-à-vis d'autres pays. Par exemple, en Corée, Naver a également créé un vaste modèle en coréen pour aider le gouvernement et les entreprises nationales à déployer des applications d'IA.
Partageant le même point de vue, le Dr Dao Duc Minh, directeur général de VinBigdata, estime également que les Vietnamiens peuvent également créer des produits d'IA générés localement pour contribuer à garantir la sécurité, l'exactitude des informations et servir au mieux le gouvernement et la société...
Selon M. Dao Duc Minh, lorsque chatGPT a été lancé fin 2022, il a créé une vague souterraine de concurrence entre les pays et les grandes entreprises dans la recherche et le lancement de modèles d'IA génératifs et de grands modèles linguistiques.
Aux États-Unis, outre l'outil chatGPT d'OpenAI, il existe d'autres modèles d'IA générative, tels que Bard de Google et Titan d'Amazon. En Chine, on trouve Earnie Bot de Baidu, SenseChat de Sense Time et Hunyan de Tencent. En Corée, on trouve HyperClova X de Naver.
M. Dao Duc Minh a déclaré que le développement d'un modèle linguistique de grande envergure applicable à l'IA générative n'est pas une tâche simple et coûte cher. Si l'IA générative est appliquée sur la base des grandes plateformes de modèles linguistiques disponibles dans le monde, le Vietnam s'expose à de nombreux risques. Par exemple, avec de grands modèles en langues étrangères, les données vietnamiennes ne représentent qu'une très faible proportion, principalement en anglais. Il est donc difficile de garantir l'exactitude, la sécurité des données et leur adéquation aux besoins de l'entreprise.
Par exemple, les grands modèles de langues étrangères comportent des centaines de milliards de paramètres. L'exécution d'un modèle réel nécessite une infrastructure informatique colossale, mais la qualité n'est pas à la hauteur, car le modèle d'IA peut donner des réponses erronées, notamment en matière de connaissances historiques, culturelles et de problématiques spécifiques à chaque pays.
C'est pourquoi VinBigdata a décidé de construire un modèle linguistique à grande échelle en vietnamien, afin de garantir la sécurité des données, d'améliorer leur précision, de réduire les coûts et de s'adapter à la situation nationale. L'équipe d'experts a élaboré un modèle comportant des centaines de fois moins de paramètres que chatGPT, mais basé sur la quantité de données des Vietnamiens.
Le modèle peut répondre avec une grande précision à des questions spécifiques à chaque région. Plus précisément, lorsqu'on lui a posé une question sur la loi concernant deux infractions différentes, le modèle chatGPT a fourni la même réponse et le même contenu général. De son côté, le modèle d'IA, utilisant des données vietnamiennes, peut répondre avec précision en se basant sur les lois, les décrets, les amendes, les sources d'information… de manière très précise.
Pour prouver cette exactitude, le Dr Dao Duc Minh a donné un exemple en posant des questions sur l'œuvre « La femme du mendiant » dans la littérature vietnamienne sur chatGPT et le modèle de langue vietnamienne développé par VinBigdata, le résultat du modèle de VinBigdata était complètement exact tandis que la réponse de ChatGPT n'était pas claire.
Le représentant de VinBigdata a également déclaré que la maîtrise de l'IA générée au niveau national est importante car elle peut aider le gouvernement à maîtriser le contenu, éviter la désinformation, garantir la sécurité des données nationales et apporter la technologie vietnamienne au monde.
Source
Comment (0)