Lors de l'événement Artificial Intelligence Day 2023 sur le thème « IA - Reconstruire la réalité », qui s'est tenu les 5 et 6 décembre, VinAI Artificial Intelligence Research and Application Company ( Vingroup ) a annoncé son projet de recherche open-source sur un grand modèle de langage spécifiquement pour le vietnamien, appelé PhoGPT.
PhoGPT est un projet open source, contrairement aux logiciels propriétaires comme ChatGPT d'OpenAI. De par son caractère open source, il ne fait l'objet d'aucune restriction commerciale ; chacun peut utiliser PhoGPT pour développer ses propres applications, y compris à des fins commerciales. Il s'agit essentiellement d'une plateforme pour la communauté nationale développant des applications liées à l'IA.
Selon le Dr Bui Hai Hung, directeur général de VinAI, société de recherche et d'application en intelligence artificielle, les limitations des modèles de langue vietnamienne existants démontrent qu'ils n'ont pas atteint des performances optimales et qu'ils ne disposent pas d'une base de code source ouverte. Par conséquent, l'une des tâches urgentes pour la communauté de l'IA en général, et celle du traitement automatique du langage naturel (TALN) en particulier, est de concevoir un nouveau modèle plus performant, capable de traiter le vietnamien avec une grande précision et efficacité.
Les experts en IA estiment que, grâce à un modèle de langage de données massives contenant 7,5 milliards de paramètres, construit sur la plateforme de décodage Transformer, ce modèle a été entraîné à partir de zéro en utilisant les techniques les plus avancées disponibles, telles que Flash Attention et l'extrapolation de la longueur du contexte AliBi.
Ces techniques permettent non seulement au modèle d'acquérir une compréhension plus approfondie du contexte, mais aussi d'améliorer sa capacité à dialoguer et à interagir de manière naturelle. Le modèle devient ainsi un outil polyvalent et flexible, capable de répondre aux divers besoins linguistiques de ses utilisateurs.
Le Dr Bui Hai Hung a ajouté que PhoGPT a été développé de A à Z par l'entreprise, indépendamment de tous les autres modèles existants . Grâce à son modèle open source, la communauté vietnamienne peut l'utiliser et l'améliorer. La mise à disposition publique du code source de PhoGPT et son accessibilité aux utilisateurs créent un environnement et une communauté où ces derniers peuvent développer des applications uniques et personnalisées.
L'un des objectifs de l'open source est de créer une plateforme qui évite de réinventer la roue, permettant ainsi aux organisations de poursuivre le développement du modèle de langage PhoGPT. Ceci contribuera à l'émergence d'une communauté open source de qualité pour le modèle de langage vietnamien, favorisant la participation et l'application de ce modèle dans divers domaines par de nombreuses entreprises. VinAI, société de recherche et d'application en intelligence artificielle, a annoncé son intention, avec PhoGPT, de concevoir et développer des applications pour les particuliers ainsi que des solutions d'assistance complètes pour les entreprises, en langue vietnamienne, dans des secteurs tels que la santé et l'éducation.
PhoGPT a posé les premières bases du développement de modèles de langue vietnamienne performants, servant de fondement au développement d'applications pratiques et efficaces qui s'alignent sur la stratégie de développement de l'IA du gouvernement jusqu'en 2030.
BA TAN
Source






Comment (0)