L'intérêt mondial pour l'IA est croissant, l'attention se concentrant principalement sur les pays dotés de modèles d'IA de pointe, comme les États-Unis et la Chine. Région économique parmi les plus importantes au monde, l'Asie du Sud-Est devient progressivement un nouveau pôle d'attraction pour l'IA, avec des avancées majeures susceptibles d'attirer l'attention des décideurs politiques, des investisseurs et des experts technologiques du monde entier.
![]() |
Le Vietnam dispose déjà d'un modèle d'IA national, l'un des rares modèles développés de toutes pièces en Asie du Sud-Est aujourd'hui. Photo : Zalo. |
Au Vietnam, le Parti et le gouvernement sont également déterminés à façonner et à promouvoir l'ère du développement technologique du pays, comme le démontre la résolution 57-NQ/TW sur les avancées scientifiques , technologiques, l'innovation et la transformation numérique nationale. Cette orientation a incité les entreprises technologiques nationales à investir et à exploiter le potentiel des technologies de pointe mondiales.
Le Vietnam est aujourd'hui l'un des rares pays d'Asie du Sud-Est à disposer d'un modèle national de formation linguistique à grande échelle (LLM). Plus précisément, depuis 2023, Zalo a formé et lancé avec succès un modèle de LLM axé sur le vietnamien, entièrement développé par une équipe d'ingénieurs vietnamiens.
Choisissez une formation à partir de zéro et obtenez des résultats inattendus
Les modèles d'IA actuels disposent de deux techniques de formation, notamment un modèle affiné - optimisant les LLM précédemment formés pour créer de nouveaux LLM dans un but spécifique - et un modèle à partir de zéro - mettant en œuvre tous les processus depuis l'initialisation des paramètres, les décisions d'architecture du modèle jusqu'aux algorithmes de formation sur un ensemble de données donné.
Parmi ces techniques, le réglage fin est privilégié par de nombreuses entreprises en raison de ses avantages, tels que sa mise en œuvre facile, ses économies de ressources et son efficacité accrue. Dans un contexte où les équipements de formation et les données représentent des défis quasi insurmontables au Vietnam, les techniques de réglage fin sont considérées comme une solution de premier ordre.
Cependant, Zalo a opté dès le départ pour cette méthode de formation. Grâce à cette méthode, l'ensemble du processus et du modèle de formation sont entièrement contrôlés par des Vietnamiens, contribuant ainsi à faire du Vietnam l'un des rares pays d'Asie du Sud-Est à proposer un LLM local.
Lors de son lancement en 2023, le premier modèle linguistique à grande échelle de Zalo, axé sur le vietnamien et doté de 7 milliards de paramètres, a atteint une performance de 150 % par rapport au GPT3.5 d'OpenAI sur le benchmark de compétences LLM vietnamien de la VMLU. Il est à noter que la durée de formation n'a été que de 6 mois, bien inférieure à l'estimation initiale de 18 mois. Cette rapidité de formation a surpris toute l'équipe de développement de Zalo.
Le modèle LLM de Zalo s'est classé 3e au défi Kahoot, derrière un vrai joueur et GPT 4 lors de ses débuts en 2023. Photo : Zalo. |
En 2024, le modèle de 13 milliards de paramètres de Zalo a officiellement dépassé de grands noms tels que GPT-4 (OpenAI), gemma-2-9b-it (Google), microsoft/Phi-3-small-128k-instruct (Microsoft), se classant seulement derrière Llama-3-70B (Meta) dans le classement des compétences LLM vietnamiennes de VMLU.
![]() |
Classement VMLU des 10 meilleurs modèles construits à partir de zéro en 2024. Photo : Zalo. |
Les résultats montrent que le niveau de formation des grands modèles linguistiques n'est pas inférieur à celui du monde pour développer un modèle d'IA propre au Vietnam, en particulier dans le contexte d'un développement initial confronté à de nombreuses difficultés.
Les efforts vietnamiens pour développer des modèles d'IA
La formation en master se heurte à trois problèmes majeurs : le matériel de formation, les données et le niveau technique. Or, le Vietnam a rencontré des difficultés sur ces trois fronts. Auparavant, alors que les grandes entreprises mondiales possédaient des milliers de GPU hautes performances Nvidia de dernière génération, les ingénieurs vietnamiens ne disposaient pas de l'infrastructure serveur nécessaire. Par ailleurs, le vietnamien se classe parmi les pays où les ressources en données sont des dizaines de fois inférieures à celles de l'anglais ou du chinois. Les ressources humaines et l'expérience en formation en master au Vietnam sont également limitées par rapport aux pays développés.
À l'époque, l'équipe Zalo devait mener des recherches et des expérimentations sur de petits GPU civils afin de se doter des connaissances et des capacités de formation LLM nécessaires dès qu'une infrastructure informatique de grande envergure serait disponible. Les puces d'entraînement IA étant rares, Zalo, même après avoir commandé huit serveurs Nvidia DGX H100, ne pouvait pas les acquérir tous en même temps et devait attendre la livraison de chaque lot du fabricant. L'optimisation de l'infrastructure informatique incomplète afin de gagner du temps pour la formation était donc un autre problème que l'équipe Zalo devait résoudre.
Parallèlement, des données de formation de qualité sont également investies pour compenser le manque de sources de données vietnamiennes.
![]() |
Dr Nguyen Truong Son, directeur scientifique chez Zalo AI. Photo de : Zalo. |
« Malgré des débuts difficiles par rapport à d'autres grandes entreprises mondiales, Zalo a décidé d'entrer dans le jeu très tôt avec l'objectif de développer avec succès son propre modèle d'IA vietnamien. Nous avons consulté des chercheurs et des ingénieurs de nombreux instituts de recherche de premier plan dans le monde afin d'élaborer une stratégie de développement adaptée. Les succès obtenus à ce jour motivent les ingénieurs de Zalo à continuer d'optimiser le modèle pour en augmenter la quantité et la qualité, tout en exploitant son potentiel pour créer de nombreux produits d'IA de classe mondiale destinés aux utilisateurs vietnamiens », a déclaré le Dr Nguyen Truong Son, directeur scientifique de Zalo AI.
![]() |
Serveur DGX H100 commandé par Zalo auprès de Nvidia. Photo : Zalo. |
Grâce à une adaptation flexible dans les premières étapes difficiles du développement, Zalo a progressivement franchi des étapes décisives, progressant vers la maîtrise de la technologie mondiale de l'IA telle qu'elle est aujourd'hui.
Actuellement, le modèle d’IA de Zalo est non seulement efficace en termes de recherche en formation, mais il est également appliqué, favorisant l’accès et l’exploitation de la valeur des nouvelles technologies avancées pour les Vietnamiens.
Début 2025, Zalo a lancé l'assistant Kiki Info Q&R, exploité comme compte officiel (OA) sur la plateforme de messagerie Zalo. Cet assistant permet de poser des questions-réponses sur divers sujets de la vie, de la création de contenu et du divertissement. Selon les statistiques de Zalo, l'assistant Kiki Info a compté un million d'utilisateurs accédant au compte OA sur Zalo en moins de deux mois.
![]() |
Le modèle LLM de Zalo est appliqué au développement de Kiki Info Assistant. Photo : Zalo. |
Une autre application du modèle LLM de Zalo est la création de cartes IA, qui a également atteint le cap des 15 millions de cartes créées et envoyées en seulement deux mois. Cette application intéresse de nombreux utilisateurs de Zalo pour souhaiter des vœux à leurs proches à l'occasion des fêtes importantes.
Actuellement, les applications issues de grands modèles linguistiques sont encore en cours d'extension et de développement par Zalo, promettant d'apporter de nombreuses valeurs utiles aux utilisateurs nationaux.
Source : https://znews.vn/viet-nam-da-co-mo-hinh-ai-do-nguoi-viet-lam-chu-post1560653.html
Comment (0)