En quittant les États-Unis pour rentrer chez eux, Nguyen Hoang Quan et ses collègues de VILM ont développé un système d'intelligence artificielle (IA) gratuit que les Vietnamiens peuvent utiliser dans les domaines du service client, avec plus de centaines de milliers de téléchargements par mois.
En juin 2023, Nguyen Hoang Quan, 25 ans, et ses collègues Pham Nhut Huy, 23 ans, ingénieur en intelligence artificielle chez ZaloAI, et Dao Minh Dung, 24 ans, doctorant à l'Université de Cork, en Irlande, ont cofondé l'organisation à but non lucratif VILM, avec le désir d'aider les Vietnamiens à découvrir la technologie d'IA la plus avancée de la manière la plus optimale.
Après près de six mois de recherche et d'application, l'équipe a développé avec succès trois modèles d'IA gratuits : OpenHermes, VinaLlama et Vistral. Ces études constituent les fondements du développement de systèmes d'IA capables de comprendre les intentions des utilisateurs et d'agir en conséquence (modèle d'action large). Ces modèles sont appliqués dans des domaines technologiques tels que le contrôle des machines, les robots permettant de mieux accompagner les personnes handicapées sans aide, ou d'aider les programmeurs à corriger les erreurs, ou encore les assistants virtuels permettant de prendre en charge les clients ou de poser des questions gratuitement.
OpenHermes atteint 85 000 téléchargements par mois, se classant ainsi parmi les 10 modèles de langage les plus téléchargés sur HuggingFace ( le plus grand site de partage de modèles d'IA au monde ). Capture d'écran
Le modèle OpenHermes est un modèle linguistique de grande taille qui prend en charge l'anglais comme ChatGPT, mais avec des scores supérieurs. Il permet aux utilisateurs de télécharger le modèle sur leur ordinateur personnel pour l'utiliser sans connexion Internet. Il est à noter que la quantité de données d'entraînement d'OpenHermes ne représente que 1/100 de celles de ChatGPT d'OpenAI. Cette application enregistre actuellement plus de 50 000 téléchargements par mois. OpenHermes-2.5 et OpenHermes-2.5-Vision sont utilisés par plus de 40 startups de la Silicon Valley (États-Unis).
VinaLlama et Vistral sont deux modèles linguistiques axés sur le service au marché vietnamien, visant à aider les utilisateurs nationaux à découvrir plus facilement la technologie d'IA la plus avancée.
Hoang Quan a étudié 7 ans aux États-Unis et a travaillé chez OpenAI comme ingénieur de recherche sur le modèle d'intelligence artificielle ChatGPT, sans être diplômé universitaire. En 2022, il a travaillé comme ingénieur de données pour Microsoft et le produit Bing Chat d'OpenAI, gagnant des milliers de dollars. En 2023, confronté à une vague de licenciements dans le secteur technologique aux États-Unis, Quan a réalisé que le marché du travail après l'obtention de son diplôme était très sombre. Cependant, voyant des opportunités au Vietnam, il a décidé de rentrer au pays.
Nguyen Hoang Quan. Photo de : NVCC
Au VILM, Quan est l'ingénieur en chef responsable de la recherche sur les techniques d'amélioration des données et de formation à l'IA. Nhut Huy assure la recherche technique en formation à l'IA, tandis que Minh Dung propose de nouvelles méthodes de recherche théorique.
Quan a expliqué que les grands modèles linguistiques actuels, tels que ChatGPT (Large Language Model), ne peuvent produire que des sorties textuelles, alors que les humains disposent de nombreux moyens de communiquer et d'acquérir des connaissances. C'est pourquoi l'équipe vise à créer un système capable de gérer de manière flexible différents types d'entrées et de sorties (recevoir et émettre différents types de données, comme du langage, des images, des vidéos et des sons), et pas seulement au niveau du langage.
Pour atteindre l'objectif de création de modèles d'action de grande envergure, l'équipe a dû surmonter deux problèmes : la sécurité et la rapidité. Les applications d'IA actuelles utilisent principalement les données des utilisateurs et les envoient aux serveurs d'entreprises comme OpenAI pour traitement, ce qui soulève des problèmes de sécurité. L'équipe s'est attachée à créer des modèles d'IA suffisamment compacts et rapides pour être traités directement sur les appareils mobiles, tout en équilibrant performances et rapidité pour ne pas affecter l'expérience utilisateur.
L'équipe expérimentale a utilisé les données générées par l'IA pour entraîner l'IA elle-même, au lieu d'utiliser des données provenant de sources réelles. Initialement, elle a eu du mal à trouver des ressources informatiques (des ordinateurs pour entraîner l'IA), mais a ensuite convaincu de grandes entreprises et des laboratoires du monde entier de financer son projet.
Quan a expliqué que l'objectif principal de ces produits est de permettre un accès rapide aux applications d'IA, avec une qualité comparable à celle de ChatGPT ou de Bing Chat, et de simplifier la recherche et la création de modèles d'IA à l'avenir. Au lieu d'utiliser ChatGPT, dont la langue et la culture vietnamiennes sont limitées, les entreprises vietnamiennes peuvent télécharger VinaLlama en vietnamien.
Le modèle linguistique VinaLlama résout facilement un problème mathématique en vietnamien. L'image montre une démonstration du produit VinaLlama pour résoudre des problèmes mathématiques. Capture d'écran.
M. Dang Hai Loc, fondateur de Mindmaid, plateforme de création de chatbots IA, a déclaré que, du point de vue d'un développeur d'applications IA, il avait compris que le coût et la confidentialité des données étaient les deux principales préoccupations des entreprises lors du déploiement d'applications IA. La solution la plus satisfaisante à ce problème réside dans les modèles LLM open source, capables de fonctionner sur l'infrastructure de l'entreprise et d'apprendre (affiner) davantage de données internes. Par conséquent, les modèles LLM open source vietnamiens tels que VinaLlama et Vistral sont très utiles pour promouvoir les applications IA au Vietnam.
« Ces modèles open source permettent également à davantage de programmeurs et de passionnés de technologie d'accéder au métier d'ingénieur en IA avec un simple MacBook, sans avoir à investir dans une infrastructure GPU (carte graphique) coûteuse. Cela favorisera également le développement des ingénieurs en IA au Vietnam, un poste très recherché dans un avenir proche », a déclaré M. Loc.
Selon Quan, les Vietnamiens possèdent de solides bases en théorie scientifique et maîtrisent l'IA. ChatGPT dispose également de ressources humaines impliquées dans la recherche, mais ils peinent à s'adapter rapidement à l'évolution constante des technologies. « Ce dont les Vietnamiens ont besoin, c'est d'une expérience dans la conception de produits destinés aux utilisateurs finaux pour comprendre véritablement les problèmes qu'ils rencontrent et orienter correctement leurs recherches », a expliqué Quan à propos de la recherche de modèles d'IA gratuits pour soutenir les Vietnamiens dans le domaine technologique. Il a indiqué avoir collaboré avec de nombreux groupes internationaux et être toujours prêt à collaborer avec des groupes de recherche vietnamiens.
Nhu Quynh
Lien source
Comment (0)