Ces informations ont été communiquées par le professeur Vu Ha Van, directeur scientifique de VinBigdata, lors d'une discussion avec des journalistes en marge du récent événement de lancement de ViGPT.
ViGPT a besoin de contributions de techniciens et de la communauté.
Le professeur Vu Ha Van a expliqué que les grandes entreprises comme Google privilégient l'anglais ou le français comme langue principale lors du développement de systèmes linguistiques complexes. Bien que le vietnamien soit également disponible, les résultats de recherche sont relativement plus lents qu'avec d'autres langues. De ce fait, les réponses de ces systèmes linguistiques aux questions posées en vietnamien sont souvent incomplètes et imprécises.
Par conséquent, VinBigdata espère qu'à terme, ViGPT surpassera les modèles existants en termes de précision pour les questions portant directement sur la culture, l'histoire, la géographie… bref, sur les caractéristiques et les particularités du peuple vietnamien. C'est précisément l'objectif des créateurs du modèle de langue vietnamienne : obtenir des réponses plus pertinentes que celles provenant de pays étrangers.
En approfondissant l'analyse, le directeur scientifique de VinBigdata a examiné, par exemple, une question relative à l'histoire de Truong Sa et Hoang Sa, dans un contexte politique sensible. Il nous est très difficile de garantir que la réponse de Google ou d'OpenAI ne soit pas influencée par les partis pris politiques des fondateurs ou des personnes à l'origine de ces entreprises. D'autres options existent au Vietnam ; il serait préférable de prendre cette question en considération.
« Notre objectif, en élaborant un modèle linguistique de grande envergure pour les Vietnamiens, est de leur fournir les meilleures réponses possibles. Nous ne pouvons pas connaître leurs objectifs », a expliqué le professeur Vu Ha Van.
Il est vrai que ViGPT ne possède pas encore toutes les fonctionnalités de ChatGPT ou Google Bard, car les investissements et les délais de développement de ces entreprises sont bien plus importants. Cependant, le professeur Vu Ha Van a indiqué que pour certaines questions orientées vers le Vietnam, comme « Quel drapeau est brodé de six mots d'or ? », ViGPT répondra « Tran Quoc Toan », même si d'autres réponses peuvent être erronées. À l'avenir, pour des questions plus approfondies de ce type, ViGPT pourra s'améliorer grâce aux retours des utilisateurs vietnamiens.
« Si les utilisateurs se contentent de critiquer, ou pensent que ce modèle de langage complexe est encore stupide alors que leur enfant de 10 ans connaît des réponses à des questions auxquelles ils n'ont pas pensé, ou encore posent des questions pièges pour prouver qu'ils sont plus intelligents que l'IA, alors nous sommes plus intelligents que l'IA, mais cela n'a aucun sens. Au lieu d'améliorer le produit, nous ne faisons que rendre les personnes qui le développent plus malheureuses. C'est pourquoi VinBigdata a besoin de la contribution de tous, techniciens et citoyens. Nous avons besoin du soutien du peuple vietnamien pour perfectionner le produit et en faire non seulement un simple outil, mais aussi une source de fierté pour les Vietnamiens », a souligné le professeur Vu Ha Van.
Prêt à soutenir et à accompagner le modèle de langue vietnamienne
S'adressant à VietNamNet , des représentants de startups travaillant sur l'IA au Vietnam ont déclaré être prêts à soutenir et à accompagner le modèle de langue vietnamienne de VinBigdata.
M. Dinh Tran Tuan Linh, directeur technique de la société Unikon, propriétaire de la plateforme Aicontent.vn, a déclaré qu'actuellement, peu de pays asiatiques ont déployé des efforts considérables pour entraîner avec succès leurs propres modèles de langage à grande échelle. La Chine, la Corée et le Japon sont en tête. Par conséquent, ViGPT représente un signal fort de l'engagement du peuple vietnamien dans les technologies de pointe. Selon M. Dinh Tran Tuan Linh, tout voyage de mille lieues commence par un premier pas. Pionnière dans le domaine des applications de l'IA, Unikon souhaite contribuer au développement de ViGPT, participer à ses tests, fournir des retours d'expérience et même l'utiliser dans certains projets d'envergure appropriée.
Par ailleurs, M. Dang Huu Son, cofondateur de Lovinbot, a déclaré que la prise en compte par VinBigdata des commentaires de la communauté et des experts était un atout majeur pour le développement d'un modèle linguistique complet spécifiquement destiné aux Vietnamiens. En tant que technicien, M. Dang Huu Son a également fait part de ses retours à l'équipe technique de VinBigdata après avoir utilisé le produit.
Selon M. Dang Huu Son, un nouveau produit ne peut être finalisé immédiatement, ni bénéficier d'un soutien total de la communauté d'emblée. En effet, les Vietnamiens ont longtemps pensé que le Vietnam était incapable de maîtriser cette technologie ; il faut donc encore du temps. Par ailleurs, VinBigdata doit recevoir des instructions précises sur la manière dont la communauté peut mieux l'accompagner et la soutenir.
M. Dang Huu Loc, fondateur de la plateforme Mindmaid, a également souligné que très peu de pays au monde sont actuellement capables de développer un modèle de langue nationale. Même des pays riches dotés de technologies de l'information performantes comme l'Inde, ou des pays au PIB supérieur à celui du Vietnam comme l'Indonésie, au Moyen-Orient, ne peuvent y parvenir par simple volonté, car cela dépend des caractéristiques linguistiques. Par conséquent, d'un point de vue plus large, le Vietnam possède un avantage stratégique dans le développement d'un tel modèle, ce qui constituera un atout majeur pour la compétitivité mondiale des Vietnamiens.
Selon M. Dang Huu Loc, tout effort visant à construire un modèle linguistique vietnamien étendu est précieux et mérite d'être commenté de manière ciblée afin d'améliorer continuellement le modèle, plutôt que de discréditer les efforts des entreprises technologiques nationales en se basant sur certaines lacunes actuelles. Les Vietnamiens devraient également mieux faire connaître l'importance de la technologie des grands langages à l'ère de l'IA et discuter davantage de la manière de l'appliquer pour créer de la valeur pour eux-mêmes et les entreprises vietnamiennes, au lieu de comparer le grand modèle linguistique vietnamien aux meilleurs grands modèles existants au monde. Bien que le grand langage soit une technologie d'IA générale, il peut ne pas être optimal pour ce problème précis, mais il est adapté à d'autres problèmes spécifiques. En particulier, le grand modèle linguistique vietnamien présentera un avantage certain pour les problèmes liés à la compréhension et à la génération du vietnamien.
Source






Comment (0)