Vietnam.vn - Nền tảng quảng bá Việt Nam

Dr Dao Duc Minh : « La maîtrise des données vietnamiennes est la première étape du développement et de la maîtrise de la technologie vietnamienne »

Báo Thanh niênBáo Thanh niên27/05/2024

image Après avoir travaillé pour une grande organisation d’intelligence artificielle aux États-Unis, pourquoi avez-vous décidé de rentrer chez vous pour rejoindre VinBigdata ? Au cours de mon travail aux États-Unis, bien que j’aie participé à de nombreux grands projets gouvernementaux, les résultats que j’ai obtenus n’étaient souvent que quelques étapes d’une vaste procédure de traitement. En fait, bien souvent, en raison des procédures de confidentialité très strictes des projets, je ne sais même pas comment les solutions que j’ai développées sont utilisées. En 2017, je suis retourné au Vietnam alors que le pays était en phase de développement et qu’il y avait de nombreux problèmes liés au big data et à l’intelligence artificielle qui devaient être résolus. J'ai accepté l'invitation du professeur Vu Ha Van pour réaliser conjointement l'objectif de développer des solutions technologiques vietnamiennes pour servir la vie des Vietnamiens. Je trouve mon retour au Vietnam beaucoup plus significatif car je pourrai résoudre des problèmes avec plus d’impact.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 2.

Dr Dao Duc Minh lors d'un atelier

NVCC

Dans la stratégie de développement de l’intelligence artificielle, quel rôle et quelle influence jouent les big data, monsieur ? Les données jouent un rôle énorme et précieux dans la formation de l’intelligence artificielle. La formation d’un modèle d’intelligence artificielle de haute qualité commence généralement par la formation d’un grand ensemble de données. Par conséquent, pour avoir une intelligence artificielle de qualité, nous devons d’abord disposer de bonnes données. De bonnes données doivent être de qualité adéquate en termes de quantité et d’échelle, de qualité, de variété et d’universalité. Le processus de collecte et de traitement de milliers d’heures de données, du nettoyage des données brutes à la création de données de la plus haute qualité pour alimenter les modèles d’intelligence artificielle, est coûteux et complexe. En revanche, pour analyser les big data, nous devons utiliser l’intelligence artificielle pour garantir la capacité de traiter les données avec précision à grande échelle, créant ainsi de meilleurs résultats décisifs ou prédictifs. Par exemple, dans le processus de développement d'un produit d'assistant virtuel pour les Vietnamiens (ViVi), nous avons dû collecter et traiter des dizaines de milliers d'heures de données audio de haute qualité, provenant de centaines de milliers de voix de différentes régions, d'âges et de sexes divers, avec un contenu couvrant des centaines de domaines... Ou plus récemment, le lancement de ViGPT - « La première version vietnamienne de ChatGPT pour les utilisateurs finaux » développée à partir d'un grand modèle linguistique entièrement détenu par VinBigdata. Ce modèle est formé sur 600 Go de données vietnamiennes affinées provenant de divers domaines. Grâce à notre connaissance de la langue et des données vietnamiennes, nous avons trouvé une nouvelle approche pour raccourcir le temps de lancement de ViGPT en seulement 9 mois après la naissance de ChatGPT. C’est la résonance entre le big data et l’intelligence artificielle.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 3.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 4.
Quel est votre point de vue sur la nécessité de lier la recherche à la valeur pratique pour servir la communauté ? - Je crois que la recherche technologique n’est véritablement fructueuse que lorsqu’elle entre réellement dans la vie, résout les problèmes sociaux et améliore la vie des gens. Pour créer des produits commerciaux pratiques qui résolvent les problèmes commerciaux et sociaux, nous devons toujours être attentifs et nous poser la question : quelle valeur les données apporteront-elles à la vie ? Jusqu'à présent, nous avons recherché et développé une variété de produits et de solutions pour diverses industries et domaines, généralement ViGPT, VinDr - fournissant des solutions d'IA dans le diagnostic d'imagerie médicale, VinBase - une plate-forme d'intelligence bio-artificielle, ou Vizone - un ensemble de solutions d'analyse d'images intelligentes.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 5.

Avec le personnel clé de VinBigdata lors d'un événement de Vingroup Corporation

NVCC

La quatrième révolution industrielle se déroule à grande échelle à l’échelle mondiale. Quels avantages pensez-vous que le Vietnam possède ? Par rapport aux révolutions précédentes, je pense que le Vietnam a actuellement de nombreux avantages pour percer dans cette révolution industrielle 4.0, contribuant à améliorer la position du pays sur la carte du monde. Les deux clés pour atteindre cet objectif sont les données et les personnes. Le Vietnam compte actuellement près de 100 millions d’habitants, dont une grande partie de jeunes utilisent des téléphones et des ordinateurs personnels. De plus, nous disposons d’experts réputés en intelligence artificielle et d’un personnel jeune et de qualité en technologies de l’information et d’une très bonne base en mathématiques. Alors, quelles sont les limites ? La première limitation évidente est que malgré une population importante, nous éprouvons encore des difficultés à maîtriser les données, notamment à les normaliser et à les synchroniser au niveau des installations, des unités commerciales et des administrations. En outre, nous sommes également confrontés à d’autres contraintes telles que des ressources d’investissement limitées, notamment dans les infrastructures de calcul haute performance.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 6.
Selon vous, quelle est l’importance du rôle de la maîtrise des données vietnamiennes dans le parcours de création et de maîtrise de la technologie au service de la vie des Vietnamiens ? Il existe actuellement de nombreux produits d'intelligence artificielle de premier plan dans le monde, généralement des produits d'application d'IA générés sur la base de grands modèles de langage tels que ChatGPT d'OpenAI ou Bard de Google. Cependant, le vietnamien n’est pas le groupe linguistique principal pour le développement de ces produits. Par conséquent, la qualité du contenu spécifique au vietnamien renvoyé aux utilisateurs est plus ou moins affectée et présente une forte possibilité d'erreurs, plus dangereusement, d'erreurs dans les connaissances de base. En tant que Vietnamiens, nous avons l’avantage d’accéder à nos propres sources de données. Nous sommes les seuls à pouvoir comprendre les caractéristiques des données vietnamiennes, les besoins et les caractéristiques du peuple vietnamien. Par conséquent, la maîtrise des données vietnamiennes est véritablement la clé pour maîtriser les technologies de base, qui sont les technologies qui serviront le peuple vietnamien.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 7.

Formation interne pour les membres de VinBigdata

NVCC

Comment accéder à des sources de données spécifiques, surtout lorsque la plupart des Vietnamiens utilisent aujourd’hui des sites de réseaux sociaux depuis l’étranger ? Le fait est que la plus grande source de données humaines aujourd’hui (pas seulement les Vietnamiens) se trouve sur Internet et les réseaux sociaux. Cependant, nous pouvons toujours accéder et collecter des données provenant de différentes sources, en fonction de la compréhension des caractéristiques des données vietnamiennes, en fonction des caractéristiques définies par chaque projet. Par exemple, les modèles GPT d’OpenAI comportent des centaines, voire des milliards de paramètres, sont formés sur des quantités massives de données et coûtent des milliards de dollars. Par rapport à eux, nous avons choisi une direction complètement différente en fonction de nos recherches, de nos capacités et de nos ressources : c'est-à-dire la création d'un modèle de langue vietnamienne avec une architecture de seulement quelques milliards de paramètres, formé sur un ensemble de données vietnamiennes de 600 Go que nous avons collectées et affinées nous-mêmes, mais avec des capacités équivalentes en termes de capacité de traitement vietnamienne. Les résultats montrent que notre architecture auto-développée peut s'auto-optimiser, raccourcir le temps de formation du modèle de langage, réduire les coûts tout en garantissant la qualité du modèle. Quels sont les défis que vous et votre équipe avez rencontrés dans le processus de recherche et de développement de produits d’intelligence artificielle ? Le premier défi est certainement le temps. La vague de technologie de l’intelligence artificielle arrive très vite et est en pleine expansion. Partout dans le monde, les principales entreprises technologiques ont rapidement lancé des produits très complets qui sont constamment mis à jour et améliorés. Si nous sommes lents et ne livrons pas les produits à temps, nous serons certainement en retard. D’autre part, si nous voulons créer des produits qui peuvent être appliqués et résoudre des problèmes sociaux pratiques, nous devons également envisager de trouver et de développer les caractéristiques exceptionnelles, spéciales et uniques du produit.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 8.

Présentation à la Journée de l'intelligence artificielle au Vietnam (AI4VN 2023)

NVCC

En fait, de nombreuses personnes et organisations au Vietnam et dans le monde entier ont subi de lourdes pertes à cause de fuites de données. Comment voyez-vous les problèmes de sécurité des données ? On peut dire que toute application aujourd’hui provient des données. Lorsque nous travaillons avec des données, nous devons d’une part garantir l’objectif d’appliquer les données pour créer la meilleure technologie pour la vie, et d’autre part, nous devons garantir la sécurité des données pour les individus et les organisations. Le facteur humain est un maillon très important dans le processus de sécurité des données. Ils incluent les développeurs, les utilisateurs de produits et les utilisateurs. Pour les développeurs, la sensibilisation à la sécurité des données doit être présente dès le début de la collecte et du traitement des données. Souvent, lorsque rien ne se passe, nous ne sommes pas conscients de l’importance de la sécurité des données. Mais si une violation de données se produit, les dommages pourraient être énormes. Les violations de données peuvent survenir en raison de problèmes techniques ou d’attaques intentionnelles de vol de données. Lorsque des données sont divulguées, les informations des individus ou des organisations peuvent être utilisées par des personnes malintentionnées à des fins illégales, tandis que les entreprises peuvent subir des pertes financières pour résoudre les problèmes liés, et même nuire à leur marque.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 9.

Le Dr Dao Duc Minh et l'équipe VinBigdata lors d'un événement

NVCC

Après l'aspiration à maîtriser la technologie pour servir le peuple vietnamien, y aura-t-il des étapes pour progresser vers le monde ? Toute organisation ou entreprise qui souhaite commercialiser ses produits sur le marché international doit se conformer aux normes internationales. VinBigdata possède des atouts en matière de solutions et de technologie, il est donc naturel de se fixer une vision pour conquérir le monde. Bien entendu, pour déployer de nombreux produits et applications différents, il est nécessaire de bénéficier du soutien d'unités internationales disposant de nombreuses années d'expérience et de compréhension des utilisateurs du monde entier. Merci!

Thanhnien.vn

Source : https://thanhnien.vn/ts-dao-duc-minh-lam-chu-du-lieu-viet-la-buoc-dau-phat-trien-va-nam-giu-cong-nghe-viet-18524052710263732.htm

Comment (0)

No data
No data

Même sujet

Même catégorie

Les gens ont attendu 5 heures pour admirer les brillants feux d'artifice dans le ciel de Ho Chi Minh-Ville
En direct : Ouverture de la saison touristique 2025 à Thai Nguyen
Gros plan sur l'intersection de la circulation à Quy Nhon qui a obligé Binh Dinh à dépenser plus de 500 milliards de dollars en rénovation
Les armées chinoise, cambodgienne et laotienne organisent un défilé militaire conjoint à Ho Chi Minh-Ville

Même auteur

Patrimoine

Chiffre

Entreprise

No videos available

Nouvelles

Système politique

Locale

Produit