Vietnam.vn - Nền tảng quảng bá Việt Nam

Dr. Dao Duc Minh: „Stăpânirea datelor vietnameze este primul pas în dezvoltarea și stăpânirea tehnologiei vietnameze”

Báo Thanh niênBáo Thanh niên27/05/2024

imagine Având în vedere că ați lucrat pentru o mare organizație de inteligență artificială din SUA, de ce ați decis să vă întoarceți în Vietnam pentru a vă alătura VinBigdata? În timp ce lucrați în SUA, deși am participat la numeroase proiecte guvernamentale mari, rezultatele pe care le-am obținut au fost adesea doar câțiva pași dintr-un proces amplu de procesare. De multe ori, din cauza procedurilor foarte stricte de confidențialitate ale proiectelor, nici măcar nu știam cum erau utilizate soluțiile pe care le dezvoltasem. În 2017, m-am întors în Vietnam când Vietnamul se afla în stadiul de dezvoltare și existau multe probleme legate de big data și inteligența artificială care trebuiau rezolvate. Am acceptat invitația profesorului Vu Ha Van de a realiza împreună obiectivul de a dezvolta soluții tehnologice vietnameze pentru a servi viețile poporului vietnamez. Consider că întoarcerea mea în Vietnam este mult mai semnificativă, deoarece voi putea lucra la probleme cu o influență mai mare.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 2.

Dr. Dao Duc Minh într-un atelier

NVCC

În strategia de dezvoltare a inteligenței artificiale, ce rol și ce influență joacă big data, domnule? Datele joacă un rol foarte important și valoros în antrenarea inteligenței artificiale. Pentru a antrena un model de inteligență artificială de înaltă calitate, începem adesea prin antrenarea unei baze de date mari. Prin urmare, pentru a avea inteligență artificială de calitate, trebuie mai întâi să avem date bune. Datele bune trebuie să îndeplinească standarde de cantitate și scară, calitate, diversitate și universalitate. Procesul de colectare și procesare a mii de ore de date de la etapa de curățare a datelor brute pentru a crea date de cea mai înaltă calitate care să alimenteze modelul de inteligență artificială este foarte costisitor și complicat. Dimpotrivă, pentru a analiza big data, trebuie să folosim inteligența artificială pentru a asigura capacitatea de a procesa datele cu precizie la scară largă, creând astfel rezultate mai decisive sau predictive. De exemplu, în procesul de dezvoltare a unui produs de asistent virtual pentru vietnamezi (ViVi), a trebuit să colectăm și să procesăm zeci de mii de ore de date audio de înaltă calitate, de la sute de mii de voci din diferite regiuni, vârste și sexe diverse, cu conținut care acoperă sute de domenii... Sau, cel mai recent, lansarea ViGPT - „Prima versiune vietnameză a ChatGPT pentru utilizatorii finali”, dezvoltată dintr-un Model Big Language deținut în totalitate de VinBigdata. Acest model a fost antrenat pe baza a 600 GB de date vietnameze rafinate din multe domenii diferite. Cu înțelegerea noastră a datelor și limbii vietnameze, am găsit o nouă abordare pentru a scurta timpul de lansare a ViGPT în doar 9 luni de la nașterea ChatGPT. Aceasta este rezonanța dintre big data și inteligența artificială.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 3.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 4.
Care este opinia dumneavoastră despre corelarea cercetării cu valoarea practică pentru a servi comunitatea? - Cred că cercetarea tehnologică are cu adevărat succes doar atunci când aceasta intră efectiv în viață, rezolvă probleme sociale și îmbunătățește viața oamenilor. Pentru a crea produse comerciale practice și a rezolva probleme de afaceri și sociale, trebuie să fim întotdeauna atenți și să ne punem întrebarea: ce valoare vor aduce datele la viață? Până în prezent, am cercetat o varietate de produse și soluții în diverse domenii și profesii, de obicei ViGPT, VinDr - care oferă soluții de inteligență artificială în diagnosticul imagistic medical , VinBase - o platformă pentru inteligență artificială sau Vizone - un set de soluții inteligente de analiză a imaginilor.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 5.

Cu personalul cheie al VinBigdata la un eveniment al Vingroup Corporation

NVCC

A patra revoluție industrială are loc cu forță la scară globală. Ce avantaje credeți că are Vietnamul? Comparativ cu revoluțiile anterioare, cred că Vietnamul are în prezent multe avantaje de depășit în această revoluție industrială 4.0, contribuind la îmbunătățirea poziției țării pe harta lumii . Cele două chei pentru atingerea acestui obiectiv sunt datele și oamenii. Vietnamul are în prezent aproape 100 de milioane de locuitori, dintre care o proporție mare de tineri utilizează telefoane și computere personale. În plus, avem experți reputați în inteligență artificială și personal tânăr și de înaltă calitate în tehnologia informației și avem o bază foarte bună în matematică. Deci, care sunt limitările? Prima limitare care poate fi observată este că, în ciuda unei populații numeroase, încă întâmpinăm dificultăți în stăpânirea datelor, în special în standardizarea și sincronizarea datelor la nivel de instalații, unități comerciale și administrative. În plus, ne confruntăm și cu alte constrângeri, cum ar fi resursele limitate de investiții, în special investițiile în infrastructura de calcul de înaltă performanță.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 6.
În opinia dumneavoastră, cât de importantă este stăpânirea datelor vietnameze în parcursul de creare și stăpânire a tehnologiei care să servească viețile vietnamezilor? În prezent, există multe produse de inteligență artificială de vârf în lume, de obicei produse de aplicații IA create pe baza unor modele lingvistice mari, cum ar fi ChatGPT de la OpenAI sau Bard de la Google. Cu toate acestea, vietnameza nu este grupul lingvistic principal pentru dezvoltarea acestor produse. Prin urmare, calitatea conținutului specific vietnamez returnat utilizatorilor este mai mult sau mai puțin afectată și există o probabilitate mare de erori, mai periculos, erori în cunoștințele de bază. Ca vietnamezi, avem avantajul de a accesa propriile surse de date. Doar noi avem capacitatea de a înțelege caracteristicile datelor vietnameze, nevoile și particularitățile vietnamezilor. Prin urmare, stăpânirea datelor vietnameze este cu adevărat cheia pentru stăpânirea tehnologiilor de bază, care sunt tehnologiile care vor servi poporul vietnamez.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 7.

Instruire internă pentru membrii VinBigdata

NVCC

Cum să accesăm surse de date specifice, mai ales când majoritatea vietnamezilor folosesc astăzi site-uri de socializare din străinătate? De fapt, cea mai mare sursă de date umane astăzi (nu doar vietnamezii) este internetul și rețelele sociale. Cu toate acestea, putem în continuare accesa și colecta date din diferite surse, pe baza înțelegerii caracteristicilor datelor vietnameze, în funcție de caracteristicile stabilite de fiecare proiect. De exemplu, modelele GPT ale OpenAI au până la sute, chiar trilioane de parametri, antrenați pe cantități uriașe de date și costă miliarde de dolari. Comparativ cu acestea, am ales o direcție complet diferită pe baza cercetării, capacităților și resurselor noastre: adică, crearea unui model de limbă vietnameză cu o arhitectură de doar câteva miliarde de parametri, antrenat pe un set de date vietnameze de 600 GB pe care l-am colectat și rafinat singuri, dar cu capacități echivalente în ceea ce privește procesarea limbii vietnameze. Rezultatele arată că arhitectura noastră auto-dezvoltată se poate auto-optimiza, poate scurta timpul de antrenament al modelului de limbă, poate reduce costurile, asigurând în același timp calitatea modelului. Care sunt provocările pe care dumneavoastră și echipa dumneavoastră le-ați întâmpinat în procesul de cercetare și dezvoltare a produselor de inteligență artificială? Prima provocare este cu siguranță timpul. Valul tehnologiei inteligenței artificiale vine foarte rapid și se află într-o perioadă de avânt. În lume, companiile tehnologice de top au lansat rapid produse extrem de complete, care sunt actualizate și îmbunătățite constant. Dacă suntem lenți și nu lansăm produse la timp, cu siguranță vom rămâne în urmă. Pe de altă parte, dacă vrem să creăm produse care pot fi aplicate și care pot rezolva probleme sociale practice, trebuie să luăm în considerare și găsirea și dezvoltarea caracteristicilor remarcabile, speciale și unice ale produsului.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 8.

Prezentare la Ziua Inteligenței Artificiale din Vietnam (AI4VN 2023)

NVCC

În realitate, multe persoane și organizații din Vietnam și din întreaga lume au suferit multe daune din cauza scurgerilor de date. Cum priviți problema securității datelor? Se poate spune că orice aplicație de astăzi provine din date. Atunci când lucrăm cu date, pe de o parte, trebuie să ne asigurăm de obiectivul de a aplica datele pentru a crea cea mai bună tehnologie pentru viață, iar pe de altă parte, trebuie să asigurăm securitatea datelor pentru indivizi și organizații. Factorul uman este o verigă foarte importantă în procesul de asigurare a securității datelor. Aceștia includ dezvoltatori, utilizatori de produse și utilizatori. Pentru dezvoltatori, conștientizarea securității datelor trebuie să fie prezentă încă de la începutul colectării și procesării datelor. Adesea, atunci când nu apare nicio problemă, nu suntem conștienți de importanța securității datelor. Dar dacă apare o scurgere de date, daunele pot fi uriașe. Încălcările de date pot apărea din cauza unor probleme tehnice sau a unor atacuri intenționate de furt de date. Atunci când datele sunt sparte, informațiile persoanelor sau organizațiilor pot fi utilizate în scopuri ilegale de către infractori, în timp ce companiile pot suferi pierderi financiare pentru a remedia problemele conexe și chiar daune aduse mărcii.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 9.

Dr. Dao Duc Minh și echipa VinBigdata la un eveniment

NVCC

După aspirația de a stăpâni tehnologia pentru a servi poporul vietnamez, cu siguranță vor exista pași pentru a avansa în lume? Orice organizație sau întreprindere care dorește să își aducă produsele pe piața internațională trebuie să respecte standardele internaționale. VinBigdata are puncte forte în soluții și tehnologie, așa că stabilirea unei viziuni de a cuceri lumea este naturală. Desigur, pentru a implementa diverse produse și aplicații, este necesar să se beneficieze de compania unor unități internaționale cu mulți ani de experiență și înțelegere a utilizatorilor din întreaga lume. Mulțumesc!

Thanhnien.vn

Sursă: https://thanhnien.vn/ts-dao-duc-minh-lam-chu-du-lieu-viet-la-buoc-dau-phat-trien-va-nam-giu-cong-nghe-viet-18524052710263732.htm

Comentariu (0)

No data
No data

Pe aceeași temă

În aceeași categorie

Orașul Ho Și Min: Strada cu felinare Luong Nhu Hoc este colorată pentru a întâmpina Festivalul de la Mijlocul Toamnei
Păstrând spiritul Festivalului de la Mijlocul Toamnei prin culorile figurinelor
Descoperă singurul sat din Vietnam din top 50 cele mai frumoase sate din lume
De ce sunt populare anul acesta felinarele cu steaguri roșii și stele galbene?

De același autor

Patrimoniu

Figura

Afaceri

No videos available

Ştiri

Sistem politic

Local

Produs