Explozia inteligenței artificiale generative (IA) a transformat complet peisajul tehnologic global.
De când OpenAI a lansat ChatGPT la sfârșitul anului 2022, o serie de modele LLM similare au apărut continuu, aplicate în multe domenii precum sănătatea, educația , finanțele și dreptul. Cursa a devenit acerbă, nu numai la nivel de întreprindere, ci și la nivel național în ceea ce privește capacitatea de formare, infrastructura de calcul și datele.
Companii mari precum OpenAI, Google, Meta și Microsoft, cu resursele lor financiare și condițiile favorabile, au investit rapid miliarde de dolari pentru a achiziționa mii de GPU-uri de ultimă generație, precum Nvidia H100 – o componentă esențială pentru antrenarea modelelor LLM. Prețul acțiunilor Nvidia a crescut vertiginos în acea perioadă, reflectând cererea globală de infrastructură.
Între timp, companiile de tehnologie din țările în curs de dezvoltare, pe lângă problemele legate de costuri, se confruntă și cu limitări în importul și exportul de echipamente cu cipuri de inteligență artificială din SUA. Acest lucru duce la o lipsă de echipamente de instruire și la un ritm mai lent în comparație cu giganții tehnologici. Cu ambiția sa de a avea succes pe plan intern, Zalo este, de asemenea, prinsă în acest vârtej.
În ceea ce privește datele, problemele anterioare de învățare automată au necesitat cantități mari de date de antrenament, însă pentru modele lingvistice la scară largă, aceasta este o cantitate enormă. Pentru a avea un model suficient de bun, un sistem LLM necesită zeci, chiar sute de miliarde de jetoane de text de intrare. Între timp, în ceea ce privește popularitatea, limba vietnameză nu se compară cu engleza și chineza. Acest lucru a sporit considerabil dificultățile pentru dezvoltatorii vietnamezi LLM.
În 2023, modelele lingvistice mari (LLM), cum ar fi GPT-3.5 și GPT-4, au revoluționat lumea tehnologiei, iar multe companii vietnameze au ales, de asemenea, modele fin reglate, ușor disponibile din străinătate, pentru a lua scurtături și a avansa în procesul de formare LLM.
Zalo a ales o cale diferită – mai provocatoare, dar mai independentă: antrenarea modelului său de la zero. Această abordare necesită ca totul să fie construit de la zero – de la date și arhitectura modelului până la întregul proces de antrenament. Această decizie nu a fost despre concurența cu giganți, ci despre realizarea aspirațiilor poporului vietnamez: stăpânirea modelului LLM în limba lor maternă.
„Am anticipat dificultățile și totuși am decis să intrăm în joc devreme. Nu am concurat direct cu «marii jucători», ci am ales o nișă de piață unde ne puteam descurca mai bine. Aspirația noastră este să construim un model pe care vietnamezii să îl stăpânească complet – de la date la algoritmi”, a declarat Dr. Nguyen Truong Son, director științific la Zalo AI.
În ciuda numeroaselor obstacole în trei domenii cheie - infrastructură, date și instruire - inginerii vietnamezi au căutat în mod proactiv soluții pentru a depăși aceste provocări. Acest lucru demonstrează spiritul și voința poporului vietnamez în circumstanțe dificile, în special în depășirea provocărilor dezvoltării unui program de masterat în drept (LLM) pentru poporul vietnamez.
Pentru a instrui inginerii în domeniul LLM (Level Learning), aceștia aveau nevoie de infrastructura potrivită. Însă, la acea vreme, GPU-urile precum H100 de la Nvidia erau aproape o „raritate globală”. Între timp, marile companii le precomandaseră cu un an înainte și plătiseră milioane de dolari pentru a le achiziționa. În Vietnam, Zalo a încercat, de asemenea, să achiziționeze 8 servere DGX H100, dar nu a fost ușor, necesitând așteptarea fiecărei livrări de la producător.
În absența GPU-urilor Nvidia, inginerii vietnamezi au fost nevoiți să utilizeze în mod flexibil GPU-uri de calitate pentru consumatori pentru experimente pe linii individuale de cod și modele la scară mică. În loc să aștepte, inginerii s-au pregătit proactiv, astfel încât, atunci când vor achiziționa echipamente moderne, totul să fie gata.
În ceea ce privește datele, în loc să se bazeze pe resurse ușor disponibile, Zalo investește în construirea propriului depozit de date de înaltă calitate pentru limba vietnameză, cu scopul de a compensa deficitul semnificativ față de engleză și chineză.
Datorită strategiei sale flexibile de dezvoltare, Zalo a scurtat timpul de dezvoltare pentru modelul său lingvistic extins de la 18 luni, cât era prevăzut, la doar 6 luni. La sfârșitul anului 2023, modelul lingvistic extins vietnamez al Zalo a fost lansat oficial la Zalo AI Summit, un eveniment care a reunit experți de top în tehnologie și inteligență artificială din Vietnam. Acolo, modelul LLM al Zalo și-a făcut debutul printr-o provocare Kahoot lansată de Tinhte.vn și a depășit în mod surprinzător GPT 3.5, clasându-se doar după GPT4 - modelul LLM considerat cel mai puternic din lume la acea vreme.
Pe platforma de benchmarking VMLU (Vietnamese Multitask Language Understanding Benchmark Suite for Large Language Models), modelul lui Zalo a atins o performanță de 1,5 ori mai mare decât GPT-3.5 de la OpenAI. Până la sfârșitul anului 2024, acest model a depășit chiar și jucători majori precum GPT-4 (OpenAI), Gemma-2-9B (Google) și Phi-3-small (Microsoft), clasându-se doar după LLaMA-3-70B de la Meta în ceea ce privește capacitățile de procesare a limbii vietnameze în clasamentul VMLU.
Dincolo de simpla cercetare, Zalo aduce treptat tehnologia din laborator în viața reală prin comercializarea și popularizarea produselor și aplicațiilor derivate din LLM.
La începutul anului 2025, asistentul complet de întrebări și răspunsuri Kiki Info – operat ca un cont oficial pe platforma Zalo – a atras peste 1 milion de utilizatori în mai puțin de două luni. O altă aplicație, AI Greeting Cards, a atins, de asemenea, un număr impresionant de 15 milioane de felicitări create și trimise în doar două luni.
Călătoria lui Zalo nu se rezumă doar la o companie care dorește să dezvolte tehnologie. Este o parte a imaginii de ansamblu – în care Vietnamul promovează agresiv inovația, cu politici care decurg din Rezoluția 57-NQ/TW privind dezvoltarea științei, tehnologiei și transformarea digitală națională. În special, pune accent pe domeniul inteligenței artificiale.
Apariția și dezvoltarea rapidă a programului de masterat în masterat (LLM) vietnamez de la Zalo nu reprezintă doar un progres tehnologic pentru o afacere, ci și o dovadă a capacităților inerente și a perseverenței echipei tehnologice vietnameze.
Cu tehnica sa „de la zero” – antrenarea modelelor de la zero – Zalo a ales o cale pe termen lung, dar una care a ajutat cu adevărat Vietnamul să stăpânească inteligența artificială. Acest lucru se aplică nu numai rezultatelor, ci întregului proces, de la arhitectura modelului, date, algoritmi, până la aplicația finală. Succesul Zalo a făcut, de asemenea, ca Vietnamul să fie una dintre puținele țări din Asia de Sud-Est care dețin un model LLM intern – o piatră de hotar strategică în competiția tehnologică globală din ce în ce mai acerbă.
În lunga călătorie care ne așteaptă, Zalo nu se va opri doar la un model sau la câteva produse, ci va continua să rafineze modelul atât pentru a servi utilizatorii, cât și pentru a crea o platformă vietnameză de inteligență artificială competitivă și de înaltă calitate: „Călătoria Zalo în dezvoltarea inteligenței artificiale este încă lungă. Vom continua să optimizăm modelul atât în amploare, cât și în profunzime, promovând în același timp aplicații practice. Scopul final este de a crea produse de inteligență artificială de înaltă calitate care să servească practic poporul vietnamez”, a adăugat dl. Son.
Dezvoltarea cu succes a unui model de inteligență artificială în limba vietnameză de către Zalo nu este doar un pas inovator pentru o companie, ci deschide și un viitor promițător pentru inteligența artificială în Vietnam. Perseverența și ambiția poporului vietnamez au condus la aceste rezultate binemeritate. Viitorul inteligenței artificiale în Vietnam nu va include doar un „Zalo”, ci și o generație de ingineri curajoși care îi vor călca pe urme, îi vor moșteni moștenirea și vor cuceri lumea tehnologiei.
Sursă: https://znews.vn/zalo-va-hanh-trinh-lam-chu-llm-tieng-viet-post1561765.html






Comentariu (0)