L'interesse globale per l'intelligenza artificiale è in crescita, con particolare attenzione rivolta ai paesi che vantano modelli di IA all'avanguardia, come Stati Uniti e Cina. Il Sud-est asiatico, una delle regioni economiche più importanti al mondo, si sta gradualmente affermando come un nuovo polo di riferimento per l'IA, con progressi significativi che potrebbero attirare l'attenzione di politici, investitori ed esperti di tecnologia a livello globale.

In Vietnam, il Partito e il Governo sono determinati a plasmare e promuovere l'era dello sviluppo tecnologico del Paese, come dimostrato dalla Risoluzione 57-NQ/TW sulle scoperte scientifiche , tecnologiche, l'innovazione e la trasformazione digitale nazionale. Questo orientamento ha creato un forte impulso per le imprese tecnologiche nazionali a investire e sfruttare il potenziale delle tecnologie globali più avanzate.
Attualmente, il Vietnam è diventato uno dei pochi paesi del Sud-est asiatico a possedere un modello linguistico di grandi dimensioni (LLM) nazionale. Nello specifico, dal 2023, Zalo ha addestrato e lanciato con successo un modello LLM incentrato sulla lingua vietnamita, interamente studiato e sviluppato da un team di ingegneri vietnamiti.
Scegliendo di allenarti da zero, i risultati saranno sorprendenti.
Attualmente, i modelli di intelligenza artificiale utilizzano due tecniche di addestramento: la modellazione fine-tuning, che ottimizza i modelli lineari latenti (LLM) precedentemente addestrati per crearne di nuovi per scopi specifici; e la modellazione da zero, un processo di costruzione di modelli completamente nuovi, dall'inizializzazione dei parametri e dalle decisioni sull'architettura del modello fino all'addestramento degli algoritmi su un dato set di dati.
Tra queste, le tecniche di fine-tuning sono scelte da molte aziende per i loro vantaggi, come la facilità di implementazione, il risparmio di risorse e il potenziale per risultati migliori. Soprattutto nel contesto del Vietnam, dove le attrezzature e i dati per la formazione sono limitati, le tecniche di fine-tuning rappresentano una soluzione ottimale.
Tuttavia, Zalo ha scelto di partire da zero per l'addestramento. Con questo metodo, l'intero processo di addestramento e il modello sono interamente di proprietà e sotto il controllo di vietnamiti. Di conseguenza, il Vietnam è diventato uno dei pochi paesi del Sud-est asiatico a possedere un modello linguistico di grandi dimensioni (LLM) sviluppato internamente.
Al momento del suo lancio nel 2023, il primo modello linguistico su larga scala di Zalo, con 7 miliardi di parametri e incentrato sulla lingua vietnamita, ha raggiunto il 150% delle sue capacità rispetto a GPT3.5 di OpenAI nello standard di valutazione delle competenze LLM VMLU per la lingua vietnamita. Il tempo di addestramento è stato di soli 6 mesi, significativamente inferiore alla stima iniziale di 18 mesi. Questo rapido processo di addestramento ha sorpreso persino il team di sviluppo di Zalo.

Il modello LLM di Zalo si è classificato al 3° posto nella sfida Kahoot al suo lancio iniziale nel 2023 (Foto: Zalo).
Nel 2024, il modello di Zalo, con 13 miliardi di parametri, ha superato i principali nomi globali , conquistando la seconda posizione nella classifica di competenza dei programmi LLM vietnamiti per principianti dell'Università di Maharaja Vikas Luhansk (VMLU).
I risultati dimostrano che il livello di formazione del Vietnam nella modellazione linguistica su larga scala è paragonabile agli standard mondiali per lo sviluppo di un proprio modello di intelligenza artificiale, soprattutto considerando le difficoltà iniziali incontrate nella sua realizzazione.
Gli sforzi del popolo vietnamita per sviluppare modelli di intelligenza artificiale.
Secondo un rappresentante di Zalo, la formazione per il programma LLM richiede tre elementi fondamentali: attrezzature per la formazione, dati e competenze tecniche. In precedenza, il Vietnam si trovava ad affrontare notevoli limitazioni in tutti e tre gli ambiti. In particolare, mentre le grandi aziende globali possedevano migliaia di GPU ad alte prestazioni di ultima generazione di Nvidia, gli ingegneri vietnamiti non disponevano dell'infrastruttura server necessaria. Allo stesso tempo, il Vietnam aveva a disposizione un bacino di dati meno ampio rispetto a quello dei paesi inglesi o cinesi. Inoltre, le risorse umane e l'esperienza del Vietnam nella formazione LLM erano limitate rispetto ai paesi sviluppati.
All'epoca, il team di Zalo dovette condurre ricerche e sperimentazioni su piccole GPU di consumo per acquisire rapidamente le conoscenze e le capacità di addestramento necessarie per LLM, in modo da essere pronti all'uso non appena fosse stata disponibile un'infrastruttura di calcolo su larga scala.
I chip per l'addestramento dell'IA sono rari, quindi, nonostante Zalo abbia ordinato 8 server Nvidia DGX H100, non può riceverli tutti contemporaneamente e deve attendere le consegne del produttore a scaglioni. Pertanto, ottimizzare l'infrastruttura di calcolo incompleta per sfruttare al meglio il tempo di addestramento è un'ulteriore sfida che il team di Zalo deve affrontare.
Parallelamente, si stanno effettuando investimenti nello sviluppo di dati di addestramento di alta qualità per compensare la carenza di fonti di dati in lingua vietnamita.

“Nonostante le notevoli difficoltà incontrate rispetto alle grandi aziende globali, Zalo ha deciso di entrare nel mercato con l'obiettivo di sviluppare con successo un proprio modello di intelligenza artificiale in Vietnam. Ci siamo consultati con ricercatori e ingegneri dei principali istituti di ricerca a livello mondiale per elaborare una strategia adeguata.”
"I traguardi raggiunti finora motivano gli ingegneri di Zalo a continuare a ottimizzare il modello per aumentarne la quantità e migliorarne la qualità. Allo stesso tempo, stiamo sfruttando le sue applicazioni per creare prodotti di intelligenza artificiale di livello mondiale per gli utenti vietnamiti", ha dichiarato il Dott. Nguyen Truong Son, Direttore Scientifico di Zalo AI.

Zalo ha ordinato il server DGX H100 da Nvidia (Foto: Zalo).
Grazie alla sua capacità di adattamento durante le difficili fasi iniziali di sviluppo, Zalo ha gradualmente raggiunto importanti traguardi, arrivando a padroneggiare la tecnologia dell'intelligenza artificiale a livello globale, come fa oggi.
Attualmente, il modello di intelligenza artificiale di Zalo non solo sta riscuotendo successo nella ricerca e nella formazione, ma viene anche applicato, promuovendo l'accesso e lo sfruttamento del valore delle nuove tecnologie avanzate per la popolazione vietnamita.
All'inizio di quest'anno, Zalo ha lanciato Kiki Info, un assistente completo per domande e risposte che opera come Account Ufficiale (OA) sulla piattaforma di messaggistica Zalo. L'assistente offre supporto per domande e risposte su vari argomenti relativi alla vita quotidiana, alla creazione di contenuti e all'intrattenimento. Secondo le statistiche di Zalo, Kiki Info ha registrato 1 milione di utenti che hanno acceduto al suo account OA su Zalo in meno di due mesi.

Il modello LLM di Zalo è stato applicato per sviluppare l'assistente informativo Kiki (Foto: Zalo).
Un'altra applicazione del modello LLM di Zalo sono le cartoline di auguri create con l'intelligenza artificiale, che hanno raggiunto i 15 milioni di biglietti creati e inviati in soli due mesi. Questa applicazione ha riscosso un notevole successo tra gli utenti di Zalo per l'invio di auguri a familiari e amici in occasioni importanti.
Attualmente, Zalo continua ad espandersi e a sviluppare applicazioni basate sul suo ampio modello linguistico, promettendo di apportare numerosi vantaggi agli utenti nazionali.
Fonte: https://dantri.com.vn/cong-nghe/zalo-phat-develop-ai-do-nguoi-viet-lam-chu-20250616161352610.htm








Commento (0)