Il 21 agosto VinBigdata ha annunciato lo sviluppo con successo di un modello linguistico di grandi dimensioni per la lingua vietnamita, ponendo le basi per la padronanza della tecnologia generativa basata sull'intelligenza artificiale.
I Large Language Models (LLM) sono modelli addestrati utilizzando tecniche di deep learning su enormi dataset di testo o immagini. Questi modelli sono in grado di comprendere la conoscenza, generare testo in modo indipendente ed eseguire diverse attività di elaborazione del linguaggio naturale. Sono considerati fondamentali per lo sviluppo della tecnologia di intelligenza artificiale generativa, capace di creare nuovi contenuti e idee in varie forme (testo, immagini, audio, ecc.).
Grazie allo sviluppo di un modello linguistico vietnamita su larga scala, VinBigdata integrerà la tecnologia per rendere VinBase (una piattaforma completa di intelligenza artificiale multi-cognitiva) la piattaforma leader in Vietnam per la generazione di IA, offrendo al contempo soluzioni sviluppate su questa tecnologia, come chatbot generativi basati sull'IA, callbot e l'assistente virtuale di nuova generazione ViVi. Questa tecnologia migliora la naturalezza della comunicazione tra macchine e utenti, consentendo loro di cercare e sintetizzare informazioni in modo più rapido e semplice rispetto al passato.
Professor Vu Ha Van - Direttore scientifico di VinBigdata Company. Foto: VinBigdata
Il professor Vu Ha Van, direttore scientifico di VinBigdata, ha affermato che diverse grandi aziende in tutto il mondo hanno condotto ricerche e lanciato con successo prodotti basati su modelli linguistici di grandi dimensioni, come OpenAI con ChatGPT e Google con Bard. In Vietnam, VinBigdata è in fase di sviluppo da parte di Vingroup per la creazione di un modello linguistico di grandi dimensioni specifico per la lingua vietnamita. Secondo il professor Van, questo modello si concentra sulla risoluzione di tre problemi fondamentali: migliorare la precisione, ridurre i costi dell'infrastruttura e garantire la sicurezza.
"Anziché aver bisogno di circa 175 miliardi di parametri come ChatGPT, VinBigdata può creare un modello linguistico su larga scala con pochi miliardi di parametri, pur essendo in grado di generare testi altamente autentici, concentrandosi sui dati e sulle conoscenze vietnamite", ha affermato il responsabile dell'unità.
Padroneggiare la tecnologia, sviluppare da zero e costruire un modello linguistico vietnamita su larga scala sono considerati passaggi cruciali per VinBigdata nell'integrazione della tecnologia di generazione di intelligenza artificiale nel suo ecosistema di prodotti e servizi sul mercato. Attualmente, l'azienda sta inizialmente applicando questa nuova tecnologia alla sua linea di prodotti VinBase KB (VinBase Knowledge Base Portal). Questo prodotto è in grado di recuperare informazioni e generare automaticamente risposte sulla base dei dati raccolti da enormi dataset all'interno della sua knowledge base.
I rappresentanti di VinBigdata hanno condiviso queste informazioni durante l'evento di lancio della nuova generazione di intelligenza artificiale. Foto: VinBigdata
Vingroup prevede di lanciare due linee di prodotti principali questo dicembre: VinBase 2.0 e l'applicazione ViGPT. VinBase 2.0 è una piattaforma di intelligenza artificiale che genera risposte multicognitive con soluzioni per aziende e agenzie governative . L'applicazione ViGPT, presentata dall'azienda come "la versione vietnamita di ChatGPT", sarà invece aperta all'accesso e alla fase di test da parte della community. Con ViGPT, gli utenti potranno porre e rispondere a domande su informazioni specifiche relative al Vietnam (regolamenti, documenti legali) o su informazioni locali (storia, letteratura, luoghi di interesse turistico, specialità locali).
VinBigdata Joint Stock Company possiede un sistema di database di ben 3.500 Terabyte. Il sistema contiene centinaia di migliaia di ore di dati vocali, immagini e informazioni che sono state ripulite, elaborate, classificate e utilizzate per l'addestramento dell'intelligenza artificiale e per l'infrastruttura di ricerca e sviluppo. Questa infrastruttura comprende decine di cluster di server Nvidia DGX A100. L'azienda vanta inoltre un team di professori vietnamiti, scienziati ed esperti di tecnologia provenienti da tutto il mondo.
Hoai Phuong
Link alla fonte








Commento (0)