
|
Interfaccia della tastiera v7 con intelligenza artificiale integrata. Foto: fornita dall'autore . |
In un'intervista a Tri Thức - Znews , Tri Duc (nato nel 2003) ha condiviso la sua idea di applicare l'intelligenza artificiale per cambiare il modo in cui viene digitata la lingua vietnamita. Il suo progetto di tastiera v7 si è ora trasformato in un articolo di ricerca ed è stato accettato all'IJCAI 2025, una prestigiosa conferenza sull'intelligenza artificiale.
Nonostante sia popolare da decenni, il metodo di input Telex o VNI presenta ancora molte limitazioni in termini di esperienza utente. Per questo motivo, è stata creata la versione 7, uno strumento di previsione leggero che aiuta a ridurre i tempi di digitazione in vietnamita grazie all'intelligenza artificiale integrata.
Passione per le lingue e la tecnologia.
La sua passione per le lingue e la tecnologia ha portato Duc a specializzarsi in Intelligenza Artificiale Applicata presso l'Università di Tecnologia di Ho Chi Minh City.
Durante i suoi studi, ha lavorato a progetti come la modellazione linguistica su larga scala (LLM) per il vietnamita, software per la traduzione di lingue di minoranze etniche e chatbot a supporto del reclutamento degli studenti. "Queste esperienze mi hanno aiutato a costruire una solida base di conoscenze, a coltivare la mia passione e ad alimentare il mio desiderio di applicare l'intelligenza artificiale per creare prodotti che siano utili alla comunità", ha affermato.

|
Tri Duc mira a dare valore alla vita applicando l'intelligenza artificiale. Foto: fornita dall'intervistato. |
Inoltre, grazie alla sua conoscenza del mandarino e del cantonese, Duc ha riconosciuto la correlazione tra pinyin/jyutping e l'ortografia vietnamita. Ciò dimostra anche che, contrariamente alla complessità dei caratteri ideografici, il metodo di immissione pinyin cinese richiede solo l'inserimento di "yn" per produrre il nome del nostro paese in caratteri cinesi. Al contrario, Telex o VNI richiedono 10 tasti per produrre "Vietnam".
Grazie alle sue osservazioni, Duc si rese conto che nelle conversazioni veloci gli utenti spesso abbreviano le parole mantenendo la consonante iniziale, come ad esempio "hs" per "student". "Se gli esseri umani riescono a comprendere facilmente questo stile di scrittura, l'intelligenza artificiale può assolutamente comprenderlo se addestrata con i dati corretti", ha spiegato a proposito delle circostanze che lo hanno portato a questa idea.
Invece di digitare tutti i caratteri e poi aggiungere i segni diacritici, come avviene con i metodi di input tradizionali come Telex o VNI, che si basano su un meccanismo complementare, v7 utilizza l'intelligenza artificiale per suggerire le parole che si desidera scrivere. La tecnologia è in grado di prevedere con precisione la parola completa con il minor numero di tasti possibile.
Nell'ortografia vietnamita, una parola è composta da una consonante iniziale, una vocale e un tono. Ad esempio, la parola "Nguyễn" è composta da "ng", "uyên" e un tono discendente. Basandosi su questo principio, è stato sviluppato il metodo di input v7 per predire la parola completa utilizzando solo la consonante iniziale e il tono, riducendo significativamente il numero di tasti premuti pur mantenendo la precisione.
La sfida di insegnare il vietnamita all'intelligenza artificiale.
Secondo Duc, la sfida più grande è stata insegnare all'IA a "capire" il vietnamita per poter utilizzare questo metodo di input. Ha provato molti modelli prima di scegliere GPT-2 come base, poiché la sua architettura Transformer offre una buona comprensione contestuale e una previsione accurata delle parole.
Dopo aver selezionato l'architettura di base, Duc ha completamente sostituito il Tokenizer (codificatore di vocabolario) con un proprio set di vocaboli vietnamiti. L'ingegnere ha filtrato e incluso tutte le parole vietnamite valide e correttamente scritte per garantire capacità di elaborazione complete e la possibilità di prevedere qualsiasi parola l'utente intendesse scrivere.
Un'altra sfida consiste nel bilanciare le prestazioni predittive e la velocità di risposta, garantendo che il modello possa funzionare in tempo reale sia su computer che su telefoni, pur rimanendo sufficientemente potente da fornire le migliori previsioni possibili. Dopo due mesi di test continui, la versione attuale posiziona correttamente in cima quasi il 70% delle parole inserite dagli utenti, con un ritardo di soli 0,03 secondi.
Per quanto riguarda il metodo di input della tastiera, secondo diversi studi consultati da Duc, condotti dai linguisti Cao Xuan Hao e Henri Maspero, la lingua vietnamita non ha solo 6 toni, ma fino a 8. Per sfruttare questa caratteristica, v7 utilizza un sistema a 8 toni anziché i soliti 6 (inclusi un tono di base e 5 toni con accenti: acuto, grave, interrogativo, tilde e punto sotto). In questa tastiera, quando si digita "v7", il modello suggerirà la parola "Viet". Questa è anche l'idea alla base del nome del prodotto.
Dopo aver condiviso la versione 7 sui suoi social media, Duc ha affermato di essere molto felice e sorpreso che il modello abbia ricevuto così tanta attenzione, supporto e il desiderio di provarlo. "Questo mi ha fatto capire chiaramente la necessità di un metodo di input vietnamita più intelligente e veloce", ha detto.

|
Gli autori dell'articolo scientifico . Da sinistra a destra: Nhat Khang, Hieu Nghia e Tri Duc. Foto: fornita dall'autore. |
Attualmente, il metodo di input è ancora in fase di prototipo, con il codice sorgente open-source disponibile su GitHub per consentire a programmatori e utenti esperti di testarlo e contribuire. È inoltre in fase di sviluppo una versione completa dell'applicazione per Windows e macOS, pensata per un utilizzo semplice e immediato.
In futuro, la priorità assoluta per la versione 7 sarà la tastiera per iPhone, con l'obiettivo di migliorare l'inserimento del testo vietnamita sugli smartphone. Inoltre, la precisione del modello verrà migliorata addestrandolo ulteriormente con dati di conversazione quotidiani, aiutando l'IA a comprendere meglio i contesti comuni.
Il percorso di Duc ha contribuito a iniettare un'ondata di innovazione, tenendo il passo con le tendenze tecnologiche nel contesto dei forti investimenti del Vietnam nelle infrastrutture di intelligenza artificiale. Un momento che lo rende orgoglioso è quando v7 ha creato per la prima volta una frase completa. "È stato allora che un piccolo modello, probabilmente solo 1/10000 delle dimensioni di ChatGPT oggi, era ancora in grado di pensare come un essere umano", ha affermato Duc.
Fonte: https://znews.vn/ky-su-tre-dung-ai-thay-doi-cach-go-tieng-viet-post1552246.html
Commento (0)