Vietnam.vn - Nền tảng quảng bá Việt Nam

Un tânăr inginer folosește inteligența artificială pentru a schimba modul în care se scrie în vietnameză.

Tastatura vietnameză integrată cu inteligență artificială este unul dintre produsele care combină cu succes creativitatea cu expertiza, având ca scop aducerea unei valori practice comunității.

ZNewsZNews14/05/2025


Interfață v7, tastatură integrată cu inteligență artificială. Fotografie: Furnizată de autor .

Într-un interviu acordat publicației Tri Thức - Znews , Tri Duc (născut în 2003) și-a împărtășit ideea de a aplica inteligența artificială pentru a schimba modul în care este introdusă limba vietnameză. Proiectul său de tastatură v7 a devenit acum o lucrare de cercetare și a fost acceptat la IJCAI 2025, o prestigioasă conferință de inteligență artificială.

Deși este populară de zeci de ani, metoda de introducere Telex sau VNI are încă multe limitări în ceea ce privește experiența utilizatorului. Prin urmare, v7 a fost creată pentru a fi un instrument de text predictiv ușor, care ajută la scurtarea timpului de tastare a limbii vietnameze datorită inteligenței artificiale integrate.

Pasiune pentru limbi străine și tehnologie.

Pasiunea sa pentru limbi străine și tehnologie l-a determinat pe Duc să se specializeze în Inteligență Artificială Aplicată la Universitatea de Tehnologie din Ho Chi Minh City.

În timpul studiilor, a lucrat la proiecte precum modelarea lingvistică la scară largă (LLM) pentru limba vietnameză, software pentru traducerea limbilor minorităților etnice și chatbot-uri pentru a sprijini recrutarea studenților. „Aceste experiențe m-au ajutat să construiesc o bază solidă de cunoștințe, să-mi hrănesc pasiunea și să-mi alimentez dorința de a aplica inteligența artificială pentru a crea produse care să beneficieze comunitatea”, a împărtășit el.

Imaginea 1 a plăcii de lemn integrate cu inteligență artificială

Tri Duc își propune să aducă valoare vieții prin aplicarea inteligenței artificiale. Fotografie: Furnizată de persoana intervievată.

În plus, având cunoștințe de mandarină și cantoneză, Duc a recunoscut corelația dintre pinyin/jyutping și ortografia vietnameză. Acest lucru arată, de asemenea, că, spre deosebire de complexitatea caracterelor ideografice, metoda de introducere a caracterelor pinyin chinezești necesită doar introducerea tastei „yn” pentru a produce numele țării noastre în caractere chinezești. În schimb, Telex sau VNI necesită 10 taste pentru a produce „Vietnam”.

Prin observațiile sale, Duc și-a dat seama că, în conversațiile rapide, utilizatorii prescurtează adesea reținând consoana inițială, cum ar fi „hs” pentru „student”. „Dacă oamenii pot înțelege cu ușurință acest stil de scriere, inteligența artificială îl poate înțelege absolut dacă este antrenată cu datele corecte”, a explicat el despre circumstanțele care au condus la ideea sa.

În loc să tasteze toate caracterele și apoi să adauge diacritice, așa cum se întâmplă în cazul metodelor tradiționale de introducere, precum Telex sau VNI, care se bazează pe un mecanism complementar, v7 folosește inteligența artificială pentru a sugera cuvintele pe care doriți să le scrieți. Tehnologia va prezice cu exactitate cuvântul complet cu cele mai puține taste posibile.

În ortografia vietnameză, un cuvânt este alcătuit dintr-o consoană inițială, o vocală și un ton. De exemplu, cuvântul „Nguyễn” este compus din „ng”, „uyên” și un ton descrescător. Pe baza acestui principiu, a fost dezvoltată metoda de introducere v7 pentru a prezice cuvântul complet folosind doar consoana inițială și tonul, reducând semnificativ numărul de apăsări de taste, menținând în același timp precizia.

Provocarea de a preda limba vietnameză unei inteligențe artificiale.

Potrivit lui Duc, cea mai mare provocare a fost învățarea inteligenței artificiale să „înțeleagă” limba vietnameză pentru a putea utiliza această metodă de introducere a textului. El a încercat multe modele înainte de a alege GPT-2 ca bază, arhitectura sa Transformers oferind o bună înțelegere contextuală și o predicție precisă a cuvintelor.

După selectarea arhitecturii subiacente, Duc a înlocuit complet Tokenizer-ul (codificatorul de vocabular) cu un set propriu de vocabular vietnamez. Inginerul a filtrat și a inclus toate cuvintele vietnameze valide, ortografiate corect, pentru a asigura capacități complete de procesare și posibilitatea de a prezice orice cuvânt pe care utilizatorul intenționa să îl scrie.

O altă provocare constă în echilibrarea performanței predictive și a vitezei de răspuns, asigurându-se că modelul poate rula în timp real atât pe computere, cât și pe telefoane, rămânând în același timp suficient de puternic pentru a oferi cele mai bune predicții posibile. După două luni de testare continuă, versiunea actuală plasează corect aproape 70% din cuvintele introduse de utilizatori în partea de sus, cu o întârziere de doar 0,03 secunde.

În ceea ce privește metoda de introducere a textului pe tastatură, conform mai multor studii consultate de Duc, realizate de lingviștii Cao Xuan Hao și Henri Maspero, limba vietnameză nu are doar 6, ci până la 8 tonuri. Pentru a profita de această caracteristică, v7 folosește un sistem de 8 tonuri în loc de cele 6 obișnuite (inclusiv un ton nivelat și 5 tonuri cu accente: acut, grav, întrebare, tildă și punct mai jos). La această tastatură, când introduceți „v7”, modelul va sugera cuvântul „Viet”. Aceasta este și ideea din spatele numelui produsului.

După ce a distribuit versiunea 7 pe rețelele sale de socializare, Duc a spus că este foarte fericit și surprins că modelul a primit atât de multă atenție, sprijin și dorința de a-l testa. „Acest lucru mi-a dat o idee clară despre nevoia unei metode de introducere a textului în vietnameză mai inteligente și mai rapide”, a spus el.

Placă de lemn integrată cu inteligență artificială (imaginea 2)

Autorii lucrării de cercetare științifică . De la stânga la dreapta: Nhat Khang, Hieu Nghia și Tri Duc. Fotografie: Furnizată de autor.

În prezent, metoda de introducere a datelor este încă în stadiul de prototip, cu cod open-source pe GitHub pentru ca programatorii și utilizatorii de tehnologie să îl poată testa și contribui. De asemenea, este în curs de dezvoltare o versiune completă a aplicației pentru Windows și macOS pentru utilizatorii generali, ceea ce o face ușor de instalat și utilizat.

În viitor, prioritatea principală pentru v7 este versiunea de tastatură pentru iPhone, cu scopul de a îmbunătăți modul în care textul vietnamez este introdus pe smartphone-uri. În plus, precizia modelului va fi îmbunătățită prin antrenamentul suplimentar al acestuia pe baza datelor conversaționale de zi cu zi, ajutând inteligența artificială să înțeleagă mai bine contextele comune.

Călătoria lui Duc a contribuit la injectarea unui val de inovație, ținând pasul cu tendințele tehnologice în contextul investițiilor puternice ale Vietnamului în infrastructura de inteligență artificială. Un moment care îl face mândru este acela în care v7 a creat pentru prima dată o propoziție completă. „Atunci un model mic, probabil doar de 1/10000 din dimensiunea ChatGPT de astăzi, putea încă să gândească ca un om”, a spus Duc.

Sursă: https://znews.vn/ky-su-tre-dung-ai-thay-doi-cach-go-tieng-viet-post1552246.html


Comentariu (0)

Lăsați un comentariu pentru a vă împărtăși sentimentele!

Pe aceeași temă

În aceeași categorie

De același autor

Patrimoniu

Figura

Afaceri

Actualități

Sistem politic

Local

Produs

Happy Vietnam
Familial

Familial

Vietnamul în inima mea

Vietnamul în inima mea

Lumina lunii

Lumina lunii