Interfața v7, tastatură integrată cu inteligență artificială. Fotografie: NVCC . |
Într-un interviu acordat lui Tri Thuc - Znews , Tri Duc (născut în 2003) a vorbit despre ideea aplicării inteligenței artificiale pentru a schimba modul în care este introdusă limba vietnameză. Instrumentul de tastare v7, proiectul său studențesc, a devenit acum o lucrare de cercetare și a fost acceptat la IJCAI 2025, o conferință prestigioasă despre inteligența artificială.
Deși este populară de zeci de ani, tastarea Telex sau VNI are încă multe limitări în experiența utilizatorului. Prin urmare, v7 s-a născut pentru a deveni un instrument de predicție ușor, ajutând la scurtarea timpului de tastare a limbii vietnameze datorită integrării inteligenței artificiale.
Pasiune pentru limbi străine și tehnologie
Dragostea sa pentru limbi străine și tehnologie l-a determinat să se specializeze în Inteligență Artificială Aplicată la Universitatea de Tehnologie din Ho Chi Minh City.
În timpul studiilor, a abordat proiecte precum un model lingvistic extins (LLM) pentru limba vietnameză, un software pentru traducerea limbilor minorităților etnice sau un chatbot pentru sprijinirea admiterilor. „Aceste experiențe m-au ajutat să acumulez o bază solidă de cunoștințe, să-mi hrănesc pasiunea și dorința de a aplica inteligența artificială pentru a crea produse utile pentru comunitate”, a împărtășit el.
Tri Duc dorește să aducă valoare prin aplicarea inteligenței artificiale în viață. Foto: NVCC. |
În plus, având o experiență în mandarină și cantoneză, Duc a recunoscut corelația dintre pinyin/jyutping și ortografia vietnameză. Acest factor ne arată, de asemenea, că, spre deosebire de complexitatea hieroglifelor, sistemul de tastare pinyin chinezesc necesită doar tastarea „yn” pentru a obține numele țării noastre cu caractere chinezești. În timp ce Telex sau VNI necesită 10 taste pentru a obține cuvântul „Vietnam”.
Prin observațiile sale, Duc și-a dat seama că atunci când comunică rapid, utilizatorii abreviază adesea păstrând prima consoană, cum ar fi „hs” pentru „student”. „Dacă oamenii pot înțelege cu ușurință acest stil de scriere, inteligența artificială îl poate înțelege complet dacă este antrenată cu datele corecte”, a spus el despre circumstanțele care au dat naștere ideii.
În loc să fie nevoie să scrieți caracterul complet și apoi să adăugați accente atunci când utilizați instrumente tradiționale de tastare precum Telex sau VNI, care urmează mecanismul de adunare, v7 folosește inteligența artificială pentru a sugera cuvântul pe care doriți să îl scrieți. Tehnologia va prezice cu exactitate cuvântul complet cu cele mai puține taste posibile.
În structura ortografică vietnameză, un cuvânt este alcătuit dintr-o consoană inițială, o rimă și un ton. De exemplu, cuvântul „Nguyen” este compus din „ng”, „uyen” și un ton descrescător. Pe baza acestui principiu, motorul de tastare v7 este construit pentru a prezice cuvinte complete doar cu consoană inițială și ton, ceea ce ajută la reducerea semnificativă a numărului de apăsări de taste, menținând în același timp precizia.
Provocarea de a preda limba vietnameză unei persoane cu inteligență artificială
Potrivit lui Duc, cea mai mare provocare este să-i înveți pe inteligența artificială să „înțeleagă” limba vietnameză pentru a servi acestui instrument de tastare. El a încercat multe modele înainte de a alege GPT-2 ca bază, cu arhitectura Transformers pentru o bună înțelegere a contextului și o predicție precisă a cuvintelor.
După ce a ales arhitectura de bază, Duc a înlocuit complet Tokenizer-ul (codificatorul de vocabular) cu un vocabular vietnamez construit de el însuși. Inginerul a filtrat toate cuvintele vietnameze valide, ortografiate corect, pentru a asigura o procesare completă, anticipând orice cuvânt pe care utilizatorul dorea să-l scrie.
O altă provocare constă în echilibrarea performanței predictive și a vitezei de răspuns, asigurându-se că modelul poate rula în timp real atât pe computere, cât și pe telefoane, dar fiind totuși suficient de puternic pentru a face cele mai bune predicții. După 2 luni de testare continuă, versiunea actuală aduce corect aproape 70% din cuvintele tastate de utilizatori în partea de sus, cu o latență de doar 0,03 secunde.
În ceea ce privește metoda de introducere a textului pe tastatură, conform numeroaselor studii consultate de Duc, realizate de lingviștii Cao Xuan Hao sau Henri Maspero, limba vietnameză are nu doar 6, ci 8 tonuri. Pentru a profita de această caracteristică, v7 folosește un sistem de 8 tonuri în loc de cele 6 obișnuite (inclusiv un ton bemol și 5 tonuri accentuate: diez, bemol, întrebare, descendent, greu). La această tastatură, atunci când se tastează „v7”, modelul va sugera cuvântul „Viet”. Aceasta este și ideea pentru numele produsului.
După ce a distribuit versiunea 7 pe rețeaua sa de socializare, Duc a spus că a fost foarte fericit și surprins când modelul a primit atenție, sprijin și dorința de a-l experimenta. „Acest lucru mi-a dat o idee clară despre nevoia unui instrument de tastare vietnameză mai inteligent și mai rapid”, a spus el.
Grupul de autori ai articolului de cercetare științifică . De la stânga la dreapta: Nhat Khang, Hieu Nghia și Tri Duc. Fotografie: NVCC. |
În prezent, tastatura este încă în stadiul de prototip, cu cod open source pe GitHub pentru ca programatorii sau utilizatorii de tehnologie să o poată testa și contribui. De asemenea, este în curs de dezvoltare o versiune completă a aplicației pentru Windows și macOS, astfel încât utilizatorii obișnuiți să o poată instala și utiliza cu ușurință.
În viitor, prioritatea principală pentru v7 va fi versiunea de tastatură pentru iPhone, pentru a îmbunătăți modul în care textul vietnamez este introdus pe smartphone-uri. În plus, modelul va fi îmbunătățit în ceea ce privește precizia prin antrenament mai intens pe baza datelor conversațiilor zilnice, ajutând inteligența artificială să înțeleagă mai bine contextele comune.
Călătoria lui Duc a contribuit la o avalanșă de creativitate, fiind la curent cu tendințele tehnologice în contextul în care Vietnamul a investit masiv în infrastructura inteligenței artificiale. Un moment care îl face mândru este momentul în care v7 a creat pentru prima dată o propoziție completă. „Atunci un model mic, probabil de doar 1/10.000 din dimensiunea ChatGPT de astăzi, încă putea gândi ca un om”, a spus Duc.
Sursă: https://znews.vn/ky-su-tre-dung-ai-thay-doi-cach-go-tieng-viet-post1552246.html
Comentariu (0)