Vietnam.vn - Nền tảng quảng bá Việt Nam

Jonge ingenieur gebruikt AI om de manier waarop Vietnamees wordt getypt te veranderen

De met AI geïntegreerde Vietnamese typesoftware is een van de producten die creativiteit succesvol combineert met professionele kennis, met als doel praktische waarde voor de gemeenschap te creëren.

ZNewsZNews14/05/2025


Interface van v7, AI-geïntegreerd toetsenbord. Foto: NVCC .

In een gesprek met Tri Thuc - Znews sprak Tri Duc (geboren in 2003) over het idee om kunstmatige intelligentie in te zetten om de manier waarop Vietnamees wordt ingevoerd te veranderen. De v7-typetool, zijn studentenproject, is inmiddels uitgegroeid tot een onderzoekspaper en geaccepteerd op IJCAI 2025, een prestigieuze conferentie over kunstmatige intelligentie (AI).

Ondanks de populariteit van Telex of VNI-typen al tientallen jaren, kent het nog steeds veel beperkingen in de gebruikerservaring. Daarom is v7 ontwikkeld als een lichtgewicht voorspellingstool die de tijd die nodig is om Vietnamees te typen verkort dankzij AI-integratie.

Passie voor talen en technologie

Zijn liefde voor talen en technologie leidde ertoe dat hij Toegepaste Kunstmatige Intelligentie ging studeren aan de Technische Universiteit van Ho Chi Minhstad.

Tijdens zijn studie pakte hij projecten aan zoals een groot taalmodel (LLM) voor het Vietnamees, software om talen van etnische minderheden te vertalen en een chatbot ter ondersteuning van de toelatingsprocedure. "Die ervaringen hebben me geholpen een solide basis aan kennis op te bouwen, mijn passie te voeden en mijn verlangen te ontwikkelen om AI toe te passen om nuttige producten voor de gemeenschap te creëren", vertelde hij.

AI geïntegreerde houtfoto 1

Tri Duc wil waarde creëren door AI in de praktijk toe te passen. Foto: NVCC.

Bovendien herkende Duc, met zijn achtergrond in het Mandarijn en Kantonees, de correlatie tussen pinyin/jyutping en de Vietnamese spelling. Deze factor laat ook zien dat, in tegenstelling tot de complexiteit van hiërogliefen, het Chinese pinyin-typesysteem slechts "yn" nodig heeft om de naam van ons land in Chinese karakters te krijgen. Terwijl Telex of VNI 10 toetsen nodig heeft om het woord "Vietnam" te krijgen.

Door zijn observaties realiseerde Duc zich dat gebruikers bij snelle communicatie vaak afkorten door de eerste medeklinker te behouden, zoals "hs" voor "student". "Als mensen deze schrijfstijl gemakkelijk kunnen begrijpen, kan AI die volledig begrijpen als ze getraind is met de juiste data", zei hij over de omstandigheden die tot het idee leidden.

In plaats van het volledige teken te moeten typen en vervolgens accenten toe te voegen zoals bij traditionele typetools zoals Telex of VNI, die het optelmechanisme gebruiken, gebruikt v7 AI om het woord dat je wilt schrijven te suggereren. De technologie voorspelt het volledige woord nauwkeurig met zo min mogelijk toetsen.

In de Vietnamese spellingsstructuur bestaat een woord uit een beginmedeklinker, rijm en toon. Zo bestaat het woord "Nguyen" uit "ng", "uyen" en een dalende toon. Op basis van dit principe is de v7-typemachine gebouwd om volledige woorden te voorspellen met alleen een beginmedeklinker en toon, wat helpt om het aantal toetsaanslagen aanzienlijk te verminderen met behoud van nauwkeurigheid.

De uitdaging van het lesgeven van Vietnamees aan AI

Volgens Duc is de grootste uitdaging het leren van AI om Vietnamees te 'begrijpen' voor deze typetool. Hij probeerde verschillende modellen voordat hij GPT-2 als basis koos, met Transformers-architectuur voor een goed contextbegrip en nauwkeurige woordvoorspelling.

Nadat hij de onderliggende architectuur had gekozen, verving Duc de Tokenizer (woordenschat-encoder) volledig door een door hemzelf samengesteld Vietnamees vocabulaire. De ingenieur filterde alle geldige, correct gespelde Vietnamese woorden eruit om een ​​volledige verwerking te garanderen en elk woord dat de gebruiker wilde schrijven te voorspellen.

Een andere uitdaging ligt in het vinden van de juiste balans tussen voorspellende prestaties en reactiesnelheid. Zorg ervoor dat het model realtime kan draaien op zowel computers als telefoons, maar toch krachtig genoeg is om de beste voorspellingen te doen. Na twee maanden continu testen haalt de huidige versie bijna 70% van de woorden die gebruikers typen correct naar voren, met een latentie van slechts 0,03 seconde.

Wat betreft de invoermethode van het toetsenbord, volgens vele studies die Duc raadpleegde van taalkundigen Cao Xuan Hao en Henri Maspero, heeft het Vietnamees niet alleen 6, maar 8 tonen. Om optimaal gebruik te maken van deze functie, gebruikt de v7 een systeem van 8 tonen in plaats van de gebruikelijke 6 (inclusief een moltoon en 5 accenttonen: scherp, mol, vraagtoon, dalend en zwaar). Op dit toetsenbord zal het model bij het typen van "v7" het woord "Viet" suggereren. Dit is ook de bedoeling van de productnaam.

Nadat hij v7 op zijn sociale netwerk had gedeeld, zei Duc dat hij erg blij en verrast was toen het model aandacht, steun en de wens om het te ervaren kreeg. "Dat gaf me een duidelijk gevoel over de behoefte aan een slimmere en snellere Vietnamese typetool", zei hij.

AI foto 2 geïntegreerd houten bord

De groep auteurs van het wetenschappelijke onderzoeksartikel. Van links naar rechts: Nhat Khang, Hieu Nghia en Tri Duc. Foto: NVCC.

Momenteel bevindt het toetsenbord zich nog in de prototypefase, met open source code op GitHub voor programmeurs en technologiegebruikers om te testen en bij te dragen. Er wordt ook gewerkt aan een complete applicatieversie voor Windows en macOS, die door gewone gebruikers eenvoudig te installeren en te gebruiken is.

In de toekomst ligt de hoogste prioriteit voor versie 7 bij de toetsenbordversie op de iPhone, om de manier waarop Vietnamese tekst op smartphones wordt ingevoerd te verbeteren. Bovendien zal de nauwkeurigheid van het model worden verbeterd door meer te trainen op dagelijkse conversatiegegevens, waardoor AI veelvoorkomende contexten beter kan begrijpen.

Ducs reis heeft bijgedragen aan een flinke dosis creativiteit en heeft de technologische trends bijgehouden in de context van Vietnams forse investeringen in AI-infrastructuur. Een moment waar hij trots op is, is toen v7 voor het eerst een complete zin creëerde. "Dat was de tijd dat een klein model, waarschijnlijk slechts 1/10.000 van de grootte van ChatGPT vandaag de dag, nog kon denken als een mens," aldus Duc.

Bron: https://znews.vn/ky-su-tre-dung-ai-thay-doi-cach-go-tieng-viet-post1552246.html


Reactie (0)

No data
No data

In hetzelfde onderwerp

In dezelfde categorie

G-Dragon explodeerde met het publiek tijdens zijn optreden in Vietnam
Vrouwelijke fan draagt ​​trouwjurk naar G-Dragon-concert in Hung Yen
Gefascineerd door de schoonheid van het dorp Lo Lo Chai in het boekweitbloemseizoen
De jonge rijst van Me Tri staat in brand en bruist van het ritme van de stamper voor de nieuwe oogst.

Van dezelfde auteur

Erfenis

Figuur

Bedrijf

De jonge rijst van Me Tri staat in brand en bruist van het ritme van de stamper voor de nieuwe oogst.

Actuele gebeurtenissen

Politiek systeem

Lokaal

Product