Interface van v7, AI-geïntegreerd toetsenbord. Foto: NVCC . |
In een gesprek met Tri Thuc - Znews sprak Tri Duc (geboren in 2003) over het idee om kunstmatige intelligentie in te zetten om de manier waarop Vietnamees wordt ingevoerd te veranderen. De v7-typetool, zijn studentenproject, is inmiddels uitgegroeid tot een onderzoekspaper en geaccepteerd op IJCAI 2025, een prestigieuze conferentie over kunstmatige intelligentie (AI).
Hoewel Telex of VNI-typen al tientallen jaren populair zijn, kent het nog steeds veel beperkingen in de gebruikerservaring. Daarom is v7 ontwikkeld als een lichtgewicht voorspellingstool die de tijd om Vietnamees te typen verkort dankzij AI-integratie.
Passie voor talen en technologie
Zijn liefde voor talen en technologie leidde ertoe dat hij Toegepaste Kunstmatige Intelligentie ging studeren aan de Technische Universiteit van Ho Chi Minhstad.
Tijdens zijn studie pakte hij projecten aan zoals een groot taalmodel (LLM) voor het Vietnamees, software voor het vertalen van talen van etnische minderheden en een chatbot ter ondersteuning van de toelatingsprocedure. "Die ervaringen hebben me geholpen een solide basis aan kennis op te bouwen, mijn passie te voeden en mijn verlangen te ontwikkelen om AI toe te passen om nuttige producten voor de gemeenschap te creëren", vertelde hij.
Tri Duc wil waarde creëren door AI in de praktijk toe te passen. Foto: NVCC. |
Met zijn achtergrond in het Mandarijn en Kantonees realiseerde Duc zich bovendien de correlatie tussen pinyin/jyutping en de Vietnamese spelling. Deze factor laat ook zien dat, in tegenstelling tot de complexiteit van hiërogliefen, het Chinese pinyin-typesysteem slechts "yn" hoeft in te voeren om de naam van ons land in Han-karakters te krijgen. Terwijl Telex of VNI 10 toetsen nodig heeft om het woord "Vietnam" te krijgen.
Door zijn observaties realiseerde Duc zich dat gebruikers bij snelle communicatie vaak afkorten door de eerste medeklinker te behouden, zoals "hs" voor "student". "Als mensen deze schrijfstijl gemakkelijk kunnen begrijpen, kan AI die volledig begrijpen als ze getraind is met de juiste data", zei hij over de omstandigheden die tot het idee leidden.
In plaats van het volledige teken te moeten schrijven en vervolgens accenten toe te voegen zoals bij traditionele typetools zoals Telex of VNI, die het complementaire mechanisme gebruiken, gebruikt v7 AI om het woord dat je wilt schrijven te suggereren. De technologie voorspelt het volledige woord nauwkeurig met zo min mogelijk toetsen.
In de Vietnamese spellingsstructuur bestaat een woord uit een beginmedeklinker, rijm en toon. Zo bestaat het woord "Nguyen" uit "ng", "uyen" en een dalende toon. Op basis van dit principe is de v7-typemachine gebouwd om volledige woorden te voorspellen met alleen een beginmedeklinker en toon, wat helpt om het aantal toetsaanslagen aanzienlijk te verminderen met behoud van nauwkeurigheid.
De uitdaging van het lesgeven van Vietnamees aan AI
Volgens Duc was de grootste uitdaging het leren van AI om Vietnamees te 'begrijpen' voor deze typetool. Hij probeerde verschillende modellen uit voordat hij GPT-2 als basis koos, met Transformers-architectuur voor een goed contextbegrip en nauwkeurige woordvoorspelling.
Nadat Duc de onderliggende architectuur had gekozen, verving hij de Tokenizer (woordenschat-encoder) volledig door een door hemzelf samengesteld Vietnamees vocabulaire. De ingenieur filterde alle geldige, correct gespelde Vietnamese woorden eruit om een volledige verwerking te garanderen en elk woord te voorspellen dat de gebruiker wil schrijven.
Een andere uitdaging ligt in het vinden van de juiste balans tussen voorspellende prestaties en reactiesnelheid. Het model moet in realtime kunnen draaien op zowel computers als telefoons, maar toch krachtig genoeg zijn om de beste voorspellingen te doen. Na twee maanden continu testen haalt de huidige versie bijna 70% van de woorden die gebruikers typen correct naar voren, met een latentie van slechts 0,03 seconde.
Wat betreft de invoermethode van het toetsenbord, volgens vele studies die Duc raadpleegde van taalkundigen Cao Xuan Hao en Henri Maspero, heeft het Vietnamees niet alleen 6, maar 8 tonen. Om optimaal gebruik te maken van deze functie, gebruikt de v7 een systeem met 8 tonen in plaats van de gebruikelijke 6 (inclusief een moltoon en 5 accenttonen: scherp, mol, vraagtoon, dalend en zwaar). Op dit toetsenbord zal het model bij het typen van "v7" het woord "Viet" suggereren. Dit is ook de bedoeling van de productnaam.
Nadat hij v7 op zijn sociale netwerk had gedeeld, zei Duc dat hij erg blij en verrast was toen het model aandacht, steun en de wens om het te ervaren kreeg. "Dat gaf me een duidelijk gevoel over de behoefte aan een slimmere en snellere Vietnamese typetool", zei hij.
De groep auteurs van het wetenschappelijke onderzoeksartikel. Van links naar rechts: Nhat Khang, Hieu Nghia en Tri Duc. Foto: NVCC. |
Momenteel bevindt het toetsenbord zich nog in de prototypefase, met open source code op GitHub voor programmeurs en technologiegebruikers om te testen en bij te dragen. Er wordt ook gewerkt aan een complete applicatieversie voor Windows en macOS, die door gewone gebruikers eenvoudig te installeren en te gebruiken is.
In de toekomst ligt de hoogste prioriteit voor versie 7 bij de toetsenbordversie op de iPhone, om de manier waarop Vietnamese tekst op smartphones wordt ingevoerd te verbeteren. Daarnaast zal de nauwkeurigheid van het model worden verbeterd door meer te trainen op dagelijkse conversatiegegevens, waardoor de AI veelvoorkomende contexten beter kan begrijpen.
Ducs reis heeft bijgedragen aan een flinke dosis creativiteit en heeft de technologische trends bijgehouden in de context van Vietnams forse investeringen in AI-infrastructuur. Een moment waar hij trots op is, is toen v7 voor het eerst een complete zin creëerde. "Dat was de tijd dat een klein model, waarschijnlijk slechts 1/10.000 van de grootte van ChatGPT vandaag de dag, nog kon denken als een mens," aldus Duc.
Bron: https://znews.vn/ky-su-tre-dung-ai-thay-doi-cach-go-tieng-viet-post1552246.html
Reactie (0)