Gränssnitt för v7, AI-integrerat tangentbord. Foto: NVCC . |
I ett samtal med Tri Thuc - Znews pratade Tri Duc (född 2003) om idén att använda artificiell intelligens för att förändra hur vietnamesiska skrivs in. Skrivverktyget v7, hans studentprojekt, har nu utvecklats till en forskningsartikel och blivit antagen till IJCAI 2025, en prestigefylld konferens om AI.
Trots att det varit populärt i årtionden har Telex- eller VNI-skrivning fortfarande många begränsningar i användarupplevelsen. Därför föddes v7 för att bli ett lättviktigt prediktionsverktyg som hjälper till att förkorta tiden det tar att skriva vietnamesiska tack vare AI-integration.
Passion för språk och teknologi
Hans kärlek till språk och teknologi ledde honom till en examen i tillämpad artificiell intelligens vid Ho Chi Minh City University of Technology.
Under sina studier arbetade han med projekt som en stor språkmodell (LLM) för vietnamesiska, en programvara för att översätta etniska minoritetsspråk eller en chatbot för att stödja antagning. ”Dessa erfarenheter hjälpte mig att samla en solid kunskapsgrund, vårda min passion och önskan att tillämpa AI för att skapa användbara produkter för samhället”, berättade han.
Tri Duc vill skapa värde genom att tillämpa AI. Foto: NVCC. |
Dessutom, med en bakgrund i mandarin och kantonesiska, insåg Duc sambandet mellan pinyin/jyutping och vietnamesisk stavning. Denna faktor får en också att se att i motsats till hieroglyfernas komplexitet kräver det kinesiska pinyin-skrivsystemet bara att man skriver "yn" för att få namnet på vårt land med kinesiska tecken. Medan Telex eller VNI kräver 10 nycklar för att få ordet "Vietnam".
Genom sina observationer insåg Duc att användare ofta förkortar texten genom att behålla den första konsonanten när de kommunicerar snabbt, som ”hs” för ”student”. ”Om människor lätt kan förstå den här skrivstilen, kan AI förstå den helt om den tränas med rätt data”, sa han om omständigheterna bakom idén.
Istället för att behöva skriva hela tecknet och sedan lägga till accenter när man använder traditionella skrivverktyg som Telex eller VNI som följer additionsmekanismen, använder v7 AI för att föreslå ordet du vill skriva. Tekniken kommer att exakt förutsäga hela ordet med så få tangenter som möjligt.
I vietnamesisk stavningsstruktur består ett ord av en initial konsonant, rim och ton. Till exempel är ordet "Nguyen" sammansatt av "ng", "uyen" och en fallande ton. Baserat på denna princip är v7-skrivmotorn byggd för att förutsäga kompletta ord med endast initial konsonant och ton, vilket hjälper till att avsevärt minska antalet tangenttryckningar samtidigt som noggrannheten bibehålls.
Utmaningen med att lära vietnamesiska AI
Enligt Duc är den största utmaningen att lära AI att "förstå" vietnamesiska för att kunna använda detta skrivverktyg. Han provade många modeller innan han valde GPT-2 som grund, med Transformers-arkitektur för god kontextförståelse och korrekt ordprediktion.
Efter att ha valt den underliggande arkitekturen ersatte Duc helt Tokenizer (ordförrådskodaren) med ett vietnamesiskt ordförråd som han själv byggt. Ingenjören filtrerade bort alla giltiga, korrekt stavade vietnamesiska ord för att säkerställa omfattande bearbetning och förutspådde alla ord som användaren ville skriva.
En annan utmaning ligger i att balansera prediktiv prestanda och svarshastighet, vilket säkerställer att modellen kan köras i realtid på både datorer och telefoner, men ändå vara tillräckligt kraftfull för att göra de bästa förutsägelserna. Efter två månaders kontinuerlig testning visar den nuvarande versionen korrekt nästan 70 % av orden som användarna skriver, med en latens på endast 0,03 sekunder.
Beträffande tangentbordets inmatningsmetod, enligt många studier som Duc konsulterat från lingvisterna Cao Xuan Hao eller Henri Maspero, har vietnamesiska inte bara 6, utan 8 toner. För att dra nytta av denna funktion använder v7 ett system med 8 toner istället för de vanliga 6 (inklusive en platt ton och 5 accenttoner: skarp, platt, frågande, fallande, tung). På detta tangentbord, när man skriver "v7", kommer modellen att föreslå ordet "Viet". Detta är också idén bakom produktnamnet.
Efter att ha delat v7 på sitt sociala nätverk sa Duc att han var väldigt glad och överraskad när modellen fick uppmärksamhet, stöd och en önskan att uppleva. "Det gav mig en tydlig känsla av behovet av ett smartare och snabbare vietnamesiskt skrivverktyg", sa han.
Författargruppen till den vetenskapliga forskningsartikeln. Från vänster till höger: Nhat Khang, Hieu Nghia och Tri Duc. Foto: NVCC. |
För närvarande är tangentbordet fortfarande i prototypstadiet, med öppen källkod på GitHub för programmerare eller teknikanvändare att testa och bidra med. En komplett applikationsversion för Windows och macOS utvecklas också för vanliga användare att enkelt installera och använda.
I framtiden är den högsta prioriteten för v7 tangentbordsversionen på iPhone, för att förbättra hur vietnamesisk text matas in på smartphones. Dessutom kommer modellen att förbättras i noggrannhet genom att träna mer på daglig konversationsdata, vilket hjälper AI att bättre förstå vanliga sammanhang.
Ducs resa har bidragit till en fläkt av kreativitet, där han har hållit jämna steg med tekniktrender i samband med Vietnams stora investeringar i AI-infrastruktur. Ett ögonblick som gör honom stolt är när v7 först skapade en fullständig mening. "Det var då en liten modell, förmodligen bara 1/10 000 av ChatGPT:s storlek idag, fortfarande kunde tänka som en människa", sa Duc.
Källa: https://znews.vn/ky-su-tre-dung-ai-thay-doi-cach-go-tieng-viet-post1552246.html
Kommentar (0)