Vietnam.vn - Nền tảng quảng bá Việt Nam

Ung ingeniør bruker kunstig intelligens for å endre måten vietnamesisk skrives på

AI-integrert vietnamesisk skriveprogramvare er et av produktene som kombinerer kreativitet med profesjonell kunnskap på en vellykket måte, med mål om å gi praktisk verdi til fellesskapet.

ZNewsZNews14/05/2025


Grensesnitt til v7, AI-integrert tastatur. Foto: NVCC .

Tri Duc (født i 2003) delte et intervju med Tri Thuc - Znews , der han snakket om ideen om å bruke kunstig intelligens for å endre måten vietnamesisk skrives på. Studentprosjektet hans, v7-skriveverktøyet, har nå utviklet seg til en forskningsartikkel og blitt akseptert på IJCAI 2025, en prestisjefylt konferanse om AI.

Til tross for at det har vært populært i flere tiår, har Telex- eller VNI-skriving fortsatt mange begrensninger i brukeropplevelsen. Derfor ble v7 født for å bli et lettvekts prediksjonsverktøy, som bidro til å forkorte tiden det tar å skrive vietnamesisk takket være AI-integrasjon.

Lidenskap for språk og teknologi

Hans kjærlighet til språk og teknologi førte ham til at han studerte anvendt kunstig intelligens ved Ho Chi Minh-byens teknologiske universitet.

I løpet av studiene jobbet han med prosjekter som en stor språkmodell (LLM) for vietnamesisk, programvare for å oversette etniske minoritetsspråk eller en chatbot for å støtte opptak. «Disse erfaringene hjalp meg med å samle et solid kunnskapsgrunnlag, pleie lidenskapen min og ønsket om å bruke AI til å lage nyttige produkter for lokalsamfunnet», delte han.

AI-integrert treverk bilde 1

Tri Duc ønsker å bringe verdi ut av å anvende kunstig intelligens. Foto: NVCC.

I tillegg, med bakgrunn i mandarin og kantonesisk, forsto Duc sammenhengen mellom pinyin/jyutping og vietnamesisk stavemåte. Denne faktoren får deg også til å se at i motsetning til kompleksiteten til hieroglyfer, krever det kinesiske pinyin-skrivesystemet bare at man skriver «yn» for å få navnet på landet vårt med kinesiske tegn. Mens Telex eller VNI krever 10 taster for å få ordet «Vietnam».

Gjennom observasjonene sine innså Duc at brukere ofte forkorter ved å beholde den første konsonanten når de kommuniserer raskt, som «hs» for «student». «Hvis mennesker lett kan forstå denne skrivestilen, kan AI forstå den fullt ut hvis de trenes med de riktige dataene», sa han om omstendighetene som ga opphav til ideen.

I stedet for å måtte skrive hele tegnet og deretter legge til aksenter når man bruker tradisjonelle skriveverktøy som Telex eller VNI som følger addisjonsmekanismen, bruker v7 AI til å foreslå ordet du vil skrive. Teknologien vil nøyaktig forutsi hele ordet med færrest mulig taster.

I vietnamesisk stavemåte består et ord av en initial konsonant, rim og tone. For eksempel er ordet «Nguyen» satt sammen av «ng», «uyen» og en fallende tone. Basert på dette prinsippet er v7-skrivemotoren bygget for å forutsi komplette ord med kun initial konsonant og tone, noe som bidrar til å redusere antall tastetrykk betydelig samtidig som nøyaktigheten opprettholdes.

Utfordringen med å lære vietnamesisk kunstig intelligens

Ifølge Duc er den største utfordringen å lære AI å «forstå» vietnamesisk for å kunne bruke dette skriveverktøyet. Han prøvde mange modeller før han valgte GPT-2 som grunnlag, med Transformers-arkitektur for god kontekstforståelse og nøyaktig ordprediksjon.

Etter å ha valgt den underliggende arkitekturen, erstattet Duc Tokenizer (vokabularkoder) fullstendig med et vietnamesisk vokabular laget av ham selv. Ingeniøren filtrerte ut alle gyldige, korrekt stavede vietnamesiske ord for å sikre omfattende prosessering, og forutså ethvert ord brukeren ønsket å skrive.

En annen utfordring ligger i å balansere prediktiv ytelse og responshastighet, slik at modellen kan kjøre i sanntid på både datamaskiner og telefoner, men fortsatt er kraftig nok til å gi de beste prediksjonene. Etter to måneder med kontinuerlig testing bringer den nåværende versjonen nesten 70 % av ordene brukerne skriver til toppen, med en forsinkelse på bare 0,03 sekunder.

Når det gjelder inndatametoden på tastaturet, ifølge mange studier som Duc konsulterte fra lingvistene Cao Xuan Hao eller Henri Maspero, har vietnamesisk ikke bare 6, men 8 toner. For å dra nytte av denne funksjonen bruker v7 et system med 8 toner i stedet for de vanlige 6 (inkludert en flat tone og 5 aksenttoner: skarp, flat, spørsmålstegn, fallende, tung). På dette tastaturet, når du skriver «v7», vil modellen foreslå ordet «vietnamesisk». Dette er også ideen bak produktnavnet.

Etter å ha delt v7 på sine sosiale nettverk, sa Duc at han var veldig glad og overrasket da modellen fikk oppmerksomhet, støtte og et ønske om å oppleve den. «Det ga meg en klar følelse av behovet for et smartere og raskere vietnamesisk skriveverktøy», sa han.

AI photo 2 integrert treplate

Gruppen av forfattere av den vitenskapelige forskningsartikkelen. Fra venstre til høyre: Nhat Khang, Hieu Nghia og Tri Duc. Foto: NVCC.

For øyeblikket er tastaturet fortsatt på prototypestadiet, med åpen kildekode på GitHub som programmerere eller teknologibrukere kan teste og bidra med. En komplett applikasjonsversjon for Windows og macOS er også under utvikling for vanlige brukere, slik at de enkelt kan installere og bruke den.

I fremtiden er toppprioriteten for v7 tastaturversjonen på iPhone, for å forbedre måten vietnamesisk tekst skrives inn på smarttelefoner. I tillegg vil modellen forbedres i nøyaktighet ved å trene mer på daglige samtaledata, noe som hjelper AI med å bedre forstå vanlige kontekster.

Ducs reise har bidratt til et pust av kreativitet, og han har tatt igjen teknologitrender i sammenheng med Vietnams store investeringer i AI-infrastruktur. Et øyeblikk som gjør ham stolt er da v7 først skapte en fullstendig setning. «Det var da en liten modell, sannsynligvis bare 1/10 000 av størrelsen til ChatGPT i dag, fortsatt kunne tenke som et menneske», sa Duc.

Kilde: https://znews.vn/ky-su-tre-dung-ai-thay-doi-cach-go-tieng-viet-post1552246.html


Kommentar (0)

No data
No data

I samme emne

I samme kategori

Å holde ånden av midthøstfestivalen oppe gjennom fargene på figurene
Oppdag den eneste landsbyen i Vietnam som er blant de 50 vakreste landsbyene i verden
Hvorfor er røde flagglykter med gule stjerner populære i år?
Vietnam vinner musikkkonkurransen Intervision 2025

Av samme forfatter

Arv

Figur

Forretninger

No videos available

Nyheter

Det politiske systemet

Lokalt

Produkt