Vietnam.vn - Nền tảng quảng bá Việt Nam

Nuori insinööri käyttää tekoälyä muuttaakseen vietnamin kirjoitustapaa.

Tekoälyyn integroitu vietnamilainen näppäimistö on yksi tuotteista, jotka yhdistävät onnistuneesti luovuuden ja asiantuntemuksen ja pyrkivät tuomaan käytännön arvoa yhteisölle.

ZNewsZNews14/05/2025


v7:n käyttöliittymä, tekoälyyn integroitu näppäimistö. Kuva: Kirjoittajan toimittama .

Vuonna 2003 syntynyt Tri Duc kertoi Tri Thức - Znewsille ajatuksestaan ​​tekoälyn soveltamisesta vietnamin kielen kirjoitustavan muuttamiseksi. Hänen v7-näppäimistöprojektinsa on nyt kehittynyt tutkimuspaperiksi ja se on hyväksytty arvostettuun IJCAI 2025 -tekoälykonferenssiin.

Vaikka Telex- tai VNI-syöttötapa on ollut suosittu vuosikymmeniä, sillä on edelleen monia rajoituksia käyttökokemuksen suhteen. Siksi v7 luotiin kevyeksi ennustustyökaluksi, joka auttaa lyhentämään vietnamin kirjoitusaikaa integroidun tekoälyn ansiosta.

Intohimo kieliin ja teknologiaan.

Hänen intohimonsa kieliin ja teknologiaan johdatti Ducin opiskelemaan sovellettua tekoälyä Ho Chi Minh Cityn teknillisessä yliopistossa.

Opiskeluaikanaan hän työskenteli projektien parissa, kuten laajamittaisen kielimallinnuksen (LLM) kehittämisessä vietnamin kielelle, etnisten vähemmistöjen kielten käännösohjelmistojen kehittämisessä ja opiskelijoiden rekrytointia tukevien chatbottien kehittämisessä. ”Nämä kokemukset auttoivat minua rakentamaan vankan tietopohjan, vaalimaan intohimoani ja ruokkimaan haluani soveltaa tekoälyä luodakseni tuotteita, jotka hyödyttävät yhteisöä”, hän kertoi.

Tekoälyllä integroitu puulevy, kuva 1

Tri Duc pyrkii tuomaan arvoa elämään tekoälyn avulla. Kuva: Haastateltavan toimittama.

Saatat myös pitää tästä
Dr. Nguyen Si Dung: Vietnam on ennakoivasti uudelleenasemoimassa rooliaan uudessa alueellisessa järjestyksessä.
Dr. Nguyen Si Dung: Vietnam on ennakoivasti uudelleenasemoimassa rooliaan uudessa alueellisessa järjestyksessä.Tohtori Nguyen Si Dungin mukaan pääsihteerin ja presidentti To Lamin valtiovierailulla kolmeen maahan on johdonmukainen viesti: Vietnam on ennakoivasti uudelleenasemoimassa rooliaan uudessa alueellisessa järjestyksessä.

Lisäksi Duc, jolla on mandariinikiinan ja kantoninkiinan tausta, tunnisti pinyin/jyutpingin ja vietnamin kirjoitusasun välisen korrelaation. Tämä osoittaa myös, että ideografisten merkkien monimutkaisuudesta huolimatta kiinalainen pinyin-syöttötapa vaatii vain "yn":n syöttämisen tuottaakseen maamme nimen kiinalaisilla merkeillä. Sitä vastoin Telex tai VNI tarvitsevat 10 avainta tuottaakseen "Vietnam".

Havaintojensa kautta Duc huomasi, että nopeissa keskusteluissa käyttäjät usein lyhentävät sanoja säilyttämällä alkukonsonantin, kuten "hs" sanalle "opiskelija". "Jos ihmiset ymmärtävät tämän kirjoitustyylin helposti, tekoäly voi ehdottomasti ymmärtää sen, jos se on koulutettu oikeilla tiedoilla", hän selitti olosuhteista, jotka johtivat hänen ideaansa.

Sen sijaan, että kaikki merkit kirjoitettaisiin ja sitten lisättäisiin diakriittiset merkit kuten perinteisissä syöttömenetelmissä, kuten Telexissä tai VNI:ssä, jotka perustuvat täydentävään mekanismiin, v7 käyttää tekoälyä ehdottaakseen sanoja, joita haluat kirjoittaa. Teknologia ennustaa tarkasti koko sanan mahdollisimman vähällä näppäinmäärällä.

Vietnamin ortografiassa sana koostuu alkukonsonantista, vokaalista ja sävelestä. Esimerkiksi sana "Nguyễn" koostuu sanoista "ng", "uyên" ja laskevasta sävelestä. Tämän periaatteen pohjalta kehitettiin v7-syöttömenetelmä, joka ennustaa koko sanan käyttämällä vain alkukonsonanttia ja säveltä, mikä vähentää merkittävästi näppäinpainallusten määrää ja säilyttää tarkkuuden.

Vietnamin opettamisen haaste tekoälylle

Ducin mukaan suurin haaste oli opettaa tekoälylle "ymmärtämään" vietnamia, jotta tämä syöttötapa toimisi. Hän kokeili useita malleja ennen kuin valitsi pohjaksi GPT-2:n, jonka Transformers-arkkitehtuuri tarjosi hyvän kontekstuaalisen ymmärryksen ja tarkan sananennustuksen.

Valittuaan pohjana olevan arkkitehtuurin Duc korvasi Tokenizerin (sanastokooderin) kokonaan omalla vietnamin kielen sanastosarjallaan. Insinööri suodatti ja sisällytti mukaan kaikki kelvolliset ja oikein kirjoitetut vietnamin kielen sanat varmistaakseen kattavat prosessointiominaisuudet ja kyvyn ennustaa mikä tahansa käyttäjän tarkoittama sana.

Toinen haaste on ennustavan suorituskyvyn ja vasteajan tasapainottaminen varmistaen, että malli toimii reaaliajassa sekä tietokoneilla että puhelimilla ja pysyy silti riittävän tehokkaana parhaiden mahdollisten ennusteiden tarjoamiseksi. Kahden kuukauden jatkuvan testauksen jälkeen nykyinen versio sijoittaa lähes 70 % käyttäjien syöttämistä sanoista oikein alkuun vain 0,03 sekunnin viiveellä.

Näppäimistön syöttötavan osalta Duc konsultoi useita kielitieteilijöiden Cao Xuan Haon ja Henri Masperon tekemiä tutkimuksia, joiden mukaan vietnamin kielessä ei ole vain kuutta, vaan jopa kahdeksan säveltä. Tämän ominaisuuden hyödyntämiseksi v7 käyttää 8-sävyistä järjestelmää tavallisen kuuden sijaan (mukaan lukien yksi tasainen sävel ja viisi aksenttisäveltä: akuutti, vakava, kysymys, tilde ja piste alla). Tässä näppäimistössä, kun kirjoitat "v7", malli ehdottaa sanaa "Viet". Tämä on myös tuotteen nimen taustalla oleva ajatus.

Jaettuaan version 7 sosiaalisessa mediassa Duc sanoi olevansa erittäin iloinen ja yllättynyt siitä, että malli sai niin paljon huomiota, tukea ja halun kokeilla sitä. "Se antoi minulle selkeän käsityksen älykkäämmän ja nopeamman vietnamilaisen syöttötavan tarpeesta", hän sanoi.

Tekoälyyn integroitu puulevy (kuva 2)

Saatat myös pitää tästä
Ansioitunut taiteilija Kieu My Dung levittää Tay Don kauneutta: Kun taiteilijoista tulee kulttuurilähettiläitä.
Ansioitunut taiteilija Kieu My Dung levittää Tay Don kauneutta: Kun taiteilijoista tulee kulttuurilähettiläitä.(NLĐO) – Ansioitunut taiteilija Kieu My Dung on aina ylpeä Can Thon kulttuuri- ja taiteellisesta toiminnasta ja toimii Cai Luong -teatterin lähettiläänä puhuessaan kotikaupungistaan.

Tieteellisen tutkimusartikkelin tekijät. Vasemmalta oikealle: Nhat Khang, Hieu Nghia ja Tri Duc. Kuva: Kirjoittajan toimittama.

Syöttötapa on tällä hetkellä vielä prototyyppivaiheessa, ja GitHubissa on avoimen lähdekoodin koodia ohjelmoijien ja teknisten käyttäjien testattavaksi ja kehittämiseksi. Yleiskäyttäjille kehitetään myös täydellistä sovellusversiota Windowsille ja macOS:lle, joten se on helppo asentaa ja käyttää.

Tulevaisuudessa v7:n tärkein prioriteetti on iPhonen näppäimistöversio, jonka tavoitteena on parantaa tapaa, jolla vietnamilaista tekstiä syötetään älypuhelimiin. Lisäksi mallin tarkkuutta parannetaan kouluttamalla sitä edelleen arkipäivän keskusteludatalla, mikä auttaa tekoälyä ymmärtämään paremmin yleisiä konteksteja.

Ducin matka on osaltaan synnyttänyt innovaatioaallon ja pysynyt mukana teknologisten trendien tahdissa Vietnamin vahvan tekoälyinfrastruktuuriin tekemän investoinnin kontekstissa. Yksi hetki, josta hän on ylpeä, on se, kun v7 loi ensimmäisen kerran kokonaisen lauseen. "Silloin pieni malli, luultavasti vain 1/10000 nykyisen ChatGPT:n koosta, kykeni vielä ajattelemaan kuin ihminen", Duc sanoi.

Lähde: https://znews.vn/ky-su-tre-dung-ai-thay-doi-cach-go-tieng-viet-post1552246.html


Kommentti (0)

Jätä kommentti kertoaksesi tunteistasi!

Sama tunniste

Sama kategoria

Sama tekijä

Perintö

Kuvio

Yritykset

Ajankohtaisohjelmat

Poliittinen järjestelmä

Paikallinen

Tuote

Happy Vietnam
Onnellisuus ylängöillä

Onnellisuus ylängöillä

viaton lapsuus

viaton lapsuus

Shakkikylän sisällä

Shakkikylän sisällä