v7 interfész, mesterséges intelligenciával integrált billentyűzet. Fotó: NVCC . |
Tri Thucnak - Znews - Tri Duc (született 2003-ban) a vietnami bevitel módjának megváltoztatására irányuló mesterséges intelligencia alkalmazásának ötletéről beszélt. Diákprojektje, a v7 gépelési eszköz mára kutatási dolgozattá fejlődött, és elfogadták az IJCAI 2025-ön, egy rangos mesterséges intelligencia konferencián.
Annak ellenére, hogy évtizedek óta népszerű, a Telex vagy VNI gépelési nyelv továbbra is számos korlátozással rendelkezik a felhasználói élmény terén. Ezért született meg a v7, hogy egy könnyűsúlyú predikciós eszközzé váljon, amely a mesterséges intelligencia integrációjának köszönhetően segít lerövidíteni a vietnami gépelés idejét.
Szenvedély a nyelvek és a technológia iránt
A nyelvek és a technológia iránti szeretete miatt a Ho Si Minh-városi Műszaki Egyetemen tanult mesterséges intelligencia szakon.
Tanulmányai során olyan projektekben vett részt, mint egy nagy nyelvi modell (LLM) vietnami nyelvre, egy szoftver az etnikai kisebbségek nyelveinek fordítására, vagy egy chatbot a felvételi eljárás támogatására. „Ezek a tapasztalatok segítettek szilárd tudásbázist felhalmozni, táplálni a szenvedélyemet és a vágyamat, hogy a mesterséges intelligenciát hasznos termékek létrehozására alkalmazzam a közösség számára” – osztotta meg.
Tri Duc értéket szeretne teremteni a mesterséges intelligencia alkalmazásából. Fotó: NVCC. |
Emellett Duc, akinek mandarin és kantoni nyelvi háttere van, felismerte a pinjin/jyutping és a vietnami helyesírás közötti összefüggést. Ez a tényező azt is mutatja, hogy a hieroglifák összetettségével ellentétben a kínai pinjin gépelési rendszerben csak az „yn” betű begépelésére van szükség ahhoz, hogy országunk nevét kínai karakterekkel kapjuk meg. Míg a Telex vagy a VNI 10 kulcsot igényel a „Vietnam” szó megszerzéséhez.
Megfigyelései során Duc rájött, hogy gyors kommunikáció esetén a felhasználók gyakran az első mássalhangzó megtartásával rövidítenek, például a „hs” a „diák” esetében. „Ha az emberek könnyen megértik ezt az írásmódot, akkor a mesterséges intelligencia teljesen megértheti, ha a megfelelő adatokkal képezik ki” – mondta az ötletet kiváltó körülményekről.
Ahelyett, hogy a hagyományos gépelési eszközök, mint például a Telex vagy a VNI, amelyek az összeadási mechanizmust követik, a teljes karaktert be kellene írni, majd ékezeteket kellene hozzáadni, a v7 mesterséges intelligenciát használ a beírni kívánt szó javaslatára. A technológia a lehető legkevesebb billentyű beírásával pontosan megjósolja a teljes szót.
A vietnami helyesírásban egy szó kezdő mássalhangzóból, rímből és hangnemből áll. Például a „Nguyen” szó az „ng”, az „uyen” és egy ereszkedő hangnemből tevődik össze. Ezen elv alapján a v7 gépelési motor úgy van kialakítva, hogy a teljes szavakat csak a kezdő mássalhangzóval és hangnemben jósolja meg, ami jelentősen csökkenti a billentyűleütések számát, miközben megőrzi a pontosságot.
A vietnami nyelv mesterséges intelligenciának való tanításának kihívása
Duc szerint a legnagyobb kihívás a mesterséges intelligencia megtanítása a vietnami nyelv „megértésére”, hogy az működhessen ebben a gépelési eszközben. Számos modellt kipróbált, mielőtt a GPT-2-t választotta alapnak, a Transformers architektúrájával a jó kontextusfelismerés és a pontos szópredikció érdekében.
Miután kiválasztotta az alapul szolgáló architektúrát, Duc teljesen lecserélte a Tokenizert (szókincs-kódolót) egy saját maga által készített vietnami szókincsre. A mérnök kiszűrte az összes érvényes, helyesen írt vietnami szót az átfogó feldolgozás biztosítása érdekében, és megjósolta a felhasználó által beírni kívánt szavakat.
További kihívást jelent az előrejelző teljesítmény és a válaszidő egyensúlyban tartása, biztosítva, hogy a modell valós időben fusson mind számítógépeken, mind telefonokon, ugyanakkor elég erős legyen a legjobb előrejelzések elkészítéséhez. 2 hónapos folyamatos tesztelés után a jelenlegi verzió a felhasználók által beírt szavak közel 70%-át helyesen hozza a legfelülre, mindössze 0,03 másodperces késleltetéssel.
A billentyűzet beviteli módját illetően a Duc által konzultált számos, Cao Xuan Hao és Henri Maspero nyelvészektől származó tanulmány szerint a vietnami nyelvnek nemcsak 6, hanem 8 hangja van. Ennek a funkciónak a kihasználása érdekében a v7 a szokásos 6 helyett 8 hangból álló rendszert használ (köztük egy lapos hangot és 5 ékezetes hangot: éles, lapos, kérdő, ereszkedő, nehéz). Ezen a billentyűzeten a "v7" beírásakor a modell a "vietnami" szót javasolja. Ez az ötlet a termék nevéhez is kapcsolódik.
Miután megosztotta a v7-et a közösségi oldalán, Duc elmondta, hogy nagyon boldog és meglepődött, amikor a modell figyelmet, támogatást és kipróbálási vágyat kapott. „Ez világosan megerősítette bennem, hogy szükség van egy okosabb és gyorsabb vietnami gépelési eszközre” – mondta.
A tudományos kutatási cikk szerzőinek csoportja. Balról jobbra: Nhat Khang, Hieu Nghia és Tri Duc. Fotó: NVCC. |
Jelenleg a billentyűzet még prototípus fázisban van, a GitHubon nyílt forráskódú kóddal rendelkezik, amelyet a programozók és a technológiai felhasználók tesztelhetnek és közreműködhetnek. A Windows és macOS rendszerekre készült teljes alkalmazásverzió is fejlesztés alatt áll, hogy a hétköznapi felhasználók könnyen telepíthessék és használhassák.
A jövőben a v7 legfontosabb prioritása az iPhone-os billentyűzetverzió lesz, hogy javítsa a vietnami szövegbevitel módját okostelefonokon. Ezenkívül a modell pontosságát is javítani fogják a napi beszélgetési adatokon való fokozottabb betanítással, segítve a mesterséges intelligenciát a gyakori kontextusok jobb megértésében.
Duc útja hozzájárult a kreativitás lélegzetvételéhez, utolérve a technológiai trendeket Vietnam kontextusában, amely jelentős összegeket fektet be a mesterséges intelligencia infrastruktúrájába. Egy pillanat, amire büszke, az az, amikor a v7 először alkotott teljes mondatot. „Akkor egy kis modell, valószínűleg a mai ChatGPT méretének mindössze 1/10 000-ed része, még mindig tudott úgy gondolkodni, mint egy ember” – mondta Duc.
Forrás: https://znews.vn/ky-su-tre-dung-ai-thay-doi-cach-go-tieng-viet-post1552246.html






Hozzászólás (0)