Rozhraní v7, klávesnice s integrovanou umělou inteligencí. Foto: NVCC . |
V rozhovoru s Tri Thuc - Znews hovořil Tri Duc (narozen v roce 2003) o myšlence využití umělé inteligence ke změně způsobu zadávání vietnamštiny. Jeho studentský projekt, nástroj pro psaní v7, se nyní rozvinul do výzkumné práce a byl přijat na prestižní konferenci o umělé inteligenci IJCAI 2025.
Přestože je psaní pomocí telexu neboli VNI oblíbené po celá desetiletí, má stále mnoho omezení v uživatelském prostředí. Proto se zrodila verze 7, která se stala lehkým nástrojem pro predikci a pomáhá zkrátit dobu psaní vietnamštiny díky integraci umělé inteligence.
Vášeň pro jazyky a technologie
Jeho láska k jazykům a technologiím ho vedla k studiu aplikované umělé inteligence na Technické univerzitě v Ho Či Minově Městě.
Během studií se věnoval projektům, jako je model velkého jazyka (LLM) pro vietnamštinu, software pro překlad jazyků etnických menšin nebo chatbot pro podporu přijímacího řízení. „Tyto zkušenosti mi pomohly nashromáždit solidní základ znalostí, rozvíjet mou vášeň a touhu aplikovat umělou inteligenci k vytváření užitečných produktů pro komunitu,“ sdělil.
Tri Duc chce přinést hodnotu z aplikace umělé inteligence do života. Foto: NVCC. |
Kromě toho, díky znalostem mandarínštiny a kantonštiny, Duc rozpoznal souvislost mezi pinyinem/džut-pchingem a vietnamským pravopisem. Tento faktor také ukazuje, že na rozdíl od složitosti hieroglyfů vyžaduje čínský systém psaní pinyin pouze napsání „yn“ k získání názvu naší země v čínských znacích. Zatímco telex nebo VNI vyžaduje 10 kláves k získání slova „Vietnam“.
Duc si díky svým pozorováním uvědomil, že při rychlé komunikaci uživatelé často zkracují slova tak, že si ponechávají první souhlásku, například „hs“ pro „student“. „Pokud lidé dokážou tomuto stylu psaní snadno porozumět, umělá inteligence mu dokáže porozumět zcela, pokud je trénována se správnými daty,“ řekl o okolnostech, které vedly k tomuto nápadu.
Místo toho, abyste museli psát celý znak a poté přidávat diakritiku při používání tradičních nástrojů pro psaní, jako je Telex nebo VNI, které používají mechanismus sčítání, v7 používá umělou inteligenci k navrhování slova, které chcete napsat. Technologie přesně předpoví celé slovo s co nejmenším počtem kláves.
Ve vietnamském pravopisu se slovo skládá z počáteční souhlásky, rýmu a tónu. Například slovo „Nguyen“ se skládá z „ng“, „uyen“ a klesajícího tónu. Na základě tohoto principu je psací engine v7 postaven tak, aby předpovídal celá slova pouze s počáteční souhláskou a tónem, což pomáhá výrazně snížit počet stisknutí kláves a zároveň zachovat přesnost.
Výzva učit vietnamštinu pro umělou inteligenci
Podle Duca je největší výzvou naučit umělou inteligenci „rozumět“ vietnamštině, aby mohla tento nástroj pro psaní používat. Než si jako základ vybral GPT-2 s architekturou Transformers pro dobré porozumění kontextu a přesnou predikci slov, vyzkoušel mnoho modelů.
Po výběru základní architektury Duc kompletně nahradil Tokenizér (kodér slovní zásoby) vietnamskou slovní zásobou, kterou si sám vytvořil. Inženýr filtroval všechna platná, správně napsaná vietnamská slova, aby zajistil komplexní zpracování, a předpovídal jakékoli slovo, které chtěl uživatel napsat.
Další výzvou je nalezení rovnováhy mezi prediktivním výkonem a rychlostí odezvy, aby model mohl běžet v reálném čase na počítačích i telefonech, ale zároveň byl dostatečně výkonný pro vytváření nejlepších předpovědí. Po 2 měsících nepřetržitého testování aktuální verze správně zobrazuje na začátku téměř 70 % slov, která uživatelé zadávají, s latencí pouhých 0,03 sekundy.
Pokud jde o metodu zadávání textu na klávesnici, podle mnoha studií, které Duc konzultoval s lingvisty Cao Xuan Hao nebo Henri Maspero, má vietnamština nejen 6, ale 8 tónů. Aby se tato funkce využila, v7 používá systém 8 tónů místo obvyklých 6 (včetně plochého tónu a 5 tónů s diakritikou: ostrý, plochý, tázací, klesající, těžký). Na této klávesnici model při psaní „v7“ navrhne slovo „Viet“. To je také nápad pro název produktu.
Poté, co Duc sdílel verzi 7 na své sociální síti, uvedl, že byl velmi šťastný a překvapen, když se modelu dostalo pozornosti, podpory a touhy si ho vyzkoušet. „To mi dalo jasný pocit, že potřebuji chytřejší a rychlejší nástroj pro psaní ve vietnamštině,“ řekl.
Skupina autorů vědeckého výzkumného článku. Zleva doprava: Nhat Khang, Hieu Nghia a Tri Duc. Foto: NVCC. |
Klávesnice je v současné době stále ve fázi prototypu s otevřeným zdrojovým kódem na GitHubu, který mohou programátoři nebo uživatelé technologií testovat a přispívat k jeho testování. Vyvíjí se také kompletní verze aplikace pro Windows a macOS, kterou si běžní uživatelé snadno nainstalují a budou moci používat.
V budoucnu je pro v7 nejvyšší prioritou verze s klávesnicí pro iPhone, která by vylepšila způsob zadávání vietnamského textu na chytrých telefonech. Kromě toho se zlepší přesnost modelu tím, že se bude více trénovat na datech z každodenní konverzace, což pomůže umělé inteligenci lépe porozumět běžným kontextům.
Ducova cesta přispěla k kreativitě a dohnala krok s technologickými trendy v kontextu silných investic Vietnamu do infrastruktury umělé inteligence. Jeden z momentů, na který je hrdý, je, když v7 poprvé vytvořila celou větu. „Tehdy malý model, pravděpodobně jen 1/10 000 velikosti dnešního ChatGPT, stále dokázal myslet jako člověk,“ řekl Duc.
Zdroj: https://znews.vn/ky-su-tre-dung-ai-thay-doi-cach-go-tieng-viet-post1552246.html
Komentář (0)