Interfejs v7, zintegrowana klawiatura AI. Zdjęcie: NVCC . |
W wywiadzie dla Znews , Tri Duc (urodzony w 2003 roku) opowiedział o pomyśle zastosowania sztucznej inteligencji do zmiany sposobu wprowadzania tekstu w języku wietnamskim. Narzędzie do pisania v7, jego projekt studencki, przekształciło się w pracę badawczą i zostało zaakceptowane na IJCAI 2025, prestiżowej konferencji poświęconej sztucznej inteligencji.
Mimo popularności od dziesięcioleci, pisanie w Telexie lub VNI wciąż wiąże się z wieloma ograniczeniami w zakresie komfortu użytkowania. Dlatego v7 powstał jako lekkie narzędzie predykcyjne, które dzięki integracji ze sztuczną inteligencją skraca czas pisania w języku wietnamskim.
Pasja do języków i technologii
Jego miłość do języków i technologii skłoniła go do podjęcia studiów na kierunku Sztuczna Inteligencja Stosowana na Uniwersytecie Technologicznym w Ho Chi Minh.
Podczas studiów zaangażował się w projekty takie jak duży model językowy (LLM) dla języka wietnamskiego, oprogramowanie do tłumaczenia języków mniejszości etnicznych czy chatbot wspomagający rekrutację. „Te doświadczenia pomogły mi zgromadzić solidne podstawy wiedzy, pielęgnować pasję i pragnienie wykorzystania sztucznej inteligencji do tworzenia użytecznych produktów dla społeczności” – powiedział.
Tri Duc chce wcielić w życie korzyści płynące z zastosowania sztucznej inteligencji. Zdjęcie: NVCC. |
Ponadto, dzięki znajomości języka mandaryńskiego i kantońskiego, Duc dostrzegł korelację między pisownią pinyin/jyutping a pisownią wietnamską. Ten czynnik uświadamia nam również, że w przeciwieństwie do złożoności hieroglifów, chiński system pisania pinyin wymaga jedynie wpisania „yn”, aby uzyskać nazwę naszego kraju w znakach Han. Natomiast Telex lub VNI wymagają 10 klawiszy, aby uzyskać słowo „Wietnam”.
Dzięki swoim obserwacjom Duc zdał sobie sprawę, że podczas szybkiej komunikacji użytkownicy często skracają słowa, zachowując pierwszą spółgłoskę, na przykład „hs” oznaczające „uczeń”. „Skoro ludzie z łatwością rozumieją ten styl pisania, sztuczna inteligencja może go w pełni zrozumieć, jeśli zostanie wyszkolona na odpowiednich danych” – powiedział o okolicznościach, które zrodziły ten pomysł.
Zamiast konieczności wpisywania całego znaku i dodawania akcentów w tradycyjnych narzędziach do pisania, takich jak Telex czy VNI, które korzystają z mechanizmu uzupełniającego, v7 wykorzystuje sztuczną inteligencję do podpowiadania słów, które chcesz wpisać. Technologia ta precyzyjnie przewiduje całe słowo przy użyciu jak najmniejszej liczby klawiszy.
W ortografii wietnamskiej słowo składa się z początkowej spółgłoski, rymu i tonu. Na przykład słowo „Nguyen” składa się z „ng”, „uyen” i tonu opadającego. W oparciu o tę zasadę, silnik v7 został stworzony do przewidywania całych słów, zawierających jedynie początkową spółgłoskę i ton, co pomaga znacznie zmniejszyć liczbę naciśnięć klawiszy przy jednoczesnym zachowaniu dokładności.
Wyzwanie nauczania języka wietnamskiego w AI
Według Duca, największym wyzwaniem było nauczenie sztucznej inteligencji „rozumienia” języka wietnamskiego, aby mogła obsługiwać to narzędzie do pisania. Wypróbował wiele modeli, zanim wybrał GPT-2 jako fundament, z architekturą Transformers, która zapewniała dobre rozumienie kontekstu i precyzyjne przewidywanie słów.
Po wybraniu architektury bazowej, Duc całkowicie zastąpił Tokenizer (koder słownictwa) stworzonym przez siebie słownikiem wietnamskim. Inżynier odfiltrował wszystkie poprawne, poprawnie napisane słowa wietnamskie, aby zapewnić kompleksowe przetwarzanie, przewidując każde słowo, które użytkownik zechce wpisać.
Kolejnym wyzwaniem jest znalezienie równowagi między wydajnością predykcyjną a szybkością reakcji, aby model mógł działać w czasie rzeczywistym zarówno na komputerach, jak i telefonach, a jednocześnie był wystarczająco wydajny, aby tworzyć najlepsze prognozy. Po dwóch miesiącach ciągłych testów, obecna wersja poprawnie wyświetla na górze prawie 70% słów wpisywanych przez użytkowników, z opóźnieniem wynoszącym zaledwie 0,03 sekundy.
Jeśli chodzi o metodę wprowadzania tekstu za pomocą klawiatury, według licznych badań, z którymi Duc zapoznał się, przeprowadzonych przez językoznawców Cao Xuan Hao i Henriego Maspero, język wietnamski ma nie tylko 6, ale 8 tonów. Aby wykorzystać tę funkcję, v7 używa systemu 8-tonowego zamiast standardowego 6 (w tym tonu płaskiego i 5 tonów akcentowanych: krzyżyka, bemola, pytania, opadającego i ciężkiego). W tej klawiaturze, po wpisaniu „v7”, model zasugeruje słowo „Viet”. Jest to również pomysł na nazwę produktu.
Po udostępnieniu v7 na swojej sieci społecznościowej, Duc powiedział, że był bardzo szczęśliwy i zaskoczony, gdy model spotkał się z zainteresowaniem, wsparciem i chęcią doświadczenia. „To dało mi jasne poczucie potrzeby inteligentniejszego i szybszego narzędzia do pisania po wietnamsku” – powiedział.
Grupa autorów artykułu naukowego . Od lewej: Nhat Khang, Hieu Nghia i Tri Duc. Zdjęcie: NVCC. |
Klawiatura jest obecnie wciąż w fazie prototypu, a jej kod źródłowy jest dostępny na GitHubie, gdzie programiści i użytkownicy technologii mogą go testować i współtworzyć. Trwają również prace nad kompletną wersją aplikacji dla systemów Windows i macOS, która będzie łatwa w instalacji i użytkowaniu dla przeciętnych użytkowników.
W przyszłości priorytetem dla wersji 7 będzie wersja klawiatury na iPhone'a, aby usprawnić wprowadzanie tekstu w języku wietnamskim na smartfonach. Ponadto model będzie bardziej precyzyjny dzięki trenowaniu na podstawie codziennych danych konwersacyjnych, co pomoże sztucznej inteligencji lepiej rozumieć typowe konteksty.
Podróż Duca przyczyniła się do powiewu kreatywności, nadążając za trendami technologicznymi w kontekście intensywnych inwestycji Wietnamu w infrastrukturę AI. Jednym z momentów, z których jest dumny, jest moment, gdy v7 po raz pierwszy stworzył pełne zdanie. „To wtedy mały model, prawdopodobnie zaledwie 1/10 000 wielkości dzisiejszego ChatGPT, mógł jeszcze myśleć jak człowiek” – powiedział Duc.
Source: https://znews.vn/ky-su-tre-dung-ai-thay-doi-cach-go-tieng-viet-post1552246.html
Komentarz (0)