Vietnam.vn - Nền tảng quảng bá Việt Nam

Junger Ingenieur nutzt KI, um die Art und Weise zu verändern, wie Vietnamesisch geschrieben wird.

Die KI-integrierte vietnamesische Tastatur ist eines der Produkte, das Kreativität und Fachwissen erfolgreich vereint und darauf abzielt, der Gemeinschaft einen praktischen Nutzen zu bringen.

ZNewsZNews14/05/2025


Benutzeroberfläche von Version 7, KI-integrierte Tastatur. Foto: Vom Autor zur Verfügung gestellt .

Im Gespräch mit Tri Thức – Znews erläuterte Tri Duc (Jahrgang 2003) seine Idee, künstliche Intelligenz zur Veränderung der vietnamesischen Texteingabe einzusetzen. Sein Tastaturprojekt v7 hat sich mittlerweile zu einer Forschungsarbeit entwickelt und wurde für die renommierte KI-Konferenz IJCAI 2025 angenommen.

Obwohl die Telex- oder VNI-Eingabemethode seit Jahrzehnten beliebt ist, weist sie hinsichtlich der Benutzerfreundlichkeit immer noch viele Einschränkungen auf. Daher wurde v7 als leichtgewichtiges Texterkennungstool entwickelt, das dank integrierter KI die Tippzeit für Vietnamesisch verkürzt.

Eine Leidenschaft für Sprachen und Technologie.

Seine Leidenschaft für Sprachen und Technologie veranlasste Duc, an der Technischen Universität Ho-Chi-Minh-Stadt Angewandte Künstliche Intelligenz zu studieren.

Während seines Studiums arbeitete er an Projekten wie groß angelegtem Sprachmodelling (LLM) für Vietnamesisch, Software zur Übersetzung von Minderheitensprachen und Chatbots zur Unterstützung der Studierendenrekrutierung. „Diese Erfahrungen haben mir geholfen, ein solides Wissensfundament zu schaffen, meine Leidenschaft zu fördern und meinen Wunsch zu bestärken, KI zur Entwicklung von Produkten einzusetzen, die der Gemeinschaft zugutekommen“, erklärte er.

Bild 1 eines KI-integrierten Holzbretts

Tri Duc hat sich zum Ziel gesetzt, durch den Einsatz von KI einen Mehrwert für das Leben zu schaffen. Foto: Zur Verfügung gestellt vom Interviewpartner.

Da Duc Mandarin und Kantonesisch beherrschte, erkannte er den Zusammenhang zwischen Pinyin/Jyutping und der vietnamesischen Schreibweise. Dies zeigt auch, dass die chinesische Pinyin-Eingabemethode – im Gegensatz zur Komplexität ideografischer Schriftzeichen – lediglich die Eingabe von „yn“ erfordert, um den Namen unseres Landes in chinesischen Schriftzeichen zu erzeugen. Im Gegensatz dazu benötigen Telex oder VNI zehn Tasten, um „Vietnam“ einzugeben.

Durch seine Beobachtungen erkannte Duc, dass Nutzer in kurzen Gesprächen oft abkürzen, indem sie den Anfangskonsonanten beibehalten, wie zum Beispiel „hs“ für „Student“. „Wenn Menschen diesen Schreibstil problemlos verstehen können, kann ihn auch eine KI verstehen, wenn sie mit den richtigen Daten trainiert wird“, erklärte er die Umstände, die zu seiner Idee führten.

Anstatt wie bei herkömmlichen Eingabemethoden wie Telex oder VNI, die auf einem komplementären Mechanismus basieren, alle Zeichen einzeln einzutippen und anschließend diakritische Zeichen hinzuzufügen, nutzt v7 KI, um Ihnen Wörter vorzuschlagen. Die Technologie sagt das vollständige Wort präzise und mit möglichst wenigen Tastenanschlägen voraus.

In der vietnamesischen Orthografie besteht ein Wort aus einem Anfangskonsonanten, einem Vokal und einem Ton. Beispielsweise setzt sich das Wort „Nguyễn“ aus „ng“, „uyên“ und einem fallenden Ton zusammen. Basierend auf diesem Prinzip wurde die v7-Eingabemethode entwickelt, die das vollständige Wort allein anhand des Anfangskonsonanten und des Tons vorhersagt und so die Anzahl der Tastenanschläge bei gleichbleibender Genauigkeit deutlich reduziert.

Die Herausforderung, KI Vietnamesisch beizubringen.

Laut Duc bestand die größte Herausforderung darin, der KI beizubringen, Vietnamesisch zu „verstehen“, um diese Eingabemethode nutzen zu können. Er testete viele Modelle, bevor er sich für GPT-2 als Grundlage entschied, dessen Transformers-Architektur ein gutes Kontextverständnis und eine präzise Wortvorhersage ermöglicht.

Nach der Auswahl der zugrundeliegenden Architektur ersetzte Duc den Tokenizer (Vokabularkodierer) vollständig durch einen eigenen vietnamesischen Wortschatz. Der Entwickler filterte und integrierte alle gültigen und korrekt geschriebenen vietnamesischen Wörter, um umfassende Verarbeitungskapazitäten und die Fähigkeit zur Vorhersage jedes vom Benutzer beabsichtigten Wortes zu gewährleisten.

Eine weitere Herausforderung besteht darin, Vorhersagegenauigkeit und Reaktionsgeschwindigkeit in Einklang zu bringen und sicherzustellen, dass das Modell in Echtzeit auf Computern und Smartphones läuft und gleichzeitig leistungsstark genug ist, um bestmögliche Vorhersagen zu liefern. Nach zwei Monaten kontinuierlicher Tests platziert die aktuelle Version fast 70 % der eingegebenen Wörter korrekt an der ersten Stelle – mit einer Verzögerung von nur 0,03 Sekunden.

Was die Eingabemethode der Tastatur betrifft, so hat Vietnamesisch laut mehreren Studien der Linguisten Cao Xuan Hao und Henri Maspero, die Duc konsultierte, nicht nur sechs, sondern bis zu acht Töne. Um diese Besonderheit zu nutzen, verwendet die v7 ein Acht-Ton-System anstelle der üblichen sechs (darunter ein Grundton und fünf Akzenttöne: Akut, Gravis, Fragezeichen, Tilde und Punkt unten). Wenn Sie auf dieser Tastatur „v7“ eingeben, schlägt das Modell das Wort „Viet“ vor. Dies ist auch die Idee hinter dem Produktnamen.

Nachdem Duc Version 7 in den sozialen Medien geteilt hatte, zeigte er sich sehr erfreut und überrascht über die große Aufmerksamkeit, Unterstützung und das große Interesse, das Modell auszuprobieren. „Das hat mir deutlich vor Augen geführt, wie wichtig eine intelligentere und schnellere Methode zur Eingabe vietnamesischer Texte ist“, sagte er.

KI-integriertes Holzbrett (Bild 2)

Die Autoren der wissenschaftlichen Arbeit. Von links nach rechts: Nhat Khang, Hieu Nghia und Tri Duc. Foto: Vom Autor zur Verfügung gestellt.

Die Eingabemethode befindet sich aktuell noch im Prototypenstadium. Der Quellcode ist auf GitHub als Open Source verfügbar und kann von Programmierern und Technikbegeisterten getestet und weiterentwickelt werden. Eine vollständige Anwendungsversion für Windows und macOS ist ebenfalls in Entwicklung und ermöglicht eine einfache Installation und Nutzung.

Zukünftig liegt der Fokus von Version 7 auf der iPhone-Tastaturversion, um die Eingabe vietnamesischer Texte auf Smartphones zu verbessern. Zusätzlich wird die Genauigkeit des Modells durch weiteres Training mit alltäglichen Gesprächsdaten optimiert, wodurch die KI gängige Kontexte besser versteht.

Ducs Werdegang hat eine Innovationswelle ausgelöst und mit den technologischen Trends Schritt gehalten, insbesondere im Kontext der hohen Investitionen Vietnams in die KI-Infrastruktur. Ein Moment, auf den er besonders stolz ist, war, als v7 zum ersten Mal einen vollständigen Satz generierte. „Damals konnte ein kleines Modell, wahrscheinlich nur ein Zehntausendstel so groß wie ChatGPT heute, noch wie ein Mensch denken“, sagte Duc.

Quelle: https://znews.vn/ky-su-tre-dung-ai-thay-doi-cach-go-tieng-viet-post1552246.html


Kommentar (0)

Hinterlasse einen Kommentar, um deine Gefühle zu teilen!

Gleiches Thema

Gleiche Kategorie

Gleicher Autor

Erbe

Figur

Unternehmen

Aktuelles

Politisches System

Lokal

Produkt

Happy Vietnam
Lausche den Echos der Zeit

Lausche den Echos der Zeit

Ein Lächeln bei der Arbeit.

Ein Lächeln bei der Arbeit.

Muong Hoa

Muong Hoa