Vietnam.vn - Nền tảng quảng bá Việt Nam

Junger Ingenieur nutzt KI, um die Art und Weise zu verändern, wie Vietnamesisch geschrieben wird.

Eine KI-integrierte vietnamesische Schreibsoftware ist eines der Produkte, das Kreativität und Fachwissen erfolgreich vereint und darauf abzielt, der Gemeinschaft einen praktischen Nutzen zu bringen.

ZNewsZNews14/05/2025


Benutzeroberfläche von Version 7, KI-integrierte Tastatur. Foto: NVCC .

Im Gespräch mit Tri Thuc – Znews sprach Tri Duc (Jahrgang 2003) über die Idee, künstliche Intelligenz einzusetzen, um die Eingabe vietnamesischer Texte zu revolutionieren. Das von ihm als Student entwickelte Tipptool v7 wurde mittlerweile zu einer Forschungsarbeit weiterentwickelt und für die renommierte KI-Konferenz IJCAI 2025 angenommen.

Obwohl Telex- oder VNI-Eingabe seit Jahrzehnten beliebt ist, weist sie immer noch viele Einschränkungen in der Benutzerfreundlichkeit auf. Daher wurde v7 als leichtgewichtiges Vorhersagetool entwickelt, das dank KI-Integration die Eingabezeit für Vietnamesisch verkürzt.

Leidenschaft für Sprachen und Technologie

Seine Liebe zu Sprachen und Technologie führte ihn dazu, Angewandte Künstliche Intelligenz an der Technischen Universität Ho-Chi-Minh-Stadt zu studieren.

Während seines Studiums arbeitete er an Projekten wie einem großen Sprachmodell (LLM) für Vietnamesisch, einer Software zur Übersetzung von Minderheitensprachen und einem Chatbot zur Unterstützung des Zulassungsverfahrens. „Diese Erfahrungen haben mir geholfen, ein solides Wissensfundament aufzubauen und meine Leidenschaft und meinen Wunsch zu fördern, KI anzuwenden, um nützliche Produkte für die Gesellschaft zu entwickeln“, erklärte er.

KI-integriertes Holzfoto 1

Tri Duc möchte durch den Einsatz von KI im Alltag einen Mehrwert schaffen. Foto: NVCC.

Da Duc Mandarin und Kantonesisch beherrschte, erkannte er den Zusammenhang zwischen Pinyin/Jyutping und der vietnamesischen Rechtschreibung. Dadurch wird auch deutlich, dass im Gegensatz zur Komplexität der Hieroglyphen das chinesische Pinyin-Eingabesystem lediglich die Eingabe von „yn“ erfordert, um den Namen unseres Landes in chinesischen Schriftzeichen zu erhalten. Telex oder VNI hingegen benötigen zehn Tasten, um das Wort „Vietnam“ einzugeben.

Durch seine Beobachtungen erkannte Duc, dass Nutzer bei schneller Kommunikation oft abkürzen, indem sie den ersten Konsonanten beibehalten, wie zum Beispiel „hs“ für „Student“. „Wenn Menschen diesen Schreibstil problemlos verstehen, kann ihn auch eine KI vollständig erfassen, wenn sie mit den richtigen Daten trainiert wird“, sagte er über die Umstände, die zu dieser Idee geführt hatten.

Anstatt wie bei herkömmlichen Eingabegeräten wie Telex oder VNI, die nach dem Additionsprinzip arbeiten, jedes einzelne Zeichen einzugeben und anschließend Akzente hinzuzufügen, nutzt v7 KI, um das gewünschte Wort vorzuschlagen. Die Technologie sagt das vollständige Wort präzise voraus und benötigt dafür nur so wenige Tasten wie möglich.

In der vietnamesischen Rechtschreibung besteht ein Wort aus Anfangskonsonant, Reim und Ton. Beispielsweise setzt sich das Wort „Nguyen“ aus „ng“, „uyen“ und einem fallenden Ton zusammen. Basierend auf diesem Prinzip wurde die v7-Eingabeengine entwickelt, um vollständige Wörter allein anhand von Anfangskonsonant und Ton vorherzusagen. Dies reduziert die Anzahl der Tastenanschläge deutlich, ohne die Genauigkeit zu beeinträchtigen.

Die Herausforderung, KI Vietnamesisch beizubringen

Laut Duc besteht die größte Herausforderung darin, der KI beizubringen, Vietnamesisch zu „verstehen“, um dieses Tipptool nutzen zu können. Er testete viele Modelle, bevor er sich für GPT-2 als Grundlage entschied, dessen Transformers-Architektur ein gutes Kontextverständnis und eine präzise Wortvorhersage ermöglicht.

Nach der Auswahl der zugrundeliegenden Architektur ersetzte Duc den Tokenizer (Vokabularkodierer) vollständig durch ein von ihm selbst entwickeltes vietnamesisches Vokabular. Der Entwickler filterte alle gültigen und korrekt geschriebenen vietnamesischen Wörter heraus, um eine umfassende Verarbeitung zu gewährleisten und jedes vom Benutzer gewünschte Wort vorherzusagen.

Eine weitere Herausforderung besteht darin, Vorhersagegenauigkeit und Reaktionsgeschwindigkeit in Einklang zu bringen. Das Modell muss in Echtzeit auf Computern und Smartphones laufen und gleichzeitig leistungsstark genug sein, um optimale Vorhersagen zu treffen. Nach zwei Monaten kontinuierlicher Tests zeigt die aktuelle Version fast 70 % der eingegebenen Wörter korrekt an erster Stelle an – und das mit einer Latenz von nur 0,03 Sekunden.

Was die Eingabemethode der Tastatur betrifft, so hat Vietnamesisch laut zahlreichen Studien, die Duc von den Linguisten Cao Xuan Hao und Henri Maspero konsultierte, nicht nur sechs, sondern acht Töne. Um diese Besonderheit zu nutzen, verwendet die v7 ein System mit acht Tönen anstelle der üblichen sechs (darunter ein b-Ton und fünf Akzenttöne: Kreuz, b, Frage, fallend und betont). Bei der Eingabe von „v7“ schlägt das Modell auf dieser Tastatur das Wort „Viet“ vor. Dies ist auch die Inspiration für den Produktnamen.

Nachdem Duc Version 7 in seinen sozialen Netzwerken geteilt hatte, zeigte er sich sehr erfreut und überrascht über die Aufmerksamkeit, Unterstützung und das große Interesse, das das Modell erfuhr. „Das hat mir deutlich vor Augen geführt, wie wichtig ein intelligenteres und schnelleres Tool zum Tippen von Vietnamesisch ist“, sagte er.

AI Foto 2 integrierte Holzplatte

Die Autorengruppe des wissenschaftlichen Forschungsartikels. Von links nach rechts: Nhat Khang, Hieu Nghia und Tri Duc. Foto: NVCC.

Die Tastatur befindet sich aktuell noch im Prototypenstadium. Der Quellcode ist auf GitHub als Open Source verfügbar, sodass Programmierer und Anwender ihn testen und dazu beitragen können. Eine vollständige Anwendungsversion für Windows und macOS ist ebenfalls in Entwicklung, um die Installation und Nutzung für Endanwender zu vereinfachen.

Zukünftig liegt der Fokus von Version 7 auf der Tastaturversion für iPhones, um die Eingabe vietnamesischer Texte auf Smartphones zu verbessern. Darüber hinaus wird die Genauigkeit des Modells durch verstärktes Training mit alltäglichen Gesprächsdaten optimiert, wodurch die KI gängige Kontexte besser versteht.

Ducs Werdegang hat zu einem kreativen Aufschwung beigetragen und ihn mit den technologischen Trends Schritt halten lassen, insbesondere angesichts der massiven Investitionen Vietnams in KI-Infrastruktur. Ein Moment, auf den er besonders stolz ist, war, als v7 zum ersten Mal einen vollständigen Satz generierte. „Damals konnte ein kleines Modell, wahrscheinlich nur 1/10.000 so groß wie ChatGPT heute, noch wie ein Mensch denken“, sagte Duc.

Quelle: https://znews.vn/ky-su-tre-dung-ai-thay-doi-cach-go-tieng-viet-post1552246.html


Kommentar (0)

No data
No data

Gleiches Thema

Gleiche Kategorie

Den Sonnenaufgang auf der Insel Co To beobachten
Wandernd zwischen den Wolken von Dalat
Die blühenden Schilffelder in Da Nang ziehen Einheimische und Touristen gleichermaßen an.
'Sa Pa xứ Thanh' mờ ảo trong sương mù

Gleicher Autor

Erbe

Figur

Geschäft

Die Schönheit des Dorfes Lo Lo Chai während der Buchweizenblütezeit

Aktuelle Ereignisse

Politisches System

Lokal

Produkt