Vietnam.vn - Nền tảng quảng bá Việt Nam

Junger Ingenieur verändert mithilfe von KI die Schreibweise Vietnamesisch

Die KI-integrierte vietnamesische Tippsoftware ist eines der Produkte, das Kreativität erfolgreich mit Fachwissen verbindet und darauf abzielt, der Community einen praktischen Mehrwert zu bieten.

Zing NewsZing News12/05/2025

v7-Schnittstelle, integrierte KI-Tastatur. Foto: NVCC .

Im Gespräch mit Tri Thuc – Znews sprach Tri Duc (Jahrgang 2003) über die Idee, künstliche Intelligenz einzusetzen, um die Art und Weise zu ändern, wie Vietnamesisch eingegeben wird. Das Projekt v7 des Studenten hat sich inzwischen zu einer Forschungsarbeit entwickelt und wurde bei IJCAI 2025, einer renommierten Konferenz zum Thema KI, angenommen.

Obwohl Telex- oder VNI-Eingabeverfahren seit Jahrzehnten beliebt sind, sind sie hinsichtlich der Benutzerfreundlichkeit noch immer mit zahlreichen Einschränkungen behaftet. Von da an wurde v7 zu einem leichtgewichtigen Vorhersagetool, das dank KI-Integration dazu beiträgt, die Tippzeit für Vietnamesisch zu verkürzen.

Leidenschaft für Sprachen und Technologie

Seine Liebe zu Sprachen und Technologie führte ihn zum Hauptfach Angewandte Künstliche Intelligenz an der Technischen Universität Ho-Chi-Minh-Stadt.

Während Ihres Studiums arbeiten Sie an Projekten wie einem großen Sprachmodell (LLM) für Vietnamesisch, einer Software zur Übersetzung von Sprachen ethnischer Minderheiten oder einem Chatbot zur Unterstützung der Zulassung. „Diese Erfahrungen haben mir geholfen, ein solides Fundament an Wissen aufzubauen und meine Leidenschaft und meinen Wunsch zu fördern, KI anzuwenden, um nützliche Produkte für die Community zu schaffen“, erzählte er.

Bo go tich hop AI anh 1

Tri Duc möchte durch die Anwendung von KI einen Mehrwert für das Leben schaffen. Foto: NVCC.

Da Duc außerdem Kenntnisse in Mandarin und Kantonesisch hatte, erkannte er die Korrelation zwischen Pinyin/Jyutping und der vietnamesischen Rechtschreibung. Dieser Faktor macht auch deutlich, dass im Gegensatz zur Komplexität der Hieroglyphen beim chinesischen Pinyin-Schreibsystem lediglich die Eingabe von „yn“ erforderlich ist, um den Namen unseres Landes in chinesischen Schriftzeichen zu erhalten. Während bei Telex oder VNI 10 Tasten erforderlich sind, um das Wort „Vietnam“ einzugeben.

Durch seine Beobachtungen stellte Duc fest, dass Menschen bei schneller Kommunikation häufig Abkürzungen vornehmen, indem sie den ersten Konsonanten beibehalten, wie beispielsweise „hs“ für „Student“. „Wenn Menschen diese Art von Schrift problemlos verstehen können, kann KI sie durchaus verstehen, wenn sie mit den richtigen Daten trainiert wird“, sagte er über die Umstände, unter denen die Idee entstand.

Anstatt bei der Verwendung herkömmlicher Schreibwerkzeuge wie Telex oder VNI, die einen zusätzlichen Mechanismus verwenden, ganze Buchstaben schreiben und dann Akzente hinzufügen zu müssen, schlägt v7 mithilfe von KI die Wörter vor, die Sie schreiben möchten. Die Technologie kann das vollständige Wort mit möglichst wenigen Tastendrücken genau vorhersagen.

In der vietnamesischen Rechtschreibstruktur besteht ein Wort aus Anfangskonsonanten, Reim und Ton. Beispielsweise besteht das Wort „Nguyen“ aus „ng“, „uyen“ und dem fallenden Ton. Basierend auf diesem Prinzip ist v7 so konzipiert, dass es vollständige Wörter nur mit Anfangskonsonanten und -tönen vorhersagt, wodurch die Anzahl der Tastenanschläge bei gleichbleibender Genauigkeit erheblich reduziert wird.

Die Herausforderung, KI Vietnamesisch beizubringen

Laut Duc besteht die größte Schwierigkeit darin, der KI beizubringen, Vietnamesisch zu „verstehen“, um dieses Tipptool zu nutzen. Er probierte viele Modelle aus, bevor er sich für GPT-2 als Grundlage entschied, mit Transformers-Architektur für gutes Kontextverständnis und genaue Wortvorhersage.

Nachdem Duc die zugrunde liegende Architektur ausgewählt hatte, ersetzte er den Tokenizer (Vokabular-Encoder) vollständig durch ein von ihm selbst erstelltes vietnamesisches Vokabular. Der Ingenieur filterte alle gültigen, richtig geschriebenen vietnamesischen Wörter heraus, um eine umfassende Verarbeitung zu gewährleisten und jedes Wort vorherzusagen, das der Benutzer schreiben wollte.

Eine weitere Herausforderung besteht darin, ein Gleichgewicht zwischen Vorhersageleistung und Reaktionsgeschwindigkeit herzustellen und sicherzustellen, dass das Modell sowohl auf Computern als auch auf Mobiltelefonen in Echtzeit ausgeführt werden kann, aber dennoch leistungsstark genug ist, um die besten Vorhersagen zu treffen. Nach zwei Monaten kontinuierlicher Tests hat die aktuelle Version fast 70 % der Wörter, die Benutzer eingeben möchten, mit einer Verzögerung von nur 0,03 Sekunden an die Spitze gebracht.

Was die Eingabemethode über die Tastatur betrifft, so hat Vietnamesisch laut zahlreichen Studien, die Duc von den Linguisten Cao Xuan Hao oder Henri Maspero konsultierte, nicht nur 6, sondern 8 Töne. Um diese Funktion zu nutzen, verwendet v7 ein 8-Ton-System anstelle der üblichen 6 (einschließlich eines flachen Tons und 5 betonten Tönen: scharf, flach, fragend, fallend, schwer). Wenn Sie auf dieser Tastatur „v7“ eingeben, schlägt das Modell das Wort „Vietnamesisch“ vor. Dies ist auch die Idee hinter dem Produktnamen.

Nachdem er v7 in seinem sozialen Netzwerk geteilt hatte, sagte Duc, dass er sehr glücklich und überrascht war, als das Modell Aufmerksamkeit, Unterstützung und den Wunsch erhielt, es auszuprobieren. „Dadurch wurde mir klar, dass ich ein intelligenteres und schnelleres vietnamesisches Tipptool brauche“, sagte er.

Bo go tich hop AI anh 2

Die Autorengruppe des wissenschaftlichen Forschungsartikels. Von links nach rechts: Nhat Khang, Hieu Nghia und Tri Duc. Foto: NVCC.

Derzeit befindet sich die Tastatur noch im Prototypstadium und der Open-Source-Code ist auf GitHub verfügbar, sodass Programmierer oder Technologiebenutzer ihn testen und Beiträge leisten können. Außerdem wird eine vollständige Anwendungsversion für Windows und macOS entwickelt, die eine einfache Installation und Verwendung durch den allgemeinen Benutzer ermöglicht.

Die höchste Priorität für v7 hat künftig die Tastaturversion für das iPhone, um die Eingabe vietnamesischer Texte mithilfe von Smartphones zu verbessern. Darüber hinaus wird die Genauigkeit des Modells durch weiteres Training mit alltäglichen Gesprächsdaten verbessert, wodurch die KI gängige Kontexte besser versteht.

Deutschlands Vorstoß hat dazu beigetragen, einen kreativen Wind zu wehen und mit den Technologietrends Schritt zu halten, während Vietnam massiv in die KI-Infrastruktur investiert. Ein Moment, der ihn stolz machte, war, als v7 zum ersten Mal einen vollständigen Satz bildete. „Das ist der Zeitpunkt, an dem ein kleines Modell, wahrscheinlich nur 1/10.000 der Größe des heutigen ChatGPT, immer noch wie ein Mensch denken kann“, sagte Duc.

Quelle: https://znews.vn/ky-su-tre-dung-ai-thay-doi-cach-go-tieng-viet-post1552246.html


Kommentar (0)

No data
No data

Erbe

Figur

Geschäft

No videos available

Nachricht

Politisches System

Lokal

Produkt