[GALERIE] Verwenden Sie kein Vietnamesisch mit KI-Agenten, wenn Sie nicht möchten, dass Ihre Spielsteine verschwinden.
Viele Nutzer von KI-Agenten sind überrascht, wenn sie feststellen, dass die gleiche Aufgabe in Vietnamesisch deutlich mehr Tokens kostet als in Englisch.
Báo Khoa học và Đời sống•29/05/2026
In der KI-Nutzergemeinschaft ist eine große Debatte entbrannt, nachdem viele Nutzer festgestellt hatten, dass die Verwendung von Vietnamesisch oder anderen Sprachen als Englisch dazu führen kann, dass KI-Agenten deutlich mehr Token verbrauchen und ihr gesamtes Nutzungslimit nach nur einer komplexen Sitzung aufbrauchen. Das Problem erregte erstmals Aufmerksamkeit auf Reddit, als ein Claude Pro-Nutzer mitteilte, dass die gleiche Eingabeaufforderung, wenn sie auf Deutsch in Claude Opus 4.7 geschrieben wurde, innerhalb kurzer Zeit das gesamte Token-Limit aufbrauchte, während das Schreiben auf Englisch oder Claude Sonnet deutlich weniger Ressourcen verbrauchte. Laut Erklärungen aus der KI-Community liegt die Ursache nicht in einem Systemfehler, sondern im Tokenisierungsmechanismus. Dieser Prozess zerlegt Texte in einzelne Token-Einheiten, bevor die KI sie verarbeitet. Englisch ist nach wie vor die am besten optimierte Sprache, da sie den Großteil der Trainingsdaten aktueller KI-Modelle ausmacht.
Bei anderen Sprachen wie Deutsch, Französisch oder Vietnamesisch müssen Tokenizer Wörter oft in kleinere Teile zerlegen, was zu einer deutlich höheren Anzahl generierter Token für denselben Inhalt führt. Dies erhöht die Betriebskosten und reduziert die tatsächliche Nutzerzahl. In der Tech-Community wird dieses Phänomen mittlerweile als „Sprach-Token-Steuer“ bezeichnet. Asiatische Sprachen oder Sprachen mit weniger Trainingsdaten sind dabei oft stärker benachteiligt. Schätzungen der Community zufolge verbraucht Vietnamesisch aufgrund seines komplexen Tonsystems und seiner Sonderzeichen potenziell 1,5- bis 2,5-mal so viele Token wie Englisch. Das Problem verschärfte sich nach der Veröffentlichung von Claude Opus 4.7 durch Anthropic, da das Unternehmen bestätigte, dass der neue Tokenizer des Modells den Tokenverbrauch um etwa das 1,0- bis 1,35-Fache erhöhen konnte, sogar im Englischen, während mehrstufige KI-Agentenaufgaben das Modell dazu veranlassten, länger zu "denken" und eine sehr große Menge zusätzlicher Token zu generieren. Dies bedeutet, dass Benutzer, die den KI-Agenten in vietnamesischer Sprache verwenden, um komplexe Aufgaben wie das Lesen von Dokumenten, die Planung, die Datenanalyse oder die Automatisierung mehrerer Schritte zu bewältigen, einen deutlich schnelleren Tokenverbrauch erleben können, obwohl sie die gleiche Abonnementgebühr wie englischsprachige Benutzer zahlen. Viele Experten sind jedoch der Ansicht, dass Nutzer Vietnamesisch bei der Verwendung von KI nicht vollständig aufgeben müssen, da der Unterschied in der Zeichenanzahl bei kurzen Gesprächen oder einfachen Aufgaben nicht allzu groß ist. Bei längeren und komplexen Arbeitsabläufen bleibt das Verfassen von Anweisungen auf Englisch jedoch die praktischste Lösung, um Kosten zu sparen und die Effektivität von KI-Systemen zu maximieren.
Kommentar (0)