[GALERIE] N'utilisez pas le vietnamien avec les agents IA si vous ne voulez pas que vos jetons disparaissent.
De nombreux utilisateurs d'agents IA sont surpris de constater que la même tâche coûte beaucoup plus de jetons lorsqu'elle est écrite en vietnamien qu'en anglais.
Báo Khoa học và Đời sống•29/05/2026
Un débat majeur a éclaté au sein de la communauté des utilisateurs d'IA après que de nombreux comptes ont constaté que l'utilisation du vietnamien ou d'autres langues que l'anglais pouvait entraîner une consommation beaucoup plus importante de jetons par les agents d'IA, allant même jusqu'à épuiser leur limite d'utilisation après une seule session complexe. Le problème a commencé à attirer l'attention sur Reddit lorsqu'un utilisateur de Claude Pro a partagé que la même invite, lorsqu'elle était écrite en allemand sur Claude Opus 4.7, consommait la totalité de la limite de jetons en peu de temps, tandis que l'écriture en anglais ou dans Claude Sonnet consommait beaucoup moins de ressources. D'après les explications de la communauté de l'IA, la cause n'est pas une erreur système, mais un problème lié au mécanisme de tokenisation, c'est-à-dire le processus par lequel l'IA décompose le texte en unités de jetons pour le traitement avant l'inférence. L'anglais reste la langue la plus optimisée car elle représente la majorité des données d'entraînement des modèles d'IA actuels.
Avec d'autres langues comme l'allemand, le français ou le vietnamien, les analyseurs lexicaux doivent souvent décomposer les mots en segments plus petits pour le traitement, ce qui génère un nombre considérablement plus élevé de jetons pour un même contenu. Cela augmente les coûts d'exploitation et réduit le nombre d'utilisateurs effectifs. La communauté technique appelle désormais ce phénomène la « taxe sur les jetons linguistiques », où les langues asiatiques ou les langues disposant de moins de données d'entraînement sont souvent davantage désavantagées, et le vietnamien consommerait potentiellement 1,5 à 2,5 fois plus de jetons que l'anglais en raison de son système complexe de tons et de caractères spéciaux. Le problème s'est aggravé après la sortie de Claude Opus 4.7 par Anthropic, la société ayant confirmé que le nouveau tokenizer du modèle pouvait augmenter la consommation de tokens d'environ 1,0 à 1,35 fois, même en anglais, tandis que les tâches d'agent IA en plusieurs étapes amenaient le modèle à « réfléchir » plus longtemps et à générer une très grande quantité de tokens supplémentaires. Cela signifie que les utilisateurs qui utilisent l'agent IA en vietnamien pour gérer des tâches complexes telles que la lecture de documents, la planification, l'analyse de données ou l'automatisation de plusieurs étapes peuvent constater une consommation de jetons beaucoup plus rapide, même s'ils paient le même abonnement que les utilisateurs anglophones. Cependant, de nombreux experts estiment que les utilisateurs n'ont pas besoin d'abandonner complètement le vietnamien lorsqu'ils utilisent l'IA, car pour les conversations courtes ou les tâches simples, la différence linguistique est minime. En revanche, pour les flux de travail longs et complexes, la rédaction des instructions en anglais reste la solution la plus pratique pour réduire les coûts et optimiser l'efficacité des agents d'IA.
Comment (0)