Interfaz de la versión 7, teclado con IA integrada. Foto: NVCC . |
En una entrevista con Znews , Tri Thuc (nacido en 2003) habló sobre la idea de aplicar inteligencia artificial para transformar la forma en que se escribe el vietnamita. La herramienta de escritura v7, su proyecto estudiantil, se ha convertido en un artículo de investigación y ha sido aceptada en IJCAI 2025, una prestigiosa conferencia sobre IA.
A pesar de su popularidad durante décadas, la escritura por Telex o VNI aún presenta muchas limitaciones en cuanto a la experiencia del usuario. Por ello, se creó v7, una herramienta predictiva ligera que, gracias a la integración de inteligencia artificial, ayuda a reducir el tiempo de escritura en vietnamita.
Pasión por los idiomas y la tecnología
Su amor por los idiomas y la tecnología lo llevó a especializarse en Inteligencia Artificial Aplicada en la Universidad Tecnológica de Ciudad Ho Chi Minh.
Durante sus estudios, participó en proyectos como un modelo lingüístico a gran escala (LLM) para el vietnamita, un software para traducir lenguas de minorías étnicas y un chatbot para apoyar el proceso de admisión. «Esas experiencias me ayudaron a consolidar una base sólida de conocimientos, a alimentar mi pasión y mi deseo de aplicar la IA para crear productos útiles para la comunidad», compartió.
Tri Duc busca aportar valor a la vida mediante la aplicación de la IA. Foto: NVCC. |
Además, gracias a su conocimiento de mandarín y cantonés, Duc reconoció la correlación entre el pinyin/jyutping y la ortografía vietnamita. Este factor también permite apreciar que, a diferencia de la complejidad de los jeroglíficos, el sistema de escritura pinyin chino solo requiere pulsar «yn» para obtener el nombre de nuestro país en caracteres chinos. En cambio, Telex o VNI requieren diez teclas para escribir la palabra «Vietnam».
A través de sus observaciones, Duc se dio cuenta de que, al comunicarse rápidamente, los usuarios suelen abreviar conservando la primera consonante, como «hs» para «student» (estudiante). «Si los humanos pueden comprender fácilmente este estilo de escritura, la IA puede comprenderlo por completo si se entrena con los datos adecuados», afirmó sobre las circunstancias que dieron origen a la idea.
En lugar de tener que escribir el carácter completo y luego añadir acentos al usar herramientas de mecanografía tradicionales como Telex o VNI, que siguen el mecanismo de suma, v7 utiliza IA para sugerir la palabra que desea escribir. Esta tecnología predice con precisión la palabra completa con el menor número de teclas posible.
En la ortografía vietnamita, una palabra se compone de consonante inicial, rima y tono. Por ejemplo, la palabra «Nguyen» se compone de «ng», «uyen» y un tono descendente. Basándose en este principio, el motor de escritura v7 predice palabras completas con solo la consonante inicial y el tono, lo que reduce significativamente el número de pulsaciones sin sacrificar la precisión.
El desafío de enseñar vietnamita a la IA
Según Duc, el mayor desafío consiste en enseñar a la IA a «entender» el vietnamita para que funcione con esta herramienta de escritura. Probó muchos modelos antes de elegir GPT-2 como base, con arquitectura Transformers para una buena comprensión del contexto y una predicción de palabras precisa.
Tras elegir la arquitectura subyacente, Duc reemplazó por completo el tokenizador (codificador de vocabulario) con un vocabulario vietnamita de su propia creación. El ingeniero filtró todas las palabras vietnamitas válidas y correctamente escritas para garantizar un procesamiento exhaustivo, prediciendo cualquier palabra que el usuario quisiera escribir.
Otro desafío reside en equilibrar el rendimiento predictivo y la velocidad de respuesta, asegurando que el modelo pueda ejecutarse en tiempo real tanto en ordenadores como en teléfonos, y que a la vez sea lo suficientemente potente como para realizar las mejores predicciones. Tras dos meses de pruebas continuas, la versión actual coloca correctamente en primer lugar casi el 70 % de las palabras que escriben los usuarios, con una latencia de tan solo 0,03 segundos.
En cuanto al método de entrada del teclado, según numerosos estudios consultados por Duc de lingüistas como Cao Xuan Hao y Henri Maspero, el vietnamita no solo tiene 6, sino 8 tonos. Para aprovechar esta característica, el v7 utiliza un sistema de 8 tonos en lugar del habitual de 6 (incluyendo un tono llano y 5 tonos acentuados: sostenido, bemol, interrogativo, descendente y fuerte). En este teclado, al escribir «v7», el modelo sugiere la palabra «Viet». Esta es también la idea que inspiró el nombre del producto.
Tras compartir la versión 7 en sus redes sociales, Duc afirmó estar muy contento y sorprendido por la atención, el apoyo y el interés que despertó el modelo. «Eso me dejó claro que hacía falta una herramienta de escritura vietnamita más inteligente y rápida», declaró.
El grupo de autores del artículo de investigación científica . De izquierda a derecha: Nhat Khang, Hieu Nghia y Tri Duc. Foto: NVCC. |
Actualmente, el teclado se encuentra en fase de prototipo, con código fuente abierto en GitHub para que programadores y usuarios de tecnología puedan probarlo y contribuir. También se está desarrollando una versión completa de la aplicación para Windows y macOS, para que los usuarios puedan instalarla y usarla fácilmente.
En el futuro, la máxima prioridad para la versión 7 es la versión con teclado para iPhone, con el fin de mejorar la forma en que se introduce texto en vietnamita en los smartphones. Además, se mejorará la precisión del modelo mediante un mayor entrenamiento con datos de conversaciones cotidianas, lo que ayudará a la IA a comprender mejor los contextos comunes.
La trayectoria de Duc ha impulsado la creatividad, manteniéndose al día con las tendencias tecnológicas en el contexto de la fuerte inversión de Vietnam en infraestructura de IA. Un momento que le llena de orgullo es cuando v7 creó por primera vez una oración completa. "Fue entonces cuando un modelo pequeño, probablemente solo 1/10.000 del tamaño de ChatGPT hoy en día, podía pensar como un humano", afirmó Duc.
Fuente: https://znews.vn/ky-su-tre-dung-ai-thay-doi-cach-go-tieng-viet-post1552246.html






Kommentar (0)