Interfaz v7, teclado AI integrado. Foto: NVCC . |
Compartiendo con Tri Thuc - Znews , Tri Duc (nacido en 2003) habló sobre la idea de aplicar inteligencia artificial para cambiar la forma en que se ingresa al idioma vietnamita. El proyecto del estudiante, v7, ahora se ha convertido en un artículo de investigación y ha sido aceptado en IJCAI 2025, una prestigiosa conferencia sobre IA.
A pesar de ser popular durante décadas, la mecanización Telex o VNI aún presenta muchas limitaciones en la experiencia del usuario. A partir de ahí, nació v7 para convertirse en una herramienta de predicción liviana, que ayuda a acortar el tiempo de escritura en vietnamita gracias a la integración de IA.
Pasión por los idiomas y la tecnología
Su amor por los idiomas y la tecnología lo llevó a especializarse en Inteligencia Artificial Aplicada en la Universidad Tecnológica de Ciudad Ho Chi Minh.
Durante tus estudios, trabajarás en proyectos como un gran modelo lingüístico (LLM) para vietnamita, un software para traducir lenguas de minorías étnicas o un chatbot para apoyar las admisiones. “Esas experiencias me ayudaron a acumular una base sólida de conocimientos, alimentar mi pasión y el deseo de aplicar la IA para crear productos útiles para la comunidad”, compartió.
Tri Duc quiere aportar valor a la vida aplicando IA. Foto: NVCC. |
Además, con experiencia en mandarín y cantonés, Duc reconoció la correlación del pinyin/jyutping con la ortografía vietnamita. Este factor también te hace ver que en contraste con la complejidad de los jeroglíficos, el sistema de escritura pinyin chino solo requiere ingresar "yn" para obtener el nombre de nuestro país en caracteres chinos. Mientras que Telex o VNI requieren 10 teclas para escribir la palabra "Vietnam".
A través de sus observaciones, Duc se dio cuenta de que cuando se comunican rápidamente, las personas a menudo abrevian conservando la primera consonante, como “hs” para “estudiante”. “Si los humanos pueden entender fácilmente este tipo de escritura, la IA también puede entenderla si se la entrena con los datos adecuados”, dijo sobre las circunstancias en las que surgió la idea.
En lugar de tener que escribir caracteres completos y luego agregar acentos al utilizar herramientas de mecanografía tradicionales como Telex o VNI, que utilizan un mecanismo complementario, v7 utiliza IA para sugerir las palabras que desea escribir. La tecnología predecirá con precisión la palabra completa con la menor cantidad de claves posible.
En la estructura ortográfica vietnamita, una palabra consta de consonante inicial, rima y tono. Por ejemplo, la palabra “Nguyen” se compone de “ng”, “uyen” y el tono descendente. Basándose en este principio, v7 está diseñado para predecir palabras completas solo con consonantes y tonos iniciales, reduciendo significativamente la cantidad de pulsaciones de teclas y manteniendo la precisión.
El desafío de enseñar vietnamita a la IA
Según Duc, la mayor dificultad es enseñar a la IA a "entender" el vietnamita para utilizar esta herramienta de mecanografía. Probó muchos modelos antes de elegir GPT-2 como base, con la arquitectura Transformers para una buena comprensión del contexto y una predicción precisa de palabras.
Después de elegir la arquitectura subyacente, Duc reemplazó completamente el Tokenizer (codificador de vocabulario) con un vocabulario vietnamita creado por él mismo. El ingeniero filtró todas las palabras vietnamitas válidas y correctamente escritas para garantizar un procesamiento exhaustivo y predecir la palabra que el usuario quería escribir.
Otro desafío consiste en equilibrar el rendimiento predictivo y la velocidad de respuesta, garantizando que el modelo pueda ejecutarse en tiempo real tanto en computadoras como en teléfonos, pero que aún sea lo suficientemente potente para realizar las mejores predicciones. Después de 2 meses de pruebas continuas, la versión actual ha llevado casi el 70% de las palabras que los usuarios quieren escribir a la parte superior, con un retraso de solo 0,03 segundos.
En cuanto al método de entrada del teclado, según muchos estudios que Duc consultó de los lingüistas Cao Xuan Hao o Henri Maspero, el vietnamita no solo tiene 6, sino 8 tonos. Para aprovechar esta característica, v7 utiliza un sistema de 8 tonos en lugar de los 6 habituales (incluido un tono plano y 5 tonos acentuados: sostenido, plano, inquisitivo, descendente y pesado). En este teclado, al escribir “v7”, el modelo sugerirá la palabra “vietnamita”. Ésta es también la idea del nombre del producto.
Luego de compartir la v7 en su red social, Duc dijo que estaba muy feliz y sorprendido cuando la modelo recibió atención, apoyo y ganas de experimentarlo. “Eso me dio una idea clara de la necesidad de una herramienta de mecanografía en vietnamita más inteligente y rápida”, dijo.
El grupo de autores del artículo de investigación científica. De izquierda a derecha: Nhat Khang, Hieu Nghia y Tri Duc. Foto: NVCC. |
Actualmente, el teclado aún se encuentra en etapa de prototipo, con código abierto en GitHub para que programadores o usuarios de tecnología puedan probarlo y contribuir. También se está desarrollando una versión completa de la aplicación para Windows y macOS para que el usuario general pueda instalarla y utilizarla fácilmente.
En el futuro, la principal prioridad de la v7 es la versión de teclado en iPhone, para mejorar la forma de ingresar texto vietnamita usando teléfonos inteligentes. Además, la precisión del modelo se mejorará con más entrenamiento con datos de conversaciones cotidianas, lo que ayudará a la IA a comprender mejor los contextos comunes.
El viaje de Alemania ha contribuido a generar un viento creativo, poniéndose al día con las tendencias tecnológicas en el contexto de una fuerte inversión de Vietnam en infraestructura de IA. Un momento que lo hizo sentir orgulloso fue cuando v7 creó una oración completa por primera vez. "Es entonces cuando un modelo pequeño, probablemente sólo 1/10.000 del tamaño de ChatGPT hoy, todavía puede pensar como un humano", dijo Duc.
Fuente: https://znews.vn/ky-su-tre-dung-ai-thay-doi-cach-go-tieng-viet-post1552246.html
Kommentar (0)