Vietnam.vn - Nền tảng quảng bá Việt Nam

Un joven ingeniero usa IA para cambiar la forma de escribir en vietnamita

El software de mecanografía vietnamita integrado con inteligencia artificial es uno de los productos que combina con éxito la creatividad con el conocimiento profesional, con el objetivo de aportar valor práctico a la comunidad.

ZNewsZNews14/05/2025


Interfaz de la versión 7, teclado con IA integrada. Foto: NVCC .

En una entrevista con Tri Thuc - Znews , Tri Duc (nacido en 2003) habló sobre la idea de aplicar inteligencia artificial para cambiar la forma de escribir en vietnamita. La herramienta de mecanografía v7, su proyecto estudiantil, se ha convertido en un artículo de investigación y ha sido aceptado en IJCAI 2025, una prestigiosa conferencia sobre IA.

A pesar de su popularidad durante décadas, la mecanografía por télex o VNI aún presenta muchas limitaciones en la experiencia del usuario. Por ello, la versión 7 nació para convertirse en una herramienta de predicción ligera, que ayuda a reducir el tiempo de escritura en vietnamita gracias a la integración de IA.

Pasión por los idiomas y la tecnología

Su amor por los idiomas y la tecnología lo llevó a especializarse en Inteligencia Artificial Aplicada en la Universidad Tecnológica de Ciudad Ho Chi Minh.

Durante sus estudios, abordó proyectos como un modelo lingüístico extenso (LLM) para vietnamita, un software para traducir lenguas de minorías étnicas o un chatbot para apoyar las admisiones. «Esas experiencias me ayudaron a acumular una sólida base de conocimientos y a alimentar mi pasión y deseo de aplicar la IA para crear productos útiles para la comunidad», compartió.

Foto de madera con IA integrada 1

Tri Duc busca aportar valor a la vida mediante la aplicación de la IA. Foto: NVCC.

Además, con su formación en mandarín y cantonés, Duc reconoció la correlación del pinyin/jyutping con la ortografía vietnamita. Este factor también permite comprender que, a diferencia de la complejidad de los jeroglíficos, el sistema de escritura pinyin chino solo requiere escribir "yn" para obtener el nombre de nuestro país en caracteres chinos. Mientras que el télex o el VNI requieren 10 teclas para obtener la palabra "Vietnam".

A través de sus observaciones, Duc se dio cuenta de que, al comunicarse rápidamente, los usuarios suelen abreviar conservando la primera consonante, como "hs" para "estudiante". "Si los humanos pueden comprender fácilmente este estilo de escritura, la IA puede comprenderlo perfectamente si se entrena con los datos adecuados", comentó sobre las circunstancias que dieron origen a la idea.

En lugar de tener que escribir el carácter completo y luego añadir acentos al usar herramientas de mecanografía tradicionales como Telex o VNI, que siguen el mecanismo de adición, la v7 utiliza IA para sugerir la palabra que desea escribir. La tecnología predecirá con precisión la palabra completa con la menor cantidad de teclas posible.

En la ortografía vietnamita, una palabra se compone de consonante inicial, rima y tono. Por ejemplo, la palabra "Nguyen" se compone de "ng", "uyen" y un tono descendente. Basándose en este principio, el motor de mecanografía v7 está diseñado para predecir palabras completas con solo la consonante inicial y el tono, lo que ayuda a reducir significativamente el número de pulsaciones de teclas, manteniendo la precisión.

El desafío de enseñar vietnamita a la IA

Según Duc, el mayor desafío es enseñar a la IA a "entender" el vietnamita para que funcione con esta herramienta de mecanografía. Probó varios modelos antes de elegir GPT-2 como base, con la arquitectura Transformers para una buena comprensión del contexto y una predicción precisa de palabras.

Tras elegir la arquitectura subyacente, Duc reemplazó por completo el Tokenizador (codificador de vocabulario) con un vocabulario vietnamita creado por él mismo. El ingeniero filtró todas las palabras vietnamitas válidas y correctamente escritas para garantizar un procesamiento exhaustivo, prediciendo cualquier palabra que el usuario quisiera escribir.

Otro desafío radica en equilibrar el rendimiento predictivo y la velocidad de respuesta, garantizando que el modelo pueda ejecutarse en tiempo real tanto en computadoras como en teléfonos, y que al mismo tiempo sea lo suficientemente potente como para realizar las mejores predicciones. Tras dos meses de pruebas continuas, la versión actual muestra correctamente casi el 70 % de las palabras que escriben los usuarios, con una latencia de tan solo 0,03 segundos.

En cuanto al método de entrada del teclado, según numerosos estudios consultados por Duc, de los lingüistas Cao Xuan Hao o Henri Maspero, el vietnamita no solo tiene 6, sino 8 tonos. Para aprovechar esta característica, el v7 utiliza un sistema de 8 tonos en lugar de los 6 habituales (incluyendo un tono bemol y 5 tonos acentuados: sostenido, bemol, interrogativo, descendente y grave). En este teclado, al escribir "v7", el modelo sugerirá la palabra "Viet". Esta es también la idea detrás del nombre del producto.

Tras compartir la versión 7 en sus redes sociales, Duc comentó que estaba muy contento y sorprendido cuando el modelo recibió atención, apoyo y ganas de experimentar. "Eso me hizo comprender la necesidad de una herramienta de mecanografía vietnamita más inteligente y rápida", afirmó.

Tablero de madera integrado con foto 2 de IA

El grupo de autores del artículo de investigación científica . De izquierda a derecha: Nhat Khang, Hieu Nghia y Tri Duc. Foto: NVCC.

Actualmente, el teclado se encuentra en fase de prototipo, con código fuente abierto en GitHub para que programadores o usuarios de tecnología puedan probarlo y contribuir. También se está desarrollando una versión completa de la aplicación para Windows y macOS para que el usuario común la instale y use fácilmente.

En el futuro, la principal prioridad de la versión 7 será la versión de teclado para iPhone, para mejorar la forma en que se introduce texto en vietnamita en los smartphones. Además, se mejorará la precisión del modelo entrenándose más con datos de conversaciones diarias, lo que ayudará a la IA a comprender mejor los contextos comunes.

La trayectoria de Duc ha contribuido a un soplo de creatividad, poniéndose al día con las tendencias tecnológicas en el contexto de la fuerte inversión de Vietnam en infraestructura de IA. Un momento que lo enorgullece es cuando v7 creó por primera vez una oración completa. "Eso fue cuando un modelo pequeño, probablemente de solo una décima parte del tamaño de ChatGPT actual, aún podía pensar como un humano", dijo Duc.

Fuente: https://znews.vn/ky-su-tre-dung-ai-thay-doi-cach-go-tieng-viet-post1552246.html


Kommentar (0)

No data
No data

Mismo tema

Misma categoría

Invierta millones en aprender arreglos florales y encuentre experiencias que fortalezcan su relación durante el Festival del Medio Otoño.
Hay una colina de flores moradas de Sim en el cielo de Son La
Perdido en la caza de nubes en Ta Xua
La belleza de la bahía de Ha Long ha sido reconocida por la UNESCO como patrimonio de la humanidad tres veces.

Mismo autor

Herencia

;

Cifra

;

Negocio

;

No videos available

Actualidad

;

Sistema político

;

Local

;

Producto

;