El interés mundial por la IA está creciendo, y la mayor parte de la atención se centra en países con muchos de los modelos de IA más avanzados del mundo, como Estados Unidos y China. El sudeste asiático, una de las regiones económicas más importantes del mundo, se está convirtiendo gradualmente en un nuevo foco de interés para la IA, con avances significativos que podrían interesar a los responsables políticos, inversores y expertos en tecnología a nivel mundial.

En Vietnam, el Partido y el Gobierno están decididos a impulsar la era del desarrollo tecnológico del país, como lo demuestra la Resolución 57-NQ/TW sobre avances en el desarrollo científico y tecnológico, la innovación y la transformación digital nacional. Esta orientación ha generado un fuerte incentivo para que las empresas tecnológicas nacionales inviertan y aprovechen el potencial de la tecnología global avanzada.
Actualmente, Vietnam se ha convertido en uno de los pocos países del sudeste asiático que cuenta con un modelo lingüístico de gran tamaño (LLM) propio. Concretamente, desde 2023, Zalo ha entrenado y lanzado con éxito un modelo LLM centrado en el vietnamita, investigado y desarrollado íntegramente por un equipo de ingenieros vietnamitas.
Elige la formación desde el principio y obtén resultados inesperados.
Actualmente, los modelos de IA cuentan con dos técnicas de entrenamiento: la técnica de ajuste fino, que consiste en optimizar modelos LLM previamente entrenados para crear nuevos LLM con fines especializados; y la técnica de entrenamiento de modelos desde cero, que implica la creación de un modelo completamente nuevo, desde la inicialización de parámetros y la decisión sobre la arquitectura del modelo hasta el entrenamiento del algoritmo con un conjunto de datos determinado.
Entre ellas, las técnicas de ajuste fino son las preferidas por muchas empresas debido a sus ventajas, como la facilidad de implementación, el ahorro de recursos y la mejora de la eficiencia. En particular, en el contexto de Vietnam, donde los equipos de capacitación y los datos son limitados, las técnicas de ajuste fino representan una solución superior.
Sin embargo, Zalo optó desde el principio por esta técnica de entrenamiento. Con este método, todo el proceso y el modelo de entrenamiento son propiedad exclusiva de vietnamitas y están bajo su control. Gracias a ello, Vietnam se ha convertido en uno de los pocos países del sudeste asiático que posee un modelo lingüístico de gran envergadura (LLM) desarrollado localmente.
En el momento de su lanzamiento en 2023, el primer modelo de lenguaje a gran escala de Zalo, con 7 mil millones de parámetros centrados en el vietnamita, alcanzó un rendimiento un 150 % superior al de GPT3.5 de OpenAI en la prueba de evaluación comparativa de competencias para el máster en Derecho (LLM) de la Universidad de Vietnam (VMLU). El entrenamiento solo duró 6 meses, mucho menos que los 18 meses previstos inicialmente. Este rápido proceso de entrenamiento sorprendió a todo el equipo de desarrollo de Zalo.

El modelo LLM de Zalo se clasificó en tercer lugar en el desafío Kahoot en su primer lanzamiento en 2023 (Foto: Zalo).
En 2024, el modelo de 13 mil millones de parámetros de Zalo superará a los grandes nombres del mundo para afirmar su posición como los 2 mejores modelos vietnamitas de LLM entrenados desde cero en el ranking de competencias de LLM vietnamitas de VMLU.
Los resultados muestran que el nivel de entrenamiento de los grandes modelos de lenguaje no es inferior al del mundo para desarrollar un modelo de IA propio de Vietnam, especialmente en el contexto de las dificultades iniciales de desarrollo.
Esfuerzos vietnamitas para desarrollar modelos de IA
Un representante de Zalo afirmó que la formación en LLM requiere tres elementos clave: equipamiento, datos y nivel técnico. Anteriormente, en Vietnam, existían numerosas limitaciones en estos tres aspectos. En concreto, mientras que grandes empresas a nivel mundial contaban con miles de las últimas GPU de alto rendimiento de Nvidia, en Vietnam los ingenieros aún no disponían de la infraestructura de servidores necesaria. Asimismo, el vietnamita se encuentra entre los idiomas con menos recursos de datos que el inglés o el chino. Los recursos humanos y la experiencia en formación de LLM en Vietnam también son limitados en comparación con los países desarrollados.
En aquel momento, el equipo de Zalo tuvo que investigar y experimentar con pequeñas GPU civiles para adquirir conocimientos y capacidades de entrenamiento LLM, estando preparados en cuanto estuviera disponible una infraestructura informática de gran escala.
Los chips para entrenamiento de IA son escasos, por lo que, aunque Zalo ha encargado ocho servidores Nvidia DGX H100, no puede disponer de todos los dispositivos a la vez y debe esperar a que el fabricante realice cada lote de entrega. Por lo tanto, optimizar la infraestructura informática incompleta para ahorrar tiempo de entrenamiento es también un problema que el equipo de Zalo debe resolver.
Al mismo tiempo, también se invierte en datos de entrenamiento de calidad para compensar la escasez de fuentes de datos vietnamitas.

“Aunque el punto de partida fue difícil en comparación con las grandes empresas del mundo, Zalo decidió unirse a la carrera con el objetivo de desarrollar con éxito un modelo de IA propio de Vietnam. Consultamos con investigadores e ingenieros de numerosos institutos de investigación líderes en el mundo para contar con una estrategia de desarrollo adecuada.
Los logros alcanzados hasta ahora motivan a los ingenieros de Zalo a seguir optimizando el modelo para que sea más grande y de mejor calidad. Asimismo, buscan aprovechar su aplicabilidad para crear numerosos productos de IA de primer nivel para los usuarios vietnamitas”, compartió el Dr. Nguyen Truong Son, Director de Ciencia de Zalo AI.

Servidor DGX H100 que Zalo encargó a Nvidia (Foto: Zalo).
Gracias a su capacidad de adaptación flexible durante las difíciles etapas iniciales de desarrollo, Zalo ha alcanzado gradualmente hitos importantes, avanzando hacia el dominio de la tecnología global de IA tal como la conocemos hoy.
Actualmente, el modelo de IA de Zalo no solo tiene éxito en términos de investigación y entrenamiento, sino que también se aplica, promoviendo el acceso y la explotación del valor de las nuevas tecnologías avanzadas para el pueblo vietnamita.
A principios de este año, Zalo lanzó el Asistente de Preguntas y Respuestas Kiki Info, que funciona como una Cuenta Oficial (OA) en la plataforma de mensajería de Zalo. El asistente permite responder preguntas sobre diversos temas relacionados con la vida, la creación de contenido y el entretenimiento. Según las estadísticas de Zalo, el Asistente Kiki Info ha alcanzado el millón de usuarios que accedieron a la cuenta OA en Zalo en menos de dos meses.

El modelo LLM de Zalo se aplica para desarrollar Kiki Info Assistant (Foto: Zalo).
Otra aplicación del modelo LLM de Zalo son las tarjetas con IA, que también alcanzaron el hito de 15 millones de tarjetas creadas y enviadas en tan solo dos meses. Esta es una aplicación que interesa a muchos usuarios de Zalo para enviar felicitaciones a familiares y amigos en fechas importantes.
Actualmente, Zalo continúa ampliando y desarrollando aplicaciones basadas en grandes modelos de lenguaje, que prometen aportar muchos valores útiles a los usuarios nacionales.
Fuente: https://dantri.com.vn/cong-nghe/zalo-phat-trien-mo-hinh-ai-do-nguoi-viet-lam-chu-20250616161352610.htm






Kommentar (0)