En el evento del Día de la Inteligencia Artificial 2023 con el tema "IA: reconstruyendo la realidad", que tuvo lugar los días 5 y 6 de diciembre, VinAI Artificial Intelligence Research and Application Company ( Vingroup Corporation) anunció un proyecto de investigación de código abierto sobre un gran modelo de lenguaje para el vietnamita, PhoGPT.
PhoGPT es un proyecto de código abierto, a diferencia de ChatGPT de OpenAI, que es un software propietario. Al ser de código abierto, no tiene limitaciones comerciales, lo que permite a cualquier usuario desarrollar sus propias aplicaciones, incluso con fines comerciales. En otras palabras, funciona como una plataforma para la comunidad que desarrolla aplicaciones relacionadas con la tecnología de IA en el país.
Según el Dr. Bui Hai Hung, Director General de VinAI, empresa de investigación y aplicación de inteligencia artificial, las limitaciones de los modelos de lenguaje vietnamita demuestran que estos modelos no alcanzan un rendimiento óptimo y carecen de un código fuente abierto. Por lo tanto, una de las tareas urgentes para la comunidad de IA en general, y para la comunidad de procesamiento del lenguaje natural (PLN) en particular, es desarrollar un modelo nuevo y más potente capaz de procesar el vietnamita con alta precisión y rendimiento.
Los expertos en IA afirman que, con un modelo de lenguaje de big data con 7.500 millones de parámetros, construido sobre la plataforma de decodificación Transformer, este modelo se entrena desde cero, utilizando las técnicas más avanzadas disponibles, como el mecanismo Flash Attention y la extrapolación de longitud de contexto AliBi...
Estas técnicas no solo ayudan al modelo a comprender mejor el contexto, sino que también mejoran las capacidades de diálogo e interacción natural de PhoGPT. Esto convierte al modelo en una herramienta versátil y flexible, capaz de satisfacer las necesidades lingüísticas de una amplia gama de usuarios.
El Dr. Bui Hai Hung añadió que PhoGPT fue desarrollado por la empresa desde sus inicios, de forma independiente a todos los demás modelos del mundo . Gracias a su modelo de código abierto, la comunidad vietnamita puede utilizarlo y mejorarlo. Hacer público el código fuente de PhoGPT y ponerlo a disposición de los usuarios contribuye a crear un entorno donde la comunidad puede desarrollar aplicaciones personalizadas y únicas.
Uno de los objetivos del código abierto es sentar las bases para que las personas no tengan que dedicar tiempo a rehacer el trabajo, y así las unidades puedan desarrollar modelos de lenguaje más complejos como PhoGPT. Esto contribuirá a que la sociedad cuente con una comunidad de código abierto de calidad para modelos de lenguaje vietnamita de gran tamaño, lo que generará un impacto positivo y permitirá que muchas empresas participen y apliquen sus soluciones en diversos campos. VinAI, empresa de investigación y aplicación de inteligencia artificial, anunció que, con PhoGPT, planea investigar y desarrollar aplicaciones para usuarios individuales y un paquete de soluciones de soporte especializadas para empresas en vietnamita en sectores como la salud y la educación, entre otros.
PhoGPT ha sentado las primeras bases para el desarrollo de modelos de lenguaje vietnamita de alto rendimiento, como base para el desarrollo de aplicaciones prácticas y efectivas, en línea con la estrategia de desarrollo de IA del Gobierno hasta 2030.
BA TAN
Fuente






Kommentar (0)