En el evento del Día de la Inteligencia Artificial de 2023, titulado "IA: Reconstruyendo la Realidad", celebrado los días 5 y 6 de diciembre, VinAI Artificial Intelligence Research and Application Company ( Vingroup ) anunció su proyecto de investigación de código abierto sobre un modelo de lenguaje extenso específicamente para el vietnamita, llamado PhoGPT.
PhoGPT es un proyecto de código abierto, a diferencia del software propietario como ChatGPT de OpenAI. Al ser de código abierto, no tiene limitaciones comerciales; cualquier persona puede usar PhoGPT para desarrollar sus propias aplicaciones, incluso con fines comerciales. En esencia, es una plataforma para la comunidad nacional que desarrolla aplicaciones relacionadas con la IA.
Según el Dr. Bui Hai Hung, director general de VinAI, empresa de investigación y aplicación de inteligencia artificial, las limitaciones de los modelos de lenguaje vietnamita existentes demuestran que no han alcanzado un rendimiento óptimo y carecen de un código fuente abierto. Por lo tanto, una de las tareas urgentes que enfrenta la comunidad de IA en general, y la comunidad de procesamiento del lenguaje natural (PLN) en particular, es construir un modelo nuevo y más potente capaz de procesar el idioma vietnamita con alta precisión y eficiencia.
Los expertos en IA creen que, con un modelo de lenguaje de big data que contiene 7.500 millones de parámetros, construido sobre la plataforma de decodificación Transformer, este modelo fue entrenado desde cero utilizando las técnicas más avanzadas disponibles, como Flash Attention y la extrapolación de la longitud del contexto AliBi.
Estas técnicas no solo ayudan al modelo a comprender mejor el contexto, sino que también mejoran la capacidad de PhoGPT para entablar diálogos e interacciones naturales. Esto convierte al modelo en una herramienta versátil y flexible, capaz de satisfacer las diversas necesidades lingüísticas de sus usuarios.
El Dr. Bui Hai Hung añadió que PhoGPT fue desarrollado desde cero por la empresa, independientemente de todos los demás modelos a nivel mundial . Gracias a su modelo de código abierto, la comunidad en Vietnam puede usarlo y mejorarlo aún más. Al poner el código fuente de PhoGPT a disposición del público y facilitar su acceso, se crea un entorno y una comunidad donde los usuarios pueden desarrollar aplicaciones únicas y personalizadas.
Uno de los objetivos del código abierto es crear una plataforma donde no sea necesario rehacer tareas, permitiendo a las organizaciones seguir desarrollando el modelo de lenguaje PhoGPT. Esto contribuirá a que la sociedad cuente con una comunidad de código abierto de calidad para el modelo de lenguaje vietnamita, generando un efecto positivo que permitirá a muchas empresas participar y aplicarlo en diversos ámbitos. Con PhoGPT, VinAI Artificial Intelligence Research and Application Company ha declarado que planea investigar y desarrollar aplicaciones para usuarios individuales y soluciones de soporte integral para empresas en idioma vietnamita en sectores como la salud y la educación.
PhoGPT ha sentado las primeras bases para el desarrollo de modelos de lenguaje vietnamita de alto rendimiento, sirviendo como base para el desarrollo de aplicaciones prácticas y eficaces que se alineen con la estrategia de desarrollo de IA del Gobierno hasta 2030.
BA TAN
Fuente






Kommentar (0)