Al salir de Estados Unidos para regresar a casa, Nguyen Hoang Quan y sus colegas de VILM desarrollaron un sistema de inteligencia artificial (IA) gratuito para que los vietnamitas lo utilicen en áreas de atención al cliente, con más de cientos de miles de descargas por mes.
En junio de 2023, Nguyen Hoang Quan, de 25 años, y sus colegas Pham Nhut Huy, de 23 años, ingeniero de inteligencia artificial en ZaloAI, y Dao Minh Dung, de 24 años, estudiante de doctorado en la Universidad de Cork, Irlanda, cofundaron la organización sin fines de lucro VILM, con el deseo de ayudar a los vietnamitas a experimentar la tecnología de IA más avanzada de la manera más óptima.
Tras casi seis meses de investigación y aplicación, el equipo desarrolló con éxito tres modelos de IA gratuitos: OpenHermes, VinaLlama y Vistral. Estos estudios son fundamentales para el desarrollo de sistemas de IA capaces de comprender y actuar según las intenciones del usuario (modelo de acción a gran escala). Estos modelos se aplican en campos tecnológicos como el control de máquinas, la robótica para ayudar a personas con discapacidad sin cuidadores, la corrección de errores en los programadores y la atención a clientes en asistentes virtuales o la realización de preguntas gratuitas.
OpenHermes alcanza las 85.000 descargas mensuales, situándose entre los 10 modelos de lenguaje más descargados en HuggingFace ( el sitio web de intercambio de modelos de IA más grande del mundo ). Captura de pantalla .
El modelo OpenHermes es un modelo de lenguaje extenso compatible con el inglés, al igual que ChatGPT, pero con puntuaciones superiores. Permite a los usuarios descargar el modelo a sus ordenadores personales para usarlo sin internet. Cabe destacar que la cantidad de datos de entrenamiento de OpenHermes es solo una centésima parte de los datos de entrenamiento de ChatGPT de OpenAI. Actualmente, esta aplicación recibe más de 50 000 descargas al mes. OpenHermes-2.5 y OpenHermes-2.5-Vision son utilizados por más de 40 startups en Silicon Valley (EE. UU.).
VinaLlama y Vistral son dos modelos de idiomas enfocados en atender al mercado vietnamita, con el objetivo de ayudar a los usuarios nacionales a experimentar la tecnología de inteligencia artificial más avanzada con mayor facilidad.
Hoang Quan estudió durante 7 años en EE. UU. y trabajó en OpenAI como ingeniero de investigación para el modelo de inteligencia artificial ChatGPT, a pesar de no haberse graduado de la universidad. En 2022, trabajó como ingeniero de datos para Microsoft y el producto Bing Chat de OpenAI, ganando miles de dólares. En 2023, ante una ola de despidos en el sector tecnológico en EE. UU., Quan se dio cuenta de que el mercado laboral tras la graduación era muy desalentador, pero al ver oportunidades en Vietnam, decidió regresar a casa.
Nguyen Hoang Quan. Foto de : NVCC
En VILM, Quan es el ingeniero jefe responsable de la investigación de técnicas de mejora de datos y del entrenamiento de IA. Nhut Huy se encarga de la investigación técnica en el entrenamiento de IA, y Minh Dung propone nuevos métodos de investigación teórica.
Quan explicó que los grandes modelos de lenguaje actuales, como ChatGPT (Gran Modelo de Lenguaje), solo pueden proporcionar salida de texto, mientras que los humanos tienen muchas maneras de comunicarse y adquirir conocimiento. Por ello, el equipo busca crear un sistema que pueda operar con flexibilidad entre diferentes tipos de entrada y salida (que pueda recibir y emitir diferentes tipos de datos, como lenguaje, imágenes, vídeos y sonidos), sin limitarse al nivel del lenguaje.
Para lograr el objetivo de crear Modelos de Acción de Gran Tamaño, el equipo tuvo que superar dos problemas: seguridad y velocidad. Las aplicaciones de IA actuales utilizan principalmente datos de usuario y los envían a servidores de empresas como OpenAI para su procesamiento, lo que plantea problemas de seguridad. El equipo se centró en crear modelos de IA lo suficientemente pequeños y rápidos como para procesarse directamente en dispositivos móviles, buscando un equilibrio entre rendimiento y velocidad para no afectar la experiencia del usuario.
El equipo experimental utilizó datos generados por la IA para entrenarla, en lugar de optar por usar datos de fuentes reales. Inicialmente, tuvieron dificultades para encontrar recursos computacionales (computadoras para entrenar la IA), pero posteriormente convencieron a grandes empresas y laboratorios de todo el mundo para que los patrocinaran.
Quan afirmó que el objetivo principal de crear estos productos es facilitar el acceso a aplicaciones de IA de forma rápida y con una calidad comparable a la de ChatGPT o Bing Chat, y simplificar la investigación y la creación de modelos de IA en el futuro. En lugar de usar ChatGPT, cuya disponibilidad es limitada en el idioma y la cultura vietnamitas, las empresas vietnamitas pueden descargar VinaLlama en vietnamita.
El modelo de lenguaje VinaLlama resuelve fácilmente un problema matemático en vietnamita. En la imagen se muestra una demostración del producto VinaLlama resolviendo problemas matemáticos. Captura de pantalla.
El Sr. Dang Hai Loc, fundador de Mindmaid, plataforma de desarrollo de chatbots de IA, afirmó que, desde la perspectiva de un desarrollador de aplicaciones de IA, se dio cuenta de que el costo y la privacidad de los datos son los dos aspectos que más preocupan a las empresas al implementar aplicaciones de IA. La solución más satisfactoria a este problema son los modelos LLM de código abierto, que pueden ejecutarse en la infraestructura de la empresa y optimizar sus propios datos. Por lo tanto, los modelos LLM vietnamitas de código abierto, como VinaLlama y Vistral, son muy valiosos para promover las aplicaciones de IA en Vietnam.
"Estos modelos de código abierto también permiten que más programadores y entusiastas de la tecnología accedan al campo de la ingeniería de IA con solo una MacBook, en lugar de tener que invertir en costosas infraestructuras de GPU (tarjetas gráficas). Esto también impulsará la fuerza de ingenieros de IA en Vietnam, un puesto muy demandado en el futuro próximo", afirmó el Sr. Loc.
Según Quan, los vietnamitas poseen una sólida base en teoría científica , son expertos en IA y ChatGPT cuenta con recursos humanos que participan en la investigación. Sin embargo, les resulta más difícil adaptarse rápidamente a la constante evolución de la tecnología. "Lo que necesitan los vietnamitas es experiencia en la creación de productos para que los usuarios finales comprendan plenamente los problemas que enfrentan y así orientar adecuadamente su investigación", explicó Quan sobre la razón para investigar modelos de IA gratuitos para apoyar a los vietnamitas en el ámbito tecnológico. Añadió que ha colaborado con numerosos grupos internacionales y que siempre está dispuesto a colaborar con los grupos de investigación en Vietnam.
Nhu Quynh
[anuncio_2]
Enlace de origen
Kommentar (0)