Tras haber trabajado para una gran organización de inteligencia artificial en Estados Unidos, ¿por qué decidiste regresar a Vietnam para unirte a VinBigdata?
Durante mi etapa laboral en Estados Unidos, si bien participé en numerosos proyectos gubernamentales de gran envergadura, los resultados que obtuve a menudo representaban solo unos pocos pasos dentro de un proceso mucho más extenso. En muchas ocasiones, debido a la estricta confidencialidad de los proyectos, ni siquiera sabía cómo se estaban utilizando las soluciones que había desarrollado.
En 2017, cuando regresé a Vietnam, el país se encontraba en fase de desarrollo y existían numerosos problemas relacionados con el big data y la inteligencia artificial que requerían solución. Acepté la invitación del profesor Vu Ha Van para colaborar en el desarrollo de soluciones tecnológicas vietnamitas que mejoraran la vida de los vietnamitas. Mi regreso a Vietnam resultó mucho más significativo, ya que me permitiría trabajar en problemas de mayor impacto.
El Dr. Dao Duc Minh en un taller
En la estrategia de desarrollo de la inteligencia artificial, ¿qué papel e influencia juegan los macrodatos, señor?
Los datos desempeñan un papel fundamental en el entrenamiento de la inteligencia artificial. El entrenamiento de un modelo de inteligencia artificial de alta calidad suele comenzar con el entrenamiento de una base de datos extensa. Por lo tanto, para lograr una inteligencia artificial de calidad, primero necesitamos contar con buenos datos.
Los datos de calidad deben cumplir con estándares en cuanto a cantidad, escala, calidad, variedad y universalidad. El proceso de recopilación y procesamiento de miles de horas de datos, desde la limpieza de datos brutos hasta la creación de datos de la más alta calidad para alimentar modelos de inteligencia artificial, es muy costoso y complejo. En cambio, para analizar macrodatos, necesitamos usar inteligencia artificial para garantizar la capacidad de procesar datos con precisión a gran escala, lo que permite obtener mejores resultados predictivos y decisivos.
Por ejemplo, en el proceso de desarrollo de un producto de asistente virtual para el público vietnamita (ViVi), tuvimos que recopilar y procesar decenas de miles de horas de datos de audio de alta calidad, procedentes de cientos de miles de voces de diferentes regiones, edades y géneros, con contenido que abarcaba cientos de campos...
Más recientemente, lanzamos ViGPT, la primera versión vietnamita de ChatGPT para usuarios finales, desarrollada a partir de un extenso modelo de lenguaje propiedad de VinBigdata. Este modelo se entrenó con 600 GB de datos refinados en vietnamita procedentes de diversos campos. Gracias a nuestro conocimiento del idioma y los datos vietnamitas, encontramos una nueva forma de acelerar el lanzamiento de ViGPT, dejándolo listo tan solo nueve meses después del lanzamiento de ChatGPT.
Esta es la sinergia entre el big data y la inteligencia artificial.
¿Cuál es su opinión sobre la vinculación de la investigación con el valor práctico al servicio de la comunidad?
Creo que la investigación tecnológica solo tiene verdadero éxito cuando entra en la vida cotidiana, resuelve problemas sociales y mejora la vida de las personas.
Para crear productos comerciales prácticos que resuelvan problemas empresariales y sociales, debemos prestar siempre atención y preguntarnos: ¿qué valor aportarán los datos a la vida?
Hasta ahora, hemos investigado y desarrollado una variedad de productos y soluciones para diversas industrias y campos, típicamente ViGPT, VinDr - que proporciona soluciones de IA en diagnóstico por imágenes médicas , VinBase - una plataforma de inteligencia bioartificial, o Vizone - un conjunto de soluciones inteligentes de análisis de imágenes.
Con personal clave de VinBigdata en un evento de Vingroup Corporation
La cuarta revolución industrial se está desarrollando con fuerza a escala mundial. ¿Qué ventajas crees que tiene Vietnam?
En comparación con revoluciones anteriores, creo que Vietnam cuenta actualmente con muchas ventajas para impulsar la revolución industrial 4.0, lo que contribuirá a mejorar la posición del país en el panorama mundial. Las dos claves para lograr este objetivo son los datos y el capital humano.
Vietnam cuenta actualmente con casi 100 millones de habitantes, de los cuales una alta proporción son jóvenes que utilizan teléfonos y ordenadores personales. Además, disponemos de expertos de renombre en inteligencia artificial y de jóvenes profesionales cualificados en tecnologías de la información, así como de una sólida base en matemáticas.
¿Cuáles son, entonces, las limitaciones?
La primera limitación evidente es que, a pesar de contar con una gran población, todavía tenemos dificultades para dominar los datos, específicamente para estandarizar y sincronizar los datos en las instalaciones, unidades comerciales y administrativas.
Además, también nos enfrentamos a otras limitaciones, como la escasez de recursos para la inversión, especialmente en infraestructura informática de alto rendimiento.
En su opinión, ¿qué importancia tiene el dominio de los datos vietnamitas en el proceso de creación y dominio de la tecnología para mejorar la vida de los vietnamitas?
Actualmente existen numerosos productos de IA líderes a nivel mundial, generalmente aplicaciones basadas en grandes modelos de lenguaje como ChatGPT de OpenAI o Bard de Google. Sin embargo, el vietnamita no es el principal grupo lingüístico para el desarrollo de estos productos.
Por lo tanto, la calidad del contenido específico para vietnamitas que se devuelve a los usuarios se ve afectada en mayor o menor medida y tiene una alta probabilidad de contener errores, lo que es más peligroso, errores en conocimientos básicos.
Como vietnamitas, tenemos la ventaja de acceder a nuestras propias fuentes de datos. Solo nosotros podemos comprender las características de los datos vietnamitas, así como las necesidades y características de la población vietnamita. Por lo tanto, dominar los datos vietnamitas es fundamental para dominar las tecnologías clave, aquellas que estarán al servicio de la población vietnamita.
Formación interna para miembros de VinBigdata
¿Cómo acceder a fuentes de datos específicas, especialmente cuando la mayoría de los vietnamitas hoy en día utilizan redes sociales desde el extranjero?
De hecho, la mayor fuente de datos humanos hoy en día (no solo de vietnamitas) se encuentra en internet y las redes sociales. Sin embargo, aún podemos acceder a datos y recopilarlos de diferentes fuentes, basándonos en la comprensión de las características de los datos vietnamitas, según las características establecidas por cada proyecto.
Por ejemplo, los modelos GPT de OpenAI tienen cientos, incluso billones, de parámetros, se entrenan con enormes cantidades de datos y cuestan miles de millones de dólares. En comparación, hemos optado por un camino completamente diferente, basado en nuestra investigación, capacidades y recursos: crear un modelo de lenguaje vietnamita con una arquitectura de tan solo unos pocos miles de millones de parámetros, entrenado con un conjunto de datos de 600 GB que recopilamos y refinamos nosotros mismos, pero con capacidades equivalentes para procesar vietnamita. Los resultados demuestran que nuestra arquitectura, desarrollada internamente, puede autooptimizarse, acortar el tiempo de entrenamiento del modelo, reducir los costos y, al mismo tiempo, garantizar la calidad del modelo.
¿Cuáles son los retos a los que se han enfrentado usted y su equipo en el proceso de investigación y desarrollo de productos de inteligencia artificial?
El primer desafío es, sin duda, el tiempo. La ola de la tecnología de inteligencia artificial avanza a pasos agigantados y se encuentra en pleno auge. A nivel mundial, las empresas tecnológicas líderes han lanzado rápidamente productos muy completos, que actualizan y mejoran constantemente. Si nos demoramos y no lanzamos nuestros productos a tiempo, sin duda nos quedaremos atrás.
Por otro lado, si queremos crear productos que puedan aplicarse y resolver problemas sociales prácticos, también debemos considerar la búsqueda y el desarrollo de las características sobresalientes, especiales y únicas del producto.
Presentación en el Día de la Inteligencia Artificial de Vietnam (AI4VN 2023)
De hecho, muchas personas y organizaciones en Vietnam y en todo el mundo han sufrido grandes pérdidas debido a filtraciones de datos. ¿Cuál es su opinión sobre el tema de la seguridad de los datos?
Se puede afirmar que toda aplicación actual se basa en datos. Al trabajar con datos, por un lado, debemos asegurar que su aplicación contribuya a crear la mejor tecnología para la vida, y por otro, debemos garantizar la seguridad de los datos tanto para las personas como para las organizaciones.
El factor humano es un eslabón fundamental en el proceso de garantía de la seguridad de los datos. Esto incluye a desarrolladores, usuarios del producto y usuarios finales. Para los desarrolladores, la concienciación sobre la seguridad de los datos debe estar presente desde el inicio de la recopilación y el procesamiento de datos.
A menudo, cuando no hay ningún problema, no somos conscientes de la importancia de la seguridad de los datos. Pero si se produce una fuga de datos, el daño puede ser enorme. Las fugas de datos pueden deberse a problemas técnicos o a ataques intencionados para robar información. Cuando se producen fugas de datos, la información de personas u organizaciones puede ser utilizada por delincuentes con fines ilegales, y las empresas pueden sufrir pérdidas económicas para solucionar los problemas derivados, e incluso daños a su reputación.
El Dr. Dao Duc Minh y el equipo de VinBigdata en un evento
Tras la aspiración de dominar la tecnología para servir al pueblo vietnamita, ¿se darán pasos para avanzar a nivel mundial?
Cualquier organización o empresa que desee comercializar sus productos en el mercado internacional debe cumplir con los estándares internacionales. VinBigdata destaca por sus soluciones y tecnología, por lo que aspirar a conquistar el mundo es algo natural.
Por supuesto, para realizar implementaciones en una amplia variedad de productos y aplicaciones, es necesario contar con el apoyo de unidades internacionales con muchos años de experiencia y un profundo conocimiento de los usuarios de todo el mundo.
¡Gracias!
Fuente: https://thanhnien.vn/ts-dao-duc-minh-lam-chu-du-lieu-viet-la-buoc-dau-phat-trien-va-nam-giu-cong-nghe-viet-18524052710263732.htm






Kommentar (0)