Vietnam.vn - Nền tảng quảng bá Việt Nam

Dos estudiantes varones publican investigación en la conferencia de IA más importante del mundo

VnExpressVnExpress12/02/2024

[anuncio_1]

Utilizando métodos de entrenamiento adversarial para permitir que la IA genere nuevos datos, la investigación de dos estudiantes de la Universidad Tecnológica de la ciudad de Ho Chi Minh se publicó en AAAI, la conferencia de IA líder a nivel mundial .

La investigación sobre modelos multilingües para entrenar a la IA en la creación de sinónimos, realizada por Pham Khanh Trinh y Le Minh Khoi, de 23 años, fue publicada en los documentos de la Conferencia AAAI-24 sobre Inteligencia Artificial, celebrada a finales de febrero en Vancouver, Canadá.

El profesor asociado, Dr. Quan Thanh Tho, vicedecano de la Facultad de Ciencias de la Computación e Ingeniería de la Universidad Tecnológica de la ciudad de Ho Chi Minh, calificó esto como un resultado encomiable. El Sr. Tho dijo que los investigadores y expertos consideran que la AAAI es de máxima calidad en las conferencias científicas en los campos de la informática y la inteligencia artificial, con una tasa de aceptación de artículos muy baja, este año del 23,75%.

Minh Khoi y Khanh Trinh (en el centro) durante la defensa de su tesis de graduación, 2023. Foto: Proporcionada por el personaje.

Minh Khoi y Khanh Trinh (en el centro) durante la defensa de su tesis de graduación, 2023. Foto: Proporcionada por el personaje.

Al compartir la pasión por el aprendizaje profundo y el procesamiento del lenguaje natural, Trinh y Khoi decidieron investigar en modelos de lenguaje grandes (LLM). Ambos querían descubrir las limitaciones de los LLM y mejorarlos.

Khanh Trinh dijo que es necesario entrenar a Chat GPT o LLM con una gran cantidad de datos de texto para generar respuestas precisas y diversas para los usuarios. Los dos chicos se dieron cuenta de que con idiomas menos comunes, como el hindi, el kazajo o el indonesio, los exámenes GPT y LLM a menudo daban resultados inesperados porque no habían estudiado mucho esos idiomas o no tenían suficientes datos para que los aprendieran.

"¿Por qué no creamos más datos de texto a partir de los 'pequeños recursos' de esos idiomas para entrenar aún más la IA?", preguntaron los dos estudiantes varones. A partir de ahí, nació el modelo LAMPAT (Adaptación de bajo rango para paráfrasis multilingüe mediante entrenamiento adversarial), un método de paráfrasis multilingüe que utiliza entrenamiento adversarial investigado por Trinh y Khoi.

LAMPAT es capaz de generar una oración sinónima a partir de una oración de entrada existente, para generar datos de texto adicionales. La explicación del “entrenamiento adversarial” es un enfoque relativamente nuevo para entrenar modelos lingüísticos de gran tamaño. Cuando se le da una oración de entrada, con los métodos de entrenamiento tradicionales, la aplicación genera una oración de salida. Pero con el entrenamiento adversarial, la aplicación puede autocorregirse, editar la oración de salida y "jugar contra sí misma" para generar más oraciones.

El multilingüismo de LAMPAT radica en que el modelo integra 60 idiomas al mismo tiempo. Basándose en los conjuntos de datos recopilados, el equipo continuó entrenando a LAMPAT para generar oraciones sinónimas. La cantidad de datos de texto generados a partir de LAMPAT continuará siendo entrenada para los LLM de modo que estos modelos puedan aprender muchas formas diferentes de expresar información para el mismo contenido, dando así respuestas diversas con mayor probabilidad de ser correctas. Con esta característica, el representante del equipo cree que LAMPAT se puede integrar en aplicaciones como ChatGPT para perfeccionar aún más este modelo.

Además, la falta de datos para Chat GPT o LLMs obliga a algunas empresas a buscar muchas fuentes externas como libros, periódicos, blogs,... sin prestar atención a las cuestiones de derechos de autor. Según Khanh Trinh, la creación de sinónimos también es una forma de limitar el plagio y la violación de derechos de autor.

Nam Sinh dio un ejemplo de aplicaciones como Chat GPT, cuando un usuario solicita un resumen de un texto existente A, la aplicación generará un texto resumen B. Si se integra el método de investigación del grupo, al recibir el texto A, la aplicación generará múltiples textos con el mismo contenido A1, A2, A3 basado en el mecanismo de generación de sinónimos, a partir de los cuales resumirá el texto y producirá muchos resultados para que el usuario elija.

Durante las primeras etapas de la investigación, el equipo tuvo dificultades para preparar datos de evaluación para 60 idiomas. Como no pudimos acceder a una cantidad suficiente de datos, el equipo compiló un conjunto de datos diverso y completo en 13 idiomas para evaluar objetivamente el modelo, incluidos: vietnamita, inglés, francés, alemán, ruso, japonés, chino, español, húngaro, portugués, sueco, finlandés y checo. Este también es un conjunto de datos confiable para el paso final de evaluación humana (puntuación).

Minh Khoi (izquierda) y Khanh Trinh (derecha) se tomaron una foto de recuerdo con el maestro Quan Thanh Tho el día de su graduación, en noviembre de 2023. Foto: Personaje proporcionado.

Minh Khoi (izquierda) y Khanh Trinh (derecha) se tomaron una foto de recuerdo con el maestro Quan Thanh Tho el día de su graduación, en noviembre de 2023. Foto: Personaje proporcionado.

Para cada uno de los idiomas inglés, vietnamita, alemán, francés y japonés, el equipo extrajo aleatoriamente 200 pares de oraciones (cada par consistía en la oración de salida y la etiqueta correcta) para su evaluación. Para cada uno de los idiomas mencionados anteriormente, el equipo pidió a cinco expertos en idiomas que los calificaran de forma independiente, basándose en tres criterios: conservación semántica; elección de palabras y similitud de vocabulario, fluidez y coherencia de la oración de salida. La escala se calcula del 1 al 5. Como resultado, la puntuación media de evaluación de los expertos en idiomas en estos 5 idiomas oscila entre 4,2 y 4,6/5 puntos.

El ejemplo da un par de oraciones vietnamitas que tienen una puntuación de 4,4/5, en las que la oración de entrada es: "Explicó el problema en detalle" y la oración de salida es: "Explicó el problema en detalle".

Pero también hay pares de oraciones con mala calidad y errores semánticos, como el par de oraciones "Comemos mientras la sopa está caliente - Comemos la sopa mientras estamos calientes", que solo obtiene 2/5 puntos.

Khanh Trinh dijo que tomó ocho meses investigar y completar este proyecto. Éste es también el tema de tesis de Trinh y Khoi. Tesis clasificada en primer lugar en el Consejo de Ciencias de la Computación 2 con 9,72/10 puntos.

Según el Sr. Quan Thanh Tho, si bien LAMPAT ha demostrado su capacidad para generar frases sinónimas con apariencia humana en varios idiomas, aún necesita mejorar para manejar modismos, canciones populares y proverbios en diferentes idiomas.

Además, el conjunto de datos de evaluación del equipo sólo incluye 13 idiomas, lo que todavía deja fuera a muchos, especialmente los idiomas minoritarios. Por lo tanto, el grupo necesita realizar investigaciones para mejorar y ampliar las capacidades de los modelos actuales de interpretación multilingüe. Desde aquí podemos eliminar las barreras lingüísticas entre países y pueblos.

A finales de 2023, Trinh y Khoi se graduaron con una licenciatura en Ciencias de la Computación con honores y distinción, con un promedio de calificaciones (GPA) de 3.7 y 3.9/4, respectivamente. Ambos planean estudiar en el extranjero para obtener una maestría y realizar investigaciones en inteligencia artificial y aprendizaje automático.

"Seguimos investigando este tema con el objetivo de aplicar más LAMPAT a futuros proyectos científicos y crear un producto multilingüe confiable para los usuarios", afirmó Trinh.

Le Nguyen


[anuncio_2]
Enlace de origen

Kommentar (0)

No data
No data

Mismo tema

Misma categoría

El Festival Internacional de Fuegos Artificiales de Da Nang 2025 (DIFF 2025) es el más largo de la historia
Cientos de coloridas bandejas de ofrendas vendidas con motivo del Festival Duanwu
La playa infinita de Ninh Thuan es más hermosa hasta finales de junio, ¡no te la pierdas!
El color amarillo de Tam Coc

Mismo autor

Herencia

Cifra

Negocio

No videos available

Noticias

Sistema político

Local

Producto