Cuando la IA sabe verificar la verdad: Nuevo avance de Viettel AI en NAACL 2025

Pie de foto

VeGraph mejora la precisión entre un 2 y un 5 % en comparación con los métodos existentes.

NAACL 2025 (Conferencia Anual de las Naciones de las Américas Capítulo de la Asociación para la Lingüística Computacional) es el foro científico de prestigio líder a nivel mundial en el campo del procesamiento del lenguaje natural y la lingüística computacional.

Según información de Viettel de la tarde del 16 de mayo, la explosión de internet y las redes sociales ha popularizado el contenido generado por los usuarios. Al mismo tiempo, ha generado una ola de noticias falsas y no oficiales que se propagan ampliamente. Esta información falsa no solo genera confusión en áreas sensibles como la salud, los desastres naturales y las políticas públicas, sino que también conlleva graves consecuencias, como pérdidas económicas, deterioro de la reputación organizacional y amenazas a la seguridad nacional.

“Antes, esta información solo tenía un impacto en un momento y alcance determinados; ahora se vuelve cada vez más peligrosa cuando se incorpora a los datos de entrada de los sistemas de inteligencia artificial (IA). En el proceso de búsqueda y recopilación de información para responder a los usuarios, sistemas como chatbots y asistentes virtuales son totalmente capaces de usar, crear o difundir información falsa si no tienen la capacidad de autoverificarse”, declaró un representante de Viettel.

La verificación de datos es el proceso de verificar la veracidad o falsedad de una información. Por ejemplo, el objetivo de verificar la afirmación «La NASA ha encontrado vida en Marte» es comprobar si la información se basa en hechos publicados mediante fuentes fiables como periódicos, datos científicos o bases de datos. Para autoverificar la información, los sistemas de IA deben ser capaces de comprender la afirmación, encontrar información relevante y extraer conclusiones lógicas basadas en datos objetivos.

VeGraph (Verify-in-the-Graph) es un método de verificación de información investigado, desarrollado y presentado por un equipo de ingenieros de Viettel AI Data Services and Artificial Intelligence Center (Viettel AI) en NAACL 2025, una de las tres conferencias internacionales más prestigiosas sobre procesamiento del lenguaje natural. Los resultados experimentales con dos conjuntos de datos de verificación populares, HoVer y FEVEROUS, muestran que VeGraph mejora la precisión entre un 2 % y un 5 % en comparación con los métodos existentes.

Según los expertos en IA de Viettel, la mayoría de los métodos actuales de verificación de información aún tienen dificultades para gestionar afirmaciones ambiguas, metafóricas o complejas, que a menudo se utilizan para ocultar información falsa. Además, no pueden explicar con claridad por qué un contenido se considera falso, lo que dificulta la confianza de los usuarios en los resultados. Muchos métodos también se basan principalmente en grandes modelos de lenguaje (LLM) sin la capacidad de contrastarlos con fuentes oficiales de conocimiento, lo que conlleva el riesgo de extraer conclusiones falsas, también conocidas como "alucinaciones".

A diferencia de las herramientas que solo realizan inferencias internas dentro del modelo, VeGraph separa proactivamente la solicitud de verificación de información en pequeñas cláusulas y luego la compara con referencias confiables como documentos legales, bases de datos gubernamentales , documentos especializados, etc. Todo el proceso de verificación está sistematizado en pasos claros, lo que facilita la supervisión y la verificación por parte de los usuarios, aumentando la precisión y la transparencia, factores cada vez más importantes en las aplicaciones de IA. Esta función también permite a las organizaciones ajustar y mejorar el sistema rápidamente cuando sea necesario.

Con el objetivo de crear un entorno digital transparente y seguro, VeGraph goza de gran reconocimiento por su aplicación práctica. Además de su capacidad de integración con sistemas de IA para aumentar la precisión y la fiabilidad, esta tecnología puede convertirse en un sistema de verificación de información en diversos ámbitos, como la salud, el periodismo, el derecho o la gestión estatal. Gracias a ello, las personas pueden autoverificar información importante que requiere alta autenticidad, como noticias de actualidad, información sobre medicamentos, vacunas, productos farmacéuticos o normativas legales.

En el futuro, VeGraph se ampliará para manejar diversos formatos de datos, como imágenes, videos, audio, etc., reconocer formas complejas del lenguaje, como metáforas e implicaciones, e incorporar gráficos de conocimiento para mejorar las capacidades de razonamiento.

Este año, NAACL 2025 atrajo un número récord de artículos, superando los 3000, con una tasa de aceptación muy competitiva para los artículos principales (alrededor del 22 %), reuniendo las investigaciones más innovadoras. NAACL 2025 se centra específicamente en avances revolucionarios en el desarrollo de grandes modelos lingüísticos, el procesamiento del lenguaje natural intercultural y multilingüe, las capacidades de inferencia emergentes y la IA responsable.

Según el periódico News and People

Fuente: https://doanhnghiepvn.vn/cong-nghe/khi-ai-biet-kiem-chung-su-that-buoc-tien-moi-tu-viettel-ai-tai-naacl-2025/20250519080205067