NAACL 2025 (Conferencia Anual de las Naciones de las Américas Capítulo de la Asociación para la Lingüística Computacional) es el foro científico de prestigio líder a nivel mundial en el campo del procesamiento del lenguaje natural y la lingüística computacional.
Según información de Viettel en la tarde del 16 de mayo, la explosión de Internet y las redes sociales ha hecho que el contenido generado por los usuarios sea cada vez más popular; Al mismo tiempo, conduce a una ola de noticias falsas y noticias no oficiales que se difunden ampliamente. Esta información falsa no sólo causa confusión a las personas en áreas sensibles como la salud, desastres naturales, políticas públicas, etc., sino que también conlleva graves consecuencias como: daños económicos, pérdida de reputación organizacional y amenazas a la seguridad nacional.
“Antes, esta información solo tenía un impacto en un momento y alcance determinados; ahora se vuelve cada vez más peligrosa cuando se incorpora a los datos de entrada de los sistemas de inteligencia artificial (IA). En el proceso de búsqueda y recopilación de información para responder a los usuarios, sistemas como chatbots y asistentes virtuales son totalmente capaces de usar, crear o difundir información falsa si no tienen la capacidad de autoverificarse”, declaró un representante de Viettel.
La verificación de hechos es el proceso de verificar la veracidad o falsedad de una pieza de información. Por ejemplo, ¿el objetivo de verificar la afirmación “La NASA ha encontrado vida en Marte” es comprobar si esta información se basa en hechos publicados? a través de fuentes confiables como periódicos, datos científicos o bases de conocimiento. Para autoverificar la información, los sistemas de IA deben poder comprender oraciones, encontrar información relevante y sacar conclusiones lógicas basadas en datos objetivos.
VeGraph (Verify-in-the-Graph) es un método de verificación de información investigado, desarrollado y presentado por un equipo de ingenieros de Viettel Data Services and Artificial Intelligence Center (Viettel AI) en NAACL 2025, una de las 3 conferencias internacionales más prestigiosas sobre procesamiento del lenguaje natural. Los resultados experimentales en dos conjuntos de datos de validación populares, HoVer y FEVEROUS, muestran que VeGraph mejora la precisión entre un 2 y un 5 % en comparación con los métodos existentes.
Según los expertos de Viettel AI, la mayoría de los métodos actuales de verificación de información aún tienen dificultades para gestionar declaraciones ambiguas, metafóricas o de múltiples capas, que a menudo se utilizan para "camuflar" información falsa; Al mismo tiempo, no es posible explicar claramente por qué un contenido se califica como falso, lo que dificulta que los usuarios confíen en los resultados. Muchos métodos también dependen en gran medida de grandes modelos de lenguaje (LLM, por sus siglas en inglés) que carecen de la capacidad de contrastarse con fuentes de conocimiento autorizadas, lo que genera el riesgo de generar conclusiones falsas, también conocidas como “alucinaciones”.
A diferencia de las herramientas que solo hacen inferencias internas dentro del modelo, VeGraph separa proactivamente la solicitud de verificación de información en pequeñas proposiciones y luego la compara con referencias confiables como documentos legales, bases de datos gubernamentales , documentos especializados, etc. Todo el proceso de verificación está sistematizado en pasos claros, lo que facilita a los usuarios su seguimiento y verificación, aumentando la precisión y la transparencia: factores que son cada vez más importantes en las aplicaciones de IA. Esta característica también permite a las organizaciones ajustar y mejorar rápidamente el sistema cuando sea necesario.
Con el objetivo de lograr un entorno digital transparente y seguro, VeGraph es muy valorado por su aplicación práctica. Además de la capacidad de integrarse en sistemas de IA para aumentar la precisión y la confiabilidad, esta tecnología puede desarrollarse en un sistema de verificación de información en muchos campos como la medicina, el periodismo, el derecho o la gestión estatal... Gracias a eso, las personas pueden autoverificar información importante que requiere alta autenticidad, como noticias de actualidad, información sobre medicamentos, vacunas, productos farmacéuticos o regulaciones legales...
En el futuro, VeGraph se ampliará para manejar diversos formatos de datos, como imágenes, videos, audio, etc., reconocer formas complejas del lenguaje, como metáforas e implicaciones, e incorporar gráficos de conocimiento para mejorar las capacidades de razonamiento.
Este año, NAACL 2025 atrajo un número récord de artículos de investigación, llegando a más de 3.000, con una tasa de aceptación muy competitiva para los artículos principales (alrededor del 22%), reuniendo las investigaciones más innovadoras. NAACL 2025 se centra específicamente en avances revolucionarios en el desarrollo de modelos de lenguaje a gran escala, procesamiento del lenguaje natural intercultural y multilingüe, capacidades de inferencia emergentes e IA responsable.
Fuente: https://doanhnghiepvn.vn/cong-nghe/khi-ai-biet-kiem-chung-su-that-buoc-tien-moi-tu-viettel-ai-tai-naacl-2025/20250519080205067
Kommentar (0)