На NAACL 2025 — одной из трех крупнейших в мире конференций по обработке естественного языка, проходящей в США, — компания Viettel AI представила VeGraph. Это новый метод проверки фактов, который повышает точность на 2–5% по сравнению с существующими методами для двух популярных наборов данных для проверки фактов, HoVer и FEVEROUS.
Распространение Интернета и социальных сетей привело к тому, что фейковые новости и дезинформация стали все более распространенными, особенно в таких деликатных областях, как здравоохранение , стихийные бедствия и государственная политика. Эта проблема становится еще более серьезной, когда эта ложная информация становится входными данными для систем искусственного интеллекта, таких как чат-боты или виртуальные помощники. Если не контролировать ИИ, он может непреднамеренно распространять или даже создавать дезинформацию.
VeGraph — метод проверки информации, исследованный, разработанный и представленный компанией Viettel AI на конференции NAACL 2025.
Проверка фактов — это процесс проверки истинности или ложности утверждения на основе надежных источников, таких как газеты, научная литература или официальные базы данных. Для этого системам искусственного интеллекта необходимо уметь понимать язык, извлекать данные и рассуждать логически.
Разработанный инженерной группой Центра обслуживания данных и искусственного интеллекта Viettel, VeGraph (Verify-in-the-Graph) разбивает запросы на проверку на небольшие пункты и сравнивает их с авторитетными источниками, такими как юридические документы, правительственные данные и специализированные документы. В отличие от многих современных методов, которые опираются исключительно на большие языковые модели (LLM), VeGraph организует процесс проверки в виде четких шагов, повышая прозрачность и уменьшая явление «иллюзии» — когда ИИ автоматически создает ложную информацию.
Помимо эффективности проверки информации, VeGraph также широко применим. Эту технологию можно интегрировать в системы ИИ для повышения надежности или использовать независимо в таких областях, как медицина, журналистика, юриспруденция или государственное управление. Люди могут полностью использовать его для самостоятельной проверки важной информации, требующей высокой степени достоверности, например, текущих новостей, информации о лекарствах, вакцинах или правовых нормах.
В будущем Viettel AI планирует развивать VeGraph для обработки различных форматов данных, таких как изображения, видео и аудио; одновременно повышая способность понимать сложный язык, такой как метафоры, коннотации и интегрируя графы знаний для улучшения способностей к рассуждению.
NAACL 2025 (Ежегодная конференция отделения Ассоциации компьютерной лингвистики стран Америки) — ведущий престижный мировой научный форум в области обработки естественного языка и компьютерной лингвистики.
В этом году конференция привлекла рекордное количество докладов — более 3000 — с очень конкурентоспособным процентом принятия ключевых докладов (около 22%), объединив самые новаторские исследования.
NAACL 2025 уделяет особое внимание прорывным достижениям в разработке больших языковых моделей, кросс-культурной и многоязычной обработке естественного языка, новым возможностям вывода и ответственному ИИ.
Источник: https://nld.com.vn/ai-cua-nguoi-viet-biet-kiem-tra-thong-tin-biet-noi-su-that-196250517125935127.htm
Комментарий (0)