VeGraph повышает точность на 2–5% по сравнению с существующими методами.
NAACL 2025 (Ежегодная конференция отделений стран Америки Ассоциации компьютерной лингвистики) — ведущий престижный научный форум в мире в области обработки естественного языка и компьютерной лингвистики.
Согласно информации Viettel , опубликованной днём 16 мая, взрывной рост популярности интернета и социальных сетей привёл к росту популярности пользовательского контента, одновременно с этим приведя к широкому распространению фейковых новостей и неофициальных сообщений. Эта ложная информация не только сбивает с толку людей, работающих в таких деликатных областях, как здравоохранение, стихийные бедствия, государственная политика и т.д., но и приводит к серьёзным последствиям, таким как экономические потери, ухудшение репутации организаций и угрозы национальной безопасности.
«Раньше эта информация имела значение только в определённое время и в определённом объёме, теперь же она становится всё более опасной, становясь частью входных данных для систем искусственного интеллекта (ИИ). В процессе поиска и сбора информации для ответа пользователям такие системы, как чат-боты и виртуальные помощники, вполне способны использовать, создавать или распространять ложную информацию, если у них нет возможности самопроверки», — заявил представитель Viettel.
Фактчекинг — это процесс проверки истинности или ложности информации. Например, цель проверки фактов утверждения «NASA обнаружило жизнь на Марсе» — проверить, основана ли эта информация на опубликованных фактах из достоверных источников, таких как газеты, научные данные или базы знаний. Для самопроверки информации системы искусственного интеллекта должны уметь понимать утверждение, находить релевантную информацию и делать логические выводы на основе объективных данных.
VeGraph (Verify-in-the-Graph) — это метод верификации информации, исследованный, разработанный и представленный командой инженеров Центра служб данных и искусственного интеллекта Viettel AI (Viettel AI) на конференции NAACL 2025 — одной из трёх самых престижных международных конференций по обработке естественного языка. Экспериментальные результаты на двух популярных наборах данных верификации, HoVer и FEVEROUS, показывают, что VeGraph повышает точность на 2–5% по сравнению с существующими методами.
По словам экспертов Viettel AI, большинство современных методов проверки информации по-прежнему испытывают трудности с обработкой двусмысленных, метафорических или многослойных утверждений, которые часто используются для «маскировки» ложной информации. В то же время, они не могут четко объяснить, почему тот или иной контент считается ложным, что затрудняет доверие пользователей к результатам. Многие методы также опираются преимущественно на большие языковые модели (LLM) без возможности перекрёстной проверки с официальными источниками знаний, что приводит к риску ложных выводов, также известных как «галлюцинации».
В отличие от инструментов, которые делают только внутренние выводы в рамках модели, VeGraph проактивно разделяет запрос на проверку информации на небольшие пункты, а затем сравнивает его с надёжными источниками, такими как юридические документы, правительственные базы данных , специализированные документы и т. д. Весь процесс проверки систематизирован и чётко выражен, что упрощает мониторинг и проверку для пользователей, повышая точность и прозрачность — факторы, которые становятся всё более важными в приложениях ИИ. Эта функция также позволяет организациям быстро корректировать и улучшать систему при необходимости.
Стремясь к созданию прозрачной и безопасной цифровой среды, VeGraph высоко ценится за её практическое применение. Помимо возможности интеграции в системы искусственного интеллекта для повышения точности и надёжности, эта технология может быть использована в качестве системы проверки информации во многих областях, таких как здравоохранение, журналистика, юриспруденция или государственное управление... Благодаря этому пользователи могут самостоятельно проверять важную информацию, требующую высокой достоверности, например, текущие новости, информацию о лекарствах, вакцинах, фармацевтических препаратах или правовых нормах...
В будущем VeGraph будет расширен для обработки различных форматов данных, таких как изображения, видео, аудио и т. д., распознавания сложных языковых форм, таких как метафоры, импликации, а также включения графов знаний для улучшения возможностей рассуждения.
В этом году конференция NAACL 2025 привлекла рекордное количество статей, превысившее 3000, при очень высоком проценте принятых первичных статей (около 22%), объединив самые новаторские исследования. NAACL 2025 уделяет особое внимание прорывным достижениям в разработке больших языковых моделей, кросс-культурной и многоязычной обработке естественного языка, новым возможностям вывода и ответственному ИИ.
По данным газеты News and People
Источник: https://doanhnghiepvn.vn/cong-nghe/khi-ai-biet-kiem-chung-su-that-buoc-tien-moi-tu-viettel-ai-tai-naacl-2025/20250519080205067
Комментарий (0)