VeGraph підвищує точність на 2-5% порівняно з існуючими методами.
NAACL 2025 (Щорічна конференція відділення Асоціації комп'ютерної лінгвістики Націй Америки) – провідний престижний світовий науковий форум у галузі обробки природної мови та комп'ютерної лінгвістики.
Згідно з інформацією Viettel станом на 16 травня, вибухове зростання інтернету та соціальних мереж зробило контент, створений користувачами, дедалі популярнішим; водночас це призвело до широкого поширення хвилі фейкових новин та неофіційних новин. Ця неправдива інформація не лише створює плутанину для людей у делікатних сферах, таких як охорона здоров'я, стихійні лиха, державна політика..., але й призводить до серйозних наслідків, таких як: економічна шкода, зниження репутації організації та загроза національній безпеці.
«У минулому ця інформація мала вплив лише у певний час і в певному обсязі, тепер вона стає дедалі небезпечнішою, коли стає частиною вхідних даних для систем штучного інтелекту (ШІ). У процесі пошуку та збору інформації для реагування на запити користувачів такі системи, як чат-боти та віртуальні помічники, цілком здатні використовувати, створювати або поширювати неправдиву інформацію, якщо вони не мають можливості самоперевірки», – сказав представник Viettel.
Перевірка фактів – це процес перевірки істинності чи хибності певної інформації. Наприклад, метою перевірки фактів твердження «NASA знайшло життя на Марсі» є перевірка того, чи інформація ґрунтується на опублікованих фактах, отриманих з надійних джерел, таких як газети, наукові дані чи бази знань. Щоб самостійно перевірити інформацію, системи штучного інтелекту повинні розуміти речення, знаходити відповідну інформацію та робити логічні висновки на основі об’єктивних даних.
VeGraph (Verify-in-the-Graph) – це метод перевірки інформації, досліджений, розроблений та представлений командою інженерів Центру послуг даних та штучного інтелекту Viettel AI (Viettel AI) на NAACL 2025 – одній із трьох найпрестижніших міжнародних конференцій з обробки природної мови. Експериментальні результати на двох популярних наборах даних для перевірки, HoVer та FEVEROUS, показують, що VeGraph підвищує точність на 2–5% порівняно з існуючими методами.
За словами експертів Viettel AI, більшість сучасних методів перевірки інформації все ще мають труднощі з обробкою неоднозначних, метафоричних або багатошарових тверджень, які часто використовуються для «маскування» фальшивої інформації; водночас вони не можуть чітко пояснити, чому фрагмент контенту вважається хибним, що ускладнює для користувачів довіру до результатів. Багато методів також спираються переважно на моделі великих мов (LLM) без можливості перехресної перевірки з офіційними джерелами знань, що призводить до ризику створення хибних висновків або так званого феномену «галюцинацій».
На відміну від інструментів, які роблять лише внутрішні висновки в рамках моделі, VeGraph проактивно розділяє запит на перевірку інформації на невеликі пункти, а потім порівнює їх з надійними посиланнями, такими як юридичні документи, урядові бази даних , спеціалізовані документи тощо. Весь процес перевірки систематизовано за чіткими кроками, що полегшує користувачам моніторинг та перевірку, підвищуючи точність та прозорість – дедалі важливіший фактор у застосунках штучного інтелекту. Ця функція також дозволяє організаціям швидко налаштовувати та вдосконалювати систему за потреби.
Прагнучи до прозорого та безпечного цифрового середовища, VeGraph високо цінується за своє практичне застосування. Окрім можливості інтеграції в системи штучного інтелекту для підвищення точності та надійності, цю технологію можна розвинути в систему перевірки інформації в багатьох галузях, таких як охорона здоров'я, журналістика, право чи державне управління... Завдяки цьому люди можуть самостійно перевіряти важливу інформацію, яка вимагає високої достовірності, таку як поточні новини, інформація про ліки, вакцини, фармацевтичні препарати чи правові норми...
У майбутньому VeGraph буде розширено для обробки різноманітних форматів даних, таких як зображення, відео, аудіо тощо, розпізнавання складних мовних форм, таких як метафори, імплікації, та вбудовування додаткових графів знань для покращення можливостей міркування.
Цього року NAACL 2025 зібрала рекордну кількість статей, перевищивши 3000, з дуже конкурентним рівнем прийняття первинних статей (приблизно 22%), об'єднавши найноваторськіші дослідження. NAACL 2025 зосереджується саме на проривних досягненнях у розробці моделей великих мов, міжкультурній та багатомовній обробці природної мови, нових можливостях логічного висновку та відповідальному штучному інтелекті.
За даними газети «Новини та люди»
Джерело: https://doanhnghiepvn.vn/cong-nghe/khi-ai-biet-kiem-chung-su-that-buoc-tien-moi-tu-viettel-ai-tai-naacl-2025/20250519080205067
Коментар (0)