Když umělá inteligence ví, jak ověřit pravdu: Nový pokrok od Viettel AI na NAACL 2025

Popisek fotografie

VeGraph zlepšuje přesnost o 2–5 % oproti stávajícím metodám.

NAACL 2025 (Výroční konference pobočky Asociace pro počítačovou lingvistiku národů Ameriky) je přední světové prestižní vědecké fórum v oblasti zpracování přirozeného jazyka a počítačové lingvistiky.

Podle informací společnosti Viettel z odpoledne 16. května exploze internetu a sociálních sítí vedla k rostoucí popularitě obsahu generovaného uživateli; zároveň to vedlo k vlně falešných zpráv a neoficiálních zpráv, které se šíří. Tyto falešné informace nejen způsobují zmatek lidem v citlivých oblastech, jako je zdraví, přírodní katastrofy, veřejná politika..., ale také vedou k vážným důsledkům, jako jsou: ekonomické škody, pokles reputace organizace a ohrožení národní bezpečnosti.

„V minulosti měly tyto informace dopad pouze v určitém čase a rozsahu, nyní se stávají stále nebezpečnějšími, když se stávají součástí vstupních dat pro systémy umělé inteligence (AI). V procesu vyhledávání a shromažďování informací pro reakci na uživatele jsou systémy, jako jsou chatboti a virtuální asistenti, zcela schopny používat, vytvářet nebo šířit nepravdivé informace, pokud nemají schopnost sebeověření,“ uvedl zástupce společnosti Viettel.

Ověřování faktů je proces ověřování pravdivosti nebo nepravdivosti určité informace. Například cílem ověřování faktů u tvrzení „NASA našla život na Marsu“ je ověřit, zda je informace založena na publikovaných faktech prostřednictvím spolehlivých zdrojů, jako jsou noviny, vědecká data nebo znalostní báze. Aby si systémy umělé inteligence mohly informace samy ověřit, musí být schopny větě porozumět, najít relevantní informace a vyvodit logické závěry na základě objektivních dat.

VeGraph (Verify-in-the-Graph) je metoda ověřování informací, kterou vyzkoumal, vyvinul a prezentoval tým inženýrů z Viettel AI Data Services and Artificial Intelligence Center (Viettel AI) na NAACL 2025 – jedné ze tří nejprestižnějších mezinárodních konferencí o zpracování přirozeného jazyka. Experimentální výsledky na dvou populárních ověřovacích datových sadách, HoVer a FEVEROUS, ukazují, že VeGraph zlepšuje přesnost o 2–5 % ve srovnání se stávajícími metodami.

Podle expertů na umělou inteligenci ze společnosti Viettel má většina současných metod ověřování informací stále potíže se zpracováním nejednoznačných, metaforických nebo vícevrstvých tvrzení, která se často používají k „maskování“ falešných informací; zároveň nedokážou jasně vysvětlit, proč je určitý obsah považován za nepravdivý, což uživatelům ztěžuje důvěru v výsledky. Mnoho metod se také spoléhá hlavně na modely velkých jazyků (LLM) bez možnosti křížové kontroly s oficiálními zdroji znalostí, což vede k riziku vytváření chybných závěrů nebo tzv. fenoménu „halucinací“.

Na rozdíl od nástrojů, které v rámci modelu provádějí pouze interní inference, VeGraph proaktivně rozděluje požadavek na ověření informací na malé klauzule a poté je porovnává se spolehlivými referencemi, jako jsou právní dokumenty, vládní databáze , specializované dokumenty atd. Celý proces ověřování je systematizován do jasných kroků, což uživatelům usnadňuje sledování a kontrolu, a zvyšuje přesnost a transparentnost – stále důležitější faktor v aplikacích umělé inteligence. Tato funkce také umožňuje organizacím rychle upravovat a vylepšovat systém v případě potřeby.

VeGraph, jehož cílem je transparentní a bezpečné digitální prostředí, je vysoce ceněn pro své praktické využití. Kromě možnosti integrace do systémů umělé inteligence pro zvýšení přesnosti a spolehlivosti lze tuto technologii rozvinout do podoby systému ověřování informací v mnoha oblastech, jako je zdravotnictví, žurnalistika, právo nebo státní správa... Díky tomu si lidé mohou sami ověřovat důležité informace, které vyžadují vysokou autenticitu, jako jsou aktuální zprávy, informace o lécích, vakcínách, léčivech nebo právních předpisech...

V budoucnu bude VeGraph rozšířen tak, aby zvládal různé datové formáty, jako jsou obrázky, videa, zvuk atd., rozpoznával složité jazykové formy, jako jsou metafory a implikace, a začleňoval další znalostní grafy pro zlepšení schopností uvažování.

Letošní NAACL 2025 přilákala rekordní počet článků, přesahující 3 000, s velmi konkurenceschopnou mírou přijetí primárních článků (přibližně 22 %), která spojila nejprůlomovější výzkum. NAACL 2025 se zaměřuje konkrétně na průlomové pokroky ve vývoji modelů velkých jazyků, mezikulturní a vícejazyčné zpracování přirozeného jazyka, nově vznikající inferenční schopnosti a odpovědnou umělou inteligenci.

Podle novin News and People

Zdroj: https://doanhnghiepvn.vn/cong-nghe/khi-ai-biet-kiem-chung-su-that-buoc-tien-moi-tu-viettel-ai-tai-naacl-2025/20250519080205067