Amikor a mesterséges intelligencia tudja, hogyan kell ellenőrizni az igazságot: Újabb előrelépés a Viettel mesterséges intelligenciájától az NAACL 2025 konferencián

Az NAACL 2025-ön, a világ egyik vezető mesterséges intelligencia (MI) konferenciáján, amelyet az Egyesült Államokban rendeztek meg, a Viettel AI bemutatta a VeGraph-ot - egy információ-ellenőrzési módszert, amely akár 5%-kal is növelheti a pontosságot a meglévő módszerekhez képest.

Tạp chí Doanh Nghiệp•19/05/2025

Képaláírás

A VeGraph 2-5%-kal javítja a pontosságot a meglévő módszerekhez képest.

Az NAACL 2025 (az Association for Computational Linguistics amerikai nemzetek éves konferenciája) a világ vezető rangos tudományos fóruma a természetes nyelvi feldolgozás és a számítógépes nyelvészet területén.

A Viettel május 16-i délutáni tájékoztatása szerint az internet és a közösségi hálózatok robbanásszerű elterjedése egyre népszerűbbé tette a felhasználók által generált tartalmakat; ugyanakkor álhírek és nem hivatalos hírek hullámához vezetett. Ezek a hamis információk nemcsak zavart okoznak az olyan érzékeny területeken élőknek, mint az egészségügy, a természeti katasztrófák, a közpolitika... hanem súlyos következményekkel is járnak, mint például gazdasági károk, a szervezetek hírnevének romlása és a nemzetbiztonság veszélyeztetése.

„A múltban ezek az információk csak bizonyos időpontban és mértékben voltak hatással, most azonban egyre veszélyesebbé válnak, amikor a mesterséges intelligencia (MI) rendszerek bemeneti adatainak részévé válnak. A felhasználóknak való válaszadáshoz szükséges információk keresése és gyűjtése során az olyan rendszerek, mint a chatbotok és a virtuális asszisztensek, képesek hamis információkat felhasználni, létrehozni vagy terjeszteni, ha nem képesek önellenőrzésre” – mondta a Viettel képviselője.

A tényellenőrzés az a folyamat, amelynek során egy információ igazát vagy hamisságát ellenőrizzük. Például a „NASA életet talált a Marson” állítás tényellenőrzésének célja annak ellenőrzése, hogy az információ publikált tényeken alapul-e, megbízható forrásokból, például újságokból, tudományos adatokból vagy tudásbázisokból. Az információk önellenőrzéséhez a mesterséges intelligencia rendszereknek képesnek kell lenniük megérteni a mondatot, releváns információkat találni, és logikus következtetéseket levonni objektív adatok alapján.

A VeGraph (Verify-in-the-Graph) egy információ-ellenőrzési módszer, amelyet a Viettel AI Data Services and Artificial Intelligence Center (Viettel AI) mérnökei kutatta, fejlesztette és mutatta be az NAACL 2025 konferencián – a természetes nyelvi feldolgozás három legrangosabb nemzetközi konferenciájának egyikén. Két népszerű ellenőrző adathalmazon, a HoVer-en és a FEVEROUS-on végzett kísérleti eredmények azt mutatják, hogy a VeGraph 2-5%-kal javítja a pontosságot a meglévő módszerekhez képest.

A Viettel mesterséges intelligencia szakértői szerint a legtöbb jelenlegi információ-ellenőrzési módszer továbbra is nehézségekbe ütközik a kétértelmű, metaforikus vagy többrétegű állítások kezelésében, amelyeket gyakran használnak a hamis információk „álcázására”; ugyanakkor nem tudják egyértelműen megmagyarázni, hogy miért tekinthető egy tartalom hamisnak, ami megnehezíti a felhasználók számára az eredmények megbízhatóságát. Számos módszer főként nagy nyelvi modellekre (LLM) támaszkodik anélkül, hogy képes lenne összevetni azokat a hivatalos tudásforrásokkal, ami téves következtetések levonásának vagy az úgynevezett „hallucináció” jelenségének kockázatához vezet.

Azokkal az eszközökkel ellentétben, amelyek csak a modellen belül belső következtetéseket vonnak le, a VeGraph proaktívan kis záradékokra bontja az információ-ellenőrzési kérelmet, majd összehasonlítja azt megbízható hivatkozásokkal, például jogi dokumentumokkal, kormányzati adatbázisokkal , speciális dokumentumokkal stb. A teljes ellenőrzési folyamat világos lépésekre van osztva, így a felhasználók könnyen nyomon követhetik és ellenőrizhetik, növelve a pontosságot és az átláthatóságot – ami egyre fontosabb tényező a mesterséges intelligencia alkalmazásokban. Ez a funkció lehetővé teszi a szervezetek számára a rendszer gyors módosítását és fejlesztését is, amikor szükséges.

Az átlátható és biztonságos digitális környezet megteremtésére törekvő VeGraph nagyra értékelt gyakorlati alkalmazása miatt. A pontosság és a megbízhatóság növelése érdekében a mesterséges intelligencia rendszereibe való integrálhatóság mellett ez a technológia számos területen, például az egészségügyben, az újságírásban, a jogban vagy az államigazgatásban is információ-ellenőrző rendszerré fejleszthető... Ennek köszönhetően az emberek önállóan ellenőrizhetik a magas hitelességet igénylő fontos információkat, például az aktuális híreket, a gyógyszerekről, oltásokról, gyógyszerészeti termékekről vagy jogszabályokról szóló információkat...

A jövőben a VeGraph kibővül, hogy képes legyen kezelni a különféle adatformátumokat, például képeket, videókat, hanganyagokat stb., felismerni az összetett nyelvi formákat, például a metaforákat és az implikációkat, és további tudásgráfokat beépíteni az érvelési képességek javítása érdekében.

Idén az NAACL 2025 rekord számú, több mint 3000 cikket vonzott, a főbb cikkek elfogadási aránya pedig rendkívül versenyképes volt (körülbelül 22%), és a legáttörőbb kutatásokat tömörítette. Az NAACL 2025 kifejezetten a nagy nyelvi modellek fejlesztésében, a kultúrák közötti és többnyelvű természetes nyelvi feldolgozásban, az újonnan megjelenő következtetési képességekben és a felelős mesterséges intelligenciában elért áttörésekre összpontosít.

A News and People újság szerint

Forrás: https://doanhnghiepvn.vn/cong-nghe/khi-ai-biet-kiem-chung-su-that-buoc-tien-moi-tu-viettel-ai-tai-naacl-2025/20250519080205067