A VeGraph 2-5%-kal javítja a pontosságot a meglévő módszerekhez képest.
Az NAACL 2025 (az Association for Computational Linguistics amerikai nemzetek éves konferenciája) a világ vezető rangos tudományos fóruma a természetes nyelvi feldolgozás és a számítógépes nyelvészet területén.
A Viettel május 16-i délutáni tájékoztatása szerint az internet és a közösségi hálózatok robbanásszerű elterjedése egyre népszerűbbé tette a felhasználók által generált tartalmakat; ugyanakkor álhírek és nem hivatalos hírek hullámához vezetett. Ezek a hamis információk nemcsak zavart okoznak az olyan érzékeny területeken élőknek, mint az egészségügy, a természeti katasztrófák, a közpolitika... hanem súlyos következményekkel is járnak, mint például gazdasági károk, a szervezetek hírnevének romlása és a nemzetbiztonság veszélyeztetése.
„A múltban ezek az információk csak bizonyos időpontban és mértékben voltak hatással, most azonban egyre veszélyesebbé válnak, amikor a mesterséges intelligencia (MI) rendszerek bemeneti adatainak részévé válnak. A felhasználóknak való válaszadáshoz szükséges információk keresése és gyűjtése során az olyan rendszerek, mint a chatbotok és a virtuális asszisztensek, képesek hamis információkat felhasználni, létrehozni vagy terjeszteni, ha nem képesek önellenőrzésre” – mondta a Viettel képviselője.
A tényellenőrzés az a folyamat, amelynek során egy információ igazát vagy hamisságát ellenőrizzük. Például a „NASA életet talált a Marson” állítás tényellenőrzésének célja annak ellenőrzése, hogy az információ publikált tényeken alapul-e, megbízható forrásokból, például újságokból, tudományos adatokból vagy tudásbázisokból. Az információk önellenőrzéséhez a mesterséges intelligencia rendszereknek képesnek kell lenniük megérteni a mondatot, releváns információkat találni, és logikus következtetéseket levonni objektív adatok alapján.
A VeGraph (Verify-in-the-Graph) egy információ-ellenőrzési módszer, amelyet a Viettel AI Data Services and Artificial Intelligence Center (Viettel AI) mérnökei kutatta, fejlesztette és mutatta be az NAACL 2025 konferencián – a természetes nyelvi feldolgozás három legrangosabb nemzetközi konferenciájának egyikén. Két népszerű ellenőrző adathalmazon, a HoVer-en és a FEVEROUS-on végzett kísérleti eredmények azt mutatják, hogy a VeGraph 2-5%-kal javítja a pontosságot a meglévő módszerekhez képest.
A Viettel mesterséges intelligencia szakértői szerint a legtöbb jelenlegi információ-ellenőrzési módszer továbbra is nehézségekbe ütközik a kétértelmű, metaforikus vagy többrétegű állítások kezelésében, amelyeket gyakran használnak a hamis információk „álcázására”; ugyanakkor nem tudják egyértelműen megmagyarázni, hogy miért tekinthető egy tartalom hamisnak, ami megnehezíti a felhasználók számára az eredmények megbízhatóságát. Számos módszer főként nagy nyelvi modellekre (LLM) támaszkodik anélkül, hogy képes lenne összevetni azokat a hivatalos tudásforrásokkal, ami téves következtetések levonásának vagy az úgynevezett „hallucináció” jelenségének kockázatához vezet.
Azokkal az eszközökkel ellentétben, amelyek csak a modellen belül belső következtetéseket vonnak le, a VeGraph proaktívan kis záradékokra bontja az információ-ellenőrzési kérelmet, majd összehasonlítja azt megbízható hivatkozásokkal, például jogi dokumentumokkal, kormányzati adatbázisokkal , speciális dokumentumokkal stb. A teljes ellenőrzési folyamat világos lépésekre van osztva, így a felhasználók könnyen nyomon követhetik és ellenőrizhetik, növelve a pontosságot és az átláthatóságot – ami egyre fontosabb tényező a mesterséges intelligencia alkalmazásokban. Ez a funkció lehetővé teszi a szervezetek számára a rendszer gyors módosítását és fejlesztését is, amikor szükséges.
Az átlátható és biztonságos digitális környezet megteremtésére törekvő VeGraph nagyra értékelt gyakorlati alkalmazása miatt. A pontosság és a megbízhatóság növelése érdekében a mesterséges intelligencia rendszereibe való integrálhatóság mellett ez a technológia számos területen, például az egészségügyben, az újságírásban, a jogban vagy az államigazgatásban is információ-ellenőrző rendszerré fejleszthető... Ennek köszönhetően az emberek önállóan ellenőrizhetik a magas hitelességet igénylő fontos információkat, például az aktuális híreket, a gyógyszerekről, oltásokról, gyógyszerészeti termékekről vagy jogszabályokról szóló információkat...
A jövőben a VeGraph kibővül, hogy képes legyen kezelni a különféle adatformátumokat, például képeket, videókat, hanganyagokat stb., felismerni az összetett nyelvi formákat, például a metaforákat és az implikációkat, és további tudásgráfokat beépíteni az érvelési képességek javítása érdekében.
Idén az NAACL 2025 rekord számú, több mint 3000 cikket vonzott, a főbb cikkek elfogadási aránya pedig rendkívül versenyképes volt (körülbelül 22%), és a legáttörőbb kutatásokat tömörítette. Az NAACL 2025 kifejezetten a nagy nyelvi modellek fejlesztésében, a kultúrák közötti és többnyelvű természetes nyelvi feldolgozásban, az újonnan megjelenő következtetési képességekben és a felelős mesterséges intelligenciában elért áttörésekre összpontosít.
A News and People újság szerint
Forrás: https://doanhnghiepvn.vn/cong-nghe/khi-ai-biet-kiem-chung-su-that-buoc-tien-moi-tu-viettel-ai-tai-naacl-2025/20250519080205067
Hozzászólás (0)