Apabila AI tahu cara mengesahkan kebenaran: Kemajuan baharu daripada Viettel AI di NAACL 2025

Kapsyen foto

VeGraph meningkatkan ketepatan sebanyak 2 - 5% berbanding kaedah sedia ada.

NAACL 2025 (Persidangan Tahunan Bangsa-Bangsa Amerika Bab bagi Persatuan Linguistik Pengiraan) ialah forum saintifik berprestij terkemuka di dunia dalam bidang pemprosesan bahasa semula jadi dan linguistik pengiraan.

Menurut maklumat daripada Viettel pada petang 16 Mei, letupan Internet dan rangkaian sosial telah menjadikan kandungan yang dijana pengguna semakin popular; pada masa yang sama, ia telah membawa kepada gelombang berita palsu dan berita tidak rasmi tersebar luas. Maklumat palsu ini bukan sahaja menyebabkan kekeliruan bagi orang di kawasan sensitif seperti kesihatan, bencana alam, dasar awam... tetapi juga membawa kepada akibat yang serius seperti: kerosakan ekonomi, kemerosotan dalam reputasi organisasi dan ancaman kepada keselamatan negara.

"Dulu, maklumat ini hanya memberi kesan pada masa dan skop tertentu, kini ia menjadi semakin berbahaya apabila ia menjadi sebahagian daripada data input untuk sistem kecerdasan buatan (AI). Dalam proses mencari dan mengumpul maklumat untuk bertindak balas kepada pengguna, sistem seperti chatbots dan pembantu maya benar-benar mampu menggunakan, mencipta atau menyebarkan maklumat palsu jika mereka tidak mempunyai keupayaan untuk mengesahkan sendiri," kata Viettel.

Semakan fakta ialah proses mengesahkan kebenaran atau kepalsuan sesuatu maklumat. Sebagai contoh, matlamat menyemak fakta kenyataan "NASA telah menemui kehidupan di Marikh" adalah untuk menyemak sama ada maklumat itu berdasarkan fakta yang diterbitkan? melalui sumber yang boleh dipercayai seperti akhbar, data saintifik, atau pangkalan pengetahuan. Untuk mengesahkan maklumat sendiri, sistem AI mesti dapat memahami ayat, mencari maklumat yang relevan dan membuat kesimpulan logik berdasarkan data objektif.

VeGraph (Verify-in-the-Graph) ialah kaedah pengesahan maklumat yang diselidik, dibangunkan dan dibentangkan oleh pasukan jurutera di Pusat Perkhidmatan Data dan Kecerdasan Buatan Viettel AI (Viettel AI) di NAACL 2025 - salah satu daripada tiga persidangan antarabangsa paling berprestij mengenai pemprosesan bahasa semula jadi. Keputusan percubaan pada dua set data pengesahan popular, HoVer dan FEVEROUS, menunjukkan bahawa VeGraph meningkatkan ketepatan sebanyak 2 - 5% berbanding kaedah sedia ada.

Menurut pakar Viettel AI, kebanyakan kaedah pengesahan maklumat semasa masih menghadapi kesukaran mengendalikan kenyataan samar-samar, metafora atau berbilang lapisan, yang sering digunakan untuk "menyamarkan" maklumat palsu; pada masa yang sama, mereka tidak dapat menjelaskan dengan jelas mengapa sesuatu kandungan dianggap palsu, sehingga menyukarkan pengguna untuk mempercayai keputusan tersebut. Banyak kaedah juga bergantung terutamanya pada model bahasa besar (LLM) tanpa keupayaan untuk menyemak silang dengan sumber pengetahuan rasmi, yang membawa kepada risiko membuat kesimpulan palsu atau apa yang dipanggil fenomena "halusinasi".

Tidak seperti alat yang hanya membuat inferens dalaman dalam model, VeGraph secara proaktif memisahkan permintaan pengesahan maklumat ke dalam klausa kecil dan kemudian membandingkannya dengan rujukan yang boleh dipercayai seperti dokumen undang-undang, pangkalan data kerajaan , dokumen khusus, dll. Keseluruhan proses pengesahan disusun menjadi langkah yang jelas, memudahkan pengguna memantau dan menyemak, meningkatkan ketepatan dan ketelusan dalam aplikasi yang semakin penting. Ciri ini juga membolehkan organisasi melaraskan dan menambah baik sistem dengan cepat apabila diperlukan.

Menyasarkan untuk persekitaran digital yang telus dan selamat, VeGraph amat dihargai kerana aplikasi praktikalnya. Selain keupayaan untuk menyepadukan ke dalam sistem AI untuk meningkatkan ketepatan dan kebolehpercayaan, teknologi ini boleh dibangunkan menjadi sistem pengesahan maklumat dalam banyak bidang seperti penjagaan kesihatan, kewartawanan, undang-undang atau pengurusan negeri... Terima kasih kepada itu, orang ramai boleh mengesahkan sendiri maklumat penting yang memerlukan keaslian tinggi seperti berita semasa, maklumat tentang ubat, vaksin, farmaseutikal atau peraturan undang-undang...

Pada masa hadapan, VeGraph akan diperluaskan untuk mengendalikan format data yang pelbagai seperti imej, video, audio, dsb., mengenali bentuk bahasa yang kompleks seperti metafora, implikasi, dan menggabungkan graf pengetahuan tambahan untuk meningkatkan keupayaan penaakulan.

Pada tahun ini, NAACL 2025 telah menarik sejumlah rekod kertas, mencecah lebih 3,000, dengan kadar penerimaan yang sangat kompetitif untuk kertas asas (kira-kira 22%), mengumpulkan penyelidikan yang paling inovatif. NAACL 2025 memberi tumpuan khusus pada kemajuan terobosan dalam pembangunan model bahasa besar, pemprosesan bahasa semula jadi silang budaya dan berbilang bahasa, keupayaan inferens yang muncul, dan AI yang bertanggungjawab.

Menurut Berita dan Akhbar Rakyat

Sumber: https://doanhnghiepvn.vn/cong-nghe/khi-ai-biet-kiem-chung-su-that-buoc-tien-moi-tu-viettel-ai-tai-naacl-2025/20250519080205067