เมื่อ AI รู้วิธีตรวจสอบความจริง: ความก้าวหน้าใหม่จาก Viettel AI ที่ NAACL 2025

ในงาน NAACL 2025 ซึ่งเป็นหนึ่งในงานประชุมด้านปัญญาประดิษฐ์ (AI) ชั้นนำของโลกที่จัดขึ้นในสหรัฐอเมริกา Viettel AI ได้เปิดตัว VeGraph ซึ่งเป็นวิธีการตรวจสอบข้อมูลที่ช่วยเพิ่มความแม่นยำได้ถึง 5% เมื่อเทียบกับวิธีการที่มีอยู่ในปัจจุบัน

Tạp chí Doanh Nghiệp•19/05/2025

คำบรรยายภาพ

VeGraph ปรับปรุงความแม่นยำได้ 2 - 5% เมื่อเทียบกับวิธีการที่มีอยู่เดิม

NAACL 2025 (การประชุมประจำปีของ Nations of the Americas Chapter of the Association for Computational Linguistics) เป็นเวที วิทยาศาสตร์ ชั้นนำระดับโลกที่มีชื่อเสียงในด้านการประมวลผลภาษาธรรมชาติและภาษาศาสตร์เชิงคำนวณ

ข้อมูลจาก Viettel ในช่วงบ่ายของวันที่ 16 พฤษภาคม ระบุว่า กระแสอินเทอร์เน็ตและโซเชียลมีเดียที่เฟื่องฟูอย่างรวดเร็วทำให้คอนเทนต์ที่ผู้ใช้สร้างขึ้นได้รับความนิยมเพิ่มขึ้น ขณะเดียวกันก็นำไปสู่กระแสข่าวปลอมและข่าวที่ไม่เป็นทางการที่แพร่กระจายไปอย่างกว้างขวาง ข้อมูลเท็จเหล่านี้ไม่เพียงแต่สร้างความสับสนให้กับผู้คนในประเด็นที่ละเอียดอ่อน เช่น สุขภาพ ภัยพิบัติทางธรรมชาติ นโยบายสาธารณะ... แต่ยังนำไปสู่ผลกระทบร้ายแรงต่างๆ เช่น ความเสียหายทางเศรษฐกิจ ชื่อเสียงขององค์กรเสื่อมเสีย และภัยคุกคามต่อความมั่นคงของชาติ

ในอดีต ข้อมูลเหล่านี้มีผลกระทบเฉพาะในช่วงเวลาและขอบเขตที่กำหนดเท่านั้น แต่ปัจจุบันกำลังกลายเป็นอันตรายมากขึ้นเมื่อข้อมูลเหล่านี้กลายเป็นส่วนหนึ่งของข้อมูลอินพุตสำหรับระบบปัญญาประดิษฐ์ (AI) ในกระบวนการค้นหาและรวบรวมข้อมูลเพื่อตอบสนองต่อผู้ใช้ ระบบต่างๆ เช่น แชทบอทและผู้ช่วยเสมือน ล้วนมีความสามารถในการใช้ สร้าง หรือเผยแพร่ข้อมูลเท็จได้อย่างสมบูรณ์ หากระบบเหล่านั้นไม่มีความสามารถในการตรวจสอบตนเอง” ตัวแทนจาก Viettel กล่าว

การตรวจสอบข้อเท็จจริงคือกระบวนการตรวจสอบความจริงหรือความเท็จของข้อมูล ตัวอย่างเช่น เป้าหมายของการตรวจสอบข้อเท็จจริงสำหรับข้อความ “นาซาพบสิ่งมีชีวิตบนดาวอังคาร” คือการตรวจสอบว่าข้อมูลดังกล่าวอ้างอิงจากข้อเท็จจริงที่เผยแพร่หรือไม่ ผ่านแหล่งข้อมูลที่เชื่อถือได้ เช่น หนังสือพิมพ์ ข้อมูลทางวิทยาศาสตร์ หรือฐานข้อมูลความรู้ ในการตรวจสอบข้อมูลด้วยตนเอง ระบบ AI จะต้องสามารถเข้าใจประโยค ค้นหาข้อมูลที่เกี่ยวข้อง และสรุปผลอย่างมีเหตุผลจากข้อมูลที่เป็นกลาง

VeGraph (Verify-in-the-Graph) เป็นวิธีการตรวจสอบข้อมูลที่วิจัย พัฒนา และนำเสนอโดยทีมวิศวกรจาก Viettel AI Data Services และศูนย์ปัญญาประดิษฐ์ (Viettel AI) ในงาน NAACL 2025 ซึ่งเป็นหนึ่งในสามการประชุมนานาชาติด้านการประมวลผลภาษาธรรมชาติที่มีชื่อเสียงที่สุด ผลการทดลองบนชุดข้อมูลการตรวจสอบยอดนิยมสองชุด ได้แก่ HoVer และ FEVEROUS แสดงให้เห็นว่า VeGraph เพิ่มความแม่นยำขึ้น 2-5% เมื่อเทียบกับวิธีการที่มีอยู่ในปัจจุบัน

ผู้เชี่ยวชาญด้าน AI ของ Viettel ระบุว่า วิธีการตรวจสอบข้อมูลในปัจจุบันส่วนใหญ่ยังคงมีปัญหาในการจัดการกับข้อความที่กำกวม เปรียบเทียบ หรือหลายชั้น ซึ่งมักใช้เพื่อ "ปกปิด" ข้อมูลปลอม ในขณะเดียวกันก็ไม่สามารถอธิบายได้อย่างชัดเจนว่าเหตุใดเนื้อหาจึงถือเป็นเท็จ ทำให้ผู้ใช้เชื่อถือผลลัพธ์ได้ยาก หลายวิธียังอาศัยแบบจำลองภาษาขนาดใหญ่ (LLM) เป็นหลัก โดยไม่สามารถตรวจสอบกับแหล่งความรู้อย่างเป็นทางการได้ ซึ่งนำไปสู่ความเสี่ยงที่จะได้ข้อสรุปที่ผิดพลาดหรือปรากฏการณ์ที่เรียกว่า "ภาพหลอน"

ต่างจากเครื่องมือที่เพียงแค่อนุมานภายในแบบจำลอง VeGraph จะแยกคำขอตรวจสอบข้อมูลออกเป็นข้อย่อยๆ เชิงรุก แล้วเปรียบเทียบกับข้อมูลอ้างอิงที่เชื่อถือได้ เช่น เอกสารทางกฎหมาย ฐานข้อมูลภาครัฐ เอกสารเฉพาะทาง ฯลฯ กระบวนการตรวจสอบทั้งหมดได้รับการจัดระบบเป็นขั้นตอนที่ชัดเจน ทำให้ผู้ใช้สามารถตรวจสอบและติดตามได้ง่าย ช่วยเพิ่มความแม่นยำและความโปร่งใส ซึ่งเป็นปัจจัยสำคัญที่เพิ่มมากขึ้นในการใช้งาน AI ฟีเจอร์นี้ยังช่วยให้องค์กรต่างๆ สามารถปรับและปรับปรุงระบบได้อย่างรวดเร็วเมื่อจำเป็น

VeGraph มุ่งมั่นที่จะสร้างสภาพแวดล้อมดิจิทัลที่โปร่งใสและปลอดภัย จึงได้รับเสียงชื่นชมอย่างสูงจากการใช้งานจริง นอกจากความสามารถในการผสานรวมเข้ากับระบบ AI เพื่อเพิ่มความแม่นยำและความน่าเชื่อถือแล้ว เทคโนโลยีนี้ยังสามารถพัฒนาเป็นระบบตรวจสอบข้อมูลในหลากหลายสาขา เช่น สาธารณสุข วารสารศาสตร์ กฎหมาย หรือการบริหารจัดการภาครัฐ... ด้วยเหตุนี้ ผู้คนจึงสามารถตรวจสอบข้อมูลสำคัญที่ต้องการความถูกต้องสูงด้วยตนเอง เช่น ข่าวสารปัจจุบัน ข้อมูลเกี่ยวกับยา วัคซีน ยา หรือกฎหมายต่างๆ...

ในอนาคต VeGraph จะได้รับการขยายตัวเพื่อจัดการกับรูปแบบข้อมูลที่หลากหลาย เช่น รูปภาพ วิดีโอ เสียง ฯลฯ จดจำรูปแบบภาษาที่ซับซ้อน เช่น อุปมา ความหมายที่ตามมา และรวมกราฟความรู้เพิ่มเติมเพื่อปรับปรุงความสามารถในการใช้เหตุผล

ปีนี้ NAACL 2025 ดึงดูดผลงานวิชาการได้มากเป็นประวัติการณ์ มากกว่า 3,000 ชิ้น โดยมีอัตราการตอบรับงานวิจัยหลักที่สูงมาก (ประมาณ 22%) ซึ่งรวบรวมงานวิจัยที่ก้าวล้ำที่สุด NAACL 2025 มุ่งเน้นที่ความก้าวหน้าครั้งสำคัญในการพัฒนาแบบจำลองภาษาขนาดใหญ่ การประมวลผลภาษาธรรมชาติข้ามวัฒนธรรมและหลายภาษา ความสามารถในการอนุมานที่เกิดขึ้นใหม่ และปัญญาประดิษฐ์ (AI) ที่มีความรับผิดชอบ

ตามรายงานของหนังสือพิมพ์ News and People

ที่มา: https://doanhnghiepvn.vn/cong-nghe/khi-ai-biet-kiem-chung-su-that-buoc-tien-moi-tu-viettel-ai-tai-naacl-2025/20250519080205067