ในงาน NAACL 2025 ซึ่งเป็นหนึ่งใน 3 การประชุมด้านการประมวลผลภาษาธรรมชาติที่สำคัญของโลกที่จัดขึ้นในสหรัฐอเมริกา Viettel AI ได้เปิดตัว VeGraph นี่เป็นวิธีการตรวจสอบข้อเท็จจริงใหม่ที่เพิ่มความแม่นยำได้ 2%–5% เมื่อเทียบกับวิธีที่มีอยู่ในชุดข้อมูลตรวจสอบข้อเท็จจริงยอดนิยมสองชุด ได้แก่ HoVer และ FEVEROUS
การแพร่กระจายของอินเทอร์เน็ตและเครือข่ายสังคมออนไลน์ทำให้ข่าวปลอมและข้อมูลที่ผิดพลาดกลายเป็นเรื่องที่พบบ่อยมากขึ้น โดยเฉพาะอย่างยิ่งในด้านที่ละเอียดอ่อน เช่น สุขภาพ ภัยธรรมชาติ และนโยบายสาธารณะ ปัญหานี้ร้ายแรงยิ่งขึ้นเมื่อข้อมูลเท็จเหล่านี้กลายมาเป็นข้อมูลอินพุตสำหรับระบบ AI เช่น แชทบอทหรือผู้ช่วยเสมือน หากไม่ได้รับการตรวจสอบ AI อาจแพร่กระจายหรือสร้างข้อมูลที่ผิดพลาดโดยไม่ได้ตั้งใจได้
VeGraph เป็นวิธีการตรวจสอบข้อมูลที่ได้รับการวิจัย พัฒนา และนำเสนอโดย Viettel AI ในงานประชุม NAACL 2025
การตรวจสอบข้อเท็จจริงคือกระบวนการตรวจยืนยันความจริงหรือความเท็จของข้อความโดยอ้างอิงจากแหล่งข้อมูลที่เชื่อถือได้ เช่น หนังสือพิมพ์ วรรณกรรม ทางวิทยาศาสตร์ หรือฐานข้อมูลอย่างเป็นทางการ ในการดำเนินการดังกล่าว ระบบ AI ต้องมีความสามารถในการเข้าใจภาษา ดึงข้อมูล และให้เหตุผลอย่างมีตรรกะ
VeGraph (Verify-in-the-Graph) เกิดจากทีมวิศวกรรมของ Viettel Data และศูนย์บริการปัญญาประดิษฐ์ โดยจะแยกคำขอยืนยันออกเป็นเงื่อนไขเล็กๆ น้อยๆ และเปรียบเทียบกับแหล่งที่มาที่มีอำนาจ เช่น เอกสารทางกฎหมาย ข้อมูลของรัฐบาล และเอกสารเฉพาะทาง ต่างจากวิธีการปัจจุบันจำนวนมากที่พึ่งพาเพียงโมเดลภาษาขนาดใหญ่ (LLM) VeGraph ได้จัดระเบียบกระบวนการตรวจสอบให้เป็นขั้นตอนที่ชัดเจน เพิ่มความโปร่งใส และลดปรากฏการณ์ "ภาพลวงตา" ซึ่งเมื่อ AI สร้างข้อมูลเท็จโดยอัตโนมัติ
นอกจากจะมีประสิทธิภาพในการตรวจสอบข้อมูลแล้ว VeGraph ยังสามารถใช้งานได้ดีอีกด้วย เทคโนโลยีนี้สามารถรวมเข้ากับระบบ AI เพื่อเพิ่มความน่าเชื่อถือหรือใช้งานโดยอิสระในพื้นที่ต่างๆ เช่น การแพทย์ การสื่อสารมวลชน กฎหมาย หรือการบริหารจัดการของรัฐ ผู้คนสามารถนำไปใช้เพื่อยืนยันข้อมูลสำคัญที่ต้องการความถูกต้องสูง เช่น ข่าวสารในปัจจุบัน ข้อมูลยา วัคซีน หรือกฎหมายต่างๆ ด้วยตนเองได้อย่างเต็มที่
ในอนาคต Viettel AI มีเป้าหมายที่จะพัฒนา VeGraph เพื่อประมวลผลรูปแบบข้อมูลหลาย ๆ รูปแบบ เช่น รูปภาพ วิดีโอ และเสียง พร้อมทั้งเพิ่มความสามารถในการเข้าใจภาษาที่ซับซ้อน เช่น อุปมา ความหมาย และการบูรณาการกราฟความรู้ เพื่อเพิ่มความสามารถในการใช้เหตุผล
NAACL 2025 (การประชุมประจำปีของ Nations of the Americas Chapter of the Association for Computational Linguistics) เป็นฟอรัมวิทยาศาสตร์อันทรงเกียรติชั้นนำของโลกในด้านการประมวลผลภาษาธรรมชาติและภาษาศาสตร์เชิงคำนวณ
ในปีนี้ การประชุมสามารถดึงดูดเอกสารได้จำนวนมากเป็นประวัติการณ์กว่า 3,000 ฉบับ และมีอัตราการยอมรับเอกสารสำคัญที่สูงมาก (ประมาณ 22%) ซึ่งนำผลงานวิจัยที่ก้าวล้ำที่สุดมารวมไว้ด้วยกัน
NAACL 2025 มุ่งเน้นเป็นพิเศษที่ความก้าวหน้าอย่างก้าวกระโดดในด้านการพัฒนาโมเดลภาษาขนาดใหญ่ การประมวลผลภาษาธรรมชาติข้ามวัฒนธรรมและหลายภาษา ความสามารถในการอนุมานที่เกิดขึ้นใหม่ และ AI ที่รับผิดชอบ
ที่มา: https://nld.com.vn/ai-cua-nguoi-viet-biet-kiem-tra-thong-tin-biet-noi-su-that-196250517125935127.htm
การแสดงความคิดเห็น (0)