NAACL 2025 (การประชุมประจำปีของ Nations of the Americas Chapter of the Association for Computational Linguistics) เป็นฟอรัม วิทยาศาสตร์ อันทรงเกียรติชั้นนำของโลกในด้านการประมวลผลภาษาธรรมชาติและภาษาศาสตร์เชิงคำนวณ
จากข้อมูลของ Viettel ในช่วงบ่ายของวันที่ 16 พฤษภาคม ระบุว่า การระเบิดของอินเตอร์เน็ตและเครือข่ายโซเชียลทำให้เนื้อหาที่สร้างโดยผู้ใช้เป็นที่นิยมเพิ่มมากขึ้น พร้อมกันนี้ยังทำให้เกิดกระแสข่าวปลอมและข่าวไม่เป็นทางการแพร่กระจายไปอย่างกว้างขวาง ข้อมูลเท็จเหล่านี้ไม่เพียงแต่ก่อให้เกิดความสับสนแก่ผู้คนในด้านที่มีความอ่อนไหว เช่น สุขภาพ ภัยธรรมชาติ นโยบายสาธารณะ ฯลฯ เท่านั้น แต่ยังนำไปสู่ผลที่ร้ายแรง เช่น ความเสียหายทางเศรษฐกิจ การสูญเสียชื่อเสียงขององค์กร และภัยคุกคามต่อความมั่นคงของชาติอีกด้วย
“ในอดีต ข้อมูลดังกล่าวจะมีผลกระทบในช่วงเวลาและขอบเขตที่กำหนดเท่านั้น แต่ในปัจจุบัน ข้อมูลดังกล่าวมีความอันตรายเพิ่มมากขึ้นเมื่อข้อมูลดังกล่าวกลายเป็นส่วนหนึ่งของข้อมูลอินพุตสำหรับระบบปัญญาประดิษฐ์ (AI) ในกระบวนการค้นหาและรวบรวมข้อมูลเพื่อตอบสนองต่อผู้ใช้ ระบบต่างๆ เช่น แชทบอทและผู้ช่วยเสมือนสามารถใช้ สร้าง หรือเผยแพร่ข้อมูลเท็จได้อย่างสมบูรณ์ หากไม่มีความสามารถในการตรวจสอบตนเอง” ตัวแทนของ Viettel กล่าว
การตรวจสอบข้อเท็จจริงคือกระบวนการตรวจยืนยันความจริงหรือความเท็จของข้อมูลชิ้นหนึ่ง ตัวอย่างเช่น เป้าหมายของการตรวจสอบคำกล่าวที่ว่า “NASA พบสิ่งมีชีวิตบนดาวอังคาร” คือการตรวจสอบว่าข้อมูลนี้มีพื้นฐานมาจากข้อเท็จจริงที่เผยแพร่หรือไม่ ผ่านทางแหล่งข้อมูลที่เชื่อถือได้ เช่น หนังสือพิมพ์ ข้อมูลทางวิทยาศาสตร์ หรือฐานความรู้ เพื่อตรวจสอบข้อมูลด้วยตนเอง ระบบ AI จะต้องสามารถเข้าใจประโยค ค้นหาข้อมูลที่เกี่ยวข้อง และดึงข้อสรุปเชิงตรรกะจากข้อมูลเชิงวัตถุได้
VeGraph (Verify-in-the-Graph) เป็นวิธีการตรวจสอบข้อมูลที่ได้รับการวิจัย พัฒนา และนำเสนอโดยทีมวิศวกรของ Viettel Data Services และศูนย์ปัญญาประดิษฐ์ (Viettel AI) ในงาน NAACL 2025 ซึ่งเป็นหนึ่งใน 3 การประชุมนานาชาติที่มีชื่อเสียงที่สุดด้านการประมวลผลภาษาธรรมชาติ ผลการทดลองจากชุดข้อมูลการตรวจสอบความถูกต้องยอดนิยมสองชุด ได้แก่ HoVer และ FEVEROUS แสดงให้เห็นว่า VeGraph เพิ่มความแม่นยำได้ 2 - 5% เมื่อเทียบกับวิธีการที่มีอยู่ในปัจจุบัน
ตามที่ผู้เชี่ยวชาญด้าน AI ของ Viettel กล่าว วิธีการตรวจสอบข้อมูลในปัจจุบันส่วนใหญ่ยังคงมีปัญหาในการจัดการกับข้อความที่คลุมเครือ เปรียบเทียบ หรือมีหลายชั้น ซึ่งมักใช้เพื่อ "ปกปิด" ข้อมูลปลอม ในขณะเดียวกันก็ไม่สามารถอธิบายได้อย่างชัดเจนว่าเหตุใดเนื้อหาชิ้นหนึ่งจึงได้รับการจัดอันดับว่าเป็นเท็จ ซึ่งทำให้ผู้ใช้ยากที่จะเชื่อถือผลลัพธ์ดังกล่าว วิธีการต่างๆ มากมายยังพึ่งพาโมเดลภาษาขนาดใหญ่ (LLM) อย่างมาก ซึ่งขาดความสามารถในการตรวจสอบกับแหล่งความรู้ที่น่าเชื่อถือ นำไปสู่ความเสี่ยงในการสรุปผลที่ผิดพลาด ซึ่งเรียกอีกอย่างว่า “ภาพหลอน”
VeGraph เป็นเครื่องมือที่แยกคำขอตรวจสอบข้อมูลออกเป็นข้อเสนอย่อยๆ อย่างเป็นขั้นตอนอย่างชัดเจน ซึ่งแตกต่างจากเครื่องมืออื่นๆ ที่ทำการอนุมานภายในโมเดลเพียงอย่างเดียว จากนั้นจึงทำการเปรียบเทียบกับข้อมูลอ้างอิงที่เชื่อถือได้ เช่น เอกสารทางกฎหมาย ฐานข้อมูลของรัฐบาล เอกสารเฉพาะทาง ฯลฯ โดยกระบวนการตรวจสอบทั้งหมดจะถูกจัดระบบเป็นขั้นตอนที่ชัดเจน ทำให้ผู้ใช้สามารถติดตามและตรวจสอบได้ง่าย ช่วยเพิ่มความแม่นยำและความโปร่งใส ซึ่งเป็นปัจจัยที่มีความสำคัญเพิ่มมากขึ้นในแอปพลิเคชัน AI คุณสมบัตินี้ยังช่วยให้องค์กรปรับปรุงและปรับปรุงระบบได้อย่างรวดเร็วเมื่อจำเป็น
VeGraph มุ่งมั่นที่จะสร้างสภาพแวดล้อมดิจิทัลที่โปร่งใสและปลอดภัย และได้รับการยกย่องอย่างสูงในการใช้งานจริง นอกจากความสามารถในการบูรณาการเข้ากับระบบ AI เพื่อเพิ่มความแม่นยำและความน่าเชื่อถือแล้ว เทคโนโลยีนี้ยังสามารถพัฒนาเป็นระบบตรวจสอบข้อมูลในสาขาต่างๆ ได้อีกมากมาย เช่น การแพทย์ วารสารศาสตร์ กฎหมาย หรือการบริหารราชการแผ่นดิน... ด้วยเหตุนี้ ผู้คนจึงสามารถตรวจสอบข้อมูลสำคัญที่ต้องการความถูกต้องสูงได้ด้วยตัวเอง เช่น ข่าวสารในปัจจุบัน ข้อมูลเกี่ยวกับยา วัคซีน เภสัชภัณฑ์ หรือกฎหมายต่างๆ...
ในอนาคต VeGraph จะขยายตัวให้รองรับรูปแบบข้อมูลหลากหลาย เช่น รูปภาพ วิดีโอ เสียง เป็นต้น สามารถจดจำรูปแบบภาษาที่ซับซ้อน เช่น อุปมา ความหมายที่แฝง และผสานกราฟความรู้เพื่อเพิ่มความสามารถในการใช้เหตุผล
ในปีนี้ งาน NAACL 2025 ดึงดูดเอกสารวิจัยจำนวนสูงเป็นประวัติการณ์ โดยมีมากกว่า 3,000 ฉบับ และอัตราการยอมรับเอกสารหลักที่สูงอย่างมาก (ประมาณ 22%) โดยนำผลงานวิจัยที่ก้าวล้ำที่สุดมาไว้รวมกัน NAACL 2025 มุ่งเน้นเป็นพิเศษที่ความก้าวหน้าอย่างก้าวกระโดดในด้านการพัฒนาโมเดลภาษาขนาดใหญ่ การประมวลผลภาษาธรรมชาติข้ามวัฒนธรรมและหลายภาษา ความสามารถในการอนุมานที่เกิดขึ้นใหม่ และ AI ที่รับผิดชอบ
ที่มา: https://doanhnghiepvn.vn/cong-nghe/khi-ai-biet-kiem-chung-su-that-buoc-tien-moi-tu-viettel-ai-tai-naacl-2025/20250519080205067
การแสดงความคิดเห็น (0)