
กรอบการทำงานสำหรับการวัดประสิทธิภาพ VLegal-Bench ซึ่งพัฒนาโดยกลุ่มวิจัย C-OpenAI ได้รับการจดทะเบียนในพอร์ทัล arXiv ของมหาวิทยาลัยคอร์เนล ประเทศสหรัฐอเมริกา โดยเวอร์ชันล่าสุดได้รับการอัปเดตเมื่อวันที่ 25 ธันวาคม 2025
CMC OpenAI ซึ่งเป็นบริษัทในเครือของ CMC Technology Group เพิ่งประกาศเปิดตัวโมเดลภาษาขนาดใหญ่ด้านกฎหมายภาษาเวียดนาม CMC-AI-Legal-32B พร้อมกับมาตรฐานการวัดประสิทธิภาพ VLegal-Bench
นี่ถือเป็นก้าวสำคัญในการวางรากฐานสำหรับการพัฒนาผู้ช่วยเสมือนจริงด้านกฎหมายภาษาเวียดนามที่มีความแม่นยำสูงและสอดคล้องกับระบบกฎหมายภายในประเทศ
จากข้อมูลของ CMC OpenAI แนวทางในการจัดการโมเดลภาษาขนาดใหญ่และตัวชี้วัดการประเมินผลไปพร้อมๆ กันนั้นมีความสำคัญอย่างยิ่งในสาขาที่มีความละเอียดอ่อน เช่น ด้านกฎหมาย ซึ่งมีความต้องการสูงในด้านความถูกต้อง ความน่าเชื่อถือ และการปฏิบัติตามมาตรฐาน การเป็นเจ้าของทั้งโมเดลและชุดมาตรฐานทำให้มั่นใจได้ว่าแอปพลิเคชัน AI ไม่เพียงแต่จะทำงานได้ดีเท่านั้น แต่ยังสามารถประเมินได้อย่างเป็นกลางและโปร่งใสอีกด้วย
จุดเด่นของการประกาศครั้งนี้คือโมเดล CMC-AI-Legal-32B ซึ่งสร้างขึ้นบนพื้นฐานที่สืบทอดมาจากโมเดลภาษาขนาดใหญ่สมัยใหม่ และได้รับการปรับแต่งอย่างพิถีพิถันเพื่อให้เหมาะสมกับระบบกฎหมายของเวียดนาม ในการทดสอบ VLegal-Bench โมเดลนี้ทำผลงานได้ดีเยี่ยม โดยครองตำแหน่งผู้นำด้านประสิทธิภาพโดยรวม ทำได้ดีที่สุด 6 จาก 22 งาน และโดดเด่นในปัญหาที่ต้องใช้การให้เหตุผลและการโต้แย้งทางกฎหมายหลายขั้นตอน
ทีมวิจัยระบุว่า โมเดลเชิงพาณิชย์ทั่วไป เช่น GPT-4o, Claude หรือ Gemini ยังคงทำงานได้อย่างมีประสิทธิภาพในงานทั่วไป เช่น การระบุตัวตนหรือการค้นหาข้อมูล
อย่างไรก็ตาม เมื่อต้องทำงานที่ต้องใช้เหตุผลทางกฎหมายที่ซับซ้อน หรือการสร้างข้อความทางกฎหมายตามโครงสร้างและมาตรฐานอ้างอิงของเวียดนาม ประสิทธิภาพของแบบจำลองเหล่านี้จะลดลงอย่างมาก
ในขณะเดียวกัน โมเดลที่ได้รับการฝึกฝนในบริบทและลักษณะเฉพาะของกฎหมายเวียดนามให้ผลลัพธ์ที่เหนือกว่า
นอกเหนือจากแบบจำลองแล้ว เกณฑ์มาตรฐาน VLegal-Bench ยังถือเป็นเสาหลักที่สองของระบบนิเวศนี้ เกณฑ์มาตรฐานประกอบด้วยตัวอย่างข้อมูล 10,450 ตัวอย่าง พร้อมคำตอบที่เป็นมาตรฐาน แบ่งออกเป็น 22 งาน และออกแบบตามระดับการอนุมานที่เพิ่มขึ้นเรื่อยๆ 5 ระดับ ตั้งแต่การระบุและดึงข้อความ การอนุมานหลายขั้นตอน การตีความและการสร้างเนื้อหาทางกฎหมาย ไปจนถึงการประเมินด้านจริยธรรม ความเป็นธรรม และความลำเอียงของแบบจำลอง
VLegal-Bench ถูกสร้างขึ้นเพื่อสะท้อนลักษณะเฉพาะของระบบกฎหมายเวียดนามอย่างใกล้ชิด โดยอิงตามประเพณีกฎหมายแพ่ง รวมถึงโครงสร้างลำดับชั้นของเอกสารทางกฎหมาย ผลทางกฎหมาย ความสัมพันธ์ระหว่างการแก้ไขและการแทนที่ และข้อกำหนดในการอ้างอิงกฎหมายเฉพาะ ตัวอย่างข้อมูลแต่ละรายการเชื่อมโยงกับเอกสารทางกฎหมายระดับส่วนกลาง ทำให้สามารถตรวจสอบและติดตามที่มาได้
ธุรกิจที่มีวิสัยทัศน์ในการสร้างแพลตฟอร์ม AI ที่เปิดกว้าง ปลอดภัย และเป็นกรรมสิทธิ์ของคนในประเทศ จะส่งเสริมให้ชุมชนธุรกิจและนักพัฒนาเข้ามามีส่วนร่วมในการสร้างแอปพลิเคชัน AI บนแพลตฟอร์มร่วมกัน
CMC OpenAI วางแผนที่จะเปิดเผยซอร์สโค้ด ข้อมูล และกระบวนการประเมินผลต่อสาธารณะอย่างโปร่งใส พร้อมทั้งเชิญชวนผู้เชี่ยวชาญทั้งในและต่างประเทศเข้าร่วมเพื่อพัฒนาปรับปรุงระบบนิเวศนี้อย่างต่อเนื่อง
ในอนาคตอันใกล้ CMC OpenAI มีแผนที่จะเผยแพร่ซอร์สโค้ดและคลังข้อมูลของ VLegal-Bench ขยายเว็บไซต์สำหรับการเปรียบเทียบโมเดล และประกาศเวอร์ชันเปิดเป็นระยะตลอดปี 2026 โดยมีเป้าหมายเพื่อสร้างแพลตฟอร์มมาตรฐานที่มีกลไกการตรวจสอบที่ชัดเจน เพื่อรองรับการพัฒนาแอปพลิเคชัน AI เฉพาะทาง และส่งเสริมการพัฒนาอย่างยั่งยืนของระบบนิเวศ AI ในเวียดนาม
มินห์ ไฮ
ที่มา: https://tuoitre.vn/cmc-openai-phat-develop-mo-hinh-ai-phap-ly-tieng-viet-20251225075949777.htm






การแสดงความคิดเห็น (0)