
Rangka kerja penanda aras VLegal-Bench yang dibangunkan oleh kumpulan penyelidikan C-OpenAI didaftarkan di portal arXiv Universiti Cornell, Amerika Syarikat, dengan versi terkini dikemas kini pada 25 Disember 2025.
CMC OpenAI, anak syarikat CMC Technology Group, baru sahaja mengumumkan model bahasa besar perundangan Vietnam CMC-AI-Legal-32B berserta penanda aras VLegal-Bench.
Ini dianggap sebagai langkah penting dalam meletakkan asas bagi pembangunan pembantu maya undang-undang berbahasa Vietnam yang sangat tepat dan serasi dengan sistem perundangan domestik.
Menurut CMC OpenAI, pendekatan untuk menguasai model bahasa berskala besar dan metrik penilaian secara serentak adalah penting dalam bidang sensitif seperti perundangan, di mana tuntutan yang tinggi diletakkan pada ketepatan, kebolehverifikasi dan pematuhan terhadap piawaian. Memiliki kedua-dua model dan set piawaian memastikan aplikasi AI bukan sahaja berfungsi dengan baik tetapi juga boleh dinilai secara objektif dan telus.
Kemuncak pengumuman ini ialah model CMC-AI-Legal-32B, yang dibina di atas asas yang diwarisi daripada model bahasa berskala besar moden dan diperhalusi dengan teliti agar sesuai dengan sistem perundangan Vietnam. Pada penanda aras VLegal-Bench, model ini mencapai kedudukan utama dalam prestasi keseluruhan, mengatasi 6 daripada 22 tugasan dan cemerlang dalam masalah yang memerlukan penaakulan dan penghujahan perundangan berbilang langkah.
Pasukan penyelidikan menyatakan bahawa model komersial umum seperti GPT-4o, Claude atau Gemini masih berfungsi dengan berkesan dalam tugas-tugas biasa seperti pengenalpastian atau pencarian maklumat.
Walau bagaimanapun, apabila melibatkan tugasan yang memerlukan penaakulan undang-undang yang kompleks atau mencipta teks undang-undang mengikut struktur dan piawaian rujukan Vietnam, prestasi model ini menurun dengan ketara.
Sementara itu, model yang dilatih dalam konteks dan spesifikasi undang-undang Vietnam menghasilkan keputusan yang lebih baik.
Di samping model tersebut, penanda aras VLegal-Bench dianggap sebagai tonggak kedua ekosistem ini. Penanda aras ini terdiri daripada 10,450 sampel data dengan jawapan piawai, dibahagikan kepada 22 tugasan dan direka bentuk mengikut lima tahap inferens yang semakin meningkat, daripada mengenal pasti dan mendapatkan semula klausa, inferens berbilang langkah, mentafsir dan menjana kandungan undang-undang, hinggalah menilai aspek etika, adil dan berat sebelah model tersebut.
VLegal-Bench dibina untuk mencerminkan ciri-ciri khusus sistem perundangan Vietnam berdasarkan tradisi undang-undang sivil, termasuk struktur hierarki dokumen perundangan, kesan perundangan, hubungan antara pindaan dan penggantian, dan keperluan untuk memetik undang-undang tertentu. Setiap sampel data dikaitkan dengan dokumen perundangan peringkat pusat, memastikan keupayaan untuk mengesahkan dan mengesan asal usulnya.
Perniagaan yang mengejar visi untuk membina platform AI yang terbuka, selamat dan dimiliki secara domestik akan menggalakkan komuniti perniagaan dan pembangun untuk mengambil bahagian dalam membina aplikasi AI pada platform yang dikongsi.
CMC OpenAI merancang untuk mendedahkan kod sumber, data dan proses penilaiannya secara terbuka secara telus, di samping menjemput penyertaan pakar domestik dan antarabangsa untuk menambah baik ekosistem ini secara beransur-ansur.
Dalam masa terdekat, CMC OpenAI merancang untuk mengeluarkan kod sumber dan repositori data VLegal-Bench, mengembangkan laman web untuk perbandingan model dan mengumumkan versi terbuka secara berperingkat sepanjang tahun 2026. Matlamatnya adalah untuk mewujudkan platform piawai dengan mekanisme pengesahan yang jelas, yang memenuhi keperluan pembangunan aplikasi AI khusus dan menyumbang kepada pembangunan mampan ekosistem AI Vietnam.
MINH HAI
Sumber: https://tuoitre.vn/cmc-openai-phat-develop-mo-hinh-ai-phap-ly-tieng-viet-20251225075949777.htm






Komen (0)