
چارچوب معیارسنجی VLegal-Bench که توسط گروه تحقیقاتی C-OpenAI توسعه داده شده است، در پورتال arXiv دانشگاه کرنل، ایالات متحده آمریکا ثبت شده است و آخرین نسخه آن در ۲۵ دسامبر ۲۰۲۵ بهروزرسانی شده است.
CMC OpenAI، زیرمجموعه گروه فناوری CMC، به تازگی مدل زبان حقوقی ویتنامی CMC-AI-Legal-32B را به همراه بنچمارک VLegal-Bench معرفی کرده است.
این گامی مهم در جهت ایجاد پایه و اساس توسعه دستیاران مجازی حقوقی بسیار دقیق به زبان ویتنامی است که با سیستم حقوقی داخلی سازگار باشند.
طبق گفته CMC OpenAI، رویکرد تسلط همزمان بر مدلهای زبانی در مقیاس بزرگ و معیارهای ارزیابی در زمینههای حساسی مانند حقوقی، که در آنها تقاضاهای بالایی بر دقت، قابلیت تأیید و رعایت استانداردها وجود دارد، بسیار مهم است. داشتن مدل و مجموعهای از استانداردها تضمین میکند که برنامههای هوش مصنوعی نه تنها عملکرد خوبی دارند، بلکه میتوانند به صورت عینی و شفاف نیز ارزیابی شوند.
نکته برجسته این اطلاعیه، مدل CMC-AI-Legal-32B است که بر پایه مدلهای زبانی مدرن در مقیاس بزرگ ساخته شده و با دقت اصلاح شده تا با سیستم حقوقی ویتنام سازگار باشد. در معیار VLegal-Bench، این مدل در عملکرد کلی جایگاه پیشرو را به دست آورد و از 22 وظیفه، 6 وظیفه را به پایان رساند و در مسائلی که نیاز به استدلال و بحث حقوقی چند مرحلهای دارند، عالی عمل کرد.
تیم تحقیقاتی اظهار داشت که مدلهای تجاری عمومی مانند GPT-4o، Claude یا Gemini هنوز در کارهای رایجی مانند شناسایی یا بازیابی اطلاعات به طور مؤثر عمل میکنند.
با این حال، وقتی صحبت از وظایفی میشود که نیاز به استدلال حقوقی پیچیده دارند یا متون حقوقی را طبق ساختار و استانداردهای مرجع ویتنامی ایجاد میکنند، عملکرد این مدلها به طور قابل توجهی کاهش مییابد.
در همین حال، مدلهایی که در چارچوب و ویژگیهای قانون ویتنام آموزش دیده بودند، نتایج بهتری به همراه داشتند.
در کنار این مدل، معیار VLegal-Bench به عنوان دومین رکن این اکوسیستم در نظر گرفته میشود. این معیار شامل ۱۰۴۵۰ نمونه داده با پاسخهای استاندارد است که به ۲۲ وظیفه تقسیم شده و بر اساس پنج سطح استنتاج که به تدریج افزایش مییابند، از شناسایی و بازیابی بندها، استنتاج چند مرحلهای، تفسیر و تولید محتوای حقوقی گرفته تا ارزیابی جنبههای اخلاقی، منصفانه و جانبدارانه مدل، طراحی شده است.
VLegal-Bench به گونهای ساخته شده است که ویژگیهای خاص نظام حقوقی ویتنام را که مبتنی بر سنت حقوق مدنی است، از جمله ساختار سلسله مراتبی اسناد حقوقی، اثر حقوقی، رابطه بین اصلاح و جایگزینی و الزام به استناد به قوانین خاص، به دقت منعکس کند. هر نمونه داده به اسناد حقوقی سطح مرکزی مرتبط است و امکان تأیید و ردیابی منشأ آنها را تضمین میکند.
کسبوکارهایی که چشمانداز ساخت یک پلتفرم هوش مصنوعی باز، امن و داخلی را دنبال میکنند، جامعه کسبوکار و توسعهدهندگان را به مشارکت در ساخت برنامههای هوش مصنوعی بر روی یک پلتفرم مشترک تشویق خواهند کرد.
CMC OpenAI قصد دارد کد منبع، دادهها و فرآیند ارزیابی خود را به صورت شفاف منتشر کند و در عین حال از متخصصان داخلی و بینالمللی برای بهبود تدریجی این اکوسیستم دعوت به همکاری کند.
در آینده نزدیک، CMC OpenAI قصد دارد کد منبع و مخزن دادههای VLegal-Bench را منتشر کند، وبسایت مقایسه مدل را گسترش دهد و نسخههای باز را در طول سال 2026 به صورت مرحلهای اعلام کند. هدف، ایجاد یک پلتفرم استاندارد با مکانیسم تأیید واضح است که در خدمت توسعه برنامههای تخصصی هوش مصنوعی باشد و به توسعه پایدار اکوسیستم هوش مصنوعی ویتنام کمک کند.
مین های
منبع: https://tuoitre.vn/cmc-openai-phat-develop-mo-hinh-ai-phap-ly-tieng-viet-20251225075949777.htm






نظر (0)