
Opracowana przez grupę badawczą C-OpenAI platforma benchmarkingowa VLegal-Bench jest zarejestrowana w portalu arXiv Uniwersytetu Cornella w USA, a jej najnowsza wersja została zaktualizowana 25 grudnia 2025 r.

Opracowana przez grupę badawczą C-OpenAI platforma benchmarkingowa VLegal-Bench jest zarejestrowana w portalu arXiv Uniwersytetu Cornella w USA, a jej najnowsza wersja została zaktualizowana 25 grudnia 2025 r.
CMC OpenAI, spółka zależna CMC Technology Group, właśnie ogłosiła powstanie wietnamskiego modelu prawniczego CMC-AI-Legal-32B wraz z testem porównawczym VLegal-Bench.
Uważa się, że jest to ważny krok w kierunku stworzenia podwalin pod rozwój niezwykle precyzyjnych wirtualnych asystentów prawnych w języku wietnamskim, kompatybilnych z krajowym systemem prawnym.
Według CMC OpenAI, podejście polegające na jednoczesnym opanowaniu modeli językowych na dużą skalę i metryk ewaluacyjnych jest kluczowe w newralgicznych dziedzinach, takich jak prawo, gdzie stawiane są wysokie wymagania dotyczące dokładności, weryfikowalności i zgodności ze standardami. Posiadanie zarówno modelu, jak i zestawu standardów gwarantuje, że aplikacje AI nie tylko działają dobrze, ale także mogą być oceniane obiektywnie i transparentnie.
Najważniejszym elementem tego ogłoszenia jest model CMC-AI-Legal-32B, zbudowany na fundamencie odziedziczonym po nowoczesnych modelach języka wielkoskalowego i skrupulatnie dopracowany do potrzeb wietnamskiego systemu prawnego. W teście VLegal-Bench model ten osiągnął wiodącą pozycję pod względem ogólnej wydajności, uzyskując najlepsze wyniki w 6 z 22 zadań i wyróżniając się w problemach wymagających wieloetapowego rozumowania i argumentacji prawniczej.
Zespół badawczy stwierdził, że ogólne modele komercyjne, takie jak GPT-4o, Claude czy Gemini, nadal skutecznie sprawdzają się w typowych zadaniach, takich jak identyfikacja czy wyszukiwanie informacji.
Jednak w przypadku zadań wymagających skomplikowanego rozumowania prawniczego lub tworzenia tekstów prawnych zgodnie ze strukturą i standardami referencyjnymi obowiązującymi w Wietnamie, wydajność tych modeli znacznie spada.
Tymczasem modele wyszkolone w kontekście i specyfice prawa wietnamskiego dały lepsze wyniki.
Obok modelu, test porównawczy VLegal-Bench jest uważany za drugi filar tego ekosystemu. Test obejmuje 10 450 próbek danych ze znormalizowanymi odpowiedziami, podzielonych na 22 zadania i zaprojektowanych zgodnie z pięcioma stopniowo rosnącymi poziomami wnioskowania, od identyfikacji i wyszukiwania klauzul, wnioskowania wieloetapowego, interpretacji i generowania treści prawnych, po ocenę etycznych, uczciwych i stronniczych aspektów modelu.
Platforma VLegal-Bench została zaprojektowana tak, aby dokładnie odzwierciedlać specyfikę wietnamskiego systemu prawnego opartego na tradycji prawa cywilnego, w tym hierarchiczną strukturę dokumentów prawnych, skutki prawne, relację między zmianą a zastąpieniem oraz wymóg powoływania się na konkretne przepisy. Każda próbka danych jest powiązana z dokumentami prawnymi na poziomie centralnym, co umożliwia weryfikację i śledzenie ich pochodzenia.
Firmy, które chcą zbudować otwartą, bezpieczną i krajową platformę AI, będą zachęcać społeczność biznesową i deweloperów do udziału w tworzeniu aplikacji AI na wspólnej platformie.
CMC OpenAI planuje transparentnie upublicznić swój kod źródłowy, dane i proces oceny, a także zaprosić krajowych i międzynarodowych ekspertów do udziału w celu stopniowego udoskonalania tego ekosystemu.
W najbliższej przyszłości CMC OpenAI planuje udostępnić kod źródłowy i repozytorium danych VLegal-Bench, rozszerzyć witrynę internetową w celu umożliwienia porównywania modeli oraz ogłosić otwarte wersje etapami w ciągu całego roku 2026. Celem jest stworzenie ujednoliconej platformy z przejrzystym mechanizmem weryfikacji, służącej rozwojowi specjalistycznych aplikacji AI i przyczyniającej się do zrównoważonego rozwoju ekosystemu AI w Wietnamie.
MINH HAI
Źródło: https://tuoitre.vn/cmc-openai-phat-develop-mo-hinh-ai-phap-ly-tieng-viet-20251225075949777.htm