
Benchmarkovací rámec VLegal-Bench vyvinutý výzkumnou skupinou C-OpenAI je registrován na portálu arXiv Cornell University v USA, přičemž nejnovější verze byla aktualizována 25. prosince 2025.
Společnost CMC OpenAI, dceřiná společnost CMC Technology Group, právě oznámila vietnamský model právního jazyka CMC-AI-Legal-32B spolu s benchmarkem VLegal-Bench.
Toto je považováno za důležitý krok při pokládání základů pro vývoj vysoce přesných vietnamských právních virtuálních asistentů, kteří jsou kompatibilní s domácím právním systémem.
Podle CMC OpenAI je přístup simultánního zvládnutí rozsáhlých jazykových modelů a hodnotících metrik klíčový v citlivých oblastech, jako je právo, kde jsou kladeny vysoké nároky na přesnost, ověřitelnost a dodržování standardů. Vlastnictví modelu i souboru standardů zajišťuje, že aplikace umělé inteligence nejen dobře fungují, ale také mohou být objektivně a transparentně hodnoceny.
Vrcholem tohoto oznámení je model CMC-AI-Legal-32B, postavený na základech zděděných od moderních rozsáhlých jazykových modelů a pečlivě vylepšený tak, aby vyhovoval vietnamskému právnímu systému. V benchmarku VLegal-Bench dosáhl tento model vedoucího postavení v celkovém výkonu, když zvítězil v 6 z 22 úkolů a vynikal v problémech vyžadujících vícestupňové právní uvažování a argumentaci.
Výzkumný tým uvedl, že běžné komerční modely, jako jsou GPT-4o, Claude nebo Gemini, stále efektivně fungují v běžných úkolech, jako je identifikace nebo vyhledávání informací.
Pokud však jde o úkoly vyžadující složité právní uvažování nebo tvorbu právních textů podle vietnamských strukturálních a referenčních standardů, výkonnost těchto modelů se výrazně snižuje.
Modely trénované v kontextu a specifikách vietnamského práva mezitím přinesly vynikající výsledky.
Spolu s modelem je za druhý pilíř tohoto ekosystému považován benchmark VLegal-Bench. Benchmark zahrnuje 10 450 datových vzorků se standardizovanými odpověďmi, rozdělených do 22 úkolů a navržených podle pěti postupně rostoucích úrovní inference, od identifikace a vyhledávání klauzulí, vícekrokové inference, interpretace a generování právního obsahu až po hodnocení etických, spravedlivých a zaujatých aspektů modelu.
VLegal-Bench je vytvořen tak, aby co nejvěrněji odrážel specifické rysy vietnamského právního systému založeného na tradici občanského práva, včetně hierarchické struktury právních dokumentů, právního účinku, vztahu mezi změnou a nahrazením a požadavku citovat konkrétní zákony. Každý vzorek dat je propojen s právními dokumenty na centrální úrovni, což zajišťuje možnost ověření a dohledání jejich původu.
Firmy, které usilují o vybudování otevřené, bezpečné a v tuzemsku vlastněné platformy umělé inteligence, povzbudí podnikatelskou komunitu a vývojáře k účasti na vytváření aplikací umělé inteligence na sdílené platformě.
CMC OpenAI plánuje transparentním způsobem veřejně zveřejnit svůj zdrojový kód, data a proces hodnocení a zároveň vyzvat k účasti domácí i mezinárodní odborníky s cílem postupně vylepšovat tento ekosystém.
V blízké budoucnosti plánuje CMC OpenAI zveřejnit zdrojový kód a datové úložiště VLegal-Bench, rozšířit webové stránky pro porovnání modelů a v průběhu roku 2026 postupně oznamovat otevřené verze. Cílem je vytvořit standardizovanou platformu s jasným ověřovacím mechanismem, která bude sloužit vývoji specializovaných aplikací umělé inteligence a přispěje k udržitelnému rozvoji ekosystému umělé inteligence ve Vietnamu.
MINH HAI
Zdroj: https://tuoitre.vn/cmc-openai-phat-develop-mo-hinh-ai-phap-ly-tieng-viet-20251225075949777.htm






Komentář (0)