
A estrutura de avaliação comparativa VLegal-Bench, desenvolvida pelo grupo de pesquisa C-OpenAI, está registrada no portal arXiv da Universidade Cornell, EUA, com a versão mais recente atualizada em 25 de dezembro de 2025.

A estrutura de avaliação comparativa VLegal-Bench, desenvolvida pelo grupo de pesquisa C-OpenAI, está registrada no portal arXiv da Universidade Cornell, EUA, com a versão mais recente atualizada em 25 de dezembro de 2025.
A CMC OpenAI, subsidiária do CMC Technology Group, acaba de anunciar o modelo de linguagem jurídica CMC-AI-Legal-32B para vietnamita, juntamente com o benchmark VLegal-Bench.
Considera-se que este seja um passo importante para estabelecer as bases para o desenvolvimento de assistentes virtuais jurídicos em língua vietnamita altamente precisos e compatíveis com o sistema jurídico nacional.
Segundo a CMC OpenAI, a abordagem de dominar simultaneamente modelos de linguagem em larga escala e métricas de avaliação é crucial em áreas sensíveis como a jurídica, onde se impõem altas exigências em termos de precisão, verificabilidade e conformidade com as normas. Possuir tanto o modelo quanto o conjunto de normas garante que as aplicações de IA não só tenham um bom desempenho, como também possam ser avaliadas de forma objetiva e transparente.
O destaque deste anúncio é o modelo CMC-AI-Legal-32B, construído sobre uma base herdada de modelos de linguagem modernos de grande escala e meticulosamente refinado para se adequar ao sistema jurídico vietnamita. No benchmark VLegal-Bench, este modelo alcançou uma posição de liderança em desempenho geral, ficando em primeiro lugar em 6 das 22 tarefas e se destacando em problemas que exigem raciocínio e argumentação jurídica em várias etapas.
A equipe de pesquisa afirmou que modelos comerciais gerais, como GPT-4o, Claude ou Gemini, ainda apresentam bom desempenho em tarefas comuns, como identificação ou recuperação de informações.
No entanto, quando se trata de tarefas que exigem raciocínio jurídico complexo ou a criação de textos jurídicos de acordo com a estrutura e as normas de referência vietnamitas, o desempenho desses modelos diminui significativamente.
Entretanto, modelos treinados no contexto e nas especificidades da legislação vietnamita produziram resultados superiores.
Juntamente com o modelo, o benchmark VLegal-Bench é considerado o segundo pilar deste ecossistema. O benchmark compreende 10.450 amostras de dados com respostas padronizadas, divididas em 22 tarefas e projetadas de acordo com cinco níveis de inferência progressivamente crescentes, desde a identificação e recuperação de cláusulas, inferência em múltiplas etapas, interpretação e geração de conteúdo jurídico, até a avaliação dos aspectos éticos, justos e tendenciosos do modelo.
O VLegal-Bench foi desenvolvido para refletir fielmente as características específicas do sistema jurídico vietnamita baseado na tradição do direito civil, incluindo a estrutura hierárquica dos documentos legais, seus efeitos jurídicos, a relação entre emendas e substituições e a exigência de citação de leis específicas. Cada amostra de dados está vinculada a documentos legais de nível central, garantindo a possibilidade de verificação e rastreamento de sua origem.
Empresas que buscam a visão de construir uma plataforma de IA aberta, segura e de propriedade nacional incentivarão a comunidade empresarial e os desenvolvedores a participar da criação de aplicativos de IA em uma plataforma compartilhada.
A CMC OpenAI planeja divulgar publicamente seu código-fonte, dados e processo de avaliação de forma transparente, além de convidar a participação de especialistas nacionais e internacionais para aprimorar gradualmente esse ecossistema.
Em um futuro próximo, a CMC OpenAI planeja liberar o código-fonte e o repositório de dados do VLegal-Bench, expandir o site para comparação de modelos e anunciar versões abertas em etapas ao longo de 2026. O objetivo é estabelecer uma plataforma padronizada com um mecanismo de verificação claro, que sirva ao desenvolvimento de aplicações de IA especializadas e contribua para o desenvolvimento sustentável do ecossistema de IA do Vietnã.
MINH HAI
Fonte: https://tuoitre.vn/cmc-openai-phat-develop-mo-hinh-ai-phap-ly-tieng-viet-20251225075949777.htm



