A IA principal 'Make in Vietnam' da CMC está classificada entre as 12 melhores do mundo

Modelo de IA.jpg

A transformação da IA no Vietnã está ocorrendo com força total, e a tecnologia OCR (reconhecimento óptico de caracteres) desempenha um papel cada vez mais importante na digitalização de documentos. Foto: Ilustração

Recentemente, o CMC Technology Application Institute (CMC ATI) anunciou o modelo CATI-VLM (Visual Document Understanding) desenvolvido pela equipe de pesquisa a partir de um grande data warehouse de 5 TB, alcançando o Top 12 no mundo e o Top 1 no Vietnã no ranking recém-anunciado pela Robust Reading Competition (RRC) em junho de 2025 na categoria Document Visual Question Answering (DocVQA).

O Sr. Dang Minh Tuan, Diretor da CMC ATI, declarou: "Estamos muito satisfeitos que a capacidade de pesquisa da equipe da CMC tenha sido confirmada por um ambiente global de prestígio como o RRC. Estamos orgulhosos de que, em tão pouco tempo, a equipe tenha alcançado uma alta classificação, equiparando-se a grandes nomes de países desenvolvidos. Mais importante ainda, esta é uma demonstração clara da capacidade de dominar a tecnologia para resolver problemas específicos do Vietnã e de áreas especializadas no Vietnã."

No contexto da transformação digital e da transformação da IA que estão ocorrendo fortemente no Vietnã, a tecnologia OCR (Reconhecimento Óptico de Caracteres) desempenha um papel cada vez mais importante na digitalização de documentos, na automação de processos de negócios, na economia de custos e na melhoria da eficiência da gestão.

Entretanto, com as características do vietnamita com sotaques e caligrafia, o problema de reconhecimento não para na "leitura de palavras", mas exige que o modelo tenha a capacidade de entender o contexto de forma abrangente.

O CATI-VLM difere do OCR tradicional porque não apenas extrai caracteres, mas também entende múltiplas camadas de informação: conteúdo de texto, elementos não textuais (caixas de seleção, caixas de seleção, gráficos, assinaturas, fórmulas), layout (estrutura de página, tabelas, formulários) e estilo (fontes, destaques…).

O modelo pode responder a perguntas visuais colocadas em imagens de documentos, semelhante ao ChatGPT, sem precisar aprender formulários específicos com antecedência.

CMC AI.jpg

O Robust Reading Competition (RRC) é um prestigiado evento científico , organizado pelo Computer Vision Center da Universitat Autònoma de Barcelona (UAB), Espanha, uma prestigiada instalação de pesquisa no mundo na área de visão computacional.

Iniciada em 2011, sempre acompanhando a Conferência Internacional sobre Análise e Reconhecimento de Texto ICDAR - um dos maiores fóruns do mundo sobre análise de documentos e visão computacional, a competição se tornou um evento importante, atraindo pesquisadores, engenheiros de universidades de prestígio, institutos de pesquisa e empresas de tecnologia como a Universidade Tsinghua, Hyundai Motor Group e Tencent...

As missões do RRC são projetadas para impulsionar o avanço tecnológico, vinculado a problemas do mundo real, desde tradução e gerenciamento de dados empresariais até análise urbana e processamento de documentos históricos.

Do trabalho à criação dos filhos: como os CEOs de tecnologia usam a IA no dia a diaDe Jensen Huang a Tim Cook, os CEOs de tecnologia mais poderosos do mundo estão aproveitando a IA em suas vidas cotidianas.

Comentário (0)