A transformação da IA no Vietnã está ocorrendo com força, e a tecnologia OCR (reconhecimento óptico de caracteres) desempenha um papel cada vez mais importante na digitalização de documentos. Foto: Ilustração
Recentemente, o CMC Technology Application Institute (CMC ATI) anunciou o modelo CATI-VLM (Visual Document Understanding) desenvolvido pela equipe de pesquisa a partir de um grande data warehouse de 5 TB, alcançando o Top 12 no mundo e o Top 1 no Vietnã no ranking recém-anunciado pela Robust Reading Competition (RRC) em junho de 2025 na categoria Document Visual Question Answering (DocVQA).
O Sr. Dang Minh Tuan, Diretor do CMC ATI, declarou: "Estamos muito felizes que a capacidade de pesquisa da equipe do CMC tenha sido confirmada por um ambiente global de prestígio como o RRC. Estamos orgulhosos de que, em tão pouco tempo, a equipe tenha alcançado uma alta classificação, equiparando-se a grandes nomes de países desenvolvidos. Mais importante ainda, esta é uma demonstração clara da capacidade de dominar a tecnologia para resolver problemas específicos do Vietnã e de áreas especializadas no Vietnã."
No contexto da transformação digital e da transformação da IA que estão ocorrendo fortemente no Vietnã, a tecnologia OCR (Reconhecimento Óptico de Caracteres) desempenha um papel cada vez mais importante na digitalização de documentos, automatização de processos de negócios, economia de custos e melhoria da eficiência da gestão.
Entretanto, com as características do vietnamita com sotaques e caligrafia, o problema de reconhecimento não para na "leitura de palavras", mas exige que o modelo tenha a capacidade de entender o contexto de forma abrangente.
O CATI-VLM difere do OCR tradicional porque não apenas extrai caracteres, mas também entende múltiplas camadas de informação: conteúdo de texto, elementos não textuais (caixas de seleção, caixas de seleção, gráficos, assinaturas, fórmulas), layout (estrutura de página, tabelas, formulários) e estilo (fontes, destaques…).
O modelo pode responder a perguntas visuais colocadas em imagens de documentos, semelhante ao ChatGPT, sem precisar aprender formulários específicos antecipadamente.
O Robust Reading Competition (RRC) é um prestigiado evento científico , organizado pelo Computer Vision Center da Universitat Autònoma de Barcelona (UAB), Espanha, um prestigiado centro de pesquisa no mundo na área de visão computacional.
Iniciada em 2011, sempre acompanhando a Conferência Internacional sobre Análise e Reconhecimento de Texto ICDAR - um dos maiores fóruns do mundo sobre análise de documentos e visão computacional, a competição se tornou um evento importante, atraindo pesquisadores, engenheiros de universidades de prestígio, institutos de pesquisa e empresas de tecnologia, como a Universidade Tsinghua, Hyundai Motor Group e Tencent...
As missões do RRC são projetadas para impulsionar o avanço tecnológico, ancoradas em problemas do mundo real, que vão desde tradução e gerenciamento de dados empresariais até análise urbana e processamento de documentos históricos.
Do trabalho à criação dos filhos: como os CEOs de tecnologia usam a IA no dia a diaDe Jensen Huang a Tim Cook, os CEOs de tecnologia mais poderosos do mundo estão aproveitando a IA em suas vidas cotidianas.
Fonte: https://vietnamnet.vn/ai-loi-make-in-vietnam-cua-cmc-duoc-xep-hang-top-12-the-gioi-2417479.html
Comentário (0)