Vietnam.vn - Nền tảng quảng bá Việt Nam

DeepSeek avança novamente

A DeepSeek anuncia o modelo DeepSeek-OCR que usa a percepção visual como meio de compressão para processar documentos grandes com 20 vezes menos tokens do que os métodos tradicionais.

ZNewsZNews23/10/2025

DeepSeek lança novo modelo de IA que pode processar documentos com 7 a 20 vezes menos tokens do que os métodos tradicionais. Foto: The Verge .

De acordo com o SCMP , a DeepSeek lançou um novo modelo de inteligência artificial (IA) multimodal que é capaz de processar documentos grandes e complexos com um número significativamente menor de tokens, 7 a 20 vezes menos do que os métodos tradicionais de processamento de texto.

Tokens são as menores unidades de texto processadas pela IA. Reduzir o número de tokens significa economizar custos computacionais e aumentar a eficiência de um modelo de IA.

Para isso, o modelo DeepSeek-OCR (reconhecimento óptico de caracteres) utilizou a percepção visual como meio de compressão de informações. Essa abordagem permite que grandes modelos de linguagem processem grandes volumes de texto sem incorrer em um custo computacional proporcionalmente maior.

“Por meio do DeepSeek-OCR, demonstramos que usar a percepção visual para compactar informações pode alcançar reduções significativas de tokens – de 7 a 20 vezes para diferentes períodos de contexto histórico, fornecendo uma direção promissora”, disse o DeepSeek.

De acordo com a postagem do blog da empresa, o DeepSeek-OCR consiste em dois componentes principais, o DeepEncoder e o DeepSeek3B-MoE-A570M, que atua como um decodificador.

Entre eles, o DeepEncoder atua como o mecanismo central do modelo, ajudando a manter baixos níveis de ativação sob entrada de alta resolução, ao mesmo tempo em que atinge uma forte taxa de compressão para reduzir o número de tokens.

O decodificador é então um modelo de Mistura de Especialistas (MoE) com 570 milhões de parâmetros, encarregado de reproduzir o texto original. A arquitetura MoE divide o modelo em sub-redes especializadas no processamento de um subconjunto dos dados de entrada, otimizando o desempenho sem a necessidade de ativar o modelo inteiro.

No OmniDocBench, um benchmark de legibilidade de documentos, o DeepSeek-OCR supera os principais modelos de OCR, como GOT-OCR 2.0 e MinerU 2.0, usando muito menos tokens.

Fonte: https://znews.vn/deepseek-lai-co-dot-pha-post1595902.html


Comentário (0)

No data
No data

Herança

Figura

Negócios

Jovens vão ao Noroeste para fazer check-in durante a mais bela temporada de arroz do ano

Eventos atuais

Sistema político

Local

Produto