Este novo modelo não só desafia o domínio dos gigantes americanos, como também remodela todo o jogo com código aberto (Imagem ilustrativa: DS).
Este modelo possui 685 bilhões de parâmetros e é disponibilizado sob uma licença de código aberto. Os resultados dos testes iniciais mostram um desempenho comparável ao de sistemas proprietários da OpenAI ou da Anthropic, e abre novas abordagens para o desenvolvimento e a distribuição de modelos avançados de IA.
Desempenho e custo
Logo após seu lançamento na plataforma Hugging Face, o DeepSeek V3.1 alcançou uma pontuação de 71,6% no teste de programação Aider. Tecnicamente, o modelo é capaz de lidar com contextos de até 128.000 tokens (o equivalente a um livro de 400 páginas). A estrutura é apresentada como "híbrida", integrando funcionalidades de chat, inferência e programação.
O pesquisador de IA Andrew Christianson afirmou na plataforma de mídia social X: "O DeepSeek V3.1 alcançou 71,6% no Aider, cerca de 1% a mais que o Claude Opus 4, e custando significativamente menos."
Segundo cálculos, o custo médio para concluir uma tarefa de programação usando a versão 3.1 é de cerca de US$ 1,01, enquanto sistemas comparáveis podem custar quase US$ 70.
Alguns desenvolvedores da comunidade também notaram a presença de quatro "tokens especiais" na arquitetura, permitindo que o modelo integre buscas na web em tempo real e lide com processos de inferência complexos.
Essa diferença se traduz em milhões de dólares em economia para empresas que lidam com milhares de interações de IA todos os dias.
Vantagem que muda o jogo
O lançamento da versão 3.1 coincidiu com o anúncio de novos modelos pela OpenAI e pela Anthropic. Ao optar por uma abordagem de código aberto, a DeepSeek adotou uma estratégia diferente da de muitas empresas americanas que comercializam modelos de IA por meio de APIs pagas.
Alguns argumentam que a ampla disponibilidade de recursos avançados pode facilitar uma implementação mais rápida por parte de organizações e empresas, ao mesmo tempo que representa um desafio para os modelos de negócios baseados em monopólios tecnológicos.
O surgimento do DeepSeek V3.1 demonstra que a IA avançada não é exclusividade de grandes corporações, mas também permite a participação de grupos de pesquisa menores.
A competição neste campo já não se limita à construção do sistema mais poderoso, mas também gira em torno da capacidade de tornar a tecnologia acessível e economicamente viável.
Nesse contexto, a questão para as empresas de tecnologia é como manter o valor comercial quando surgem cada vez mais modelos de código aberto com desempenho e custo competitivos.
Fonte: https://dantri.com.vn/cong-nghe/deepseek-am-tham-ra-phien-ban-ai-moi-20250820121017977.htm






Comentário (0)