Este novo modelo não apenas desafia o domínio dos gigantes americanos, mas também remodela todo o jogo com código aberto (Ilustração: DS).
O modelo possui 685 bilhões de parâmetros e é lançado sob uma licença de código aberto. Os resultados dos testes iniciais mostram que seu desempenho está no mesmo nível de sistemas proprietários da OpenAI ou Anthropic, e abre uma nova abordagem para o desenvolvimento e a distribuição de modelos avançados de IA.
Desempenho e custo
Logo após seu lançamento na plataforma Hugging Face, o DeepSeek V3.1 obteve 71,6% no teste de programação da Aider. Tecnicamente, o modelo é capaz de lidar com contextos de até 128.000 tokens (equivalente a um livro de cerca de 400 páginas). A arquitetura é descrita como "híbrida", integrando funções de conversação, raciocínio e programação.
“O DeepSeek V3.1 alcançou 71,6% no Aider, cerca de 1% a mais que o Claude Opus 4, mas custando significativamente menos”, disse o pesquisador de IA Andrew Christianson na rede social X.
Estima-se que o custo médio para concluir uma tarefa de programação usando a versão V3.1 seja de cerca de US$ 1,01, enquanto sistemas equivalentes podem custar perto de US$ 70.
Alguns desenvolvedores da comunidade também notaram a presença de quatro “tokens especiais” na arquitetura, que permitem que o modelo integre pesquisas na web em tempo real e lide com processos complexos de inferência.
Essa diferença se traduz em milhões de dólares em economia para empresas que lidam com milhares de interações de IA todos os dias.
Vantagem que muda o jogo
O lançamento da versão 3.1 ocorre poucas semanas após a OpenAI e a Anthropic anunciarem novos modelos. Ao optar por uma abordagem de código aberto, a DeepSeek segue uma estratégia diferente de muitas empresas americanas que comercializam modelos de IA por meio de APIs pagas.
Alguns argumentam que tornar recursos avançados amplamente disponíveis pode permitir que organizações e empresas implementem seus recursos mais rapidamente, ao mesmo tempo em que desafia modelos de negócios baseados em monopólios de tecnologia.
O surgimento do DeepSeek V3.1 mostra que a IA avançada não é domínio apenas de grandes corporações, mas também de grupos de pesquisa menores.
A competição nesse espaço não se limita mais à construção do sistema mais potente, mas também gira em torno de tornar a tecnologia acessível e barata.
Nesse contexto, a questão para as empresas de tecnologia é como manter o valor comercial quando cada vez mais modelos de código aberto aparecem com desempenho e custo competitivos.
Fonte: https://dantri.com.vn/cong-nghe/deepseek-am-tham-ra-phien-ban-ai-moi-20250820121017977.htm
Comentário (0)