DeepSeek lança ferramenta de IA capaz de ganhar medalha de ouro em competição internacional de matemática

Resolver problemas complexos com linguagem natural, soluções e argumentos claros e coerentes... não é fácil, nem mesmo para alunos com bom desempenho em matemática. No entanto, a DeepSeek criou um modelo de IA, o DeepSeekMath-V2, capaz de realizar essa tarefa.

DeepSeek ra mắt công cụ AI có khả năng giành HCV kỳ thi toán quốc tế - 1 — A DeepSeek impressionou ao criar um modelo de IA capaz de resolver problemas de nível de exame internacional (Ilustração: IA).

Nas avaliações, o DeepSeekMath-V2 alcançou pontuações de nível medalha de ouro na resolução de problemas na Olimpíada Internacional de Matemática (IMO) de 2025 e na Olimpíada Chinesa de Matemática (CMO) de 2024.

Ao participar do teste IMO-ProofBench para avaliar a capacidade de interpretação matemática e raciocínio de modelos de IA, o DeepSeekMath-V2 da DeepSeek obteve pontuações excelentes em comparação com outros modelos de IA, como o DeepMind do Google, o Grok da xAI ou o GPT-5 da OpenAI...

Notavelmente, o modelo de IA da DeepSeek também obteve 118/120 pontos ao resolver o Putnam Math Competition em 2024, enquanto o participante com a melhor classificação nessa competição alcançou apenas 90 pontos. O Putnam Competition é considerado a competição de matemática mais difícil e prestigiosa do mundo para estudantes universitários, realizada todos os anos em dezembro.

Em competições internacionais, muitos problemas não exigem uma resposta numérica exata; a pontuação baseia-se no raciocínio utilizado para chegar à solução. No entanto, o DeepSeekMath-V2 demonstra capacidade de raciocinar de forma precisa e em linguagem natural, como os humanos, o que contribui para a alta pontuação desse modelo de IA.

A DeepSeek afirma que, para ajudar seu modelo de IA a gerar respostas precisas e argumentos sólidos, construiu dois grandes modelos de linguagem e os colocou em competição direta. Um modelo atua como "provador", gerando argumentos e provas matemáticas, enquanto o outro atua como "juiz", verificando os argumentos apresentados.

Essa forma de trabalhar ajuda a eliminar hipóteses e argumentos fracos, concentrando-se na otimização da solução para encontrar a resposta correta e argumentando de forma concisa.

O DeepSeekMath-V2 é desenvolvido como código aberto, permitindo que a comunidade modifique o código-fonte e o utilize para diversos fins.

A DeepSeek afirma que os avanços alcançados com o DeepSeekMath-V2 lançarão as bases para a construção de sistemas de IA matemática mais poderosos e confiáveis.

A DeepSeek é uma empresa de tecnologia chinesa que causou sensação globalmente ao lançar o modelo AI R1 no final de janeiro, proporcionando velocidade de resposta rápida e precisa.

O grande destaque do R1 é que a DeepSeek gastou apenas cerca de 6,5 milhões de dólares para desenvolver e treinar esse modelo de IA, em vez de ter que gastar bilhões de dólares, como fazem as empresas de tecnologia americanas, para treinar e operar seus próprios modelos de IA.

Além disso, o R1 foi desenvolvido e operado pela DeepSeek com base em chips de IA de geração anterior, já que empresas chinesas sob embargo do governo dos EUA não podem encomendar chips de IA de ponta. No entanto, o R1 ainda demonstra uma capacidade de processamento e velocidade de resposta impressionantes às solicitações do usuário.

O surgimento do DeepSeek fez com que os EUA perdessem seu monopólio na corrida pelo desenvolvimento de modelos de IA e, ao mesmo tempo, abriu uma nova corrida. Em vez de se concentrarem apenas na inteligência e na capacidade de processamento, as empresas de tecnologia começaram a dar mais atenção à questão da eficiência econômica no processo de desenvolvimento de modelos de IA.

Comentário (0)