Em 28 de novembro, a empresa chinesa de inteligência artificial (IA) DeepSeek anunciou o modelo de IA DeepSeekMath-V2, considerado um avanço no campo do raciocínio matemático em IA, estabelecendo novos padrões de desempenho e expandindo os limites das capacidades de resolução de problemas usando aprendizado de máquina.
O código-fonte do DeepSeekMath-V2 está disponível publicamente no Hugging Face e no GitHub.
O modelo integra uma estrutura de autoverificação para verificar a validade de uma cadeia de argumentos, além de gerar respostas corretas, algo com que muitos modelos de IA atuais ainda têm dificuldades.
Os resultados da avaliação mostram que o DeepSeekMath-V2 está qualificado para medalhas de ouro na Olimpíada Internacional de Matemática (IMO) de 2025 e na Olimpíada Chinesa de Matemática (CMO) de 2024.
Notavelmente, o modelo obteve 118/120 pontos no exame Putnam de 2024, superando em muito a marca de 90 pontos, o recorde mais alto já alcançado por humanos.
As capacidades de raciocínio lógico do modelo são testadas usando o sistema IMO-ProofBench, um benchmark dedicado usado para verificar a precisão do raciocínio de modelos de IA.
O DeepSeekMath-V2 demonstra desempenho superior em comparação com muitos outros modelos de última geração, incluindo o DeepThink da DeepMind.
O IMO-ProofBench opera com um mecanismo de verificação cruzada: um modelo assume o papel de "provar", gerando uma cadeia de argumentos matemáticos, enquanto o outro modelo assume o papel de "validar", avaliando a força do argumento.
Esse mecanismo permite a detecção de erros no raciocínio do modelo, uma fragilidade inerente aos sistemas de IA contemporâneos.
Segundo a equipe de desenvolvimento, o método de autoverificação do DeepSeekMath-V2 ajuda a resolver a maior limitação dos modelos de IA atuais: a capacidade de gerar respostas corretas, mas com base em raciocínio incorreto ou inconsistente.
A DeepSeek acredita que esses avanços demonstram que a abordagem de "raciocínio matemático autoverificável" tem o potencial de se tornar a base fundamental para uma geração de IA matemática mais poderosa, confiável e transparente no futuro.
Fonte: https://www.vietnamplus.vn/deepseek-phat-trien-mo-hinh-ai-lap-luan-toan-hoc-co-kha-nang-tu-kiem-chung-post1079916.vnp






Comentário (0)