DeepSeek desenvolve um modelo de IA de raciocínio matemático capaz de autoverificação.

Em 28 de novembro, a empresa chinesa de inteligência artificial (IA) DeepSeek anunciou o modelo de IA DeepSeekMath-V2, considerado um avanço no campo do raciocínio matemático em IA, estabelecendo novos padrões de desempenho e expandindo os limites das capacidades de resolução de problemas usando aprendizado de máquina.

O código-fonte do DeepSeekMath-V2 está disponível publicamente no Hugging Face e no GitHub.

O modelo integra uma estrutura de autoverificação para verificar a validade de uma cadeia de argumentos, além de gerar respostas corretas, algo com que muitos modelos de IA atuais ainda têm dificuldades.

Os resultados da avaliação mostram que o DeepSeekMath-V2 está qualificado para medalhas de ouro na Olimpíada Internacional de Matemática (IMO) de 2025 e na Olimpíada Chinesa de Matemática (CMO) de 2024.

Notavelmente, o modelo obteve 118/120 pontos no exame Putnam de 2024, superando em muito a marca de 90 pontos, o recorde mais alto já alcançado por humanos.

As capacidades de raciocínio lógico do modelo são testadas usando o sistema IMO-ProofBench, um benchmark dedicado usado para verificar a precisão do raciocínio de modelos de IA.

O DeepSeekMath-V2 demonstra desempenho superior em comparação com muitos outros modelos de última geração, incluindo o DeepThink da DeepMind.

O IMO-ProofBench opera com um mecanismo de verificação cruzada: um modelo assume o papel de "provar", gerando uma cadeia de argumentos matemáticos, enquanto o outro modelo assume o papel de "validar", avaliando a força do argumento.

Esse mecanismo permite a detecção de erros no raciocínio do modelo, uma fragilidade inerente aos sistemas de IA contemporâneos.

Segundo a equipe de desenvolvimento, o método de autoverificação do DeepSeekMath-V2 ajuda a resolver a maior limitação dos modelos de IA atuais: a capacidade de gerar respostas corretas, mas com base em raciocínio incorreto ou inconsistente.

A DeepSeek acredita que esses avanços demonstram que a abordagem de "raciocínio matemático autoverificável" tem o potencial de se tornar a base fundamental para uma geração de IA matemática mais poderosa, confiável e transparente no futuro.

(TTXVN/Vietnã+)

Fonte: https://www.vietnamplus.vn/deepseek-phat-trien-mo-hinh-ai-lap-luan-toan-hoc-co-kha-nang-tu-kiem-chung-post1079916.vnp

Tópico: QUEM DeepSeek

Comentário (0)