Vietnam.vn - Nền tảng quảng bá Việt Nam

Novo modelo de inferência do ChatGPT

O O3 Pro é considerado por muitos usuários superior a outros chatbots em diversas áreas. No entanto, este modelo apresenta uma grande desvantagem e aplicações específicas.

ZNewsZNews16/06/2025

O o3 pro se destaca por sua capacidade de lidar com solicitações complexas. Imagem: OpenAI.

A OpenAI lançou o o3 Pro em um pacote Pro com preço de US$ 200/mês com suporte para equipes via API. Uma versão atualizada do o3, que foi apresentada há alguns meses, o o3 Pro é considerado pela empresa a versão mais poderosa disponível atualmente.

Todas as versões com a palavra "pro" adicionada estão associadas à capacidade de responder a perguntas mais difíceis e longas. Ao contrário das versões típicas de IA, o modelo de raciocínio processa os problemas passo a passo, permitindo que ele opere de forma mais estável e confiável em áreas como física, matemática e programação.

“Recomendamos o uso do o3-pro para questões complexas onde a confiabilidade é mais importante que a velocidade, e esperar alguns minutos é uma compensação que vale a pena”, afirmou a empresa. Em análises comparativas, o o3-pro obteve resultados superiores em relação às versões o3 e o1-pro.

Ao comentar sobre esse novo modelo, Ben Hylak, ex-funcionário da Apple e cofundador da empresa de desenvolvimento de IA Raindrop, afirmou que ele é muito mais inteligente. Ele compilou um histórico de todas as reuniões anteriores em sua empresa e, em seguida, solicitou à o3-pro a criação de um plano.

Os resultados foram bastante impressionantes, específicos e claramente analisados ​​— exatamente como ele sempre esperou que uma modelagem de linguagem em larga escala (LLM) pudesse alcançar. O plano incluía métricas-alvo, cronogramas, prioridades e orientações rigorosas sobre o que eliminar completamente. "Era tão específico e bem fundamentado que precisei repensar o futuro da minha empresa", escreveu ele.

novo modelo de raciocínio imagem 1

Os resultados obtidos com o o3 pro (à esquerda) são mais específicos e confiáveis. Foto: Ben Hylak/X.

O O3-pro custa US$ 20 por milhão de tokens investidos e US$ 80 por milhão de tokens exportados quando usado via API. Isso se deve à capacidade da IA ​​de memorizar e processar dados. Um milhão de tokens investidos equivale a aproximadamente 750.000 palavras, o que é ainda mais longo do que o livro *Guerra e Paz* , como compara o The Verge .

A OpenAI afirma que os especialistas classificam consistentemente o o3 pro como superior ao o3 em todas as categorias testadas. Os avaliadores também atribuem classificações mais altas ao o3 pro pela consistência em diversos critérios, como clareza, facilidade de uso e precisão, principalmente em áreas-chave como ciência, educação , programação, negócios e suporte à escrita.

No AIME 2024, um teste que avalia as capacidades matemáticas do modelo, o o3 pro obteve uma pontuação superior até mesmo ao Gemini 2.5 Pro, a IA mais avançada do Google. Além disso, o modelo também superou o Claude 4 Opus da Anthropic no GPQA Diamond, um teste de conhecimento científico de nível doutoral.

O o3 pro também integra ferramentas que permitem pesquisar na web, analisar arquivos, usar Python para computação e programação, e personalizar respostas aproveitando a memória. Comentando sobre esse aspecto, Ben Hylak observou que a ferramenta demonstra claramente sua capacidade de reconhecer o ambiente ao seu redor, sabendo quando perguntar sobre o mundo exterior (em vez de fingir que sabe) e selecionando a ferramenta certa para cada tarefa.

No entanto, a maior desvantagem do modelo reside no seu tempo de resposta, que é ainda mais lento do que o do O1 Pro. O YouTuber Bijan Bowen concorda com isso. "Embora a resposta do modelo seja bastante clara, mesmo com apenas algumas frases descritivas, o tempo de resposta é bem longo", disse ele. Principalmente em casos com dados externos insuficientes, o modelo tende a pensar demais, acrescentou Ben Hylak.

O modelo O3-pro também apresenta algumas outras limitações, como a impossibilidade de criar imagens e a falta de suporte para o recurso Canvas. O recurso de bate-papo temporário com este modelo no ChatGPT está atualmente desativado enquanto a OpenAI corrige um "problema técnico".

No entanto, Hylak argumenta que este não é um modelo para bate-papo amigável ao usuário como o Claude 3.5 Sonnet ou o ChatGPT 4o. Nate B. Jones, chefe de produto da Rockerbox, recomenda que o o3 pro seja usado para tarefas complexas que exigem de 15 a 20 minutos de reflexão.


Fonte: https://znews.vn/mo-hinh-suy-luan-moi-cua-chatgpt-post1560084.html


Comentário (0)

Deixe um comentário para compartilhar seus sentimentos!

No mesmo tópico

Na mesma categoria

Do mesmo autor

Herança

Figura

Empresas

Atualidades

Sistema político

Local

Produto

Happy Vietnam
Cidade Imperial de Hue

Cidade Imperial de Hue

Gracioso

Gracioso

Tam Dao

Tam Dao