Novo modelo de inferência do ChatGPT

O o3 pro se destaca por sua capacidade de lidar com solicitações complexas. Imagem: OpenAI.

A OpenAI lançou o o3 Pro em um pacote Pro com preço de US$ 200/mês com suporte para equipes via API. Uma versão atualizada do o3, que foi apresentada há alguns meses, o o3 Pro é considerado pela empresa a versão mais poderosa disponível atualmente.

Todas as versões com a palavra "pro" adicionada estão associadas à capacidade de responder a perguntas mais difíceis e longas. Ao contrário das versões típicas de IA, o modelo de raciocínio processa os problemas passo a passo, permitindo que ele opere de forma mais estável e confiável em áreas como física, matemática e programação.

“Recomendamos o uso do o3-pro para questões complexas onde a confiabilidade é mais importante que a velocidade, e esperar alguns minutos é uma compensação que vale a pena”, afirmou a empresa. Em análises comparativas, o o3-pro obteve resultados superiores em relação às versões o3 e o1-pro.

Ao comentar sobre esse novo modelo, Ben Hylak, ex-funcionário da Apple e cofundador da empresa de desenvolvimento de IA Raindrop, afirmou que ele é muito mais inteligente. Ele compilou um histórico de todas as reuniões anteriores em sua empresa e, em seguida, solicitou à o3-pro a criação de um plano.

Os resultados foram bastante impressionantes, específicos e claramente analisados — exatamente como ele sempre esperou que uma modelagem de linguagem em larga escala (LLM) pudesse alcançar. O plano incluía métricas-alvo, cronogramas, prioridades e orientações rigorosas sobre o que eliminar completamente. "Era tão específico e bem fundamentado que precisei repensar o futuro da minha empresa", escreveu ele.

novo modelo de raciocínio imagem 1

Os resultados obtidos com o o3 pro (à esquerda) são mais específicos e confiáveis. Foto: Ben Hylak/X.

O O3-pro custa US$ 20 por milhão de tokens investidos e US$ 80 por milhão de tokens exportados quando usado via API. Isso se deve à capacidade da IA de memorizar e processar dados. Um milhão de tokens investidos equivale a aproximadamente 750.000 palavras, o que é ainda mais longo do que o livro *Guerra e Paz* , como compara o The Verge .

A OpenAI afirma que os especialistas classificam consistentemente o o3 pro como superior ao o3 em todas as categorias testadas. Os avaliadores também atribuem classificações mais altas ao o3 pro pela consistência em diversos critérios, como clareza, facilidade de uso e precisão, principalmente em áreas-chave como ciência, educação , programação, negócios e suporte à escrita.

No AIME 2024, um teste que avalia as capacidades matemáticas do modelo, o o3 pro obteve uma pontuação superior até mesmo ao Gemini 2.5 Pro, a IA mais avançada do Google. Além disso, o modelo também superou o Claude 4 Opus da Anthropic no GPQA Diamond, um teste de conhecimento científico de nível doutoral.

O o3 pro também integra ferramentas que permitem pesquisar na web, analisar arquivos, usar Python para computação e programação, e personalizar respostas aproveitando a memória. Comentando sobre esse aspecto, Ben Hylak observou que a ferramenta demonstra claramente sua capacidade de reconhecer o ambiente ao seu redor, sabendo quando perguntar sobre o mundo exterior (em vez de fingir que sabe) e selecionando a ferramenta certa para cada tarefa.

No entanto, a maior desvantagem do modelo reside no seu tempo de resposta, que é ainda mais lento do que o do O1 Pro. O YouTuber Bijan Bowen concorda com isso. "Embora a resposta do modelo seja bastante clara, mesmo com apenas algumas frases descritivas, o tempo de resposta é bem longo", disse ele. Principalmente em casos com dados externos insuficientes, o modelo tende a pensar demais, acrescentou Ben Hylak.

O modelo O3-pro também apresenta algumas outras limitações, como a impossibilidade de criar imagens e a falta de suporte para o recurso Canvas. O recurso de bate-papo temporário com este modelo no ChatGPT está atualmente desativado enquanto a OpenAI corrige um "problema técnico".

No entanto, Hylak argumenta que este não é um modelo para bate-papo amigável ao usuário como o Claude 3.5 Sonnet ou o ChatGPT 4o. Nate B. Jones, chefe de produto da Rockerbox, recomenda que o o3 pro seja usado para tarefas complexas que exigem de 15 a 20 minutos de reflexão.

Fonte: https://znews.vn/mo-hinh-suy-luan-moi-cua-chatgpt-post1560084.html

Tópico: QUEM inteligência artificial (IA)ChatGPT

Comentário (0)

Cidade Imperial de Hue

Gracioso

Tam Dao