Le nouveau modèle d'inférence de ChatGPT

L'O3 Pro se distingue par sa capacité à gérer des requêtes complexes. Image : OpenAI.

OpenAI a lancé o3 Pro dans une formule Pro à 200 $/mois avec accès à Team via API. Version améliorée d'o3, présentée il y a quelques mois, o3 Pro est décrite par l'entreprise comme la version la plus performante actuellement disponible.

Toutes les versions comportant le mot « pro » sont capables de répondre à des questions plus complexes et plus longues. Contrairement aux versions d'IA classiques, leur modèle de raisonnement traite les problèmes étape par étape, ce qui leur permet de fonctionner de manière plus stable et fiable dans des domaines tels que la physique, les mathématiques et la programmation.

« Nous recommandons l'utilisation de l'o3-pro pour les questions complexes où la fiabilité prime sur la rapidité, et où quelques minutes d'attente constituent un compromis acceptable », a déclaré l'entreprise. Lors de tests comparatifs, l'o3-pro a obtenu des résultats supérieurs aux versions o3 et o1-pro.

Ben Hylak, ancien employé d'Apple et cofondateur de Raindrop, une entreprise spécialisée dans le développement de l'IA, a commenté ce nouveau modèle en affirmant qu'il était bien plus intelligent. Il a compilé l'historique de toutes les réunions précédentes au sein de son entreprise, puis a demandé à o3-pro d'élaborer un plan.

Les résultats étaient impressionnants, précis et analysés avec clarté, exactement comme il l'avait toujours espéré d'une modélisation du langage à grande échelle. Le plan comprenait des indicateurs cibles, un calendrier, des priorités et des directives strictes sur les éléments à éliminer. « Il était si précis et si bien fondé que j'ai dû repenser l'avenir de mon entreprise », a-t-il écrit.

image 1 du nouveau modèle de raisonnement

Les résultats obtenus avec o3 pro (à gauche) sont plus spécifiques et fiables. Photo : Ben Hylak/X.

O3-pro coûte 20 $ par million de jetons investis et 80 $ par million de jetons exportés via l'API. Ce coût s'explique par la capacité de l'IA à mémoriser et traiter les données. Un million de jetons investis équivaut à environ 750 000 mots, soit plus que le livre *Guerre et Paix* , comme le souligne The Verge .

OpenAI indique que les experts attribuent systématiquement à o3 pro une meilleure note qu'à o3 dans toutes les catégories testées. Les évaluateurs attribuent également à o3 pro des notes supérieures pour sa constance sur plusieurs critères tels que la clarté, la facilité d'utilisation et la précision, notamment dans des domaines clés comme les sciences, l'éducation , la programmation, le commerce et l'aide à la rédaction.

Lors du test AIME 2024, évaluant les capacités mathématiques du modèle, o3 pro a obtenu un score supérieur à celui de Gemini 2.5 Pro, l'IA de pointe de Google. De plus, le modèle a également surpassé Claude 4 Opus d'Anthropic au GPQA Diamond, un test de connaissances scientifiques de niveau doctoral.

L'o3 pro intègre également des outils lui permettant d'effectuer des recherches sur le Web, d'analyser des fichiers, d'utiliser Python pour le calcul et la programmation, et de personnaliser les réponses grâce à la mémoire. À ce sujet, Ben Hylak a souligné que l'outil démontre clairement sa capacité à reconnaître son environnement, à savoir quand poser des questions sur le monde extérieur (au lieu de faire semblant de le savoir) et à sélectionner l'outil approprié à chaque tâche.

Cependant, le principal défaut du modèle réside dans son temps de réponse, encore plus lent que celui du o1 pro. Le youtubeur Bijan Bowen le confirme : « Bien que la réponse du modèle soit assez claire, même pour quelques phrases descriptives, le temps de réponse est plutôt long », explique-t-il. Ben Hylak ajoute que, notamment en cas de données externes insuffisantes, le modèle a tendance à trop analyser la situation.

O3-pro présente également d'autres limitations, comme l'impossibilité de créer des images et la prise en charge limitée de la fonctionnalité Canvas. La fonctionnalité de chat temporaire associée à ce modèle dans ChatGPT est actuellement désactivée, OpenAI travaillant à la résolution d'un problème technique.

Cependant, Hylak soutient que ce n'est pas un modèle de chat convivial comme Claude 3.5 Sonnet ou ChatGPT 4o. Nate B. Jones, responsable produit chez Rockerbox, conseille d'utiliser l'o3 pro pour des tâches complexes nécessitant 15 à 20 minutes de réflexion.

Source : https://znews.vn/mo-hinh-suy-luan-moi-cua-chatgpt-post1560084.html