L'IA peut-elle vraiment penser ?

Des entreprises comme OpenAI et DeepSeek repoussent les limites des chatbots logiques, capables d'effectuer de meilleures tâches informatiques.

ZNews•06/04/2025

Le chatbot d'OpenAI s'améliore constamment grâce aux nouvelles technologies. Photo : New York Times .

En septembre 2024, OpenAI a lancé ChatGPT, une version de l'IA qui intègre le modèle o1, capable de raisonner sur des tâches liées aux mathématiques, aux sciences et à la programmation informatique.

Contrairement à la version précédente de ChatGPT, la nouvelle technologie prendra le temps de « réfléchir » aux solutions des problèmes complexes avant de fournir une réponse.

À la suite d'OpenAI, de nombreux concurrents tels que Google, Anthropic et DeepSeek ont également introduit des modèles de raisonnement similaires. Bien que perfectible, cette technologie d'amélioration des chatbots reste très appréciée des développeurs.

Comment l'IA raisonne

En clair, le raisonnement permet aux chatbots de consacrer plus de temps à résoudre les problèmes posés par les utilisateurs.

« Le raisonnement est la manière dont le système effectue un travail supplémentaire après avoir reçu une question », a déclaré Dan Klein, professeur d'informatique à l'Université de Californie, au New York Times .

Un système logique peut décomposer un problème en étapes individuelles plus petites, ou le résoudre par tâtonnement.

Lors de son lancement, ChatGPT pouvait répondre instantanément aux questions en extrayant et en synthétisant les informations. À l'inverse, les systèmes de raisonnement nécessitaient quelques secondes (voire minutes) supplémentaires pour résoudre le problème et fournir une réponse.

AI ly luan, OpenAI o1 va ChatGPT, mo hinh ly luan, tri tue nhan tao anh 1

Exemple du processus de raisonnement du modèle O1 dans un chatbot de service client. Image : OpenAI .

Dans certains cas, le système de raisonnement modifie son approche du problème, améliorant ainsi continuellement la solution. De plus, le modèle peut tester plusieurs solutions avant de faire un choix optimal, ou vérifier la pertinence des réponses précédentes.

En général, le système de raisonnement prendra en compte toutes les réponses possibles à la question. Cela s'apparente à la démarche des élèves du primaire qui notent plusieurs options sur une feuille de papier avant de choisir la solution la plus appropriée à un problème de mathématiques.

D'après le New York Times , l'IA est désormais capable de raisonner sur presque tous les sujets. Cependant, elle sera particulièrement performante pour les questions liées aux mathématiques, aux sciences et à la programmation informatique.

Comment le système théorique est-il entraîné ?

Sur un chatbot classique, les utilisateurs peuvent toujours demander des explications sur le processus ou vérifier l'exactitude de la réponse. De fait, de nombreux jeux de données d'entraînement ChatGPT incluent déjà des procédures de résolution de problèmes.

Le système de raisonnement devient encore plus performant lorsqu'il peut effectuer des opérations sans intervention de l'utilisateur. Ce processus est alors plus complexe et plus étendu. Les entreprises utilisent le terme « raisonnement » car le système fonctionne de manière similaire à la pensée humaine.

De nombreuses entreprises, comme OpenAI, considèrent les systèmes de raisonnement comme la meilleure solution pour améliorer les chatbots actuellement disponibles. Pendant des années, elles ont cru que les performances des chatbots s'amélioraient avec la quantité d'informations qu'ils recevaient pour leur entraînement sur Internet.

D’ici 2024, les systèmes d’IA auront exploité la quasi-totalité des textes disponibles sur Internet. Les entreprises doivent donc trouver de nouvelles solutions pour moderniser leurs chatbots, notamment en intégrant des systèmes de raisonnement.

AI ly luan, OpenAI o1 va ChatGPT, mo hinh ly luan, tri tue nhan tao anh 2

La start-up DeepSeek avait fait sensation avec son modèle de raisonnement dont les coûts étaient inférieurs à ceux d'OpenAI. Photo : Bloomberg .

Depuis l'année dernière, des entreprises comme OpenAI se concentrent sur les techniques d'apprentissage par renforcement. Ce processus prend généralement plusieurs mois, durant lesquels l'IA apprend les comportements par essais et erreurs.

Par exemple, en résolvant des milliers de problèmes, le système peut identifier la méthode optimale pour parvenir à la bonne réponse. À partir de là, les chercheurs conçoivent des mécanismes de rétroaction sophistiqués qui aident le système à distinguer les solutions correctes des solutions incorrectes.

« C’est un peu comme dresser un chien. Si le système fonctionne bien, on le récompense. Sinon, on dit : “Ce chien a été vilain” », explique Jerry Tworek, chercheur chez OpenAI.

L'IA est-elle l'avenir ?

D'après le New York Times , les techniques d'apprentissage par renforcement sont efficaces pour répondre aux exigences des mathématiques, des sciences et de la programmation informatique. Ce sont des domaines où les réponses correctes ou incorrectes sont clairement définies.

À l'inverse, l'apprentissage par renforcement est inefficace en écriture, en philosophie ou en éthique – des domaines où il est difficile de distinguer le bien du mal. Néanmoins, les chercheurs affirment que cette technique peut améliorer les performances de l'IA, même pour des questions non mathématiques.

« Les systèmes apprendront les voies qui mènent à des résultats positifs et négatifs », a déclaré Jared Kaplan, directeur scientifique d'Anthropic.

AI ly luan, OpenAI o1 va ChatGPT, mo hinh ly luan, tri tue nhan tao anh 3

Site web d'Anthropic, la start-up propriétaire du modèle d'IA Claude. Photo : Bloomberg .

Il est important de noter que l'apprentissage par renforcement et les systèmes de raisonnement sont deux concepts différents. Plus précisément, l'apprentissage par renforcement est une méthode de construction de systèmes de raisonnement. Il s'agit de la dernière étape d'entraînement permettant aux chatbots de raisonner.

Étant donné que ces techniques sont encore relativement récentes, les scientifiques ne peuvent pas encore affirmer avec certitude que le raisonnement des chatbots ou l'apprentissage par renforcement permettent à l'IA de penser comme les humains. Il convient de noter que de nombreuses méthodes actuelles d'entraînement de l'IA se développent très rapidement au début, puis ralentissent progressivement.

De plus, le raisonnement des chatbots peut encore commettre des erreurs. En se basant sur les probabilités, le système choisira le processus qui ressemble le plus aux données qu'il a apprises, que ce soit sur Internet ou par apprentissage par renforcement. Par conséquent, les chatbots peuvent toujours proposer des solutions incorrectes ou illogiques.

Source : https://znews.vn/ai-ly-luan-nhu-the-nao-post1541477.html