Vietnam.vn - Nền tảng quảng bá Việt Nam

L’IA peut-elle vraiment penser ?

Des entreprises comme OpenAI et DeepSeek font la promotion de chatbots de raisonnement, qui peuvent être plus performants dans certaines tâches de calcul.

ZNewsZNews06/04/2025

Le chatbot d'OpenAI s'améliore grâce aux nouvelles technologies. Photo : New York Times .

En septembre 2024, OpenAI a publié une version de ChatGPT qui intègre le modèle o1, qui peut raisonner sur des tâches liées aux mathématiques, aux sciences et à la programmation informatique.

Contrairement à la version précédente de ChatGPT, la nouvelle technologie prendra le temps de « réfléchir » aux solutions à des problèmes complexes avant de donner une réponse.

Après OpenAI, de nombreux concurrents tels que Google, Anthropic et DeepSeek ont également introduit des modèles de raisonnement similaires. Bien qu'imparfaite, cette technologie de mise à niveau des chatbots reste une technologie à laquelle de nombreux développeurs font confiance.

Comment l'IA raisonne

Fondamentalement, le raisonnement signifie que le chatbot peut passer plus de temps à résoudre le problème présenté par l’utilisateur.

« Le raisonnement est la façon dont le système fait plus de travail après avoir reçu une question », a déclaré Dan Klein, professeur d’informatique à l’Université de Californie à Berkeley, au New York Times .

Le système de raisonnement peut décomposer un problème en étapes individuelles ou le résoudre par essais et erreurs.

Lors de son lancement, ChatGPT pouvait répondre instantanément aux questions en extrayant et en synthétisant les informations. Les systèmes de raisonnement, quant à eux, avaient besoin de quelques secondes (voire minutes) supplémentaires pour résoudre le problème et répondre.

AI ly luan,  OpenAI o1 va ChatGPT,  mo hinh ly luan,  tri tue nhan tao anh 1

Exemple de raisonnement du modèle o1 dans un chatbot de service client. Photo : OpenAI .

Dans certains cas, le système de raisonnement modifie son approche du problème, améliorant continuellement la solution. Le modèle peut également essayer plusieurs solutions avant de choisir la solution optimale, ou tester l'exactitude des réponses précédentes.

En général, le système de raisonnement envisage toutes les réponses possibles à la question. C'est un peu comme les élèves de primaire, qui notent plusieurs options sur papier avant de choisir la solution la plus adaptée à un problème mathématique.

Selon le New York Times , l'IA est désormais capable de raisonner sur n'importe quel sujet. Cependant, cette tâche sera particulièrement efficace pour les questions liées aux mathématiques, aux sciences et à la programmation informatique.

Comment le système théorique est-il formé ?

Sur un chatbot classique, les utilisateurs peuvent toujours demander une explication du processus ou vérifier l'exactitude d'une réponse. De fait, de nombreux jeux de données d'entraînement ChatGPT incluent déjà un processus de résolution de problèmes.

Un système de raisonnement va encore plus loin lorsqu'il peut effectuer une action sans que l'utilisateur ne le lui demande. Ce processus est plus complexe et de plus grande portée. Les entreprises utilisent le terme « raisonnement » car ce système fonctionne de manière similaire à la pensée humaine.

De nombreuses entreprises comme OpenAI parient sur le fait que les systèmes de raisonnement constituent aujourd'hui le meilleur moyen d'améliorer les chatbots. Pendant des années, elles ont cru que les chatbots seraient plus performants s'ils étaient entraînés à utiliser un maximum d'informations issues d'Internet.

D'ici 2024, les systèmes d'IA auront consommé la quasi-totalité du texte disponible sur Internet. Les entreprises devront donc trouver de nouvelles solutions pour moderniser leurs chatbots, notamment leurs systèmes de raisonnement.

AI ly luan,  OpenAI o1 va ChatGPT,  mo hinh ly luan,  tri tue nhan tao anh 2

La startup DeepSeek a fait sensation avec un modèle de raisonnement moins coûteux qu'OpenAI. Photo : Bloomberg .

Depuis l’année dernière, des entreprises comme OpenAI se concentrent sur une technique appelée apprentissage par renforcement, un processus qui prend généralement plusieurs mois et implique que l’IA apprenne le comportement par essais et erreurs.

Par exemple, en résolvant des milliers de problèmes, le système peut apprendre la méthode optimale pour obtenir la bonne réponse. À partir de là, les chercheurs ont élaboré des mécanismes de rétroaction complexes qui aident le système à identifier les bonnes et les mauvaises solutions.

« C'est comme dresser un chien. Si ça marche, on lui donne une friandise. Si ça ne marche pas, on dit : "Ce chien est méchant" », explique Jerry Tworek, chercheur chez OpenAI.

L’IA est-elle l’avenir ?

Selon le New York Times , l’apprentissage par renforcement fonctionne bien avec les questions de mathématiques, de sciences et de programmation informatique, où les réponses bonnes ou mauvaises sont clairement définies.

En revanche, l'apprentissage par renforcement ne fonctionne pas bien en écriture, en philosophie ou en éthique, où il est difficile de distinguer le bien du mal. Cependant, les chercheurs affirment que cette technique peut néanmoins améliorer les performances de l'IA, même sur des questions extérieures aux mathématiques.

« Les systèmes apprendront les chemins qui mènent à des résultats positifs et négatifs », a déclaré Jared Kaplan, directeur scientifique d’Anthropic.

AI ly luan,  OpenAI o1 va ChatGPT,  mo hinh ly luan,  tri tue nhan tao anh 3

Site web d'Anthropic, la startup propriétaire du modèle d'IA Claude. Photo : Bloomberg .

Il est important de noter que l'apprentissage par renforcement et les systèmes de raisonnement sont deux concepts distincts. Plus précisément, l'apprentissage par renforcement est une méthode de construction de systèmes de raisonnement. Il s'agit de l'étape finale de formation des chatbots pour qu'ils acquièrent des capacités de raisonnement.

Étant donné leur caractère relativement récent, les scientifiques ne peuvent pas affirmer avec certitude si les chatbots raisonnés ou l'apprentissage par renforcement peuvent aider l'IA à penser comme les humains. Il convient de noter que de nombreuses tendances actuelles en matière d'entraînement de l'IA se développent très rapidement au début, puis ralentissent.

De plus, les chatbots raisonnés peuvent toujours commettre des erreurs. En fonction des probabilités, le système choisira le processus le plus proche des données apprises, qu'elles proviennent d'Internet ou de l'apprentissage par renforcement. Par conséquent, les chatbots peuvent toujours choisir une solution erronée ou déraisonnable.

Source : https://znews.vn/ai-ly-luan-nhu-the-nao-post1541477.html


Comment (0)

No data
No data
Morceaux de teinte - Morceaux de teinte
Scène magique sur la colline de thé « bol renversé » à Phu Tho
Trois îles de la région centrale sont comparées aux Maldives et attirent les touristes en été.
Admirez la ville côtière scintillante de Gia Lai à Quy Nhon la nuit
Image de champs en terrasses à Phu Tho, en pente douce, lumineux et beaux comme des miroirs avant la saison des plantations
L'usine Z121 est prête pour la soirée finale du feu d'artifice international
Un célèbre magazine de voyage fait l'éloge de la grotte de Son Doong comme étant « la plus magnifique de la planète »
Une grotte mystérieuse attire les touristes occidentaux, comparée à la « grotte de Phong Nha » à Thanh Hoa
Découvrez la beauté poétique de la baie de Vinh Hy
Comment est transformé le thé le plus cher de Hanoi, dont le prix dépasse les 10 millions de VND/kg ?

Patrimoine

Chiffre

Entreprise

No videos available

Nouvelles

Système politique

Locale

Produit