GPT-4.5 est le plus grand modèle jamais développé par OpenAI. Source : The Verge . |
Une nouvelle étude du Département des sciences cognitives de l'Université de Californie à San Diego marque une étape importante dans le domaine de l'intelligence artificielle : le modèle GPT-4.5 d'OpenAI a obtenu des performances supérieures au test de Turing en utilisant une approche d'interaction basée sur la « personnalité ».
Il s’agit du système de conversation d’IA le plus proche de l’humain jamais créé, ouvrant de nombreuses applications potentielles dans le domaine de l’intelligence sociale.
GPT-4.5 est présenté par OpenAI comme « une avancée majeure dans la mise à l’échelle de la pré-formation et de la post-formation ». Il s’agit du plus grand modèle jamais développé par OpenAI, avec une taille et une puissance de calcul qui surpassent les versions précédentes.
Selon le billet de blog officiel d'OpenAI du 27 février, GPT-4.5 a commencé à être déployé auprès des utilisateurs de ChatGPT Pro le jour de son annonce.
L’IA peut-elle tromper les humains ?
L'expérience a comparé quatre systèmes d'IA représentatifs : le chatbot ELIZA des années 1960, le LLaMa-3.1-405B de Meta AI et les GPT-4o et GPT-4.5 d'OpenAI. L'équipe a conçu deux tests indépendants avec 250 participants chacun, pour un total de 500 personnes provenant de plateformes en ligne comme Prolific. Les participants étaient d’âges, de sexes et de niveaux d’éducation différents afin de garantir la diversité de l’échantillon.
![]() |
Tableau comparatif de quatre systèmes d’IA typiques. Source : AIbase |
Le test utilise le format traditionnel de Turing : chaque participant discute via une interface textuelle avec deux sujets (un humain, une IA) pendant 5 minutes, puis évalue lequel est humain.
Les résultats ont été surprenants : GPT-4.5 a atteint un taux de réussite au test de Turing allant jusqu'à 73 %, dépassant la moyenne humaine (60-70 %). C’est la première fois qu’un modèle d’IA « réussit » réellement le test standard de Turing. Pendant ce temps, GPT-4o obtient des scores légèrement inférieurs, LLaMa-3.1-405B se rapproche ou atteint les performances humaines dans certains contextes, et ELIZA est loin d'être à la hauteur.
Capacité à interagir comme un humain
Le point fort du GPT-4.5 réside non seulement dans sa fluidité linguistique, mais aussi dans sa capacité à exprimer des émotions et à adapter ses réponses aux nuances de communication de l'interlocuteur. De nombreux participants l’ont décrit comme « convivial » et « authentique ».
En particulier, lorsque les utilisateurs semblent confus ou stressés, GPT-4.5 peut donner des réponses humoristiques ou réconfortantes, faisant croire à beaucoup qu'ils discutent avec une vraie personne.
![]() |
Contenu de la conversation de deux sujets (une IA, un humain) dans le test. Photo : UC San Diego . |
Parallèlement, LLaMa-3.1-405B, bien que techniquement impressionnant, présente des capacités d'expression émotionnelle et d'adaptation au contexte plus faibles que GPT-4.5. GPT-4o est puissant mais ne parvient pas à s'adapter aux situations en termes de personnalisation et d'adaptation à la situation.
La percée de GPT-4.5 pourrait ouvrir une large gamme d’applications pratiques, des tuteurs virtuels au soutien psychologique en passant par le service client. Cependant, à mesure que l’IA se rapproche de plus en plus de l’humain, faire la distinction entre le réel et le virtuel et contrôler la manière dont cette technologie est utilisée deviendra un défi sociétal majeur.
L’étude intervient dans un contexte de développement rapide de l’IA. Le succès de GPT-4.5 n’est pas seulement un triomphe technique pour OpenAI, mais soulève également de profondes questions sur la relation entre les humains et les machines. Un participant au test a déclaré qu’il avait l’impression de parler à un ami, jusqu’à ce qu’il réalise qu’il ne s’agissait que de lignes de code. Le dialogue entre les humains et l’IA ne fait peut-être que commencer.
Source : https://znews.vn/chatgpt-da-vuot-qua-bai-danh-gia-quan-trong-xac-dinh-may-nguoi-post1542945.html
Comment (0)