GPT-4.5 ist das größte Modell, das OpenAI je gebaut hat. Quelle: The Verge . |
Eine neue Studie der Abteilung für Kognitionswissenschaft an der University of California, San Diego, markiert einen Meilenstein auf dem Gebiet der künstlichen Intelligenz: Das GPT-4.5-Modell von OpenAI hat mit einem auf der „Persönlichkeit“ basierenden Interaktionsansatz eine überragende Leistung beim Turing-Test erzielt.
Dies gilt als das menschenähnlichste KI-Konversationssystem aller Zeiten und eröffnet viele potenzielle Anwendungen im Bereich der sozialen Intelligenz.
GPT-4.5 wird von OpenAI als „ein großer Schritt vorwärts bei der Skalierung des Vor- und Nachtrainings“ angepriesen. Es ist das größte Modell, das OpenAI je gebaut hat, und übertrifft in Größe und Rechenleistung frühere Versionen.
Laut dem offiziellen Blogbeitrag von OpenAI vom 27. Februar wurde GPT-4.5 am Tag seiner Ankündigung für ChatGPT Pro-Benutzer eingeführt.
Kann KI Menschen täuschen?
Das Experiment verglich vier repräsentative KI-Systeme: den Chatbot ELIZA aus den 1960er Jahren, LLaMa-3.1-405B von Meta AI sowie GPT-4o und GPT-4.5 von OpenAI. Das Team entwickelte zwei unabhängige Tests mit jeweils 250 Teilnehmern, insgesamt also 500 Personen von Online-Plattformen wie Prolific. Die Teilnehmer waren unterschiedlichen Alters, Geschlechts und Bildungsniveaus, um eine vielfältige Stichprobe zu gewährleisten.
![]() |
Vergleichstabelle von vier typischen KI-Systemen. Quelle: AIbase |
Der Test verwendet das traditionelle Turing-Format: Jeder Teilnehmer chattet fünf Minuten lang über eine Textschnittstelle mit zwei Probanden (einem Menschen und einer KI) und bewertet dann, welcher von beiden ein Mensch ist.
Die Ergebnisse waren überraschend: GPT-4.5 erreichte eine Bestehensquote von 73 % beim Turing-Test und übertraf damit den menschlichen Durchschnitt (60–70 %). Dies ist das erste Mal, dass ein KI-Modell den Standard-Turing-Test tatsächlich „bestanden“ hat. GPT-4o schnitt etwas schlechter ab, LLaMa-3.1-405B erreichte in einigen Kontexten die menschliche Leistung oder näherte sich ihr sogar an, und ELIZA blieb weit zurück.
Fähigkeit, wie ein Mensch zu interagieren
Was GPT-4.5 auszeichnet, ist nicht nur seine Sprachgewandtheit, sondern auch seine Fähigkeit, Emotionen auszudrücken und seine Antworten an die Nuancen der Kommunikation seines Gesprächspartners anzupassen. Viele Teilnehmer beschrieben es als „freundlich“ und „authentisch“.
Insbesondere wenn Benutzer verwirrt oder gestresst wirken, kann GPT-4.5 humorvolle oder beruhigende Antworten geben, sodass viele glauben, sie würden mit einer echten Person chatten.
![]() |
Gespräch zwischen zwei Probanden (eine KI, ein Mensch) während des Tests. Foto: UC San Diego . |
LLaMa-3.1-405B hingegen ist zwar technisch beeindruckend, aber weniger ausdrucksstark und weniger kontextadaptiv als GPT-4.5. GPT-4o ist zwar leistungsstark, aber in Bezug auf Personalisierung und Anpassung an situationsbedingte Reaktionen unterlegen.
Der Durchbruch von GPT-4.5 könnte eine Reihe praktischer Anwendungen eröffnen, von virtuellen Tutoren über psychologische Unterstützung bis hin zum Kundenservice. Doch je menschenähnlicher die KI wird, desto größer wird die gesellschaftliche Herausforderung, zwischen Realität und Fantasie zu unterscheiden und den Einsatz der Technologie zu regulieren.
Die Forschung findet inmitten rasanter Fortschritte in der KI statt. Der Erfolg von GPT-4.5 ist nicht nur ein technischer Triumph für OpenAI, sondern wirft auch tiefgreifende Fragen über die Beziehung zwischen Mensch und Maschine auf. Ein Tester kommentierte, es habe sich angefühlt, als würde er mit einem Freund sprechen – bis ihm klar wurde, dass alles nur aus Codezeilen bestand. Der Dialog zwischen Mensch und KI hat möglicherweise gerade erst begonnen.
Quelle: https://znews.vn/chatgpt-da-vuot-qua-bai-danh-gia-quan-trong-xac-dinh-may-nguoi-post1542945.html
Kommentar (0)