GPT-4.5 هو أكبر نموذج بنته OpenAI على الإطلاق. المصدر: The Verge . |
تشكل دراسة جديدة من قسم العلوم الإدراكية في جامعة كاليفورنيا في سان دييغو علامة فارقة في مجال الذكاء الاصطناعي: حيث حقق نموذج GPT-4.5 من OpenAI أداءً متفوقًا في اختبار تورينج باستخدام نهج التفاعل القائم على "الشخصية".
ويعتبر هذا نظام المحادثة بالذكاء الاصطناعي الأكثر تشابهًا مع الإنسان على الإطلاق، وهو ما يفتح المجال للعديد من التطبيقات المحتملة في مجال الذكاء الاجتماعي.
وصفت OpenAI إصدار GPT-4.5 بأنه "قفزة نوعية في توسيع نطاق التدريب المسبق والتدريب اللاحق". وهو أكبر نموذج طورته OpenAI على الإطلاق، بحجم وقوة حسابية تتفوقان على الإصدارات السابقة.
وفقًا لمدونة OpenAI الرسمية في 27 فبراير، بدأ طرح GPT-4.5 لمستخدمي ChatGPT Pro في يوم الإعلان عنه.
هل يمكن للذكاء الاصطناعي خداع البشر؟
قارنت التجربة أربعة أنظمة ذكاء اصطناعي تمثيلية: روبوت الدردشة ELIZA من ستينيات القرن الماضي، وبرنامج Meta AI LLaMa-3.1-405B، وبرنامجي GPT-4o وGPT-4.5 من OpenAI. صمم الفريق اختبارين مستقلين، شارك في كلٍّ منهما 250 مشاركًا، بإجمالي 500 شخص من منصات إلكترونية مثل Prolific. تنوعت أعمار المشاركين وأجناسهم ومستوياتهم التعليمية لضمان تنوع العينة.
![]() |
جدول مقارنة لأربعة أنظمة ذكاء اصطناعي نموذجية. المصدر: AIbase |
يستخدم الاختبار تنسيق تورينج التقليدي: يتحدث كل مشارك عبر واجهة نصية مع شخصين (أحدهما بشري والآخر ذكاء اصطناعي) لمدة 5 دقائق، ثم يقوم بتقييم أيهما بشري.
كانت النتائج مفاجئة: حقق GPT-4.5 نسبة نجاح في اختبار تورينج وصلت إلى 73%، متجاوزًا المتوسط البشري (60-70%). وهذه هي المرة الأولى التي يجتاز فيها نموذج ذكاء اصطناعي اختبار تورينج القياسي. في الوقت نفسه، سجل GPT-4o نتيجة أقل بقليل، بينما اقترب LLaMa-3.1-405B من الأداء البشري أو وصل إليه في بعض السياقات، بينما كان ELIZA أقل بكثير.
القدرة على التفاعل مثل الإنسان
ما ميّز GPT-4.5 ليس طلاقته اللغوية فحسب، بل قدرته أيضًا على التعبير عن المشاعر وتكييف استجاباته مع تفاصيل تواصل مُحاوره. وقد وصفه العديد من المشاركين بأنه "ودود" و"أصيل".
والجدير بالذكر أنه عندما بدا على المستخدمين الارتباك أو التوتر، كان GPT-4.5 قادرًا على تقديم ردود فكاهية أو مريحة، مما دفع الكثيرين إلى الاعتقاد بأنهم يتحدثون مع شخص حقيقي.
![]() |
محادثة بين شخصين (أحدهما ذكاء اصطناعي والآخر إنسان) أثناء الاختبار. الصورة: جامعة كاليفورنيا، سان دييغو . |
في الوقت نفسه، يُعدّ LLaMa-3.1-405B، على الرغم من تميّزه التقني، أقلّ تعبيرًا وأقلّ تكيّفًا مع السياق من GPT-4.5. أما GPT-4o، على الرغم من قوّته، فهو أدنى من حيث التخصيص والتكيّف مع الاستجابة للمواقف.
قد يفتح هذا الاختراق في GPT-4.5 آفاقًا واسعةً للتطبيقات العملية، بدءًا من المعلمين الافتراضيين، مرورًا بالدعم النفسي، ووصولًا إلى خدمة العملاء. ومع ذلك، ومع تزايد تشابه الذكاء الاصطناعي مع البشر، سيُصبح التمييز بين الواقع والافتراضي، وتنظيم كيفية استخدام هذه التقنية، تحديًا مجتمعيًا رئيسيًا.
يأتي هذا البحث في ظلّ التطورات السريعة في مجال الذكاء الاصطناعي. لا يُعدّ نجاح GPT-4.5 انتصارًا تقنيًا لشركة OpenAI فحسب، بل يثير أيضًا تساؤلاتٍ عميقة حول العلاقة بين البشر والآلات. علق أحد المختبرين قائلاً إنه شعر وكأنه يتحدث إلى صديق، حتى أدرك أنها مجرد أسطر برمجية. ربما يكون الحوار بين البشر والذكاء الاصطناعي قد بدأ للتو.
المصدر: https://znews.vn/chatgpt-da-vuot-qua-bai-danh-gia-quan-trong-xac-dinh-may-nguoi-post1542945.html
تعليق (0)