Vietnam.vn - Nền tảng quảng bá Việt Nam

نموذج الاستدلال الجديد لـ ChatGPT

يعتبر العديد من المستخدمين برنامج O3 Pro متفوقًا على برامج الدردشة الآلية الأخرى في عدة جوانب. ومع ذلك، يعاني هذا النموذج من عيب رئيسي ويقتصر استخدامه على تطبيقات محددة.

ZNewsZNews16/06/2025

يتميز جهاز o3 pro بقدرته على التعامل مع الطلبات المعقدة. الصورة: OpenAI.

أطلقت OpenAI برنامج o3 pro ضمن باقة احترافية بسعر 200 دولار شهريًا مع إمكانية إدارة الفريق عبر واجهة برمجة التطبيقات (API). يُعدّ o3 pro نسخة مطورة من o3 الذي طُرح قبل بضعة أشهر، وتصفه الشركة بأنه النسخة الأقوى المتاحة حاليًا.

جميع الإصدارات التي تحمل كلمة "pro" مرتبطة بالقدرة على الإجابة عن أسئلة أكثر صعوبة وطولاً. وعلى عكس إصدارات الذكاء الاصطناعي التقليدية، يعالج نموذج الاستدلال المشكلات خطوة بخطوة، مما يسمح له بالعمل بثبات وموثوقية أكبر في مجالات مثل الفيزياء والرياضيات والبرمجة.

"ننصح باستخدام o3-pro للأسئلة الصعبة التي تتطلب موثوقية أعلى من السرعة، حيث يُعدّ الانتظار لبضع دقائق خيارًا مناسبًا"، هذا ما صرّحت به الشركة. وقد حققت o3-pro نتائج أفضل في مراجعات الاختبارات المشتركة مقارنةً بإصداري o3 و o1-pro.

وفي تعليقه على هذا النموذج الجديد، قال بن هيلاك، الموظف السابق في شركة آبل والمؤسس المشارك لشركة تطوير الذكاء الاصطناعي "ريندروب"، إنه أكثر ذكاءً بكثير. وقد جمع سجلاً لجميع الاجتماعات السابقة في شركته، ثم طلب من شركة "أو 3-برو" وضع خطة.

كانت النتائج مبهرة للغاية، ومحددة، ومحللة بوضوح، تمامًا كما كان يأمل دائمًا أن يحققه نموذج اللغة واسع النطاق. تضمنت الخطة مؤشرات أداء رئيسية، وجداول زمنية، وأولويات، وتوجيهات صارمة بشأن ما يجب استبعاده تمامًا. وكتب: "كانت الخطة محددة ومؤسسة على أسس متينة لدرجة أنني اضطررت إلى إعادة التفكير في مستقبل شركتي".

صورة نموذج الاستدلال الجديد 1

النتائج التي تم الحصول عليها من جهاز o3 pro (يسار) أكثر دقة وموثوقية. الصورة: بن هيلاك/X.

تبلغ تكلفة O3-pro عشرين دولارًا لكل مليون رمز مُستثمر، وثمانين دولارًا لكل مليون رمز مُصدّر عند استخدامه عبر واجهة برمجة التطبيقات (API). ويعود ذلك إلى قدرة الذكاء الاصطناعي على حفظ البيانات ومعالجتها. يُعادل مليون رمز مُستثمر ما يقارب 750 ألف كلمة، وهو عدد يفوق حتى رواية "الحرب والسلام" ، وفقًا لموقع The Verge .

تؤكد OpenAI أن الخبراء يُقيّمون برنامج o3 pro باستمرار أعلى من برنامج o3 في جميع الفئات التي تم اختبارها. كما يُعطي المراجعون برنامج o3 pro تقييمات أعلى لثباته في عدة معايير مثل الوضوح وسهولة المتابعة والدقة، لا سيما في مجالات رئيسية كالعلوم والتعليم والبرمجة والأعمال ودعم الكتابة.

في اختبار AIME 2024، الذي يقيس القدرات الرياضية للنموذج، حقق نموذج o3 pro أداءً أفضل حتى من نموذج Gemini 2.5 Pro، وهو أفضل نموذج ذكاء اصطناعي من جوجل. بالإضافة إلى ذلك، تفوق النموذج أيضًا على نموذج Claude 4 Opus من شركة Anthropic في اختبار GPQA Diamond، وهو اختبار معرفي علمي على مستوى الدكتوراه.

يُدمج جهاز o3 pro أيضًا أدواتٍ تُمكّنه من البحث في الإنترنت، وتحليل الملفات، واستخدام لغة بايثون للحساب والبرمجة، وتخصيص الاستجابات بالاستفادة من الذاكرة. وفي تعليقه على هذا الجانب، أشار بن هيلاك إلى أن الأداة تُظهر بوضوح قدرتها على إدراك محيطها، ومعرفة متى تسأل عن العالم الخارجي (بدلاً من التظاهر بالمعرفة)، واختيار الأداة المناسبة لكل مهمة.

مع ذلك، يكمن أكبر عيب في هذا النموذج في سرعة استجابته، التي تفوق حتى سرعة استجابة جهاز o1 pro. ويتفق اليوتيوبر بيجان بوين مع هذا الرأي، إذ يقول: "على الرغم من وضوح استجابة النموذج، إلا أنها تستغرق وقتًا طويلاً، حتى مع بضع جمل وصفية فقط". ويضيف بن هيلاك أن النموذج، خاصةً في الحالات التي تفتقر إلى بيانات خارجية كافية، يميل إلى الإفراط في التحليل.

يُعاني O3-pro أيضًا من بعض القيود الأخرى، مثل عدم القدرة على إنشاء الصور، بالإضافة إلى عدم دعم ميزة Canvas. وقد تم تعطيل ميزة الدردشة المؤقتة مع هذا النموذج في ChatGPT مؤقتًا ريثما تُصلح OpenAI "مشكلة تقنية".

ومع ذلك، يجادل هايلاك بأن هذا ليس نموذجًا مناسبًا للدردشة سهلة الاستخدام مثل Claude 3.5 Sonnet أو ChatGPT 4o. وينصح نيت بي. جونز، رئيس قسم المنتجات في Rockerbox، باستخدام o3 pro للمهام الصعبة التي تتطلب من 15 إلى 20 دقيقة من التفكير.


المصدر: https://znews.vn/mo-hinh-suy-luan-moi-cua-chatgpt-post1560084.html


تعليق (0)

يرجى ترك تعليق لمشاركة مشاعرك!

نفس الموضوع

نفس الفئة

نفس المؤلف

إرث

شكل

الشركات

الشؤون الجارية

النظام السياسي

محلي

منتج

Happy Vietnam
فيتنام - البلد - الشعب

فيتنام - البلد - الشعب

"شلال ذو تسع طبقات - فيض من الحب من أم قرية لانغ سين"

"شلال ذو تسع طبقات - فيض من الحب من أم قرية لانغ سين"

روضة أطفال وطنية

روضة أطفال وطنية