روبوت المحادثة من OpenAI يتطور مع التقنيات الجديدة. الصورة: نيويورك تايمز . |
في سبتمبر 2024، أصدرت OpenAI إصدارًا من ChatGPT يدمج نموذج o1، والذي يمكنه التفكير في المهام المتعلقة بالرياضيات والعلوم وبرمجة الكمبيوتر.
على عكس الإصدار السابق من ChatGPT، ستستغرق التكنولوجيا الجديدة بعض الوقت "للتفكير" في حلول للمشاكل المعقدة قبل تقديم الاستجابة.
بعد OpenAI، قدّم العديد من المنافسين، مثل جوجل وأنثروبيك وديب سيك، نماذج استدلال مشابهة. ورغم أنها ليست مثالية، إلا أنها لا تزال تقنيةً متطورةً لروبوتات الدردشة تحظى بثقة العديد من المطورين.
كيف يفكر الذكاء الاصطناعي
في الأساس، يعني الاستدلال أن برنامج المحادثة الآلي يمكن أن يقضي وقتًا أطول في حل المشكلة التي يطرحها المستخدم.
يقول دان كلاين، أستاذ علوم الكمبيوتر بجامعة كاليفورنيا في بيركلي، لصحيفة نيويورك تايمز : "التفكير المنطقي هو الطريقة التي يبذل بها النظام المزيد من العمل بعد أن يتلقى سؤالاً".
يمكن لنظام التفكير أن يقسم المشكلة إلى خطوات فردية، أو أن يحلها من خلال التجربة والخطأ.
عند إطلاقه، كان ChatGPT قادرًا على الإجابة على الأسئلة فورًا عن طريق استخراج المعلومات وتوليفها. في الوقت نفسه، احتاجت أنظمة التفكير المنطقي إلى بضع ثوانٍ إضافية (أو حتى دقائق) لحل المشكلة والاستجابة.
![]() |
مثال على عملية التفكير في نموذج o1 في روبوت محادثة لخدمة العملاء. الصورة: OpenAI . |
في بعض الحالات، يُغيّر نظام الاستدلال نهجه في التعامل مع المشكلة، مُحسّنًا الحل باستمرار. أو قد يُجرّب النموذج حلولًا متعددة قبل الاستقرار على الخيار الأمثل، أو يختبر دقة الإجابات السابقة.
بشكل عام، يأخذ نظام التفكير المنطقي بعين الاعتبار جميع الإجابات الممكنة للسؤال. وهذا يشبه طلاب المرحلة الابتدائية، الذين يكتبون العديد من الخيارات على الورق قبل اختيار الطريقة الأنسب لحل مسألة رياضية.
وفقًا لصحيفة نيويورك تايمز ، أصبح الذكاء الاصطناعي قادرًا الآن على التفكير في أي موضوع. ومع ذلك، ستكون هذه المهمة أكثر فعالية مع الأسئلة المتعلقة بالرياضيات والعلوم وبرمجة الحاسوب.
كيف يتم تدريب النظام النظري؟
في روبوت المحادثة العادي، لا يزال بإمكان المستخدمين طلب شرح للعملية أو التحقق من صحة الإجابة. في الواقع، تتضمن العديد من مجموعات بيانات تدريب ChatGPT عملية حل المشكلات.
يتخطى نظام الاستدلال حدوده عندما يتمكن من تنفيذ إجراء ما دون طلب من المستخدم. هذه العملية أكثر تعقيدًا وشمولًا. تستخدم الشركات مصطلح "الاستدلال" لأن النظام يعمل بطريقة مشابهة للتفكير البشري.
تراهن العديد من الشركات، مثل OpenAI، على أن أنظمة التفكير المنطقي هي أفضل طريقة لتحسين روبوتات الدردشة اليوم. لسنوات، اعتقدوا أن روبوتات الدردشة ستعمل على أفضل وجه إذا تم تدريبها على أكبر قدر ممكن من المعلومات من الإنترنت.
بحلول عام ٢٠٢٤، ستكون أنظمة الذكاء الاصطناعي قد استهلكت تقريبًا كل النصوص المتاحة على الإنترنت. هذا يعني أن الشركات ستحتاج إلى إيجاد حلول جديدة لتطوير روبوتات الدردشة، بما في ذلك أنظمة الاستدلال.
![]() |
أثارت شركة DeepSeek الناشئة ضجةً كبيرةً بنموذجها الاستدلالي الذي كان أقل تكلفةً من OpenAI. الصورة: بلومبرج . |
منذ العام الماضي، ركزت شركات مثل OpenAI على تقنية تسمى التعلم التعزيزي، وهي عملية تستغرق عادة عدة أشهر وتتضمن سلوك التعلم الذكي من خلال التجربة والخطأ.
على سبيل المثال، من خلال حل آلاف المسائل، يستطيع النظام تعلم الطريقة المثلى للحصول على الإجابة الصحيحة. ومن هنا، طوّر الباحثون آليات تغذية راجعة معقدة تساعد النظام على تعلم الحلول الصحيحة والخاطئة.
قال جيري تووريك، الباحث في OpenAI: "الأمر أشبه بتدريب كلب. إذا نجح، تُكافئه. وإذا لم ينجح، تقول: هذا الكلب سيء".
هل الذكاء الاصطناعي هو المستقبل؟
وفقًا لصحيفة نيويورك تايمز ، فإن التعلم المعزز يعمل بشكل جيد مع أسئلة الرياضيات والعلوم وبرمجة الكمبيوتر، حيث توجد إجابات صحيحة أو خاطئة محددة بوضوح.
على النقيض من ذلك، لا يُجدي التعلم المُعزَّز نفعًا في الكتابة أو الفلسفة أو الأخلاق، حيث يصعب التمييز بين الجيد والسيئ. لكن الباحثين يقولون إن هذه التقنية لا تزال قادرة على تحسين أداء الذكاء الاصطناعي، حتى في مسائل خارج الرياضيات.
وقال جاريد كابلان، كبير مسؤولي العلوم في أنثروبيك: "ستتعلم الأنظمة المسارات التي تؤدي إلى نتائج إيجابية وسلبية".
![]() |
موقع شركة أنثروبيك، الشركة الناشئة المالكة لنموذج الذكاء الاصطناعي كلود. الصورة: بلومبرغ . |
من المهم ملاحظة أن التعلم المعزز وأنظمة الاستدلال مفهومان مختلفان. على وجه التحديد، التعلم المعزز هو أسلوب لبناء أنظمة الاستدلال. هذه هي المرحلة النهائية لتدريب روبوتات الدردشة على اكتساب قدرات الاستدلال.
نظرًا لحداثة هذه التقنيات نسبيًا، لا يستطيع العلماء الجزم بما إذا كانت روبوتات المحادثة المنطقية أو التعلم المُعزَّز قادرة على مساعدة الذكاء الاصطناعي على التفكير كالبشر. تجدر الإشارة إلى أن العديد من اتجاهات تدريب الذكاء الاصطناعي الحالية تتطور بسرعة كبيرة في البداية ثم تتباطأ.
علاوة على ذلك، لا تزال روبوتات المحادثة المنطقية عرضة للأخطاء. بناءً على الاحتمالات، سيختار النظام العملية الأكثر تشابهًا مع البيانات التي تعلمها، سواءً كانت من الإنترنت أو من خلال التعلم التعزيزي. لذلك، لا يزال بإمكان روبوتات المحادثة اختيار الحل الخاطئ أو غير المنطقي.
المصدر: https://znews.vn/ai-ly-luan-nhu-the-nao-post1541477.html
تعليق (0)