
كلما كان النموذج أقوى، كلما كان "التفكير" أضعف؟
في تقرير نُشر حديثًا، قام باحثو شركة أبل بتقييم أداء نماذج الاستدلال الكبيرة (LRMs) في التعامل مع مشاكل المنطق ذات الصعوبة المتزايدة، مثل مشكلة برج هانوي أو مشكلة عبور النهر .
كانت النتائج صادمة: فعند مواجهة مشاكل معقدة للغاية، لم تتدهور دقة نماذج الذكاء الاصطناعي المتقدمة فحسب، بل "انهارت تمامًا".
الأمر الأكثر إثارة للقلق هو أنه قبل أن يتراجع الأداء، بدأت النماذج في ... تقليل جهد التفكير، وهو سلوك يتعارض مع الحدس، حيث ينبغي أن يكون هناك حاجة إلى مزيد من التفكير عند التعامل مع مشكلة صعبة.
في كثير من الحالات، حتى مع استخدام الخوارزمية الصحيحة، تعجز النماذج عن تقديم حل. وهذا يكشف عن قصور كبير في قدرتها على التكيف وتطبيق القواعد في بيئات جديدة.
تحدي "النظرية العامة"
وفي معرض رده على هذا البحث، وصف الباحث الأمريكي غاري ماركوس، أحد الأصوات المتشككة في القدرات الحقيقية للذكاء الاصطناعي، نتائج شركة أبل بأنها "مدمرة للغاية".
في رسالته الإخبارية الشخصية على منصة Substack، صرح قائلاً: "أي شخص يعتقد أن نماذج اللغة الكبيرة (LLMs) هي طريق مباشر إلى الذكاء الاصطناعي العام (AGI) يخدع نفسه".
ويتفق أندرو روجوسكي، الخبير في معهد الذكاء الاصطناعي المتمحور حول الإنسان (جامعة ساري، المملكة المتحدة)، مع هذا الرأي، ويعتقد أن هذه النتيجة تشير إلى احتمال أن صناعة التكنولوجيا تتجه نحو "طريق مسدود": "عندما لا تعمل النماذج بشكل جيد إلا مع المشكلات البسيطة والمتوسطة الصعوبة، ولكنها تفشل تمامًا في زيادة الصعوبة، فمن الواضح أن هناك مشكلة في النهج الحالي".
إحدى النقاط المحددة التي سلطت عليها شركة آبل الضوء هي الافتقار إلى القدرة على "التفكير العام"، أي القدرة على توسيع الفهم من موقف معين إلى مواقف مماثلة.
عندما يتعذر نقل المعرفة بالطريقة التي يفعلها البشر عادةً، فإن النماذج الحالية تقع بسهولة في حالة "التعلم الآلي": قوية في الأنماط المتكررة، ولكنها ضعيفة في التفكير المنطقي أو الاستنتاج.
علاوة على ذلك، وجدت الأبحاث أن نماذج الاستدلال واسعة النطاق تستهلك موارد الحوسبة من خلال تكرار تنفيذ الخطوات الصحيحة للمشاكل البسيطة، ولكن اختيار النهج الخاطئ منذ البداية للمشاكل الأكثر تعقيدًا قليلاً.
اختبر التقرير مجموعة من النماذج الرائدة، بما في ذلك o3 من OpenAI، وGemini Thinking من Google، وClaude 3.7 Sonnet-Thinking، وDeepSeek-R1. وبينما لم ترد Anthropic وGoogle وDeepSeek بعد، امتنعت OpenAI عن التعليق.
لا ينكر بحث شركة آبل إنجازات الذكاء الاصطناعي في مجالات اللغة والتصوير والبيانات الضخمة. ومع ذلك، فإنه يسلط الضوء على نقطة عمياء يتم تجاهلها: القدرة على التفكير المنطقي، والتي تُعدّ جوهر تحقيق الذكاء الحقيقي.
المصدر: https://baovanhoa.vn/nhip-song-so/ai-suy-luan-kem-dan-khi-gap-bai-toan-phuc-tap-141602.html







تعليق (0)