
هرچه مدل قویتر باشد، «تفکر» ضعیفتر است؟
در گزارشی که به تازگی منتشر شده است، محققان اپل عملکرد مدلهای استدلال بزرگ (LRM) را در مدیریت مسائل منطقی با سختی فزاینده، مانند برج هانوی یا مسئله عبور از رودخانه ، ارزیابی کردند.
نتایج تکاندهنده بود: هنگام مواجهه با مسائل بسیار پیچیده، دقت مدلهای پیشرفته هوش مصنوعی نه تنها کاهش یافت، بلکه «کاملاً فرو ریخت».
نکته نگرانکنندهتر این است که قبل از افت عملکرد، مدلها شروع به کاهش تلاش استدلال خود کردند، رفتاری برخلاف شهود، زیرا هنگام برخورد با یک مسئله دشوار باید تفکر بیشتری مورد نیاز باشد.
در بسیاری از موارد، حتی وقتی الگوریتم صحیح به مدلها داده میشود، آنها هنوز در ارائه راهحل شکست میخورند. این موضوع محدودیتهای عمیقی را در توانایی آنها برای سازگاری و اعمال قوانین در محیطهای جدید نشان میدهد.
چالش «نظریه عمومی»
در پاسخ به این تحقیق، گری مارکوس، محقق آمریکایی و یکی از منتقدان سرسخت قابلیتهای واقعی هوش مصنوعی، یافتههای اپل را «کاملاً ویرانگر» خواند.
او در خبرنامه شخصی خود در Substack اظهار داشت: «هر کسی که فکر میکند مدلهای زبانی بزرگ (LLM) مسیر مستقیمی به AGI هستند، خودش را فریب میدهد.»
اندرو روگویسکی، متخصص موسسه هوش مصنوعی انسانمحور (دانشگاه ساری، انگلستان)، با این دیدگاه موافق است و معتقد است که این یافته به این احتمال اشاره دارد که صنعت فناوری به سمت یک «بنبست» در حرکت است: «وقتی مدلها فقط با مسائل ساده و با سختی متوسط خوب عمل میکنند، اما در افزایش سختی کاملاً شکست میخورند، مشخص است که مشکلی در رویکرد فعلی وجود دارد.»
یکی از نکات خاصی که اپل بر آن تأکید کرد، فقدان توانایی «استدلال عمومی» است، یعنی توانایی گسترش درک از یک موقعیت خاص به موقعیتهای مشابه.
وقتی دانش نتواند به شیوهای که انسانها معمولاً انجام میدهند منتقل شود، مدلهای فعلی به راحتی در حالت «یادگیری طوطیوار» قرار میگیرند: در الگوهای تکراری قوی، اما در تفکر منطقی یا استنتاج ضعیف هستند.
علاوه بر این، تحقیقات نشان داده است که مدلهای استدلال در مقیاس بزرگ، با انجام مکرر مراحل صحیح برای مسائل ساده، منابع محاسباتی را مصرف میکنند، اما برای مسائل کمی پیچیدهتر، از همان ابتدا رویکرد اشتباه را انتخاب میکنند.
این گزارش طیف وسیعی از مدلهای پیشرو، از جمله o3 شرکت OpenAI، Gemini Thinking گوگل، Claude 3.7 Sonnet-Thinking و DeepSeek-R1 را آزمایش کرده است. در حالی که Anthropic، گوگل و DeepSeek هنوز پاسخی ندادهاند، OpenAI از اظهار نظر خودداری کرده است.
تحقیقات اپل دستاوردهای هوش مصنوعی در زبان، تصویرسازی یا کلانداده را انکار نمیکند. با این حال، نقطه کوری را برجسته میکند که نادیده گرفته میشود: توانایی استدلال واقعی، که هسته اصلی دستیابی به هوش واقعی است.
منبع: https://baovanhoa.vn/nhip-song-so/ai-suy-luan-kem-dan-khi-gap-bai-toan-phuc-tap-141602.html








نظر (0)