توانایی استدلال هوش مصنوعی هنگام مواجهه با مسائل پیچیده رو به زوال می‌رود.

VHO - یک مطالعه جدید توسط اپل نشان می‌دهد که مدل‌های پیشرفته هوش مصنوعی می‌توانند در مواجهه با مشکلات پیچیده «کاملاً از هم بپاشند» و این موضوع سوالات جدی در مورد توانایی رسیدن به هوش مصنوعی عمومی - مرحله‌ای که ماشین‌ها مانند انسان‌ها فکر می‌کنند - ایجاد می‌کند.

Báo Văn Hóa•10/06/2025

توانایی استدلال هوش مصنوعی هنگام مواجهه با مسائل پیچیده کاهش می‌یابد - تصویر ۱ — تحقیقات جدید اپل نشان می‌دهد که استدلال هوش مصنوعی در مواجهه با مسائل پیچیده، کارایی کمتری دارد.

هرچه مدل قوی‌تر باشد، «تفکر» ضعیف‌تر است؟

در گزارشی که به تازگی منتشر شده است، محققان اپل عملکرد مدل‌های استدلال بزرگ (LRM) را در مدیریت مسائل منطقی با سختی فزاینده، مانند برج هانوی یا مسئله عبور از رودخانه ، ارزیابی کردند.

نتایج تکان‌دهنده بود: هنگام مواجهه با مسائل بسیار پیچیده، دقت مدل‌های پیشرفته هوش مصنوعی نه تنها کاهش یافت، بلکه «کاملاً فرو ریخت».

نکته نگران‌کننده‌تر این است که قبل از افت عملکرد، مدل‌ها شروع به کاهش تلاش استدلال خود کردند، رفتاری برخلاف شهود، زیرا هنگام برخورد با یک مسئله دشوار باید تفکر بیشتری مورد نیاز باشد.

در بسیاری از موارد، حتی وقتی الگوریتم صحیح به مدل‌ها داده می‌شود، آنها هنوز در ارائه راه‌حل شکست می‌خورند. این موضوع محدودیت‌های عمیقی را در توانایی آنها برای سازگاری و اعمال قوانین در محیط‌های جدید نشان می‌دهد.

چالش «نظریه عمومی»

در پاسخ به این تحقیق، گری مارکوس، محقق آمریکایی و یکی از منتقدان سرسخت قابلیت‌های واقعی هوش مصنوعی، یافته‌های اپل را «کاملاً ویرانگر» خواند.

او در خبرنامه شخصی خود در Substack اظهار داشت: «هر کسی که فکر می‌کند مدل‌های زبانی بزرگ (LLM) مسیر مستقیمی به AGI هستند، خودش را فریب می‌دهد.»

اندرو روگویسکی، متخصص موسسه هوش مصنوعی انسان‌محور (دانشگاه ساری، انگلستان)، با این دیدگاه موافق است و معتقد است که این یافته به این احتمال اشاره دارد که صنعت فناوری به سمت یک «بن‌بست» در حرکت است: «وقتی مدل‌ها فقط با مسائل ساده و با سختی متوسط خوب عمل می‌کنند، اما در افزایش سختی کاملاً شکست می‌خورند، مشخص است که مشکلی در رویکرد فعلی وجود دارد.»

یکی از نکات خاصی که اپل بر آن تأکید کرد، فقدان توانایی «استدلال عمومی» است، یعنی توانایی گسترش درک از یک موقعیت خاص به موقعیت‌های مشابه.

وقتی دانش نتواند به شیوه‌ای که انسان‌ها معمولاً انجام می‌دهند منتقل شود، مدل‌های فعلی به راحتی در حالت «یادگیری طوطی‌وار» قرار می‌گیرند: در الگوهای تکراری قوی، اما در تفکر منطقی یا استنتاج ضعیف هستند.

علاوه بر این، تحقیقات نشان داده است که مدل‌های استدلال در مقیاس بزرگ، با انجام مکرر مراحل صحیح برای مسائل ساده، منابع محاسباتی را مصرف می‌کنند، اما برای مسائل کمی پیچیده‌تر، از همان ابتدا رویکرد اشتباه را انتخاب می‌کنند.

این گزارش طیف وسیعی از مدل‌های پیشرو، از جمله o3 شرکت OpenAI، Gemini Thinking گوگل، Claude 3.7 Sonnet-Thinking و DeepSeek-R1 را آزمایش کرده است. در حالی که Anthropic، گوگل و DeepSeek هنوز پاسخی نداده‌اند، OpenAI از اظهار نظر خودداری کرده است.

تحقیقات اپل دستاوردهای هوش مصنوعی در زبان، تصویرسازی یا کلان‌داده را انکار نمی‌کند. با این حال، نقطه کوری را برجسته می‌کند که نادیده گرفته می‌شود: توانایی استدلال واقعی، که هسته اصلی دستیابی به هوش واقعی است.

منبع: https://baovanhoa.vn/nhip-song-so/ai-suy-luan-kem-dan-khi-gap-bai-toan-phuc-tap-141602.html