
মডেল যত শক্তিশালী, 'চিন্তাভাবনা' তত দুর্বল?
সম্প্রতি প্রকাশিত একটি প্রতিবেদনে, অ্যাপলের গবেষকরা টাওয়ার অফ হ্যানয় বা রিভার ক্রসিং সমস্যার মতো ক্রমবর্ধমান কঠিন যৌক্তিক সমস্যা সমাধানে লার্জ রিজনিং মডেল (এলআরএম)-এর কার্যকারিতা মূল্যায়ন করেছেন।
ফলাফল ছিল চমকপ্রদ: অত্যন্ত জটিল সমস্যার সম্মুখীন হয়ে উন্নত এআই মডেলগুলোর নির্ভুলতা শুধু হ্রাসই পায়নি, বরং "সম্পূর্ণরূপে ভেঙে পড়েছিল"।
আরও উদ্বেগের বিষয় হলো যে, কর্মক্ষমতা মারাত্মকভাবে হ্রাস পাওয়ার আগে, মডেলগুলো তাদের যুক্তি প্রয়োগের প্রচেষ্টা কমিয়ে দিতে শুরু করে, যা সাধারণ যুক্তির পরিপন্থী একটি আচরণ, কারণ একটি কঠিন সমস্যা সমাধানের জন্য আরও বেশি চিন্তাভাবনার প্রয়োজন হওয়া উচিত।
অনেক ক্ষেত্রে, সঠিক অ্যালগরিদম দেওয়া সত্ত্বেও মডেলগুলো সমাধান দিতে ব্যর্থ হয়। এটি নতুন পরিবেশে খাপ খাইয়ে নেওয়ার এবং নিয়ম প্রয়োগ করার ক্ষেত্রে তাদের গভীর সীমাবদ্ধতা প্রকাশ করে।
"সাধারণ তত্ত্ব"-এর চ্যালেঞ্জ
এই গবেষণার প্রতিক্রিয়ায়, এআই-এর প্রকৃত ক্ষমতা নিয়ে সংশয়বাদী কণ্ঠস্বরগুলোর অন্যতম আমেরিকান গবেষক গ্যারি মার্কাস অ্যাপলের এই ফলাফলকে "বেশ বিধ্বংসী" বলে অভিহিত করেছেন।
তার ব্যক্তিগত সাবস্ট্যাক নিউজলেটারে তিনি বলেছেন: "যারা মনে করেন যে বৃহৎ ভাষা মডেল (এলএলএম) হলো এজিআই-এর সরাসরি পথ, তারা নিজেদেরকেই ধোঁকা দিচ্ছেন।"
এই মতের সঙ্গে একমত হয়ে, যুক্তরাজ্যের সারে বিশ্ববিদ্যালয়ের হিউম্যান-সেন্টার্ড এআই ইনস্টিটিউটের বিশেষজ্ঞ অ্যান্ড্রু রোগোইস্কি মনে করেন যে, এই আবিষ্কারটি এই সম্ভাবনার দিকে ইঙ্গিত করে যে প্রযুক্তি শিল্প একটি ‘অচল অবস্থার’ দিকে এগিয়ে যাচ্ছে: “যখন মডেলগুলো কেবল সহজ এবং মাঝারি-কঠিন সমস্যাতেই ভালো কাজ করে, কিন্তু ক্রমবর্ধমান কঠিন সমস্যায় পুরোপুরি ব্যর্থ হয়, তখন এটা স্পষ্ট যে বর্তমান পদ্ধতিতে একটি সমস্যা রয়েছে।”
অ্যাপল বিশেষভাবে যে বিষয়টি তুলে ধরেছে তা হলো 'সাধারণ যুক্তিবোধ' ক্ষমতার অভাব, অর্থাৎ, একটি নির্দিষ্ট পরিস্থিতি থেকে প্রাপ্ত উপলব্ধিকে অনুরূপ পরিস্থিতিতে প্রসারিত করার ক্ষমতার অভাব।
যখন মানুষের স্বাভাবিক পদ্ধতিতে জ্ঞান স্থানান্তর করা যায় না, তখন বর্তমান মডেলগুলো সহজেই 'মুখস্থ বিদ্যা'র পর্যায়ে চলে যায়: যা পুনরাবৃত্তিমূলক ধরনে শক্তিশালী, কিন্তু যৌক্তিক চিন্তাভাবনা বা অনুমানের ক্ষেত্রে দুর্বল।
এছাড়াও, গবেষণায় দেখা গেছে যে বৃহৎ পরিসরের যুক্তি মডেলগুলো সহজ সমস্যার জন্য বারবার সঠিক পদক্ষেপগুলো সম্পাদন করে, কিন্তু সামান্য বেশি জটিল সমস্যার ক্ষেত্রে শুরু থেকেই ভুল পদ্ধতি বেছে নিয়ে কম্পিউটেশনাল রিসোর্স খরচ করে।
প্রতিবেদনটিতে ওপেনএআই-এর ও৩, গুগলের জেমিনি থিঙ্কিং, ক্লদ ৩.৭ সনেট-থিঙ্কিং এবং ডিপসিক-আর১ সহ বেশ কিছু শীর্ষস্থানীয় মডেল পরীক্ষা করা হয়েছে। যদিও অ্যানথ্রোপিক, গুগল এবং ডিপসিক এখনও কোনো প্রতিক্রিয়া জানায়নি, ওপেনএআই মন্তব্য করতে অস্বীকৃতি জানিয়েছে।
অ্যাপলের গবেষণা ভাষা, চিত্র বা বিগ ডেটার ক্ষেত্রে এআই-এর সাফল্যকে অস্বীকার করে না। তবে, এটি এমন একটি দুর্বল দিক তুলে ধরে যা উপেক্ষা করা হচ্ছে: স্বাভাবিকভাবে যুক্তি দিয়ে বিচার করার ক্ষমতা, যা প্রকৃত বুদ্ধিমত্তা অর্জনের মূল ভিত্তি।
উৎস: https://baovanhoa.vn/nhip-song-so/ai-suy-luan-kem-dan-khi-gap-bai-toan-phuc-tap-141602.html








মন্তব্য (0)