মে মাসের মাঝামাঝি এক সপ্তাহান্তে, গণিত জগতের একটি গোপন বৈঠক অনুষ্ঠিত হয়। বিশ্বের ৩০ জন শীর্ষস্থানীয় গণিতবিদ গোপনে মার্কিন যুক্তরাষ্ট্রের ক্যালিফোর্নিয়ার বার্কলেতে "যুক্তি" করতে সক্ষম একটি চ্যাটবটের সাথে মুখোমুখি হওয়ার জন্য ভ্রমণ করেন। চ্যাটবটটিকে গণিতবিদদের দ্বারা লিখিত সমস্যা সমাধানের দায়িত্ব দেওয়া হয়েছিল, এর সমস্যা সমাধানের ক্ষমতা পরীক্ষা করার জন্য।
দুই দিন ধরে একটানা অধ্যাপক-স্তরের প্রশ্ন করার পর, গণিতবিদরা অবাক হয়ে বুঝতে পারলেন যে এই চ্যাটবটটি ইতিহাসের সবচেয়ে কঠিন কিছু সমস্যার সমাধান করতে পারে।
“আমি সহকর্মীদের সরাসরি বলতে দেখেছি যে এই বৃহৎ ভাষা মডেলটি গাণিতিক প্রতিভার স্তরের দিকে এগিয়ে যাচ্ছে,” ভার্জিনিয়া বিশ্ববিদ্যালয়ের অধ্যাপক এবং সভার সভাপতি ও বিচারক কেন ওনো সায়েন্টিফিক আমেরিকানকে বলেন।
যে চ্যাটবটটি আমাদের দৃষ্টি আকর্ষণ করেছে তা o4-mini দ্বারা চালিত, যা একটি বৃহৎ ভাষা মডেল (LLM) যা জটিল যুক্তির জন্য ডিজাইন করা হয়েছে। এটি OpenAI এর একটি পণ্য এবং এটি পরিশীলিত যুক্তি সম্পাদনের জন্য প্রশিক্ষিত। গুগলের সমতুল্য মডেল, জেমিনি 2.5 ফ্ল্যাশ, এরও একই ক্ষমতা রয়েছে।
পূর্ববর্তী ChatGPT LLM-এর মতো, o4-mini একটি টেক্সট স্ট্রিং-এর পরবর্তী শব্দ ভবিষ্যদ্বাণী করতে শেখে। যাইহোক, o4-mini হল একটি হালকা, আরও নমনীয় সংস্করণ যা গভীর তথ্যের উপর প্রশিক্ষিত এবং মানুষের দ্বারা ঘনিষ্ঠভাবে সুরক্ষিত - এটিকে এমন গাণিতিক সমস্যাগুলির মধ্যে গভীরভাবে প্রবেশ করতে দেয় যা পূর্ববর্তী মডেলগুলি পৌঁছাতে পারেনি।
o4-মিনির ক্ষমতা পরীক্ষা করার জন্য, OpenAI LLM মডেল পরীক্ষায় বিশেষজ্ঞ একটি অলাভজনক প্রতিষ্ঠান Epoch AI-কে 300টি পূর্বে অপ্রকাশিত গাণিতিক প্রশ্ন তৈরি করতে বলেছিল। যদিও ঐতিহ্যবাহী LLM অনেক জটিল সমস্যার সমাধান করতে পারে, যখন সম্পূর্ণ নতুন প্রশ্নের সাথে চ্যালেঞ্জ করা হয়, তাদের বেশিরভাগই 2% এরও কম সঠিক পেয়েছে, যা ইঙ্গিত দেয় যে তারা যুক্তি দিতে সত্যিই সক্ষম ছিল না।
নতুন মূল্যায়ন প্রকল্পে, Epoch AI তরুণ গণিতবিদ ডঃ এলিয়ট গ্লেজারকে তাদের নেতা হিসেবে নিয়োগ করেছে। FrontierMath নামে নতুন এই প্রকল্পটি ২০২৪ সালের সেপ্টেম্বর থেকে চালু হবে।
এই প্রকল্পটি স্নাতক, স্নাতকোত্তর থেকে শুরু করে উন্নত গবেষণা পর্যন্ত চারটি স্তরের অসুবিধার নতুন প্রশ্ন সংগ্রহ করে। ২০২৫ সালের এপ্রিলের মধ্যে, গ্লেজার আবিষ্কার করেন যে o4-mini প্রায় ২০% সমস্যার সমাধান করতে পারে। তাই তিনি ৪র্থ স্তরে চলে আসেন - এটিকে এমন সমস্যা সমাধান করতে বলেন যা এমনকি উন্নত গণিতবিদদেরও মোকাবেলা করতে হয়।
অংশগ্রহণকারীদের একটি গোপনীয়তা চুক্তিতে স্বাক্ষর করতে বাধ্য করা হয়েছিল এবং তারা কেবল এনক্রিপ্ট করা অ্যাপ সিগন্যালের মাধ্যমে যোগাযোগ করতে পারত, কারণ ইমেল ব্যবহার করলে LLM বিষয়বস্তু স্ক্যান করতে এবং "শুঁকে" নিতে পারত, যার ফলে মূল্যায়ন তথ্য জাল করা হত।
o4-mini সমাধান করতে পারে না এমন প্রতিটি সমস্যা প্রশ্নকর্তাকে ৭,৫০০ মার্কিন ডলার পুরষ্কার দেবে।
প্রাথমিক দলটি প্রশ্ন তৈরিতে ধীর কিন্তু স্থির অগ্রগতি অর্জন করেছিল। কিন্তু গ্লেজার ১৭-১৮ মে একটি সশরীরে বৈঠক করে দ্রুত কাজ শুরু করার সিদ্ধান্ত নেন। অংশগ্রহণকারী ৩০ জন গণিতবিদকে ছয়জনের দলে ভাগ করা হয়েছিল, যারা একে অপরের বিরুদ্ধে প্রতিযোগিতা করেছিলেন - সমস্যা সমাধানের জন্য নয়, বরং এমন সমস্যা তৈরি করার জন্য যা কৃত্রিম বুদ্ধিমত্তা সমাধান করতে পারে না।
১৭ মে সন্ধ্যার মধ্যে, কেন ওনো চ্যাটবটটি নিয়ে হতাশ হতে শুরু করেছিলেন, যা প্রত্যাশার চেয়ে অনেক বেশি গাণিতিক দক্ষতার স্তর দেখাচ্ছিল, যার ফলে দলের পক্ষে এটিকে "ফাঁদে ফেলা" কঠিন হয়ে পড়েছিল। "আমি এমন একটি সমস্যা নিয়ে এসেছি যা এই ক্ষেত্রের বিশেষজ্ঞরা সংখ্যা তত্ত্বের একটি উন্মুক্ত সমস্যা হিসাবে স্বীকৃতি দেবেন - পিএইচডি করার জন্য উপযুক্ত একটি সমস্যা," তিনি বলেছিলেন।
ফলস্বরূপ, যখন তিনি o4-mini-কে জিজ্ঞাসা করলেন, তখন তিনি চ্যাটবটটি মাত্র ১০ মিনিটের মধ্যে বিশ্লেষণ, যুক্তি এবং সঠিক সমাধান নিয়ে আসতে দেখে অবাক হয়ে গেলেন। বিশেষ করে, প্রথম দুই মিনিটে, এটি সমস্ত প্রাসঙ্গিক নথি শিখেছে এবং আঁকড়ে ধরেছে। তারপর, এটি কীভাবে এটি মোকাবেলা করতে হয় তা শেখার জন্য সমস্যার একটি সহজ সংস্করণ চেষ্টা করার প্রস্তাব দেয়।
পাঁচ মিনিট পরে, চ্যাটবটটি সঠিক উত্তরটি দিয়েছিল, আত্মবিশ্বাসী - এমনকি অহংকারী - সুরে। "এটি গালমন্দ হতে শুরু করেছিল," ওনো বলে, "এবং এটি আরও বলেছিল: 'কোনও উদ্ধৃতি দেওয়ার দরকার নেই কারণ আমি গোপন নম্বরটি বের করে ফেলেছি!'"
১৮ মে ভোরে এআই-এর কাছে পরাজিত হয়ে, ওনো তৎক্ষণাৎ সিগন্যালের মাধ্যমে দলকে একটি সতর্কীকরণ বার্তা পাঠান। "আমি এই ধরণের মডেলের সাথে মোকাবিলা করার জন্য সম্পূর্ণরূপে প্রস্তুত ছিলাম না," তিনি বলেন। "আমি কখনও কোনও কম্পিউটার মডেলে এই ধরণের যুক্তি দেখিনি। এটি এমনভাবে চিন্তা করছিল যা একজন প্রকৃত বিজ্ঞানী চিন্তা করেন। এবং এটি ছিল ভীতিকর।"
যদিও গণিতবিদরা অবশেষে ১০টি প্রশ্ন খুঁজে পেতে সফল হয়েছেন যা o4-মিনিকে হতবাক করে দিয়েছিল, তবুও তারা মাত্র এক বছরে AI এর বিকাশের গতিতে তাদের বিস্ময় লুকাতে পারেনি।
ওনো o4-মিনির সাথে কাজ করার অভিজ্ঞতাকে একজন অত্যন্ত প্রতিভাবান সহকর্মীর সাথে সহযোগিতা করার সাথে তুলনা করেন। এবং লন্ডন ইনস্টিটিউট অফ ম্যাথমেটিক্যাল সায়েন্সেসের একজন গণিতবিদ এবং গণিতে AI প্রয়োগের পথিকৃৎ ইয়াং হুই হে মন্তব্য করেন: "একজন অত্যন্ত প্রতিভাবান পিএইচডি শিক্ষার্থী এটিই করতে পারে - এবং আরও অনেক কিছু।"
এবং এটা মনে রাখা উচিত যে AI এটি মানুষের তুলনায় অনেক দ্রুত করে। যদিও মানুষের এটি সমাধান করতে সপ্তাহ বা মাস সময় লাগে, o4-mini মাত্র কয়েক মিনিট সময় নেয়।
o4-মিনি ঘিরে যে উত্তেজনা তা উদ্বেগের বাইরে নয়। ওনো এবং হি উভয়েই সতর্ক করে দিয়েছেন যে o4-মিনির ক্ষমতা মানুষকে অতিরিক্ত আত্মবিশ্বাসী করে তুলতে পারে। "আমাদের কাছে প্রবর্তন দ্বারা প্রমাণ, দ্বন্দ্ব দ্বারা প্রমাণ, এবং এখন প্রমাণ দ্বারা... অপ্রতিরোধ্য," তিনি বলেন। "যদি আপনি যথেষ্ট আত্মবিশ্বাসের সাথে কিছু বলেন, তাহলে মানুষ ভীত হবে। আমার মনে হয় o4-মিনি এই ধরণের প্রমাণ আয়ত্ত করেছে: এটি অত্যন্ত আত্মবিশ্বাসের সাথে সবকিছু বলে।"
সভা শেষ হওয়ার সাথে সাথে, গণিতবিদরা গণিতের ভবিষ্যৎ নিয়ে ভাবতে শুরু করলেন। তারা "পঞ্চম স্তর" - এমন একটি প্রশ্ন নিয়ে আলোচনা করলেন যা বিশ্বের সেরা গণিতবিদরাও সমাধান করতে পারবেন না - এর সম্ভাবনা নিয়ে আলোচনা করলেন। যদি AI সেই সীমায় পৌঁছায়, তাহলে গণিতবিদদের ভূমিকা নাটকীয়ভাবে পরিবর্তিত হবে: সম্ভবত তারা প্রশ্নকারী হয়ে উঠবেন, নতুন গাণিতিক সত্য আবিষ্কারের জন্য AI যুক্তির সাথে যোগাযোগ করবেন এবং নির্দেশনা দেবেন - ঠিক যেমন একজন অধ্যাপক একজন স্নাতক ছাত্রের সাথে কাজ করেন।
"আমি অনেক দিন ধরেই আমার সহকর্মীদের বলে আসছি যে, সাধারণ কৃত্রিম বুদ্ধিমত্তা কখনোই ঘটবে না, এটি কেবল একটি কম্পিউটার, এটা ভাবাটা হবে বিরাট ভুল," ওনো বলেন। "আমি আতঙ্কিত হতে চাই না, কিন্তু কিছু দিক থেকে এই বৃহৎ ভাষা মডেলগুলি ইতিমধ্যেই বিশ্বের সেরা পিএইচডি শিক্ষার্থীদের বেশিরভাগকেই ছাড়িয়ে যেতে শুরু করেছে।"
সূত্র: https://www.vietnamplus.vn/cuoc-gap-go-dac-biet-noi-cac-nha-toan-hoc-tim-cach-danh-bai-tri-tue-nhan-tao-post1043183.vnp
মন্তব্য (0)