मई के मध्य में एक सप्ताहांत, गणित जगत की एक गुप्त बैठक हुई। दुनिया के 30 प्रमुख गणितज्ञ गुप्त रूप से बर्कले, कैलिफ़ोर्निया, अमेरिका पहुँचे, जहाँ उन्होंने एक "तर्क" करने में सक्षम चैटबॉट से मुलाक़ात की। चैटबॉट को गणितज्ञों द्वारा स्वयं लिखे गए प्रश्नों को हल करने का काम सौंपा गया था, ताकि उसकी समस्या-समाधान क्षमताओं का परीक्षण किया जा सके।
दो दिनों तक लगातार प्रोफेसर स्तर के प्रश्न पूछने के बाद, गणितज्ञ यह जानकर आश्चर्यचकित हो गए कि यह चैटबॉट इतिहास में अब तक हल की गई कुछ सबसे कठिन समस्याओं को हल कर सकता है।
वर्जीनिया विश्वविद्यालय के प्रोफेसर तथा बैठक के अध्यक्ष और निर्णायक केन ओनो ने साइंटिफिक अमेरिकन को बताया, "मैंने सहकर्मियों को स्पष्ट रूप से यह कहते हुए देखा कि यह विशाल भाषा मॉडल गणितीय प्रतिभा के स्तर के करीब पहुंच रहा है।"
जिस चैटबॉट ने हमारा ध्यान खींचा, वह o4-mini द्वारा संचालित है, जो जटिल तर्क के लिए डिज़ाइन किया गया एक बड़ा भाषा मॉडल (LLM) है। यह OpenAI का एक उत्पाद है और परिष्कृत तर्क करने के लिए प्रशिक्षित है। Google के समकक्ष मॉडल, Gemini 2.5 Flash, में भी ऐसी ही क्षमताएँ हैं।
पिछले ChatGPT LLM की तरह, o4-mini टेक्स्ट स्ट्रिंग में अगले शब्द का अनुमान लगाना सीखता है। हालाँकि, o4-mini एक हल्का, ज़्यादा लचीला संस्करण है जिसे गहन डेटा पर प्रशिक्षित किया गया है और मनुष्यों द्वारा बारीकी से ट्यून किया गया है - जिससे यह उन गणितीय समस्याओं में गहराई से उतर सकता है जिन तक पिछले मॉडल नहीं पहुँच पाए थे।
ओ4-मिनी की क्षमताओं का परीक्षण करने के लिए, ओपनएआई ने एलएलएम मॉडलों के परीक्षण में विशेषज्ञता रखने वाली एक गैर-लाभकारी संस्था, एपोच एआई से 300 पहले से अप्रकाशित गणितीय प्रश्न बनाने को कहा। हालाँकि पारंपरिक एलएलएम कई जटिल समस्याओं को हल कर सकते हैं, लेकिन जब उन्हें पूरी तरह से नए प्रश्नों के साथ चुनौती दी गई, तो उनमें से ज़्यादातर 2% से भी कम सही उत्तर दे पाए, जिससे पता चलता है कि वे वास्तव में तर्क करने में सक्षम नहीं थे।
नए मूल्यांकन प्रोजेक्ट में, एपोच एआई ने युवा गणितज्ञ डॉ. इलियट ग्लेज़र को अपना नेता नियुक्त किया है। फ्रंटियरमैथ नामक यह नया प्रोजेक्ट सितंबर 2024 से लागू होगा।
यह परियोजना स्नातक, स्नातकोत्तर और उन्नत शोध स्तर तक, कठिनाई के चार स्तरों पर नए प्रश्न एकत्र करती है। अप्रैल 2025 तक, ग्लेज़र ने पाया कि o4-mini लगभग 20% समस्याओं को हल कर सकता है। इसलिए उन्होंने इसे स्तर 4 तक आगे बढ़ाया—और इसे ऐसे प्रश्न हल करने के लिए कहा जिन्हें हल करने में उन्नत गणितज्ञ भी संघर्ष कर सकते थे।
प्रतिभागियों को गोपनीयता समझौते पर हस्ताक्षर करने के लिए मजबूर किया गया था और वे केवल एन्क्रिप्टेड ऐप सिग्नल के माध्यम से ही संवाद कर सकते थे, क्योंकि ईमेल का उपयोग करने से एलएलएम को सामग्री को स्कैन करने और "सूंघने" की अनुमति मिल सकती थी, जिससे मूल्यांकन डेटा गलत हो सकता था।
प्रत्येक समस्या जिसे o4-mini हल नहीं कर पाएगा, प्रश्नकर्ता को 7,500 USD का पुरस्कार मिलेगा।
शुरुआती टीम ने प्रश्नों को हल करने में धीमी, लेकिन लगातार प्रगति की। लेकिन ग्लेज़र ने 17-18 मई को एक व्यक्तिगत बैठक आयोजित करके इस प्रक्रिया को तेज़ करने का फैसला किया। भाग लेने वाले 30 गणितज्ञों को छह-छह के समूहों में विभाजित किया गया, जो एक-दूसरे के साथ प्रतिस्पर्धा कर रहे थे—समस्याओं को हल करने के लिए नहीं, बल्कि ऐसी समस्याओं को हल करने के लिए जिन्हें एआई हल नहीं कर सकता था।
17 मई की शाम तक, केन ओनो चैटबॉट से निराश होने लगे थे, क्योंकि वह गणितीय दक्षता का स्तर अपेक्षा से कहीं ज़्यादा दिखा रहा था, जिससे टीम के लिए उसे "ट्रैप" करना मुश्किल हो रहा था। उन्होंने कहा, "मैं एक ऐसी समस्या लेकर आया था जिसे इस क्षेत्र के विशेषज्ञ संख्या सिद्धांत में एक खुली समस्या के रूप में पहचानेंगे—एक ऐसी समस्या जो पीएचडी के लिए उपयुक्त है।"
परिणामस्वरूप, जब उन्होंने o4-mini से पूछा, तो वे यह देखकर दंग रह गए कि चैटबॉट ने केवल 10 मिनट में विश्लेषण, तर्क और सही समाधान कैसे प्रस्तुत किया। खास तौर पर, शुरुआती दो मिनटों में ही, इसने सभी संबंधित दस्तावेज़ों को सीख और समझ लिया। फिर, इसने समस्या का एक सरल संस्करण आज़माने का प्रस्ताव रखा ताकि यह सीखा जा सके कि इसे कैसे हल किया जाए।
पाँच मिनट बाद, चैटबॉट ने आत्मविश्वास से, यहाँ तक कि अहंकार से, सही जवाब दिया। ओनो कहते हैं, "यह थोड़ा शरारती होने लगा, और इसमें यह भी जोड़ा गया: 'मुझे गुप्त नंबर पता चल गया है, इसलिए उद्धरण की कोई ज़रूरत नहीं है!'"
एआई से हारकर, 18 मई की सुबह-सुबह ओनो ने सिग्नल के ज़रिए टीम को तुरंत एक चेतावनी संदेश भेजा। उन्होंने कहा, "मैं इस तरह के मॉडल से निपटने के लिए बिल्कुल तैयार नहीं था। मैंने कंप्यूटर मॉडल में इस तरह का तर्क पहले कभी नहीं देखा था। यह एक असली वैज्ञानिक की सोच जैसा था। और यह डरावना था।"
यद्यपि गणितज्ञ अंततः ऐसे 10 प्रश्न खोजने में सफल रहे, जिन्होंने o4-mini को हैरान कर दिया, फिर भी वे केवल एक वर्ष में AI के विकास की गति पर अपने आश्चर्य को छिपा नहीं सके।
ओनो, ओ4-मिनी के साथ काम करने के अनुभव की तुलना एक बेहद प्रतिभाशाली सहकर्मी के साथ काम करने से करते हैं। और लंदन इंस्टीट्यूट ऑफ मैथमेटिकल साइंसेज के गणितज्ञ और गणित में एआई के अनुप्रयोग में अग्रणी, यांग हुई हे, टिप्पणी करते हैं: "यह वही है जो एक बेहद प्रतिभाशाली पीएचडी छात्र कर सकता है — और उससे भी ज़्यादा।"
और यह ध्यान रखना ज़रूरी है कि AI यह काम इंसानों से कहीं ज़्यादा तेज़ी से करता है। जहाँ इंसानों को इसे हल करने में हफ़्तों या महीनों का समय लगता है, वहीं o4-mini को बस कुछ ही मिनट लगते हैं।
ओ4-मिनी को लेकर उत्साह अपनी चिंताओं से रहित नहीं है। ओनो और ही, दोनों चेतावनी देते हैं कि ओ4-मिनी की क्षमताएँ लोगों को अति-आत्मविश्वासी बना सकती हैं। वे कहते हैं, "हमारे पास प्रेरण द्वारा प्रमाण, विरोधाभास द्वारा प्रमाण, और अब... अत्यधिक प्रमाण है।" "अगर आप किसी बात को पर्याप्त आत्मविश्वास के साथ कहते हैं, तो लोग डर जाएँगे। मुझे लगता है कि ओ4-मिनी ने इस तरह के प्रमाण में महारत हासिल कर ली है: यह हर बात को बड़े आत्मविश्वास के साथ कहता है।"
बैठक समाप्त होते ही, गणितज्ञों ने गणित के भविष्य के बारे में सोचना शुरू कर दिया। उन्होंने "पाँचवें स्तर" की संभावना पर चर्चा की—ऐसे प्रश्न जिन्हें दुनिया के सर्वश्रेष्ठ गणितज्ञ भी हल नहीं कर सकते। अगर एआई उस सीमा तक पहुँच जाता है, तो गणितज्ञों की भूमिका नाटकीय रूप से बदल जाएगी: शायद वे प्रश्नकर्ता बन जाएँगे, नए गणितीय सत्यों की खोज के लिए एआई तर्क के साथ बातचीत और मार्गदर्शन करेंगे—ठीक वैसे ही जैसे एक प्रोफेसर किसी स्नातक छात्र के साथ काम करता है।
ओनो ने कहा, "मैं अपने सहकर्मियों से काफ़ी समय से कह रहा हूँ कि यह सोचना बहुत बड़ी भूल होगी कि सामान्य एआई कभी अस्तित्व में नहीं आएगा, यह सिर्फ़ एक कंप्यूटर है।" उन्होंने आगे कहा, "मैं घबराना नहीं चाहता, लेकिन कुछ मायनों में ये बड़े भाषा मॉडल दुनिया के ज़्यादातर बेहतरीन पीएचडी छात्रों से भी आगे निकलने लगे हैं।"
स्रोत: https://www.vietnamplus.vn/cuoc-gap-go-dac-biet-noi-cac-nha-toan-hoc-tim-cach-danh-bai-tri-tue-nhan-tao-post1043183.vnp
टिप्पणी (0)