एक उल्लेखनीय बैठक जहां गणितज्ञ कृत्रिम बुद्धिमत्ता को मात देने का प्रयास कर रहे हैं।

कृत्रिम बुद्धिमत्ता (एआई) को हराने का तरीका खोजने के लिए दुनिया के अग्रणी गणितज्ञ गुप्त रूप से मिले, लेकिन एआई की क्षमताओं को देखकर वे चकित रह गए।

VietnamPlus•20/05/2025

मई के मध्य में एक सप्ताहांत में, गणितज्ञों की एक गुप्त बैठक हुई। दुनिया के तीस प्रमुख गणितज्ञ गुप्त रूप से बर्कले, कैलिफोर्निया, अमेरिका गए, ताकि "तर्क करने" में सक्षम एक चैटबॉट के साथ आमने-सामने की बातचीत में भाग ले सकें। इस चैटबॉट को गणितज्ञों द्वारा स्वयं तैयार की गई समस्याओं को हल करने का कार्य सौंपा गया था, ताकि इसकी समस्या-समाधान क्षमताओं का परीक्षण किया जा सके।

दो दिनों तक लगातार प्रोफेसर स्तर के प्रश्नों की बौछार करने के बाद, गणितज्ञ यह देखकर आश्चर्यचकित रह गए कि यह चैटबॉट इतिहास में अब तक हल की गई कुछ सबसे कठिन समस्याओं को हल कर सकता है।

वर्जीनिया विश्वविद्यालय के प्रोफेसर और बैठक के अध्यक्ष और निर्णायक केन ओनो ने साइंटिफिक अमेरिकन को बताया, "मैंने अपने सहयोगियों को यह कहते हुए सुना है कि यह बड़े पैमाने पर भाषा मॉडल गणितीय प्रतिभा के स्तर के करीब पहुंच रहा है।"

उपर्युक्त चैटबॉट o4-mini पर आधारित है, जो जटिल तर्क क्षमता के लिए डिज़ाइन किया गया एक बड़ा भाषा मॉडल (LLM) है। OpenAI का यह उत्पाद परिष्कृत तर्क प्रक्रियाओं को करने के लिए प्रशिक्षित है। Google का एक समान मॉडल, जिसे Gemini 2.5 Flash कहा जाता है, में भी ऐसी ही क्षमताएं हैं।

पिछले ChatGPT LLM की तरह, o4-mini भी टेक्स्ट स्ट्रिंग में अगले शब्द का अनुमान लगाना सीखता है। हालांकि, अंतर यह है कि o4-mini एक हल्का और अधिक लचीला संस्करण है, जिसे गहन डेटा पर प्रशिक्षित किया गया है और इसमें मानवीय समायोजन किया गया है—जिससे यह उन गणितीय समस्याओं को हल करने में सक्षम हो जाता है जिन तक पिछले मॉडल नहीं पहुंच पाते थे।

o4-mini की क्षमताओं को परखने और उनका आकलन करने के लिए, OpenAI ने LLM मॉडल के परीक्षण में विशेषज्ञता रखने वाली एक गैर-लाभकारी संस्था Epoch AI को 300 अप्रकाशित गणितीय प्रश्न तैयार करने का काम सौंपा। पारंपरिक LLM कई जटिल समस्याओं को हल कर सकते हैं, लेकिन जब उन्हें पूरी तरह से नए प्रश्न दिए गए, तो उनमें से अधिकांश ने केवल 2% से भी कम प्रश्नों को सही ढंग से हल किया। इससे पता चलता है कि उनमें वास्तविक तर्क क्षमता का अभाव है।

अपने नवीनतम मूल्यांकन प्रोजेक्ट के लिए, Epoch AI ने युवा गणित में पीएचडी कर चुके इलियट ग्लेज़र को मुख्य कार्यकारी अधिकारी के रूप में नियुक्त किया है। FrontierMath नामक यह नया प्रोजेक्ट सितंबर 2024 में शुरू किया जाएगा।

इस परियोजना में स्नातक और स्नातकोत्तर स्तर से लेकर गहन शोध तक, चार कठिनाई स्तरों के नए प्रश्न एकत्र किए गए। अप्रैल 2025 में, ग्लेज़र ने पाया कि o4-mini लगभग 20% समस्याओं को हल कर सकता है। इसलिए, उन्होंने इसे तुरंत स्तर 4 पर स्थानांतरित कर दिया - जिसमें इसे उन समस्याओं को हल करने की आवश्यकता थी जिन्हें हल करने में अत्यधिक उन्नत गणितज्ञों को भी कठिनाई होती।

प्रतिभागियों को एक गोपनीयता समझौते पर हस्ताक्षर करना आवश्यक था, जिसके तहत उन्हें केवल एन्क्रिप्टेड सिग्नल ऐप के माध्यम से ही संवाद करना था, क्योंकि ईमेल के उपयोग को स्कैन किया जा सकता था और एलएलएम द्वारा इसकी सामग्री को "सीखा" जा सकता था, जिससे मूल्यांकन डेटा में हेराफेरी हो सकती थी।

o4-mini द्वारा हल न किए जा सकने वाले प्रत्येक प्रश्न के लिए, प्रश्नकर्ता को 7,500 डॉलर का पुरस्कार मिलेगा।

प्रारंभिक कार्य समूह प्रश्नों को तैयार करने में धीमा लेकिन निरंतर था। हालाँकि, ग्लेज़र ने 17-18 मई को दो दिवसीय आमने-सामने की बैठक आयोजित करके काम में तेज़ी लाने का निर्णय लिया। तीस गणितज्ञों ने भाग लिया, जिन्हें छह-छह के समूहों में विभाजित किया गया था, और वे एक-दूसरे के साथ प्रतिस्पर्धा कर रहे थे - समस्याओं को हल करने के लिए नहीं, बल्कि ऐसी समस्याओं को तैयार करने के लिए जिन्हें एआई हल नहीं कर सकता था।

17 मई की शाम तक, केन ओनो चैटबॉट से निराश होने लगे, क्योंकि चैटबॉट ने उम्मीद से कहीं अधिक गणितीय क्षमता प्रदर्शित की, जिससे टीम के लिए उसे "पकड़ना" मुश्किल हो गया। उन्होंने बताया, "मैंने एक ऐसी समस्या सोची जिसे उद्योग विशेषज्ञ संख्या सिद्धांत में एक अनसुलझी समस्या के रूप में पहचानेंगे - एक ऐसी समस्या जो पीएचडी के लिए उपयुक्त है।"

परिणामस्वरूप, जब उन्होंने o4-mini से पूछा, तो वे चैटबॉट को मात्र 10 मिनट में विश्लेषण, तर्क और सही समाधान प्रदान करते देखकर आश्चर्यचकित रह गए। विशेष रूप से, पहले दो मिनट में ही इसने सभी प्रासंगिक सामग्री का शोध किया और उसे समझ लिया। फिर, इसने समस्या के एक सरल संस्करण के साथ प्रयोग करने का सुझाव दिया ताकि इस दृष्टिकोण को सीखा जा सके।

पांच मिनट बाद, चैटबॉट ने आत्मविश्वास से भरे—यहाँ तक कि कुछ हद तक घमंडी—अहंकार के साथ सही उत्तर दिया। ओनो ने बताया, “यह चालाकी से पेश आने लगा और यहाँ तक कि इसने यह भी कहा: ‘उद्धृत करने की कोई आवश्यकता नहीं है, मैंने पहले ही रहस्यमय संख्या की गणना कर ली है!’”

एआई के सामने नाकाम होने के बाद, 18 मई की सुबह ओनो ने तुरंत सिग्नल के ज़रिए टीम को एक चेतावनी संदेश भेजा। उन्होंने कहा, "मैं इस तरह के मॉडल से निपटने के लिए बिल्कुल तैयार नहीं था। मैंने किसी कंप्यूटर मॉडल में इस तरह की तर्कशक्ति पहले कभी नहीं देखी थी। यह बिल्कुल असली वैज्ञानिक की तरह सोचता था। और यह बहुत डरावना था।"

हालांकि गणितज्ञ अंततः उन 10 सवालों को खोजने में सफल रहे जिन्होंने o4-mini को हैरान कर दिया, लेकिन वे सिर्फ एक साल में एआई के विकास की गति को देखकर अपना आश्चर्य नहीं छिपा सके।

ओनो ने o4-mini के साथ काम करने के अनुभव की तुलना एक बेहद प्रतिभाशाली सहकर्मी के साथ सहयोग करने से की। लंदन स्थित इंस्टीट्यूट फॉर मैथमेटिकल साइंसेज के गणितज्ञ और गणित में एआई के अनुप्रयोग के क्षेत्र में अग्रणी यांग हुई हे ने टिप्पणी की: "यह वही है जो एक बहुत ही अच्छा स्नातक छात्र कर सकता है - बल्कि इससे भी कहीं अधिक।"

और यह उल्लेखनीय है कि एआई मनुष्यों की तुलना में कहीं अधिक तेज़ी से काम करता है। जहां मनुष्यों को किसी समस्या को हल करने में सप्ताह या महीने लग जाते हैं, वहीं o4-mini इसे केवल कुछ मिनटों में हल कर लेता है।

o4-mini के साथ बुद्धि की इस लड़ाई को लेकर उत्साह के साथ-साथ काफी चिंता भी थी। ओनो और हे दोनों ने चेतावनी दी कि o4-mini की क्षमताओं से अति आत्मविश्वास पैदा हो सकता है। हे ने कहा, “हमारे पास प्रेरण द्वारा प्रमाण, विरोधाभास द्वारा प्रमाण और अब… अत्यधिक बल द्वारा प्रमाण है। यदि आप किसी बात को पर्याप्त आत्मविश्वास के साथ कहते हैं, तो दूसरे भयभीत हो जाएंगे। मुझे लगता है कि o4-mini ने इस प्रकार के प्रमाण में महारत हासिल कर ली है: यह जो कुछ भी कहता है वह बहुत निश्चित होता है।”

बैठक समाप्त होते ही गणितज्ञ गणित के भविष्य पर विचार करने लगे। उन्होंने "पांचवें स्तर" की संभावना पर चर्चा की—ऐसे प्रश्न जिन्हें दुनिया के सर्वश्रेष्ठ गणितज्ञ भी हल नहीं कर सकते। यदि कृत्रिम बुद्धिमत्ता उस स्तर तक पहुँच जाती है, तो गणितज्ञ की भूमिका में नाटकीय परिवर्तन आएगा: वे प्रश्नकर्ता बन सकते हैं, कृत्रिम बुद्धिमत्ता के साथ संवाद कर सकते हैं और नए गणितीय सत्यों की खोज के लिए उसके तर्क में मार्गदर्शन कर सकते हैं—ठीक उसी तरह जैसे एक प्रोफेसर स्नातकोत्तर छात्रों के साथ काम करता है।

“मैं काफी समय से अपने सहयोगियों से कहता आ रहा हूं कि यह मान लेना एक गंभीर गलती होगी कि सामान्य कृत्रिम बुद्धिमत्ता कभी प्रकट नहीं होगी, कि यह सिर्फ एक कंप्यूटर है,” ओनो ने कहा। “मैं घबराहट पैदा नहीं करना चाहता, लेकिन कुछ मामलों में, ये बड़े भाषा मॉडल पहले ही दुनिया के अधिकांश सर्वश्रेष्ठ स्नातक छात्रों से बेहतर प्रदर्शन करना शुरू कर चुके हैं।”

(वियतनाम+)

स्रोत: https://www.vietnamplus.vn/cuoc-gap-go-dac-biet-noi-cac-nha-toan-hoc-tim-cach-danh-bai-tri-tue-nhan-tao-post1043183.vnp