क्या एआई सचमुच सोच सकता है?

ओपनएआई और डीपसीक जैसी कंपनियां लॉजिकल चैटबॉट की सीमाओं को आगे बढ़ा रही हैं, जो कुछ निश्चित कम्प्यूटेशनल कार्यों में बेहतर प्रदर्शन कर सकते हैं।

ZNews•06/04/2025

ओपनएआई का चैटबॉट नई तकनीकों के माध्यम से लगातार बेहतर हो रहा है। फोटो: न्यूयॉर्क टाइम्स ।

सितंबर 2024 में, OpenAI ने ChatGPT लॉन्च किया, जो AI का एक ऐसा संस्करण है जो o1 मॉडल को एकीकृत करता है और गणित, विज्ञान और कंप्यूटर प्रोग्रामिंग से संबंधित कार्यों में तर्क करने में सक्षम है।

ChatGPT के पिछले संस्करण के विपरीत, नई तकनीक जटिल समस्याओं के समाधान के बारे में "सोचने" में समय लेगी और फिर प्रतिक्रिया देगी।

ओपनएआई के बाद, गूगल, एंथ्रोपिक और डीपसीक जैसे कई प्रतिस्पर्धियों ने भी इसी तरह के तर्क मॉडल पेश किए हैं। हालांकि यह पूरी तरह से सही नहीं है, फिर भी यह चैटबॉट को उन्नत करने वाली एक ऐसी तकनीक है जिस पर कई डेवलपर्स भरोसा करते हैं।

एआई कैसे तर्क करता है

संक्षेप में, तर्क करने का अर्थ यह है कि चैटबॉट उपयोगकर्ताओं द्वारा बताई गई समस्याओं को हल करने में अधिक समय व्यतीत कर सकते हैं।

कैलिफोर्निया विश्वविद्यालय में कंप्यूटर विज्ञान के प्रोफेसर डैन क्लेन ने न्यूयॉर्क टाइम्स को बताया, "तर्क करना वह तरीका है जिससे सिस्टम प्रश्न प्राप्त करने के बाद अतिरिक्त कार्य करता है।"

एक तार्किक प्रणाली किसी समस्या को छोटे-छोटे, अलग-अलग चरणों में तोड़ सकती है, या उसे परीक्षण और त्रुटि के माध्यम से हल कर सकती है।

जब ChatGPT को पहली बार लॉन्च किया गया था, तब यह जानकारी को निकालकर और उसका विश्लेषण करके तुरंत सवालों के जवाब दे सकता था। इसके विपरीत, तर्क प्रणालियों को समस्या को हल करने और जवाब देने में कुछ सेकंड (या मिनट भी) लग जाते थे।

AI ly luan, OpenAI o1 va ChatGPT, mo hinh ly luan, tri tue nhan tao anh 1

ग्राहक सेवा चैटबॉट में O1 मॉडल की तर्क प्रक्रिया का एक उदाहरण। चित्र: OpenAI

कुछ मामलों में, तर्क प्रणाली समस्या के प्रति अपना दृष्टिकोण बदल देती है, जिससे समाधान में लगातार सुधार होता रहता है। इसके अतिरिक्त, मॉडल सर्वोत्तम विकल्प चुनने से पहले कई समाधानों का परीक्षण कर सकता है, या पिछले उत्तरों की सटीकता की जाँच कर सकता है।

सामान्य तौर पर, तर्क प्रणाली प्रश्न के सभी संभावित उत्तरों पर विचार करेगी। यह ठीक उसी तरह है जैसे प्राथमिक विद्यालय के छात्र गणित की किसी समस्या का सबसे उपयुक्त हल चुनने से पहले कागज पर कई विकल्प लिखते हैं।

न्यूयॉर्क टाइम्स के अनुसार, कृत्रिम बुद्धिमत्ता अब लगभग किसी भी विषय पर तर्क करने में सक्षम है। हालांकि, यह गणित, विज्ञान और कंप्यूटर प्रोग्रामिंग से संबंधित प्रश्नों में सबसे अधिक प्रभावी होगी।

सैद्धांतिक प्रणाली को कैसे प्रशिक्षित किया जाता है?

एक सामान्य चैटबॉट पर, उपयोगकर्ता प्रक्रिया की व्याख्या मांग सकते हैं या प्रतिक्रिया की सटीकता की पुष्टि कर सकते हैं। वास्तव में, कई चैटजीपीटी प्रशिक्षण डेटासेट में पहले से ही समस्या-समाधान प्रक्रियाएं शामिल हैं।

जब तर्क प्रणाली उपयोगकर्ता के इनपुट के बिना कार्य करने में सक्षम हो जाती है, तो यह और भी उन्नत हो जाती है। यह प्रक्रिया अधिक जटिल और व्यापक होती है। कंपनियां "तर्क" शब्द का प्रयोग इसलिए करती हैं क्योंकि यह प्रणाली मनुष्यों के सोचने के तरीके के समान कार्य करती है।

ओपनएआई जैसी कई कंपनियां मौजूदा चैटबॉट को बेहतर बनाने के लिए रीजनिंग सिस्टम को सबसे अच्छा समाधान मानती हैं। वर्षों से उनका मानना रहा है कि इंटरनेट पर जितनी अधिक जानकारी के साथ चैटबॉट को प्रशिक्षित किया जाता है, उनका प्रदर्शन उतना ही बेहतर होता है।

2024 तक, एआई सिस्टम इंटरनेट पर उपलब्ध लगभग सभी टेक्स्ट का उपयोग कर लेंगे। इसका मतलब है कि कंपनियों को चैटबॉट को अपग्रेड करने के लिए नए समाधान खोजने होंगे, जिनमें रीजनिंग सिस्टम भी शामिल हैं।

AI ly luan, OpenAI o1 va ChatGPT, mo hinh ly luan, tri tue nhan tao anh 2

स्टार्टअप डीपसीक ने एक समय अपने उस तर्क मॉडल से सनसनी मचा दी थी जिसकी लागत ओपनएआई से भी कम थी। फोटो: ब्लूमबर्ग ।

पिछले साल से, OpenAI जैसी कंपनियों ने रीइन्फोर्समेंट लर्निंग तकनीकों पर ध्यान केंद्रित किया है। इस प्रक्रिया में आमतौर पर कई महीने लगते हैं, जिसके दौरान AI ट्रायल और एरर के माध्यम से व्यवहार सीखता है।

उदाहरण के लिए, हजारों समस्याओं को हल करके, यह प्रणाली सही उत्तर तक पहुंचने का सर्वोत्तम तरीका पहचान सकती है। इसके बाद, शोधकर्ता परिष्कृत फीडबैक तंत्र विकसित करते हैं जो प्रणाली को सही और गलत समाधानों के बीच अंतर करने में मदद करते हैं।

"यह कुत्ते को प्रशिक्षित करने के तरीके के समान है। यदि प्रणाली अच्छी तरह से काम करती है, तो आप उसे इनाम देते हैं। अन्यथा, आप कहते हैं, 'वह कुत्ता शरारती है'," ओपनएआई के शोधकर्ता जेरी ट्वोरेक ने बताया।

क्या एआई भविष्य है?

न्यूयॉर्क टाइम्स के अनुसार, गणित, विज्ञान और कंप्यूटर प्रोग्रामिंग में आवश्यकताओं से निपटने के लिए रीइन्फोर्समेंट लर्निंग तकनीकें प्रभावी होती हैं। ये ऐसे क्षेत्र हैं जहां सही या गलत उत्तरों को स्पष्ट रूप से परिभाषित किया जा सकता है।

इसके विपरीत, लेखन, दर्शन या नैतिकता जैसे क्षेत्रों में सुदृढ़ीकरण अधिगम अप्रभावी है—ये ऐसे क्षेत्र हैं जहाँ अच्छे और बुरे के बीच अंतर करना कठिन है। फिर भी, शोधकर्ताओं का दावा है कि यह तकनीक गैर-गणितीय प्रश्नों में भी कृत्रिम बुद्धिमत्ता के प्रदर्शन को बेहतर बना सकती है।

एंथ्रोपिक के मुख्य वैज्ञानिक अधिकारी जेरेड कपलान ने कहा, "प्रणालियां सकारात्मक और नकारात्मक परिणामों की ओर ले जाने वाले रास्तों को सीख लेंगी।"

AI ly luan, OpenAI o1 va ChatGPT, mo hinh ly luan, tri tue nhan tao anh 3

क्लाउड एआई मॉडल की मालिक स्टार्टअप कंपनी एंथ्रोपिक की वेबसाइट। फोटो: ब्लूमबर्ग ।

यह ध्यान रखना महत्वपूर्ण है कि रीइन्फोर्समेंट लर्निंग और रीजनिंग सिस्टम दो अलग-अलग अवधारणाएं हैं। विशेष रूप से, रीइन्फोर्समेंट लर्निंग रीजनिंग सिस्टम बनाने की एक विधि है। यह चैटबॉट को तर्क करने में सक्षम बनाने के लिए प्रशिक्षण का अंतिम चरण है।

क्योंकि यह अभी अपेक्षाकृत नया क्षेत्र है, इसलिए वैज्ञानिक अभी तक निश्चित रूप से यह नहीं कह सकते कि चैटबॉट की तर्क क्षमता या सुदृढ़ीकरण अधिगम कृत्रिम बुद्धिमत्ता को मनुष्यों की तरह सोचने में मदद कर सकता है या नहीं। यह ध्यान देने योग्य है कि कृत्रिम बुद्धिमत्ता प्रशिक्षण के कई वर्तमान रुझान शुरुआत में बहुत तेजी से विकसित होते हैं और फिर धीरे-धीरे धीमे हो जाते हैं।

इसके अलावा, चैटबॉट की तर्क क्षमता में भी गलतियाँ हो सकती हैं। संभाव्यता के आधार पर, सिस्टम उस प्रक्रिया को चुनेगा जो इंटरनेट से या सुदृढ़ीकरण अधिगम के माध्यम से प्राप्त डेटा से सबसे अधिक मिलती-जुलती हो। इसलिए, चैटबॉट गलत या अतार्किक समाधान भी चुन सकते हैं।

स्रोत: https://znews.vn/ai-ly-luan-nhu-the-nao-post1541477.html