ओपनएआई का चैटबॉट नई तकनीकों के माध्यम से लगातार बेहतर हो रहा है। फोटो: न्यूयॉर्क टाइम्स । |
सितंबर 2024 में, OpenAI ने ChatGPT लॉन्च किया, जो AI का एक ऐसा संस्करण है जो o1 मॉडल को एकीकृत करता है और गणित, विज्ञान और कंप्यूटर प्रोग्रामिंग से संबंधित कार्यों में तर्क करने में सक्षम है।
ChatGPT के पिछले संस्करण के विपरीत, नई तकनीक जटिल समस्याओं के समाधान के बारे में "सोचने" में समय लेगी और फिर प्रतिक्रिया देगी।
ओपनएआई के बाद, गूगल, एंथ्रोपिक और डीपसीक जैसे कई प्रतिस्पर्धियों ने भी इसी तरह के तर्क मॉडल पेश किए हैं। हालांकि यह पूरी तरह से सही नहीं है, फिर भी यह चैटबॉट को उन्नत करने वाली एक ऐसी तकनीक है जिस पर कई डेवलपर्स भरोसा करते हैं।
एआई कैसे तर्क करता है
संक्षेप में, तर्क करने का अर्थ यह है कि चैटबॉट उपयोगकर्ताओं द्वारा बताई गई समस्याओं को हल करने में अधिक समय व्यतीत कर सकते हैं।
कैलिफोर्निया विश्वविद्यालय में कंप्यूटर विज्ञान के प्रोफेसर डैन क्लेन ने न्यूयॉर्क टाइम्स को बताया, "तर्क करना वह तरीका है जिससे सिस्टम प्रश्न प्राप्त करने के बाद अतिरिक्त कार्य करता है।"
तर्क की एक प्रणाली किसी समस्या को कई अलग-अलग चरणों में तोड़ सकती है, या उसे परीक्षण और त्रुटि के माध्यम से हल कर सकती है।
जब ChatGPT को पहली बार लॉन्च किया गया था, तब यह जानकारी को निकालकर और उसका विश्लेषण करके तुरंत सवालों के जवाब दे सकता था। इसके विपरीत, तर्क प्रणाली को समस्या को हल करने और जवाब देने में कुछ सेकंड (या मिनट भी) लग जाते थे।
![]() |
ग्राहक सेवा चैटबॉट में o1 मॉडल की तर्क प्रक्रिया का एक उदाहरण। चित्र: OpenAI |
कुछ मामलों में, तर्क प्रणाली समस्या के प्रति अपना दृष्टिकोण बदल देती है, जिससे समाधान में लगातार सुधार होता रहता है। इसके अतिरिक्त, मॉडल सर्वोत्तम विकल्प चुनने से पहले कई समाधानों का परीक्षण कर सकता है, या पिछले उत्तरों की सटीकता की जाँच कर सकता है।
सामान्य तौर पर, तर्क प्रणाली प्रश्न के सभी संभावित उत्तरों पर विचार करेगी। यह कुछ हद तक प्राथमिक विद्यालय के छात्रों द्वारा गणित की समस्या का सबसे उपयुक्त हल चुनने से पहले कागज पर कई विकल्प लिखने के समान है।
न्यूयॉर्क टाइम्स के अनुसार, कृत्रिम बुद्धिमत्ता अब लगभग किसी भी विषय पर तर्क करने में सक्षम है। हालांकि, यह गणित, विज्ञान और कंप्यूटर प्रोग्रामिंग से संबंधित प्रश्नों में सबसे अधिक प्रभावी होगी।
सैद्धांतिक प्रणाली को कैसे प्रशिक्षित किया जाता है?
एक सामान्य चैटबॉट पर, उपयोगकर्ता प्रक्रिया की व्याख्या मांग सकते हैं या प्रतिक्रिया की सटीकता की पुष्टि कर सकते हैं। वास्तव में, कई चैटजीपीटी प्रशिक्षण डेटासेट में पहले से ही समस्या-समाधान प्रक्रियाएं शामिल हैं।
जब तर्क प्रणाली उपयोगकर्ता के इनपुट के बिना कार्य करने में सक्षम हो जाती है, तो यह और भी उन्नत हो जाती है। यह प्रक्रिया अधिक जटिल और व्यापक होती है। कंपनियां "तर्क" शब्द का प्रयोग इसलिए करती हैं क्योंकि यह प्रणाली मनुष्यों के सोचने के तरीके के समान कार्य करती है।
ओपनएआई जैसी कई कंपनियां मौजूदा चैटबॉट को बेहतर बनाने के लिए रीजनिंग सिस्टम को सबसे अच्छा समाधान मानती हैं। वर्षों से उनका मानना रहा है कि इंटरनेट पर जितनी अधिक जानकारी के साथ चैटबॉट को प्रशिक्षित किया जाता है, उनका प्रदर्शन उतना ही बेहतर होता है।
2024 तक, एआई सिस्टम इंटरनेट पर उपलब्ध लगभग सभी टेक्स्ट का उपयोग कर लेंगे। इसका मतलब है कि कंपनियों को चैटबॉट को अपग्रेड करने के लिए नए समाधान खोजने होंगे, जिनमें रीजनिंग सिस्टम भी शामिल हैं।
![]() |
स्टार्टअप डीपसीक ने एक समय अपने उस तर्क मॉडल से सनसनी मचा दी थी जो ओपनएआई से सस्ता था। फोटो: ब्लूमबर्ग । |
पिछले साल से, OpenAI जैसी कंपनियों ने रीइन्फोर्समेंट लर्निंग तकनीकों पर ध्यान केंद्रित किया है। इस प्रक्रिया में आमतौर पर कई महीने लगते हैं, जिसके दौरान AI ट्रायल और एरर के माध्यम से व्यवहार सीखता है।
उदाहरण के लिए, हजारों समस्याओं को हल करके, यह प्रणाली सही उत्तर तक पहुंचने का सर्वोत्तम तरीका पहचान सकती है। इसके बाद, शोधकर्ता परिष्कृत फीडबैक तंत्र विकसित करते हैं जो प्रणाली को सही और गलत समाधानों के बीच अंतर करने में मदद करते हैं।
"यह कुत्ते को प्रशिक्षित करने के तरीके के समान है। यदि प्रणाली अच्छी तरह से काम करती है, तो आप उसे इनाम देते हैं। अन्यथा, आप कहते हैं, 'वह कुत्ता शरारती है'," ओपनएआई के शोधकर्ता जेरी ट्वोरेक ने बताया।
क्या एआई भविष्य है?
न्यूयॉर्क टाइम्स के अनुसार, गणित, विज्ञान और कंप्यूटर प्रोग्रामिंग में आवश्यकताओं से निपटने के लिए सुदृढ़ीकरण अधिगम तकनीकें प्रभावी होती हैं। ये ऐसे क्षेत्र हैं जहां सही या गलत उत्तरों को स्पष्ट रूप से परिभाषित किया जा सकता है।
इसके विपरीत, लेखन, दर्शन या नैतिकता जैसे क्षेत्रों में सुदृढ़ीकरण अधिगम अप्रभावी है—ये ऐसे क्षेत्र हैं जहाँ अच्छे और बुरे के बीच अंतर करना कठिन है। फिर भी, शोधकर्ताओं का दावा है कि यह तकनीक गैर-गणितीय प्रश्नों में भी कृत्रिम बुद्धिमत्ता (एआई) के प्रदर्शन में सुधार कर सकती है।
एंथ्रोपिक के मुख्य वैज्ञानिक अधिकारी जेरेड कपलान ने कहा, "प्रणालियां सकारात्मक और नकारात्मक परिणामों की ओर ले जाने वाले रास्तों को सीख लेंगी।"
![]() |
क्लाउड एआई मॉडल की मालिक स्टार्टअप कंपनी एंथ्रोपिक की वेबसाइट। फोटो: ब्लूमबर्ग । |
यह ध्यान रखना महत्वपूर्ण है कि रीइन्फोर्समेंट लर्निंग और रीजनिंग सिस्टम दो अलग-अलग अवधारणाएं हैं। विशेष रूप से, रीइन्फोर्समेंट लर्निंग रीजनिंग सिस्टम बनाने की एक विधि है। यह चैटबॉट को तर्क करने में सक्षम बनाने के लिए प्रशिक्षण का अंतिम चरण है।
क्योंकि यह अभी अपेक्षाकृत नया क्षेत्र है, इसलिए वैज्ञानिक अभी तक निश्चित रूप से यह नहीं कह सकते कि चैटबॉट रीजनिंग या रीइन्फोर्समेंट लर्निंग से एआई को मनुष्यों की तरह सोचने में मदद मिल सकती है या नहीं। यह ध्यान देने योग्य है कि एआई प्रशिक्षण के कई वर्तमान रुझान शुरुआत में बहुत तेजी से विकसित होते हैं और फिर धीरे-धीरे धीमे हो जाते हैं।
इसके अलावा, चैटबॉट की तर्क क्षमता में भी गलतियाँ हो सकती हैं। संभाव्यता के आधार पर, सिस्टम उस प्रक्रिया को चुनेगा जो इंटरनेट या रीइन्फोर्समेंट लर्निंग के माध्यम से सीखे गए डेटा से सबसे अधिक मिलती-जुलती हो। इसलिए, चैटबॉट गलत या अतार्किक समाधान भी चुन सकते हैं।
स्रोत: https://znews.vn/ai-ly-luan-nhu-the-nao-post1541477.html









टिप्पणी (0)