ओपनएआई का चैटबॉट नई तकनीकों के ज़रिए लगातार बेहतर होता जा रहा है। फोटो: न्यूयॉर्क टाइम्स । |
सितंबर 2024 में, ओपनएआई ने चैटजीपीटी का एक संस्करण जारी किया जो o1 मॉडल को एकीकृत करता है, जो गणित, विज्ञान और कंप्यूटर प्रोग्रामिंग से संबंधित कार्यों पर तर्क कर सकता है।
चैटजीपीटी के पिछले संस्करण के विपरीत, नई तकनीक प्रतिक्रिया देने से पहले जटिल समस्याओं के समाधान के बारे में “सोचने” में समय लेगी।
ओपनएआई के बाद, गूगल, एंथ्रोपिक और डीपसीक जैसे कई प्रतिस्पर्धियों ने भी इसी तरह के तर्क मॉडल पेश किए। हालाँकि यह पूरी तरह से सही नहीं है, फिर भी यह एक चैटबॉट एन्हांसमेंट तकनीक है जिस पर कई डेवलपर्स भरोसा करते हैं।
एआई कैसे तर्क करता है
मूलतः, तर्क का अर्थ यह है कि चैटबॉट उपयोगकर्ता द्वारा प्रस्तुत समस्या को हल करने में अधिक समय व्यतीत कर सकता है।
कैलिफोर्निया विश्वविद्यालय में कंप्यूटर विज्ञान के प्रोफेसर डैन क्लेन ने न्यूयॉर्क टाइम्स को बताया, "तर्क यह है कि प्रश्न प्राप्त होने के बाद सिस्टम अतिरिक्त कार्य कैसे करता है।"
तर्क प्रणाली किसी समस्या को अलग-अलग चरणों में तोड़ सकती है, या परीक्षण और त्रुटि के माध्यम से उसका समाधान कर सकती है।
जब इसे पहली बार लॉन्च किया गया था, तो चैटजीपीटी जानकारी निकालकर और उसे संश्लेषित करके तुरंत सवालों के जवाब दे सकता था। वहीं, तर्क प्रणाली को समस्या का समाधान करने और प्रतिक्रिया देने में कुछ सेकंड (या मिनट भी) लगते थे।
![]() |
ग्राहक सेवा चैटबॉट में o1 मॉडल की तर्क प्रक्रिया का उदाहरण। फोटो: OpenAI । |
कुछ मामलों में, तर्क प्रणाली समस्या के प्रति अपना दृष्टिकोण बदलती रहेगी और समाधान में लगातार सुधार करती रहेगी। वैकल्पिक रूप से, मॉडल सर्वोत्तम विकल्प पर पहुँचने से पहले कई समाधानों को आज़मा सकता है, या पिछले उत्तरों की सटीकता की जाँच कर सकता है।
सामान्यतः, तर्क प्रणाली प्रश्न के सभी संभावित उत्तरों पर विचार करेगी। यह एक प्राथमिक विद्यालय के छात्र की तरह है जो गणित के किसी प्रश्न को हल करने का सबसे उपयुक्त तरीका चुनने से पहले, कागज़ पर कई संभावित उत्तर लिख लेता है।
न्यूयॉर्क टाइम्स के अनुसार, एआई अब किसी भी विषय पर तर्क करने में सक्षम है। हालाँकि, यह कार्य गणित, विज्ञान और कंप्यूटर प्रोग्रामिंग से संबंधित प्रश्नों में सबसे प्रभावी होगा।
सैद्धांतिक प्रणाली को कैसे प्रशिक्षित किया जाता है?
एक सामान्य चैटबॉट में, उपयोगकर्ता अभी भी प्रक्रिया का स्पष्टीकरण मांग सकते हैं या किसी प्रतिक्रिया की सत्यता की जाँच कर सकते हैं। वास्तव में, कई चैटजीपीटी प्रशिक्षण डेटासेट में पहले से ही एक समस्या-समाधान प्रक्रिया शामिल होती है।
एक तर्क प्रणाली और भी आगे बढ़ जाती है जब यह उपयोगकर्ता के पूछे बिना ही कोई कार्य कर सकती है। यह प्रक्रिया अधिक जटिल और दूरगामी होती है। कंपनियाँ "तर्क" शब्द का प्रयोग इसलिए करती हैं क्योंकि यह प्रणाली मानवीय सोच के समान ही काम करती है।
ओपनएआई जैसी कई कंपनियाँ इस बात पर दांव लगा रही हैं कि तर्क प्रणालियाँ चैटबॉट्स को बेहतर बनाने का सबसे अच्छा तरीका हैं। वर्षों से, उनका मानना था कि अगर चैटबॉट्स को इंटरनेट पर उपलब्ध ज़्यादा से ज़्यादा जानकारी पर प्रशिक्षित किया जाए, तो वे बेहतर काम करेंगे।
2024 तक, एआई सिस्टम इंटरनेट पर उपलब्ध लगभग सभी टेक्स्ट का उपयोग कर लेंगे। इसका मतलब है कि कंपनियों को चैटबॉट्स को अपग्रेड करने के लिए नए समाधान खोजने होंगे, जिनमें रीजनिंग सिस्टम भी शामिल हैं।
![]() |
स्टार्टअप डीपसीक ने एक बार ओपनएआई से भी कम लागत वाले एक तर्क मॉडल से "खलबली मचा दी थी"। फोटो: ब्लूमबर्ग । |
पिछले वर्ष से, ओपनएआई जैसी कम्पनियां सुदृढीकरण अधिगम नामक तकनीक पर ध्यान केंद्रित कर रही हैं, यह एक ऐसी प्रक्रिया है जिसमें आमतौर पर कई महीने लगते हैं, जिसमें एआई परीक्षण और त्रुटि के माध्यम से व्यवहार सीखता है।
उदाहरण के लिए, हज़ारों समस्याओं को हल करके, सिस्टम सही उत्तर पाने का सबसे अच्छा तरीका सीख सकता है। इसके आधार पर, शोधकर्ताओं ने जटिल फीडबैक तंत्र विकसित किए जो सिस्टम को सही और गलत समाधान सीखने में मदद करते हैं।
ओपनएआई के एक शोधकर्ता जेरी ट्वोरेक ने कहा, "यह एक कुत्ते को प्रशिक्षित करने जैसा है। अगर वह अच्छा है, तो आप उसे खाना खिलाते हैं। अगर वह बुरा है, तो आप कहते हैं, 'यह कुत्ता बुरा है।'"
क्या एआई भविष्य है?
न्यूयॉर्क टाइम्स के अनुसार, सुदृढीकरण सीखना गणित, विज्ञान और कंप्यूटर प्रोग्रामिंग के प्रश्नों के साथ अच्छी तरह से काम करता है, जहां स्पष्ट रूप से सही या गलत उत्तर परिभाषित होते हैं।
इसके विपरीत, रचनात्मक लेखन, दर्शनशास्त्र या नैतिकता जैसे क्षेत्रों में सुदृढीकरण सीखना उतना प्रभावी नहीं है, जहाँ अच्छे और बुरे के बीच अंतर करना मुश्किल होता है। लेकिन शोधकर्ताओं का कहना है कि यह तकनीक गणित से बाहर के प्रश्नों में भी एआई के प्रदर्शन को बेहतर बना सकती है।
एंथ्रोपिक के मुख्य विज्ञान अधिकारी जेरेड कपलान ने कहा, "प्रणालियां उन रास्तों को सीखेंगी जो सकारात्मक और नकारात्मक परिणामों की ओर ले जाते हैं।"
![]() |
एआई मॉडल क्लाउड के मालिक स्टार्टअप एंथ्रोपिक की वेबसाइट। फोटो: ब्लूमबर्ग । |
यह ध्यान रखना ज़रूरी है कि रीइन्फोर्समेंट लर्निंग और रीजनिंग सिस्टम दो अलग-अलग अवधारणाएँ हैं। विशेष रूप से, रीइन्फोर्समेंट लर्निंग रीजनिंग सिस्टम बनाने की एक विधि है। चैटबॉट्स में रीजनिंग क्षमता विकसित करने के लिए यह अंतिम प्रशिक्षण चरण है।
चूँकि ये अभी भी अपेक्षाकृत नए हैं, वैज्ञानिक इस बात को लेकर आश्वस्त नहीं हैं कि रीजनिंग चैटबॉट या रीइन्फोर्समेंट लर्निंग, एआई को इंसानों की तरह सोचने में मदद कर सकते हैं या नहीं। यह ध्यान रखना ज़रूरी है कि एआई प्रशिक्षण के कई मौजूदा रुझान शुरुआत में बहुत तेज़ी से विकसित होते हैं और फिर धीरे-धीरे स्थिर हो जाते हैं।
इसके अलावा, तर्कशील चैटबॉट्स भी गलतियाँ कर सकते हैं। प्रायिकता के आधार पर, सिस्टम उस प्रक्रिया को चुनेगा जो उसके द्वारा सीखे गए डेटा से सबसे ज़्यादा मिलती-जुलती हो, चाहे वह इंटरनेट से हो या रीइन्फोर्समेंट लर्निंग के ज़रिए। इसलिए, चैटबॉट्स अभी भी गलत या अनुचित समाधान चुन सकते हैं।
स्रोत: https://znews.vn/ai-ly-luan-nhu-the-nao-post1541477.html













टिप्पणी (0)