O3 प्रो जटिल अनुरोधों को संभालने की अपनी क्षमता के लिए जाना जाता है। चित्र: ओपनएआई। |
OpenAI ने API के ज़रिए टीम एक्सेस के साथ $200 प्रति माह की कीमत पर o3 प्रो का प्रो पैकेज लॉन्च किया है। कुछ महीने पहले पेश किए गए o3 का यह उन्नत संस्करण है, जिसे कंपनी वर्तमान में उपलब्ध सबसे शक्तिशाली संस्करण बता रही है।
जिन संस्करणों के नाम के आगे "प्रो" शब्द जोड़ा गया है, वे अधिक कठिन और लंबे प्रश्नों के उत्तर देने की क्षमता से जुड़े हैं। सामान्य एआई संस्करणों के विपरीत, यह तर्क मॉडल समस्याओं को चरण-दर-चरण हल करता है, जिससे यह भौतिकी, गणित और प्रोग्रामिंग जैसे क्षेत्रों में अधिक स्थिरता और विश्वसनीयता के साथ कार्य कर पाता है।
कंपनी ने कहा, “हम कठिन प्रश्नों के लिए o3-pro का उपयोग करने की सलाह देते हैं, जहाँ गति की तुलना में विश्वसनीयता अधिक महत्वपूर्ण है, और कुछ मिनट प्रतीक्षा करना एक उचित समझौता है।” साझा परीक्षण समीक्षाओं में, o3-pro ने o3 और o1-pro संस्करणों की तुलना में बेहतर परिणाम प्राप्त किए।
इस नए मॉडल पर टिप्पणी करते हुए, ऐप्पल के पूर्व कर्मचारी और एआई विकास कंपनी रेनड्रॉप के सह-संस्थापक बेन हिलाक ने कहा कि यह कहीं अधिक स्मार्ट है। उन्होंने अपनी कंपनी में हुई सभी पिछली बैठकों का इतिहास संकलित किया, फिर o3-pro से एक योजना बनाने को कहा।
परिणाम बेहद प्रभावशाली, सटीक और स्पष्ट रूप से विश्लेषित थे—ठीक वैसे ही जैसे उन्होंने हमेशा बड़े पैमाने पर भाषा मॉडलिंग (एलएलएम) से उम्मीद की थी। योजना में लक्ष्य मापदंड, समयसीमा, प्राथमिकताएं और पूरी तरह से समाप्त किए जाने वाले कार्यों पर सख्त दिशानिर्देश शामिल थे। उन्होंने लिखा, "यह इतना सटीक और सुस्थापित था कि मुझे अपनी कंपनी के भविष्य पर पुनर्विचार करना पड़ा।"
o3 प्रो (बाएं) से प्राप्त परिणाम अधिक विशिष्ट और विश्वसनीय हैं। फोटो: बेन हिलाक/एक्स। |
API के माध्यम से उपयोग किए जाने पर O3-pro की लागत निवेश किए गए प्रति मिलियन टोकन पर 20 डॉलर और निर्यात किए गए प्रति मिलियन टोकन पर 80 डॉलर है। ऐसा AI की डेटा को याद रखने और संसाधित करने की क्षमता के कारण है। निवेश किए गए एक मिलियन टोकन लगभग 750,000 शब्दों के बराबर हैं, जो कि *वॉर एंड पीस* पुस्तक से भी लंबी है, जैसा कि द वर्ज ने तुलना की है।
OpenAI का कहना है कि विशेषज्ञों ने परीक्षण की गई हर श्रेणी में o3 pro को o3 से लगातार बेहतर रेटिंग दी है। समीक्षकों ने स्पष्टता, सुगमता और सटीकता जैसे कई मानदंडों में निरंतरता के लिए भी o3 pro को उच्च रेटिंग दी है, विशेष रूप से विज्ञान, शिक्षा , प्रोग्रामिंग, व्यवसाय और लेखन सहायता जैसे प्रमुख क्षेत्रों में।
AIME 2024 में, जो मॉडल की गणितीय क्षमताओं का आकलन करने वाला एक परीक्षण है, o3 प्रो ने Google के शीर्ष AI, Gemini 2.5 Pro से भी अधिक अंक प्राप्त किए। इसके अलावा, इस मॉडल ने डॉक्टरेट स्तर के वैज्ञानिक ज्ञान परीक्षण, GPQA डायमंड में Anthropic के Claude 4 Opus को भी पीछे छोड़ दिया।
o3 प्रो में ऐसे उपकरण भी एकीकृत हैं जो इसे वेब सर्च करने, फाइलों का विश्लेषण करने, कंप्यूटेशन और प्रोग्रामिंग के लिए पायथन का उपयोग करने और मेमोरी का लाभ उठाकर प्रतिक्रियाओं को वैयक्तिकृत करने की अनुमति देते हैं। इस पहलू पर टिप्पणी करते हुए, बेन हिलाक ने कहा कि यह उपकरण स्पष्ट रूप से अपने परिवेश को पहचानने, बाहरी दुनिया के बारे में कब पूछना है (जानने का दिखावा करने के बजाय) और प्रत्येक कार्य के लिए सही उपकरण चुनने की अपनी क्षमता प्रदर्शित करता है।
हालांकि, इस मॉडल की सबसे बड़ी कमी इसकी प्रतिक्रिया समय में निहित है, जो o1 प्रो से भी धीमी है। यूट्यूबर बिजन बोवेन भी इससे सहमत हैं। उन्होंने कहा, "हालांकि मॉडल की प्रतिक्रिया कुछ ही वर्णनात्मक वाक्यों में काफी स्पष्ट होती है, फिर भी प्रतिक्रिया समय काफी लंबा है।" बेन हिलाक ने आगे कहा कि विशेष रूप से अपर्याप्त बाहरी डेटा के मामलों में, मॉडल जरूरत से ज्यादा सोचने लगता है।
O3-pro में कुछ अन्य सीमाएँ भी हैं, जैसे कि इमेज बनाने की क्षमता का अभाव और कैनवास फ़ीचर का सपोर्ट न होना। OpenAI द्वारा एक "तकनीकी समस्या" को ठीक किए जाने तक ChatGPT में इस मॉडल के साथ अस्थायी चैट फ़ीचर फिलहाल निष्क्रिय है।
हालांकि, हिलाक का तर्क है कि यह क्लाउड 3.5 सॉनेट या चैटजीपीटी 40 जैसे उपयोगकर्ता-अनुकूल चैट के लिए उपयुक्त मॉडल नहीं है। रॉकरबॉक्स के उत्पाद प्रमुख नेट बी. जोन्स सलाह देते हैं कि o3 प्रो का उपयोग उन चुनौतीपूर्ण कार्यों के लिए किया जाना चाहिए जिनमें 15-20 मिनट के चिंतन की आवश्यकता होती है।
स्रोत: https://znews.vn/mo-hinh-suy-luan-moi-cua-chatgpt-post1560084.html







टिप्पणी (0)