![]() |
गूगल जेमिनी लोगो. फोटो: ब्लूमबर्ग . |
गूगल ने नवंबर के अंत में जेमिनी 3 मॉडल लॉन्च किया। कंपनी ने इसमें कई उल्लेखनीय अपग्रेड पेश किए, जैसे बेहतर कोडिंग क्षमताएँ, विज़ुअलाइज़ेशन और एजेंट, जो उपयोगकर्ताओं की ओर से कुछ कार्य निष्पादित करते हैं।
जेमिनी 3 को पेश करते हुए, गूगल ने ज़ोर देकर कहा कि यह कंपनी का "अब तक का सबसे स्मार्ट मॉडल" है। व्यावहारिक अनुभव से पता चलता है कि यह मॉडल तेज़ी से प्रोसेस करता है, इसकी तर्क क्षमता बेहतर है, हालाँकि कुछ ऐसे कारक हैं जिनमें सुधार की आवश्यकता है।
शीघ्रता से इंटरैक्टिव इंटरफेस बनाएँ
जेमिनी 3 में एक बड़ा अपग्रेड कैनवस के इर्द-गिर्द घूमता है, जो जेमिनी में एक इंटरैक्टिव वर्कस्पेस है जो आपको चैटबॉट्स से कोड लिखने, परिणामों को विज़ुअलाइज़ करने और सामग्री को संपादित करने की सुविधा देता है।
जब जेमिनी 3 को एक फुटबॉल, पृथ्वी, सूर्य और आकाशगंगा के आकार के बीच अंतर का 3D मॉडल बनाने के लिए कहा जाता है, तो उपकरण एक इंटरैक्टिव कोडिंग, प्रसंस्करण और निर्माण इंटरफ़ेस को सक्रिय करता है जो वस्तुओं को चुनने और आकार में तुलना करने की अनुमति देता है।
![]() |
जेमिनी 3 में कैनवास सुविधा के साथ इंटरैक्टिव स्थान बनाने की क्षमता। |
गूगल के डेमो की तुलना में, इमेज क्वालिटी के मामले में नतीजे थोड़े खराब हैं। बदले में, वस्तुओं के बारे में जानकारी स्पष्ट और आसानी से समझ में आने वाली होती है। प्रोसेसिंग में लगभग 2 मिनट लगते हैं। कैनवस इंटरफ़ेस में, उपयोगकर्ता सीधे कोड को संपादित कर सकते हैं, कॉपी कर सकते हैं या कंटेंट शेयर कर सकते हैं।
एक अन्य कमांड के साथ, जेमिनी 3 को एक पेड़ की टहनी पर बैठे वॉक्सेल-शैली के बाज की आकृति बनाने के लिए कहा गया। टूल ने लगभग 45 सेकंड में परिणाम दिए, और उपयोगकर्ता माउस का उपयोग करके दृश्य को ज़ूम इन और घुमा सकते थे। हालाँकि, छवि के कुछ विवरणों में ग्राफ़िक त्रुटियाँ थीं और वे ठीक से प्रदर्शित नहीं हो रहे थे।
एक पेड़ की टहनी पर बैठे एक बाज के साथ भी, लेकिन एक ज़्यादा मुश्किल अनुरोध (3D मॉडल) के साथ। पहली बार जेमिनी 3 द्वारा जनरेट किया गया कोड क्रैश हो गया और चलने में विफल रहा। सुधार का अनुरोध करने के बाद, छवि दिखाई दी और इंटरैक्टिव थी।
![]() |
जेमिनी 3 की इंटरैक्टिव वातावरण निर्माण क्षमताएं। |
हालांकि इसमें कुछ समस्याएं हैं, लेकिन प्रश्न-उत्तर मॉडल से सहयोगात्मक संपादन की ओर कदम एक दिलचस्प दिशा है जो जेमिनी 3 को जटिल, दीर्घकालिक कार्यों के लिए उपयोगी बनाएगी।
बेशक, जेमिनी 3 सिर्फ़ ग्राफ़िक्स या विज़ुअल मॉडल बनाने के लिए ही नहीं है। गूगल एआई प्रो यूज़र्स के लिए "जेनरेटिव यूआई" फ़ीचर का परीक्षण कर रहा है। कुछ कमांड्स के साथ, यह मॉडल इंटरैक्टिव मैगज़ीन-स्टाइल इंटरफ़ेस या विज़ुअल वेबसाइट बना सकता है।
गूगल का कहना है कि यह सुविधा चरणों में जारी की जा रही है। जैसा कि द वर्ज ने अनुभव किया, उपयोगकर्ताओं को विज़ुअल लेआउट सुविधा चुननी होगी, फिर "मेरे लिए रोम की 3-दिवसीय यात्रा की योजना बनाएँ" जैसा कमांड टाइप करना होगा।
प्रोसेसिंग के बाद, जेमिनी 3 एक ट्रैवल वेबसाइट जैसे परिणाम उत्पन्न करता है, जिसमें विस्तृत कार्यक्रम और चित्र, साथ ही यात्रा की प्राथमिकताओं और खान-पान के बारे में कई प्रश्न होते हैं। इसके बाद, मॉडल उत्तरों को तदनुसार समायोजित कर देगा। यह सुविधा कंप्यूटर कैसे असेंबल करें, मछलीघर कैसे बनाएँ, आदि जैसे विषयों के लिए भी काफी उपयोगी है।
अधिक प्रभावी ढंग से तर्क और विश्लेषण करें
गूगल के अनुसार, जेमिनी 3 में अपने पूर्ववर्ती की तुलना में बेहतर तर्क क्षमता है। कंपनी का दावा है कि जेमिनी 3 प्रो की तर्क क्षमता डॉक्टरेट स्तर की है, जिसका ह्यूमैनिटीज़ लास्ट परीक्षा में 37.5% और GPQA डायमंड परीक्षा में 91.9% स्कोर है।
बेशक, उपयोगकर्ता केवल मॉडल के साथ सीधे बातचीत करके ही अंतर महसूस कर सकते हैं। GPQA डायमंड रेफरेंस सेट (डॉक्टरेट स्तर पर केंद्रित) से ली गई एक समस्या को हल करने के लिए कहा गया, तो जेमिनी 3 प्रो ने समस्या के प्रत्येक चरण और चित्रात्मक चित्रों सहित एक विस्तृत समाधान प्रदान करने में लगभग 30 सेकंड का समय लिया।
![]() |
जेमिनी 3 जटिल प्रश्नों का उत्तर दे सकता है, सोचने की क्षमता पीएचडी स्तर के बराबर होती है। |
मूल्यांकन के अनुसार, समाधान काफी विस्तृत है और प्रक्रिया का पालन करता है। तुलना के लिए, GPT-5.1 ने भी लगभग 30 सेकंड का समय लिया, सही उत्तर दिया लेकिन समाधान कम विस्तृत था। इसी तरह, क्लाउड 4.5 सॉनेट ने सही उत्तर दिया, जेमिनी 3 से तेज़, लेकिन कम विवरण के साथ।
गूगल का कहना है कि जेमिनी 3 एक साथ कई स्रोतों से दस्तावेज़ निकाल सकता है, जैसे टेक्स्ट, इमेज और वीडियो । जिन कार्यों के लिए इसे पहले प्रशिक्षित नहीं किया गया है, उन्हें भी जेमिनी 3 बेहतर तरीके से संभालता है।
![]() |
जेमिनी 3 वीडियो विश्लेषण क्षमताएं. |
उदाहरण के लिए, जब 57 मिनट के वीडियो के मुख्य विषय का विश्लेषण करने के लिए कहा गया, तो जेमिनी 3 को अनुरोधित तर्कों के साथ-साथ वीडियो के संबंधित भाग का टाइमस्टैम्प भी देने में लगभग एक मिनट का समय लगा। इसी तरह, मॉडल ने टेनिस के बारे में एक वीडियो की सही पहचान की, मैचों का विश्लेषण किया और प्रत्येक खिलाड़ी के खेलने के तरीके का भी विश्लेषण किया।
उपयोगकर्ता जेमिनी 3 से बाहरी स्रोतों का संदर्भ लेते हुए वीडियो देखने के लिए कह सकते हैं, और गहन विश्लेषण के लिए प्रश्न भी पूछ सकते हैं। कुल मिलाकर, जेमिनी 3 दस्तावेज़ों का विश्लेषण और संदर्भ देने में काफी कुशल है, जिसका एक बड़ा कारण गूगल सर्च डेटाबेस से इसका कनेक्शन है।
एजेंट मददगार है लेकिन उसमें समस्याएं हैं
एजेंट भी जेमिनी 3 पर एक उल्लेखनीय उन्नयन है। एआई अल्ट्रा पैकेज (वर्तमान में केवल अमेरिकी बाजार का समर्थन) के उपयोगकर्ताओं के लिए, यह मोड उपयोगकर्ताओं की ओर से जटिल प्रक्रियाएं कर सकता है जैसे ईमेल को सॉर्ट करना और व्यवस्थित करना, जानकारी खोजना, यात्रा टिकट बुक करना ...
जब गूगल ने जेमिनी 3 लांच किया, तो उसने जीमेल में आपके इनबॉक्स को व्यवस्थित करने की क्षमता दिखाई, और द वर्ज के अनुभव में, इसने ठीक वैसे ही काम किया जैसा कि इससे अपेक्षित था: इसने एक सप्ताह के अपठित ईमेल की पूरी सूची तैयार कर दी।
कैनवस फ़ीचर की तरह, ईमेल सूची और सुझाए गए कार्य एक अलग क्षेत्र में प्रदर्शित होते हैं। जेमिनी कुछ विकल्प प्रदान करता है जैसे महत्वपूर्ण ईमेल के लिए रिमाइंडर सेट करना, प्रचार ईमेल संग्रहित करना...
![]() |
जेमिनी 3 का एजेंट फ़ीचर जीमेल इनबॉक्स प्रबंधन को सपोर्ट करता है। फोटो: द वर्ज । |
बिल भुगतान रिमाइंडर बनाने के लिए कहने पर, जेमिनी तुरंत संबंधित जानकारी को Google टास्क में खींच लेता है। भुगतान कार्य के लिए, एजेंट स्वचालित रूप से नेविगेट करता है और जब उपयोगकर्ता को भुगतान जानकारी दर्ज करने की आवश्यकता होती है, तो रुक जाता है।
कुल मिलाकर, जेमिनी 3 एजेंट उन ईमेल का पता लगाने में काफ़ी उपयोगी है जिन्हें उपयोगकर्ता भूल सकते हैं। यह टूल उन विज्ञापन पतों से आने वाले ईमेल भी ढूँढ़कर उनकी सदस्यता समाप्त कर सकता है जो अब उपयोगी नहीं हैं।
दरअसल, Perplexity और ChatGPT जैसे कुछ चैटबॉट एजेंट पहले से ही Gmail एकीकरण का समर्थन करते हैं। हालाँकि, Gemini की एकीकरण क्षमताएँ सबसे विविध हैं। उदाहरण के लिए, Perplexity उपयोगकर्ताओं को उन ईमेल को विशेष रूप से दर्ज करना होता है जिन्हें वे रखना या हटाना चाहते हैं, जबकि Gemini का संचालन बटनों के माध्यम से किया जा सकता है।
![]() |
जेमिनी 3 का इंटरैक्टिव इंटरफ़ेस निर्माण फ़ीचर। फ़ोटो: द वर्ज । |
चैटजीपीटी का ईमेल शेड्यूलिंग फ़ीचर भी असंगत है। हालाँकि, जेमिनी की ईमेल डिलीवरी स्पीड पेरप्लेक्सिटी से धीमी है। रेस्टोरेंट में बुकिंग जैसे कुछ कामों में कभी-कभी समस्याएँ आती हैं।
हालाँकि भुगतान करने या ईमेल भेजने जैसे संवेदनशील कार्यों को करने से पहले हमेशा उपयोगकर्ता की पुष्टि की आवश्यकता होती है, फिर भी कुछ कार्यों को AI पर छोड़ने से उपयोगकर्ता हिचकिचाते हैं। जेमिनी 3 का एजेंट मोड काफी उपयोगी है, लेकिन उपयोगकर्ताओं को अभी भी आउटपुट पर नज़र रखनी होगी।
स्रोत: https://znews.vn/gemini-3-tot-den-dau-post1607493.html

















टिप्पणी (0)