गूगल जेमिनी अपग्रेड, गूगल डीपमाइंड द्वारा विकसित "नैनो बनाना" इमेज मॉडल का उपयोग करता है। यह सुविधा अब मुफ़्त और सशुल्क दोनों उपयोगकर्ताओं के लिए वैश्विक स्तर पर उपलब्ध है। इसकी सबसे बड़ी खूबी तस्वीरों में चेहरों और वस्तुओं को एक समान बनाए रखने की इसकी क्षमता है, जो अन्य एआई उपकरणों के लिए अक्सर मुश्किल होती है।

डीपमाइंड की उत्पाद प्रमुख निकोल ब्रिचटोवा ने कहा, "हमने तस्वीरों की गुणवत्ता और मॉडल की निर्देशों का पालन करने की क्षमता को वाकई बेहतर बनाया है। इस अपडेट से संपादन और भी सहज हो गए हैं और परिणाम इतने अच्छे हैं कि इन्हें किसी भी काम में इस्तेमाल किया जा सकता है।"

हर तस्वीर में "आप" को रखें

एआई तस्वीरों को नकली बनाने वाली एक वजह यह है कि छोटी-छोटी बारीकियाँ विकृत हो जाती हैं। गूगल का कहना है कि जेमिनी इस समस्या का समाधान करता है, जिससे आप चेहरे और हाव-भाव को वही रखते हुए पूरे दृश्य को बदल सकते हैं। आप तस्वीर के विकृत होने की चिंता किए बिना नया हेयरस्टाइल आज़मा सकते हैं, दीवार का रंग बदल सकते हैं, या किसी पालतू जानवर को दृश्य में ला सकते हैं।

फ़ोटो को एक साथ मिलाएँ.gif
Google Gemini का उपयोग करके दो मौजूदा छवियों से नए संदर्भ वाली फ़ोटो मर्ज करें। स्रोत: Google

जेमिनी आपको एक साथ कई फोटो अपलोड करने की सुविधा भी देता है, जैसे कि अपनी बिल्ली के साथ एक चित्र को जोड़कर सड़क पर एक साथ साइकिल चलाते हुए एक फोटो बनाना।

जेमिनी मल्टी-टर्न एडिटिंग को सपोर्ट करता है, जिससे यूज़र्स किसी भी जगह की हर छोटी-बड़ी चीज़ जोड़ सकते हैं: वॉलपेपर, फ़र्नीचर से लेकर पेंट के रंग तक। इसकी खासियत यह है कि सिर्फ़ वही हिस्सा बदलता है जिसे एडिट करना है, बाकी सब वैसा ही रहता है।

इसके अलावा, मिथुन राशि वाले तस्वीरों में स्टाइल मिला सकते हैं। उदाहरण के लिए, रेन बूट्स को फ्लोरल प्रिंट वाले जूतों में बदल सकते हैं, या बटरफ्लाई पैटर्न वाली ड्रेस बना सकते हैं।

प्रौद्योगिकी दिग्गजों के बीच एआई छवि निर्माण की दौड़

गूगल का यह अपग्रेड ऐसे समय में आया है जब एआई इमेजिंग की जंग तेज़ हो रही है। ओपनएआई ने पहले GPT-4o लॉन्च किया था, जो सीधे इमेज जनरेट कर सकता है, और स्टूडियो घिबली-स्टाइल मीम्स की एक श्रृंखला के साथ वायरल हो गया। सीईओ सैम ऑल्टमैन ने खुलासा किया कि उपयोगकर्ताओं की संख्या इतनी बढ़ गई कि कंपनी के GPU "लगभग पिघल गए।"

इस क्रम में आगे बढ़ते हुए, मेटा ने मिडजर्नी के साथ साझेदारी की घोषणा की, जबकि जर्मन स्टार्टअप ब्लैक फॉरेस्ट लैब्स अपने फ्लक्स मॉडल के साथ कई चार्टों पर हावी है।

मल्टी टर्न एडिटिंग.gif
गूगल जेमिनी की बहु-चरणीय फ़ोटो संपादन क्षमताएँ। स्रोत: गूगल

गूगल को उम्मीद है कि जेमिनी चैटजीपीटी के साथ अंतर कम कर सकेगी। सीईओ सुंदर पिचाई के अनुसार, जेमिनी के वर्तमान में 45 करोड़ मासिक उपयोगकर्ता हैं, जो चैटजीपीटी से काफ़ी पीछे है, जिसके साप्ताहिक उपयोगकर्ता 70 करोड़ से ज़्यादा हैं।

ब्रिचटोवा ने बताया कि जेमिनी को वास्तविक दुनिया के परिदृश्यों के लिए डिज़ाइन किया गया है, जिसमें लिविंग रूम और बगीचों की कल्पना से लेकर मनोरंजक तस्वीरें बनाने तक शामिल हैं। इस मॉडल में बेहतर " दुनिया का ज्ञान" है और यह कई तस्वीरों और रंग पैलेट को एक ही रेंडरिंग में संयोजित कर सकता है।

हालाँकि, Google सख्त सीमाएँ भी लगाता है। सभी उत्पन्न छवियों में एक स्पष्ट वॉटरमार्क और मेटाडेटा में छिपा एक पहचान चिह्न होता है। डीपफेक के दुरुपयोग को रोकने के लिए कंपनी बिना अनुमति के संवेदनशील छवियों के निर्माण पर सख्त प्रतिबंध लगाती है।

गूगल ने पहले भी जेमिनी की गलत ऐतिहासिक तस्वीरों के लिए माफ़ी मांगी है। इस बार, कंपनी का मानना ​​है कि उसने रचनात्मकता और सुरक्षा के बीच संतुलन बनाए रखा है। ब्रिचटोवा ने ज़ोर देकर कहा, "हम चाहते हैं कि उपयोगकर्ता रचनात्मक हों, लेकिन हर चीज़ की अनुमति नहीं है।"

जेमिनी 2.5 फ्लैश इमेज के साथ, Google एआई फोटो संपादन अनुभव को बढ़ाने पर दांव लगा रहा है, जिससे पुराने उपयोगकर्ताओं को बनाए रखने और ओपनएआई, मेटा और अन्य प्रतियोगियों के साथ एक भयंकर प्रौद्योगिकी दौड़ में नए लोगों को आकर्षित करने की उम्मीद है।

(टेकक्रंच, टॉम्स गाइड के अनुसार)

85 मिलियन VND प्रति 'ब्रेन' की कीमत पर, Nvidia इंसानों द्वारा रोबोट बनाने के युग का मार्ग प्रशस्त कर रहा है। Nvidia ने हाल ही में Jetson AGX Thor नामक एक चिप लॉन्च की है, जिसे "रोबोट ब्रेन" कहा जाता है, जो मशीनों को इंसानों की तरह देखने, सोचने और काम करने में सक्षम बनाती है, और 3,499 अमेरिकी डॉलर में भौतिक AI की दौड़ का द्वार खोलती है।

स्रोत: https://vietnamnet.vn/google-gemini-nang-tam-ai-tao-anh-doi-nen-kieu-toc-chi-bang-mot-cau-lenh-2436782.html