गूगल जेमिनी अपग्रेड, गूगल डीपमाइंड द्वारा विकसित "नैनो बनाना" इमेज मॉडल का उपयोग करता है। यह सुविधा अब मुफ़्त और सशुल्क दोनों उपयोगकर्ताओं के लिए वैश्विक स्तर पर उपलब्ध है। इसकी सबसे बड़ी खूबी यह है कि यह छवियों में चेहरों और वस्तुओं को एक समान बनाए रखने में सक्षम है, जो कि अन्य एआई उपकरणों के लिए अक्सर मुश्किल होता है।
डीपमाइंड की उत्पाद प्रमुख निकोल ब्रिचटोवा ने कहा, "हमने छवि की गुणवत्ता और मॉडल की निर्देशों का पालन करने की क्षमता को वास्तव में बेहतर बनाया है। इस अपडेट से संपादन और भी सहज हो गया है और परिणाम इतने अच्छे हैं कि इन्हें किसी भी उद्देश्य के लिए इस्तेमाल किया जा सकता है।"
हर तस्वीर में "आप" को रखें
एआई तस्वीरों को नकली बनाने वाली एक वजह यह है कि छोटी-छोटी बारीकियाँ विकृत हो जाती हैं। गूगल का कहना है कि जेमिनी इस समस्या का समाधान करता है, जिससे आप चेहरे और हाव-भाव को वही रखते हुए पूरे दृश्य को बदल सकते हैं। आप तस्वीर के विकृत होने की चिंता किए बिना नया हेयरस्टाइल आज़मा सकते हैं, दीवार का रंग बदल सकते हैं, या किसी पालतू जानवर को दृश्य में ला सकते हैं।

जेमिनी आपको एक साथ कई फोटो अपलोड करने की सुविधा भी देता है, जैसे कि अपनी बिल्ली के साथ एक चित्र को जोड़कर सड़क पर एक साथ साइकिल चलाते हुए एक फोटो बनाना।
जेमिनी मल्टी-टर्न एडिटिंग को सपोर्ट करता है, जिससे यूज़र्स किसी भी जगह की हर छोटी-बड़ी चीज़ जोड़ सकते हैं: वॉलपेपर, फ़र्नीचर से लेकर पेंट के रंग तक। इसकी खासियत यह है कि सिर्फ़ वही हिस्सा बदलता है जिसे एडिट करना है, बाकी सब वैसा ही रहता है।
इसके अलावा, मिथुन राशि वाले तस्वीरों में स्टाइल मिला सकते हैं। उदाहरण के लिए, रेन बूट्स को फ्लोरल प्रिंट वाले जूतों में बदल सकते हैं, या बटरफ्लाई पैटर्न वाली ड्रेस बना सकते हैं।
प्रौद्योगिकी दिग्गजों के बीच एआई छवि निर्माण की दौड़
गूगल का यह अपग्रेड ऐसे समय में आया है जब एआई इमेजिंग की जंग तेज़ हो रही है। ओपनएआई ने पहले GPT-4o लॉन्च किया था, जो सीधे इमेज जनरेट कर सकता है, और स्टूडियो घिबली-स्टाइल मीम्स की एक श्रृंखला के साथ वायरल हो गया। सीईओ सैम ऑल्टमैन ने बताया कि उपयोगकर्ताओं की संख्या इतनी बढ़ गई कि कंपनी के GPU लगभग "पिघल" गए।
इस क्रम में आगे बढ़ते हुए, मेटा ने मिडजर्नी के साथ साझेदारी की घोषणा की, जबकि जर्मन स्टार्टअप ब्लैक फॉरेस्ट लैब्स अपने फ्लक्स मॉडल के साथ कई चार्टों पर हावी है।

गूगल को उम्मीद है कि जेमिनी चैटजीपीटी के साथ यह अंतर कम कर सकेगी। सीईओ सुंदर पिचाई के अनुसार, जेमिनी के वर्तमान में 45 करोड़ मासिक उपयोगकर्ता हैं, जो चैटजीपीटी से काफ़ी कम है, जिसके साप्ताहिक उपयोगकर्ता 70 करोड़ से ज़्यादा हैं।
ब्रिचटोवा ने बताया कि जेमिनी को वास्तविक दुनिया के परिदृश्यों के लिए डिज़ाइन किया गया है, जिसमें लिविंग रूम और बगीचों की कल्पना से लेकर मनोरंजक तस्वीरें बनाने तक शामिल हैं। इस मॉडल में बेहतर " दुनिया का ज्ञान" है और यह कई तस्वीरों और रंग पैलेट को एक ही रेंडरिंग में संयोजित कर सकता है।
हालाँकि, Google सख्त सीमाएँ भी तय करता है। सभी उत्पन्न छवियों में एक स्पष्ट वॉटरमार्क और मेटाडेटा में छिपे हुए पहचानकर्ता होते हैं। डीपफेक दुरुपयोग को रोकने के लिए कंपनी अनैच्छिक रूप से संवेदनशील छवियों के निर्माण पर सख्त प्रतिबंध लगाती है।
गूगल ने पहले भी जेमिनी की गलत ऐतिहासिक तस्वीरों के लिए माफ़ी मांगी है। इस बार, कंपनी का मानना है कि उसने रचनात्मकता और सुरक्षा के बीच संतुलन बनाए रखा है। ब्रिचटोवा ने ज़ोर देकर कहा, "हम चाहते हैं कि उपयोगकर्ता रचनात्मक हों, लेकिन हर चीज़ की अनुमति नहीं है।"
जेमिनी 2.5 फ्लैश इमेज के साथ, गूगल एआई फोटो संपादन अनुभव को बढ़ाने पर दांव लगा रहा है, जिससे पुराने उपयोगकर्ताओं को बनाए रखने और ओपनएआई, मेटा और अन्य प्रतियोगियों के साथ भयंकर प्रौद्योगिकी दौड़ में नए लोगों को आकर्षित करने की उम्मीद है।
(टेकक्रंच, टॉम्स गाइड के अनुसार)

स्रोत: https://vietnamnet.vn/google-gemini-nang-tam-ai-tao-anh-doi-nen-kieu-toc-chi-bang-mot-cau-lenh-2436782.html
टिप्पणी (0)