गूगल जेमिनी अपग्रेड, गूगल डीपमाइंड द्वारा विकसित "नैनो बनाना" इमेज मॉडल का उपयोग करता है। यह सुविधा अब मुफ़्त और सशुल्क दोनों उपयोगकर्ताओं के लिए वैश्विक स्तर पर उपलब्ध है। इसकी सबसे बड़ी खूबी यह है कि यह छवियों में चेहरों और वस्तुओं को एक समान बनाए रखने में सक्षम है, जो कि अन्य एआई उपकरणों के लिए अक्सर मुश्किल होता है।

डीपमाइंड की उत्पाद प्रमुख निकोल ब्रिचटोवा ने कहा, "हमने छवि की गुणवत्ता और मॉडल की निर्देशों का पालन करने की क्षमता को वास्तव में बेहतर बनाया है। इस अपडेट से संपादन और भी सहज हो गया है और परिणाम इतने अच्छे हैं कि इन्हें किसी भी उद्देश्य के लिए इस्तेमाल किया जा सकता है।"

हर तस्वीर में "आप" को रखें

एआई तस्वीरों को नकली बनाने वाली एक वजह यह है कि छोटी-छोटी बारीकियाँ विकृत हो जाती हैं। गूगल का कहना है कि जेमिनी इस समस्या का समाधान करता है, जिससे आप चेहरे और हाव-भाव को वही रखते हुए पूरे दृश्य को बदल सकते हैं। आप तस्वीर के विकृत होने की चिंता किए बिना नया हेयरस्टाइल आज़मा सकते हैं, दीवार का रंग बदल सकते हैं, या किसी पालतू जानवर को दृश्य में ला सकते हैं।

फ़ोटो को एक साथ मिलाएँ.gif
Google Gemini का उपयोग करके दो मौजूदा छवियों से नए संदर्भ वाली फ़ोटो मर्ज करें। स्रोत: Google

जेमिनी आपको एक साथ कई फोटो अपलोड करने की सुविधा भी देता है, जैसे कि अपनी बिल्ली के साथ एक चित्र को जोड़कर सड़क पर एक साथ साइकिल चलाते हुए एक फोटो बनाना।

जेमिनी मल्टी-टर्न एडिटिंग को सपोर्ट करता है, जिससे यूज़र्स किसी भी जगह की हर छोटी-बड़ी चीज़ जोड़ सकते हैं: वॉलपेपर, फ़र्नीचर से लेकर पेंट के रंग तक। इसकी खासियत यह है कि सिर्फ़ वही हिस्सा बदलता है जिसे एडिट करना है, बाकी सब वैसा ही रहता है।

इसके अलावा, मिथुन राशि वाले तस्वीरों में स्टाइल मिला सकते हैं। उदाहरण के लिए, रेन बूट्स को फ्लोरल प्रिंट वाले जूतों में बदल सकते हैं, या बटरफ्लाई पैटर्न वाली ड्रेस बना सकते हैं।

प्रौद्योगिकी दिग्गजों के बीच एआई छवि निर्माण की दौड़

गूगल का यह अपग्रेड ऐसे समय में आया है जब एआई इमेजिंग की जंग तेज़ हो रही है। ओपनएआई ने पहले GPT-4o लॉन्च किया था, जो सीधे इमेज जनरेट कर सकता है, और स्टूडियो घिबली-स्टाइल मीम्स की एक श्रृंखला के साथ वायरल हो गया। सीईओ सैम ऑल्टमैन ने बताया कि उपयोगकर्ताओं की संख्या इतनी बढ़ गई कि कंपनी के GPU लगभग "पिघल" गए।

इस क्रम में आगे बढ़ते हुए, मेटा ने मिडजर्नी के साथ साझेदारी की घोषणा की, जबकि जर्मन स्टार्टअप ब्लैक फॉरेस्ट लैब्स अपने फ्लक्स मॉडल के साथ कई चार्टों पर हावी है।

मल्टी टर्न एडिटिंग.gif
गूगल जेमिनी की बहु-चरणीय फ़ोटो संपादन क्षमताएँ। स्रोत: गूगल

गूगल को उम्मीद है कि जेमिनी चैटजीपीटी के साथ यह अंतर कम कर सकेगी। सीईओ सुंदर पिचाई के अनुसार, जेमिनी के वर्तमान में 45 करोड़ मासिक उपयोगकर्ता हैं, जो चैटजीपीटी से काफ़ी कम है, जिसके साप्ताहिक उपयोगकर्ता 70 करोड़ से ज़्यादा हैं।

ब्रिचटोवा ने बताया कि जेमिनी को वास्तविक दुनिया के परिदृश्यों के लिए डिज़ाइन किया गया है, जिसमें लिविंग रूम और बगीचों की कल्पना से लेकर मनोरंजक तस्वीरें बनाने तक शामिल हैं। इस मॉडल में बेहतर " दुनिया का ज्ञान" है और यह कई तस्वीरों और रंग पैलेट को एक ही रेंडरिंग में संयोजित कर सकता है।

हालाँकि, Google सख्त सीमाएँ भी तय करता है। सभी उत्पन्न छवियों में एक स्पष्ट वॉटरमार्क और मेटाडेटा में छिपे हुए पहचानकर्ता होते हैं। डीपफेक दुरुपयोग को रोकने के लिए कंपनी अनैच्छिक रूप से संवेदनशील छवियों के निर्माण पर सख्त प्रतिबंध लगाती है।

गूगल ने पहले भी जेमिनी की गलत ऐतिहासिक तस्वीरों के लिए माफ़ी मांगी है। इस बार, कंपनी का मानना ​​है कि उसने रचनात्मकता और सुरक्षा के बीच संतुलन बनाए रखा है। ब्रिचटोवा ने ज़ोर देकर कहा, "हम चाहते हैं कि उपयोगकर्ता रचनात्मक हों, लेकिन हर चीज़ की अनुमति नहीं है।"

जेमिनी 2.5 फ्लैश इमेज के साथ, गूगल एआई फोटो संपादन अनुभव को बढ़ाने पर दांव लगा रहा है, जिससे पुराने उपयोगकर्ताओं को बनाए रखने और ओपनएआई, मेटा और अन्य प्रतियोगियों के साथ भयंकर प्रौद्योगिकी दौड़ में नए लोगों को आकर्षित करने की उम्मीद है।

(टेकक्रंच, टॉम्स गाइड के अनुसार)

85 मिलियन VND प्रति 'ब्रेन' की कीमत पर, Nvidia इंसानों द्वारा रोबोट बनाने के युग का मार्ग प्रशस्त कर रहा है। Nvidia ने हाल ही में Jetson AGX Thor नामक एक चिप लॉन्च की है, जिसे "रोबोट ब्रेन" कहा जाता है, जो मशीनों को इंसानों की तरह देखने, सोचने और काम करने में मदद कर सकती है। इस चिप के साथ, भौतिक AI की दौड़ शुरू हो गई है और इसकी कीमत 3,499 अमेरिकी डॉलर है।

स्रोत: https://vietnamnet.vn/google-gemini-nang-tam-ai-tao-anh-doi-nen-kieu-toc-chi-bang-mot-cau-lenh-2436782.html