गूगल डीपमाइंड ने जनरेटिव आर्टिफिशियल इंटेलिजेंस (GenAI) के क्षेत्र में एक बड़ी छलांग लगाई है: जेमिनी 2.5 फ्लैश इमेज मॉडल।

समुदाय द्वारा प्यार से "नैनो बनाना" के नाम से जाना जाने वाला यह मॉडल एक शक्तिशाली उपकरण है जो टेक्स्ट को छवियों में बदलने और मौजूदा छवियों को उच्च सटीकता और लचीलेपन के साथ संपादित करने में सक्षम है।

यह जेमिनी मॉडल श्रृंखला का उत्तराधिकारी है, लेकिन विशेष रूप से छवि-संबंधी कार्यों के लिए अनुकूलित है।

c732a0fbdcce57900edf.jpg
4 सितंबर को वियतनाम में गूगल ट्रेंड्स पर 'जेमिनी' कीवर्ड सबसे ऊपर रहा। (स्क्रीनशॉट)

इमेज क्रिएशन और एडिटिंग में अपनी उत्कृष्ट क्षमताओं के साथ, नैनो बनाना वियतनाम सहित दुनिया भर के प्रौद्योगिकी उपयोगकर्ताओं का काफी ध्यान आकर्षित कर रहा है।

गूगल ट्रेंड्स के अनुसार, पिछले 24 घंटों में मिथुन राशि और नैनो केले की खोज में भारी उछाल आया है। 4 सितंबर के आंकड़ों से पता चलता है कि सभी विषयों में "मिथुन" कीवर्ड ट्रेंडिंग चार्ट में सबसे ऊपर रहा।

फ़ोरम और सोशल मीडिया समूहों पर, उपयोगकर्ता नैनो बनाना का उपयोग करके छवि निर्माण कमांड और परिदृश्यों को साझा करते हैं और उन पर प्रयोग करते हैं।

अधिकांश लोग इस टूल की तेजी और कुशलता से इमेज बनाने की क्षमता के साथ-साथ इसके आउटपुट की गुणवत्ता की भी सराहना करते हैं।

टेक्स्ट विवरण से केवल इमेज बनाने के अलावा, जेमिनी 2.5 फ्लैश इमेज कई मुख्य क्षेत्रों में उत्कृष्ट प्रदर्शन करती है: कमांड-आधारित इमेज एडिटिंग, कैरेक्टर की स्थिरता बनाए रखना, प्रभावशाली प्रोसेसिंग गति और सिंथआईडी सुरक्षा तकनीक।

उपयोगकर्ता सामान्य भाषा का उपयोग करके फ़ोटो में मौजूद तत्वों को बदल सकते हैं। उदाहरण के लिए, केवल "टेबल के बगल में एक लाल कुर्सी जोड़ें" या "पृष्ठभूमि को जंगल में बदलें" जैसे कमांड दर्ज करने पर, मॉडल सटीकता और सहजता से संपादन कर देगा।

चरित्र की निरंतरता बनाए रखना इसकी सबसे महत्वपूर्ण विशेषता मानी जाती है। यह मॉडल एक ही चरित्र या वस्तु की छवि को कई अलग-अलग छवियों में लगातार विशेषताओं (जैसे चेहरा, कपड़े, शैली) के साथ याद रख सकता है और पुन: प्रस्तुत कर सकता है।

यह उन रचनात्मक परियोजनाओं के लिए विशेष रूप से उपयोगी है जिन्हें संबंधित छवियों की एक श्रृंखला तैयार करने की आवश्यकता होती है, चाहे वह कॉमिक्स हो या मार्केटिंग अभियान।

अपनी अनुकूलित वास्तुकला के साथ, जेमिनी 2.5 फ्लैश इमेज कुछ ही सेकंड में उच्च-गुणवत्ता वाले परिणाम उत्पन्न कर सकती है, जिससे रचनात्मक प्रक्रिया में काफी तेजी आती है।

मॉडल द्वारा बनाई या संपादित की गई सभी छवियों पर Google का एक मालिकाना अदृश्य डिजिटल वॉटरमार्क लगा होता है, जिससे AI द्वारा बनाई गई छवियों की पहचान की जा सकती है, इस प्रकार सामग्री की पारदर्शिता और उत्पत्ति सुनिश्चित करने में मदद मिलती है।

जेमिनी 2.5 फ्लैश इमेज मॉडल व्यक्तिगत उपयोगकर्ताओं से लेकर पेशेवर डेवलपर्स तक, कई संभावित अनुप्रयोगों के द्वार खोल रहा है।

डेवलपर्स जेमिनी एपीआई और गूगल एआई स्टूडियो के माध्यम से मॉडल तक पहुंच सकते हैं और अपने स्वयं के एप्लिकेशन बना सकते हैं, जबकि व्यवसाय वर्टेक्स एआई प्लेटफॉर्म पर मॉडल का उपयोग कर सकते हैं।

औसत उपयोगकर्ता के लिए, यह मॉडल सीधे Google Gemini और अन्य अनुप्रयोगों में एकीकृत है, जिससे AI इमेज क्रिएशन एक सुलभ और सहज उपकरण बन जाता है।

अपनी उत्कृष्ट विशेषताओं, विशेष रूप से कैरेक्टर की स्थिरता बनाए रखने की क्षमता के साथ, जेमिनी 2.5 फ्लैश इमेज को फोटोशॉप जैसे पारंपरिक फोटो एडिटिंग सॉफ्टवेयर का एक मजबूत प्रतियोगी बनने की उम्मीद है, जिससे रचनाकारों और उपयोगकर्ताओं के डिजिटल छवियों के साथ बातचीत करने के तरीके में बदलाव आएगा।

वैश्विक एआई अनुवाद प्रतियोगिता में चीन ने अप्रत्याशित रूप से अमेरिका को पीछे छोड़ दिया । टेनसेंट (चीन) के ओपन-सोर्स मॉडल हुनयुआन-एमटी-7बी ने डब्ल्यूएमटी25 सम्मेलन में आयोजित अंतरराष्ट्रीय मशीन अनुवाद प्रतियोगिता में अमेरिकी दिग्गजों पर लगभग पूर्ण विजय प्राप्त की।

स्रोत: https://vietnamnet.vn/nano-banana-la-gi-ma-khien-moi-nguoi-xon-xao-dung-dau-google-trends-viet-nam-2439283.html