(सीएलओ) गूगल ने हाल ही में "व्हिस्क" नामक एक नया कृत्रिम बुद्धिमत्ता (एआई) टूल लॉन्च किया है, जो उपयोगकर्ताओं को एआई-जनरेटेड संयुक्त छवियों को पुनः प्राप्त करने के लिए फोटो अपलोड करने की अनुमति देता है, भले ही उपयोगकर्ता कोई टेक्स्ट दर्ज न करे।
व्हिस्क अपलोड की गई तस्वीर के विषय, संदर्भ और शैली को संयोजित करने के लिए एआई का उपयोग करता है, जिससे एक नई और अधिक अनूठी छवि बनती है।
गूगल ने व्हिस्क को एक "रचनात्मक टूल" बताया है जो उपयोगकर्ताओं को बिना किसी पेशेवर फोटो संपादन कौशल के नए विज़ुअल आइडियाज़ को तेज़ी से उत्पन्न करने में मदद करता है। गूगल के अनुसार, यह टूल कोई पारंपरिक इमेज एडिटर नहीं है, बल्कि एक मज़ेदार एआई टूल है जिसका उद्देश्य रचनात्मकता और तेज़ी से खोज को बढ़ावा देना है।
जब कोई उपयोगकर्ता कोई फोटो अपलोड करता है, तो व्हिस्क गूगल की एआई सेवा, जेमिनी, और इमेजन 3 प्रौद्योगिकी के संयोजन का उपयोग करता है - एक उपकरण जो पाठ से चित्र बनाता है जिसे गूगल ने डीपमाइंड से प्राप्त किया है।
जेमिनी फोटो का विश्लेषण करेगा और एक कैप्शन बनाएगा, फिर इमेजन 3 उस फोटो के तत्वों को रचनात्मक तरीके से संयोजित करेगा, विषय की हूबहू नकल करने के बजाय उसके "सार" को बरकरार रखेगा।
व्हिस्क टूल इंटरफ़ेस. स्क्रीनशॉट
इसका मतलब है कि अंतिम परिणाम मूल छवि से 100% मेल नहीं खा सकता। उदाहरण के लिए, नई छवि में विषयों की ऊँचाई, केश विन्यास या त्वचा का रंग मूल छवि से भिन्न हो सकता है। हालाँकि, उपयोगकर्ता अभी भी इनपुट जानकारी को समायोजित कर सकते हैं, दृश्य, शैली बदल सकते हैं, या विभिन्न चित्र बनाने के लिए कई विषयों को मिला सकते हैं।
व्हिस्क न केवल टेक्स्ट से, बल्कि रॉ इमेज से भी इमेज बना सकता है, जिससे उपयोगकर्ताओं की रचनात्मक संभावनाओं का विस्तार होता है और उन्हें किसी फोटो एडिटिंग अनुभव की आवश्यकता नहीं होती। गूगल लैब्स के उत्पाद प्रबंधन निदेशक थॉमस इल्जिक ने कहा, "व्हिस्क को उपयोगकर्ताओं को विषयों, संदर्भों और शैलियों को रचनात्मक तरीकों से रीमिक्स करने में मदद करने के लिए डिज़ाइन किया गया है, जिससे उन्हें प्रत्येक पिक्सेल को सावधानीपूर्वक संपादित करने के बजाय दृश्य रूप से एक्सप्लोर करने की सुविधा मिलती है।"
जबकि व्हिस्क अभी विकास के प्रारंभिक चरण में है, इस टूल को गूगल लैब्स पर एक वेबसाइट के रूप में लॉन्च किया गया है और अब यह अमेरिका में उपयोगकर्ताओं के लिए उपलब्ध है।
वेडबुश सिक्योरिटीज के प्रबंध निदेशक और वरिष्ठ विश्लेषक डैन इवेस ने कहा कि व्हिस्क तकनीकी दौड़ में गूगल के लिए एक और "शक्ति प्रदर्शन का क्षण" है।
इव्स ने यह भी बताया कि डीपमाइंड, वह एआई लैब जिसे गूगल ने 2014 में अधिग्रहित किया था, गूगल को एआई क्षेत्र में अपनी स्थिति बनाए रखने में एक महत्वपूर्ण भूमिका निभा रही है। व्हिस्क सहित एआई उत्पाद आने वाले वर्षों में गूगल की उत्पाद विकास रणनीति का एक महत्वपूर्ण हिस्सा हैं, और 2025 तक कई नए उत्पाद लॉन्च होने की उम्मीद है।
व्हिस्क टूल न्यूनतम उपयोगकर्ता हस्तक्षेप के साथ रचनात्मक उत्पाद बनाने के लिए एआई के उपयोग के नए रास्ते खोलता है। यह दृश्य तत्वों को रचनात्मक रूप से समझने और संयोजित करने में एआई की प्रगति को दर्शाता है।
व्हिस्क, गूगल और ओपनएआई सहित प्रमुख तकनीकी कंपनियों के बीच बढ़ते चलन का हिस्सा है, जो उपभोक्ता-केंद्रित एआई उपकरण विकसित करने का लक्ष्य रखते हैं, जिनका उद्देश्य चित्र, टेक्स्ट और वीडियो बनाने से लेकर नए रचनात्मक अनुभव प्रदान करना है। ओपनएआई ने हाल ही में सोरा नामक एक टेक्स्ट-टू-वीडियो जनरेटर भी पेश किया है, जो व्हिस्क के साथ सीधे प्रतिस्पर्धा करता है।
न्गोक आन्ह (सीएनएन, द वर्ज, जेडडीएनईटी के अनुसार)
[विज्ञापन_2]
स्रोत: https://www.congluan.vn/google-ra-mat-cong-cu-tao-hinh-anh-ai-tu-hinh-anh-that-post326441.html
टिप्पणी (0)