
गूगल आई/ओ 2025 इवेंट में, गूगल ने वीओ 3 नामक अपने एआई वीडियो निर्माण मॉडल को पेश करके तकनीकी जगत को चौंका दिया, जो इस तकनीकी दिग्गज के लिए एक अत्यधिक विवादास्पद क्षेत्र में एक बड़ा कदम है।
द वर्ज की रिपोर्टर एलिसन जॉनसन के अनुसार, वीओ 3 का सबसे परिष्कृत पहलू प्रत्येक वीडियो के लिए मूल ऑडियो बनाने की इसकी क्षमता है, जिसमें ध्वनि प्रभाव और पृष्ठभूमि शोर से लेकर पात्रों के संवाद तक शामिल हैं।
"वीओ 3 ने मुझे एक ऐसी मशीन के रूप में प्रभावित किया जो बिल्कुल 'बेकार' एआई सामग्री बनाती है," द वर्ज के एक रिपोर्टर ने टिप्पणी की।
नई विशेषताएं और चौंकाने वाला यथार्थवाद।
गूगल के जेमिनी उपाध्यक्ष जोश वुडवर्ड ने अपने वीओ 3 लॉन्च प्रेजेंटेशन में बताया, "हम रचनात्मकता के एक नए युग में प्रवेश कर रहे हैं," और इसकी "बेहद यथार्थवादी" वीडियो बनाने की क्षमता पर प्रकाश डाला।
जॉनसन को शुरू में संदेह था, लेकिन एआई टूल का व्यक्तिगत अनुभव करने के बाद, उन्होंने पुष्टि की कि वुडवर्ड की बात में कोई अतिशयोक्ति नहीं थी। Veo 3 बेहद यथार्थवादी उत्पाद बनाने में सक्षम है।
विशेष रूप से, द वर्ज के एक रिपोर्टर ने एक समाचार एंकर द्वारा आग लगने की घोषणा करते हुए एक छोटा वीडियो बनाने की कोशिश की। यह क्लिप अविश्वसनीय रूप से विश्वसनीय थी, जिसमें ध्वनि और दृश्य किसी भी पारंपरिक समाचार प्रसारण के समान थे।
![]() |
Veo 3 द्वारा बनाए गए एक वीडियो का एक दृश्य। फोटो: द वर्ज। |
इसके तुरंत बाद, एआई द्वारा निर्मित पात्रों के वीडियो की एक श्रृंखला वाली पोस्ट, जिसमें एआई-संचालित वीडियो बनाने के लिए उपयोग किए गए आदेशों का विरोध किया गया था, को रेडिट पर 50,000 लाइक मिले। दृश्यों में एक आपदा, अस्पताल के बिस्तर पर सांस लेने के लिए ट्यूब का उपयोग करती एक महिला और एक पात्र को बंदूक से धमकाया जाना शामिल था - सभी में संवाद और यथार्थवादी पृष्ठभूमि ध्वनियां थीं।
अन्य एआई वीडियो निर्माण उपकरणों की तुलना में, Veo 3 ने चीजों को बहुत सरल बना दिया है। इसके लिए केवल एक बुनियादी कमांड, प्लेटफॉर्म द्वारा प्रोसेसिंग के लिए कुछ मिनट और Google के AI अल्ट्रा प्लान ( 249.99 डॉलर प्रति माह) की सदस्यता की आवश्यकता होती है।
जॉनसन को कम विशिष्ट कमांड का उपयोग करके वीडियो बनाना भी आसान लगा, और इससे एक बात साबित होती है: Veo 3 बच्चों के लिए सबसे सरल YouTube सामग्री बनाने में माहिर है।
मूक फिल्म युग का अंत
आज तक, कोई भी एआई वीडियो निर्माण मॉडल वीडियो आउटपुट के साथ एक साथ सिंक्रनाइज़्ड ऑडियो या किसी भी प्रकार का ऑडियो प्रदान करने में सक्षम नहीं रहा है। हालांकि, सिंक्रनाइज़्ड ऑडियो बनाने की क्षमता के साथ, Veo 3 "मूक फिल्म युग" को समाप्त करने का लक्ष्य रखता है।
"हम वीडियो निर्माण के मौन युग से बाहर निकल रहे हैं," गूगल डीपमाइंड के सीईओ डेमिस हसाबिस ने एक प्रेस कॉन्फ्रेंस में कहा।
वीडियो क्रिएटर बनाने के लिए उपकरणों की व्यापक उपलब्धता के कारण विक्रेताओं की संख्या में भारी वृद्धि हुई है, जिससे यह क्षेत्र संतृप्त होता जा रहा है।
रनवे, लाइट्रिक्स, जेनमो, पिका, हिग्सफील्ड, क्लिंग और लूमा जैसे स्टार्टअप से लेकर ओपनएआई और अलीबाबा जैसी तकनीकी दिग्गज कंपनियों तक, मॉडल तेजी से लॉन्च हो रहे हैं। कई मामलों में, इन मॉडलों में बहुत कम अंतर है।
यह अभी स्पष्ट नहीं है कि वीडियो गुणवत्ता के मामले में Veo 3, OpenAI Sora को पीछे छोड़ पाएगा या नहीं। हालांकि, केवल छवि और ध्वनि सहित पूरी तरह से निर्मित वीडियो क्लिप निर्यात करने की क्षमता ही Veo 3 को तुरंत एक अधिक आकर्षक प्लेटफॉर्म बना सकती है।
![]() |
Veo 3 की सबसे खास बात यह है कि यह वीडियो के साथ ऑडियो को बिल्कुल सटीक रूप से सिंक्रनाइज़ कर सकता है। चित्र: गूगल। |
"फिल्म और टेलीविजन की दुनिया में, बैकग्राउंड नॉइज़ और साउंड इफ़ेक्ट आमतौर पर कलाकारों का काम होते हैं। ज़रा सोचिए, अगर आपको सिर्फ़ Veo को बैकग्राउंड में और एक्शन से जुड़े साउंड के बारे में बताना हो, और वो वीडियो और डायलॉग समेत सब कुछ आउटपुट कर दे। ऐसा काम करने में एनिमेटर्स को हफ़्तों या महीनों लग जाते हैं," जॉनसन ने टिप्पणी की।
अगर Veo 3 सचमुच आदेशों का पालन कर सकता है और घंटों तक लगातार वीडियो और ऑडियो आउटपुट दे सकता है, तो वह दिन दूर नहीं जब हमारे पास पूरी तरह से AI द्वारा निर्मित पहली एनिमेटेड फिल्म होगी।
Veo 3 के रिलीज़ होते ही, रचनाकारों ने X जैसे प्लेटफॉर्म पर क्लिप साझा करना शुरू कर दिया, जिनमें सबसे उल्लेखनीय एक स्टैंड-अप कॉमेडी वीडियो था जिसे पूरी तरह से AI द्वारा बनाया गया था। दर्शकों को यह जानकर आश्चर्य हुआ कि वॉयसओवर, वीडियो और यहां तक कि दर्शकों की आवाज़ सहित पूरा दृश्य एक ही लिखित कमांड से उत्पन्न हुआ था।
फिर, एक और वीडियो वायरल हुआ, जिसमें पाइथागोरस को उनके प्रसिद्ध प्रमेय को समझाते हुए दिखाया गया था, जिसमें प्राचीन परिवेश और सटीक संवाद का इस्तेमाल किया गया था। यहां तक कि वीओ 3 द्वारा निर्मित एक संगीत वीडियो भी था, जिसमें दृश्य और संगीत दोनों पूरी तरह से सिंक्रनाइज़ थे।
द इकोनॉमिक टाइम्स ने टिप्पणी की कि इस प्रकार की तकनीक को "फिल्म निर्माण का एक नया युग" कहा जा सकता है, जो व्यक्तिगत रचनाकारों से लेकर बड़े मीडिया स्टूडियो तक किसी को भी कम लागत और न्यूनतम संसाधनों के साथ पेशेवर सामग्री का निर्माण करने की अनुमति देता है।
स्रोत: https://znews.vn/ac-mong-tu-ai-tao-video-moi-cua-google-post1556018.html








टिप्पणी (0)