
গুগল আই/ও ২০২৫ ইভেন্টে, গুগল প্রযুক্তি জগৎকে চমকে দিয়েছে যখন তারা ভিও ৩ নামে একটি ভিডিও -জেনারেটিং এআই মডেল চালু করেছে, যা একটি বিতর্কিত ক্ষেত্রে একটি টেক জায়ান্টের জন্য একটি বড় পদক্ষেপ।
দ্য ভার্জের প্রতিবেদক অ্যালিসন জনসনের অভিজ্ঞতা অনুসারে, ভিও ৩-এর সবচেয়ে পরিশীলিত দিক হল প্রতিটি ভিডিওর জন্য মৌলিক অডিও তৈরি করার ক্ষমতা, সাউন্ড এফেক্ট, ব্যাকগ্রাউন্ড নয়েজ থেকে শুরু করে চরিত্রের সংলাপ পর্যন্ত।
"Veo 3 আমার কাছে একেবারে 'আবর্জনা' AI কন্টেন্ট জেনারেটর বলে মনে হয়," দ্য ভার্জের প্রতিবেদক মন্তব্য করেছেন।
নতুন বৈশিষ্ট্য এবং চমকপ্রদ বাস্তবতা
"আমরা সৃজনশীলতার এক নতুন যুগে প্রবেশ করছি," গুগলের জেমিনি ভিপি জোশ উডওয়ার্ড ভিও ৩ লঞ্চের মূল ভাষণে ব্যাখ্যা করেন, "অতি-বাস্তবসম্মত" ভিডিও তৈরির ক্ষমতা তুলে ধরেন।
জনসন প্রথমে সন্দেহবাদী ছিলেন, কিন্তু নিজের জন্য AI টুলটি অভিজ্ঞতার পর, তিনি নিশ্চিত হন যে উডওয়ার্ড অতিরঞ্জিত করছেন না। Veo 3 এমন পণ্য তৈরি করতে সক্ষম যা ভয়ঙ্করভাবে বাস্তবসম্মত।
বিশেষ করে, দ্য ভার্জের প্রতিবেদক একটি ছোট ভিডিও তৈরি করার চেষ্টা করেছিলেন যেখানে একজন সংবাদ উপস্থাপক আগুন লাগার ঘোষণা দিচ্ছেন। ক্লিপটি অত্যন্ত বিশ্বাসযোগ্য, শব্দের মান এবং দৃশ্যপট যেকোনো ঐতিহ্যবাহী সংবাদ প্রতিবেদনের মতোই।
![]() |
ভিও ৩ দ্বারা নির্মিত একটি ভিডিওর একটি দৃশ্য। ছবি: দ্য ভার্জ। |
পোস্টটিতে, AI-উত্পাদিত চরিত্রদের দেখানো ভিডিওগুলির একটি সিরিজ অন্তর্ভুক্ত ছিল যা AI-উত্পাদিত ভিডিও তৈরিতে ব্যবহৃত কমান্ডের বিরুদ্ধে প্রতিবাদ জানিয়েছিল, তারপর থেকে Reddit-এ ৫০,০০০ আপভোট পেয়েছে। দৃশ্যগুলির মধ্যে রয়েছে একটি বিপর্যয়, ভেন্টিলেটরে হাসপাতালের বিছানায় শুয়ে থাকা একজন মহিলা এবং একটি চরিত্রকে বন্দুকের হুমকি দেওয়া - সবই কথ্য সংলাপ এবং বাস্তবসম্মত পটভূমির শব্দ সহ।
অন্যান্য AI ভিডিও তৈরির সরঞ্জামগুলির তুলনায়, Veo 3 জিনিসগুলিকে অনেক সহজ করে তুলেছে। এর জন্য কেবল একটি মৌলিক কমান্ড, প্ল্যাটফর্মটি প্রক্রিয়া করার জন্য কয়েক মিনিট অপেক্ষা করা এবং Google এর AI Ultra প্ল্যানের সাবস্ক্রিপশন (প্রতি মাসে $249.99 ) প্রয়োজন।
জনসনের জন্য কম নির্দিষ্ট কমান্ড ব্যবহার করে ভিডিও তৈরি করা আরও সহজ ছিল, এবং এটি একটি বিষয়ের দিকে ইঙ্গিত করে: শিশুদের জন্য সবচেয়ে কম-সাধারণ-হর ধরনের YouTube কন্টেন্ট তৈরিতে Veo 3 উৎকৃষ্ট।
"নীরব চলচ্চিত্র যুগের" সমাপ্তি
আজ পর্যন্ত, কোনও AI ভিডিও জেনারেশন মডেল একই সাথে সিঙ্ক্রোনাইজড অডিও, অথবা ভিডিও আউটপুটের সাথে কোনও অডিও সরবরাহ করতে সক্ষম হয়নি। যাইহোক, ভিও 3 - এর সিঙ্ক্রোনাইজড অডিও জেনারেশন ক্ষমতা সহ - "নীরব যুগের" অবসান ঘটাতে চাইছে।
"আমরা ভিডিও তৈরির নীরব যুগ থেকে বেরিয়ে আসছি," গুগল ডিপমাইন্ডের সিইও ডেমিস হাসাবিস এক সংবাদ সম্মেলনে বলেন।
ভিডিও নির্মাতা সরঞ্জামের ব্যাপক প্রাপ্যতার কারণে বিক্রেতাদের সংখ্যা এতটাই বেড়েছে যে স্থানটি ক্রমশ পরিপূর্ণ হয়ে উঠছে।
রানওয়ে, লাইট্রিক্স, জেনমো, পিকা, হিগসফিল্ড, ক্লিং এবং লুমার মতো স্টার্টআপ থেকে শুরু করে ওপেনএআই এবং আলিবাবার মতো টেক জায়ান্ট পর্যন্ত, মডেলগুলি দ্রুত গতিতে প্রকাশিত হচ্ছে। অনেক ক্ষেত্রেই, এই মডেলগুলির মধ্যে খুব কম পার্থক্য রয়েছে।
ভিডিও মানের দিক থেকে Veo 3 OpenAI Sora কে ছাড়িয়ে যেতে পারবে কিনা তা এখনও দেখার বিষয়, তবে অডিও এবং ভিডিও উভয়ের মাধ্যমে সম্পূর্ণরূপে তৈরি ভিডিও আউটপুট করার ক্ষমতা অবিলম্বে Veo 3 কে আরও আকর্ষণীয় প্ল্যাটফর্ম করে তুলতে পারে।
![]() |
ভিও ৩ এর সবচেয়ে অসাধারণ বৈশিষ্ট্য হল ভিডিওর সাথে "নিখুঁত" সিঙ্কে শব্দ তৈরি করার ক্ষমতা। ছবি: গুগল। |
"চলচ্চিত্র এবং টেলিভিশনের জগতে , ব্যাকগ্রাউন্ড নয়েজ এবং সাউন্ড এফেক্ট প্রায়শই শিল্পীদের কাজ। এখন কল্পনা করুন, যদি আপনাকে কেবল ভিও-কে ব্যাকগ্রাউন্ডে আপনি যে শব্দটি চান এবং অ্যাকশনের সাথে সংযুক্ত করেন তা বর্ণনা করতে হয়, এবং এটি ভিডিও এবং সংলাপ সহ সবকিছুই প্রকাশ করবে। এটি এমন একটি কাজ যা অ্যানিমেটররা সপ্তাহ বা মাস ব্যয় করবে," জনসন মন্তব্য করেছিলেন।
যদি ভিও ৩ আসলেই কমান্ড এবং ধারাবাহিক ভিডিও এবং অডিও আউটপুট ঘন্টা অনুসরণ করতে পারে, তাহলে খুব বেশি সময় লাগবে না যে আমরা সম্পূর্ণরূপে এআই ব্যবহার করে তৈরি প্রথম অ্যানিমেটেড ফিচার ফিল্মটি তৈরি করতে পারব।
ভিও ৩ চালু হওয়ার পরপরই, নির্মাতারা এক্সের মতো প্ল্যাটফর্মগুলিতে ক্লিপগুলি ভাগ করে নেওয়া শুরু করেন, যার মধ্যে একটি স্ট্যান্ড-আপ কমেডি ভিডিওও ছিল যা সম্পূর্ণরূপে এআই দিয়ে তৈরি করা হয়েছিল। দর্শকরা জেনে অবাক হয়েছিলেন যে ভয়েস, ভিডিও এবং এমনকি শ্রোতাদের অডিও সহ পুরো দৃশ্যটি কেবল একটি টেক্সট বর্ণনা থেকে তৈরি করা হয়েছিল।
এরপর আরেকটি ভাইরাল ক্লিপ আছে যেখানে পিথাগোরাস তার বিখ্যাত উপপাদ্য ব্যাখ্যা করে পুনঃনির্মাণ করেছেন, যা প্রাচীন প্রেক্ষাপট এবং সঠিক সংলাপ সহ সম্পূর্ণ। এমনকি একটি মিউজিক ভিডিওও রয়েছে যা সম্পূর্ণরূপে Veo 3 দ্বারা তৈরি, যেখানে ভিজ্যুয়াল এবং সঙ্গীত নিখুঁতভাবে সমন্বয় করা হয়েছে।
ইকোনমিক টাইমস মন্তব্য করেছে যে এই ধরণের প্রযুক্তিকে "চলচ্চিত্র নির্মাণের একটি নতুন যুগ" বলা যেতে পারে, যা স্বতন্ত্র নির্মাতা থেকে শুরু করে প্রধান মিডিয়া স্টুডিও পর্যন্ত - যে কেউ কম খরচে এবং ন্যূনতম সম্পদে পেশাদার সামগ্রী তৈরি করতে সক্ষম করে।
সূত্র: https://znews.vn/ac-mong-tu-ai-tao-video-moi-cua-google-post1556018.html
মন্তব্য (0)