
গুগল আই/ও ২০২৫ ইভেন্টে, গুগল প্রযুক্তি জগৎকে চমকে দিয়েছে যখন তারা ভিও ৩ নামে একটি ভিডিও -জেনারেটিং এআই মডেল চালু করেছে, যা একটি বিতর্কিত ক্ষেত্রে একটি টেক জায়ান্টের জন্য একটি বড় পদক্ষেপ।
দ্য ভার্জের প্রতিবেদক অ্যালিসন জনসনের অভিজ্ঞতা অনুসারে, ভিও ৩-এর সবচেয়ে পরিশীলিত দিক হল সাউন্ড এফেক্ট, ব্যাকগ্রাউন্ড নয়েজ থেকে শুরু করে চরিত্রের সংলাপ পর্যন্ত প্রতিটি ভিডিওর জন্য মৌলিক অডিও তৈরি করার ক্ষমতা।
"Veo 3 আমার কাছে একেবারে 'আবর্জনা' AI কন্টেন্ট জেনারেটর বলে মনে হয়," দ্য ভার্জের প্রতিবেদক মন্তব্য করেছেন।
নতুন বৈশিষ্ট্য এবং চমকপ্রদ বাস্তবতা
"আমরা সৃজনশীলতার এক নতুন যুগে প্রবেশ করছি," গুগলের জেমিনি ভিপি জোশ উডওয়ার্ড ভিও ৩ লঞ্চের মূল ভাষণে ব্যাখ্যা করেন, "অতি-বাস্তববাদী" ভিডিও তৈরির ক্ষমতা তুলে ধরেন।
জনসন প্রথমে সন্দেহবাদী ছিলেন, কিন্তু নিজের জন্য AI টুলটি অভিজ্ঞতার পর, তিনি নিশ্চিত হন যে উডওয়ার্ড অতিরঞ্জিত করছেন না। Veo 3 এমন পণ্য তৈরি করতে সক্ষম যা ভয়ঙ্করভাবে বাস্তবসম্মত।
বিশেষ করে, দ্য ভার্জের প্রতিবেদক একটি ছোট ভিডিও তৈরি করার চেষ্টা করেছিলেন যেখানে একজন সংবাদ উপস্থাপক আগুন লাগার ঘোষণা দিচ্ছেন। ক্লিপটি অত্যন্ত বিশ্বাসযোগ্য, শব্দের মান এবং দৃশ্যপট যেকোনো ঐতিহ্যবাহী সংবাদ প্রতিবেদনের মতোই।
![]() |
ভিও ৩ দ্বারা নির্মিত একটি ভিডিওর একটি দৃশ্য। ছবি: দ্য ভার্জ। |
এর কিছুক্ষণ পরেই, পোস্টটিতে AI-উত্পাদিত চরিত্রদের ভিডিওগুলির একটি সিরিজ অন্তর্ভুক্ত ছিল যা AI-উত্পাদিত ভিডিও তৈরিতে ব্যবহৃত কমান্ডের বিরুদ্ধে প্রতিবাদ জানিয়েছিল, Reddit-এ ৫০,০০০ আপভোট পেয়েছিল। দৃশ্যগুলিতে একটি বিপর্যয়, ভেন্টিলেটরে হাসপাতালের বিছানায় শুয়ে থাকা একজন মহিলা এবং একটি চরিত্রকে বন্দুকের হুমকি দেওয়া অন্তর্ভুক্ত ছিল - সবই কথ্য সংলাপ এবং বাস্তবসম্মত পটভূমির শব্দ সহ।
অন্যান্য AI ভিডিও তৈরির সরঞ্জামগুলির তুলনায়, Veo 3 জিনিসগুলিকে অনেক সহজ করে তুলেছে। এর জন্য কেবল একটি মৌলিক কমান্ড, প্ল্যাটফর্মটি প্রক্রিয়া করার জন্য কয়েক মিনিট অপেক্ষা করা এবং Google এর AI Ultra প্ল্যানের সাবস্ক্রিপশন (প্রতি মাসে $249.99 ) প্রয়োজন।
জনসনের জন্য কম নির্দিষ্ট কমান্ড ব্যবহার করে ভিডিও তৈরি করা আরও সহজ ছিল, এবং এটি একটি বিষয়ের দিকে ইঙ্গিত করে: শিশুদের জন্য সবচেয়ে কম-সাধারণ-হর ধরনের YouTube কন্টেন্ট তৈরিতে Veo 3 উৎকৃষ্ট।
"নীরব চলচ্চিত্র যুগের" সমাপ্তি
আজ পর্যন্ত, কোনও AI ভিডিও জেনারেশন মডেল একই সাথে সিঙ্ক্রোনাইজড অডিও, অথবা ভিডিও আউটপুটের সাথে কোনও অডিও সরবরাহ করতে সক্ষম হয়নি। যাইহোক, ভিও 3 - এর সিঙ্ক্রোনাইজড অডিও জেনারেশন ক্ষমতা সহ - "নীরব যুগের" অবসান ঘটাতে চাইছে।
"আমরা ভিডিও তৈরির নীরব যুগ থেকে বেরিয়ে আসছি," গুগল ডিপমাইন্ডের সিইও ডেমিস হাসাবিস এক সংবাদ সম্মেলনে বলেন।
ভিডিও নির্মাতা সরঞ্জামের ব্যাপক প্রাপ্যতার কারণে বিক্রেতাদের সংখ্যা এতটাই বেড়েছে যে স্থানটি ক্রমশ পরিপূর্ণ হয়ে উঠছে।
রানওয়ে, লাইট্রিক্স, জেনমো, পিকা, হিগসফিল্ড, ক্লিং এবং লুমার মতো স্টার্টআপ থেকে শুরু করে ওপেনএআই এবং আলিবাবার মতো টেক জায়ান্ট পর্যন্ত, মডেলগুলি দ্রুত গতিতে প্রকাশিত হচ্ছে। অনেক ক্ষেত্রেই, এই মডেলগুলির মধ্যে খুব কম পার্থক্য রয়েছে।
ভিডিও মানের দিক থেকে Veo 3 OpenAI Sora কে ছাড়িয়ে যেতে পারবে কিনা তা এখনও স্পষ্ট নয়, তবে অডিও এবং ভিডিও উভয়ের মাধ্যমে সম্পূর্ণরূপে তৈরি ভিডিও আউটপুট করার ক্ষমতা অবিলম্বে Veo 3 কে আরও আকর্ষণীয় প্ল্যাটফর্ম করে তুলতে পারে।
![]() |
ভিও ৩ এর সবচেয়ে অসাধারণ বৈশিষ্ট্য হল ভিডিওর সাথে "নিখুঁতভাবে" সিঙ্ক্রোনাইজ করা শব্দ তৈরি করার ক্ষমতা। ছবি: গুগল। |
"চলচ্চিত্র এবং টেলিভিশনের জগতে , ব্যাকগ্রাউন্ড নয়েজ এবং সাউন্ড এফেক্ট প্রায়শই শিল্পীদের কাজ। এখন কল্পনা করুন, যদি আপনাকে কেবল ভিও-কে ব্যাকগ্রাউন্ডে আপনি যে শব্দটি চান এবং অ্যাকশনের সাথে সংযুক্ত করেন তা বর্ণনা করতে হয়, এবং এটি ভিডিও এবং সংলাপ সহ সবকিছুই আউটপুট করবে। এটি এমন কাজ যা অ্যানিমেটরদের করতে সপ্তাহ বা মাস সময় নেয়," জনসন মন্তব্য করেছিলেন।
যদি ভিও ৩ আসলেই কমান্ড এবং ধারাবাহিক ভিডিও এবং অডিও আউটপুট ঘন্টা অনুসরণ করতে পারে, তাহলে খুব বেশি সময় লাগবে না যে আমরা সম্পূর্ণরূপে এআই ব্যবহার করে তৈরি প্রথম অ্যানিমেটেড ফিচার ফিল্মটি তৈরি করতে পারব।
ভিও ৩ চালু হওয়ার পরপরই, নির্মাতারা এক্সের মতো প্ল্যাটফর্মগুলিতে ক্লিপগুলি ভাগ করে নেওয়া শুরু করেন, যার মধ্যে একটি স্ট্যান্ড-আপ কমেডি ভিডিওও ছিল যা সম্পূর্ণরূপে এআই দিয়ে তৈরি করা হয়েছিল। দর্শকরা জেনে অবাক হয়েছিলেন যে ভয়েসওভার, ভিডিও এবং এমনকি দর্শকদের অডিও সহ পুরো দৃশ্যটি কেবল একটি টেক্সট বর্ণনা থেকে তৈরি করা হয়েছিল।
এরপর আরেকটি ভাইরাল ক্লিপ আছে যেখানে পিথাগোরাস তার বিখ্যাত উপপাদ্য ব্যাখ্যা করে পুনঃনির্মাণ করেছেন, যা প্রাচীন প্রেক্ষাপট এবং সঠিক সংলাপ সহ সম্পূর্ণ। এমনকি একটি মিউজিক ভিডিওও রয়েছে যা সম্পূর্ণরূপে Veo 3 দ্বারা তৈরি, যেখানে ভিজ্যুয়াল এবং সঙ্গীত নিখুঁতভাবে সমন্বয় করা হয়েছে।
ইকোনমিক টাইমস মন্তব্য করেছে যে এই ধরণের প্রযুক্তিকে "চলচ্চিত্র নির্মাণের একটি নতুন যুগ" বলা যেতে পারে, যা স্বতন্ত্র নির্মাতা থেকে শুরু করে প্রধান মিডিয়া স্টুডিও পর্যন্ত - যে কেউ কম খরচে এবং ন্যূনতম সম্পদে পেশাদার সামগ্রী তৈরি করতে সক্ষম করে।
সূত্র: https://znews.vn/ac-mong-tu-ai-tao-video-moi-cua-google-post1556018.html












মন্তব্য (0)