
গুগল আই/ও ২০২৫ ইভেন্টে, গুগল তার ভিও ৩ (Veo 3) নামক এআই ভিডিও তৈরির মডেলটি উন্মোচন করে প্রযুক্তি বিশ্বকে চমকে দিয়েছে, যা এই প্রযুক্তি জায়ান্টের জন্য একটি অত্যন্ত বিতর্কিত ক্ষেত্রে একটি বড় পদক্ষেপ হিসেবে চিহ্নিত হয়েছে।
দ্য ভার্জ-এর প্রতিবেদক অ্যালিসন জনসনের মতে, ভিও ৩-এর সবচেয়ে অত্যাধুনিক দিক হলো প্রতিটি ভিডিওর জন্য নিজস্ব অডিও তৈরি করার ক্ষমতা, যা সাউন্ড ইফেক্ট ও পারিপার্শ্বিক কোলাহল থেকে শুরু করে চরিত্রের সংলাপ পর্যন্ত বিস্তৃত।
"ভিও ৩ আমাকে এমন একটি যন্ত্র হিসেবে মুগ্ধ করেছে যা পুরোপুরি 'আবর্জনা' এআই কন্টেন্ট তৈরি করে," মন্তব্য করেছেন দ্য ভার্জ-এর একজন প্রতিবেদক।
নতুন বৈশিষ্ট্য এবং চমকপ্রদ বাস্তবতা।
"আমরা সৃজনশীলতার এক নতুন যুগে প্রবেশ করছি," ভিও ৩-এর উদ্বোধনী উপস্থাপনায় এর "অত্যন্ত বাস্তবসম্মত" ভিডিও তৈরির ক্ষমতার ওপর আলোকপাত করে ব্যাখ্যা করেন গুগলের জেমিনি ভাইস প্রেসিডেন্ট জশ উডওয়ার্ড।
জনসন প্রথমে সন্দিহান ছিলেন, কিন্তু ব্যক্তিগতভাবে এআই টুলটি ব্যবহার করার পর তিনি নিশ্চিত হন যে উডওয়ার্ড অতিরঞ্জিত করেননি। ভিও ৩ ভয়ংকর রকমের বাস্তবসম্মত পণ্য তৈরি করতে সক্ষম।
বিশেষ করে, ‘দ্য ভার্জ’-এর একজন রিপোর্টার একজন সংবাদ উপস্থাপকের আগুন লাগার ঘোষণা দেওয়ার একটি সংক্ষিপ্ত ভিডিও তৈরি করার চেষ্টা করেছিলেন। ক্লিপটি ছিল অত্যন্ত বিশ্বাসযোগ্য, যার শব্দ ও দৃশ্য যেকোনো প্রচলিত সংবাদ সম্প্রচারের মতোই ছিল।
![]() |
Veo 3 দ্বারা নির্মিত একটি ভিডিওর দৃশ্য। ছবি: দ্য ভার্জ। |
এর কিছুক্ষণ পরেই, পোস্টটি রেডিটে ৫০,০০০ লাইক পায়। পোস্টটিতে এমন কিছু ভিডিও ছিল, যেখানে এআই-চালিত চরিত্ররা ভিডিওগুলো তৈরির জন্য ব্যবহৃত কমান্ডের প্রতিবাদ করছিল। দৃশ্যগুলোর মধ্যে ছিল একটি দুর্যোগ, হাসপাতালের বিছানায় শ্বাস-প্রশ্বাসের নল ব্যবহার করা এক নারী, এবং বন্দুক দিয়ে হুমকি দেওয়া একটি চরিত্র—সবকিছুতেই ছিল সংলাপ এবং বাস্তবসম্মত আবহ সঙ্গীত।
অন্যান্য এআই ভিডিও তৈরির টুলের তুলনায়, Veo 3 কাজটিকে অনেক সহজ করে দিয়েছে। এর জন্য প্রয়োজন শুধু একটি সাধারণ কমান্ড, প্ল্যাটফর্মটির প্রসেস করার জন্য কয়েক মিনিট সময় এবং গুগলের এআই আল্ট্রা প্ল্যানের (প্রতি মাসে ২৪৯.৯৯ ডলার ) একটি সাবস্ক্রিপশন।
জনসনের কাছে আরও কম সুনির্দিষ্ট কমান্ড ব্যবহার করে ভিডিও তৈরি করা আরও সহজ মনে হয়েছে, এবং এটি একটি বিষয় প্রমাণ করে: শিশুদের জন্য সবচেয়ে সহজবোধ্য ইউটিউব কন্টেন্ট তৈরিতে ভিও ৩ বিশেষভাবে পারদর্শী।
“নীরব চলচ্চিত্র যুগের” অবসান
আজ পর্যন্ত, কোনো এআই ভিডিও তৈরির মডেলই একই সাথে সিঙ্ক্রোনাইজড অডিও, বা ভিডিও আউটপুটের সাথে কোনো ধরনের অডিও সরবরাহ করতে সক্ষম হয়নি। তবে, সিঙ্ক্রোনাইজড অডিও তৈরির সক্ষমতা নিয়ে Veo 3 “নীরব চলচ্চিত্রের যুগের” অবসান ঘটাতে চাইছে।
"আমরা ভিডিও নির্মাণের নীরব যুগ থেকে বেরিয়ে আসছি," একটি সংবাদ সম্মেলনে বলেছেন গুগল ডিপমাইন্ডের সিইও ডেমিস হাসাবিস।
ভিডিও তৈরির সরঞ্জামগুলোর ব্যাপক সহজলভ্যতার ফলে বিক্রেতার সংখ্যা এমনভাবে বেড়েছে যে এই ক্ষেত্রটি এখন সম্পৃক্ত হয়ে পড়ছে।
রানওয়ে, লাইটরিক্স, জেনমো, পিকা, হিগসফিল্ড, ক্লিঙ এবং লুমার মতো স্টার্টআপ থেকে শুরু করে ওপেনএআই এবং আলিবাবার মতো প্রযুক্তি জায়ান্ট পর্যন্ত, দ্রুত গতিতে মডেল প্রকাশ করা হচ্ছে। অনেক ক্ষেত্রে, এই মডেলগুলোর মধ্যে খুব সামান্যই পার্থক্য থাকে।
ভিডিওর গুণমানের দিক থেকে Veo 3, OpenAI Sora-কে ছাড়িয়ে যেতে পারবে কি না, তা এখনও স্পষ্ট নয়। তবে, ছবি ও শব্দ উভয়সহ সম্পূর্ণ ভিডিও ক্লিপ রপ্তানি করার সক্ষমতাই Veo 3-কে তাৎক্ষণিকভাবে আরও আকর্ষণীয় একটি প্ল্যাটফর্ম করে তুলতে পারে।
![]() |
Veo 3-এর সবচেয়ে উল্লেখযোগ্য বৈশিষ্ট্য হলো ভিডিওর সাথে ‘নিখুঁত’ সিঙ্ক্রোনাইজড অডিও তৈরি করার ক্ষমতা। ছবি: গুগল। |
চলচ্চিত্র ও টেলিভিশনের জগতে , আবহের শব্দ এবং সাউন্ড ইফেক্ট সাধারণত শিল্পীদের কাজ। এখন, কল্পনা করুন তো, যদি আপনাকে শুধু ভিও-কে (Veo) বর্ণনা করতে হতো যে আপনি পটভূমিতে কী ধরনের শব্দ চান এবং তা দৃশ্যের সাথে কীভাবে যুক্ত থাকবে, আর এটি ভিডিও এবং সংলাপসহ সবকিছুই তৈরি করে দিত। এই কাজটি সম্পন্ন করতে অ্যানিমেটরদের সপ্তাহ বা মাস লেগে যায়," জনসন মন্তব্য করেন।
যদি Veo 3 সত্যিই নির্দেশ অনুসরণ করতে পারে এবং ঘণ্টার পর ঘণ্টা ধরে একটানা ভিডিও ও অডিও তৈরি করতে পারে, তবে সম্পূর্ণভাবে এআই দিয়ে তৈরি প্রথম অ্যানিমেটেড চলচ্চিত্রটি পেতে বেশি দেরি হবে না।
Veo 3 মুক্তি পাওয়ার পরপরই, নির্মাতারা X-এর মতো প্ল্যাটফর্মে ক্লিপ শেয়ার করতে শুরু করেন, যার মধ্যে সবচেয়ে উল্লেখযোগ্য ছিল সম্পূর্ণভাবে এআই দ্বারা নির্মিত একটি স্ট্যান্ড-আপ কমেডি ভিডিও। দর্শকরা এটা জেনে অবাক হয়েছিলেন যে, ভয়েসওভার, ভিডিও এবং এমনকি দর্শকদের আওয়াজসহ পুরো দৃশ্যটি শুধুমাত্র একটি লিখিত নির্দেশ থেকেই তৈরি হয়েছিল।
এরপর, আরেকটি ক্লিপ ভাইরাল হয়, যেখানে পিথাগোরাসকে তাঁর বিখ্যাত উপপাদ্যটি ব্যাখ্যা করতে দেখা যায়, সাথে ছিল প্রাচীন প্রেক্ষাপট এবং নির্ভুল সংলাপ। এমনকি ভিও ৩ (Veo 3) দিয়ে সম্পূর্ণভাবে নির্মিত একটি মিউজিক ভিডিও-ও ছিল, যেখানে দৃশ্য এবং সঙ্গীত উভয়ই নিখুঁতভাবে সিঙ্ক্রোনাইজ করা হয়েছিল।
ইকোনমিক টাইমস মন্তব্য করেছে যে, এই ধরনের প্রযুক্তিকে "চলচ্চিত্র নির্মাণের এক নতুন যুগ" বলা যেতে পারে, যা ব্যক্তিগত নির্মাতা থেকে শুরু করে বড় মিডিয়া স্টুডিও পর্যন্ত যে কাউকে স্বল্প খরচে এবং ন্যূনতম সম্পদ ব্যবহার করে পেশাদার মানের বিষয়বস্তু নির্মাণ করার সুযোগ করে দেয়।
উৎস: https://znews.vn/ac-mong-tu-ai-tao-video-moi-cua-google-post1556018.html













মন্তব্য (0)