জেনারেটিভ এআই টুলগুলি বিস্ফোরিত হচ্ছে, যা ব্যবহারকারীদের বর্ণনামূলক পাঠ্য থেকে তীক্ষ্ণ নিবন্ধ, ছবি, সঙ্গীত এবং ভিডিও তৈরি করতে সাহায্য করছে।
টেক জায়ান্টদের মধ্যে প্রতিযোগিতা ক্রমশ তীব্র হচ্ছে। মে মাসের শেষে, গুগল লিপ-সিঙ্ক করা ভিডিও এবং স্বয়ংক্রিয় ভয়েসওভার তৈরির ক্ষমতা সহ ভিও ৩ চালু করেছে।
ছাড়িয়ে যাওয়ার কথা নয়, OpenAI Sora 2 প্রকাশ করেছে, যা ২০২৪ সালের ফেব্রুয়ারিতে চালু হওয়া টুলের একটি আপগ্রেড সংস্করণ।
পদার্থবিদ্যার সূত্রের নির্ভুল সিমুলেশনের জন্য সোরা ২ আলাদাভাবে দাঁড়িয়ে আছে, যা চলমান এবং ইন্টারেক্টিভ দৃশ্যগুলিকে জীবন্ত করে তোলে। বিশেষ করে, সর্বোচ্চ ভিডিও দৈর্ঘ্য ১০ সেকেন্ড, যা ভিও ৩ (৮ সেকেন্ড) এর চেয়ে সামান্য বেশি।
সোরা ২ দ্বারা বিভিন্ন স্টাইলে তৈরি ভিডিও (ভিডিও: ওপেনএআই)।
ছবি রেন্ডারিং ক্ষমতা ছাড়াও, সোরা ২ ব্যাকগ্রাউন্ড সাউন্ড তৈরি, চরিত্র সংলাপকে একীভূত করে এবং ভিয়েতনামী সহ অনেক ভাষা সমর্থন করে।
আরেকটি উল্লেখযোগ্য বৈশিষ্ট্য হল ক্যামিও বৈশিষ্ট্য: আপনার মুখ এবং কণ্ঠস্বর রেকর্ড করে একটি ছোট ভিডিও আপলোড করুন, এবং ব্যবহারকারীরা সরাসরি AI-উত্পাদিত ভিডিওতে "রূপান্তরিত" হতে পারবেন।

ব্যবহারকারীদের নমুনা ভিডিও থেকে, Sora 2 সেগুলিকে AI-জেনারেটেড ভিডিওতে একত্রিত করতে পারে (ছবি: OpenAI)।
ওপেনএআই-এর সিইও স্যাম অল্টম্যান, সোরা ২-কে "এখন পর্যন্ত তৈরি করা সবচেয়ে শক্তিশালী কল্পনাশক্তি তৈরির হাতিয়ার" বলে অভিহিত করেছেন, যা মানুষকে বিনোদনমূলক ভিডিও, বিজ্ঞাপন বা শৈল্পিক ধারণা তৈরি করতে সাহায্য করবে বলে আশা করছেন।
তবে, ফেস-ইনজেকশন বৈশিষ্ট্যটি উদ্বেগ প্রকাশ করে যে বিভ্রান্তিকর বা আপত্তিকর সামগ্রী তৈরিতে এর অপব্যবহার হতে পারে। ওপেনএআই জানিয়েছে যে এটি কৃত্রিম বুদ্ধিমত্তা-উত্পাদিত ভিডিওগুলি সনাক্ত করতে কঠোর সংযম প্রয়োগ করবে এবং "সোরা" লেবেল করবে।
সোরা ২ (ভিডিও: ওপেনএআই) দ্বারা তৈরি ভিডিওগুলির উপর সিইও স্যাম অল্টম্যানকে সুপারইম্পোজ করা হয়েছে।
সোরা ২ বর্তমানে মার্কিন যুক্তরাষ্ট্র এবং কানাডায় iOS-এ সীমিত পরীক্ষামূলকভাবে চলছে, পরীক্ষার পর অ্যান্ড্রয়েড এবং অন্যান্য দেশে সম্প্রসারণের পরিকল্পনা রয়েছে।
সূত্র: https://dantri.com.vn/cong-nghe/video-va-am-thanh-an-tuong-tu-cong-cu-ai-moi-cua-openai-20251002125910913.htm
মন্তব্য (0)