এআই জেনারেশন টুলগুলি ক্রমবর্ধমানভাবে বিকশিত হচ্ছে, যা ব্যবহারকারীদের বর্ণনামূলক পাঠ্য থেকে উচ্চমানের নিবন্ধ, ছবি, সঙ্গীত এবং ভিডিও তৈরি করতে সাহায্য করে।
টেক জায়ান্টদের মধ্যে প্রতিযোগিতা ক্রমশ তীব্রতর হচ্ছে। মে মাসের শেষে, গুগল ভিও ৩ চালু করেছে, যা সিঙ্ক্রোনাইজড লিপ-সিঙ্কিং এবং স্বয়ংক্রিয় ভয়েসওভারের মাধ্যমে ভিডিও তৈরি করতে সক্ষম।
ছাড়িয়ে যাওয়ার কথা নয়, OpenAI Sora 2 প্রকাশ করেছে, যা ২০২৪ সালের ফেব্রুয়ারিতে চালু হওয়া টুলের একটি আপগ্রেড সংস্করণ।
সোরা ২ পদার্থবিদ্যার সূত্রের নির্ভুল সিমুলেশনের জন্য আলাদা, যা গতি এবং মিথস্ক্রিয়া দৃশ্যগুলিকে জীবন্ত করে তোলে। উল্লেখযোগ্যভাবে, সর্বোচ্চ ভিডিও দৈর্ঘ্য ১০ সেকেন্ড, যা ভিও ৩ (৮ সেকেন্ড) এর চেয়ে সামান্য বেশি।
সোরা ২ দ্বারা বিভিন্ন স্টাইলে তৈরি ভিডিও (ভিডিও: ওপেনএআই)।
ছবি রেন্ডারিং ক্ষমতা ছাড়াও, সোরা ২ ব্যাকগ্রাউন্ড সাউন্ড তৈরি, চরিত্র সংলাপকে একীভূত করে এবং ভিয়েতনামী সহ একাধিক ভাষা সমর্থন করে।
আরেকটি উল্লেখযোগ্য বৈশিষ্ট্য হল ক্যামিও বৈশিষ্ট্য: ব্যবহারকারীদের মুখ এবং কণ্ঠস্বরের একটি ছোট ভিডিও ক্লিপ আপলোড করে, ব্যবহারকারীরা সরাসরি AI দ্বারা তৈরি একটি ভিডিওতে "রূপান্তরিত" হতে পারেন।

ব্যবহারকারীর নমুনা ভিডিও ব্যবহার করে, Sora 2 এগুলিকে AI-উত্পাদিত ভিডিওগুলিতে একীভূত করতে পারে (ছবি: OpenAI)।
ওপেনএআই-এর সিইও স্যাম অল্টম্যান, সোরা ২-কে "এখন পর্যন্ত তৈরি করা সবচেয়ে শক্তিশালী কল্পনা-গঠনকারী হাতিয়ার" বলে অভিহিত করেছেন, এবং আশা করছেন যে এটি মানুষকে বিনোদনমূলক ভিডিও, বিজ্ঞাপন বা শৈল্পিক ধারণা তৈরি করতে সাহায্য করবে।
তবে, ফেস-ইনসার্শন বৈশিষ্ট্যটি বিভ্রান্তিকর বা আপত্তিকর সামগ্রী তৈরিতে এর অপব্যবহার নিয়েও উদ্বেগ প্রকাশ করেছে। ওপেনএআই জানিয়েছে যে তারা কঠোর সেন্সরশিপ বাস্তবায়ন করবে এবং এআই-উত্পাদিত সামগ্রী সনাক্ত করতে ভিডিওগুলিকে "সোরা" দিয়ে লেবেল করবে।
সোরা ২ (ভিডিও: ওপেনএআই) দ্বারা তৈরি ভিডিওগুলিতে সিইও স্যাম অল্টম্যানকে সুপারপোজ করা হয়েছে।
বর্তমানে, সোরা 2 মার্কিন যুক্তরাষ্ট্র এবং কানাডায় iOS-এ সীমিত পরীক্ষামূলকভাবে চলছে, পরীক্ষার পর অ্যান্ড্রয়েড এবং অন্যান্য দেশে সম্প্রসারণের পরিকল্পনা রয়েছে।
সূত্র: https://dantri.com.vn/cong-nghe/video-va-am-thanh-an-tuong-tu-cong-cu-ai-moi-cua-openai-20251002125910913.htm






মন্তব্য (0)