CNBC এর মতে, OpenAI সম্প্রতি Sora চালু করেছে - একটি পরবর্তী প্রজন্মের AI মডেল যা তাদের পূর্ববর্তী DALL-E ইমেজ-জেনারেটিং AI টুলের মতোই কাজ করে। ব্যবহারকারীদের কেবল পছন্দসই দৃশ্য ইনপুট করতে হবে এবং Sora একটি উচ্চ-রেজোলিউশনের ভিডিও ক্লিপ ফিরিয়ে দেবে। Sora স্থির চিত্র দ্বারা অনুপ্রাণিত ভিডিও ক্লিপ তৈরি করতে এবং বিদ্যমান ভিডিওগুলি প্রসারিত করতে বা অনুপস্থিত ফ্রেমগুলি পূরণ করতে পারে।
এআই-জেনারেটেড ভিডিওতে, রাতে নিয়ন আলোয় শহর জুড়ে সামোয়েড এবং গোল্ডেন রিট্রিভার কুকুরের আনন্দ।
সৃজনশীল AI-এর জন্য ভিডিও তৈরি হতে পারে পরবর্তী বড় পদক্ষেপ, কিছুদিন আগে চ্যাটবট এবং ইমেজ জেনারেটর গ্রাহক এবং ব্যবসায়িক জগতে প্রবেশ করার পর। কন্টেন্ট তৈরি AI-এর উৎসাহীদের উত্তেজিত করলেও, এই নতুন প্রযুক্তিগুলি বিশ্বব্যাপী রাজনৈতিক নির্বাচনের সময় যত এগিয়ে আসছে, ভুল তথ্যের বিষয়ে গুরুতর উদ্বেগ তৈরি করছে। মেশিন লার্নিং কোম্পানি ক্ল্যারিটির তথ্য অনুসারে, AI-এর মাধ্যমে তৈরি ডিপফেকের সংখ্যা বছরের পর বছর ৯০০% বৃদ্ধি পেয়েছে।
সোরার মাধ্যমে, ওপেনএআই গুগল এবং মেটার মতো কোম্পানিগুলির ভিডিও-জেনারেটিং এআই টুলগুলির সাথে প্রতিযোগিতা করার চেষ্টা করছে। স্ট্যাবিলিটি এআই-এর মতো অন্যান্য স্টার্টআপগুলিতেও অনুরূপ এআই টুল পাওয়া যায়, যার একটি পণ্য রয়েছে স্টেবল ভিডিও ডিফিউশন। অ্যামাজন ক্রিয়েট উইথ অ্যালেক্সাও প্রকাশ করেছে, যা একটি মডেল যা কমান্ডের উপর ভিত্তি করে শিশুদের জন্য স্বল্প-ফর্ম অ্যানিমেটেড কন্টেন্ট তৈরিতে বিশেষজ্ঞ।
সোরা বর্তমানে এক মিনিট বা তার কম দৈর্ঘ্যের ভিডিও তৈরির মধ্যেই সীমাবদ্ধ। ওপেনএআই মাল্টিমোডালিটি, একটি পদ্ধতি যা টেক্সট, ছবি এবং ভিডিও তৈরির সমন্বয় করে, একটি লক্ষ্য তৈরি করেছে যাতে এআই মডেলের একটি বিস্তৃত সেট প্রদান করা যায়।
এখনও পর্যন্ত, সোরা কেবলমাত্র নিরাপত্তা পরীক্ষকদের একটি ছোট দল, বা "রেড টিম"-এর জন্য উপলব্ধ করা হয়েছে, যাদের ভুল তথ্যের মতো ক্ষেত্রে দুর্বলতার জন্য মডেলটি পরীক্ষা করার দায়িত্ব দেওয়া হয়েছে। কোম্পানিটি তার ওয়েবসাইটে উপলব্ধ 10টি নমুনা ক্লিপ ছাড়া আর কোনও পাবলিক ডেমো প্রকাশ করেনি এবং এটি বলেছে যে এর সাথে থাকা প্রযুক্তিগত ডকুমেন্টেশন শীঘ্রই প্রকাশ করা হবে।
ওপেনএআই আরও বলেছে যে তারা একটি "ডিটেকশন ক্লাসিফায়ার" তৈরি করছে যা সোরা-জেনারেটেড ভিডিও ক্লিপগুলি সনাক্ত করতে পারে এবং এআই-জেনারেটেড কন্টেন্ট সনাক্ত করতে সহায়তা করার জন্য আউটপুটে নির্দিষ্ট মেটাডেটা অন্তর্ভুক্ত করার পরিকল্পনা করছে। এআই-জেনারেটেড ছবিগুলি সনাক্ত করতে মেটা এই ধরণের মেটাডেটা ব্যবহার করতে চাইছে।
সোরা হল একটি এআই মডেল যা ট্রান্সফরমার আর্কিটেকচার ব্যবহার করে যা গুগল গবেষকরা ২০১৭ সালে একটি গবেষণাপত্রে প্রবর্তন করেছিলেন। ওপেনএআই তার ঘোষণায় বলেছে যে সোরা এমন মডেলগুলির ভিত্তি হিসেবে কাজ করে যা বাস্তব জগৎকে বোঝে এবং অনুকরণ করে।
[বিজ্ঞাপন_২]
উৎস লিঙ্ক






মন্তব্য (0)