বাইটড্যান্স -এর নতুন টুলটি আত্মবিশ্বাসের সাথে সকল প্রতিযোগীকে ছাড়িয়ে গেছে। ছবি: বাইটড্যান্স । |
টিকটক ও ডুইয়িনের মূল সংস্থা বাইটড্যান্স আনুষ্ঠানিকভাবে সিড্যান্স ১.০ উন্মোচন করেছে, যা টেক্সট ও ছবি থেকে ভিডিও তৈরি করতে সক্ষম একটি কৃত্রিম বুদ্ধিমত্তা (এআই) টুল। এআই-চালিত কন্টেন্ট তৈরির প্ল্যাটফর্ম তৈরির প্রতিযোগিতায় এই চীনা প্রযুক্তি জায়ান্টের জন্য এটিকে একটি গুরুত্বপূর্ণ পদক্ষেপ হিসেবে দেখা হচ্ছে।
কোম্পানিটি সম্প্রতি সিড্যান্স ১.০ (Seedance 1.0) নিয়ে একটি বিশদ গবেষণা প্রকাশ করেছে। গবেষণা অনুসারে, এই টুলটি বিশদ স্ক্রিপ্ট বা জটিল কমান্ডের প্রয়োজন ছাড়াই সাধারণ নির্দেশনাকে উচ্চ-মানের ভিডিওতে রূপান্তর করার জন্য ডিজাইন করা হয়েছে। এটি কেবল স্বতন্ত্র শটই পরিচালনা করে না, বরং একাধিক ক্যামেরা অ্যাঙ্গেলও একত্রিত করে, সাবলীল ট্রানজিশন নিশ্চিত করে এবং পুরো ভিডিও জুড়ে চরিত্রের সামঞ্জস্য বজায় রাখে।
“আমরা ভিডিওতে স্থানিক এবং কালিক তথ্য আলাদা করার একটি উপায় খুঁজে পেয়েছি। এই প্রযুক্তিটি অবস্থানকে ‘এনকোড’ করার জন্য একটি বিশেষ পদ্ধতি ব্যবহার করে, যা এআই-কে একই মডেলের মধ্যে টেক্সট এবং ছবি উভয় থেকেই ভিডিও তৈরি করতে শিখতে সাহায্য করে। এর ফলে, এআই স্বয়ংক্রিয়ভাবে এবং সাবলীলভাবে একাধিক ভিন্ন শট ব্যবহার করে ভিডিও তৈরি করতে পারে,” বাইটড্যান্স গবেষণা পত্রে এই কথা জানিয়েছে।
বাইটড্যান্স আত্মবিশ্বাসের সাথে দাবি করে যে, সিড্যান্স ১.০ বাজারে বিদ্যমান এআই ভিডিও তৈরির টুলগুলোকে ছাড়িয়ে গেছে, বিশেষ করে ব্যবহারকারীর ধারণা নিখুঁতভাবে অনুসরণ করার ক্ষমতা, ছবির তীক্ষ্ণতা এবং চরিত্রের স্বাভাবিক নড়াচড়ার ক্ষেত্রে।
এআই মডেলের কর্মক্ষমতা বিশ্লেষণ ও মূল্যায়নে বিশেষায়িত একটি প্ল্যাটফর্ম, আর্টিফিশিয়াল অ্যানালাইসিস-এর মতে, সিড্যান্স ১.০ গুগলের ভিও ৩, কুয়াইশৌ-এর ক্লিঙ ২.০ এবং ওপেনএআই-এর সোরা-র মতো অন্যান্য এআই ভিডিও তৈরির টুলকে ছাড়িয়ে গেছে। এই টুলটি টেক্সট-টু-ভিডিও এবং ইমেজ-টু-ভিডিও উভয় রূপান্তরের কাজেই উন্নততর কর্মক্ষমতা প্রদর্শন করেছে।
কোম্পানিটি আরও জানিয়েছে যে, সিড্যান্স ১.০-কে সর্বজনীনভাবে উপলব্ধ এবং লাইসেন্সপ্রাপ্ত উৎস থেকে সংগৃহীত ভিডিওর এক বিশাল ডেটাবেসের ওপর ভিত্তি করে প্রশিক্ষণ দেওয়া হয়েছে। সহিংস বা সংবেদনশীল বিষয়বস্তু বাদ দেওয়ার জন্য প্রশিক্ষণ ভিডিওগুলো একটি কঠোর ফিল্টারিং প্রক্রিয়ার মধ্য দিয়ে গেছে।
অনেকের মতে, এই ডেটা মূলত বাইটড্যান্স পরিচালিত দুটি প্ল্যাটফর্ম টিকটক এবং ডুইয়িন থেকে আসে।
সিড্যান্স ১.০ প্রশিক্ষণ প্রক্রিয়াটি কয়েকটি পর্যায়ে বিভক্ত: প্রথমে সমৃদ্ধ ছবি ও ভিডিও ডেটা থেকে শেখা, এবং তারপর বিভিন্ন শৈলীর ট্রানজিশন কৌশল সম্পর্কে গভীরভাবে জ্ঞান অর্জন করা।
প্রশিক্ষণ প্রক্রিয়ায় মানুষেরও একটি গুরুত্বপূর্ণ ভূমিকা রয়েছে, কারণ প্রকৌশলীরা মডেলের শেখার জন্য উচ্চ-মানের ভিডিও নির্বাচন করেন। এই প্রশিক্ষণ চক্র ততক্ষণ চলতে থাকে যতক্ষণ না সিড্যান্স ১.০ চাহিদা অনুযায়ী তৈরি হওয়া অসংখ্য ভিডিওর মধ্য থেকে স্বাধীনভাবে সর্বোত্তম ফলাফলটি নির্বাচন করতে পারে।
বর্তমানে, সিডেন্স ১.০ ভিডিওর দৈর্ঘ্য সর্বোচ্চ ৫ সেকেন্ডে সীমাবদ্ধ করে (ভিও ৩-এর ৮ সেকেন্ডের তুলনায়)। তবে, এর সবচেয়ে বড় সুবিধা হলো এর দ্রুত প্রসেসিং গতি: একটি ফুল এইচডি ভিডিও তৈরি করতে মাত্র ৪১ সেকেন্ড সময় লাগে। সিডেন্স ১.০-এর একটি অসুবিধা হলো, এটি এখনও এর গুগল প্রতিরূপের মতো স্বয়ংক্রিয় সাউন্ড ওভারলে সমর্থন করে না।
বাইটড্যান্স শীঘ্রই সাধারণ ব্যবহারকারী এবং পেশাদার কন্টেন্ট নির্মাতা উভয়ের জন্য এই টুলটি প্রকাশ করার পরিকল্পনা করছে, যা প্রচারমূলক ভিডিও বা সোশ্যাল মিডিয়ার জন্য সংক্ষিপ্ত কন্টেন্ট তৈরির চাহিদা পূরণ করবে।
সিড্যান্স ১.০-এর আগে বাইটড্যান্স অমনিহিউম্যান, গোকু এবং জিমেং এআই-এর মতো এআই ভিডিও তৈরির টুল তৈরি করেছিল। তবে, সিড্যান্স ১.০ হলো প্রথম পণ্য, যা সম্পর্কে কোম্পানিটি আত্মবিশ্বাসের সাথে দাবি করে যে এটি এআই-চালিত ভিডিও তৈরির ক্ষমতায় তার প্রতিযোগীদের ছাড়িয়ে যেতে পারে।
উৎস: https://znews.vn/cong-ty-me-tiktok-ra-mat-cong-nghe-thach-thuc-google-post1562025.html






মন্তব্য (0)