شرکت مادر تیک تاک، فناوری جدیدی را برای به چالش کشیدن گوگل عرضه می‌کند.

ابزار جدید ByteDance با اطمینان از همه رقبا پیشی می‌گیرد. عکس: ByteDance .

بایت‌دنس، شرکت مادر تیک‌تاک و دویین، رسماً Seedance 1.0، یک ابزار هوش مصنوعی (AI) که قادر به ساخت ویدیو از متن و تصاویر است را معرفی کرد. این اقدام به عنوان گامی مهم برای این غول فناوری چینی در رقابت برای توسعه پلتفرم‌های تولید محتوای مبتنی بر هوش مصنوعی تلقی می‌شود.

این شرکت اخیراً مطالعه‌ی دقیقی روی Seedance 1.0 منتشر کرده است. طبق این مطالعه، این ابزار برای تبدیل دستورالعمل‌های ساده به ویدیوهای با کیفیت بالا بدون نیاز به اسکریپت‌های دقیق یا دستورات پیچیده طراحی شده است. این ابزار نه تنها نماهای تکی را مدیریت می‌کند، بلکه زوایای مختلف دوربین را نیز ترکیب می‌کند، انتقال‌های روان را تضمین می‌کند و ثبات شخصیت را در طول ویدیو حفظ می‌کند.

بایت‌دنس در مقاله تحقیقاتی خود اظهار داشت: «ما راهی برای جداسازی اطلاعات مکانی و زمانی در ویدیو پیدا کرده‌ایم. این فناوری از روشی ویژه برای «رمزگذاری» مکان استفاده می‌کند و به هوش مصنوعی کمک می‌کند تا یاد بگیرد ویدیوها را از متن و تصاویر در یک مدل واحد بسازد. در نتیجه، هوش مصنوعی می‌تواند به طور خودکار ویدیوهایی با چندین نمای مختلف و به طور روان ایجاد کند.»

بایت‌دنس با اطمینان ادعا می‌کند که Seedance 1.0 از ابزارهای ساخت ویدیوی هوش مصنوعی موجود در بازار، به‌ویژه در توانایی‌اش در دنبال کردن دقیق ایده‌های کاربر، وضوح تصویر و حرکت طبیعی شخصیت‌ها، پیشی می‌گیرد.

طبق گزارش Artificial Analysis ، پلتفرمی که در تحلیل و ارزیابی عملکرد مدل‌های هوش مصنوعی تخصص دارد، Seedance 1.0 از سایر ابزارهای ساخت ویدیوی هوش مصنوعی مانند Veo 3 گوگل، Kling 2.0 کوایشو و Sora اوپن‌ای‌آی پیشی گرفته است. این ابزار عملکرد برتری را در هر دو وظیفه تبدیل متن به ویدیو و تصویر به ویدیو نشان داده است.

این شرکت همچنین فاش کرد که Seedance 1.0 بر اساس یک پایگاه داده عظیم از ویدیوها، که از منابع عمومی و دارای مجوز جمع‌آوری شده بود، آموزش دیده است. ویدیوهای آموزشی تحت یک فرآیند فیلترینگ دقیق قرار گرفتند تا محتوای خشونت‌آمیز یا حساس حذف شود.

بسیاری معتقدند که این داده‌ها عمدتاً از TikTok و Douyin، دو پلتفرمی که توسط خود ByteDance اداره می‌شوند، گرفته شده است.

فرآیند آموزش Seedance 1.0 به چندین مرحله تقسیم می‌شود: در ابتدا یادگیری از داده‌های غنی تصویر و ویدیو، و سپس ادامه یادگیری عمیق در مورد تکنیک‌های انتقال در سبک‌های مختلف.

انسان‌ها نیز نقش حیاتی در فرآیند آموزش دارند، زیرا مهندسان ویدیوهای با کیفیت بالا را برای یادگیری مدل انتخاب می‌کنند. حلقه آموزش تا زمانی ادامه می‌یابد که Seedance 1.0 بتواند به طور مستقل نتیجه بهینه را از بین ویدیوهای تولید شده بر اساس تقاضا انتخاب کند.

در حال حاضر، Seedance 1.0 طول ویدیو را به حداکثر ۵ ثانیه محدود می‌کند (در مقایسه با ۸ ثانیه برای Veo 3). با این حال، مزیت برجسته آن سرعت پردازش سریع آن است: ایجاد یک ویدیوی Full HD فقط ۴۱ ثانیه طول می‌کشد. یکی از معایب Seedance 1.0 این است که هنوز از پوشش خودکار صدا مانند همتای گوگل خود پشتیبانی نمی‌کند.

بایت‌دنس قصد دارد این ابزار را به زودی برای کاربران عمومی و تولیدکنندگان محتوای حرفه‌ای منتشر کند و نیازهای تولید ویدیوهای تبلیغاتی یا محتوای کوتاه برای رسانه‌های اجتماعی را برآورده سازد.

پیش از Seedance 1.0، بایت‌دنس ابزارهای ساخت ویدیوی هوش مصنوعی مانند OmniHuman، Goku و Jimeng AI را توسعه داده بود. با این حال، Seedance 1.0 اولین محصولی است که این شرکت با اطمینان ادعا می‌کند می‌تواند در قابلیت‌های ساخت ویدیوی مبتنی بر هوش مصنوعی از رقبای خود پیشی بگیرد.

منبع: https://znews.vn/cong-ty-me-tiktok-ra-mat-cong-nghe-thach-thuc-google-post1562025.html