ابزار جدید ByteDance با اطمینان از همه رقبا پیشی میگیرد. عکس: ByteDance . |
بایتدنس، شرکت مادر تیکتاک و دویین، رسماً Seedance 1.0، یک ابزار هوش مصنوعی (AI) که قادر به ساخت ویدیو از متن و تصاویر است را معرفی کرد. این اقدام به عنوان گامی مهم برای این غول فناوری چینی در رقابت برای توسعه پلتفرمهای تولید محتوای مبتنی بر هوش مصنوعی تلقی میشود.
این شرکت اخیراً مطالعهی دقیقی روی Seedance 1.0 منتشر کرده است. طبق این مطالعه، این ابزار برای تبدیل دستورالعملهای ساده به ویدیوهای با کیفیت بالا بدون نیاز به اسکریپتهای دقیق یا دستورات پیچیده طراحی شده است. این ابزار نه تنها نماهای تکی را مدیریت میکند، بلکه زوایای مختلف دوربین را نیز ترکیب میکند، انتقالهای روان را تضمین میکند و ثبات شخصیت را در طول ویدیو حفظ میکند.
بایتدنس در مقاله تحقیقاتی خود اظهار داشت: «ما راهی برای جداسازی اطلاعات مکانی و زمانی در ویدیو پیدا کردهایم. این فناوری از روشی ویژه برای «رمزگذاری» مکان استفاده میکند و به هوش مصنوعی کمک میکند تا یاد بگیرد ویدیوها را از متن و تصاویر در یک مدل واحد بسازد. در نتیجه، هوش مصنوعی میتواند به طور خودکار ویدیوهایی با چندین نمای مختلف و به طور روان ایجاد کند.»
بایتدنس با اطمینان ادعا میکند که Seedance 1.0 از ابزارهای ساخت ویدیوی هوش مصنوعی موجود در بازار، بهویژه در تواناییاش در دنبال کردن دقیق ایدههای کاربر، وضوح تصویر و حرکت طبیعی شخصیتها، پیشی میگیرد.
طبق گزارش Artificial Analysis ، پلتفرمی که در تحلیل و ارزیابی عملکرد مدلهای هوش مصنوعی تخصص دارد، Seedance 1.0 از سایر ابزارهای ساخت ویدیوی هوش مصنوعی مانند Veo 3 گوگل، Kling 2.0 کوایشو و Sora اوپنایآی پیشی گرفته است. این ابزار عملکرد برتری را در هر دو وظیفه تبدیل متن به ویدیو و تصویر به ویدیو نشان داده است.
این شرکت همچنین فاش کرد که Seedance 1.0 بر اساس یک پایگاه داده عظیم از ویدیوها، که از منابع عمومی و دارای مجوز جمعآوری شده بود، آموزش دیده است. ویدیوهای آموزشی تحت یک فرآیند فیلترینگ دقیق قرار گرفتند تا محتوای خشونتآمیز یا حساس حذف شود.
بسیاری معتقدند که این دادهها عمدتاً از TikTok و Douyin، دو پلتفرمی که توسط خود ByteDance اداره میشوند، گرفته شده است.
فرآیند آموزش Seedance 1.0 به چندین مرحله تقسیم میشود: در ابتدا یادگیری از دادههای غنی تصویر و ویدیو، و سپس ادامه یادگیری عمیق در مورد تکنیکهای انتقال در سبکهای مختلف.
انسانها نیز نقش حیاتی در فرآیند آموزش دارند، زیرا مهندسان ویدیوهای با کیفیت بالا را برای یادگیری مدل انتخاب میکنند. حلقه آموزش تا زمانی ادامه مییابد که Seedance 1.0 بتواند به طور مستقل نتیجه بهینه را از بین ویدیوهای تولید شده بر اساس تقاضا انتخاب کند.
در حال حاضر، Seedance 1.0 طول ویدیو را به حداکثر ۵ ثانیه محدود میکند (در مقایسه با ۸ ثانیه برای Veo 3). با این حال، مزیت برجسته آن سرعت پردازش سریع آن است: ایجاد یک ویدیوی Full HD فقط ۴۱ ثانیه طول میکشد. یکی از معایب Seedance 1.0 این است که هنوز از پوشش خودکار صدا مانند همتای گوگل خود پشتیبانی نمیکند.
بایتدنس قصد دارد این ابزار را به زودی برای کاربران عمومی و تولیدکنندگان محتوای حرفهای منتشر کند و نیازهای تولید ویدیوهای تبلیغاتی یا محتوای کوتاه برای رسانههای اجتماعی را برآورده سازد.
پیش از Seedance 1.0، بایتدنس ابزارهای ساخت ویدیوی هوش مصنوعی مانند OmniHuman، Goku و Jimeng AI را توسعه داده بود. با این حال، Seedance 1.0 اولین محصولی است که این شرکت با اطمینان ادعا میکند میتواند در قابلیتهای ساخت ویدیوی مبتنی بر هوش مصنوعی از رقبای خود پیشی بگیرد.
منبع: https://znews.vn/cong-ty-me-tiktok-ra-mat-cong-nghe-thach-thuc-google-post1562025.html






نظر (0)