Материнська компанія TikTok запускає технологію, щоб кинути виклик Google.

Новий інструмент від ByteDance впевнено перевершує всіх конкурентів. Фото: ByteDance .

ByteDance, материнська компанія TikTok та Douyin, офіційно представила Seedance 1.0, інструмент штучного інтелекту (ШІ), здатний створювати відео з тексту та зображень. Це розглядається як важливий крок для китайського технологічного гіганта в гонці розробки платформ для створення контенту на базі ШІ.

Нещодавно компанія опублікувала детальне дослідження Seedance 1.0. Згідно з дослідженням, цей інструмент розроблений для перетворення простих інструкцій у високоякісне відео без необхідності використання детальних сценаріїв чи складних команд. Він обробляє не лише окремі кадри, але й поєднує різні ракурси камери, забезпечує плавні переходи та підтримує узгодженість персонажів протягом усього відео.

«Ми знайшли спосіб розділити просторову та часову інформацію у відео. Ця технологія використовує спеціальний метод для «кодування» місцезнаходження, допомагаючи штучному інтелекту навчитися створювати відео як з тексту, так і з зображень в межах однієї моделі. В результаті штучний інтелект може автоматично плавно створювати відео з кількома різними кадрами», – йдеться в дослідницькій роботі ByteDance.

ByteDance впевнено стверджує, що Seedance 1.0 перевершує існуючі на ринку інструменти для створення відео на основі штучного інтелекту, зокрема, у своїй здатності точно відстежувати ідеї користувача, чіткість зображення та природний рух персонажів.

Згідно з Artificial Analysis , платформою, що спеціалізується на аналізі та оцінці продуктивності моделей штучного інтелекту, Seedance 1.0 перевершив інші інструменти для створення відео на основі штучного інтелекту, такі як Veo 3 від Google, Kling 2.0 від Kuaishou та Sora від OpenAI. Цей інструмент продемонстрував чудову продуктивність як у завданнях перетворення тексту у відео, так і зображень у відео.

Компанія також повідомила, що Seedance 1.0 навчався на величезній базі даних відео, зібраних із загальнодоступних та ліцензованих джерел. Навчальні відео пройшли ретельний процес фільтрації для видалення насильницького або делікатного контенту.

Багато хто вважає, що дані надходять переважно з TikTok та Douyin, двох платформ, якими керує сама ByteDance.

Процес навчання Seedance 1.0 поділений на кілька етапів: спочатку навчання на основі багатих зображень та відеоданих, а потім подальше поглиблене вивчення технік переходів у різних стилях.

Люди також відіграють вирішальну роль у процесі навчання, оскільки інженери вибирають високоякісні відео для моделі, на яких вона буде навчатися. Цикл навчання триває доти, доки Seedance 1.0 не зможе самостійно вибрати оптимальний результат серед багатьох відео, що генеруються на вимогу.

Наразі Seedance 1.0 обмежує тривалість відео максимум 5 секундами (порівняно з 8 секундами для Veo 3). Однак його головною перевагою є висока швидкість обробки: для створення відео у форматі Full HD потрібно лише 41 секунда. Одним з недоліків Seedance 1.0 є те, що він поки що не підтримує автоматичне накладання звуку, як його аналог від Google.

ByteDance планує незабаром випустити цей інструмент як для звичайних користувачів, так і для професійних творців контенту, задовольняючи потреби створення рекламних відеороликів або короткого контенту для соціальних мереж.

До Seedance 1.0, ByteDance розробляла інструменти для створення відео на основі штучного інтелекту, такі як OmniHuman, Goku та Jimeng AI. Однак, Seedance 1.0 — це перший продукт, який, за впевненістю компанії, може перевершити конкурентів у можливостях створення відео на основі штучного інтелекту.

Джерело: https://znews.vn/cong-ty-me-tiktok-ra-mat-cong-nghe-thach-thuc-google-post1562025.html