Новый инструмент от ByteDance уверенно превосходит всех конкурентов. Фото: ByteDance . |
Компания ByteDance, владеющая TikTok и Douyin, официально представила Seedance 1.0 — инструмент на основе искусственного интеллекта (ИИ), способный создавать видеоролики из текста и изображений. Это рассматривается как важный шаг для китайского технологического гиганта в гонке за разработку платформ для создания контента на основе ИИ.
Компания недавно опубликовала подробное исследование Seedance 1.0. Согласно исследованию, этот инструмент предназначен для преобразования простых инструкций в высококачественное видео без необходимости написания подробных сценариев или сложных команд. Он обрабатывает не только отдельные кадры, но и комбинирует несколько ракурсов камеры, обеспечивает плавные переходы и поддерживает единообразие персонажей на протяжении всего видео.
«Мы нашли способ разделить пространственную и временную информацию в видео. Эта технология использует специальный метод «кодирования» местоположения, помогая ИИ научиться создавать видео из текста и изображений в рамках одной модели. В результате ИИ может автоматически и плавно создавать видео с несколькими разными кадрами», — говорится в исследовательской работе ByteDance.
Компания ByteDance с уверенностью заявляет, что Seedance 1.0 превосходит существующие на рынке инструменты для создания видео с использованием ИИ, особенно в своей способности точно следовать идеям пользователя, обеспечивать четкость изображения и естественные движения персонажей.
Согласно данным платформы Artificial Analysis , специализирующейся на анализе и оценке производительности моделей ИИ, Seedance 1.0 превзошла другие инструменты для создания видео с помощью ИИ, такие как Google Veo 3, Kuaishou Kling 2.0 и OpenAI Sora. Этот инструмент продемонстрировал превосходные результаты как в задачах преобразования текста в видео, так и в задачах преобразования изображений в видео.
Компания также сообщила, что Seedance 1.0 обучалась на огромной базе видеороликов, собранных из общедоступных и лицензированных источников. Обучающие видеоролики прошли строгий процесс фильтрации для удаления насильственного или деликатного контента.
Многие считают, что данные в основном поступают из TikTok и Douyin, двух платформ, принадлежащих самой компании ByteDance.
Процесс обучения в Seedance 1.0 разделен на несколько этапов: сначала обучение на основе большого объема изображений и видеоданных, а затем углубленное изучение техник перехода в различных стилях.
Люди также играют решающую роль в процессе обучения, поскольку инженеры отбирают высококачественные видеоролики, на основе которых модель будет обучаться. Цикл обучения продолжается до тех пор, пока Seedance 1.0 не сможет самостоятельно выбирать оптимальный результат из множества видеороликов, сгенерированных по запросу.
В настоящее время Seedance 1.0 ограничивает длину видео максимум 5 секундами (по сравнению с 8 секундами у Veo 3). Однако его главное преимущество — высокая скорость обработки: для создания видео Full HD требуется всего 41 секунда. Одним из недостатков Seedance 1.0 является отсутствие поддержки автоматического наложения звука, как у его аналога от Google.
Компания ByteDance планирует в ближайшее время выпустить этот инструмент как для обычных пользователей, так и для профессиональных создателей контента, удовлетворяя потребности в производстве рекламных видеороликов или коротких материалов для социальных сетей.
До Seedance 1.0 компания ByteDance разработала инструменты для создания видео с использованием ИИ, такие как OmniHuman, Goku и Jimeng AI. Однако Seedance 1.0 — это первый продукт, который, по утверждению компании, может с уверенностью превзойти конкурентов по возможностям создания видео с помощью ИИ.
Источник: https://znews.vn/cong-ty-me-tiktok-ra-mat-cong-nghe-thach-thuc-google-post1562025.html






Комментарий (0)