OpenAI запускает инструмент для создания текстовых видео

По данным CNBC , компания OpenAI представила Sora — модель искусственного интеллекта нового поколения, которая работает аналогично их предыдущему инструменту для генерации изображений DALL-E. Пользователям достаточно указать желаемую сцену, и Sora предоставит видеоклип высокого разрешения. Sora также может создавать видеоклипы на основе неподвижных изображений, расширять существующие видео или заполнять недостающие кадры.

OpenAI ra mắt công cụ sáng tạo video bằng văn bản- Ảnh 1. — Самоедская собака и золотистый ретривер резвятся по ночному городу с неоновыми огнями в видео, созданном искусственным интеллектом

Создание видео может стать следующим важным шагом в развитии креативного ИИ после того, как чат-боты и генераторы изображений недавно проникли в потребительский и деловой мир. Хотя создание контента, безусловно, будет интересовать энтузиастов ИИ, эти новые технологии вызывают серьёзные опасения по поводу дезинформации в преддверии крупных политических выборов в мире. По данным компании Clarity, специализирующейся на машинном обучении, количество дипфейков, созданных с помощью ИИ, выросло на 900% по сравнению с прошлым годом.

С помощью Sora компания OpenAI стремится составить конкуренцию инструментам ИИ для создания видео от таких компаний, как Google и Meta. Аналогичные инструменты ИИ доступны и у других стартапов, например, у Stability AI, у которого есть продукт под названием Stable Video Diffusion. Amazon также выпустила Create with Alexa — модель, специализирующуюся на создании короткометражного анимированного контента для детей с помощью команд.

В настоящее время Sora ограничена генерацией видео длительностью не более минуты. OpenAI поставила перед собой цель использовать мультимодальность — метод, сочетающий генерацию текста, изображений и видео — для расширения набора моделей ИИ.

Пока что Sora доступна только небольшой группе тестировщиков безопасности, или «красным командам», которым поручено тестировать модель на наличие уязвимостей, таких как дезинформация. Компания не опубликовала никаких публичных демоверсий, кроме 10 видеороликов, доступных на её веб-сайте, и заявляет, что сопроводительная техническая документация будет опубликована в ближайшее время.

OpenAI также заявляет о разработке «классификатора обнаружения», способного идентифицировать видеоклипы, сгенерированные Sora, и планирует включать в выходные данные определённые метаданные, которые помогут идентифицировать контент, сгенерированный ИИ. Именно такие метаданные Meta планирует использовать для идентификации изображений, сгенерированных ИИ.

Sora — это модель искусственного интеллекта, использующая архитектуру Transformer, которую исследователи Google представили в статье 2017 года. В своем заявлении OpenAI заявила, что Sora служит основой для моделей, которые понимают и имитируют реальный мир .

Ссылка на источник