По данным CNBC , компания OpenAI представила Sora — модель искусственного интеллекта нового поколения, которая работает аналогично их предыдущему инструменту для генерации изображений DALL-E. Пользователям достаточно ввести желаемую сцену, и Sora предоставит видеоклип высокого разрешения. Sora также может создавать видеоклипы на основе неподвижных изображений, расширять существующие видео или заполнять недостающие кадры.
Самоедская собака и золотистый ретривер резвятся по ночному городу, освещенному неоновыми огнями, в видео, созданном искусственным интеллектом
Создание видео может стать следующим рубежом развития креативного ИИ после того, как чат-боты и генераторы изображений недавно проникли в потребительский и деловой мир. Хотя создание контента, безусловно, будет интересовать энтузиастов ИИ, эти новые технологии вызывают серьёзные опасения по поводу дезинформации в преддверии крупных политических выборов в мире. По данным компании Clarity, специализирующейся на машинном обучении, количество дипфейков, созданных с помощью ИИ, выросло на 900% по сравнению с прошлым годом.
С помощью Sora компания OpenAI стремится составить конкуренцию инструментам ИИ для создания видео от таких компаний, как Google и Meta. Аналогичные инструменты ИИ доступны и у других стартапов, например, у Stability AI, у которого есть продукт под названием Stable Video Diffusion. Amazon также запустила Create with Alexa — модель, специализирующуюся на создании короткометражного анимированного контента для детей на основе команд.
В настоящее время Sora ограничена генерацией видео длительностью не более минуты. OpenAI поставила перед собой цель использовать мультимодальность — метод, сочетающий генерацию текста, изображений и видео — для расширения набора моделей ИИ.
Пока что Sora доступна только небольшой группе тестировщиков безопасности, или «красным командам», которые проверяют модель на наличие уязвимостей, таких как дезинформация. Компания не опубликовала никаких публичных демоверсий, кроме 10 видеороликов, доступных на её сайте, и заявляет, что сопроводительная техническая документация будет опубликована в ближайшее время.
OpenAI также заявляет о разработке «классификатора обнаружения», способного идентифицировать видеоклипы, сгенерированные Sora, и планирует включать в выходные данные определённые метаданные, которые помогут идентифицировать контент, сгенерированный ИИ. Именно такие метаданные Meta планирует использовать для идентификации изображений, сгенерированных ИИ.
Sora — это модель искусственного интеллекта, использующая архитектуру Transformer, которую исследователи Google представили в статье 2017 года. В своем заявлении OpenAI заявила, что Sora служит основой для моделей, которые понимают и имитируют реальный мир .
Ссылка на источник
Комментарий (0)