Sora — это новая генеративная модель искусственного интеллекта OpenAI, работающая аналогично генератору изображений Dall-E той же компании. Пользователи просто запрашивают видеоконтент , и Sora возвращает высококачественный видеоклип. Она также может создавать видео из статичных изображений, растягивать видео и заполнять пустые кадры.
Видео может стать следующим рубежом развития генеративного ИИ по мере того, как чат-боты и генераторы изображений выходят в реальный мир. Хотя новая технология приветствуется энтузиастами ИИ, она также вызывает серьёзные опасения по поводу дезинформации в преддверии крупных политических выборов в мире. Согласно данным компании Clarity, специализирующейся на машинном обучении, количество дипфейков, созданных с помощью ИИ, выросло на 900% по сравнению с прошлым годом.
С помощью Sora компания OpenAI стремится составить конкуренцию инструментам ИИ для создания видео от таких конкурентов, как Meta, Google и стартапы вроде Stability AI. Amazon также выпустила Create with Alexa — модель для создания короткометражного анимированного контента для детей с использованием подсказок.
Sora может создавать видео длительностью не более минуты, и небольшая группа, или «красная команда», использует эту модель для поиска уязвимостей безопасности. OpenAI не выпускала никаких публичных демонстраций, кроме 10 примеров, доступных на её сайте.
OpenAI также разрабатывает классификатор, способный идентифицировать видеоклипы как продукты Sora, и планирует включать в выходные данные определённые метаданные для идентификации контента, созданного ИИ. Эта инициатива аналогична деятельности Meta для идентификации изображений, созданных ИИ.
Sora, как и ChatGPT, использует архитектуру Transformer, представленную исследователями Google в статье 2017 года.
(По данным CNBC)
Источник
Комментарий (0)