Sora — это новая генеративная модель искусственного интеллекта OpenAI, работающая аналогично генератору изображений Dall-E той же компании. Пользователи просто запрашивают видеоконтент , и Sora возвращает высококачественный видеоклип . Она также может генерировать видео из статичных изображений, растягивать видео или заполнять пустые кадры.
Видео может стать следующим рубежом развития генеративного ИИ по мере того, как чат-боты и генераторы изображений выходят в реальный мир. Хотя новая технология приветствуется энтузиастами ИИ, она также вызывает серьёзные опасения по поводу дезинформации в преддверии крупных политических выборов в мире. Согласно данным компании Clarity, специализирующейся на машинном обучении, количество дипфейков, созданных с помощью ИИ, выросло на 900% по сравнению с прошлым годом.
С помощью Sora компания OpenAI стремится составить конкуренцию инструментам ИИ для создания видео от таких конкурентов, как Meta, Google и стартапы вроде Stability AI. Amazon также запустила Create with Alexa — модель создания короткометражного анимированного контента для детей с использованием подсказок.
В настоящее время Sora может создавать видео длительностью не более минуты. Существует также небольшая команда, или «красная команда», которая использует эту модель для поиска уязвимостей безопасности. OpenAI пока не выпустила ни одной публичной демоверсии, кроме 10 видеороликов, доступных на сайте.
OpenAI также разрабатывает классификатор, способный идентифицировать видеоклипы как продукты Sora, и планирует включать в выходные данные определённые метаданные для идентификации контента, созданного ИИ. Эта работа аналогична работе Meta для идентификации изображений, созданных ИИ.
Sora, как и ChatGPT, использует архитектуру Transformer, представленную исследователями Google в статье 2017 года.
(По данным CNBC)
Источник
Комментарий (0)