Sora — это новая генеративная модель ИИ от OpenAI, которая работает аналогично генератору изображений Dall-E компании. Пользователи просто запрашивают видеоконтент , и Sora возвращает высококачественный видеоклип. Она также может генерировать видео из неподвижных изображений, растягивать видео или заполнять пустые кадры.
Видео может стать следующим рубежом для генеративного ИИ, поскольку чат-боты и генераторы изображений выходят в реальный мир. Хотя новая технология приветствуется энтузиастами ИИ, она также вызывает серьезные опасения по поводу дезинформации по мере приближения крупных мировых политических выборов. Согласно данным компании Clarity, занимающейся машинным обучением, количество дипфейков, сгенерированных ИИ, выросло на 900% по сравнению с прошлым годом.
С помощью Sora OpenAI стремится составить конкуренцию инструментам ИИ для генерации видео от таких конкурентов, как Meta, Google и стартапов, таких как Stability AI. Amazon также запустила Create with Alexa — модель на основе подсказок для создания короткометражного анимированного контента для детей.
В настоящее время Sora может создавать видео длительностью не более минуты. Также есть небольшая команда — или «красная команда», — которая использует модель для поиска уязвимостей безопасности. OpenAI не выпустила ни одной публичной демонстрации, кроме 10 образцов клипов, доступных на ее веб-сайте.
OpenAI также создает классификатор, который может идентифицировать видеоклипы как продукты Sora, и планирует включить определенные метаданные в вывод, чтобы помочь идентифицировать контент, сгенерированный ИИ. Усилия аналогичны тем, что предпринимает Meta для идентификации изображений, сгенерированных ИИ.
Sora, как и ChatGPT, использует архитектуру Transformer, представленную исследователями Google в статье 2017 года.
(По данным CNBC)
Источник
Комментарий (0)