Компания OpenAI, которой принадлежит ChatGPT, внедряет свою технологию искусственного интеллекта в сферу видео . Компания только что представила Sora — модель искусственного интеллекта нового поколения. Sora работает аналогично ранее существовавшему инструменту искусственного интеллекта для генерации изображений DALL-E от OpenAI.
Пользователь вводит желаемую описательную подсказку, а программное обеспечение Sora возвращает видеоклип высокого разрешения, позволяющий отображать сцены с несколькими персонажами, определенными типами движения и подробностями, тесно связанными с введенной подсказкой.
«Эта модель ИИ не только понимает, что пользователь просит в подсказке, но и то, как эти вещи существуют в физическом мире », — говорится в сообщении в блоге компании.
Новая модель под названием Sora позволяет пользователям превращать желаемые описательные подсказки в видеоклипы высокого разрешения. (Изображение: фрагмент из видео-примера OpenAI)
С помощью Sora компания OpenAI стремится составить конкуренцию инструментам искусственного интеллекта для генерации видео от таких компаний, как Meta и Google. Похожие инструменты ИИ доступны и у других стартапов, например, у Stability AI, у которого есть продукт под названием Stable Video Diffusion. Amazon также выпустила Create with Alexa — модель, которая специализируется на создании короткометражного анимационного контента для детей на основе подсказок.
В настоящее время программное обеспечение Sora ограничивается созданием видеороликов длительностью не более одной минуты. На данный момент Sora доступна только небольшой команде, которая тестирует модель на наличие уязвимостей. Компания пока не выпустила ни одной публичной демоверсии, за исключением 10 вступительных роликов, доступных на ее веб-сайте.
По мнению Риса Хейдена, старшего аналитика исследовательской компании ABI Research, этот тип модели ИИ может оказать огромное влияние на рынок цифровых развлечений. На данный момент эта модель все еще имеет много ограничений, но она показывает направление развития рынка в будущем.
Эксперты утверждают, что видео может стать следующим рубежом генеративного ИИ, поскольку чат-боты и генераторы изображений проникают в мир потребителей и бизнеса. Хотя инновационные возможности будут воодушевлять энтузиастов ИИ, новые технологии, подобные этим, также вызовут серьезную обеспокоенность по поводу дезинформации в связи с приближением важных политических выборов по всему миру. По данным компании Clarity, занимающейся машинным обучением, в 2023 году количество дипфейковых видео и фотографий, созданных с помощью ИИ, выросло на 900% по сравнению с предыдущим годом.
Источник
Комментарий (0)