Sora — це нова генеративна модель штучного інтелекту від OpenAI, яка працює аналогічно до генератора зображень Dall-E компанії. Користувачі просто запитують відеоконтент , а Sora повертає високоякісний відеокліп. Вона також може генерувати відео зі статичних зображень, розтягувати відео або заповнювати порожні кадри.
Відео може стати наступним рубежем для генеративного штучного інтелекту, оскільки чат-боти та генератори зображень виходять у реальний світ. Хоча нова технологія схвально сприймається ентузіастами штучного інтелекту, вона також викликає серйозні занепокоєння щодо дезінформації, оскільки наближаються великі світові політичні вибори. Згідно з даними компанії машинного навчання Clarity, кількість діпфейків, згенерованих штучним інтелектом, зросла на 900% у порівнянні з минулим роком.
За допомогою Sora OpenAI прагне конкурувати з інструментами штучного інтелекту для створення відео від таких конкурентів, як Meta, Google, та стартапів, таких як Stability AI. Amazon також запустила Create with Alexa, модель на основі підказок для створення короткоформатного анімованого контенту для дітей.
Наразі Sora може створювати відео тривалістю лише хвилину або менше. Також є невелика команда, або «червона команда», яка використовує модель для пошуку вразливостей безпеки. OpenAI не опублікував жодних публічних демонстрацій, окрім 10 зразків кліпів, доступних на його вебсайті.
OpenAI також створює класифікатор, який може ідентифікувати відеокліпи як продукти Sora, і планує включити певні метадані до виводу, щоб допомогти ідентифікувати контент, згенерований штучним інтелектом. Ці зусилля подібні до тих, що робить Meta для ідентифікації зображень, згенерованих штучним інтелектом.
Sora, як і ChatGPT, використовує архітектуру Transformer, представлену дослідниками Google у статті 2017 року.
(За даними CNBC)
Джерело
Коментар (0)