x5p2qoem.png
Сцена, створена Сорою. (Зображення: OpenAI)

Sora — це нова генеративна модель штучного інтелекту від OpenAI, яка працює аналогічно генератору зображень Dall-E від тієї ж компанії. Користувачі просто запитують відеоконтент , а Sora повертає високоякісний відеокліп. Вона також може створювати відео зі статичних зображень, розтягувати відео або заповнювати порожні кадри.

Відео може стати наступним рубежем для генеративного штучного інтелекту, оскільки чат-боти та генератори зображень виходять у реальний світ. Хоча нова технологія схвально сприймається ентузіастами штучного інтелекту, вона також викликає серйозні занепокоєння щодо дезінформації, оскільки наближаються великі світові політичні вибори. Згідно з даними компанії машинного навчання Clarity, кількість діпфейків, згенерованих штучним інтелектом, зросла на 900% у порівнянні з минулим роком.

За допомогою Sora OpenAI прагне конкурувати з інструментами штучного інтелекту для створення відео від таких конкурентів, як Meta, Google, та стартапів, таких як Stability AI. Amazon також випустила Create with Alexa, модель на основі підказок для створення короткоформатного анімованого контенту для дітей.

Sora може створювати відео тривалістю лише хвилину або менше, і невелика група, або «червона команда», використовує модель для пошуку вразливостей безпеки. OpenAI не опублікував жодних публічних демонстрацій, окрім 10 зразків кліпів, доступних на його вебсайті.

OpenAI також створює класифікатор, який може ідентифікувати відеокліпи як продукти Sora, і планує включити певні метадані до виводу, щоб допомогти ідентифікувати контент, згенерований штучним інтелектом. Ці зусилля схожі на те, що Meta робить для ідентифікації зображень, згенерованих штучним інтелектом.

Sora, як і ChatGPT, використовує архітектуру Transformer, представлену дослідниками Google у статті 2017 року.

(За даними CNBC)