Згідно з CNBC , OpenAI щойно представила Sora — модель штучного інтелекту наступного покоління, яка працює аналогічно їхньому попередньому інструменту штучного інтелекту для генерації зображень DALL-E. Користувачам потрібно лише ввести потрібну сцену, і Sora поверне відеокліп високої роздільної здатності. Sora також може створювати відеокліпи, натхненні статичними зображеннями, та розширювати існуючі відео або заповнювати відсутні кадри.
Самоїд та золотистий ретривер граються містом з неоновими вогнями вночі у відео, створеному штучним інтелектом
Створення відео може стати наступним великим кроком для креативного ШІ, після того, як чат-боти та генератори зображень нещодавно проникли у світ споживачів та бізнесу. Хоча створення контенту захоплюватиме ентузіастів ШІ, ці нові технології викликають серйозне занепокоєння щодо дезінформації з наближенням великих світових політичних виборів. Згідно з даними компанії машинного навчання Clarity, кількість діпфейків, згенерованих ШІ, зросла на 900% у порівнянні з минулим роком.
За допомогою Sora OpenAI прагне конкурувати з інструментами штучного інтелекту для створення відео від таких компаній, як Google та Meta. Подібні інструменти штучного інтелекту доступні від інших стартапів, таких як Stability AI, продукт якої називається Stable Video Diffusion. Amazon також випустила Create with Alexa, модель, яка спеціалізується на створенні короткометражного анімованого контенту для дітей на основі команд.
Наразі Sora обмежується створенням відео тривалістю до хвилини. OpenAI поставив собі за мету мультимодальність – метод, який поєднує генерацію тексту, зображень та відео – щоб забезпечити ширший набір моделей штучного інтелекту.
Поки що Sora була доступна лише невеликій групі тестувальників безпеки, або «червоним командам», яким доручено перевірити модель на наявність вразливостей у таких сферах, як дезінформація. Компанія не опублікувала жодних публічних демонстрацій, окрім 10 зразків кліпів, доступних на її вебсайті, і заявляє, що супровідна технічна документація буде опублікована найближчим часом.
OpenAI також заявляє, що створює «класифікатор виявлення», який може ідентифікувати відеокліпи, згенеровані Sora, і планує включити певні метадані до виводу, щоб допомогти ідентифікувати контент, згенерований штучним інтелектом. Саме такі метадані Meta планує використовувати для ідентифікації зображень, згенерованих штучним інтелектом.
Sora — це модель штучного інтелекту, яка використовує архітектуру Transformer, яку дослідники Google представили у своїй статті 2017 року. У своєму оголошенні OpenAI заявила, що Sora служить основою для моделей, які розуміють та імітують реальний світ .
Посилання на джерело






Коментар (0)