x5p2qoem.png
Scena stworzona przez Sorę. (Grafika: OpenAI)

Sora to nowy generatywny model sztucznej inteligencji firmy OpenAI, który działa podobnie do generatora obrazu Dall-E. Użytkownicy po prostu pytają o treść wideo , a Sora zwraca wysokiej jakości klip wideo. Potrafi również generować filmy ze statycznych obrazów, rozciągać filmy lub wypełniać puste klatki.

Wideo może stać się kolejnym obszarem rozwoju generatywnej sztucznej inteligencji, w miarę jak chatboty i generatory obrazów wkraczają do realnego świata. Choć entuzjaści sztucznej inteligencji z zadowoleniem przyjmują tę nową technologię, budzi ona również poważne obawy dotyczące dezinformacji w obliczu zbliżających się ważnych wyborów politycznych na świecie. Według danych firmy Clarity, zajmującej się uczeniem maszynowym, liczba deepfake'ów generowanych przez sztuczną inteligencję wzrosła o 900% rok do roku.

Dzięki Sora, OpenAI chce konkurować z narzędziami AI do generowania wideo od takich konkurentów jak Meta, Google i startupy, takie jak Stability AI. Amazon uruchomił również Create with Alexa, oparty na poleceniach model generowania krótkich, animowanych treści dla dzieci.

Sora może obecnie tworzyć filmy o długości maksymalnie minuty. Istnieje również niewielki zespół – „czerwony zespół” – który wykorzystuje ten model do wyszukiwania luk w zabezpieczeniach. OpenAI nie opublikowało żadnych publicznych wersji demonstracyjnych poza 10 przykładowymi klipami dostępnymi na swojej stronie internetowej.

OpenAI tworzy również klasyfikator, który będzie identyfikował klipy wideo jako produkty Sora i planuje uwzględnić w wynikach określone metadane, które ułatwią identyfikację treści generowanych przez sztuczną inteligencję. Działania te są podobne do tych, które Meta podejmuje w celu identyfikacji obrazów generowanych przez sztuczną inteligencję.

Sora, podobnie jak ChatGPT, wykorzystuje architekturę Transformer wprowadzoną przez badaczy Google w artykule z 2017 r.

(Według CNBC)