Sora to nowy generatywny model sztucznej inteligencji firmy OpenAI, który działa podobnie do generatora obrazu Dall-E. Użytkownicy po prostu pytają o treść wideo , a Sora zwraca wysokiej jakości klip wideo. Potrafi również generować filmy ze statycznych obrazów, rozciągać filmy lub wypełniać puste klatki.
Wideo może stać się kolejnym obszarem rozwoju generatywnej sztucznej inteligencji, w miarę jak chatboty i generatory obrazów wkraczają do realnego świata. Choć entuzjaści sztucznej inteligencji z zadowoleniem przyjmują tę nową technologię, budzi ona również poważne obawy dotyczące dezinformacji w obliczu zbliżających się ważnych wyborów politycznych na świecie. Według danych firmy Clarity, zajmującej się uczeniem maszynowym, liczba deepfake'ów generowanych przez sztuczną inteligencję wzrosła o 900% rok do roku.
Dzięki Sora, OpenAI chce konkurować z narzędziami AI do generowania wideo od takich konkurentów jak Meta, Google i startupy, takie jak Stability AI. Amazon uruchomił również Create with Alexa, oparty na poleceniach model generowania krótkich, animowanych treści dla dzieci.
Sora może obecnie tworzyć filmy o długości maksymalnie minuty. Istnieje również niewielki zespół – „czerwony zespół” – który wykorzystuje ten model do wyszukiwania luk w zabezpieczeniach. OpenAI nie opublikowało żadnych publicznych wersji demonstracyjnych poza 10 przykładowymi klipami dostępnymi na swojej stronie internetowej.
OpenAI tworzy również klasyfikator, który będzie identyfikował klipy wideo jako produkty Sora i planuje uwzględnić w wynikach określone metadane, które ułatwią identyfikację treści generowanych przez sztuczną inteligencję. Działania te są podobne do tych, które Meta podejmuje w celu identyfikacji obrazów generowanych przez sztuczną inteligencję.
Sora, podobnie jak ChatGPT, wykorzystuje architekturę Transformer wprowadzoną przez badaczy Google w artykule z 2017 r.
(Według CNBC)
Źródło
Komentarz (0)