OpenAI wprowadza narzędzie do tworzenia filmów w oparciu o tekst

[reklama_1]

Według CNBC , OpenAI właśnie zaprezentowało Sora – model sztucznej inteligencji nowej generacji, który działa podobnie do ich poprzedniego narzędzia do generowania obrazu DALL-E. Wystarczy, że użytkownik wprowadzi żądaną scenę, a Sora zwróci klip wideo w wysokiej rozdzielczości. Sora może również tworzyć klipy wideo inspirowane nieruchomymi obrazami, rozszerzać istniejące nagrania lub uzupełniać brakujące klatki.

OpenAI ra mắt công cụ sáng tạo video bằng văn bản- Ảnh 1. — Psy rasy samoyed i golden retriever hasają nocą po mieście oświetlonym neonami na nagraniu wideo wygenerowanym przez sztuczną inteligencję

Tworzenie filmów może być kolejnym wielkim krokiem dla kreatywnej sztucznej inteligencji (AI), po tym jak chatboty i generatory obrazów niedawno wkroczyły do świata konsumentów i biznesu. Chociaż tworzenie treści z pewnością zachwyci entuzjastów sztucznej inteligencji, te nowe technologie budzą poważne obawy dotyczące dezinformacji w obliczu zbliżających się ważnych wyborów politycznych na świecie. Według danych firmy Clarity, zajmującej się uczeniem maszynowym, liczba deepfake'ów generowanych przez AI wzrosła o 900% rok do roku.

Dzięki Sora, OpenAI chce konkurować z narzędziami AI do generowania wideo od firm takich jak Google i Meta. Podobne narzędzia AI oferują inne startupy, takie jak Stability AI, który oferuje produkt o nazwie Stable Video Diffusion. Amazon wprowadził również na rynek Create with Alexa, model specjalizujący się w tworzeniu krótkich, animowanych treści dla dzieci w oparciu o polecenia głosowe.

Sora jest obecnie ograniczona do generowania filmów o długości minuty lub krótszej. OpenAI obrał sobie za cel multimodalność, metodę łączącą generowanie tekstu, obrazu i wideo, aby zapewnić szerszy zestaw modeli AI.

Do tej pory Sora była dostępna jedynie dla niewielkiej grupy testerów bezpieczeństwa, tzw. „czerwonych zespołów”, których zadaniem jest testowanie modelu pod kątem luk w zabezpieczeniach, takich jak dezinformacja. Firma nie opublikowała żadnych publicznych wersji demonstracyjnych poza 10 przykładowymi klipami dostępnymi na swojej stronie internetowej i zapowiada, że wkrótce zostanie opublikowana towarzysząca im dokumentacja techniczna.

OpenAI twierdzi również, że opracowuje „klasyfikator detekcji”, który będzie w stanie identyfikować klipy wideo wygenerowane przez Sora, i planuje uwzględnić w wynikach określone metadane, które ułatwią identyfikację treści generowanych przez sztuczną inteligencję. Właśnie tego rodzaju metadane Meta chce wykorzystać do identyfikacji obrazów generowanych przez sztuczną inteligencję.

Sora to model sztucznej inteligencji wykorzystujący architekturę Transformer, którą badacze Google przedstawili w artykule opublikowanym w 2017 r. W swoim ogłoszeniu firma OpenAI stwierdziła, że Sora stanowi podstawę dla modeli, które rozumieją i symulują rzeczywisty świat .

Link źródłowy