Az OpenAI elindítja a szövegalapú videókészítő eszközt

[hirdetés_1]

A CNBC szerint az OpenAI bemutatta a Sorát – egy következő generációs mesterséges intelligencia modellt, amely hasonlóan működik, mint a korábbi DALL-E képgeneráló mesterséges intelligencia eszközük. A felhasználóknak csak meg kell adniuk a kívánt jelenetet, és a Sora egy nagy felbontású videoklipet ad vissza. A Sora állóképek ihlette videoklipeket is készíthet, és kibővítheti a meglévő videókat, vagy kitöltheti a hiányzó képkockákat.

OpenAI ra mắt công cụ sáng tạo video bằng văn bản- Ảnh 1. — Szamojéd és golden retriever kutyák játszanak egy neonfényes városban éjszaka egy mesterséges intelligencia által generált videóban

A videókészítés lehet a kreatív mesterséges intelligencia következő nagy lépése, miután a chatbotok és a képgenerátorok nemrégiben berobbantak a fogyasztói és üzleti világba. Míg a tartalomkészítés izgalomba hozza a mesterséges intelligencia rajongóit, ezek az új technológiák komoly aggodalmakat vetnek fel a félretájékoztatás miatt, ahogy közelednek a nagyobb globális politikai választások. A Clarity gépi tanulással foglalkozó cég adatai szerint a mesterséges intelligencia által generált deepfake-ek száma 900%-kal nőtt éves szinten.

A Sorával az OpenAI versenyre kíván kelni olyan cégek videógeneráló MI-eszközeivel, mint a Google és a Meta. Hasonló MI-eszközök más startupoktól is elérhetők, például a Stability AI-tól, amelynek Stable Video Diffusion nevű terméke van. Az Amazon kiadta a Create with Alexa modellt is, amely rövid animált tartalmak létrehozására specializálódott gyerekeknek parancsok alapján.

A Sora jelenleg legfeljebb egyperces videókat tud generálni. Az OpenAI a multimodalitást, egy olyan módszert tűzte ki célul, amely szöveg-, kép- és videógenerálást kombinál, hogy szélesebb körű MI-modelleket kínálhasson.

A Sora eddig csak egy kis csoportnyi biztonsági tesztelő, vagy „vörös csapat” számára volt elérhető, akiknek feladata a modell sebezhetőségeinek tesztelése olyan területeken, mint a félretájékoztatás. A cég a weboldalán elérhető 10 minta klipen kívül nem tett közzé nyilvános demókat, és azt állítja, hogy a kísérő műszaki dokumentáció hamarosan megjelenik.

Az OpenAI azt is állítja, hogy egy „észlelő osztályozót” épít, amely képes azonosítani a Sora által generált videoklipeket, és azt tervezi, hogy bizonyos metaadatokat is belefoglal a kimenetbe, hogy segítsen azonosítani a mesterséges intelligencia által generált tartalmat. A Meta ilyen típusú metaadatokat kíván használni a mesterséges intelligencia által generált képek azonosítására.

A Sora egy mesterséges intelligencia modell, amely a Google kutatói által 2017-ben egy tanulmányban bemutatott Transformer architektúrát használja. Bejelentésében az OpenAI azt állította, hogy a Sora alapul szolgál a valós világot megértő és szimuláló modellek számára.

[hirdetés_2]
Forráslink