OpenAI spouští nástroj pro tvorbu textových videí

Podle CNBC společnost OpenAI právě představila Soru – model umělé inteligence nové generace, který funguje podobně jako jejich předchozí nástroj pro generování obrázků s využitím umělé inteligence DALL-E. Uživatelé stačí zadat požadovanou scénu a Sora vrátí videoklip ve vysokém rozlišení. Sora také dokáže vytvářet videoklipy inspirované statickými snímky a rozšiřovat stávající videa nebo doplňovat chybějící snímky.

OpenAI ra mắt công cụ sáng tạo video bằng văn bản- Ảnh 1. — Psi plemene samojed a zlatý retrívr dovádějí v noci po městě s neonovými světly ve videu generovaném umělou inteligencí

Tvorba videa by mohla být dalším velkým krokem pro kreativní umělou inteligenci, a to poté, co chatboti a generátory obrázků nedávno pronikly do spotřebitelského a obchodního světa. Zatímco tvorba obsahu nadchne nadšence do umělé inteligence, tyto nové technologie vyvolávají vážné obavy z dezinformací s blížícími se významnými globálními politickými volbami. Podle údajů společnosti Clarity, která se zabývá strojovým učením, se počet deepfakeů generovaných umělou inteligencí meziročně zvýšil o 900 %.

S platformou Sora se OpenAI snaží konkurovat nástrojům umělé inteligence pro generování videa od společností jako Google a Meta. Podobné nástroje umělé inteligence jsou k dispozici i od jiných startupů, jako je například Stability AI s produktem s názvem Stable Video Diffusion. Amazon také vydal model Create with Alexa, který se specializuje na vytváření krátkého animovaného obsahu pro děti na základě příkazů.

Sora je v současné době omezena na generování videí o délce jedné minuty nebo méně. OpenAI si ve snaze poskytnout širší sadu modelů umělé inteligence stanovila za cíl multimodalitu, tedy metodu kombinující generování textu, obrázků a videa.

Sora byla zatím zpřístupněna pouze malé skupině bezpečnostních testerů neboli „červených týmů“, jejichž úkolem je testovat model na zranitelnosti v oblastech, jako jsou dezinformace. Společnost nezveřejnila žádná veřejná dema kromě 10 ukázkových klipů dostupných na jejích webových stránkách a uvádí, že doprovodná technická dokumentace bude brzy zveřejněna.

OpenAI také uvádí, že vytváří „detekční klasifikátor“, který dokáže identifikovat videoklipy generované aplikací Sora, a plánuje do výstupu zahrnout určitá metadata, která pomohou identifikovat obsah generovaný umělou inteligencí. Právě tato metadata chce Meta použít k identifikaci obrázků generovaných umělou inteligencí.

Sora je model umělé inteligence, který využívá architekturu Transformer, kterou vědci z Googlu představili v roce 2017. OpenAI ve svém oznámení uvedla, že Sora slouží jako základ pro modely, které chápou a simulují reálný svět .

Zdrojový odkaz