Riziko, že se umělá inteligence vymkne kontrole.

Tạp chí Doanh Nghiệp•24/02/2024

Rozvoj umělé inteligence s sebou nese pozitivní i negativní aspekty. A s příchodem Sory se tato technologie stane žádanější než kdy dříve.

Sora – „nový horizont“ OpenAI

Soralá představuje pro OpenAI velký skok vpřed, protože umožňuje převod textu do obrázků s neuvěřitelnou kvalitou.

V japonštině znamená „Sora“ nebe. Výzkumný tým, který stojí za touto technologií, zvolil název Sora, protože evokuje myšlenku neomezeného tvůrčího potenciálu.

Sora dokáže vytvářet animace s více postavami, pohyby a detailním pozadím. Tento nástroj nejen rozumí příkazům, ale také tomu, jak jsou znázorněny ve skutečnosti. Má se za to, že má potenciál urychlit práci filmařů a zcela nahradit méně zkušené grafické inženýry.

Sora není jediný program s umělou inteligencí, který úspěšně převedl text na obrázky. Během uplynulého roku se totéž podařilo i několika dalším softwarovým programům. Produkty vytvořené pomocí technologie umělé inteligence jsou stále sofistikovanější a realističtější.

Soraova špičková technologie

Aby Sora mohl vytvářet realisticky vypadající videa , musí rozumět jazyku, požadavkům a příkazům uživatele. Tím to ale nekončí; Sora také potřebuje rozumět fyzikálním zákonům, tomu, jak se objekty pohybují a jak se mění světlo a stín s pohybem postavy.

Například instrukce zněla, že dívka má v noci jít po tokijské ulici. A produkt, který Sora vytvořila, byl naprosto dokonalý. Pokud se nepodíváte pozorně, drobné nedostatky ve videu byste si nevšimli.

Video je z 99 % realistické, s živými detaily, jako jsou pouliční lampy vrhající stíny skrz kaluže dešťové vody na zemi. Tyto prvky nejsou uvedeny v návodu; umělá inteligence rozumí zákonům fyziky reálného světa a vytváří je automaticky.

Podle AI news je technologie, na které je Sora založena, částečně založena na GPT-4. Jedná se o rozsáhlý multimodální model, který dokáže zpracovávat textové a obrazové vstupy. GPT-4 aktualizuje rozsáhlý jazykový model OpenAI, který je trénován na velkém množství online dat a generuje komplexní odpovědi na uživatelské dotazy.

Zbytek Sory je difuzní model, který transformuje statický šum na koherentní video postupným snižováním tohoto šumu v několika krocích. Sora také používá podobnou technologii jako Dalle-3: převádí text na obrázky, v tomto případě neuvěřitelně realistická videa.

Jaký dopad bude mít umělá inteligence na kreativní oblast?

Lidé pracující ve výtvarném umění, kinematografii a grafickém designu se velmi zajímají o rozvoj umělé inteligence. V Hollywoodu, světové filmové metropoli, experti změřili dopad umělé inteligence.

Podle zprávy 21,4 % filmařů, televizních producentů a animátorů v Hollywoodu předpovídá, že budou do roku 2026 nahrazeni umělou inteligencí.

Netflix loni v létě začal s náborem na pozici produktového manažera pro umělou inteligenci s přemrštěným platem v rozmezí od 300 000 do 900 000 dolarů, což je desítkykrát více než plat průměrného neznámého herce.

Obavy z nekontrolovaného rozvoje umělé inteligence.

Trend umělé inteligence je jako velká vlna. Pokud se naučíte surfovat, abyste vždy zůstali na vrcholu vlny, je pravděpodobné, že vy i vaše práce a pozice budete mít jistotu, a možná se vám dokonce bude dařit.

Příležitosti však vždy přicházejí s riziky. Tyto pokročilé programy umělé inteligence také představují rizika. A s nepředstavitelným rozvojem umělé inteligence se tato rizika stávají ještě znepokojivějšími.

Podle Dr. Trana Van Canha, datového vědce na Fakultě informačních technologií Univerzity v Heidelbergu v Německu, ačkoli má současný model Sora mnoho nedostatků, jako je zaměňování levé a pravé strany nebo neschopnost udržet souvislý obraz v celém videu, je riziko, že Sora generuje dezinformace, zcela možné, což ještě více ztěžuje určení pravdy na internetu.

„S aplikací Sora je rozlišování mezi skutečnými a falešnými zprávami velmi obtížné, protože videa vytvořená aplikací Sora jsou vysoce autentická. OpenAI sama hledá řešení, jak tento problém zmírnit, musíme však akceptovat, že neexistuje žádné spolehlivé řešení. V budoucnu aplikace umožní uživatelům poskytovat obrázky a text k vytváření nových videí, čímž se velmi usnadní falšování prohlášení vlivných osobností z celého světa, což veřejnosti způsobí značné škody,“ poznamenal Dr. Tran Van Canh.

Před Sora vydala společnost OpenAI dva produkty, včetně ChatGPT, který dokáže generovat text podobný lidskému, a technologie DALL-E, která vytváří „Deepfakes“ – techniku využívající umělou inteligenci k vytváření falešných zvuků, obrázků a videí. Obětí Deepfakes se stalo mnoho lidí, od papeže a bývalého amerického prezidenta Donalda Trumpa až po nedávný případ popové hvězdy Taylor Swift, jejíž obličej byl překryt za účelem vytvoření falešných pornografických obrázků.

„OpenAI je ve skutečnosti průkopnickou společností v oblasti technologie GenAI. Mají velmi vynikající tým vědců . Financování, které investují do modelů umělé inteligence, lidských zdrojů a strojového učení, je obrovské, takže produkty, které OpenAI vytváří, mají velmi vysokou míru realismu,“ řekl Dr. Tran Van Canh.

To ukazuje, že rozvoj umělé inteligence přináší do neustále se vyvíjejícího světa internetu pozitivní i negativní aspekty. A s nástupem Sory se předpokládá, že technologický závod bude ještě horší než kdy dříve. V současné době velké technologické společnosti jako Meta, Google a Runway AI také zkoumají a vyvíjejí technologie umělé inteligence pro vytváření videí z textu a oznámily několik podobných modelů.

Podle VTV

Zdroj