Omnimodální model s názvem OmniHuman-1 dokáže podle vývojového týmu ByteDance vytvářet dynamická videa postav, které mluví, zpívají a pohybují se, s „vynikající kvalitou ve srovnání se současnými metodami tvorby videa“.

Technologie umělé inteligence, která vytváří realistické obrázky, videa a zvuk, známá také jako „deepfake“, se stále častěji používá v podvodech a zábavním průmyslu.

ByteDance je v současnosti jednou z nejžhavějších společností v oblasti umělé inteligence v Číně. Aplikace Doubao od této společnosti je nejoblíbenější mezi uživateli v pevninské Číně.

Ačkoli OmniHuman-1 dosud nebyl široce zveřejněn, ukázková videa se rychle rozšířila.

Jednou z vynikajících ukázek bylo 23sekundové video zobrazující Alberta Einsteina při projevu. TechCrunch popsal výstup aplikace jako „šokujícím způsobem úžasný“ a „dosud nejrealističtější deepfake videa“.

Vývojáři tvrdí, že OmniHuman-1 potřebuje k vytvoření videa libovolné délky pouze jeden obrázek jako referenční data a zvuková data, jako je řeč nebo zpěv.

Snímkovou frekvenci výstupního videa lze upravit, stejně jako „tělesné proporce“ postav v něm.

d6a434e5a4dc974582b09c05b3646092afcf9490.jpeg
ByteDance je v současnosti jednou z nejvýznamnějších společností v oblasti umělé inteligence v Číně. Foto: TechCrunch

Model umělé inteligence, trénovaný na 19 000 hodinách video obsahu z nepublikovaných zdrojů, je navíc schopen upravovat existující videa a dokonce i přesvědčivě měnit pohyby lidských rukou a nohou.

ByteDance však také připustil, že OmniHuman-1 není dokonalý, protože stále bojuje s určitými pózami a že „referenční snímky nízké kvality“ nevytvoří nejlepší video.

Nový model umělé inteligence od ByteDance demonstruje pokrok Číny navzdory snahám Washingtonu omezit vývoz technologií.

Obavy

V loňském roce se politické deepfaky rozšířily po celém světě. V Moldavsku deepfake videa napodobovala prezidentku země Maiu Sanduovou při jejím rezignačním projevu.

A v Jihoafrické republice se před volbami v zemi stal virálním deepfake, na kterém rapper Eminem podporuje jihoafrickou opoziční stranu.

Deepfakes se také stále častěji používají k páchání finanční kriminality. Spotřebitelé jsou podváděni deepfaky celebrit, které doporučují investice a nabízejí falešné investiční příležitosti, zatímco společnosti přicházejí o miliony dolarů kvůli imitátorům vrcholových manažerů.

Podle společnosti Deloitte přispěl obsah generovaný umělou inteligencí v roce 2023 ke ztrátám způsobeným podvody ve výši přes 12 miliard dolarů a do roku 2027 by v USA mohl dosáhnout 40 miliard dolarů.

Loni v únoru stovky lidí z komunity umělé inteligence podepsaly dopis požadující přísnější regulaci deepfakes. I když v USA neexistují žádné federální zákony, které by deepfakes kriminalizovaly, více než 10 států přijalo zákony proti padělání s využitím umělé inteligence.

Odhalování deepfaků však není snadné. Přestože některé platformy sociálních médií a vyhledávače zavedly opatření k omezení jejich šíření, množství deepfake obsahu online stále roste alarmujícím tempem.

V průzkumu společnosti Jumio, která se zabývá ověřováním identity, z května 2024 uvedlo 60 % účastníků, že se v uplynulém roce setkali s deepfakeem; 72 % respondentů uvedlo, že se obávají, že je deepfakey denně podvádějí, zatímco většina podpořila schválení legislativy, která by řešila šíření falešných videí generovaných umělou inteligencí.

Google „schválil“ používání umělé inteligence v technologiích zbraní a sledování . Google porušil svůj slib, že nebude navrhovat a nasazovat nástroje umělé inteligence pro použití v technologiích zbraní a sledování.