Den omnimodale modellen, kalt OmniHuman-1, kan lage dynamiske videoer av karakterer som snakker, synger og beveger seg med «overlegen kvalitet sammenlignet med nåværende videoproduksjonsmetoder», ifølge ByteDance-utviklingsteamet.

AI-teknologi som lager realistiske bilder, videoer og lyd, også kjent som «deepfake», brukes i økende grad i svindel og underholdning.

ByteDance er for tiden et av de heteste AI-selskapene i Kina. Selskapets Doubao-app er den mest populære blant brukere på fastlandet.

Selv om OmniHuman-1 ikke har blitt bredt utgitt for offentligheten ennå, har eksempelvideoer raskt spredt seg mye.

En demonstrasjon som skilte seg ut var en 23 sekunder lang video som viste Albert Einstein holde en tale. TechCrunch beskrev appens resultater som «sjokkerende fantastiske» og «de mest realistiske deepfake-videoene til dags dato».

Utviklerne sier at OmniHuman-1 bare trenger ett enkelt bilde som referansedata sammen med lyddata som tale eller sang for å lage en video av hvilken som helst lengde.

Bildefrekvensen for utgående video kan justeres, i likhet med "kroppsproporsjonene" til karakterene i den.

d6a434e5a4dc974582b09c05b3646092afcf9490.jpeg
ByteDance er for tiden et av de mest fremtredende AI-selskapene i Kina. Foto: TechCrunch

Videre er AI-modellen, trent på 19 000 timer med videoinnhold fra upubliserte kilder, i stand til å redigere eksisterende videoer og til og med endre menneskelige hender og føtter med en overbevisende grad.

ByteDance innrømmet imidlertid også at OmniHuman-1 ikke er perfekt, ettersom den fortsatt sliter med visse positurer, og at «referansebilder av lav kvalitet» ikke vil produsere den beste videoen.

ByteDances nye AI-modell demonstrerer Kinas fremgang til tross for Washingtons forsøk på å begrense teknologieksport.

Bekymringer

I fjor spredte politiske deepfakes seg globalt. I Moldova etterlignet deepfake-videoer landets president, Maia Sandu, da hun holdt sin avskjedstale.

Og i Sør-Afrika har en deepfake av rapperen Eminem som støtter et sørafrikansk opposisjonsparti gått viralt før landets valg.

Deepfakes brukes også i økende grad til å begå økonomisk kriminalitet. Forbrukere blir svindlet av deepfakes av kjendiser som anbefaler investeringer og tilbyr falske investeringsmuligheter, mens selskaper taper millioner av dollar på etterligninger av toppledere.

Ifølge Deloitte bidro AI-generert innhold til over 12 milliarder dollar i svindeltap i 2023, og kan nå 40 milliarder dollar i USA innen 2027.

I februar i fjor signerte hundrevis av mennesker i AI-miljøet et brev der de ba om strengere reguleringer av deepfakes. Selv om det ikke finnes noen føderale lover som kriminaliserer deepfakes i USA, har mer enn 10 stater vedtatt lover mot AI-drevet forfalskning.

Det er imidlertid ikke lett å oppdage deepfakes. Selv om noen sosiale medieplattformer og søkemotorer har iverksatt tiltak for å begrense spredningen, vokser mengden deepfake-innhold på nettet fortsatt i et alarmerende tempo.

I en undersøkelse fra mai 2024 utført av identitetsverifiseringsselskapet Jumio, rapporterte 60 % av deltakerne at de hadde opplevd en deepfake i løpet av det siste året; 72 % av respondentene sa at de var bekymret for å bli lurt av deepfakes daglig, mens et flertall støttet vedtak av lovgivning for å håndtere spredningen av AI-genererte falske videoer.

Google gir grønt lys for bruk av kunstig intelligens i våpen og overvåkingsteknologi . Google har brutt løftet sitt om ikke å designe og distribuere kunstig intelligens-verktøy for bruk i våpen og overvåkingsteknologi.