(Dan Tri) - ByteDance, compania-mamă a TikTok, a surprins pe toată lumea când a introdus un instrument de inteligență artificială capabil să creeze videoclipuri cu conținut realist.
ByteDance, compania de tehnologie din spatele rețelei de socializare TikTok, a lansat un nou model de inteligență artificială (IA) numit OmniHuman-1, cu capacitatea de a crea videoclipuri realiste și vii.
ByteDance a declarat că OmniHuman-1 se bazează pe tehnologia deepfake, permițându-i să creeze videoclipuri cu mișcări extrem de fluide și fiind foarte greu de recunoscut ca produs de inteligență artificială. ByteDance susține cu încredere că instrumentul său de inteligență artificială poate crea produse cu o calitate superioară în comparație cu alte instrumente de creare video bazate pe inteligență artificială existente.
Videoclip cu discursul lui Albert Einstein creat de OmniHuman-1 din imaginea omului de știință (Video: ByteDance).
Conform cercetătorilor ByteDance, OmniHuman-1 are nevoie doar de o singură imagine și un singur sunet ca eșantion, cum ar fi vocea unei persoane aleatorii sau vocea cântată. Pe baza acestor date, motorul de inteligență artificială poate crea videoclipuri de orice lungime, cu o voce sau o voce cântată identică cu eșantionul audio.
OmniHuman-1 poate, de asemenea, edita și modifica videoclipuri existente pentru a schimba conținutul videoclipului original.
În plus, OmniHuman-1 permite utilizatorilor să creeze videoclipuri noi cu multe stiluri vizuale și audio, cum ar fi videoclipuri animate, în stil cinematografic sau videoclipuri realiste.
Videoclip creat de OmniHuman-1 la cererea utilizatorului (Video: ByteDance).
Utilizatorii trebuie doar să specifice cerințe privind raportul de aspect și raportul corpului (portret, jumătate de corp, corp întreg sau totul într-unul), acest instrument de inteligență artificială putând crea videoclipuri cu cel mai înalt realism, inclusiv mișcări, lumini, detalii din jur...
ByteDance nu a lansat încă oficial OmniHuman-1 publicului, dar compania a distribuit videoclipuri exemplu create de acest instrument.
Un videoclip de 23 de secunde a fost creat dintr-o imagine cu Albert Einstein, în care celebrul om de știință a ținut o prelegere, cu mișcări faciale și ale buzelor realiste.
Mai multe alte videoclipuri scurte create de OmniHuman-1 prezintă oameni prezentându-se cu gesturi și expresii faciale realiste.
Video cu personaje care susțin prezentări, creat de OmniHuman-1 din imagini statice (Video: ByteDance).
Videoclipurile demonstrative ale capacităților OmniHuman-1 au uimit comunitatea online și comunitatea tehnologică, mulți recunoscând că acesta este cel mai realist videoclip fals pe care l-au văzut vreodată.
Cercetătorii de la ByteDance au declarat că au construit un model de inteligență artificială cu capacitatea de a combina date din imagini, videoclipuri și sunete pentru a crea videoclipuri realiste, cu proporții faciale, corp, expresii faciale, acțiuni... cât mai asemănătoare cu cele umane.
Echipa de cercetare a declarat că videoclipurile generate de inteligența artificială prezintă fețe naturale, mișcări ale capului, gesturi... care se potrivesc cu sunetele și scenele din jur, contribuind la creșterea „realismului” videoclipurilor.
ByteDance nu a dezvăluit încă când va fi disponibil OmniHuman-1 pentru utilizatori.
Video creat de OmniHuman-1 din imagini, cu peisajul din afara ferestrei trenului schimbându-se ca și cum ar fi real (Video: ByteDance).
Apariția OmniHuman-1 demonstrează capacitățile incredibile ale instrumentelor de inteligență artificială provenite din China, însă mulți oameni sunt îngrijorați că OmniHuman-1 ar putea fi exploatat în scopuri rău intenționate, cum ar fi crearea de videoclipuri false cu celebrități pentru a distribui informații false, escrocherii sau chiar crearea de videoclipuri porno false pentru șantaj.
Cursa dezvoltării inteligenței artificiale devine din ce în ce mai intensă între SUA și China, deoarece cele două superputeri introduc continuu instrumente de inteligență artificială cu caracteristici superioare pentru a-și învinge adversarii.
Acum câteva zile, OpenAI a integrat și o nouă funcționalitate în ChatGPT, permițând instrumentului să completeze un raport dintr-o cantitate imensă de date în doar câteva minute, o sarcină care ar dura ore întregi pentru a fi finalizată de oameni.
Deepfake este o tehnologie de inteligență artificială care folosește tehnici de sinteză a imaginilor cuiva pentru a combina și suprapune imaginea feței peste un videoclip sau o imagine a altei persoane.
Deepfake va trece printr-un „proces de învățare”, bazat pe datele de intrare pentru a crea modele și a alege algoritmi adecvați pentru a procesa continuu și a învăța din aceste modele. După o perioadă de „învățare”, deepfake poate îmbina fețe cu o precizie ridicată, dificil de recunoscut cu ochiul liber.
Sursă: https://dantri.com.vn/suc-manh-so/cong-ty-trung-quoc-ra-mat-ai-tao-video-gia-mao-giong-het-nhu-that-20250206125927906.htm
Comentariu (0)