(Dan Tri) - ByteDance, het moederbedrijf van TikTok, verraste iedereen met de introductie van een AI-tool die video's met realistische content kan maken.
ByteDance, het technologiebedrijf achter het sociale netwerk TikTok, heeft zojuist een nieuw model voor kunstmatige intelligentie (AI) geïntroduceerd, genaamd OmniHuman-1, waarmee levensechte, levendige video's kunnen worden gemaakt.
ByteDance zei dat OmniHuman-1 gebaseerd is op deepfake-technologie, waardoor het video's met extreem vloeiende bewegingen kan maken en zeer moeilijk te herkennen is als een AI-product. ByteDance beweert vol vertrouwen dat zijn AI-tool producten kan creëren met een superieure kwaliteit in vergelijking met andere bestaande AI-videotools.
Video van de lezing van Albert Einstein, gemaakt door OmniHuman-1 op basis van de afbeelding van de wetenschapper (Video: ByteDance).
Volgens onderzoekers van ByteDance heeft OmniHuman-1 slechts één beeld en geluid nodig als sample, zoals de stem of zangstem van een willekeurig persoon. Op basis van deze data kan de AI-engine video's van elke gewenste lengte maken, met een stem of zangstem die identiek is aan de sample-audio.
OmniHuman-1 kan ook bestaande video's bewerken en aanpassen om de inhoud van de originele video te wijzigen.
Bovendien biedt OmniHuman-1 gebruikers de mogelijkheid om nieuwe video's te maken met vele visuele en audiostijlen, zoals geanimeerde video's of filmische of levensechte video's.
Video gemaakt door OmniHuman-1 op verzoek van de gebruiker (Video: ByteDance).
Gebruikers hoeven alleen maar eisen op te geven voor de beeldverhouding, lichaamsverhouding (portret, half lichaam, heel lichaam of alles in één). Deze AI-tool kan video's maken met het hoogste realisme, inclusief bewegingen, lichten, omgevingsdetails...
ByteDance heeft OmniHuman-1 nog niet officieel uitgebracht voor het publiek, maar het bedrijf heeft wel voorbeeldvideo's gedeeld die met de tool zijn gemaakt.
Er werd een 23 seconden durende video gemaakt van een afbeelding van Albert Einstein, waarin de beroemde wetenschapper een presentatie gaf, met levensechte gezichtsbewegingen en lipbewegingen.
In diverse andere korte video's die OmniHuman-1 heeft gemaakt, zijn mensen te zien die zich presenteren met levensechte gebaren en gezichtsuitdrukkingen.
Video van personages die presentaties geven, gemaakt door OmniHuman-1 op basis van stilstaande beelden (Video: ByteDance).
Demonstratievideo's van de mogelijkheden van OmniHuman-1 hebben de online gemeenschap en de technische gemeenschap versteld doen staan. Velen geven toe dat dit de meest realistische nepvideo is die ze ooit hebben gezien.
Onderzoekers van ByteDance zeggen dat ze een AI-model hebben gebouwd dat gegevens uit afbeeldingen, video's en geluiden kan combineren om realistische video's te maken, met gezichtsverhoudingen, lichaam, gezichtsuitdrukkingen, acties... zo menselijk mogelijk.
Volgens het onderzoeksteam bevatten de door AI gegenereerde video's natuurlijke gezichten, hoofdbewegingen en gebaren die passen bij de omgevingsgeluiden en -scènes. Dit draagt bij aan het 'realisme' van de video's.
ByteDance heeft nog niet bekendgemaakt wanneer OmniHuman-1 beschikbaar zal zijn voor gebruikers.
Video gemaakt door OmniHuman-1 op basis van afbeeldingen, waarop het landschap buiten het treinraam verandert alsof het echt is (Video: ByteDance).
De opkomst van OmniHuman-1 laat zien hoeveel AI-tools uit China ongelooflijk veel kunnen. Toch zijn veel mensen bezorgd dat OmniHuman-1 voor kwaadaardige doeleinden kan worden misbruikt, zoals het maken van nepvideo's van beroemdheden om valse informatie te delen, oplichting of zelfs het maken van neppornovideo's om te chanteren.
De race om AI-ontwikkeling tussen de VS en China wordt steeds spannender, omdat de twee grootmachten voortdurend AI-hulpmiddelen met superieure functies introduceren om hun tegenstanders te verslaan.
Een paar dagen geleden integreerde OpenAI ook een nieuwe functie in ChatGPT, waardoor de tool binnen enkele minuten een rapport kan samenstellen uit een enorme hoeveelheid data. Dit is een taak waar mensen normaal gesproken uren voor nodig hebben.
Deepfake is een technologie met kunstmatige intelligentie die gebruikmaakt van beeldsynthesetechnieken om een gezichtsafbeelding van iemand te combineren en over een video of afbeelding van een andere persoon heen te leggen.
Deepfake doorloopt een "leerproces", gebaseerd op invoergegevens om modellen te creëren en geschikte algoritmen te kiezen om continu te verwerken en van die modellen te leren. Na een leerperiode kan deepfake gezichten met een hoge nauwkeurigheid samenvoegen die met het blote oog moeilijk te herkennen is.
Bron: https://dantri.com.vn/suc-manh-so/cong-ty-trung-quoc-ra-mat-ai-tao-video-gia-mao-giong-het-nhu-that-20250206125927906.htm
Reactie (0)