ByteDances nye verktøy overgår alle konkurrentene med sikkerhet. Foto: ByteDance . |
ByteDance, morselskapet til TikTok og Douyin, har offisielt introdusert Seedance 1.0, et verktøy for kunstig intelligens (KI) som er i stand til å lage videoer fra tekst og bilder. Dette blir sett på som et viktig skritt for den kinesiske teknologigiganten i kappløpet om å utvikle KI-drevne plattformer for innholdsproduksjon.
Selskapet publiserte nylig en detaljert studie om Seedance 1.0. Ifølge studien er dette verktøyet utviklet for å konvertere enkle instruksjoner til video av høy kvalitet uten å kreve detaljerte skript eller komplekse kommandoer. Det håndterer ikke bare individuelle bilder, men kombinerer også flere kameravinkler, sikrer jevne overganger og opprettholder karakterkonsistens gjennom hele videoen.
«Vi har funnet en måte å skille romlig og tidsmessig informasjon i video. Denne teknologien bruker en spesiell metode for å «kode» plassering, noe som hjelper AI med å lære å lage videoer fra både tekst og bilder innenfor samme modell. Som et resultat kan AI automatisk lage videoer med flere forskjellige bilder uten problemer», uttalte ByteDance i forskningsartikkelen.
ByteDance hevder med sikkerhet at Seedance 1.0 overgår eksisterende AI-videoproduksjonsverktøy på markedet, spesielt når det gjelder evnen til å følge brukerideer nøye, bildeskarphet og naturlig karakterbevegelse.
Ifølge Artificial Analysis , en plattform som spesialiserer seg på å analysere og evaluere ytelsen til AI-modeller, har Seedance 1.0 overgått andre AI-verktøy for videoproduksjon, som Googles Veo 3, Kuaishous Kling 2.0 og OpenAIs Sora. Dette verktøyet viste overlegen ytelse i både tekst-til-video- og bilde-til-video-konverteringsoppgaver.
Selskapet avslørte også at Seedance 1.0 ble trent på en massiv database med videoer, samlet fra offentlig tilgjengelige og lisensierte kilder. Treningsvideoene gjennomgikk en grundig filtreringsprosess for å fjerne voldelig eller sensitivt innhold.
Mange tror at dataene hovedsakelig kommer fra TikTok og Douyin, to plattformer som drives av ByteDance selv.
Seedance 1.0-opplæringsprosessen er delt inn i flere faser: først læring fra rike bilde- og videodata, deretter fortsettelse av dyptgående læring om overgangsteknikker i ulike stiler.
Mennesker spiller også en avgjørende rolle i treningsprosessen, ettersom ingeniører velger videoer av høy kvalitet som modellen skal lære fra. Treningsløkken fortsetter inntil Seedance 1.0 uavhengig kan velge det optimale resultatet blant mange videoer generert på forespørsel.
For øyeblikket begrenser Seedance 1.0 videolengden til maksimalt 5 sekunder (sammenlignet med 8 sekunder for Veo 3). Dens fremste fordel er imidlertid den raske behandlingshastigheten: det tar bare 41 sekunder å lage en Full HD-video. En ulempe med Seedance 1.0 er at den ennå ikke støtter automatisk lydoverlegg slik som Googles motpart.
ByteDance planlegger å lansere dette verktøyet snart for både vanlige brukere og profesjonelle innholdsskapere, og dekker behovene for å produsere reklamevideoer eller kort innhold for sosiale medier.
Før Seedance 1.0 utviklet ByteDance AI-baserte videoverktøy som OmniHuman, Goku og Jimeng AI. Seedance 1.0 er imidlertid det første produktet som selskapet med sikkerhet hevder kan overgå konkurrentene innen AI-drevne videoproduksjonsmuligheter.
Kilde: https://znews.vn/cong-ty-me-tiktok-ra-mat-cong-nghe-thach-thuc-google-post1562025.html






Kommentar (0)