ByteDances nya verktyg överträffar med säkerhet alla konkurrenter. Foto: ByteDance . |
ByteDance, moderbolaget till TikTok och Douyin, har officiellt introducerat Seedance 1.0, ett verktyg för artificiell intelligens (AI) som kan skapa videor från text och bilder. Detta ses som ett viktigt steg för den kinesiska teknikjätten i kapplöpningen om att utveckla AI-drivna plattformar för innehållsskapande.
Företaget publicerade nyligen en detaljerad studie om Seedance 1.0. Enligt studien är verktyget utformat för att konvertera enkla instruktioner till högkvalitativ video utan att kräva detaljerade manus eller komplexa kommandon. Det hanterar inte bara enskilda bilder utan kombinerar även flera kameravinklar, säkerställer smidiga övergångar och bibehåller karaktärskonsekvens genom hela videon.
”Vi har hittat ett sätt att separera rumslig och temporal information i video. Den här tekniken använder en speciell metod för att ’koda’ plats, vilket hjälper AI att lära sig att skapa videor från både text och bilder inom samma modell. Som ett resultat kan AI automatiskt skapa videor med flera olika tagningar smidigt”, konstaterade ByteDance i forskningsrapporten.
ByteDance hävdar med säkerhet att Seedance 1.0 överträffar befintliga AI-verktyg för videoskapande på marknaden, särskilt i sin förmåga att noggrant följa användarnas idéer, bildskärpa och naturliga karaktärsrörelser.
Enligt Artificial Analysis , en plattform som specialiserar sig på att analysera och utvärdera prestandan hos AI-modeller, har Seedance 1.0 överträffat andra AI-verktyg för videoskapande som Googles Veo 3, Kuaishous Kling 2.0 och OpenAIs Sora. Detta verktyg visade överlägsen prestanda i både text-till-video- och bild-till-video-konverteringsuppgifter.
Företaget avslöjade också att Seedance 1.0 tränades på en massiv databas med videor, insamlade från offentligt tillgängliga och licensierade källor. Träningsvideorna genomgick en rigorös filtreringsprocess för att ta bort våldsamt eller känsligt innehåll.
Många tror att informationen främst kommer från TikTok och Douyin, två plattformar som drivs av ByteDance själva.
Seedance 1.0-utbildningsprocessen är uppdelad i flera steg: initialt lär man sig från omfattande bild- och videodata, och sedan fortsätter man med att lära sig djupare om övergångstekniker i olika stilar.
Människor spelar också en avgörande roll i träningsprocessen, eftersom ingenjörer väljer högkvalitativa videor som modellen kan lära sig av. Träningsslingan fortsätter tills Seedance 1.0 självständigt kan välja det optimala resultatet bland många videor som genereras på begäran.
För närvarande begränsar Seedance 1.0 videolängden till maximalt 5 sekunder (jämfört med 8 sekunder för Veo 3). Dess framträdande fördel är dock den snabba bearbetningshastigheten: det tar bara 41 sekunder att skapa en Full HD-video. En nackdel med Seedance 1.0 är att den ännu inte stöder automatisk ljudöverlagring som dess motsvarighet från Google.
ByteDance planerar att släppa det här verktyget snart för både vanliga användare och professionella innehållsskapare, vilket tillgodoser behoven av att producera reklamvideor eller kort innehåll för sociala medier.
Innan Seedance 1.0 hade ByteDance utvecklat AI-verktyg för videoskapande som OmniHuman, Goku och Jimeng AI. Seedance 1.0 är dock den första produkten som företaget med säkerhet hävdar kan överträffa sina konkurrenter i AI-drivna videoskapandefunktioner.
Källa: https://znews.vn/cong-ty-me-tiktok-ra-mat-cong-nghe-thach-thuc-google-post1562025.html






Kommentar (0)