Nowe narzędzie ByteDance z pewnością przewyższa wszystkich konkurentów. Zdjęcie: ByteDance . |
ByteDance, spółka macierzysta TikToka i Douyin, oficjalnie zaprezentowała Seedance 1.0, narzędzie oparte na sztucznej inteligencji (AI) umożliwiające tworzenie filmów z tekstu i obrazów. Jest to postrzegane jako znaczący krok dla chińskiego giganta technologicznego w wyścigu o rozwój platform do tworzenia treści opartych na AI.
Firma opublikowała niedawno szczegółowe badanie dotyczące Seedance 1.0. Według badania, narzędzie to zostało zaprojektowane do konwersji prostych instrukcji na wysokiej jakości wideo bez konieczności stosowania szczegółowych skryptów czy skomplikowanych poleceń. Obsługuje nie tylko pojedyncze ujęcia, ale także łączy wiele ujęć kamery, zapewnia płynne przejścia i zachowuje spójność postaci w całym filmie.
„Znaleźliśmy sposób na oddzielenie informacji przestrzennych od czasowych w wideo. Technologia ta wykorzystuje specjalną metodę „kodowania” lokalizacji, pomagając sztucznej inteligencji uczyć się tworzenia filmów z tekstu i obrazów w ramach tego samego modelu. W rezultacie sztuczna inteligencja może automatycznie i płynnie tworzyć filmy z wieloma różnymi ujęciami” – stwierdził ByteDance w artykule badawczym.
ByteDance z przekonaniem twierdzi, że Seedance 1.0 przewyższa istniejące na rynku narzędzia do tworzenia filmów wykorzystujące sztuczną inteligencję, zwłaszcza jeśli chodzi o możliwość dokładnego podążania za pomysłami użytkownika, ostrość obrazu i naturalny ruch postaci.
Według Artificial Analysis , platformy specjalizującej się w analizie i ocenie wydajności modeli AI, Seedance 1.0 przewyższyło inne narzędzia do tworzenia filmów oparte na AI, takie jak Veo 3 firmy Google, Kling 2.0 firmy Kuaishou i Sora firmy OpenAI. Narzędzie to wykazało lepszą wydajność zarówno w zadaniach konwersji tekstu na wideo, jak i obrazu na wideo.
Firma ujawniła również, że program Seedance 1.0 został przeszkolony na ogromnej bazie filmów, zebranych z publicznie dostępnych i licencjonowanych źródeł. Filmy szkoleniowe przeszły rygorystyczny proces filtrowania w celu usunięcia treści zawierających przemoc lub treści drażliwe.
Wiele osób uważa, że dane pochodzą głównie z TikToka i Douyin, dwóch platform obsługiwanych przez sam ByteDance.
Proces szkoleniowy Seedance 1.0 podzielony jest na kilka etapów: początkowo nauka w oparciu o bogate dane obrazowe i wideo, a następnie dogłębna nauka technik przejść w różnych stylach.
Ludzie również odgrywają kluczową rolę w procesie szkolenia, ponieważ inżynierowie wybierają wysokiej jakości filmy, z których model będzie się uczył. Pętla szkoleniowa trwa do momentu, aż Seedance 1.0 samodzielnie wybierze optymalny wynik spośród wielu filmów generowanych na żądanie.
Obecnie Seedance 1.0 ogranicza długość filmu do maksymalnie 5 sekund (w porównaniu do 8 sekund w Veo 3). Jednak jego główną zaletą jest szybkość przetwarzania: utworzenie filmu Full HD zajmuje zaledwie 41 sekund. Wadą Seedance 1.0 jest to, że nie obsługuje jeszcze automatycznego nakładania dźwięku, tak jak jego odpowiednik Google.
ByteDance planuje niebawem udostępnić to narzędzie zarówno zwykłym użytkownikom, jak i profesjonalnym twórcom treści. Będzie ono odpowiadać na potrzeby producentów filmów promocyjnych lub krótkich treści do mediów społecznościowych.
Przed premierą Seedance 1.0, ByteDance opracowało narzędzia do tworzenia filmów z wykorzystaniem sztucznej inteligencji, takie jak OmniHuman, Goku i Jimeng AI. Jednak Seedance 1.0 to pierwszy produkt, który – jak twierdzi firma – może przewyższyć konkurencję pod względem możliwości tworzenia filmów z wykorzystaniem sztucznej inteligencji.
Źródło: https://znews.vn/cong-ty-me-tiktok-ra-mat-cong-nghe-thach-thuc-google-post1562025.html






Komentarz (0)