틱톡의 모회사가 구글에 도전할 기술을 출시했다.

바이트댄스 의 새로운 도구는 모든 경쟁사를 압도적으로 능가합니다. 사진: 바이트댄스 .

틱톡과 더우인의 모회사인 바이트댄스가 텍스트와 이미지를 이용해 동영상을 제작할 수 있는 인공지능(AI) 도구인 시드댄스 1.0을 공식 출시했습니다. 이는 AI 기반 콘텐츠 제작 플랫폼 개발 경쟁에서 중국 기술 대기업인 바이트댄스가 거둔 중요한 진전으로 평가됩니다.

최근 Seedance 1.0에 대한 상세한 연구 보고서를 발표한 회사 측에 따르면, 이 도구는 복잡한 스크립트나 명령 없이도 간단한 지시사항을 고품질 영상으로 변환하도록 설계되었습니다. 개별 장면뿐만 아니라 여러 카메라 앵글을 결합하고, 부드러운 전환을 보장하며, 영상 전체에 걸쳐 캐릭터의 일관성을 유지합니다.

바이트댄스는 연구 논문에서 "비디오에서 공간 정보와 시간 정보를 분리하는 방법을 개발했습니다. 이 기술은 위치 정보를 '인코딩'하는 특수 방식을 사용하여 AI가 동일한 모델 내에서 텍스트와 이미지를 모두 활용하여 비디오를 생성하는 방법을 학습하도록 돕습니다. 결과적으로 AI는 여러 장면을 매끄럽게 결합하여 자동으로 비디오를 제작할 수 있습니다."라고 밝혔습니다.

바이트댄스는 Seedance 1.0이 특히 사용자의 아이디어를 정확하게 따라가는 능력, 이미지 선명도, 자연스러운 캐릭터 움직임 면에서 시중에 나와 있는 기존 AI 비디오 제작 도구를 능가한다고 자신 있게 주장합니다.

인공지능 모델 성능 분석 및 평가 전문 플랫폼인 Artificial Analysis 에 따르면, Seedance 1.0은 Google의 Veo 3, Kuaishou의 Kling 2.0, OpenAI의 Sora 등 다른 AI 비디오 제작 도구를 능가하는 성능을 보였습니다. 이 도구는 텍스트를 비디오로 변환하는 작업과 이미지를 비디오로 변환하는 작업 모두에서 뛰어난 성능을 입증했습니다.

또한 Seedance 1.0은 공개적으로 이용 가능하고 라이선스가 있는 소스에서 수집한 방대한 비디오 데이터베이스를 기반으로 학습되었다고 회사 측은 밝혔습니다. 학습 비디오는 폭력적이거나 민감한 콘텐츠를 제거하기 위해 엄격한 필터링 과정을 거쳤습니다.

많은 사람들은 해당 데이터가 주로 바이트댄스가 운영하는 틱톡과 더우인이라는 두 플랫폼에서 나온 것이라고 믿습니다.

Seedance 1.0 학습 과정은 여러 단계로 나뉩니다. 초기에는 풍부한 이미지 및 비디오 데이터를 통해 학습하고, 이후에는 다양한 스타일의 전환 기법에 대해 심도 있게 학습합니다.

엔지니어들이 모델 학습에 사용할 고품질 영상을 선별하는 등, 인간의 역할 또한 훈련 과정에서 매우 중요합니다. 이러한 훈련 과정은 Seedance 1.0이 필요에 따라 생성된 수많은 영상 중에서 최적의 결과를 스스로 선택할 수 있을 때까지 계속됩니다.

현재 Seedance 1.0은 동영상 길이를 최대 5초로 제한합니다(Veo 3는 8초). 하지만 Seedance 1.0의 가장 큰 장점은 빠른 처리 속도입니다. Full HD 동영상을 생성하는 데 단 41초밖에 걸리지 않습니다. Seedance 1.0의 한 가지 단점은 Google의 Veo 3처럼 자동 사운드 오버레이 기능을 아직 지원하지 않는다는 점입니다.

바이트댄스는 일반 사용자와 전문 콘텐츠 제작자 모두를 위해 이 도구를 곧 출시할 예정이며, 홍보 영상이나 소셜 미디어용 짧은 콘텐츠 제작에 필요한 기능을 제공할 것입니다.

Seedance 1.0 출시 이전에도 ByteDance는 OmniHuman, Goku, Jimeng AI와 같은 AI 기반 영상 제작 도구를 개발해 왔습니다. 그러나 Seedance 1.0은 ByteDance가 AI 기반 영상 제작 기능에서 경쟁사를 능가할 수 있다고 자신 있게 주장하는 첫 번째 제품입니다.

출처: https://znews.vn/cong-ty-me-tiktok-ra-mat-cong-nghe-thach-thuc-google-post1562025.html