ByteDance 의 새로운 도구는 모든 경쟁사를 자신 있게 능가합니다. 사진: ByteDance . |
틱톡과 더우인의 모회사인 바이트댄스가 텍스트와 이미지로 영상을 제작할 수 있는 인공지능(AI) 도구인 시드댄스 1.0을 공식 출시했습니다. 이는 AI 기반 콘텐츠 제작 플랫폼 개발 경쟁에서 바이트댄스가 중요한 진전을 이룬 것으로 평가됩니다.
이 회사는 최근 Seedance 1.0에 대한 상세 연구 논문을 발표했습니다. Seedance 1.0은 자세한 스크립트나 복잡한 명령 없이도 간단한 지시를 고품질 영상으로 변환하도록 설계되었습니다. 이 도구는 개별 장면을 처리할 뿐만 아니라 여러 카메라 각도를 결합하고, 부드러운 전환을 제공하며, 영상 전체에서 캐릭터의 일관성을 보장합니다.
ByteDance는 연구 논문에서 "우리는 비디오에서 공간 정보와 시간 정보를 분리하는 방법을 발견했습니다. 이 기술은 고유한 방식으로 위치를 '인코딩'하여 AI가 동일한 모델에서 텍스트와 이미지 모두를 사용하여 비디오를 생성하는 방법을 학습할 수 있도록 합니다. 결과적으로 AI는 다양한 장면의 비디오를 매끄럽게 자동으로 생성할 수 있습니다."라고 밝혔습니다.
ByteDance는 Seedance 1.0이 시중에 나와 있는 기존 AI 영상 제작 도구보다 뛰어나다고 자신 있게 주장합니다. 특히 사용자 아이디어를 면밀히 따라가는 능력, 이미지 선명도, 캐릭터 움직임의 자연스러움이 뛰어납니다.
AI 모델 성능 분석 및 평가 전문 플랫폼인 Artificial Analysis 에 따르면, Seedance 1.0은 Google의 Veo 3, Kuaishou의 Kling 2.0, OpenAI의 Sora 등 다른 비디오 생성 AI 도구를 능가했습니다. 이 도구는 텍스트-비디오 변환 및 이미지-비디오 변환 작업 모두에서 뛰어난 성능을 보여줍니다.
회사는 또한 Seedance 1.0이 공개적으로 이용 가능하고 라이선스가 부여된 출처에서 수집된 방대한 비디오 데이터 세트를 기반으로 훈련되었다고 밝혔습니다. 훈련 비디오는 폭력적이거나 민감한 콘텐츠를 제거하기 위해 엄격한 필터링 과정을 거쳤습니다.
많은 의견은 데이터 출처가 주로 ByteDance가 운영하는 두 플랫폼인 TikTok과 Douyin에서 나온다고 말합니다.
Seedance 1.0의 훈련 과정은 여러 단계로 나뉩니다. 처음에는 풍부한 이미지와 비디오 데이터로부터 학습한 다음, 다양한 스타일의 심층적인 장면 전환 기술을 계속해서 학습합니다.
엔지니어가 모델이 학습할 고품질 비디오를 선택하는 과정에서 인간 또한 중요한 역할을 합니다. Seedance 1.0이 주문형으로 생성된 수많은 비디오 중에서 최적의 결과를 도출할 때까지 학습 루프는 계속됩니다.
현재 Seedance 1.0은 최대 비디오 길이를 5초로 제한합니다(Veo 3의 8초와 비교). 하지만 가장 큰 장점은 빠른 처리 속도입니다. Full HD 비디오를 생성하는 데 41초밖에 걸리지 않습니다. Seedance 1.0의 한 가지 단점은 Google의 경쟁 제품처럼 자동 오디오 더빙을 지원하지 않는다는 것입니다.
ByteDance는 일반 사용자와 전문 콘텐츠 제작자 모두를 위해 이 도구를 곧 출시할 계획이며, 소셜 네트워크에서 홍보 영상이나 짧은 콘텐츠를 제작하는 데 필요한 기능을 제공할 예정입니다.
Seedance 1.0 출시 이전에도 ByteDance는 OmniHuman, Goku, Jimeng AI와 같은 AI 영상 제작 도구를 개발했습니다. 하지만 Seedance 1.0은 회사가 AI 영상 제작 역량 측면에서 경쟁사보다 우위를 점할 수 있다고 자신 있게 주장하는 최초의 제품입니다.
출처: https://znews.vn/cong-ty-me-tiktok-ra-mat-cong-nghe-thach-thuc-google-post1562025.html
댓글 (0)