TikTok의 모회사인 바이트댄스는 이미지와 사운드를 사실적인 비디오로 바꿀 수 있는 인공지능(AI) 모델을 출시했습니다.
ByteDance 개발팀에 따르면, OmniHuman-1이라 불리는 멀티모달 모델은 캐릭터가 말하고, 노래하고, 움직이는 몰입형 비디오를 "현재의 비디오 생성 방법보다 뛰어난 품질"로 제작할 수 있습니다.
실제 사람과 유사한 이미지, 비디오, 사운드를 생성하는 AI 기술은 "딥페이크"라고도 불리며, 사기뿐만 아니라 엔터테인먼트 분야에서도 점점 더 많이 사용되는 기술입니다.
바이트댄스는 중국에서 가장 인기 있는 AI 기업 중 하나입니다. 이 회사의 두바오 앱은 중국 본토 사용자들에게 가장 인기가 많습니다.
OmniHuman-1은 아직 대중에게 공개되지 않았지만 샘플 영상은 빠르게 퍼져나갔습니다.
가장 돋보이는 데모 중 하나는 알베르트 아인슈타인이 연설하는 모습을 담은 23초 분량의 영상입니다. TechCrunch는 이 앱의 제품을 "놀랍도록 멋진" 그리고 "지금까지 나온 가장 사실적인 딥페이크 영상"이라고 설명합니다.
개발자에 따르면 OmniHuman-1은 음성이나 보컬과 같은 오디오 데이터와 함께 참조 데이터로 단일 이미지만 있으면 길이에 상관없이 비디오를 만들 수 있다고 합니다.
출력 비디오 프레임 속도를 조정할 수 있으며, 비디오 속 캐릭터의 "신체 비율"도 조정할 수 있습니다.
그뿐 아니라, 비공개 소스에서 얻은 19,000시간 분량의 비디오 콘텐츠로 훈련된 AI 모델은 기존 비디오를 편집할 수 있으며, 심지어 사람의 손과 발 동작을 설득력 있게 바꿀 수도 있습니다.
그러나 ByteDance는 OmniHuman-1이 완벽하지 않다는 것을 인정했습니다. 특정 포즈를 취하는 데 여전히 어려움이 있으며, "저품질 참조 이미지"로는 최고의 비디오를 제작할 수 없다고 말했습니다.
ByteDance의 새로운 AI 모델은 워싱턴의 기술 수출 제한 노력에도 불구하고 중국의 진전을 보여줍니다.
우려 사항
작년에는 정치적 딥페이크가 널리 퍼졌습니다. 몰도바에서는 딥페이크 영상에서 마이아 산두 대통령이 사임 연설을 하는 모습이 묘사되었습니다.
남아프리카공화국에서는 래퍼 에미넴이 남아프리카 공화국 야당을 지지하는 모습을 담은 딥페이크 영상이 국가 선거를 앞두고 급속히 퍼졌습니다.
딥페이크는 금융 범죄를 저지르는 데에도 점점 더 많이 이용되고 있습니다. 소비자들은 유명인이 투자를 추천하고, 가짜 투자 기회를 제공하는 딥페이크 영상에 속고 있으며, 기업들은 고위 임원을 사칭하는 사칭범 때문에 수백만 달러의 손실을 입기도 했습니다.
Deloitte에 따르면, AI가 생성한 콘텐츠로 인해 2023년에 사기로 인한 손실이 120억 달러가 넘었으며, 2027년까지 미국에서는 400억 달러에 달할 수 있습니다.
지난 2월, AI 커뮤니티의 수백 명이 딥페이크에 대한 엄격한 규제를 요구하는 서한에 서명했습니다. 미국에서는 연방 차원의 딥페이크 범죄화가 시행되지 않음에도 불구하고 10개 이상의 주에서 AI 위조를 금지하는 법률을 제정했습니다.
하지만 딥페이크를 감지하는 것은 쉽지 않습니다. 일부 소셜 네트워크와 검색 엔진에서는 딥페이크 콘텐츠의 확산을 제한하기 위한 조치를 취했지만, 온라인에서 딥페이크 콘텐츠의 양은 여전히 놀라운 속도로 늘어나고 있습니다.
신원 확인 회사 Jumio가 2024년 5월에 실시한 설문 조사에 따르면, 응답자의 60%가 지난 1년 동안 딥페이크를 본 적이 있다고 답했습니다. 응답자의 72%는 매일 딥페이크에 속는 것이 걱정된다고 답했으며, 대다수는 AI가 생성한 가짜 영상의 급증을 해결하기 위한 법안 통과를 지지했습니다.
[광고_2]
출처: https://vietnamnet.vn/model-ai-moi-cua-bytedance-noi-ran-ran-nho-kha-nang-deepfake-2368831.html
댓글 (0)