
Google I/O 2025 행사에서 Google은 Veo 3라는 비디오 생성 AI 모델을 선보이며 기술계에 충격을 주었습니다. 이는 기술 거대 기업이 논란이 많은 분야에서 큰 진전을 이룬 것을 의미합니다.
The Verge의 기자 앨리슨 존슨의 경험에 따르면 Veo 3의 가장 정교한 기능은 각 비디오에 대한 오리지널 오디오를 만드는 기능입니다. 사운드 효과, 배경 소음, 심지어 캐릭터 대화까지 포함됩니다.
The Verge 기자는 "Veo 3는 완전히 '쓰레기' AI 콘텐츠 생성 머신으로 보인다"고 논평했습니다.
새로운 기능과 충격적인 사실성
Google의 Gemini 부사장인 Josh Woodward는 Veo 3 출시 기조연설에서 "우리는 창의성의 새로운 시대로 접어들고 있습니다."라고 설명하며 "매우 사실적인" 비디오를 제작할 수 있는 기능을 강조했습니다.
존슨은 처음에는 회의적이었지만, AI 도구를 직접 사용해 본 후 우드워드가 과장하지 않았다는 확신을 갖게 되었습니다. Veo 3는 무섭도록 사실적인 제품을 만들어낼 수 있습니다.
구체적으로, The Verge 기자는 뉴스 앵커가 화재를 알리는 내용으로 짧은 영상을 만들려고 했습니다. 이 클립은 믿을 수 없을 정도로 설득력이 뛰어나고, 사운드 품질과 풍경이 기존 뉴스 방송과 비슷합니다.
![]() |
Veo 3가 제작한 영상의 한 장면. 사진: The Verge. |
얼마 지나지 않아, AI가 생성한 영상을 만드는 데 사용된 명령에 항의하는 AI가 생성한 캐릭터가 등장하는 일련의 영상이 포함된 게시물이 Reddit에서 50,000개의 추천을 받았습니다. 장면에는 재난 장면, 병원 침대에 누워 호흡 튜브를 사용하는 여성, 총으로 위협받는 캐릭터 등이 포함되며, 모든 장면에 대사와 사실적인 배경음이 포함됩니다.
다른 비디오 제작 AI 도구와 비교했을 때 Veo 3는 작업을 훨씬 더 간단하게 만들었습니다. 필요한 것은 기본적인 명령 하나와 플랫폼이 처리하는 데 걸리는 몇 분의 대기 시간, 그리고 Google의 AI Ultra 플랜 구독(월 249.99달러 )뿐입니다.
존슨은 덜 구체적인 명령을 사용해 비디오를 만드는 것이 더 쉬웠고, 이는 한 가지 사실을 시사했습니다. Veo 3는 어린이를 위한 가장 기본적인 유형의 YouTube 콘텐츠를 만드는 데 탁월합니다.
무성영화 시대의 종말
지금까지 어떤 AI 비디오 생성 모델도 동기화된 오디오나 비디오 출력에 동반되는 어떤 종류의 오디오도 동시에 제공할 수 없었습니다. 하지만 동기화된 사운드를 만들어내는 기능을 갖춘 Veo 3는 "무성 영화 시대"를 끝내려고 하고 있습니다.
구글 딥마인드 CEO 데미스 하사비스는 기자 회견에서 "우리는 영상 제작의 조용한 시대에서 벗어나고 있습니다."라고 말했습니다.
비디오 제작 도구가 널리 보급되면서 공급업체가 폭발적으로 늘어나 해당 분야가 포화 상태에 이르렀습니다.
Runway, Lightricks, Genmo, Pika, Higgsfield, Kling, Luma와 같은 스타트업부터 OpenAI와 Alibaba와 같은 기술 거대 기업에 이르기까지 모델이 빠른 속도로 출시되고 있습니다. 많은 경우, 이러한 모델들 사이에는 차이가 거의 없습니다.
Veo 3가 비디오 품질 면에서 OpenAI Sora를 능가할 수 있을지는 아직 알 수 없습니다. 하지만 오디오와 비디오가 모두 포함된 완전히 제작된 비디오를 내보낼 수 있는 기능만으로도 Veo 3는 즉시 더욱 매력적인 플랫폼이 될 수 있습니다.
![]() |
Veo 3의 가장 뛰어난 기능은 비디오와 "완벽하게" 동기화된 사운드를 만들어낼 수 있는 기능입니다. 사진: 구글. |
"영화와 TV 업계 에서 배경 소음과 음향 효과는 종종 예술가의 작업입니다. 이제 Veo에게 배경과 액션에 필요한 사운드를 설명하기만 하면 비디오와 대사를 포함한 모든 사운드가 출력된다고 상상해 보세요. 애니메이터들이 몇 주 또는 몇 달씩 걸리는 작업이죠."라고 존슨은 말했습니다.
Veo 3가 실제로 명령을 따르고 수 시간 분량의 일관된 비디오와 오디오를 출력할 수 있다면, AI만으로 제작된 최초의 애니메이션 영화가 탄생하는 데 오래 걸리지 않을 것입니다.
Veo 3가 출시된 직후, 크리에이터들은 X와 같은 플랫폼에서 클립을 공유하기 시작했는데, X에서는 전적으로 AI로 만든 스탠드업 코미디 영상을 선보였습니다. 시청자들은 음성, 영상, 심지어 청중 오디오까지 포함한 전체 장면이 단 하나의 텍스트 설명 명령으로 만들어졌다는 사실을 알고 놀랐습니다.
그런 다음 피타고라스가 그의 유명한 정리를 설명하는 모습을 재연하는 영상이 고대의 맥락과 정확한 대화를 담아 바이럴하게 퍼졌습니다. Veo 3가 전적으로 제작한 뮤직 비디오도 있는데, 영상과 음악이 완벽한 동기화를 이루고 있습니다.
이코노믹 타임즈는 이러한 유형의 기술을 "영화 제작의 새로운 시대"라고 부를 수 있으며, 개인 제작자부터 대형 미디어 스튜디오에 이르기까지 누구나 저렴한 비용과 최소한의 리소스로 전문적인 콘텐츠를 제작할 수 있다고 논평했습니다.
출처: https://znews.vn/ac-mong-tu-ai-tao-video-moi-cua-google-post1556018.html
댓글 (0)