구글은 인공지능(AI) 도구 개발 경쟁에 매우 적극적으로 참여해 온 기술 기업 중 하나이며, 여기에는 ChatGPT와 경쟁하는 제미니 챗봇이나 텍스트 기반 이미지 생성 도구인 이미지젠(Imagen)이 포함됩니다. 그러나 구글의 설명적 텍스트 기반 비디오 생성 능력은 기술 업계에서 여전히 경쟁사들에 비해 훨씬 뒤떨어져 있다는 평가를 받고 있습니다.
최근 Google은 Gemini Advanced 사용자가 텍스트를 8초 길이의 고해상도 비디오로 변환할 수 있도록 지원하는 도구를 공식 출시했습니다. 또한, Whisk Animate 기능을 통해 정지 이미지를 비슷한 길이의 생생한 애니메이션 비디오로 변환할 수 있습니다. 두 기능 모두 Google One AI Premium 구독자에게 제공됩니다.
구글은 Veo 2가 고해상도의 디테일하고 사실적이며 영화 같은 영상을 제작하도록 설계되어 영상 제작의 혁신을 이룬다고 밝혔습니다. Veo 2는 실제 물리 법칙과 사람의 움직임을 포착하여 다양한 피사체와 스타일에 걸쳐 부드러운 캐릭터 움직임, 역동적인 장면, 그리고 정교한 디테일을 구현할 수 있습니다.
비디오를 제작하려면 사용자는 Gemini의 모델 메뉴에서 Veo 2를 선택해야 합니다(인터페이스에서 이 옵션의 위치는 개발 과정에서 변경될 수 있습니다). 이 기능을 사용하면 720p 해상도의 8초 비디오를 제작하여 16:9 가로 화면 비율의 MP4 파일로 내보낼 수 있습니다. Google은 또한 사용자가 한 달에 제작할 수 있는 비디오 개수가 제한되어 있다고 밝혔습니다.
사용자는 짧은 이야기든, 시각적 아이디어든, 구체적인 장면이든, 상상하는 장면을 간단히 묘사합니다. 그러면 Gemini가 그 아이디어에 생명을 불어넣습니다. 사용자의 묘사가 자세할수록 최종 영상의 완성도는 높아집니다.
Google은 Veo 2로 제작한 동영상을 TikTok이나 YouTube Shorts와 같은 소셜 미디어 플랫폼에 쉽게 공유할 수 있다고 밝혔습니다. 하지만 Veo 2로 제작한 동영상은 16:9의 화면비를 가지고 있어 이러한 플랫폼에서 공유하기에는 전혀 적합하지 않습니다.

비디오 제작 기능은 이제 웹과 모바일 모두에서 전 세계 Gemini Advanced 사용자에게 출시됩니다. 하지만 Google One AI Premium 요금제에 가입한 사용자에게만 제공되며, Gemini에서는 모든 언어 지원이 제공됩니다.
현재 Veo 2는 Google에서 Gemini Advanced 사용자에게 제공하고 있으며, 베트남에서 월 서비스 가격은 489,000 VND입니다.
Veo 2 외에도 Google은 Whisk Animate라는 AI 도구를 출시했습니다. 이 도구를 사용하면 사용자는 설명적 텍스트로 새로운 이미지를 만든 다음 이 이미지를 부드럽게 움직이는 비디오로 바꿀 수 있지만 Veo 2와 비슷하게 최대 길이가 8초로 제한됩니다.
2024년 말에 출시될 Google Labs 실험 프로젝트인 Whisk는 사용자가 텍스트와 이미지 프롬프트를 통해 새로운 아이디어를 빠르게 탐색 하고 시각화할 수 있도록 도와줍니다. 사용자는 Whisk Animate 기능을 사용하여 아이디어를 생생하게 표현할 수 있습니다.
Whisk Animate는 Veo 2 기술을 사용하여 사용자의 정지 사진을 8초짜리 라이브 동영상으로 변환하는 기능을 제공합니다. 이 기능은 60개국 이상의 Google One AI Premium 구독자에게 제공됩니다.

Google은 안전한 동영상 제작 환경을 보장하기 위해 상당한 조치를 취했다고 밝혔습니다. 여기에는 Google 정책을 위반하는 콘텐츠 제작을 방지하기 위한 레드팀 구성 및 철저한 검토가 포함됩니다. 또한, Veo 2로 제작된 모든 동영상에는 각 프레임에 내장된 디지털 워터마크인 SynthID가 표시되어 AI가 생성한 동영상임을 명확하게 나타냅니다./.
출처: https://www.vietnamplus.vn/google-gioi-thieu-cong-cu-ai-chuyen-doi-van-ban-thanh-video-tu-gemini-advanced-post1033671.vnp
댓글 (0)