Googleは、ChatGPTに対抗するチャットボット「Gemini」や、テキストベースの画像作成ツール「Imagen」など、人工知能(AI)ツールの開発競争に積極的に取り組んでいるテクノロジー企業の一つです。しかし、説明文から動画を作成するGoogleの能力は、テクノロジーコミュニティから依然として競合他社に比べてはるかに劣っていると考えられています。
Googleは最近、Gemini Advancedのユーザー向けに、テキストを8秒間の高解像度動画に変換できるツールを正式に導入しました。同時に、静止画像を同様の長さの鮮やかなアニメーション動画に変換できるWhisk Animate機能も導入されました。これらの機能は、Google One AI Premiumに加入しているユーザーが利用できるようになりました。
Googleによると、Veo 2は動画制作における飛躍的な進歩であり、高解像度で精細、リアルで映画のような動画を制作するために設計されているという。Veo 2は現実世界の物理法則と人間の動きを捉え、幅広いテーマやスタイルにおいて、滑らかなキャラクターの動き、ダイナミックなシーン、そして精緻なディテールを再現できる。
動画を作成するには、GeminiのモデルメニューからVeo 2を選択する必要があります(インターフェース上のこのオプションの位置は開発中に変更される可能性があります)。この機能により、720p解像度の8秒間の動画が作成され、16:9の横長アスペクト比のMP4形式でエクスポートされます。Googleによると、ユーザーが月に作成できる動画の数には制限があります。
ユーザーは、短編小説、ビジュアルアイデア、特定のシーンなど、思い描いたシーンを説明するだけです。Gemini はそれらのアイデアを現実のものにしていきます。ユーザーの説明が詳細であればあるほど、最終的な動画のクオリティは向上します。
Googleによると、Veo 2で作成した動画はTikTokやYouTube Shortsなどのソーシャルメディアプラットフォームで簡単に共有できるとのことです。しかし、Veo 2で作成された動画のアスペクト比は16:9であるため、これらの動画プラットフォームでの共有には全く適していません。

動画作成機能は現在、ウェブとモバイルの両方で、世界中のGemini Advancedユーザーに展開されています。ただし、この機能はGoogle One AI Premiumプランにご加入の方にのみご利用いただけます。Geminiでは、すべての言語サポートをご利用いただけます。
現在、Veo 2 は Google によって Gemini Advanced ユーザーに提供されており、ベトナムでのサービス価格は月額 489,000 VND です。
Veo 2に加えて、GoogleはWhisk AnimateというAIツールもリリースしました。これを使用すると、ユーザーは説明文付きの新しい画像を作成し、この画像をスムーズな動きの動画に変換できますが、Veo 2と同様に最大8秒までしか動画の長さは制限されていません。
2024年後半にリリース予定のGoogle Labs実験ツール「Whisk」は、テキストと画像の両方のプロンプトを通じて、ユーザーが新しいアイデアを素早く探求し、視覚化するのに役立ちます。ユーザーはWhisk Animate機能を使ってアイデアを現実のものにすることができます。
Whisk Animateは、Veo 2テクノロジーを活用して、ユーザーの静止画を8秒間のライブ動画に変換する機能を提供します。この機能は、60か国以上のGoogle One AIプレミアム会員がご利用いただけます。

Googleはまた、安全な動画作成体験を確保するために重要な措置を講じていると述べています。これには、Googleのポリシーに違反するコンテンツの作成を防ぐためのレッドチーム演習や徹底的なレビューが含まれます。さらに、Veo 2で作成されたすべての動画には、AIによって生成されたことを明確に示すデジタル透かしであるSynthIDが各フレームに埋め込まれます。
出典: https://www.vietnamplus.vn/google-gioi-thieu-cong-cu-ai-chuyen-doi-van-ban-thanh-video-tu-gemini-advanced-post1033671.vnp
コメント (0)