Gemini で利用可能なモデルのリスト。 |
Gemini 2.5 Flashは、Googleの新しいAIモデルの1つです。推論機能により、Google検索、Googleマップ、YouTubeなどの複数のアプリケーションと連携できます。
この機能のおかげで、ユーザーは、特に長い動画を見るときに時間を節約したい場合に、YouTube 上の動画を要約するように Gemini に依頼できます。
このモデルを使用するには、コンピューターをお使いの場合はGeminiのウェブサイトにアクセスするか、iOSまたはAndroidで同名のアプリをダウンロードしてください。次に、左上隅のモデル名をクリックし、 「Gemini 2.5 Flash (Experimental)」を選択してください。
スポーツハイライトサマリー
ウェブ上では、ユーザーはチャットボットのリクエストを入力し、ビデオリンクをドラッグアンドドロップできますが、モバイルデバイスではリンクをコピーする必要があります。
たとえば、ジェミニには、約 5 ~ 20 分の長さのスポーツハイライト ビデオの主なイベントを要約するように依頼できます。
「この試合で何が起こったか?」のようなクエリを入力し、動画のリンクを貼り付けてEnterキーを押すだけです。数秒後、Geminiはハイライトのリストと、動画内の対応するタイムスタンプを表示します。
![]() |
スポーツビデオのハイライトを要約する Gemini の機能。 |
ユーザーはGeminiに特定のトピックの合成を続けるよう依頼できます。例えば、チャットボットは最初にショットを打った選手を正確に提示できますが、タイムスタンプは動画の時間と数秒ずれています。
このツールはスポーツ動画を集約するのに解説に依存している可能性が高いため、タイムラインも実際の画像ではなく解説者の言葉に基づいています。
推論および統合機能により、ユーザーはビデオ関連のトピックについてインターネット上で情報を検索するよう Gemini に依頼できます。
長いビデオの要約
さらに、Geminiは長い動画を要約できます。1時間40分のポッドキャストでも、主要なトピックと議論された内容を要約するのに数秒しかかかりません。
フィードバックが不十分で不十分だと感じた場合は、Gemini に詳細な要約を依頼できます。また、各トピックには動画内のタイムスタンプが表示されるので、すぐに確認できます。
![]() |
約 2 時間のビデオ ポッドキャストを要約できる Gemini の機能。 |
Geminiは依然として音声またはテキスト翻訳に依存しており、動画画像の実際の分析は行いません。例えば、番組の司会者チームの名前が動画に登場していても、AIは番組の詳細を提供しません。また、説明文に記載されているにもかかわらず、番組のメインコンテンツ全体をリストアップすることさえありません。
そのかわり、Gemini は、要求に応じて詳細な分析も含め、ビデオからオーディオをすばやく要約する優れた機能を備えています。
もちろん、ポッドキャストに加えて、ユーザーはチュートリアルやテクニカル分析などの他の長いビデオを Gemini に要約してもらい、主要なアイデアを把握し、必要に応じて追加情報を参照することもできます。
ビデオインタビューの要約
インタビュー動画も要約が必要となるジャンルの一つです。Geminiの音声分析機能を使えば、映画俳優のインタビュー動画のハイライト部分を非常に的確に要約できます。インタビュー動画には多くのセリフが含まれているからです。
![]() |
Gemini のビデオインタビュー要約機能。 |
そこでGeminiの出番です。このツールはまだ、インタビューの場所、人物の表情、行動、視覚的な詳細など、動画内の音声以外の要素を分析することはできません。
全体的に見て、GeminiはYouTube動画の音声を要約し、音声で言及されている限り関連情報を分析・取得する点で優れています。視覚情報の場合、ユーザーはコンテンツ全体を理解するには動画を視聴する必要があります。
出典: https://znews.vn/tom-tat-video-youtube-mien-phi-voi-gemini-post1549612.html
コメント (0)