Gemini で利用可能なモデルのリスト。 |
Gemini 2.5 Flash は、Google の新しい AI モデルの 1 つです。このモデルは推論機能を備えており、Google 検索、Google マップ、YouTube などの複数のアプリケーションに接続できます。
この機能のおかげで、ユーザーは、特に長い動画を見るときに時間を節約したい場合に、Gemini に YouTube の動画の要約を依頼することができます。
このモデルを使用するには、コンピューターを使用している場合は Gemini の Web サイトにアクセスするか、iOS または Android で同じ名前のアプリをダウンロードするだけです。次に、左上隅のモデル名をタップし、 「Gemini 2.5 Flash (Experimental)」を選択します。
スポーツハイライトサマリー
ウェブ上では、ユーザーはチャットボットのリクエストを入力し、ビデオリンクをドラッグアンドドロップできますが、モバイルデバイスではリンクをコピーする必要があります。
たとえば、ジェミニには、約 5 ~ 20 分の長さのスポーツハイライト ビデオの主なイベントを要約するように依頼できます。
「この試合で何が起こったか?」のようなコマンドを入力し、ビデオリンクを貼り付けてEnter キーを押すだけです。数秒後、Gemini はいくつかのハイライトと、ビデオ内の対応するタイムスタンプを含む結果を表示します。
![]() |
スポーツビデオのハイライトを要約する Gemini の機能。 |
ユーザーは、Gemini に特定のトピックの集約を継続するようリクエストできます。たとえば、チャットボットは最初にショットを打ったプレーヤーを正確に提供できましたが、タイムスタンプはビデオの時間と数秒ずれていました。
このツールはスポーツ動画を集約するのに解説に依存している可能性が高いため、タイムラインも実際の画像ではなく解説者の言葉に基づいています。
推論および統合機能により、ユーザーは Gemini にビデオ関連のトピックについてインターネット上の情報を検索するよう依頼できます。
長いビデオの要約
次に、Gemini は長いビデオを要約できます。 1 時間 40 分のポッドキャストの場合、ツールが主要なトピックと議論された内容を要約するのにかかる時間はわずか数秒です。
フィードバックが不十分または不完全だと思われる場合は、Gemini に詳細を要約するよう依頼できます。各トピックには、すぐに追跡できるようにビデオ内の対応するタイムラインも付属しています。
![]() |
約 2 時間のビデオ ポッドキャストを要約できる Gemini の機能。 |
Gemini は依然として、ビデオ画像の実際の分析ではなく、音声またはテキストの翻訳に依存しています。たとえば、番組の司会チームの名前が動画に登場したにもかかわらず、AI は番組の詳細を提供しませんでした。また、説明に記載されていたにもかかわらず、メインコンテンツ全体をリストアップしませんでした。
そのかわり、Gemini は、要求に応じて詳細な分析も含め、ビデオからオーディオをすばやく要約する優れた機能を備えています。
もちろん、ポッドキャストに加えて、ユーザーはチュートリアルやテクニカル分析などの他の長いビデオを Gemini に要約してもらい、主要なアイデアを把握し、必要に応じて追加情報を参照することもできます。
ビデオインタビューの要約
インタビュー動画も要約が必要となることが多いジャンルです。インタビュー ビデオには多くのスピーチが含まれているため、Gemini はオーディオ分析機能を使用して、俳優インタビュー ビデオのハイライトを非常に正確に合成できます。
![]() |
Gemini のビデオインタビュー要約機能。 |
しかし、それがジェミニの唯一の利点でもあります。このツールでは、インタビューの場所、表情、動画内の人物の行動、画像に関連する詳細など、動画内の音声以外の要素を分析することはまだできません。
全体的に、Gemini は YouTube 動画の音声を要約するだけでなく、口頭で言及されている関連情報を分析して取得する機能も優れています。情報が視覚的な形式で提供される場合でも、ユーザーはコンテンツ全体を把握するためにビデオを見る必要があります。
出典: https://znews.vn/tom-tat-video-youtube-mien-phi-voi-gemini-post1549612.html
コメント (0)