Список моделей, доступных на Gemini. |
Gemini 2.5 Flash — одна из новых моделей искусственного интеллекта от Google. Благодаря своим возможностям вывода модель может подключать несколько приложений, таких как Google Search, Google Maps и YouTube.
Благодаря этой возможности пользователи могут попросить Gemini сделать краткий обзор видео на YouTube, особенно если они хотят сэкономить время при просмотре длинных видео.
Чтобы воспользоваться моделью, просто зайдите на сайт Gemini, если вы используете компьютер, или загрузите одноименное приложение на iOS или Android. Затем нажмите на название модели в левом верхнем углу и выберите Gemini 2.5 Flash (экспериментальная) .
Обзор спортивных событий
В Интернете пользователи могут ввести запрос на чат-бот, а затем перетащить ссылку на видео, тогда как на мобильных устройствах ссылку необходимо скопировать.
Например, Близнецов можно попросить кратко изложить основные события в видеороликах о спортивных событиях, продолжительность которых составляет около 5–20 минут.
Просто введите команду, например «Что произошло в этом матче?», затем вставьте ссылку на видео и нажмите Enter . Через несколько секунд Gemini предоставит результаты с некоторыми яркими моментами, а также соответствующими временными метками в видео.
![]() |
Умение Близнецов пересказывать основные моменты спортивных видео. |
Пользователи могут попросить Gemini продолжить агрегацию определенных тем. Например, чат-бот смог точно указать первого игрока, который сделал бросок, но временная метка на несколько секунд отличалась от времени на видео.
Вероятно, инструмент использует комментарии для объединения спортивных видеороликов, поэтому временная шкала также основана на словах комментатора, а не на фактическом изображении.
Благодаря возможностям рассуждения и синтеза пользователи могут попросить Gemini найти в Интернете информацию по темам, связанным с видео.
Длинный видео-резюме
Далее Gemini может пересказывать длинные видео. Для подкаста продолжительностью 1 час 40 минут инструменту требуется всего несколько секунд, чтобы обобщить основные темы и обсуждаемый контент.
Если отзыв покажется вам отрывочным и неполным, вы можете попросить Gemini изложить его более подробно. Для быстрого отслеживания каждой темы в видео также имеется соответствующая временная шкала.
![]() |
Способность Gemini пересказать почти 2 часа видеоподкастов. |
Gemini по-прежнему полагается на перевод речи или текста, а не на фактический анализ видеоизображений. Например, ИИ не предоставил подробную информацию о команде ведущих шоу, хотя их имена упоминались в видео, и даже не перечислил весь основной контент, хотя он был упомянут в описании.
В свою очередь, Gemini отлично справляется с быстрой обработкой аудио из видео, включая подробный анализ, если требуется больше.
Конечно, помимо подкастов, пользователи могут попросить Gemini сделать краткий обзор других длинных видео, таких как обучающие материалы, технический анализ... чтобы уловить основную идею и при необходимости обратиться к дополнительной информации.
Краткое содержание видеоинтервью
Видеоинтервью — это также жанр, который часто требует обобщения. Благодаря возможностям аудиоанализа Gemini может достаточно хорошо синтезировать основные моменты в видеоинтервью с актером, поскольку в нем содержится много речи.
![]() |
Возможности видеоинтервью Gemini по составлению резюме. |
Однако это единственное преимущество Близнецов. Этот инструмент пока не может анализировать элементы видео, отличные от звука, такие как места интервью, выражения лиц, действия людей на видео или детали, связанные с изображением.
В целом Gemini хорошо справляется с обобщением аудиозаписей из видеороликов YouTube, а также анализирует и извлекает соответствующую информацию, если она упоминается устно. Поскольку информация представлена в визуальной форме, пользователям все равно приходится смотреть видео, чтобы понять весь контент.
Источник: https://znews.vn/tom-tat-video-youtube-mien-phi-voi-gemini-post1549612.html
Комментарий (0)