![]() |
Логотип Google Gemini. Фото: Bloomberg . |
В конце ноября Google выпустила модель Gemini 3. Компания представила ряд существенных улучшений, таких как усовершенствованные возможности программирования, создание визуальных изображений и агенты, выполняющие определенные задачи от имени пользователя.
Представляя Gemini 3, Google подчеркнула, что это «самая умная модель компании на сегодняшний день». Опыт эксплуатации в реальных условиях показывает, что модель обрабатывает информацию быстрее и обладает лучшими аналитическими способностями, хотя есть еще некоторые области, требующие улучшения.
Создавайте интерактивные интерфейсы быстро.
Одно из главных улучшений в Gemini 3 связано с Canvas. Это интерактивное рабочее пространство внутри Gemini, которое позволяет запрашивать у чат-ботов написание кода, визуализацию результатов и редактирование контента.
Когда Gemini 3 получает запрос на создание 3D-модели, показывающей разницу в размерах футбольного мяча, Земли, Солнца и Млечного пути, инструмент активирует программный интерфейс, обрабатывает данные и создает интерактивную среду, позволяющую пользователям выбирать и сравнивать размеры объектов.
![]() |
Возможность создавать интерактивные пространства с помощью функции Canvas в Gemini 3. |
По сравнению с демонстрационной версией Google, результаты немного уступают по качеству изображений. Однако информация об объектах четкая и легко понятная. Время обработки составляет приблизительно 2 минуты. В интерфейсе Canvas пользователи могут напрямую редактировать код, копировать или делиться содержимым.
С помощью другой команды Gemini 3 было предложено создать трехмерную кубическую (воксельную) модель орла, сидящего на ветке дерева. Инструмент выдал результат примерно за 45 секунд, и пользователи могли увеличивать масштаб и вращать изображение с помощью мыши. Однако некоторые детали изображения содержали графические ошибки и отображались нестабильно.
Изображение орла, сидящего на ветке дерева, также присутствовало, но требование было более сложным (3D-модель). Первоначально код, сгенерированный Gemini 3, не работал и не запускался. После запроса на внесение изменений изображение появилось и стало интерактивным.
![]() |
Возможность Gemini 3 создавать интерактивные среды. |
Несмотря на некоторые сохраняющиеся проблемы, переход от модели вопросов и ответов к совместному редактированию является интересным направлением, делающим Gemini 3 полезным для сложных долгосрочных задач.
Конечно, Gemini 3 предназначен не только для создания графики или визуальных моделей. Google тестирует функцию «Генеративный пользовательский интерфейс» для пользователей AI Pro. С помощью определенных команд модель может создавать интерактивные интерфейсы в стиле журналов или визуальные веб-сайты.
Google заявляет, что эта функция внедряется поэтапно. По данным издания The Verge , пользователям необходимо выбрать функцию « Визуальный макет» , а затем ввести команду, например, «Спланировать мою 3-дневную поездку в Рим».
После обработки Gemini 3 генерирует результаты, похожие на сайт туристического агентства, с маршрутами, подробными изображениями и несколькими вопросами о предпочтениях в путешествиях и пищевых привычках. Затем модель соответствующим образом корректирует ответы. Эта функция также весьма полезна для таких тем, как сборка компьютера или создание аквариума.
Более эффективные рассуждения и анализ.
По данным Google, Gemini 3 обладает лучшими аналитическими способностями, чем его предшественник. Компания утверждает, что аналитические способности Gemini 3 Pro достигают уровня доктора наук, набрав 37,5% на экзамене Humanity's Last Exam и 91,9% на экзамене GPQA Diamond.
Конечно, пользователи смогут по-настоящему оценить разницу только при непосредственном взаимодействии с моделью. Когда Gemini 3 Pro предложили решить задачу из набора эталонных вопросов GPQA Diamond (ориентированного на докторский уровень), программа потребовалось приблизительно 30 секунд, чтобы предоставить подробное решение, включающее пошаговые инструкции и наглядные изображения.
![]() |
Близнецы 3 способны отвечать на сложные вопросы, демонстрируя мыслительные способности, эквивалентные уровню кандидата наук. |
Согласно оценке, решение достаточно подробное и соответствует правильной процедуре. Для сравнения, GPT-5.1 также потребовалось около 30 секунд, чтобы ответить правильно, но решение было менее подробным. Аналогично, Claude 4.5 Sonnet ответил правильно и быстрее, чем Gemini 3, но решение было менее подробным.
Google утверждает, что Gemini 3 может одновременно извлекать документы из нескольких источников, таких как текст, изображения и видео . Gemini 3 также лучше справляется с задачами, для которых ранее не проводилось обучение.
![]() |
Возможности анализа видеоданных в Gemini 3. |
Например, при анализе основной темы 57-минутного видео Gemini 3 потребовалась всего около минуты, чтобы предоставить результаты, включающие запрошенные аргументы и временные метки соответствующего сегмента видео. Аналогичным образом, модель правильно идентифицировала видео с теннисными матчами, проанализировав поединки и стиль игры каждого спортсмена.
Пользователи могут попросить Gemini 3 одновременно просматривать видео и обращаться к внешним источникам, а также задавать вопросы для более глубокого анализа. В целом, Gemini 3 достаточно быстро реагирует на аналитические задачи и задачи по поиску ссылок в документах, отчасти благодаря подключению к базе данных Google Search.
Агент отзывчивый, но проблемы всё ещё остаются.
Функция «Агент» также является заметным улучшением по сравнению с Gemini 3. Для пользователей тарифного плана AI Ultra (в настоящее время доступного только на рынке США) этот режим может выполнять сложные задачи от имени пользователя, такие как категоризация и организация электронных писем, поиск информации и бронирование билетов на поездки.
При запуске Gemini 3 Google привела в пример возможность организации входящих сообщений в Gmail. По данным издания The Verge , эта функция работает именно так, как и было запрошено: создается полный список непрочитанных писем за неделю.
Подобно функции Canvas, списки рассылок и предлагаемые действия отображаются в отдельной области. Gemini предлагает несколько опций, таких как установка напоминаний о важных письмах, архивирование рекламных писем и т. д.
![]() |
Функция агента в Gemini 3 помогает управлять почтовыми ящиками Gmail. Изображение: The Verge . |
При создании напоминания об оплате счета Gemini быстро вводит необходимую информацию в Google Tasks. В случае задачи об оплате агент автоматически переходит к нужному разделу и останавливается, когда пользователю необходимо ввести платежные данные.
В целом, агент Gemini 3 довольно полезен для обнаружения электронных писем, которые пользователи склонны забывать получать. Инструмент также может находить и отписываться от рассылок с рекламных адресов, которые больше не актуальны.
На самом деле, агенты некоторых чат-ботов, таких как Perplexity и ChatGPT, уже поддерживают интеграцию с Gmail. Однако Gemini предлагает наиболее разнообразные возможности интеграции. Например, пользователям Perplexity нужно специально вводить адреса электронной почты, которые они хотят сохранить или удалить, в то время как на Gemini эти действия можно выполнить с помощью кнопок.
![]() |
Функция создания интерактивного интерфейса в Gemini 3. Фото: The Verge . |
Функция сортировки электронной почты в ChatGPT также работает нестабильно. Однако скорость отправки писем в Gemini ниже, чем в Perplexity. При выполнении некоторых задач, например, бронировании столиков в ресторане, иногда возникают проблемы.
Несмотря на то, что для выполнения таких важных действий, как платежи или отправка электронных писем, всегда требуется подтверждение пользователя, делегирование определенных задач искусственному интеллекту все еще вызывает у пользователей опасения. Режим агента в Gemini 3 довольно полезен, но пользователям все равно необходимо отслеживать результаты.
Источник: https://znews.vn/gemini-3-tot-den-dau-post1607493.html













Комментарий (0)