![]() |
Логотип Google Gemini. Фото: Bloomberg . |
В конце ноября Google выпустила модель Gemini 3. Компания внедрила ряд заметных улучшений, таких как улучшенные возможности кодирования, визуализации и агентов, выполняющих определённые задачи от имени пользователей.
Представляя Gemini 3, Google подчеркнула, что это «самая умная модель компании на сегодняшний день». Практический опыт показывает, что модель обрабатывает данные быстрее и обладает более высокой способностью к рассуждению, хотя есть ряд факторов, которые необходимо улучшить.
Быстро создавайте интерактивные интерфейсы
Одно из крупных обновлений Gemini 3 связано с Canvas — интерактивным рабочим пространством в Gemini, которое позволяет вам заставлять чат-ботов писать код, визуализировать результаты и редактировать контент.
Когда Gemini 3 получает запрос на создание 3D-модели разницы между размерами футбольного мяча, Земли, Солнца и Млечного Пути, инструмент запускает интерактивный интерфейс кодирования, обработки и создания, позволяющий выбирать объекты и сравнивать их по размеру.
![]() |
Возможность создания интерактивных пространств с помощью функции Canvas в Gemini 3. |
По сравнению с демо-версией Google, качество изображения немного хуже. Зато информация об объектах представлена наглядно и легко воспринимается. Время обработки занимает около 2 минут. В интерфейсе Canvas пользователи могут напрямую редактировать код, копировать или делиться контентом.
С помощью другой команды Gemini 3 было предложено создать воксельное изображение орла, сидящего на ветке дерева. Инструмент выдал результат примерно через 45 секунд, и пользователи могли увеличивать и вращать изображение с помощью мыши. Однако некоторые детали изображения имели графические ошибки и отображались некорректно.
То же самое с орлом, сидящим на ветке дерева, но с более сложным запросом (3D-моделью). В первый раз код, сгенерированный Gemini 3, дал сбой и не запустился. После запроса на исправление изображение появилось и стало интерактивным.
![]() |
Возможности создания интерактивной среды Gemini 3. |
Несмотря на некоторые проблемы, переход от модели вопросов и ответов к совместному редактированию — интересное направление, которое сделает Gemini 3 полезным для решения сложных долгосрочных задач.
Конечно, Gemini 3 предназначен не только для создания графики или визуальных моделей. Google тестирует функцию «Generative UI» для пользователей AI Pro. Всего несколько команд — и модель может создавать интерактивные интерфейсы в стиле журналов или визуальные веб-сайты.
Google заявляет, что функция будет внедряться поэтапно. Как показала практика The Verge , пользователям нужно выбрать функцию « Визуальный макет» , а затем ввести команду, например, «Спланируйте для меня трёхдневную поездку в Рим».
После обработки Gemini 3 генерирует результаты, похожие на результаты на сайте о путешествиях , с подробными расписаниями и изображениями, а также рядом вопросов о предпочтениях в путешествиях и стиле питания. Исходя из этого, модель корректирует ответы. Эта функция также весьма полезна для таких тем, как сборка компьютера, аквариума и т. д.
Рассуждайте и анализируйте более эффективно
По данным Google, Gemini 3 обладает более развитыми логическими способностями, чем его предшественник. Компания утверждает, что логические способности Gemini 3 Pro находятся на уровне доктора наук: он набрал 37,5% на экзамене Humanity's Last Exam и 91,9% на экзамене GPQA Diamond.
Конечно, пользователи могут почувствовать разницу только при непосредственном взаимодействии с моделью. Когда Gemini 3 Pro предложили решить задачу из набора GPQA Diamond (ориентированного на уровень докторантуры), ему потребовалось около 30 секунд, чтобы предоставить подробное решение, включая каждый этап решения задачи и иллюстративные изображения.
![]() |
Gemini 3 могут отвечать на сложные вопросы, их мыслительные способности эквивалентны уровню доктора наук. |
Согласно оценке, решение достаточно подробное и соответствует процедуре. Для сравнения, GPT-5.1 также занял около 30 секунд, ответ был верным, но решение было менее подробным. Аналогично, Claude 4.5 Sonnet ответил правильно, быстрее, чем Gemini 3, но с меньшей детализацией.
Google утверждает, что Gemini 3 может извлекать документы из нескольких источников одновременно, таких как текст, изображения и видео . Задачи, которым он ранее не обучался, также лучше справляются с Gemini 3.
![]() |
Возможности видеоаналитики Gemini 3. |
Например, когда Gemini 3 было предложено проанализировать основную тему 57-минутного видео, ему потребовалось всего около минуты, чтобы вернуть результат, включающий запрошенные аргументы и временную метку соответствующей части видео. Аналогичным образом, модель правильно идентифицировала видео о теннисе, проанализировав матчи и игру каждого игрока.
Пользователи могут попросить Gemini 3 посмотреть видео, ссылаясь на внешние источники, и даже задавать вопросы для более глубокого анализа. В целом, Gemini 3 довольно отзывчив при анализе и создании ссылок на документы, отчасти благодаря подключению к базе данных Google Search.
Агент полезен, но у него есть проблемы
Агент также является заметным обновлением по сравнению с Gemini 3. Для пользователей пакета AI Ultra (в настоящее время поддерживающего только рынок США) этот режим может выполнять сложные процессы от имени пользователей, такие как сортировка и организация электронных писем, поиск информации, бронирование билетов на самолет...
Когда Google запустил Gemini 3, он продемонстрировал возможность организации почтового ящика в Gmail, и, по опыту The Verge , эта функция сработала именно так, как и было задумано: она создала полный список непрочитанных писем за неделю.
Подобно функции Canvas, список адресов электронной почты и предлагаемые действия отображаются в отдельной области. Gemini предоставляет ряд функций, таких как настройка напоминаний о важных письмах, архивация рекламных писем...
![]() |
Функция агента в Gemini 3 поддерживает управление почтовым ящиком Gmail. Фото: The Verge . |
Когда вам предлагают создать напоминание об оплате счёта, Gemini быстро загружает соответствующую информацию в Google Tasks. При выполнении задачи оплаты агент автоматически переходит к следующему этапу и останавливается, когда пользователю требуется ввести платёжную информацию.
В целом, агент Gemini 3 весьма полезен для обнаружения писем, которые пользователи, вероятно, забудут. Инструмент также может находить и отписываться от писем с рекламных адресов, которые больше не нужны.
Фактически, некоторые чат-боты, такие как Perplexity и ChatGPT, уже поддерживают интеграцию с Gmail. Однако возможности интеграции Gemini весьма разнообразны. Например, пользователям Perplexity приходится специально вводить адреса электронной почты, которые они хотят сохранить или удалить, в то время как в Gemini все операции выполняются с помощью кнопок.
![]() |
Функция создания интерактивного интерфейса Gemini 3. Фото: The Verge . |
Функция планирования рассылок в ChatGPT также работает нестабильно. Однако скорость доставки писем в Gemini ниже, чем в Perplexity. Некоторые задачи, например, бронирование столиков в ресторане, иногда вызывают проблемы.
Хотя он всегда требует подтверждения пользователя перед выполнением конфиденциальных действий, таких как оплата или отправка электронных писем, передача некоторых задач ИИ всё ещё вызывает у пользователей сомнения. Режим агента на Gemini 3 весьма полезен, но пользователям всё равно приходится следить за результатами.
Источник: https://znews.vn/gemini-3-tot-den-dau-post1607493.html

















Комментарий (0)