![]() |
Логотип Google Gemini. Фото: Bloomberg . |
Google запустила модель Gemini 3 наприкінці листопада. Компанія запровадила низку помітних оновлень, таких як покращені можливості кодування, візуалізації та агентів, які виконують певні завдання від імені користувачів.
Під час презентації Gemini 3 Google наголосив, що це «найрозумніша модель компанії на сьогодні». Практичний досвід показує, що модель обробляє дані швидше, має кращі можливості для міркування, хоча є деякі фактори, які потребують покращення.
Швидко створюйте інтерактивні інтерфейси
Одне з головних оновлень у Gemini 3 стосується Canvas, інтерактивного робочого простору в Gemini, який дозволяє вам просити чат-ботів писати код, візуалізувати результати та редагувати контент.
Коли Gemini 3 просять створити 3D-модель різниці між розмірами футбольного м'яча, Землі, Сонця та Чумацького Шляху, інструмент запускає інтерактивний інтерфейс кодування, обробки та створення, який дозволяє вибирати об'єкти та порівнювати їх за розміром.
![]() |
Можливість створювати інтерактивні простори за допомогою функції Canvas у Gemini 3. |
Порівняно з демоверсією Google, результати дещо гірші з точки зору якості зображення. Натомість інформація про об'єкти надається чітко та легко для розуміння. Час обробки займає близько 2 хвилин. В інтерфейсі Canvas користувачі можуть безпосередньо редагувати код, копіювати або ділитися контентом.
За допомогою іншої команди Gemini 3 було запропоновано створити орла у воксельному стилі, що сидить на гілці дерева. Інструмент дав результати приблизно через 45 секунд, і користувачі могли збільшувати та обертати зображення за допомогою миші. Однак деякі деталі зображення мали графічні помилки та відображалися неправильно.
Також із орлом, що сидить на гілці дерева, але зі складнішим запитом (3D-модель). Першого разу код, згенерований Gemini 3, зазнав аварії та не зміг запуститися. Після запиту на виправлення зображення з'явилося та стало інтерактивним.
![]() |
Можливості створення інтерактивного середовища Gemini 3. |
Хоча є деякі проблеми, перехід від моделі питань і відповідей до спільного редагування — це цікавий напрямок, який зробить Gemini 3 корисним для складних, довгострокових завдань.
Звичайно, Gemini 3 призначений не лише для створення графіки чи візуальних моделей. Google тестує функцію «Генеративного інтерфейсу» для користувачів AI Pro. За допомогою кількох команд модель може створювати інтерактивні інтерфейси у стилі журналу або візуальні вебсайти.
Google каже, що ця функція впроваджується поетапно. Як зазначає The Verge , користувачам потрібно вибрати функцію візуального макета , а потім ввести команду на кшталт «Сплануй мені 3-денну поїздку до Риму».
Після обробки Gemini 3 генерує результати, схожі на туристичний веб-сайт, з детальним розкладом і зображеннями, а також низкою питань про вподобання в подорожах і стилі харчування. На основі цього модель відповідно коригуватиме відповіді. Ця функція також досить корисна для таких тем, як зібрати комп'ютер, побудувати акваріум тощо.
Міркування та аналіз ефективніше
Згідно з даними Google, Gemini 3 має кращі здібності до міркування, ніж його попередник. Компанія стверджує, що здатність до міркування Gemini 3 Pro знаходиться на докторському рівні, з результатом 37,5% на іспиті Humanity's Last Exam та 91,9% на іспиті GPQA Diamond.
Звісно, користувачі можуть відчути різницю лише під час безпосередньої взаємодії з моделлю. Коли Gemini 3 Pro було запропоновано розв'язати задачу з довідкового набору GPQA Diamond (орієнтованого на докторський рівень), йому знадобилося близько 30 секунд, щоб надати детальне рішення, включаючи кожен крок задачі та ілюстративні зображення.
![]() |
Близнюки 3 можуть відповідати на складні питання, їхня здатність мислити еквівалентна рівню доктора філософії. |
Згідно з оцінюванням, розв'язок досить детальний та відповідає процедурі. Для порівняння, GPT-5.1 також зайняв близько 30 секунд, відповів правильно, але розв'язок був менш детальним. Аналогічно, Claude 4.5 Sonnet відповів правильно, швидше, ніж Gemini 3, але з меншою деталізацією.
Google стверджує, що Gemini 3 може витягувати документи з кількох джерел одночасно, такі як текст, зображення та відео . Завдання, для яких раніше не було навчання, також краще справляються на Gemini 3.
![]() |
Можливості відеоаналітики Gemini 3. |
Наприклад, коли Gemini 3 попросили проаналізувати основну тему 57-хвилинного відео, йому знадобилося лише близько хвилини, щоб повернути результат, який містив запитувані аргументи разом із міткою часу відповідної частини відео. Аналогічно, модель правильно ідентифікувала відео про теніс, аналізуючи матчі та гру кожного гравця.
Користувачі можуть попросити Gemini 3 переглянути відео, посилаючись на зовнішні джерела, і навіть ставити запитання для глибшого аналізу. Загалом, Gemini 3 досить швидко реагує на аналіз та посилання на документи, частково завдяки підключенню до бази даних пошуку Google.
Агент корисний, але має проблеми
Агент також є помітним оновленням Gemini 3. Для користувачів пакету AI Ultra (наразі підтримується лише ринок США) цей режим може виконувати складні процеси від імені користувачів, такі як сортування та впорядкування електронних листів, пошук інформації, бронювання квитків...
Коли Google запустив Gemini 3, він продемонстрував можливість упорядкування вхідних повідомлень у Gmail, і, за досвідом The Verge , це спрацювало саме так, як мало бути: воно генерувало повний список непрочитаних листів за тиждень.
Подібно до функції Canvas, список розсилки та запропоновані дії відображаються в окремій області. Gemini надає деякі опції, такі як налаштування нагадувань для важливих електронних листів, архівування рекламних листів...
![]() |
Функція агента Gemini 3 підтримує керування вхідними повідомленнями Gmail. Фото: The Verge . |
Коли Gemini просять створити нагадування про оплату рахунків, він швидко завантажує відповідну інформацію в Google Tasks. Для платіжного завдання агент автоматично переходить до наступного кроку та зупиняється, коли користувачеві потрібно ввести платіжну інформацію.
Загалом, агент Gemini 3 досить корисний для виявлення електронних листів, які користувачі, ймовірно, забувають. Інструмент також може знаходити та скасовувати підписку на електронні листи з рекламних адрес, які більше не є корисними.
Фактично, деякі чат-боти, такі як Perplexity та ChatGPT, вже підтримують інтеграцію з Gmail. Однак можливості інтеграції Gemini найрізноманітніші. Наприклад, користувачам Perplexity потрібно спеціально вводити електронні листи, які вони хочуть зберегти або видалити, тоді як операції Gemini можна виконувати за допомогою кнопок.
![]() |
Функція створення інтерактивного інтерфейсу Gemini 3. Фото: The Verge . |
Функція планування електронної пошти в ChatGPT також непослідовна. Однак швидкість доставки електронної пошти в Gemini повільніша, ніж у Perplexity. З деякими завданнями, такими як бронювання столиків у ресторані, іноді виникають проблеми.
Хоча перед виконанням конфіденційних дій, таких як здійснення платежів або надсилання електронних листів, завжди потрібне підтвердження користувача, залишати деякі завдання штучному інтелекту все ще викликає вагання користувачів. Режим агента в Gemini 3 досить корисний, але користувачам все одно доводиться контролювати результат.
Джерело: https://znews.vn/gemini-3-tot-den-dau-post1607493.html

















Коментар (0)