Найбільший конкурент ChatGPT

Логотип Google Gemini. Фото: Bloomberg .

Google запустила модель Gemini 3 наприкінці листопада. Компанія представила низку помітних оновлень, таких як покращені можливості кодування, створення візуальних зображень та агенти, які виконують певні завдання від імені користувача.

Під час презентації Gemini 3 Google наголосив, що це «найрозумніша модель компанії на сьогодні». Реальний досвід показує, що модель обробляє дані швидше та має кращі можливості для міркування, хоча деякі області для вдосконалення все ще є.

Швидко створюйте інтерактивні інтерфейси.

Одне з головних оновлень у Gemini 3 стосується Canvas. Це інтерактивний робочий простір у Gemini, який дозволяє вам просити чат-ботів писати код, візуалізувати результати та редагувати контент.

Коли Gemini 3 просять створити 3D-модель різниці в розмірах між футбольним м'ячем, Землею, Сонцем та Чумацьким Шляхом, інструмент активує інтерфейс кодування, обробляє та створює інтерактивне середовище, дозволяючи користувачам вибирати та порівнювати розміри об'єктів.

Gemini 3 la gi, danh gia Gemini 3, mo hinh Gemini 3, Google Gemini 3 Pro anh 1

Можливість створювати інтерактивні простори за допомогою функції Canvas у Gemini 3.

Порівняно з демоверсією Google, результати дещо гірші за якістю зображення. Однак інформація про об'єкти чітка та зрозуміла. Час обробки становить приблизно 2 хвилини. В інтерфейсі Canvas користувачі можуть безпосередньо редагувати код, копіювати або ділитися контентом.

За допомогою іншої команди Gemini 3 було запропоновано створити 3D-модель орла, що сидить на гілці дерева, у стилі куба (воксель). Інструмент видавав результат приблизно за 45 секунд, і користувачі могли збільшувати та обертати зображення за допомогою миші. Однак деякі деталі зображення мали графічні помилки та відображалися нестабільно.

Орел, що сидів на гілці дерева, також був присутній, але вимога була складнішою (3D-модель). Спочатку код, згенерований Gemini 3, не працював. Після запиту на внесення змін зображення з'явилося та стало інтерактивним.

Gemini 3 la gi, danh gia Gemini 3, mo hinh Gemini 3, Google Gemini 3 Pro anh 2

Здатність Gemini 3 створювати інтерактивні середовища.

Незважаючи на деякі проблеми, що залишилися, перехід від моделі питань і відповідей до спільного редагування є цікавим напрямком, що робить Gemini 3 корисним для складних довгострокових завдань.

Звичайно, Gemini 3 призначений не лише для створення графіки чи візуальних моделей. Google тестує функцію «Генеративного інтерфейсу» для користувачів AI Pro. За допомогою певних команд модель може створювати інтерактивні інтерфейси у стилі журналу або візуальні вебсайти.

Google каже, що ця функція впроваджується поетапно. Згідно з досвідом The Verge , користувачам потрібно вибрати функцію « Візуальний макет» , а потім ввести команду, наприклад, «Спланувати мою 3-денну поїздку до Риму».

Після обробки Gemini 3 генерує результати, подібні до туристичного веб-сайту, з маршрутами, детальними зображеннями та деякими питаннями про вподобання щодо подорожей та харчові звички. Потім модель відповідно коригує відповіді. Ця функція також досить корисна для таких тем, як зібрати комп'ютер або побудувати акваріум.

Більш ефективні міркування та аналіз.

За даними Google, Gemini 3 має кращі можливості міркування, ніж його попередник. Компанія стверджує, що здатність міркувати Gemini 3 Pro досягає докторського рівня, отримавши 37,5% на останньому іспиті Humanity's Last та 91,9% на іспиті GPQA Diamond.

Звісно, користувачі можуть по-справжньому оцінити різницю лише під час безпосередньої взаємодії з моделлю. Коли Gemini 3 Pro просили вирішити задачу з довідкового набору питань GPQA Diamond (орієнтованого на докторський рівень), йому знадобилося приблизно 30 секунд, щоб надати детальне рішення, включаючи покрокові інструкції та ілюстративні зображення.

Gemini 3 la gi, danh gia Gemini 3, mo hinh Gemini 3, Google Gemini 3 Pro anh 3

Близнюки 3 можуть відповідати на складні питання, демонструючи розумові здібності, еквівалентні рівню доктора філософії.

Згідно з оцінюванням, розв'язок досить детальний та відповідає правильній процедурі. Для порівняння, у GPT-5.1 також знадобилося близько 30 секунд, щоб відповісти правильно, але розв'язок був менш детальним. Аналогічно, у Claude 4.5 Sonnet було надано правильну відповідь швидше, ніж у Gemini 3, але воно було менш детальним.

Google стверджує, що Gemini 3 може одночасно витягувати документи з кількох джерел, таких як текст, зображення та відео . Завдання, які раніше ніколи не навчалися, також краще справляються на Gemini 3.

Gemini 3 la gi, danh gia Gemini 3, mo hinh Gemini 3, Google Gemini 3 Pro anh 4

Можливості аналізу відео Gemini 3.

Наприклад, коли Gemini 3 попросили проаналізувати основну тему 57-хвилинного відео, йому знадобилося лише близько хвилини, щоб надати результати, включаючи запитувані аргументи та позначки часу для відповідного сегмента відео. Аналогічно, модель правильно ідентифікувала тенісне відео, аналізуючи матчі та стиль гри кожного спортсмена.

Користувачі можуть попросити Gemini 3 одночасно переглядати відео та звертатися до зовнішніх джерел, навіть ставити запитання для глибшого аналізу. Загалом, Gemini 3 досить швидко реагує на аналітичні завдання та завдання з посиланнями на документи, частково завдяки зв'язку з базою даних пошуку Google.

Агент корисний, але проблеми все ще є.

Функція «Агент» також є помітним оновленням у Gemini 3. Для користувачів плану AI Ultra (наразі доступного лише на ринку США) цей режим може виконувати складні завдання від імені користувача, такі як категоризація та впорядкування електронних листів, пошук інформації та бронювання квитків.

Під час запуску Gemini 3 Google використав приклад можливості впорядкування вхідних повідомлень у Gmail. За досвідом The Verge , ця функція працює саме так, як і було запропоновано: створює повний список непрочитаних листів за тиждень.

Подібно до функції Canvas, списки розсилки та запропоновані дії відображаються в окремій області. Gemini пропонує кілька опцій, таких як налаштування нагадувань для важливих електронних листів, архівування рекламних листів тощо.

Gemini 3 la gi, danh gia Gemini 3, mo hinh Gemini 3, Google Gemini 3 Pro anh 5

Функція агента Gemini 3 допомагає керувати вхідними повідомленнями Gmail. Зображення: The Verge .

Коли з’являється запит на створення нагадування про оплату рахунків, Gemini швидко вводить відповідну інформацію в Google Tasks. Для платіжного завдання агент автоматично переходить до наступного кроку та зупиняється, коли користувачеві потрібно ввести платіжну інформацію.

Загалом, агент Gemini 3 досить корисний для виявлення електронних листів, які користувачі схильні забувати. Інструмент також може знаходити та скасовувати підписку на електронні листи з рекламних адрес, які більше не є корисними.

Фактично, агенти деяких чат-ботів, таких як Perplexity та ChatGPT, вже підтримують інтеграцію з Gmail. Однак Gemini пропонує найрізноманітніші можливості інтеграції. Наприклад, користувачам Perplexity потрібно спеціально вводити електронні листи, які вони хочуть зберегти або видалити, тоді як ці дії можна виконувати за допомогою кнопок на Gemini.

Gemini 3 la gi, danh gia Gemini 3, mo hinh Gemini 3, Google Gemini 3 Pro anh 6

Функція створення інтерактивного інтерфейсу Gemini 3. Фото: The Verge .

Функція сортування електронної пошти в ChatGPT також нестабільна. Однак швидкість надсилання електронної пошти в Gemini повільніша, ніж у Perplexity. Деякі завдання, такі як бронювання столика в ресторані, іноді виникають проблеми.

Хоча перед виконанням конфіденційних дій, таких як платежі чи надсилання електронних листів, завжди потрібне підтвердження користувача, делегування певних завдань штучному інтелекту все ще викликає вагання користувачів. Режим агента на Gemini 3 досить корисний, але користувачам все одно потрібно контролювати результат.

Джерело: https://znews.vn/gemini-3-tot-den-dau-post1607493.html