Vietnam.vn - Nền tảng quảng bá Việt Nam

Штучний інтелект Google Gemini 2.5 працює з браузером як справжня людина

Google анонсувала модель штучного інтелекту Gemini 2.5 Computer Use, яка дозволяє штучному інтелекту клацати, друкувати, прокручувати та перетягувати елементи так само, як і люди.

Báo Khoa học và Đời sốngBáo Khoa học và Đời sống10/10/2025

Google щойно анонсував нову модель штучного інтелекту під назвою Gemini 2.5 Computer Use, яка дозволяє штучному інтелекту безпосередньо взаємодіяти з веббраузером, як справжній користувач.

Можливості цього штучного інтелекту включають клацання, прокручування, введення тексту, перетягування та навігацію веб-сайтами.

Це важливий крок вперед у наданні можливості штучному інтелекту обробляти завдання на інтерфейсах без API або прямих з'єднань.

Згідно з Google, Gemini 2.5 Computer Use оснащений можливостями візуального розуміння та міркування для розуміння екранного вмісту та виконання запитів користувачів, таких як заповнення форм, надсилання даних або навігація по інтерфейсах користувача (тестування інтерфейсу користувача).

Деякі попередні версії цієї моделі були протестовані у внутрішніх проектах, таких як AI Mode та Project Mariner, де ШІ може автоматично виконувати завдання у браузері, такі як додавання продуктів до кошика на основі списку інгредієнтів, наданого користувачем.

Примітно, що оголошення Google з'явилося лише через день після того, як OpenAI представила серію нових програм для ChatGPT на своєму заході Dev Day, а Anthropic також представила функцію «використання комп'ютера» для своєї моделі Claude минулого року.

За даними Google, Gemini 2.5 Computer Use перевершує конкуруючі моделі в багатьох веб- та мобільних тестах.

Однак, на відміну від ChatGPT Agent чи Claude, модель Google працює лише в середовищі браузера та не оптимізована для повного контролю над операційною системою комп'ютера.

Наразі він підтримує 13 типів дій, включаючи відкриття браузера, введення тексту, перетягування та переміщення елементів інтерфейсу. Модель доступна розробникам через Google AI Studio та Vertex AI, а користувачі можуть переглянути живу демонстрацію на Browserbase, де ШІ виконує такі завдання, як «грати в 2048» або «знайти суперечливі теми на Hacker News».

Gemini легко проходить тест браузера «Я не робот».

Джерело: https://khoahocdoisong.vn/ai-google-gemini-25-thao-tac-voi-trinh-duyet-nhu-nguoi-that-post2149059532.html


Коментар (0)

No data
No data

У тій самій категорії

Збірна В'єтнаму піднялася до рейтингу ФІФА після перемоги над Непалом, Індонезія під загрозою
Через 71 рік після визволення Ханой зберігає свою історичну красу в сучасному потоці.
71-ша річниця Дня визволення столиці – спонукання Ханоя міцно ступити в нову еру
Затоплені райони Ланг Сону, видні з гелікоптера

Того ж автора

Спадщина

Фігура

Бізнес

No videos available

Поточні події

Політична система

Місцевий

Продукт