
Google baru sahaja mengumumkan model AI baharu yang dipanggil Gemini 2.5 Computer Use, yang membolehkan kecerdasan buatan berinteraksi secara langsung dengan pelayar web seperti pengguna sebenar.

Keupayaan AI ini termasuk mengklik, menatal, menaip, menyeret dan menjatuhkan serta menavigasi tapak web.

Ini merupakan langkah penting ke hadapan dalam membolehkan AI mengendalikan tugas pada antara muka tanpa API atau sambungan langsung.

Menurut Google, Gemini 2.5 Computer Use dilengkapi dengan pemahaman visual dan keupayaan penaakulan untuk memahami kandungan pada skrin dan melaksanakan permintaan pengguna, seperti mengisi borang, menyerahkan data atau menavigasi antara muka pengguna (pengujian UI).

Beberapa versi terdahulu model ini telah diuji dalam projek dalaman seperti Mod AI dan Project Mariner, di mana AI boleh menyelesaikan tugas secara automatik dalam penyemak imbas, seperti menambahkan produk pada troli beli-belah berdasarkan senarai ramuan yang disediakan pengguna.

Khususnya, pengumuman Google dibuat hanya sehari selepas OpenAI melancarkan satu siri aplikasi baharu untuk ChatGPT pada acara Dev Daynya, manakala Anthropic turut memperkenalkan ciri "penggunaan komputer" untuk model Claudenya tahun lepas.

Menurut Google, Gemini 2.5 Computer Use mengatasi model pesaing pada banyak ujian penanda aras web dan mudah alih.

Walau bagaimanapun, tidak seperti Ejen ChatGPT atau Claude, model Google hanya berfungsi dalam persekitaran penyemak imbas dan tidak dioptimumkan untuk kawalan penuh sistem pengendalian komputer.

Pada masa ini ia menyokong 13 jenis tindakan, termasuk membuka penyemak imbas, memasukkan teks, menyeret dan menjatuhkan, dan memindahkan elemen antara muka. Model ini tersedia kepada pembangun melalui Google AI Studio dan Vertex AI, dan pengguna boleh melihat demo langsung di Browserbase, di mana AI melaksanakan tugas seperti "main 2048" atau "cari topik kontroversi di Berita Hacker."
Sumber: https://khoahocdoisong.vn/ai-google-gemini-25-thao-tac-voi-trinh-duyet-nhu-nguoi-that-post2149059532.html
Komen (0)