
Google tocmai a anunțat un nou model de inteligență artificială numit Gemini 2.5 Computer Use, care permite inteligenței artificiale să interacționeze direct cu browserul web, la fel ca un utilizator real.

Capacitățile acestei inteligențe artificiale includ clicuri, derulare, tastare, glisare și plasare și navigare pe site-uri web.

Acesta este un pas important înainte în permiterea inteligenței artificiale să gestioneze sarcini pe interfețe fără API-uri sau conexiuni directe.

Conform Google, Gemini 2.5 Computer Use este echipat cu capacități de înțelegere vizuală și raționament pentru a înțelege conținutul de pe ecran și a îndeplini solicitările utilizatorilor, cum ar fi completarea formularelor, trimiterea de date sau navigarea prin interfețele utilizator (testarea UI).

Unele versiuni anterioare ale acestui model au fost testate în proiecte interne precum AI Mode și Project Mariner, unde AI poate finaliza automat sarcini în browser, cum ar fi adăugarea de produse în coșul de cumpărături pe baza unei liste de ingrediente furnizate de utilizator.

În mod special, anunțul Google vine la doar o zi după ce OpenAI a dezvăluit o serie de noi aplicații pentru ChatGPT la evenimentul său Dev Day, în timp ce Anthropic a introdus și o funcție de „utilizare a computerului” pentru modelul său Claude anul trecut.

Conform Google, Gemini 2.5 Computer Use depășește performanțele modelelor concurente în multe teste de benchmark web și mobile.

Totuși, spre deosebire de ChatGPT Agent sau Claude, modelul Google funcționează doar într-un mediu de browser și nu este optimizat pentru controlul complet asupra sistemului de operare al computerului.

În prezent, acceptă 13 tipuri de acțiuni, inclusiv deschiderea unui browser, introducerea de text, glisarea și plasarea și mutarea elementelor de interfață. Modelul este disponibil dezvoltatorilor prin Google AI Studio și Vertex AI, iar utilizatorii pot viziona o demonstrație live pe Browserbase, unde IA îndeplinește sarcini precum „joacă 2048” sau „găsește subiecte controversate pe Hacker News”.
Sursă: https://khoahocdoisong.vn/ai-google-gemini-25-thao-tac-voi-trinh-duyet-nhu-nguoi-that-post2149059532.html
Comentariu (0)