Vietnam.vn - Nền tảng quảng bá Việt Nam

Google Gemini 2.5, bazat pe inteligență artificială, funcționează cu browserul ca o persoană reală

Google a anunțat modelul de inteligență artificială Gemini 2.5 Computer Use, care permite inteligenței artificiale să dea clic, să tasteze, să deruleze și să tragă și să plaseze, exact ca oamenii.

Báo Khoa học và Đời sốngBáo Khoa học và Đời sống10/10/2025

Google tocmai a anunțat un nou model de inteligență artificială numit Gemini 2.5 Computer Use, care permite inteligenței artificiale să interacționeze direct cu browserul web, la fel ca un utilizator real.

Capacitățile acestei inteligențe artificiale includ clicuri, derulare, tastare, glisare și plasare și navigare pe site-uri web.

Acesta este un pas important înainte în permiterea inteligenței artificiale să gestioneze sarcini pe interfețe fără API-uri sau conexiuni directe.

Conform Google, Gemini 2.5 Computer Use este echipat cu capacități de înțelegere vizuală și raționament pentru a înțelege conținutul de pe ecran și a îndeplini solicitările utilizatorilor, cum ar fi completarea formularelor, trimiterea de date sau navigarea prin interfețele utilizator (testarea UI).

Unele versiuni anterioare ale acestui model au fost testate în proiecte interne precum AI Mode și Project Mariner, unde AI poate finaliza automat sarcini în browser, cum ar fi adăugarea de produse în coșul de cumpărături pe baza unei liste de ingrediente furnizate de utilizator.

În mod special, anunțul Google vine la doar o zi după ce OpenAI a dezvăluit o serie de noi aplicații pentru ChatGPT la evenimentul său Dev Day, în timp ce Anthropic a introdus și o funcție de „utilizare a computerului” pentru modelul său Claude anul trecut.

Conform Google, Gemini 2.5 Computer Use depășește performanțele modelelor concurente în multe teste de benchmark web și mobile.

Totuși, spre deosebire de ChatGPT Agent sau Claude, modelul Google funcționează doar într-un mediu de browser și nu este optimizat pentru controlul complet asupra sistemului de operare al computerului.

În prezent, acceptă 13 tipuri de acțiuni, inclusiv deschiderea unui browser, introducerea de text, glisarea și plasarea și mutarea elementelor de interfață. Modelul este disponibil dezvoltatorilor prin Google AI Studio și Vertex AI, iar utilizatorii pot viziona o demonstrație live pe Browserbase, unde IA îndeplinește sarcini precum „joacă 2048” sau „găsește subiecte controversate pe Hacker News”.

Gemini trece cu ușurință testul browserului „Nu sunt robot”.

Sursă: https://khoahocdoisong.vn/ai-google-gemini-25-thao-tac-voi-trinh-duyet-nhu-nguoi-that-post2149059532.html


Comentariu (0)

No data
No data

În aceeași categorie

Echipa Vietnamului a promovat la rangul FIFA după victoria asupra Nepalului, Indonezia în pericol
La 71 de ani de la eliberare, Hanoi își păstrează frumusețea moștenirii în fluxul modern.
A 71-a aniversare a Zilei Eliberării Capitalei - insuflând spiritului pentru ca Hanoiul să pășească ferm în noua eră
Zone inundate din Lang Son văzute dintr-un elicopter

De același autor

Patrimoniu

Figura

Afaceri

No videos available

Evenimente actuale

Sistem politic

Local

Produs