
Google heeft zojuist een nieuw AI-model aangekondigd met de naam Gemini 2.5 Computer Use, waarmee kunstmatige intelligentie rechtstreeks met de webbrowser kan communiceren, net als een echte gebruiker.

De mogelijkheden van deze AI omvatten klikken, scrollen, typen, slepen en neerzetten en navigeren op websites.

Dit is een belangrijke stap voorwaarts om AI in staat te stellen taken uit te voeren op interfaces zonder API's of directe verbindingen.

Volgens Google is Gemini 2.5 Computer Use uitgerust met visuele begrips- en redeneermogelijkheden om de inhoud op het scherm te begrijpen en gebruikersopdrachten uit te voeren, zoals het invullen van formulieren, het indienen van gegevens of het navigeren door gebruikersinterfaces (UI-testen).

Eerdere versies van dit model zijn getest in interne projecten zoals AI Mode en Project Mariner, waarbij AI automatisch taken in de browser kan uitvoeren, zoals het toevoegen van producten aan een winkelwagen op basis van een door de gebruiker verstrekte lijst met ingrediënten.

Opvallend is dat de aankondiging van Google slechts een dag nadat OpenAI een reeks nieuwe applicaties voor ChatGPT onthulde tijdens zijn Dev Day-evenement, terwijl Anthropic vorig jaar ook een "computergebruik"-functie voor zijn Claude-model introduceerde.

Volgens Google presteert Gemini 2.5 Computer Use beter dan concurrerende modellen in veel web- en mobiele benchmarktests.

In tegenstelling tot ChatGPT Agent of Claude werkt het model van Google echter alleen in een browseromgeving en is het niet geoptimaliseerd voor volledige controle over het besturingssysteem van de computer.

Het ondersteunt momenteel 13 soorten acties, waaronder het openen van een browser, het invoeren van tekst, slepen en neerzetten en het verplaatsen van interface-elementen. Het model is beschikbaar voor ontwikkelaars via Google AI Studio en Vertex AI, en gebruikers kunnen een live demo bekijken op Browserbase, waar de AI taken uitvoert zoals "speel 2048" of "vind controversiële onderwerpen op Hacker News".
Bron: https://khoahocdoisong.vn/ai-google-gemini-25-thao-tac-voi-trinh-duyet-nhu-nguoi-that-post2149059532.html
Reactie (0)