Vietnam.vn - Nền tảng quảng bá Việt Nam

O Google Gemini 2.5 funciona com o navegador como uma pessoa real

O Google anunciou o modelo de IA Gemini 2.5 Computer Use, que permite que a IA clique, digite, role e arraste e solte, assim como os humanos.

Báo Khoa học và Đời sốngBáo Khoa học và Đời sống10/10/2025

O Google acaba de anunciar um novo modelo de IA chamado Gemini 2.5 Computer Use, que permite que a inteligência artificial interaja diretamente com o navegador da web como um usuário real.

Os recursos desta IA incluem clicar, rolar, digitar, arrastar e soltar e navegar em sites.

Este é um passo importante para permitir que a IA lide com tarefas em interfaces sem APIs ou conexões diretas.

De acordo com o Google, o Gemini 2.5 Computer Use é equipado com recursos de compreensão e raciocínio visual para entender o conteúdo na tela e atender às solicitações do usuário, como preencher formulários, enviar dados ou navegar em interfaces de usuário (testes de IU).

Algumas versões anteriores deste modelo foram testadas em projetos internos como o AI Mode e o Project Mariner, onde a IA pode concluir tarefas automaticamente no navegador, como adicionar produtos a um carrinho de compras com base em uma lista de ingredientes fornecida pelo usuário.

Vale ressaltar que o anúncio do Google ocorre apenas um dia após a OpenAI revelar uma série de novos aplicativos para o ChatGPT em seu evento Dev Day, enquanto a Anthropic também introduziu um recurso de "uso de computador" para seu modelo Claude no ano passado.

De acordo com o Google, o Gemini 2.5 Computer Use supera modelos concorrentes em muitos testes de benchmark na web e em dispositivos móveis.

No entanto, diferentemente do ChatGPT Agent ou do Claude, o modelo do Google só funciona em um ambiente de navegador e não é otimizado para controle total do sistema operacional do computador.

Atualmente, ele suporta 13 tipos de ações, incluindo abrir um navegador, inserir texto, arrastar e soltar e mover elementos da interface. O modelo está disponível para desenvolvedores por meio do Google AI Studio e do Vertex AI, e os usuários podem assistir a uma demonstração ao vivo no Browserbase, onde a IA realiza tarefas como "jogar 2048" ou "encontrar tópicos polêmicos no Hacker News".

O Gemini passa facilmente no teste "Não sou um robô" do navegador.

Fonte: https://khoahocdoisong.vn/ai-google-gemini-25-thao-tac-voi-trinh-duyet-nhu-nguoi-that-post2149059532.html


Comentário (0)

No data
No data

Na mesma categoria

Seleção vietnamita é promovida à classificação da FIFA após vitória sobre o Nepal; Indonésia corre perigo
71 anos após a libertação, Hanói mantém sua beleza patrimonial no fluxo moderno
71º aniversário do Dia da Libertação da Capital - despertando o espírito para que Hanói entre firmemente na nova era
Áreas inundadas em Lang Son vistas de um helicóptero

Do mesmo autor

Herança

Figura

Negócios

No videos available

Eventos atuais

Sistema político

Local

Produto