![]() |
Logotipo do Google Gemini. Foto: Bloomberg . |
O Google lançou o modelo Gemini 3 no final de novembro. A empresa trouxe uma série de atualizações notáveis, como recursos aprimorados de codificação, visualização e agentes, que executam determinadas tarefas em nome dos usuários.
Ao apresentar o Gemini 3, o Google enfatizou que este é o "modelo mais inteligente até o momento" da empresa. A experiência prática demonstra que o modelo processa dados mais rapidamente e possui melhor capacidade de raciocínio, embora ainda existam alguns aspectos que precisam ser aprimorados.
Crie interfaces interativas rapidamente
Uma das grandes melhorias do Gemini 3 gira em torno do Canvas, um espaço de trabalho interativo no Gemini que permite pedir aos chatbots que escrevam código, visualizem resultados e editem conteúdo.
Quando o Gemini 3 é solicitado a criar um modelo 3D da diferença entre o tamanho de uma bola de futebol, da Terra, do Sol e da Via Láctea, a ferramenta aciona uma interface interativa de codificação, processamento e criação que permite selecionar objetos e comparar seus tamanhos.
![]() |
A capacidade de criar espaços interativos com o recurso Canvas no Gemini 3. |
Em comparação com a demonstração do Google, os resultados são ligeiramente inferiores em termos de qualidade de imagem. Em contrapartida, as informações sobre os objetos são apresentadas de forma clara e fácil de entender. O tempo de processamento é de aproximadamente 2 minutos. Na interface Canvas, os usuários podem editar o código diretamente, copiar ou compartilhar o conteúdo.
Com outro comando, o Gemini 3 foi solicitado a criar uma águia em estilo voxel pousada em um galho de árvore. A ferramenta apresentou resultados após cerca de 45 segundos, e os usuários podiam ampliar e girar a visualização usando o mouse. No entanto, alguns detalhes da imagem apresentavam erros gráficos e não eram exibidos corretamente.
Também com uma águia empoleirada num galho de árvore, mas com uma solicitação mais complexa (modelo 3D). Na primeira tentativa, o código gerado pelo Gemini 3 travou e não funcionou. Após solicitar uma correção, a imagem apareceu e tornou-se interativa.
![]() |
As capacidades de criação de ambientes interativos do Gemini 3. |
Embora existam alguns problemas, a transição de um modelo de perguntas e respostas para a edição colaborativa é uma direção interessante que tornará o Gemini 3 útil para tarefas complexas e de longo prazo.
É claro que o Gemini 3 não serve apenas para criar gráficos ou modelos visuais. O Google está testando um recurso de "Interface de Usuário Generativa" para usuários do AI Pro. Com alguns comandos, o modelo pode criar interfaces interativas no estilo de revistas ou sites visuais.
O Google afirma que o recurso está sendo implementado gradualmente. Como constatado pelo The Verge , os usuários precisam selecionar o recurso de layout visual e, em seguida, digitar um comando como "Planeje uma viagem de 3 dias para Roma".
Após o processamento, o Gemini 3 gera resultados semelhantes a um site de viagens , com roteiros detalhados e imagens, além de uma série de perguntas sobre preferências de viagem e hábitos alimentares. A partir daí, o modelo ajusta as respostas de acordo. Esse recurso também é bastante útil para tópicos como montagem de computador, construção de um aquário, etc.
Raciocinar e analisar com mais eficácia
Segundo o Google, o Gemini 3 possui habilidades de raciocínio superiores às do seu antecessor. A empresa afirma que a capacidade de raciocínio do Gemini 3 Pro está em nível de doutorado, com uma pontuação de 37,5% no Humanity's Last Exam e 91,9% no exame GPQA Diamond.
É claro que os usuários só conseguem perceber a diferença ao interagir diretamente com o modelo. Ao ser solicitado a resolver um problema retirado do conjunto de referência GPQA Diamond (focado em nível de doutorado), o Gemini 3 Pro levou cerca de 30 segundos para fornecer uma solução detalhada, incluindo cada etapa do problema e imagens ilustrativas.
![]() |
Gemini 3 consegue responder a perguntas complexas, com capacidade de raciocínio equivalente ao nível de um doutorado. |
De acordo com a avaliação, a solução é bastante detalhada e segue o procedimento. Para comparação, o GPT-5.1 também levou cerca de 30 segundos, respondeu corretamente, mas a solução foi menos detalhada. Da mesma forma, o Claude 4.5 Sonnet respondeu corretamente, mais rápido que o Gemini 3, mas com menos detalhes.
O Google afirma que o Gemini 3 consegue extrair documentos de múltiplas fontes simultaneamente, como texto, imagens e vídeos . Tarefas para as quais ele não foi treinado anteriormente também são executadas com mais eficiência no Gemini 3.
![]() |
Recursos de análise de vídeo do Gemini 3. |
Por exemplo, ao ser solicitado a analisar o tema principal de um vídeo de 57 minutos, o Gemini 3 levou cerca de um minuto para retornar um resultado que incluía os argumentos solicitados, juntamente com um registro de tempo para a parte correspondente do vídeo. Da mesma forma, o modelo identificou corretamente um vídeo sobre tênis, analisando as partidas e o desempenho de cada jogador.
Os usuários podem solicitar que o Gemini 3 assista a vídeos enquanto consulta fontes externas, e até mesmo fazer perguntas para uma análise mais aprofundada. No geral, o Gemini 3 é bastante ágil na análise e consulta de documentos, em parte graças à sua conexão com o banco de dados de busca do Google.
O agente é prestativo, mas tem problemas.
O recurso Agente também representa uma atualização notável em relação ao Gemini 3. Para usuários do pacote AI Ultra (atualmente disponível apenas no mercado americano), esse modo permite a execução de processos complexos, como triagem e organização de e-mails, busca de informações, reserva de passagens aéreas, etc.
Quando o Google lançou o Gemini 3, demonstrou a capacidade de organizar sua caixa de entrada no Gmail e, segundo a experiência do The Verge , funcionou exatamente como deveria: gerou uma lista completa de e-mails não lidos da semana.
Semelhante ao recurso Canvas, a lista de e-mails e as ações sugeridas são exibidas em uma área separada. O Gemini oferece algumas opções, como definir lembretes para e-mails importantes, arquivar e-mails promocionais...
![]() |
O recurso de agente do Gemini 3 oferece suporte ao gerenciamento da caixa de entrada do Gmail. Foto: The Verge . |
Ao ser solicitado a criar um lembrete de pagamento de contas, o Gemini importa rapidamente as informações relevantes para o Google Tasks. Para a tarefa de pagamento, o agente navega automaticamente e para quando o usuário precisa inserir as informações de pagamento.
De forma geral, o agente Gemini 3 é bastante útil para detectar e-mails que os usuários provavelmente esquecerão. A ferramenta também pode encontrar e cancelar a inscrição de e-mails de endereços de publicidade que não são mais relevantes.
Na verdade, alguns chatbots como o Perplexity e o ChatGPT já oferecem integração com o Gmail. No entanto, as opções de integração do Gemini são as mais abrangentes. Por exemplo, enquanto os usuários do Perplexity precisam inserir manualmente os e-mails que desejam manter ou excluir, no Gemini essas operações podem ser feitas por meio de botões.
![]() |
Recurso de criação de interface interativa do Gemini 3. Foto: The Verge . |
O recurso de agendamento de e-mails do ChatGPT também é inconsistente. No entanto, a velocidade de entrega de e-mails do Gemini é mais lenta que a do Perplexity. Algumas tarefas, como fazer reservas em restaurantes, às vezes apresentam problemas.
Embora a confirmação do usuário seja sempre necessária antes de realizar ações sensíveis, como efetuar pagamentos ou enviar e-mails, delegar algumas tarefas à IA ainda gera hesitação nos usuários. O modo agente do Gemini 3 é bastante útil, mas os usuários ainda precisam monitorar o resultado.
Fonte: https://znews.vn/gemini-3-tot-den-dau-post1607493.html

















Comentário (0)