O que a IA pode fazer sem a rede do Google?

O modelo principal do Gemma 4 consegue inferir e analisar imagens, além de escrever código, sendo compatível tanto com PCs quanto com smartphones.

ZNews•28/05/2026

Tai Google Gemma 4, Gemma 4 la gi, Gemma 4 vs Gemini, tai AI mien phi anh 1

Gemma 4 é uma linguagem de modelos de grande porte (LLM, na sigla em inglês) desenvolvida pelo Google DeepMind. Trata-se de uma família de modelos de código aberto que suporta processamento local sem conexão com a internet. Os usuários podem baixá-la, personalizá-la e implantá-la em seus computadores ou dispositivos móveis.

Tai Google Gemma 4, Gemma 4 la gi, Gemma 4 vs Gemini, tai AI mien phi anh 2

A série Gemma 4 é distribuída em quatro versões: E2B, E4B, 31B e 26B A4B. As versões E2B e E4B requerem um mínimo de 4 a 6 GB (4 bits) ou 10 a 16 GB (16 bits) de RAM, sendo adequadas para uso em dispositivos móveis e computadores com configurações moderadas. Já a versão 26B A4B requer um mínimo de 18 GB de RAM, e a 31B, pelo menos 20 GB.

Tai Google Gemma 4, Gemma 4 la gi, Gemma 4 vs Gemini, tai AI mien phi anh 3

Segundo a MindStudio , uma das vantagens de executar modelos de IA localmente é a segurança e a ausência de custos adicionais. No entanto, o desempenho desses modelos depende do hardware do dispositivo. Usuários de dispositivos móveis podem instalar o aplicativo Google AI Edge Gallery (na imagem), enquanto computadores exigem ferramentas como o LM Studio ou o Ollama. Foto: Google .

Tai Google Gemma 4, Gemma 4 la gi, Gemma 4 vs Gemini, tai AI mien phi anh 4

O LM Studio para PC permite selecionar e carregar o Gemma 4 na primeira execução. A versão E4B tem aproximadamente 6,3 GB e suporta inferência e análise de imagens. O Gemma 4 E4B para dispositivos móveis tem um tamanho de 3,6 GB quando baixado usando a Galeria do Google AI Edge.

Tai Google Gemma 4, Gemma 4 la gi, Gemma 4 vs Gemini, tai AI mien phi anh 5

Após a conclusão do download, o usuário é redirecionado para uma interface semelhante a um chatbot. Na seção de seleção de modelo abaixo, clique em Gemma 4 E4B . Na janela seguinte, selecione Carregar Modelo e aguarde cerca de um minuto para que o modelo seja iniciado.

Tai Google Gemma 4, Gemma 4 la gi, Gemma 4 vs Gemini, tai AI mien phi anh 6

Assim como outros modelos populares, o Gemma 4 E4B suporta interação em vietnamita. Em testes realizados em um Mac mini M4 (16 GB de RAM) com o comando "Olá", o modelo levou aproximadamente 8 segundos para deduzir e responder.

Tai Google Gemma 4, Gemma 4 la gi, Gemma 4 vs Gemini, tai AI mien phi anh 7

Ao ser questionada sobre "O que você sabe fazer?", Gemma 4 E4B levou aproximadamente 13 segundos para entender e traduzir imediatamente o comando para o inglês, e então gradualmente anotou a resposta.

Tai Google Gemma 4, Gemma 4 la gi, Gemma 4 vs Gemini, tai AI mien phi anh 8

Como é executado diretamente no dispositivo, o tempo de resposta do modelo pode variar dependendo do hardware. Com a mesma pergunta, "O que você pode fazer?", o modelo levou aproximadamente 45 segundos para fornecer uma resposta completa em um iPhone 15 Pro.

Tai Google Gemma 4, Gemma 4 la gi, Gemma 4 vs Gemini, tai AI mien phi anh 9

Outra questão de raciocínio que foi respondida de forma rápida e precisa foi, por exemplo: "Um trem parte às 8h15 e chega às 11h47. Quanto tempo durou a viagem?". Em geral, enunciados de raciocínio simples como esses não são muito complicados para a nova geração de mestres em Direito.

Tai Google Gemma 4, Gemma 4 la gi, Gemma 4 vs Gemini, tai AI mien phi anh 10

Testada com uma questão de lógica como "Quantos 'r's existem na palavra 'morango'?". Essa questão havia confundido muitos candidatos anteriores ao LLM, mas Gemma 4 E4B levou apenas cerca de 3 segundos para respondê-la corretamente.

Tai Google Gemma 4, Gemma 4 la gi, Gemma 4 vs Gemini, tai AI mien phi anh 11

Tai Google Gemma 4, Gemma 4 la gi, Gemma 4 vs Gemini, tai AI mien phi anh 12

Diante de uma questão mais complexa, após uma série de raciocínios meticulosos, Gemma 4 respondeu corretamente. O tempo total de raciocínio foi de 1 minuto e 6 segundos, um valor não muito longo para um modelo offline. Para efeito de comparação, o Gemini 3 Thinking levou cerca de 15 segundos, e o GPT-5.5, um tempo semelhante.

Tai Google Gemma 4, Gemma 4 la gi, Gemma 4 vs Gemini, tai AI mien phi anh 13

O grande diferencial do Gemma 4 E4B reside em suas capacidades multimodais, que suportam a entrada de imagens. Por exemplo, o LLM pode analisar imagens e responder a perguntas sobre pontos de referência, detalhes importantes e condições climáticas presentes na imagem.

Tai Google Gemma 4, Gemma 4 la gi, Gemma 4 vs Gemini, tai AI mien phi anh 14

Ao ser solicitado a extrair todo o texto da imagem de uma página de revista, o Gemma 4 levou pouco mais de 30 segundos para retornar o resultado. Esse tempo não difere significativamente do de outros mecanismos de busca online com os quais os usuários estão familiarizados.

Tai Google Gemma 4, Gemma 4 la gi, Gemma 4 vs Gemini, tai AI mien phi anh 15

No aplicativo para smartphone, os usuários precisam selecionar um recurso na interface principal (Chat com IA, Solicitar Imagem, etc.) e, em seguida, escolher um modelo para usar. Como ele opera com base na GPU, o dispositivo pode aquecer durante o processo de inferência de IA.

Tai Google Gemma 4, Gemma 4 la gi, Gemma 4 vs Gemini, tai AI mien phi anh 16

Os usuários também podem fazer upload de arquivos de documentos, em formato DOCX ou PDF, e solicitar análise ou resumo de texto. Segundo representantes do Google, a nova geração de modelos controla efetivamente a geração de sequências de caracteres. O modelo limita processos de processamento desnecessários, reduzindo a carga computacional nas placas gráficas e na memória do computador.

Tai Google Gemma 4, Gemma 4 la gi, Gemma 4 vs Gemini, tai AI mien phi anh 17

Gemma 4 também é programável. Em um experimento, o modelo foi incumbido de usar HTML, CSS e JavaScript para construir um sistema operacional que roda diretamente no navegador. Os usuários precisavam aumentar o Comprimento do Contexto antes da inicialização para garantir que o modelo produzisse uma resposta completa. Mesmo assim, a IA ainda poderia cometer erros se o arquivo HTML estivesse incompleto, e alguns componentes do aplicativo poderiam não funcionar.

Tai Google Gemma 4, Gemma 4 la gi, Gemma 4 vs Gemini, tai AI mien phi anh 18

Em geral, comandos que exigem várias etapas ou dados complexos podem ser desafiadores para o Gemma 4. Alguns comandos podem consumir um grande número de tokens de processamento. Definir limites de tokens excessivamente altos pode consumir muita RAM ou VRAM.

Fonte: https://znews.vn/ai-khong-can-internet-cua-google-lam-duoc-gi-post1652142.html