![]() |
Gemma 4 é uma linguagem de modelos de grande porte (LLM, na sigla em inglês) desenvolvida pelo Google DeepMind. Trata-se de uma família de modelos de código aberto que suporta processamento local sem conexão com a internet. Os usuários podem baixá-la, personalizá-la e implantá-la em seus computadores ou dispositivos móveis. |
![]() |
A série Gemma 4 é distribuída em quatro versões: E2B, E4B, 31B e 26B A4B. As versões E2B e E4B requerem um mínimo de 4 a 6 GB (4 bits) ou 10 a 16 GB (16 bits) de RAM, sendo adequadas para uso em dispositivos móveis e computadores com configurações moderadas. Já a versão 26B A4B requer um mínimo de 18 GB de RAM, e a 31B, pelo menos 20 GB. |
![]() |
Segundo a MindStudio , uma das vantagens de executar modelos de IA localmente é a segurança e a ausência de custos adicionais. No entanto, o desempenho desses modelos depende do hardware do dispositivo. Usuários de dispositivos móveis podem instalar o aplicativo Google AI Edge Gallery (na imagem), enquanto computadores exigem ferramentas como o LM Studio ou o Ollama. Foto: Google . |
![]() |
O LM Studio para PC permite selecionar e carregar o Gemma 4 na primeira execução. A versão E4B tem aproximadamente 6,3 GB e suporta inferência e análise de imagens. O Gemma 4 E4B para dispositivos móveis tem um tamanho de 3,6 GB quando baixado usando a Galeria do Google AI Edge. |
![]() |
Após a conclusão do download, o usuário é redirecionado para uma interface semelhante a um chatbot. Na seção de seleção de modelo abaixo, clique em Gemma 4 E4B . Na janela seguinte, selecione Carregar Modelo e aguarde cerca de um minuto para que o modelo seja iniciado. |
![]() |
Assim como outros modelos populares, o Gemma 4 E4B suporta interação em vietnamita. Em testes realizados em um Mac mini M4 (16 GB de RAM) com o comando "Olá", o modelo levou aproximadamente 8 segundos para deduzir e responder. |
![]() |
Ao ser questionada sobre "O que você sabe fazer?", Gemma 4 E4B levou aproximadamente 13 segundos para entender e traduzir imediatamente o comando para o inglês, e então gradualmente anotou a resposta. |
![]() |
Como é executado diretamente no dispositivo, o tempo de resposta do modelo pode variar dependendo do hardware. Com a mesma pergunta, "O que você pode fazer?", o modelo levou aproximadamente 45 segundos para fornecer uma resposta completa em um iPhone 15 Pro. |
![]() |
Outra questão de raciocínio que foi respondida de forma rápida e precisa foi, por exemplo: "Um trem parte às 8h15 e chega às 11h47. Quanto tempo durou a viagem?". Em geral, enunciados de raciocínio simples como esses não são muito complicados para a nova geração de mestres em Direito. |
![]() |
Testada com uma questão de lógica como "Quantos 'r's existem na palavra 'morango'?". Essa questão havia confundido muitos candidatos anteriores ao LLM, mas Gemma 4 E4B levou apenas cerca de 3 segundos para respondê-la corretamente. |
![]() ![]() |
Diante de uma questão mais complexa, após uma série de raciocínios meticulosos, Gemma 4 respondeu corretamente. O tempo total de raciocínio foi de 1 minuto e 6 segundos, um valor não muito longo para um modelo offline. Para efeito de comparação, o Gemini 3 Thinking levou cerca de 15 segundos, e o GPT-5.5, um tempo semelhante. |
![]() |
O grande diferencial do Gemma 4 E4B reside em suas capacidades multimodais, que suportam a entrada de imagens. Por exemplo, o LLM pode analisar imagens e responder a perguntas sobre pontos de referência, detalhes importantes e condições climáticas presentes na imagem. |
![]() |
Ao ser solicitado a extrair todo o texto da imagem de uma página de revista, o Gemma 4 levou pouco mais de 30 segundos para retornar o resultado. Esse tempo não difere significativamente do de outros mecanismos de busca online com os quais os usuários estão familiarizados. |
![]() |
No aplicativo para smartphone, os usuários precisam selecionar um recurso na interface principal (Chat com IA, Solicitar Imagem, etc.) e, em seguida, escolher um modelo para usar. Como ele opera com base na GPU, o dispositivo pode aquecer durante o processo de inferência de IA. |
![]() |
Os usuários também podem fazer upload de arquivos de documentos, em formato DOCX ou PDF, e solicitar análise ou resumo de texto. Segundo representantes do Google, a nova geração de modelos controla efetivamente a geração de sequências de caracteres. O modelo limita processos de processamento desnecessários, reduzindo a carga computacional nas placas gráficas e na memória do computador. |
![]() |
Gemma 4 também é programável. Em um experimento, o modelo foi incumbido de usar HTML, CSS e JavaScript para construir um sistema operacional que roda diretamente no navegador. Os usuários precisavam aumentar o Comprimento do Contexto antes da inicialização para garantir que o modelo produzisse uma resposta completa. Mesmo assim, a IA ainda poderia cometer erros se o arquivo HTML estivesse incompleto, e alguns componentes do aplicativo poderiam não funcionar. |
![]() |
Em geral, comandos que exigem várias etapas ou dados complexos podem ser desafiadores para o Gemma 4. Alguns comandos podem consumir um grande número de tokens de processamento. Definir limites de tokens excessivamente altos pode consumir muita RAM ou VRAM. |
Fonte: https://znews.vn/ai-khong-can-internet-cua-google-lam-duoc-gi-post1652142.html


























Comentário (0)