![]() |
Gemma 4 is een grote modeltaal (LLM) ontwikkeld door Google DeepMind. Het is een open-source modelfamilie die on-premises verwerking zonder internetverbinding ondersteunt. Gebruikers kunnen het downloaden, aanpassen en implementeren op hun computers of mobiele apparaten. |
![]() |
De Gemma 4-serie is verkrijgbaar in vier versies: E2B, E4B, 31B en 26B A4B. De E2B- en E4B-versies vereisen minimaal 4-6 GB (4-bit) of 10-16 GB (16-bit) RAM, geschikt voor gebruik op mobiele apparaten en computers met een gemiddelde configuratie. De 26B A4B-versie vereist minimaal 18 GB RAM en de 31B minimaal 20 GB. |
![]() |
Volgens MindStudio is een van de voordelen van het lokaal uitvoeren van AI-modellen de beveiliging en het ontbreken van extra kosten. De prestaties van deze modellen zijn echter afhankelijk van de hardware van het apparaat. Mobiele gebruikers kunnen de Google AI Edge Gallery-app installeren (zie afbeelding), terwijl computers tools zoals LM Studio of Ollama nodig hebben. Foto: Google . |
![]() |
Met LM Studio op de pc kunt u Gemma 4 direct selecteren en laden. De E4B-versie is ongeveer 6,3 GB groot en ondersteunt beeldherkenning en -analyse. Gemma 4 E4B op mobiele apparaten heeft een grootte van 3,6 GB wanneer het wordt gedownload via Google AI Edge Gallery. |
![]() |
Nadat de download is voltooid, wordt de gebruiker doorgestuurd naar een chatbot-achtige interface. Klik in het onderstaande gedeelte voor modelselectie op Gemma 4 E4B . Selecteer in het volgende venster ' Model laden' en wacht ongeveer een minuut totdat het model is opgestart. |
![]() |
Net als andere populaire modellen ondersteunt de Gemma 4 E4B interactie met de Vietnamese taal. Bij een test op een Mac mini M4 (16 GB RAM) met het commando "Hallo" had het model ongeveer 8 seconden nodig om de taal te herkennen en te reageren. |
![]() |
Toen aan Gemma 4 E4B werd gevraagd "Wat kun je doen?", had ze ongeveer 13 seconden nodig om het commando te begrijpen en het direct in het Engels te vertalen, waarna ze het antwoord geleidelijk opschreef. |
![]() |
Omdat het model direct op het apparaat draait, kan de reactietijd variëren afhankelijk van de hardware. Bij dezelfde vraag, "Wat kun je doen?", had het model ongeveer 45 seconden nodig om een volledig antwoord te geven op een iPhone 15 Pro. |
![]() |
Een andere redeneervraag die snel en accuraat werd beantwoord, was bijvoorbeeld: "Een trein vertrekt om 8:15 uur en arriveert om 11:47 uur. Hoe lang duurde de reis?". Over het algemeen zijn eenvoudige redeneervragen zoals deze niet te ingewikkeld voor de nieuwe generatie rechtenstudenten. |
![]() |
Getest met een logische vraag als "Hoeveel 'r's zitten er in het woord 'aardbei'?". Deze vraag had veel eerdere LLM's (Letter of Learning) hoofdbreken bezorgd, maar Gemma 4 E4B had slechts ongeveer 3 seconden nodig om het juiste antwoord te geven. |
![]() ![]() |
Bij een complexere vraag gaf Gemma 4 na een reeks zorgvuldige redeneringen het juiste antwoord. De totale denktijd bedroeg 1 minuut en 6 seconden, niet te lang voor een offline model. Ter vergelijking: Gemini 3 Thinking deed er ongeveer 15 seconden over, en GPT-5.5 had een vergelijkbare tijd nodig. |
![]() |
Het hoogtepunt van de Gemma 4 E4B is de multimodale functionaliteit, die onder andere beeldinvoer ondersteunt. Zo kan LLM bijvoorbeeld beelden analyseren en vragen beantwoorden over herkenningspunten, opvallende details en weers- en klimaatomstandigheden in het beeld. |
![]() |
Toen Gemma 4 werd gevraagd om alle tekst uit een afbeelding van een tijdschriftpagina te halen, had het programma iets meer dan 30 seconden nodig om het resultaat te leveren. Deze tijdsduur verschilt niet significant van die van andere online zoekmachines die gebruikers kennen. |
![]() |
In de smartphone-app moeten gebruikers een functie selecteren vanuit de hoofdinterface (AI-chat, Afbeelding vragen, enz.) en vervolgens een model kiezen. Omdat de app gebruikmaakt van de GPU, kan het apparaat warm worden tijdens het AI-inferentieproces. |
![]() |
Gebruikers kunnen ook documentbestanden uploaden, in DOCX- of PDF-formaat, en vervolgens tekstanalyse of samenvatting aanvragen. Volgens vertegenwoordigers van Google stuurt de nieuwe generatie modellen de generatie van tekenreeksen effectief aan. Het model beperkt onnodige denkprocessen, waardoor de belasting van grafische kaarten en computergeheugen wordt verminderd. |
![]() |
Gemma 4 is ook programmeerbaar. In een experiment kreeg het model de opdracht om met behulp van HTML, CSS en JavaScript een besturingssysteem te bouwen dat direct in de browser draait. Gebruikers moesten de contextlengte vóór de opstart verhogen om ervoor te zorgen dat het model een volledig antwoord gaf. Zelfs dan kon de AI nog fouten maken als het HTML-bestand onvolledig was, en sommige applicatieonderdelen werkten mogelijk niet. |
![]() |
Over het algemeen kunnen commando's die meerdere stappen of complexe gegevens vereisen, een uitdaging vormen voor Gemma 4. Sommige commando's kunnen een groot aantal verwerkingstokens verbruiken. Het instellen van buitensporig hoge tokenlimieten kan veel RAM of VRAM in beslag nemen. |
Bron: https://znews.vn/ai-khong-can-internet-cua-google-lam-duoc-gi-post1652142.html


























Reactie (0)