![]() |
Gemma 4 ist eine große Modellsprache (LLM), die von Google DeepMind entwickelt wurde. Es handelt sich um eine Open-Source-Modellfamilie, die die lokale Verarbeitung ohne Internetverbindung unterstützt. Benutzer können sie herunterladen, anpassen und auf ihren Computern oder Mobilgeräten einsetzen. |
![]() |
Die Gemma 4-Serie ist in vier Versionen erhältlich: E2B, E4B, 31B und 26B A4B. Die Versionen E2B und E4B benötigen mindestens 4–6 GB (4-Bit) bzw. 10–16 GB (16-Bit) Arbeitsspeicher und eignen sich für den Einsatz auf Mobilgeräten und Computern mit mittlerer Leistung. Die Version 26B A4B benötigt mindestens 18 GB Arbeitsspeicher, und die Version 31B benötigt mindestens 20 GB. |
![]() |
Laut MindStudio liegt einer der Vorteile der lokalen Ausführung von KI-Modellen in der Sicherheit und den fehlenden Zusatzkosten. Die Leistung dieser Modelle hängt jedoch von der Gerätehardware ab. Mobilnutzer können die Google AI Edge Gallery App (siehe Abbildung) installieren, während Computer Tools wie LM Studio oder Ollama benötigen. Foto: Google . |
![]() |
LM Studio auf dem PC ermöglicht es Ihnen, Gemma 4 beim ersten Start auszuwählen und zu laden. Die E4B-Version ist ca. 6,3 GB groß und unterstützt Bildinferenz und -analyse. Gemma 4 E4B hat auf Mobilgeräten eine Größe von 3,6 GB, wenn es über die Google AI Edge Gallery heruntergeladen wird. |
![]() |
Nach Abschluss des Downloads wird der Benutzer zu einer Chatbot-ähnlichen Oberfläche weitergeleitet. Klicken Sie im unten stehenden Bereich zur Modellauswahl auf Gemma 4 E4B . Wählen Sie im nächsten Fenster „Modell laden“ und warten Sie etwa eine Minute, bis das Modell startet. |
![]() |
Wie andere gängige Modelle unterstützt auch die Gemma 4 E4B die Interaktion in vietnamesischer Sprache. Im Test auf einem Mac mini M4 (16 GB RAM) mit dem Befehl „Hallo“ benötigte das Modell etwa 8 Sekunden, um die Bedeutung zu erfassen und zu antworten. |
![]() |
Auf die Frage „Was kannst du tun?“ benötigte Gemma 4 E4B ungefähr 13 Sekunden, um den Befehl zu verstehen und sofort ins Englische zu übersetzen, und schrieb dann nach und nach die Antwort auf. |
![]() |
Da das Modell direkt auf dem Gerät ausgeführt wird, kann die Reaktionszeit je nach Hardware variieren. Bei der gleichen Frage „Was können Sie tun?“ benötigte das Modell auf einem iPhone 15 Pro etwa 45 Sekunden für eine vollständige Antwort. |
![]() |
Eine weitere Logikfrage, die schnell und korrekt beantwortet wurde, lautete beispielsweise: „Ein Zug fährt um 8:15 Uhr ab und kommt um 11:47 Uhr an. Wie lange hat die Fahrt gedauert?“ Im Allgemeinen stellen solche einfachen Logikaufgaben für die neue Generation von LLM-Absolventen keine allzu große Herausforderung dar. |
![]() |
Geprüft wurde mit einer Logikfrage wie „Wie viele ‚r‘s enthält das Wort ‚Erdbeere‘?“. Diese Frage hatte schon viele LLM-Teilnehmer vor große Schwierigkeiten gestellt, aber Gemma 4 E4B brauchte nur etwa 3 Sekunden, um sie richtig zu beantworten. |
![]() ![]() |
Bei einer komplexeren Frage beantwortete Gemma 4 diese nach sorgfältiger Überlegung korrekt. Die gesamte Denkzeit betrug 1 Minute und 6 Sekunden, was für ein Offline-Modell nicht zu lang ist. Zum Vergleich: Gemini 3 benötigte etwa 15 Sekunden, und GPT-5.5 brauchte eine ähnliche Zeit. |
![]() |
Das Highlight von Gemma 4 E4B sind seine multimodalen Fähigkeiten, insbesondere die Unterstützung von Bildeingaben. So kann LLM beispielsweise Bilder analysieren und Fragen zu Sehenswürdigkeiten, markanten Details sowie Wetter- und Klimabedingungen im Bild beantworten. |
![]() |
Gemma 4 benötigte für die Extraktion des gesamten Textes aus einem Magazinseitenbild etwas mehr als 30 Sekunden. Diese Zeitspanne unterscheidet sich nicht wesentlich von der anderer, Nutzern bekannter Online-Suchmaschinen. |
![]() |
In der Smartphone-App müssen Nutzer eine Funktion auf der Hauptoberfläche auswählen (z. B. KI-Chat, Bildanfrage) und anschließend ein Modell auswählen. Da die App auf der GPU basiert, kann sich das Gerät während der KI-Berechnung erwärmen. |
![]() |
Nutzer können außerdem Dokumentdateien im DOCX- oder PDF-Format hochladen und anschließend eine Textanalyse oder -zusammenfassung anfordern. Laut Google-Vertretern steuert die neue Modellgeneration die Generierung von Zeichenketten effektiv. Das Modell beschränkt unnötige Denkprozesse und reduziert so die Rechenlast von Grafikkarte und Arbeitsspeicher. |
![]() |
Gemma 4 ist auch programmierbar. In einem Experiment wurde das Modell beauftragt, mithilfe von HTML, CSS und JavaScript ein Betriebssystem zu entwickeln, das direkt im Browser läuft. Die Nutzer mussten vor dem Start die Kontextlänge erhöhen, um sicherzustellen, dass das Modell eine vollständige Antwort lieferte. Trotzdem konnte die KI Fehler machen, wenn die HTML-Datei unvollständig war, und einige Anwendungskomponenten funktionierten möglicherweise nicht. |
![]() |
Im Allgemeinen können Befehle, die mehrere Schritte oder komplexe Daten erfordern, für Gemma 4 eine Herausforderung darstellen. Einige Befehle können eine große Anzahl von Verarbeitungstoken beanspruchen. Zu hohe Token-Limits können viel RAM oder VRAM verbrauchen. |
Quelle: https://znews.vn/ai-khong-can-internet-cua-google-lam-duoc-gi-post1652142.html


























Kommentar (0)