![]() |
Gemma 4 är ett stort modellspråk (LLM) utvecklat av Google DeepMind. Det är en modellfamilj med öppen källkod som stöder lokal bearbetning utan internetanslutning. Användare kan ladda ner, anpassa och distribuera det på sina datorer eller mobila enheter. |
![]() |
Gemma 4-serien finns i fyra versioner: E2B, E4B, 31B och 26B A4B. E2B- och E4B-versionerna kräver minst 4–6 GB (4-bitars) eller 10–16 GB (16-bitars) RAM, lämpliga för att köras på mobila enheter och måttligt konfigurerade datorer. 26B A4B-versionen kräver minst 18 GB RAM och 31B minst 20 GB. |
![]() |
Enligt MindStudio är en av fördelarna med att köra AI-modeller lokalt säkerhet och inga extra kostnader. Prestandan för dessa modeller beror dock på enhetens hårdvara. Mobilanvändare kan installera Google AI Edge Gallery-appen (på bilden), medan datorer kräver verktyg som LM Studio eller Ollama. Foto: Google . |
![]() |
Med LM Studio på PC kan du välja och ladda Gemma 4 vid första körningen. E4B-versionen är ungefär 6,3 GB stor och stöder bildinferens och analys. Gemma 4 E4B på mobilen är 3,6 GB stor när den laddas ner med Google AI Edge Gallery. |
![]() |
När nedladdningen är klar omdirigeras användaren till ett chatbot-liknande gränssnitt. I modellvalssektionen nedan klickar du på Gemma 4 E4B . I nästa fönster väljer du Ladda modell och väntar ungefär en minut tills modellen startar. |
![]() |
I likhet med andra populära modeller stöder Gemma 4 E4B interaktion på vietnamesiska. Vid testning på en Mac mini M4 (16 GB RAM) med kommandot "Hej" tog det ungefär 8 sekunder för modellen att härleda och svara. |
![]() |
När Gemma 4 E4B fick frågan "Vad kan du göra?" tog det ungefär 13 sekunder för henne att förstå och omedelbart översätta kommandot till engelska, för att sedan gradvis skriva ner svaret. |
![]() |
Eftersom den körs direkt på enheten kan modellens svarstid variera beroende på hårdvaran. Med samma fråga, "Vad kan du göra?", tog det ungefär 45 sekunder för modellen att ge ett fullständigt svar på en iPhone 15 Pro. |
![]() |
En annan resonemangsfråga som besvarades snabbt och korrekt var till exempel "Ett tåg avgår klockan 8:15 och anländer klockan 11:47. Hur lång tid tog resan?". I allmänhet är enkla resonemangspåståenden som dessa inte alltför komplicerade för den nya generationen juridikexperter. |
![]() |
Testade med en logikbaserad fråga som "Hur många 'r' finns det i ordet 'jordgubbe'?". Den här frågan hade överrumplat många tidigare juridikprov, men det tog bara cirka 3 sekunder att svara korrekt på Gemma 4 E4B. |
![]() ![]() |
Med en mer komplex fråga, efter en serie noggranna resonemang, svarade Gemma 4 korrekt. Den totala tanketiden var 1 minut och 6 sekunder, inte för lång tid för en offline-modell. Som jämförelse tog Gemini 3 Thinking cirka 15 sekunder och GPT-5.5 tog ungefär lika lång tid. |
![]() |
Höjdpunkten med Gemma 4 E4B ligger i dess multimodala funktioner, som stöder bildinmatning. Till exempel kan LLM analysera bilder och besvara frågor om landmärken, framträdande detaljer samt väder- och klimatförhållanden i bilden. |
![]() |
När Gemma 4 ombads att extrahera all text från en bild på en tidskriftssida tog det drygt 30 sekunder för dem att returnera resultatet. Denna tidsram skiljer sig inte signifikant från den för andra sökmotorer online som användarna är bekanta med. |
![]() |
I smartphone-appen måste användare välja en funktion från huvudgränssnittet (AI Chat, Ask Image, etc.) och sedan välja en modell att använda. Eftersom den fungerar baserat på GPU:n kan enheten bli varm under AI-inferensprocessen. |
![]() |
Användare kan också ladda upp dokumentfiler i DOCX- eller PDF-format och sedan begära textanalys eller sammanfattning. Enligt Googles representanter styr den nya generationen modeller effektivt generering av teckensträngar. Modellen begränsar onödiga tankeprocesser, vilket minskar beräkningsbelastningen på grafikkort och datorminne. |
![]() |
Gemma 4 är också programmerbar. I ett experiment fick modellen i uppdrag att använda HTML, CSS och JavaScript för att bygga ett operativsystem som körs direkt i webbläsaren. Användare behövde öka kontextlängden före uppstart för att säkerställa att modellen gav ett komplett svar. Trots det kunde AI:n fortfarande göra misstag om HTML-filen var ofullständig, och vissa applikationskomponenter kanske inte fungerade. |
![]() |
Generellt sett kan kommandon som kräver flera steg eller komplex data vara utmanande för Gemma 4. Vissa kommandon kan förbruka ett stort antal bearbetningstokens. Att ställa in alltför stora tokengränser kan förbruka mycket RAM eller VRAM. |
Källa: https://znews.vn/ai-khong-can-internet-cua-google-lam-duoc-gi-post1652142.html


























Kommentar (0)