![]() |
Gemma 4 è un linguaggio di modellazione di grandi dimensioni (LLM) sviluppato da Google DeepMind. Si tratta di una famiglia di modelli open source che supporta l'elaborazione in locale senza connessione a Internet. Gli utenti possono scaricarlo, personalizzarlo e distribuirlo sui propri computer o dispositivi mobili. |
![]() |
La serie Gemma 4 è disponibile in quattro versioni: E2B, E4B, 31B e 26B A4B. Le versioni E2B ed E4B richiedono un minimo di 4-6 GB (4 bit) o 10-16 GB (16 bit) di RAM, adatte per l'utilizzo su dispositivi mobili e computer con configurazione di fascia media. La versione 26B A4B richiede invece un minimo di 18 GB di RAM, mentre la 31B ne richiede almeno 20 GB. |
![]() |
Secondo MindStudio , uno dei vantaggi dell'esecuzione di modelli di intelligenza artificiale in locale è la sicurezza e l'assenza di costi aggiuntivi. Tuttavia, le prestazioni di questi modelli dipendono dall'hardware del dispositivo. Gli utenti di dispositivi mobili possono installare l'app Google AI Edge Gallery (nell'immagine), mentre i computer richiedono strumenti come LM Studio o Olama. Foto: Google . |
![]() |
LM Studio su PC consente di selezionare e caricare Gemma 4 al primo avvio. La versione E4B ha una dimensione di circa 6,3 GB e supporta l'inferenza e l'analisi delle immagini. Gemma 4 E4B su dispositivi mobili ha una dimensione di 3,6 GB se scaricato tramite Google AI Edge Gallery. |
![]() |
Una volta completato il download, l'utente viene reindirizzato a un'interfaccia in stile chatbot. Nella sezione di selezione del modello sottostante, fare clic su Gemma 4 E4B . Nella finestra successiva, selezionare Carica modello e attendere circa un minuto affinché il modello si avvii. |
![]() |
Analogamente ad altri modelli popolari, Gemma 4 E4B supporta l'interazione in lingua vietnamita. Testato su un Mac mini M4 (16 GB di RAM) con il comando "Ciao", il modello ha impiegato circa 8 secondi per dedurre e rispondere. |
![]() |
Quando le è stato chiesto "Cosa sai fare?", Gemma 4 E4B ha impiegato circa 13 secondi per capire e tradurre immediatamente il comando in inglese, per poi scrivere gradualmente la risposta. |
![]() |
Poiché viene eseguito direttamente sul dispositivo, il tempo di risposta del modello può variare a seconda dell'hardware. Con la stessa domanda, "Cosa sai fare?", il modello ha impiegato circa 45 secondi per fornire una risposta completa su un iPhone 15 Pro. |
![]() |
Un altro quesito di ragionamento a cui si è risposto in modo rapido e preciso è stato, ad esempio: "Un treno parte alle 8:15 e arriva alle 11:47. Quanto è durato il viaggio?". In generale, affermazioni di ragionamento semplici come queste non sono troppo complicate per la nuova generazione di studenti di LLM. |
![]() |
È stata messa alla prova con una domanda di logica del tipo "Quante 'r' ci sono nella parola 'strawberry'?". Questa domanda aveva messo in difficoltà molti partecipanti al corso LLM, ma Gemma 4 E4B ha impiegato solo circa 3 secondi per rispondere correttamente. |
![]() ![]() |
Con una domanda più complessa, dopo una serie di ragionamenti meticolosi, Gemma 4 ha risposto correttamente. Il tempo totale di elaborazione è stato di 1 minuto e 6 secondi, non eccessivo per un modello offline. Per confronto, Gemini 3 Thinking ha impiegato circa 15 secondi e GPT-5.5 ha impiegato un tempo simile. |
![]() |
Il punto di forza di Gemma 4 E4B risiede nelle sue capacità multimodali, che supportano l'acquisizione di immagini. Ad esempio, LLM è in grado di analizzare le immagini e rispondere a domande su punti di riferimento, dettagli rilevanti e condizioni meteorologiche e climatiche presenti nell'immagine. |
![]() |
Quando gli è stato chiesto di estrarre tutto il testo dall'immagine di una pagina di una rivista, Gemma 4 ha impiegato poco più di 30 secondi per restituire il risultato. Questo lasso di tempo non è significativamente diverso da quello di altri motori di ricerca online che gli utenti conoscono. |
![]() |
Nell'app per smartphone, gli utenti devono selezionare una funzione dall'interfaccia principale (Chat AI, Richiesta immagine, ecc.), quindi scegliere un modello da utilizzare. Poiché il funzionamento si basa sulla GPU, il dispositivo potrebbe surriscaldarsi durante il processo di inferenza AI. |
![]() |
Gli utenti possono anche caricare file di documenti, in formato DOCX o PDF, e quindi richiedere l'analisi o la sintesi del testo. Secondo i rappresentanti di Google, la nuova generazione di modelli controlla efficacemente la generazione di stringhe di caratteri. Il modello limita i processi di pensiero non necessari, riducendo il carico computazionale sulle schede grafiche e sulla memoria del computer. |
![]() |
Gemma 4 è anche programmabile. In un esperimento, al modello è stato chiesto di utilizzare HTML, CSS e JavaScript per costruire un sistema operativo eseguibile direttamente nel browser. Gli utenti dovevano aumentare la lunghezza del contesto prima dell'avvio per garantire che il modello producesse una risposta completa. Ciononostante, l'IA poteva comunque commettere errori se il file HTML era incompleto e alcuni componenti dell'applicazione potevano non funzionare. |
![]() |
In generale, i comandi che richiedono più passaggi o dati complessi possono rappresentare una sfida per Gemma 4. Alcuni comandi possono consumare un numero elevato di token di elaborazione. Impostare limiti di token eccessivamente elevati può comportare un consumo eccessivo di RAM o VRAM. |
Fonte: https://znews.vn/ai-khong-can-internet-cua-google-lam-duoc-gi-post1652142.html


























Commento (0)