![]() |
Gemma 4 este un limbaj de programare pentru modele mari (LLM) dezvoltat de Google DeepMind. Este o familie de modele open-source care acceptă procesarea locală fără o conexiune la internet. Utilizatorii îl pot descărca, personaliza și implementa pe computerele sau dispozitivele lor mobile. |
![]() |
Seria Gemma 4 este distribuită în patru versiuni: E2B, E4B, 31B și 26B A4B. Versiunile E2B și E4B necesită minimum 4-6 GB (4 biți) sau 10-16 GB (16 biți) de RAM, potrivite pentru rularea pe dispozitive mobile și computere cu configurație moderată. Între timp, versiunea 26B A4B necesită minimum 18 GB de RAM, iar cea 31B necesită cel puțin 20 GB. |
![]() |
Conform MindStudio , unul dintre avantajele rulării locale a modelelor de inteligență artificială este securitatea și lipsa costurilor suplimentare. Cu toate acestea, performanța acestor modele depinde de hardware-ul dispozitivului. Utilizatorii de dispozitive mobile pot instala aplicația Google AI Edge Gallery (în imagine), în timp ce computerele necesită instrumente precum LM Studio sau Ollama. Fotografie: Google . |
![]() |
LM Studio pe PC vă permite să selectați și să încărcați Gemma 4 la prima rulare. Versiunea E4B are o dimensiune de aproximativ 6,3 GB și acceptă inferența și analiza imaginilor. Gemma 4 E4B pe mobil are o dimensiune de 3,6 GB atunci când este descărcată folosind Google AI Edge Gallery. |
![]() |
După finalizarea descărcării, utilizatorul este redirecționat către o interfață de tip chatbot. În secțiunea de selectare a modelului de mai jos, faceți clic pe Gemma 4 E4B . În fereastra următoare, selectați Încărcare model și așteptați aproximativ un minut pentru ca modelul să pornească. |
![]() |
Similar altor modele populare, Gemma 4 E4B acceptă interacțiunea în limba vietnameză. Testând pe un Mac mini M4 (16 GB RAM) cu comanda „Hello”, modelul a avut nevoie de aproximativ 8 secunde pentru a deduce și a răspunde. |
![]() |
Când a fost întrebată „Ce poți face?”, Gemma 4 E4B a înțeles și a tradus imediat comanda în engleză în aproximativ 13 secunde, apoi a notat treptat răspunsul. |
![]() |
Deoarece rulează direct pe dispozitiv, timpul de răspuns al modelului poate varia în funcție de hardware. La aceeași întrebare „Ce poți face?”, modelul a avut nevoie de aproximativ 45 de secunde pentru a oferi un răspuns complet pe un iPhone 15 Pro. |
![]() |
O altă întrebare de raționament la care s-a răspuns rapid și precis a fost, de exemplu, „Un tren pleacă la 8:15 și sosește la 11:47. Cât a durat călătoria?”. În general, enunțurile simple de raționament, cum ar fi acestea, nu sunt prea complicate pentru noua generație de LLM-uri. |
![]() |
Testat cu o întrebare bazată pe logică, cum ar fi „Câte litere „r” sunt în cuvântul «căpșună»?”. Această întrebare a pus în dificultate multe examene de masterat în drept anterioare, dar Gemma 4 E4B a avut nevoie de doar aproximativ 3 secunde pentru a răspunde corect. |
![]() ![]() |
Cu o întrebare mai complexă, după o serie de raționamente meticuloase, Gemma 4 a răspuns corect. Timpul total de gândire a fost de 1 minut și 6 secunde, nu prea mult pentru un model offline. Pentru comparație, Gemini 3 Thinking a durat aproximativ 15 secunde, iar GPT-5.5 a necesitat un timp similar. |
![]() |
Punctul culminant al Gemma 4 E4B constă în capacitățile sale multimodale, care permit introducerea de imagini. De exemplu, LLM poate analiza imagini și răspunde la întrebări despre repere, detalii importante și condiții meteorologice și climatice din imagine. |
![]() |
Când i s-a cerut să extragă tot textul dintr-o imagine dintr-o pagină de revistă, Gemma 4 a returnat rezultatul în puțin peste 30 de secunde. Acest interval de timp nu este semnificativ diferit de cel al altor motoare de căutare online cu care utilizatorii sunt familiarizați. |
![]() |
În aplicația pentru smartphone, utilizatorii trebuie să selecteze o funcție din interfața principală (AI Chat, Ask Image etc.), apoi să aleagă un model de utilizat. Deoarece funcționează pe baza GPU-ului, dispozitivul se poate încălzi în timpul procesului de inferență AI. |
![]() |
Utilizatorii pot, de asemenea, încărca fișiere documente, în format DOCX sau PDF, și apoi pot solicita analiza textului sau rezumatul acestuia. Potrivit reprezentanților Google, noua generație de modele controlează eficient generarea șirurilor de caractere. Modelul limitează procesele de gândire inutile, reducând efortul de calcul asupra plăcilor grafice și a memoriei computerului. |
![]() |
Gemma 4 este, de asemenea, programabilă. Într-un experiment, modelul a fost însărcinat să utilizeze HTML, CSS și JavaScript pentru a construi un sistem de operare care rulează direct în browser. Utilizatorii au trebuit să mărească Lungimea Contextului înainte de pornire pentru a se asigura că modelul produce un răspuns complet. Chiar și așa, inteligența artificială ar putea face greșeli dacă fișierul HTML era incomplet, iar unele componente ale aplicației ar putea să nu funcționeze. |
![]() |
În general, comenzile care necesită mai mulți pași sau date complexe pot fi dificile pentru Gemma 4. Unele comenzi pot consuma un număr mare de jetoane de procesare. Setarea unor limite excesiv de mari pentru jetoane poate consuma multă memorie RAM sau VRAM. |
Sursă: https://znews.vn/ai-khong-can-internet-cua-google-lam-duoc-gi-post1652142.html


























Comentariu (0)