![]() |
Gemma 4 je jazyk pro velké modelování (LLM) vyvinutý společností Google DeepMind. Jedná se o open-source rodinu modelů, která podporuje lokální zpracování bez připojení k internetu. Uživatelé si ji mohou stáhnout, přizpůsobit a nasadit na své počítače nebo mobilní zařízení. |
![]() |
Řada Gemma 4 je distribuována ve čtyřech verzích: E2B, E4B, 31B a 26B A4B. Verze E2B a E4B vyžadují minimálně 4–6 GB (4bitová) nebo 10–16 GB (16bitová) paměti RAM, což je vhodné pro provoz na mobilních zařízeních a středně konfigurovaných počítačích. Verze 26B A4B vyžaduje minimálně 18 GB RAM a verze 31B vyžaduje alespoň 20 GB. |
![]() |
Podle MindStudia je jednou z výhod lokálního spouštění modelů umělé inteligence bezpečnost a žádné dodatečné náklady. Výkon těchto modelů však závisí na hardwaru zařízení. Mobilní uživatelé si mohou nainstalovat aplikaci Google AI Edge Gallery (na obrázku), zatímco počítače vyžadují nástroje jako LM Studio nebo Ollama. Foto: Google . |
![]() |
LM Studio na PC umožňuje vybrat a načíst Gemma 4 hned při prvním spuštění. Verze E4B má velikost přibližně 6,3 GB a podporuje inferenci a analýzu obrazu. Gemma 4 E4B na mobilním zařízení má po stažení pomocí Google AI Edge Gallery velikost 3,6 GB. |
![]() |
Po dokončení stahování je uživatel přesměrován do rozhraní ve stylu chatbota. V sekci výběru modelu níže klikněte na Gemma 4 E4B . V dalším okně vyberte Načíst model a počkejte asi minutu, než se model spustí. |
![]() |
Podobně jako jiné populární modely, i Gemma 4 E4B podporuje interakci ve vietnamštině. Při testování na Macu mini M4 (16 GB RAM) s příkazem „Hello“ trvalo modelu dedukci a odpověď přibližně 8 sekund. |
![]() |
Na otázku „Co umíš?“ Gemma 4 E4B pochopila a okamžitě přeložila příkaz do angličtiny přibližně 13 sekund a poté postupně zapsala odpověď. |
![]() |
Protože běží přímo na zařízení, může se doba odezvy modelu lišit v závislosti na hardwaru. Na stejnou otázku „Co umíš?“ trvalo modelu na iPhonu 15 Pro poskytnout plnou odpověď přibližně 45 sekund. |
![]() |
Další otázka na uvažování, která byla rychle a přesně zodpovězena, byla například: „Vlak odjíždí v 8:15 a přijíždí v 11:47. Jak dlouho trvala cesta?“. Obecně platí, že jednoduchá uvažovací tvrzení, jako jsou tato, nejsou pro novou generaci LLM příliš složitá. |
![]() |
Testováno logickou otázkou typu „Kolik 'r' je ve slově 'jahoda'?“. Tato otázka zaskočila mnoho předchozích LLM, ale Gemma 4 E4B trvala správná odpověď jen asi 3 sekundy. |
![]() ![]() |
U složitější otázky Gemma 4 po sérii pečlivého uvažování odpověděla správně. Celková doba přemýšlení byla 1 minuta a 6 sekund, což na offline model není příliš dlouho. Pro srovnání, myšlení u Gemini 3 trvalo asi 15 sekund a GPT-5.5 podobně dlouho. |
![]() |
Hlavní výhodou Gemmy 4 E4B jsou její multimodální schopnosti, které podporují obrazový vstup. Například LLM dokáže analyzovat snímky a odpovídat na otázky týkající se orientačních bodů, výrazných detailů a povětrnostních a klimatických podmínek na snímku. |
![]() |
Když byla Gemma 4 požádána o extrahování veškerého textu z obrázku na stránce časopisu, trvalo jí něco málo přes 30 sekund, než vrátila výsledek. Tento časový rámec se výrazně neliší od časového rámce jiných online vyhledávačů, které uživatelé znají. |
![]() |
V aplikaci pro chytré telefony si uživatelé musí vybrat funkci z hlavního rozhraní (AI Chat, Ask Image atd.) a poté zvolit model, který chtějí použít. Protože aplikace funguje na základě GPU, může se zařízení během procesu odvozování pomocí umělé inteligence zahřívat. |
![]() |
Uživatelé mohou také nahrávat soubory dokumentů ve formátu DOCX nebo PDF a poté požádat o analýzu textu nebo jeho shrnutí. Podle zástupců společnosti Google nová generace modelů efektivně řídí generování řetězců znaků. Model omezuje zbytečné myšlenkové procesy a snižuje výpočetní zátěž grafických karet a paměti počítače. |
![]() |
Gemma 4 je také programovatelná. V jednom experimentu měl model za úkol pomocí HTML, CSS a JavaScriptu vytvořit operační systém, který běží přímo v prohlížeči. Uživatelé museli před spuštěním zvýšit délku kontextu, aby zajistili, že model vygeneruje úplnou odpověď. I přesto mohla umělá inteligence dělat chyby, pokud byl soubor HTML neúplný, a některé komponenty aplikace nemusely fungovat. |
![]() |
Obecně platí, že příkazy vyžadující více kroků nebo složitá data mohou být pro Gemma 4 náročné. Některé příkazy mohou spotřebovávat velké množství tokenů pro zpracování. Nastavení nadměrně velkých limitů tokenů může spotřebovat velké množství RAM nebo VRAM. |
Zdroj: https://znews.vn/ai-khong-can-internet-cua-google-lam-duoc-gi-post1652142.html


























Komentář (0)