![]() |
A Gemma 4 egy nagyméretű modellező nyelv (LLM), amelyet a Google DeepMind fejlesztett ki. Ez egy nyílt forráskódú modellcsalád, amely támogatja a helyszíni feldolgozást internetkapcsolat nélkül. A felhasználók letölthetik, testreszabhatják és telepíthetik számítógépükön vagy mobileszközeiken. |
![]() |
A Gemma 4 sorozat négy verzióban kapható: E2B, E4B, 31B és 26B A4B. Az E2B és E4B verziók minimum 4-6 GB (4 bites) vagy 10-16 GB (16 bites) RAM-ot igényelnek, ami alkalmas mobil eszközökön és közepesen konfigurált számítógépeken való futtatásra. Eközben a 26B A4B verzió minimum 18 GB RAM-ot, a 31B pedig legalább 20 GB-ot igényel. |
![]() |
A MindStudio szerint a mesterséges intelligencia modellek lokális futtatásának egyik előnye a biztonság és a további költségek hiánya. Ezeknek a modelleknek a teljesítménye azonban az eszköz hardverétől függ. A mobilfelhasználók telepíthetik a Google AI Edge Gallery alkalmazást (a képen), míg a számítógépekhez olyan eszközökre van szükség, mint az LM Studio vagy az Ollama. Fotó: Google . |
![]() |
Az LM Studio PC-n lehetővé teszi a Gemma 4 kiválasztását és betöltését az első futtatáskor. Az E4B verzió körülbelül 6,3 GB méretű, és támogatja a képkikövetkeztetést és -elemzést. A Gemma 4 E4B mobilon 3,6 GB méretű, ha a Google AI Edge Gallery segítségével töltjük le. |
![]() |
A letöltés befejezése után a felhasználó egy chatbot-stílusú felületre kerül átirányításra. Az alábbi modellválasztó részben kattintson a Gemma 4 E4B elemre. A következő ablakban válassza a Modell betöltése lehetőséget , és várjon körülbelül egy percet, amíg a modell elindul. |
![]() |
Más népszerű modellekhez hasonlóan a Gemma 4 E4B támogatja a vietnami nyelvi interakciót. Egy Mac mini M4-en (16 GB RAM) a „Hello” paranccsal tesztelve a modellnek körülbelül 8 másodpercre volt szüksége a kikövetkeztetéshez és a válaszadáshoz. |
![]() |
Amikor a „Mit tudsz csinálni?” kérdésre válaszoltak, Gemma 4 E4B-nek körülbelül 13 másodpercre volt szüksége, hogy megértse és azonnal lefordítsa a parancsot angolra, majd fokozatosan leírja a választ. |
![]() |
Mivel közvetlenül a készüléken fut, a modell válaszideje a hardvertől függően változhat. Ugyanarra a kérdésre, hogy „Mit tehetsz?”, a modellnek körülbelül 45 másodpercre volt szüksége a teljes válaszadáshoz egy iPhone 15 Pro készüléken. |
![]() |
Egy másik gyorsan és pontosan megválaszolt érvelési kérdés például a következő volt: „Egy vonat 8:15-kor indul és 11:47-kor érkezik meg. Mennyi ideig tartott az út?”. Általánosságban elmondható, hogy az ilyen egyszerű érvelési kijelentések nem túl bonyolultak az új generációs LLM-ek számára. |
![]() |
Logikai kérdéssel tesztelve, például: „Hány „r” betű van az „eper” szóban?”. Ez a kérdés sok korábbi LLM hallgatót megbénított, de a Gemma 4 E4B esetében mindössze 3 másodperc kellett a helyes válaszadáshoz. |
![]() ![]() |
Egy összetettebb kérdéssel, aprólékos gondolkodás után, a Gemma 4 helyesen válaszolt. A teljes gondolkodási idő 1 perc 6 másodperc volt, ami nem túl hosszú egy offline modellhez képest. Összehasonlításképpen, a Gemini 3 gondolkodási ideje körülbelül 15 másodperc volt, a GPT-5.5 pedig hasonló ideig tartott. |
![]() |
A Gemma 4 E4B legfőbb előnye a multimodális képességei, amelyek támogatják a képbevitelt. Például az LLM képes elemezni a képeket, és válaszolni a képen látható nevezetességekkel, kiemelkedő részletekkel, valamint időjárási és éghajlati viszonyokkal kapcsolatos kérdésekre. |
![]() |
Amikor a Gemma 4-nek egy magazinoldal képének teljes szövegének kinyerésére kérték, alig több mint 30 másodperc alatt adta vissza az eredményt. Ez az időkeret nem különbözik jelentősen a felhasználók által ismert más online keresőmotorokétól. |
![]() |
Az okostelefon-alkalmazásban a felhasználóknak ki kell választaniuk egy funkciót a fő felületen (AI Chat, Ask Image stb.), majd ki kell választaniuk a használni kívánt modellt. Mivel a GPU alapján működik, az eszköz felmelegedhet az AI következtetési folyamata során. |
![]() |
A felhasználók dokumentumfájlokat is feltölthetnek DOCX vagy PDF formátumban, majd szövegelemzést vagy összefoglalást kérhetnek. A Google képviselői szerint az új generációs modellek hatékonyan szabályozzák a karakterláncok generálását. A modell korlátozza a felesleges gondolkodási folyamatokat, csökkentve a grafikus kártyák és a számítógép memóriájának számítási terhelését. |
![]() |
A Gemma 4 programozható is. Az egyik kísérletben a modell feladata az volt, hogy HTML, CSS és JavaScript segítségével egy olyan operációs rendszert építsen, amely közvetlenül a böngészőben fut. A felhasználóknak növelniük kellett a kontextus hosszát az indítás előtt, hogy a modell teljes választ adjon. Ennek ellenére a mesterséges intelligencia hibákat véthetett, ha a HTML fájl hiányos volt, és egyes alkalmazáskomponensek nem működhettek. |
![]() |
Általánosságban elmondható, hogy a több lépést vagy összetett adatokat igénylő parancsok kihívást jelenthetnek a Gemma 4 számára. Egyes parancsok nagyszámú feldolgozási tokent fogyaszthatnak. A túlzottan nagy tokenkorlátok beállítása sok RAM-ot vagy VRAM-ot fogyaszthat. |
Forrás: https://znews.vn/ai-khong-can-internet-cua-google-lam-duoc-gi-post1652142.html


























Hozzászólás (0)