![]() |
Gemma 4 to język dużego modelu (LLM) opracowany przez Google DeepMind. To rodzina modeli open-source, która obsługuje przetwarzanie lokalne bez połączenia z internetem. Użytkownicy mogą pobrać, dostosować i wdrożyć ją na swoich komputerach lub urządzeniach mobilnych. |
![]() |
Seria Gemma 4 jest dostępna w czterech wersjach: E2B, E4B, 31B i 26B A4B. Wersje E2B i E4B wymagają minimum 4-6 GB (wersja 4-bitowa) lub 10-16 GB (wersja 16-bitowa) pamięci RAM, co pozwala na uruchomienie ich na urządzeniach mobilnych i komputerach o umiarkowanej konfiguracji. Wersja 26B A4B wymaga minimum 18 GB pamięci RAM, a wersja 31B – co najmniej 20 GB. |
![]() |
Według MindStudio , jedną z zalet lokalnego uruchamiania modeli AI jest bezpieczeństwo i brak dodatkowych kosztów. Wydajność tych modeli zależy jednak od sprzętu urządzenia. Użytkownicy urządzeń mobilnych mogą zainstalować aplikację Google AI Edge Gallery (na zdjęciu), natomiast komputery wymagają narzędzi takich jak LM Studio lub Ollama. Zdjęcie: Google . |
![]() |
LM Studio na komputerze PC umożliwia wybranie i załadowanie Gemma 4 już przy pierwszym uruchomieniu. Wersja E4B ma rozmiar około 6,3 GB i obsługuje wnioskowanie i analizę obrazu. Gemma 4 E4B na urządzeniach mobilnych ma rozmiar 3,6 GB po pobraniu za pomocą Google AI Edge Gallery. |
![]() |
Po zakończeniu pobierania użytkownik zostanie przekierowany do interfejsu w stylu chatbota. W sekcji wyboru modelu poniżej kliknij Gemma 4 E4B . W następnym oknie wybierz opcję „Załaduj model” i odczekaj około minuty, aż model się uruchomi. |
![]() |
Podobnie jak inne popularne modele, Gemma 4 E4B obsługuje interakcję w języku wietnamskim. Testy na komputerze Mac mini M4 (16 GB RAM) z poleceniem „Hello” wykazały, że model potrzebował około 8 sekund, aby wywnioskować i odpowiedzieć. |
![]() |
Na pytanie „Co potrafisz?” Gemma 4 E4B potrzebowała około 13 sekund, aby zrozumieć polecenie i natychmiast przetłumaczyć je na angielski, a następnie stopniowo zapisać odpowiedź. |
![]() |
Ponieważ działa bezpośrednio na urządzeniu, czas reakcji modelu może się różnić w zależności od wersji sprzętowej. Na to samo pytanie: „Co potrafisz?”, model potrzebował około 45 sekund, aby udzielić pełnej odpowiedzi na iPhonie 15 Pro. |
![]() |
Inne pytanie wymagające szybkiego i trafnego uzasadnienia brzmiało na przykład: „Pociąg odjeżdża o 8:15 i przyjeżdża o 11:47. Jak długo trwała podróż?”. Ogólnie rzecz biorąc, takie proste stwierdzenia nie są zbyt skomplikowane dla nowego pokolenia absolwentów studiów magisterskich (LLM). |
![]() |
Test przeprowadzono za pomocą pytania logicznego, takiego jak „Ile liter „r” jest w słowie „truskawka”?”. To pytanie zaskoczyło wielu poprzednich egzaminów LLM, ale na Gemma 4 E4B poprawna odpowiedź zajęła tylko około 3 sekund. |
![]() ![]() |
W przypadku bardziej złożonego pytania, po serii skrupulatnych analiz, Gemma 4 odpowiedziała poprawnie. Całkowity czas myślenia wyniósł 1 minutę i 6 sekund, co nie jest zbyt długim czasem jak na model offline. Dla porównania, myślenie Gemini 3 zajęło około 15 sekund, a GPT-5.5 zajęło podobny czas. |
![]() |
Największą zaletą Gemma 4 E4B są jej możliwości multimodalne, które wspierają wprowadzanie obrazu. Na przykład LLM może analizować obrazy i odpowiadać na pytania dotyczące punktów orientacyjnych, charakterystycznych detali oraz warunków pogodowych i klimatycznych na obrazie. |
![]() |
Poproszona o wyodrębnienie całego tekstu z obrazu strony magazynu, Gemma 4 potrzebowała nieco ponad 30 sekund na znalezienie odpowiedzi. Ten czas nie różni się znacząco od czasu uzyskiwanego przez inne wyszukiwarki internetowe, z którymi użytkownicy mają styczność. |
![]() |
W aplikacji na smartfony użytkownicy muszą wybrać funkcję z głównego interfejsu (czat AI, Ask Image itp.), a następnie wybrać model, którego będą używać. Ponieważ urządzenie działa w oparciu o GPU, może się nagrzewać podczas procesu wnioskowania AI. |
![]() |
Użytkownicy mogą również przesyłać pliki dokumentów w formacie DOCX lub PDF, a następnie zlecać analizę tekstu lub podsumowanie. Według przedstawicieli Google, nowa generacja modeli skutecznie kontroluje generowanie ciągów znaków. Model ten ogranicza zbędne procesy myślowe, zmniejszając obciążenie obliczeniowe kart graficznych i pamięci komputera. |
![]() |
Gemma 4 jest również programowalna. W jednym z eksperymentów model miał za zadanie wykorzystać HTML, CSS i JavaScript do zbudowania systemu operacyjnego działającego bezpośrednio w przeglądarce. Użytkownicy musieli zwiększyć długość kontekstu przed uruchomieniem, aby upewnić się, że model wygeneruje pełną odpowiedź. Mimo to, sztuczna inteligencja nadal mogła popełniać błędy, jeśli plik HTML był niekompletny, a niektóre komponenty aplikacji mogły nie działać. |
![]() |
Ogólnie rzecz biorąc, polecenia wymagające wielu kroków lub złożonych danych mogą stanowić wyzwanie dla Gemma 4. Niektóre polecenia mogą zużywać dużą liczbę tokenów przetwarzania. Ustawienie zbyt dużych limitów tokenów może powodować duże zużycie pamięci RAM lub VRAM. |
Źródło: https://znews.vn/ai-khong-can-internet-cua-google-lam-duoc-gi-post1652142.html


























Komentarz (0)