![]() |
Gemma 4 — це мова великих моделей (LLM), розроблена Google DeepMind. Це сімейство моделей з відкритим кодом, яке підтримує локальну обробку без підключення до Інтернету. Користувачі можуть завантажувати, налаштовувати та розгортати її на своїх комп’ютерах або мобільних пристроях. |
![]() |
Серія Gemma 4 постачається у чотирьох версіях: E2B, E4B, 31B та 26B A4B. Версії E2B та E4B вимагають щонайменше 4-6 ГБ (4-розрядна) або 10-16 ГБ (16-розрядна) оперативної пам'яті, що підходить для роботи на мобільних пристроях та комп'ютерах середньої конфігурації. Тим часом версія 26B A4B вимагає щонайменше 18 ГБ оперативної пам'яті, а 31B — щонайменше 20 ГБ. |
![]() |
За даними MindStudio , однією з переваг локального запуску моделей штучного інтелекту є безпека та відсутність додаткових витрат. Однак продуктивність цих моделей залежить від апаратного забезпечення пристрою. Користувачі мобільних пристроїв можуть встановити додаток Google AI Edge Gallery (на фото), тоді як для комп’ютерів потрібні такі інструменти, як LM Studio або Ollama. Фото: Google . |
![]() |
LM Studio на ПК дозволяє вибрати та завантажити Gemma 4 під час першого запуску. Версія E4B має розмір приблизно 6,3 ГБ та підтримує виведення та аналіз зображень. Gemma 4 E4B на мобільному пристрої має розмір 3,6 ГБ після завантаження за допомогою Google AI Edge Gallery. |
![]() |
Після завершення завантаження користувача буде перенаправлено до інтерфейсу в стилі чат-бота. У розділі вибору моделі нижче натисніть на Gemma 4 E4B . У наступному вікні виберіть «Завантажити модель» та зачекайте приблизно хвилину, поки модель запуститься. |
![]() |
Подібно до інших популярних моделей, Gemma 4 E4B підтримує взаємодію в'єтнамською мовою. Під час тестування на Mac mini M4 (16 ГБ оперативної пам'яті) з командою "Hello" моделі знадобилося приблизно 8 секунд, щоб розпізнати код та відповісти. |
![]() |
Коли Джемму 4 E4B запитали «Що ти вмієш?», їй знадобилося приблизно 13 секунд, щоб зрозуміти та одразу перекласти команду англійською мовою, а потім поступово записати відповідь. |
![]() |
Оскільки він працює безпосередньо на пристрої, час відгуку моделі може відрізнятися залежно від апаратного забезпечення. На те саме запитання «Що ти можеш зробити?» моделі знадобилося приблизно 45 секунд, щоб надати повну відповідь на iPhone 15 Pro. |
![]() |
Ще одне питання для міркування, на яке було дано швидку та точну відповідь, було, наприклад, «Поїзд відправляється о 8:15 ранку та прибуває об 11:47 ранку. Скільки часу тривала подорож?». Загалом, такі прості твердження для міркування не є надто складними для нового покоління LLM. |
![]() |
Перевірено за допомогою логічного питання, такого як «Скільки літер «р» у слові «полуниця»?». Це питання поставило в глухий кут багато попередніх LLM, але Gemma 4 E4B знадобилося лише близько 3 секунд, щоб відповісти правильно. |
![]() ![]() |
На складніше запитання, після низки ретельних міркувань, Джемма 4 відповіла правильно. Загальний час обдумування склав 1 хвилину 6 секунд, що не так багато для офлайн-моделі. Для порівняння, на обдумування Gemini 3 знадобилося близько 15 секунд, а на GPT-5.5 — приблизно стільки ж часу. |
![]() |
Родзинкою Gemma 4 E4B є її мультимодальні можливості, що підтримують введення зображень. Наприклад, LLM може аналізувати зображення та відповідати на запитання про орієнтири, помітні деталі, погодні та кліматичні умови на зображенні. |
![]() |
Коли Gemma 4 попросили витягти весь текст із зображення сторінки журналу, їй знадобилося трохи більше 30 секунд, щоб повернути результат. Цей проміжок часу суттєво не відрізняється від інших пошукових систем, з якими знайомі користувачі. |
![]() |
У додатку для смартфона користувачам потрібно вибрати функцію з основного інтерфейсу (AI Chat, Ask Image тощо), а потім вибрати модель для використання. Оскільки він працює на основі графічного процесора, пристрій може нагріватися під час процесу штучного інтелекту. |
![]() |
Користувачі також можуть завантажувати файли документів у форматі DOCX або PDF, а потім запитувати аналіз тексту або його узагальнення. За словами представників Google, нове покоління моделей ефективно контролює генерацію символьних рядків. Модель обмежує непотрібні розумові процеси, зменшуючи обчислювальне навантаження на відеокарти та пам'ять комп'ютера. |
![]() |
Gemma 4 також програмована. В одному експерименті моделі було доручено використовувати HTML, CSS та JavaScript для створення операційної системи, яка працює безпосередньо в браузері. Користувачам потрібно було збільшити довжину контексту (Context Length) перед запуском, щоб гарантувати, що модель видасть повну відповідь. Навіть за таких умов штучний інтелект все ще міг помилятися, якщо HTML-файл був неповним, і деякі компоненти програми могли не працювати. |
![]() |
Загалом, команди, що потребують кількох кроків або складних даних, можуть бути складними для Gemma 4. Деякі команди можуть споживати велику кількість токенів обробки. Встановлення надмірно великих лімітів токенів може споживати багато оперативної або відеопам'яті. |
Джерело: https://znews.vn/ai-khong-can-internet-cua-google-lam-duoc-gi-post1652142.html


























Коментар (0)