![]() |
Gemma 4 — это язык больших моделей (LLM), разработанный Google DeepMind. Это семейство моделей с открытым исходным кодом, поддерживающее обработку данных в локальной среде без подключения к интернету. Пользователи могут загружать, настраивать и развертывать его на своих компьютерах или мобильных устройствах. |
![]() |
Серия Gemma 4 выпускается в четырех версиях: E2B, E4B, 31B и 26B A4B. Версии E2B и E4B требуют минимум 4-6 ГБ (4-бит) или 10-16 ГБ (16-бит) оперативной памяти, что подходит для работы на мобильных устройствах и компьютерах средней конфигурации. В свою очередь, версия 26B A4B требует минимум 18 ГБ оперативной памяти, а версия 31B — не менее 20 ГБ. |
![]() |
По данным MindStudio , одним из преимуществ запуска моделей ИИ локально является безопасность и отсутствие дополнительных затрат. Однако производительность этих моделей зависит от аппаратного обеспечения устройства. Пользователи мобильных устройств могут установить приложение Google AI Edge Gallery (на фото), а для компьютеров потребуются такие инструменты, как LM Studio или Ollama. Фото: Google . |
![]() |
LM Studio на ПК позволяет выбрать и загрузить Gemma 4 при первом запуске. Версия E4B занимает примерно 6,3 ГБ и поддерживает обработку и анализ изображений. Gemma 4 E4B на мобильных устройствах занимает 3,6 ГБ при загрузке через Google AI Edge Gallery. |
![]() |
После завершения загрузки пользователь будет перенаправлен на интерфейс в стиле чат-бота. В разделе выбора модели ниже нажмите на Gemma 4 E4B . В следующем окне выберите «Загрузить модель» и подождите около минуты, пока модель запустится. |
![]() |
Как и другие популярные модели, Gemma 4 E4B поддерживает взаимодействие на вьетнамском языке. При тестировании на Mac mini M4 (16 ГБ ОЗУ) с командой «Hello» модели потребовалось приблизительно 8 секунд, чтобы определить и ответить. |
![]() |
На вопрос "Что ты умеешь делать?" Джемме 4 E4B потребовалось приблизительно 13 секунд, чтобы понять и немедленно перевести команду на английский язык, а затем постепенно записать ответ. |
![]() |
Поскольку программа работает непосредственно на устройстве, время отклика модели может варьироваться в зависимости от аппаратного обеспечения. На тот же вопрос: «Что вы можете сделать?», модели потребовалось приблизительно 45 секунд для получения полного ответа на iPhone 15 Pro. |
![]() |
Еще один вопрос на логическое мышление, на который был дан быстрый и точный ответ, звучал, например: «Поезд отправляется в 8:15 утра и прибывает в 11:47 утра. Сколько времени заняла поездка?». В целом, подобные простые логические утверждения не представляют особой сложности для нового поколения магистров права. |
![]() |
Проверяли с помощью логического вопроса, например: «Сколько букв „р“ в слове „клубника“?». Этот вопрос ставил в тупик многих предыдущих студентов магистратуры, но Джемма 4 E4B ответила на него правильно всего за 3 секунды. |
![]() ![]() |
В случае более сложного вопроса, после серии тщательных рассуждений, Gemma 4 ответила правильно. Общее время на обдумывание составило 1 минуту и 6 секунд, что не слишком долго для офлайн-модели. Для сравнения, Gemini 3 на обдумывание потребовалось около 15 секунд, а GPT-5.5 — примерно столько же времени. |
![]() |
Главная особенность Gemma 4 E4B заключается в ее многомодальных возможностях, поддерживающих ввод изображений. Например, LLM может анализировать изображения и отвечать на вопросы о достопримечательностях, важных деталях, а также погодных и климатических условиях на изображении. |
![]() |
При попытке извлечь весь текст с изображения страницы журнала, Gemma 4 потребовалось чуть более 30 секунд, чтобы получить результат. Это время не сильно отличается от времени, затрачиваемого другими поисковыми системами, с которыми знакомы пользователи. |
![]() |
В приложении для смартфона пользователям необходимо выбрать функцию в главном интерфейсе (чат с ИИ, запрос изображения и т. д.), а затем выбрать модель для использования. Поскольку приложение работает на основе графического процессора, устройство может нагреваться во время процесса выполнения ИИ-вычислений. |
![]() |
Пользователи также могут загружать файлы документов в формате DOCX или PDF, а затем запрашивать анализ текста или его суммирование. По словам представителей Google, новое поколение моделей эффективно контролирует генерацию символьных строк. Модель ограничивает ненужные мыслительные процессы, снижая вычислительную нагрузку на видеокарты и память компьютера. |
![]() |
Gemma 4 также является программируемой. В одном из экспериментов модели было поручено использовать HTML, CSS и JavaScript для создания операционной системы, работающей непосредственно в браузере. Пользователям необходимо было увеличить длину контекста перед запуском, чтобы убедиться, что модель выдает полный ответ. Даже в этом случае ИИ все еще мог допускать ошибки, если HTML-файл был неполным, и некоторые компоненты приложения могли не работать. |
![]() |
В целом, команды, требующие нескольких шагов или сложных данных, могут представлять собой сложную задачу для Gemma 4. Некоторые команды могут потреблять большое количество токенов обработки. Установка чрезмерно больших лимитов токенов может привести к значительному потреблению оперативной или видеопамяти. |
Источник: https://znews.vn/ai-khong-can-internet-cua-google-lam-duoc-gi-post1652142.html


























Комментарий (0)