![]() |
Gemma 4는 Google DeepMind에서 개발한 대규모 모델 언어(LLM)입니다. 인터넷 연결 없이 온프레미스에서 처리를 지원하는 오픈 소스 모델 제품군입니다. 사용자는 Gemma 4를 다운로드, 맞춤 설정 및 컴퓨터나 모바일 장치에 배포할 수 있습니다. |
![]() |
Gemma 4 시리즈는 E2B, E4B, 31B, 26B A4B의 네 가지 버전으로 출시됩니다. E2B와 E4B 버전은 최소 4~6GB(4비트) 또는 10~16GB(16비트)의 RAM을 필요로 하며, 모바일 기기 및 중간 사양의 컴퓨터에서 실행하기에 적합합니다. 한편, 26B A4B 버전은 최소 18GB의 RAM을, 31B 버전은 최소 20GB의 RAM을 필요로 합니다. |
![]() |
MindStudio 에 따르면, AI 모델을 로컬에서 실행하는 장점 중 하나는 보안이 강화되고 추가 비용이 발생하지 않는다는 점입니다. 하지만 이러한 모델의 성능은 기기 하드웨어에 따라 달라집니다. 모바일 사용자는 Google AI Edge Gallery 앱(사진 참조)을 설치할 수 있으며, 컴퓨터 사용자는 LM Studio 또는 Ollama와 같은 도구가 필요합니다. 사진: Google |
![]() |
PC용 LM Studio에서는 처음 실행 시 Gemma 4를 선택하여 로드할 수 있습니다. E4B 버전은 약 6.3GB 크기이며 이미지 추론 및 분석을 지원합니다. 모바일용 Gemma 4 E4B는 Google AI Edge Gallery를 사용하여 다운로드할 경우 3.6GB 크기입니다. |
![]() |
다운로드가 완료되면 사용자는 챗봇 스타일의 인터페이스로 이동합니다. 아래 모델 선택 섹션에서 Gemma 4 E4B 를 클릭하십시오. 다음 창에서 모델 로드를 선택하고 모델이 시작될 때까지 약 1분 정도 기다리십시오. |
![]() |
다른 인기 모델들과 마찬가지로 Gemma 4 E4B는 베트남어 상호 작용을 지원합니다. Mac mini M4(16GB RAM)에서 "안녕하세요"라는 명령어로 테스트한 결과, 모델이 의미를 파악하고 응답하는 데 약 8초가 걸렸습니다. |
![]() |
"무엇을 할 수 있나요?"라는 질문을 받았을 때, Gemma 4 E4B는 약 13초 만에 명령어를 이해하고 즉시 영어로 번역한 다음, 천천히 답을 적었습니다. |
![]() |
기기에서 직접 실행되기 때문에 모델의 응답 시간은 하드웨어에 따라 달라질 수 있습니다. "무엇을 할 수 있나요?"라는 동일한 질문에 대해, 해당 모델은 iPhone 15 Pro에서 완전한 응답을 제공하는 데 약 45초가 걸렸습니다. |
![]() |
예를 들어, "기차가 오전 8시 15분에 출발하여 오전 11시 47분에 도착합니다. 소요 시간은 얼마입니까?"와 같은 추론 문제도 신세대 법학 석사(LLM)들에게는 그다지 어렵지 않은 문제들입니다. |
![]() |
"strawberry라는 단어에 'r'이 몇 개 있나요?"와 같은 논리 기반 문제로 테스트를 진행했습니다. 이 문제는 이전의 많은 LLM 수강생들을 애먹였지만, Gemma 4 E4B는 단 3초 만에 정답을 맞혔습니다. |
![]() ![]() |
좀 더 복잡한 질문에 대해, 젬마 4는 일련의 면밀한 추론 끝에 정답을 맞혔습니다. 총 사고 시간은 1분 6초로, 오프라인 모델로서는 그리 길지 않았습니다. 비교하자면, 제미니 3 사고 과정은 약 15초, GPT-5.5는 비슷한 시간이 걸렸습니다. |
![]() |
Gemma 4 E4B의 가장 큰 특징은 이미지 입력을 지원하는 멀티모달 기능입니다. 예를 들어, LLM은 이미지를 분석하여 이미지 속 랜드마크, 주요 세부 사항, 날씨 및 기후 조건에 대한 정보를 얻을 수 있습니다. |
![]() |
잡지 페이지 이미지에서 모든 텍스트를 추출하라는 요청을 받았을 때, Gemma 4는 결과를 반환하는 데 30초 남짓 걸렸습니다. 이 시간은 사용자들이 익숙한 다른 온라인 검색 엔진과 크게 다르지 않습니다. |
![]() |
스마트폰 앱에서 사용자는 메인 인터페이스에서 기능(AI 채팅, 이미지 요청 등)을 선택한 후 사용할 모델을 선택해야 합니다. GPU 기반으로 작동하기 때문에 AI 추론 과정 중에 기기가 발열될 수 있습니다. |
![]() |
사용자는 DOCX 또는 PDF 형식의 문서 파일을 업로드한 후 텍스트 분석 또는 요약을 요청할 수 있습니다. 구글 관계자에 따르면, 차세대 모델은 문자열 생성 과정을 효과적으로 제어합니다. 이 모델은 불필요한 사고 과정을 최소화하여 그래픽 카드와 컴퓨터 메모리에 가해지는 연산 부담을 줄입니다. |
![]() |
Gemma 4는 프로그래밍도 가능합니다. 한 실험에서, 이 모델은 HTML, CSS, JavaScript를 사용하여 브라우저에서 직접 실행되는 운영 체제를 구축하는 임무를 맡았습니다. 사용자는 모델이 완전한 답변을 생성하도록 시작하기 전에 컨텍스트 길이를 늘려야 했습니다. 그럼에도 불구하고, HTML 파일이 불완전한 경우 AI는 여전히 오류를 범할 수 있으며, 일부 애플리케이션 구성 요소가 제대로 작동하지 않을 수 있습니다. |
![]() |
일반적으로 여러 단계를 거치거나 복잡한 데이터를 입력해야 하는 명령은 Gemma 4에서 처리하기 어려울 수 있습니다. 일부 명령은 많은 처리 토큰을 소모할 수 있으며, 토큰 제한을 지나치게 크게 설정하면 RAM 또는 VRAM 사용량이 크게 증가할 수 있습니다. |
출처: https://znews.vn/ai-khong-can-internet-cua-google-lam-duoc-gi-post1652142.html


























댓글 (0)