![]() |
Gemma 4は、Google DeepMindが開発した大規模モデル言語(LLM)です。インターネット接続なしでオンプレミス処理をサポートするオープンソースのモデルファミリーです。ユーザーは、コンピュータやモバイルデバイスにダウンロード、カスタマイズ、デプロイできます。 |
![]() |
Gemma 4シリーズは、E2B、E4B、31B、26B A4Bの4つのバージョンで展開されています。E2BとE4Bバージョンは、モバイルデバイスや中程度のスペックのコンピュータでの動作に適した、最低4~6GB(4ビット)または10~16GB(16ビット)のRAMを必要とします。一方、26B A4Bバージョンは最低18GB、31Bバージョンは最低20GBのRAMを必要とします。 |
![]() |
MindStudioによると、AIモデルをローカルで実行する利点の1つは、セキュリティと追加コストがかからないことです。ただし、これらのモデルのパフォーマンスはデバイスのハードウェアに依存します。モバイルユーザーはGoogle AI Edge Galleryアプリ(写真)をインストールできますが、コンピューターではLM StudioやOllamaなどのツールが必要です。写真: Google 。 |
![]() |
PC版LM Studioでは、初回起動時にGemma 4を選択して読み込むことができます。E4B版のサイズは約6.3GBで、画像推論と解析をサポートしています。モバイル版Gemma 4 E4Bは、Google AI Edge Galleryを使用してダウンロードした場合、サイズが3.6GBです。 |
![]() |
ダウンロードが完了すると、チャットボット形式のインターフェースにリダイレクトされます。下のモデル選択セクションで、 「Gemma 4 E4B」をクリックしてください。次のウィンドウで「モデルの読み込み」を選択し、モデルが起動するまで約1分お待ちください。 |
![]() |
他の人気モデルと同様に、Gemma 4 E4Bはベトナム語での対話に対応しています。Mac mini M4(16GB RAM)で「Hello」というコマンドを使ってテストしたところ、モデルが認識して応答するまでに約8秒かかりました。 |
![]() |
「何ができるの?」と尋ねられたとき、ジェマ4 E4Bは、約13秒で指示を理解し、すぐに英語に翻訳し、その後徐々に答えを書き出した。 |
![]() |
このモデルはデバイス上で直接動作するため、ハードウェアによって応答時間が異なる場合があります。「何ができますか?」という同じ質問に対して、iPhone 15 Proでは、モデルが完全な応答を返すまでに約45秒かかりました。 |
![]() |
例えば、「列車が午前8時15分に出発し、午前11時47分に到着しました。所要時間はどれくらいですか?」といった、迅速かつ正確に解答できた推論問題が他にもありました。一般的に、このような単純な推論問題は、新世代の法学修士課程の学生にとってそれほど複雑ではありません。 |
![]() |
「『strawberry』という単語には『r』がいくつありますか?」といった論理的な質問でテストしました。この問題はこれまで多くのLLM受験者を悩ませてきましたが、ジェマ4 E4Bはわずか3秒ほどで正解しました。 |
![]() ![]() |
より複雑な質問に対し、Gemma 4は綿密な推論を経て正解を導き出した。思考時間は合計1分6秒で、オフラインモデルとしてはそれほど長くはない。比較のために挙げると、Gemini 3 Thinkingは約15秒、GPT-5.5もほぼ同程度の時間を要した。 |
![]() |
Gemma 4 E4Bの最大の特長は、画像入力に対応したマルチモーダル機能です。例えば、LLMは画像を分析し、画像内のランドマーク、目立つディテール、天候や気候条件に関する質問に答えることができます。 |
![]() |
雑誌のページ画像からすべてのテキストを抽出するよう依頼したところ、Gemma 4は30秒強で結果を返しました。この所要時間は、ユーザーがよく知っている他のオンライン検索エンジンと比べて、特に大きな違いはありません。 |
![]() |
スマートフォンアプリでは、ユーザーはメインインターフェースから機能(AIチャット、画像検索など)を選択し、使用するモデルを選択する必要があります。GPUに基づいて動作するため、AI推論処理中にデバイスが発熱する場合があります。 |
![]() |
ユーザーは、DOCXまたはPDF形式のドキュメントファイルをアップロードし、テキスト分析や要約をリクエストすることもできます。Googleの担当者によると、新世代のモデルは文字列生成を効果的に制御します。このモデルは不要な処理を制限し、グラフィックカードやコンピュータのメモリへの計算負荷を軽減します。 |
![]() |
Gemma 4はプログラミングも可能です。ある実験では、HTML、CSS、JavaScriptを使用してブラウザ上で直接動作するオペレーティングシステムを構築するというタスクがモデルに課されました。モデルが完全な回答を生成するようにするには、起動前にコンテキスト長を増やす必要がありました。それでも、HTMLファイルが不完全な場合、AIは間違いを犯す可能性があり、一部のアプリケーションコンポーネントが動作しない場合があります。 |
![]() |
一般的に、複数のステップや複雑なデータを必要とするコマンドは、Gemma 4にとって処理が難しい場合があります。一部のコマンドは、大量の処理トークンを消費する可能性があります。トークン制限を過度に大きく設定すると、大量のRAMまたはVRAMを消費する可能性があります。 |
出典:https://znews.vn/ai-khong-can-internet-cua-google-lam-duoc-gi-post1652142.html


























コメント (0)