![]() |
Gemma 4 adalah bahasa model besar (LLM) yang dikembangkan oleh Google DeepMind. Ini adalah keluarga model sumber terbuka yang mendukung pemrosesan di tempat tanpa koneksi internet. Pengguna dapat mengunduh, menyesuaikan, dan menerapkannya di komputer atau perangkat seluler mereka. |
![]() |
Seri Gemma 4 didistribusikan dalam empat versi: E2B, E4B, 31B, dan 26B A4B. Versi E2B dan E4B membutuhkan RAM minimal 4-6 GB (4-bit) atau 10-16 GB (16-bit), cocok untuk dijalankan pada perangkat seluler dan komputer dengan konfigurasi sedang. Sementara itu, versi 26B A4B membutuhkan RAM minimal 18 GB, dan versi 31B membutuhkan setidaknya 20 GB. |
![]() |
Menurut MindStudio , salah satu keuntungan menjalankan model AI secara lokal adalah keamanan dan tanpa biaya tambahan. Namun, kinerja model ini bergantung pada perangkat keras perangkat. Pengguna seluler dapat menginstal aplikasi Google AI Edge Gallery (seperti yang terlihat pada gambar), sementara komputer memerlukan alat seperti LM Studio atau Ollama. Foto: Google . |
![]() |
LM Studio di PC memungkinkan Anda untuk memilih dan memuat Gemma 4 pada saat pertama kali dijalankan. Versi E4B berukuran sekitar 6,3 GB dan mendukung inferensi dan analisis gambar. Gemma 4 E4B di perangkat seluler berukuran 3,6 GB saat diunduh menggunakan Google AI Edge Gallery. |
![]() |
Setelah pengunduhan selesai, pengguna akan dialihkan ke antarmuka bergaya chatbot. Di bagian pemilihan model di bawah, klik Gemma 4 E4B . Di jendela berikutnya, pilih Muat Model dan tunggu sekitar satu menit hingga model mulai berjalan. |
![]() |
Mirip dengan model populer lainnya, Gemma 4 E4B mendukung interaksi bahasa Vietnam. Pengujian pada Mac mini M4 (RAM 16 GB) dengan perintah "Hello," model tersebut membutuhkan waktu sekitar 8 detik untuk memahami dan merespons. |
![]() |
Ketika ditanya "Apa yang bisa kamu lakukan?", Gemma 4 E4B membutuhkan waktu sekitar 13 detik untuk memahami dan langsung menerjemahkan perintah tersebut ke dalam bahasa Inggris, kemudian secara bertahap menuliskan jawabannya. |
![]() |
Karena dijalankan langsung di perangkat, waktu respons model dapat bervariasi tergantung pada perangkat keras. Dengan pertanyaan yang sama, "Apa yang dapat Anda lakukan?", model membutuhkan waktu sekitar 45 detik untuk memberikan respons lengkap pada iPhone 15 Pro. |
![]() |
Contoh pertanyaan penalaran lain yang dijawab dengan cepat dan akurat adalah, misalnya, "Sebuah kereta berangkat pukul 8:15 pagi dan tiba pukul 11:47 pagi. Berapa lama perjalanan itu berlangsung?". Secara umum, pernyataan penalaran sederhana seperti ini tidak terlalu rumit bagi generasi baru LLM. |
![]() |
Diuji dengan pertanyaan berbasis logika seperti "Ada berapa huruf 'r' dalam kata 'strawberry'?". Pertanyaan ini telah membingungkan banyak LLM sebelumnya, tetapi Gemma 4 E4B hanya membutuhkan waktu sekitar 3 detik untuk menjawab dengan benar. |
![]() ![]() |
Dengan pertanyaan yang lebih kompleks, setelah serangkaian penalaran yang cermat, Gemma 4 menjawab dengan benar. Total waktu berpikir adalah 1 menit dan 6 detik, tidak terlalu lama untuk model offline. Sebagai perbandingan, Gemini 3 membutuhkan waktu sekitar 15 detik untuk berpikir, dan GPT-5.5 membutuhkan waktu yang hampir sama. |
![]() |
Keunggulan Gemma 4 E4B terletak pada kemampuan multimodalnya, yang mendukung input gambar. Misalnya, LLM dapat menganalisis gambar dan menjawab pertanyaan tentang landmark, detail penting, serta kondisi cuaca dan iklim dalam gambar tersebut. |
![]() |
Saat diminta untuk mengekstrak semua teks dari gambar halaman majalah, Gemma 4 hanya membutuhkan waktu sedikit lebih dari 30 detik untuk menampilkan hasilnya. Jangka waktu ini tidak jauh berbeda dari mesin pencari online lain yang sudah dikenal pengguna. |
![]() |
Pada aplikasi ponsel pintar, pengguna perlu memilih fitur dari antarmuka utama (AI Chat, Ask Image, dll.), lalu memilih model yang akan digunakan. Karena beroperasi berdasarkan GPU, perangkat mungkin akan menjadi panas selama proses inferensi AI. |
![]() |
Pengguna juga dapat mengunggah berkas dokumen, dalam format DOCX atau PDF, lalu meminta analisis atau ringkasan teks. Menurut perwakilan Google, model generasi baru ini secara efektif mengontrol pembuatan rangkaian karakter. Model ini membatasi proses berpikir yang tidak perlu, mengurangi beban komputasi pada kartu grafis dan memori komputer. |
![]() |
Gemma 4 juga dapat diprogram. Dalam satu percobaan, model tersebut ditugaskan untuk menggunakan HTML, CSS, dan JavaScript untuk membangun sistem operasi yang berjalan langsung di browser. Pengguna perlu meningkatkan Panjang Konteks sebelum memulai untuk memastikan model menghasilkan jawaban yang lengkap. Meskipun demikian, AI masih dapat membuat kesalahan jika file HTML tidak lengkap, dan beberapa komponen aplikasi mungkin tidak berfungsi. |
![]() |
Secara umum, perintah yang membutuhkan banyak langkah atau data kompleks dapat menjadi tantangan bagi Gemma 4. Beberapa perintah mungkin mengonsumsi sejumlah besar token pemrosesan. Menetapkan batas token yang terlalu besar dapat menghabiskan banyak RAM atau VRAM. |
Sumber: https://znews.vn/ai-khong-can-internet-cua-google-lam-duoc-gi-post1652142.html


























Komentar (0)