![]() |
Gemma 4 ialah bahasa model besar (LLM) yang dibangunkan oleh Google DeepMind. Ia merupakan keluarga model sumber terbuka yang menyokong pemprosesan di premis tanpa sambungan internet. Pengguna boleh memuat turun, menyesuaikan dan menggunakan aplikasi tersebut pada komputer atau peranti mudah alih mereka. |
![]() |
Siri Gemma 4 diedarkan dalam empat versi: E2B, E4B, 31B, dan 26B A4B. Versi E2B dan E4B memerlukan minimum 4-6 GB (4-bit) atau 10-16 GB (16-bit) RAM, sesuai untuk dijalankan pada peranti mudah alih dan komputer berkonfigurasi sederhana. Sementara itu, versi 26B A4B memerlukan minimum 18 GB RAM, dan 31B memerlukan sekurang-kurangnya 20 GB. |
![]() |
Menurut MindStudio , salah satu kelebihan menjalankan model AI secara tempatan ialah keselamatan dan tiada kos tambahan. Walau bagaimanapun, prestasi model ini bergantung pada perkakasan peranti. Pengguna mudah alih boleh memasang aplikasi Google AI Edge Gallery (gambar), manakala komputer memerlukan alatan seperti LM Studio atau Ollama. Foto: Google . |
![]() |
LM Studio pada PC membolehkan anda memilih dan memuatkan Gemma 4 pada pelancaran pertama. Versi E4B bersaiz lebih kurang 6.3 GB dan menyokong inferens dan analisis imej. Gemma 4 E4B pada mudah alih mempunyai saiz 3.6 GB apabila dimuat turun menggunakan Google AI Edge Gallery. |
![]() |
Selepas muat turun selesai, pengguna akan dialihkan ke antara muka ala chatbot. Dalam bahagian pemilihan model di bawah, klik pada Gemma 4 E4B . Dalam tetingkap seterusnya, pilih Muat Model dan tunggu kira-kira seminit untuk model bermula. |
![]() |
Sama seperti model popular yang lain, Gemma 4 E4B menyokong interaksi bahasa Vietnam. Pengujian pada Mac mini M4 (RAM 16 GB) dengan arahan "Helo," model ini mengambil masa kira-kira 8 saat untuk membuat kesimpulan dan memberi respons. |
![]() |
Apabila ditanya "Apa yang boleh anda lakukan?", Gemma 4 E4B mengambil masa kira-kira 13 saat untuk memahami dan segera menterjemahkan arahan tersebut ke dalam bahasa Inggeris, kemudian secara beransur-ansur menulis jawapannya. |
![]() |
Oleh kerana ia berjalan terus pada peranti, masa tindak balas model mungkin berbeza-beza bergantung pada perkakasan. Dengan soalan yang sama, "Apa yang boleh anda lakukan?", model tersebut mengambil masa kira-kira 45 saat untuk memberikan tindak balas penuh pada iPhone 15 Pro. |
![]() |
Satu lagi soalan penaakulan yang dijawab dengan cepat dan tepat ialah, sebagai contoh, "Sebuah kereta api berlepas pada pukul 8:15 pagi dan tiba pada pukul 11:47 pagi. Berapa lama perjalanan itu diambil?". Secara amnya, pernyataan penaakulan mudah seperti ini tidak terlalu rumit untuk generasi baharu LLM. |
![]() |
Diuji dengan soalan berasaskan logik seperti "Berapa banyak huruf 'r' yang terdapat dalam perkataan 'strawberi'?". Soalan ini telah membingungkan banyak LLM sebelumnya, tetapi Gemma 4 E4B hanya mengambil masa kira-kira 3 saat untuk dijawab dengan betul. |
![]() ![]() |
Dengan soalan yang lebih kompleks, selepas beberapa siri penaakulan yang teliti, Gemma 4 menjawab dengan betul. Jumlah masa berfikir ialah 1 minit 6 saat, tidak terlalu lama untuk model luar talian. Sebagai perbandingan, Gemini 3 Berfikir mengambil masa kira-kira 15 saat, dan GPT-5.5 mengambil masa yang sama. |
![]() |
Kemuncak Gemma 4 E4B datang daripada keupayaan multimodalnya, yang menyokong input imej. Contohnya, LLM boleh menganalisis imej dan menjawab soalan tentang mercu tanda, butiran penting serta keadaan cuaca dan iklim dalam imej. |
![]() |
Apabila diminta untuk mengekstrak semua teks daripada imej halaman majalah, Gemma 4 mengambil masa lebih 30 saat untuk mengembalikan hasilnya. Tempoh masa ini tidak jauh berbeza daripada enjin carian dalam talian lain yang biasa digunakan oleh pengguna. |
![]() |
Pada aplikasi telefon pintar, pengguna perlu memilih ciri daripada antara muka utama (AI Chat, Ask Image, dll.), kemudian memilih model untuk digunakan. Oleh kerana ia beroperasi berdasarkan GPU, peranti mungkin menjadi panas semasa proses inferens AI. |
![]() |
Pengguna juga boleh memuat naik fail dokumen, dalam format DOCX atau PDF, dan kemudian meminta analisis teks atau ringkasan. Menurut wakil Google, generasi baharu model ini berkesan mengawal penjanaan rentetan aksara. Model ini mengehadkan proses pemikiran yang tidak perlu, sekali gus mengurangkan tekanan pengiraan pada kad grafik dan memori komputer. |
![]() |
Gemma 4 juga boleh diprogramkan. Dalam satu eksperimen, model tersebut ditugaskan untuk menggunakan HTML, CSS dan JavaScript untuk membina sistem pengendalian yang berjalan terus dalam pelayar. Pengguna perlu meningkatkan Panjang Konteks sebelum permulaan untuk memastikan model menghasilkan jawapan yang lengkap. Walaupun begitu, AI masih boleh melakukan kesilapan jika fail HTML tidak lengkap, dan beberapa komponen aplikasi mungkin tidak berfungsi. |
![]() |
Secara amnya, arahan yang memerlukan berbilang langkah atau data yang kompleks boleh menjadi mencabar untuk Gemma 4. Sesetengah arahan mungkin menggunakan sejumlah besar token pemprosesan. Menetapkan had token yang terlalu besar boleh menggunakan banyak RAM atau VRAM. |
Sumber: https://znews.vn/ai-khong-can-internet-cua-google-lam-duoc-gi-post1652142.html


























Komen (0)