![]() |
Gemma 4 เป็นภาษาแบบจำลองขนาดใหญ่ (LLM) ที่พัฒนาโดย Google DeepMind เป็นตระกูลแบบจำลองโอเพนซอร์สที่รองรับการประมวลผลภายในองค์กรโดยไม่ต้องเชื่อมต่ออินเทอร์เน็ต ผู้ใช้สามารถดาวน์โหลด ปรับแต่ง และใช้งานบนคอมพิวเตอร์หรืออุปกรณ์เคลื่อนที่ของตนได้ |
![]() |
ซีรีส์ Gemma 4 มีให้เลือกสี่รุ่น ได้แก่ E2B, E4B, 31B และ 26B A4B รุ่น E2B และ E4B ต้องการ RAM อย่างน้อย 4-6 GB (4 บิต) หรือ 10-16 GB (16 บิต) เหมาะสำหรับใช้งานบนอุปกรณ์พกพาและคอมพิวเตอร์ที่มีสเปคปานกลาง ในขณะที่รุ่น 26B A4B ต้องการ RAM อย่างน้อย 18 GB และรุ่น 31B ต้องการอย่างน้อย 20 GB |
![]() |
จากข้อมูลของ MindStudio ข้อดีอย่างหนึ่งของการรันโมเดล AI ในเครื่องคือเรื่องความปลอดภัยและไม่มีค่าใช้จ่ายเพิ่มเติม อย่างไรก็ตาม ประสิทธิภาพของโมเดลเหล่านี้ขึ้นอยู่กับฮาร์ดแวร์ของอุปกรณ์ ผู้ใช้มือถือสามารถติดตั้งแอป Google AI Edge Gallery (ตามภาพ) ในขณะที่คอมพิวเตอร์ต้องใช้เครื่องมืออย่าง LM Studio หรือ Ollama ภาพ: Google |
![]() |
LM Studio บนพีซีช่วยให้คุณเลือกและโหลด Gemma 4 ได้ในการใช้งานครั้งแรก เวอร์ชัน E4B มีขนาดประมาณ 6.3 GB และรองรับการอนุมานและการวิเคราะห์ภาพ Gemma 4 E4B บนมือถือมีขนาด 3.6 GB เมื่อดาวน์โหลดโดยใช้ Google AI Edge Gallery |
![]() |
หลังจากดาวน์โหลดเสร็จสมบูรณ์ ผู้ใช้จะถูกนำไปยังอินเทอร์เฟซแบบแชทบอท ในส่วนการเลือกโมเดลด้านล่าง ให้คลิกที่ Gemma 4 E4B ในหน้าต่างถัดไป ให้เลือก Load Model และรอประมาณหนึ่งนาทีเพื่อให้โมเดลเริ่มทำงาน |
![]() |
เช่นเดียวกับรุ่นยอดนิยมอื่นๆ Gemma 4 E4B รองรับการโต้ตอบด้วยภาษาเวียดนาม จากการทดสอบบน Mac mini M4 (RAM 16 GB) ด้วยคำสั่ง "Hello" พบว่ารุ่นนี้ใช้เวลาประมาณ 8 วินาทีในการประมวลผลและตอบกลับ |
![]() |
เมื่อถูกถามว่า "คุณทำอะไรได้บ้าง" เจมม่า 4 E4B ใช้เวลาประมาณ 13 วินาทีในการทำความเข้าใจและแปลคำสั่งเป็นภาษาอังกฤษทันที จากนั้นจึงค่อยๆ เขียนคำตอบลงไป |
![]() |
เนื่องจากโมเดลทำงานโดยตรงบนอุปกรณ์ เวลาตอบสนองของโมเดลจึงอาจแตกต่างกันไปขึ้นอยู่กับฮาร์ดแวร์ โดยใช้คำถามเดียวกันว่า "คุณทำอะไรได้บ้าง" โมเดลใช้เวลาประมาณ 45 วินาทีในการตอบสนองอย่างสมบูรณ์บน iPhone 15 Pro |
![]() |
ตัวอย่างเช่น คำถามเชิงตรรกะอีกข้อหนึ่งที่ตอบได้อย่างรวดเร็วและแม่นยำคือ "รถไฟออกเดินทางเวลา 8:15 น. และถึงเวลา 11:47 น. การเดินทางใช้เวลานานเท่าใด" โดยทั่วไปแล้ว คำถามเชิงตรรกะง่ายๆ เช่นนี้ไม่ได้ซับซ้อนเกินไปสำหรับนักศึกษาปริญญาโทด้านกฎหมายรุ่นใหม่ |
![]() |
ทดสอบด้วยคำถามเชิงตรรกะ เช่น "ในคำว่า 'strawberry' มีตัว 'r' กี่ตัว?" คำถามนี้เคยทำให้ผู้เรียน LLM รุ่นก่อนๆ หลายคนตอบไม่ได้ แต่เจมม่า 4 E4B ใช้เวลาเพียงประมาณ 3 วินาทีในการตอบได้อย่างถูกต้อง |
![]() ![]() |
เมื่อได้รับคำถามที่ซับซ้อนขึ้น หลังจากใช้เหตุผลอย่างละเอียดถี่ถ้วนแล้ว Gemma 4 ก็ตอบได้อย่างถูกต้อง โดยใช้เวลาคิดทั้งหมด 1 นาที 6 วินาที ซึ่งไม่นานเกินไปสำหรับโมเดลแบบออฟไลน์ เมื่อเปรียบเทียบกันแล้ว Gemini 3 Thinking ใช้เวลาประมาณ 15 วินาที และ GPT-5.5 ก็ใช้เวลาใกล้เคียงกัน |
![]() |
จุดเด่นของ Gemma 4 E4B อยู่ที่ความสามารถในการประมวลผลหลายรูปแบบ รองรับการป้อนข้อมูลภาพ ตัวอย่างเช่น LLM สามารถวิเคราะห์ภาพและตอบคำถามเกี่ยวกับสถานที่สำคัญ รายละเอียดที่โดดเด่น และสภาพอากาศและสภาพภูมิอากาศในภาพได้ |
![]() |
เมื่อถูกขอให้ดึงข้อความทั้งหมดจากภาพหน้าหนังสือพิมพ์หรือนิตยสาร Gemma 4 ใช้เวลาเพียง 30 วินาทีในการแสดงผลลัพธ์ ซึ่งระยะเวลานี้ไม่แตกต่างจากเครื่องมือค้นหาออนไลน์อื่นๆ ที่ผู้ใช้คุ้นเคยมากนัก |
![]() |
ในแอปพลิเคชันบนสมาร์ทโฟน ผู้ใช้ต้องเลือกฟีเจอร์จากหน้าจอหลัก (เช่น AI Chat, Ask Image เป็นต้น) จากนั้นเลือกโมเดลที่จะใช้ เนื่องจากแอปพลิเคชันทำงานโดยใช้ GPU อุปกรณ์อาจร้อนขึ้นระหว่างกระบวนการประมวลผล AI |
![]() |
ผู้ใช้ยังสามารถอัปโหลดไฟล์เอกสารในรูปแบบ DOCX หรือ PDF จากนั้นขอให้วิเคราะห์หรือสรุปข้อความได้ ตามที่ตัวแทนของ Google กล่าวไว้ โมเดลรุ่นใหม่นี้ควบคุมการสร้างสตริงข้อความได้อย่างมีประสิทธิภาพ โมเดลนี้จำกัดกระบวนการคิดที่ไม่จำเป็น ลดภาระการประมวลผลของกราฟิกการ์ดและหน่วยความจำคอมพิวเตอร์ |
![]() |
Gemma 4 ยังสามารถตั้งโปรแกรมได้อีกด้วย ในการทดลองหนึ่ง โมเดลได้รับมอบหมายให้ใช้ HTML, CSS และ JavaScript เพื่อสร้างระบบปฏิบัติการที่ทำงานโดยตรงในเบราว์เซอร์ ผู้ใช้จำเป็นต้องเพิ่มความยาวของบริบท (Context Length) ก่อนเริ่มต้นเพื่อให้แน่ใจว่าโมเดลให้คำตอบที่สมบูรณ์ ถึงกระนั้น AI ก็ยังอาจทำผิดพลาดได้หากไฟล์ HTML ไม่สมบูรณ์ และส่วนประกอบบางอย่างของแอปพลิเคชันอาจใช้งานไม่ได้ |
![]() |
โดยทั่วไป คำสั่งที่ต้องใช้หลายขั้นตอนหรือข้อมูลที่ซับซ้อนอาจเป็นเรื่องยากสำหรับ Gemma 4 คำสั่งบางคำสั่งอาจใช้โทเค็นการประมวลผลจำนวนมาก การตั้งค่าขีดจำกัดโทเค็นที่มากเกินไปอาจใช้ RAM หรือ VRAM จำนวนมาก |
ที่มา: https://znews.vn/ai-khong-can-internet-cua-google-lam-duoc-gi-post1652142.html


























การแสดงความคิดเห็น (0)