![]() |
ג'מה 4 היא שפת מודלים גדולה (LLM) שפותחה על ידי גוגל דיפ-מיינד. זוהי משפחת מודלים בקוד פתוח התומכת בעיבוד מקומי ללא חיבור לאינטרנט. משתמשים יכולים להוריד, להתאים אישית ולפרוס אותה במחשבים או במכשירים הניידים שלהם. |
![]() |
סדרת Gemma 4 מופצת בארבע גרסאות: E2B, E4B, 31B ו-26B A4B. גרסאות E2B ו-E4B דורשות מינימום של 4-6 ג'יגה-בייט (4 סיביות) או 10-16 ג'יגה-בייט (16 סיביות) של זיכרון RAM, מתאים להפעלה על מכשירים ניידים ומחשבים בעלי תצורה בינונית. בינתיים, גרסת 26B A4B דורשת מינימום של 18 ג'יגה-בייט של זיכרון RAM, וגרסת 31B דורשת לפחות 20 ג'יגה-בייט. |
![]() |
לפי MindStudio , אחד היתרונות של הרצת מודלים של בינה מלאכותית באופן מקומי הוא אבטחה והיעדר עלויות נוספות. עם זאת, ביצועי המודלים הללו תלויים בחומרת המכשיר. משתמשי מובייל יכולים להתקין את אפליקציית Google AI Edge Gallery (בתמונה), בעוד שמחשבים דורשים כלים כמו LM Studio או Ollama. צילום: גוגל . |
![]() |
LM Studio במחשב מאפשר לך לבחור ולטעון את Gemma 4 בהפעלה הראשונה. גרסת E4B היא בגודל של כ-6.3 ג'יגה-בייט ותומכת בהסקת תמונות וניתוחן. גודל Gemma 4 E4B בנייד הוא 3.6 ג'יגה-בייט בעת הורדה באמצעות Google AI Edge Gallery. |
![]() |
לאחר השלמת ההורדה, המשתמש מועבר לממשק בסגנון צ'אטבוט. במקטע בחירת המודל למטה, לחץ על Gemma 4 E4B . בחלון הבא, בחר Load Model והמתן כדקה עד שהמודל יתחיל לפעול. |
![]() |
בדומה לדגמים פופולריים אחרים, Gemma 4 E4B תומך באינטראקציה בשפה הוייטנאמית. בבדיקה על מק מיני M4 (16 ג'יגה-בייט זיכרון RAM) עם הפקודה "שלום", לקח לדגם כ-8 שניות להסיק ולהגיב. |
![]() |
כשנשאלה "מה את יכולה לעשות?", ג'מה 4 E4B לקח לה בערך 13 שניות להבין ולתרגם מיד את הפקודה לאנגלית, ואז לרשום בהדרגה את התשובה. |
![]() |
מכיוון שהוא פועל ישירות על המכשיר, זמן התגובה של הדגם עשוי להשתנות בהתאם לחומרה. עם אותה השאלה, "מה אתה יכול לעשות?", לקח לדגם כ-45 שניות לספק תגובה מלאה באייפון 15 פרו. |
![]() |
שאלת חשיבה נוספת שנענה במהירות ובדייקנות הייתה, למשל, "רכבת יוצאת בשעה 8:15 בבוקר ומגיעה בשעה 11:47 בבוקר. כמה זמן ארכה הנסיעה?". באופן כללי, משפטי חשיבה פשוטים כאלה אינם מסובכים מדי עבור הדור החדש של סטודנטים לתואר ראשון במשפטים. |
![]() |
נבדק עם שאלה מבוססת לוגיקה כמו "כמה 'ר' יש במילה 'תות'?". שאלה זו הטרידה ניסויים קודמים רבים במשפטים, אך מבחן Gemma 4 E4B לקח רק כ-3 שניות לענות נכון. |
![]() ![]() |
עם שאלה מורכבת יותר, לאחר סדרה של חשיבה מדוקדקת, ג'מה 4 ענתה נכון. זמן החשיבה הכולל היה דקה ו-6 שניות, לא ארוך מדי עבור מודל לא מקוון. לשם השוואה, ג'מיני 3 חשיבה ארכה כ-15 שניות, ו-GPT-5.5 ארכה פרק זמן דומה. |
![]() |
גולת הכותרת של Gemma 4 E4B נובעת מיכולותיה הרב-מודאליות, התומכות בקלט תמונה. לדוגמה, LLM יכול לנתח תמונות ולענות על שאלות לגבי ציוני דרך, פרטים בולטים ותנאי מזג אוויר ואקלים בתמונה. |
![]() |
כאשר התבקשה ג'מה 4 לחלץ את כל הטקסט מתמונה בעמוד מגזין, היא החזירה את התוצאה תוך קצת יותר מ-30 שניות. מסגרת זמן זו אינה שונה באופן משמעותי מזו של מנועי חיפוש מקוונים אחרים שהמשתמשים מכירים. |
![]() |
באפליקציית הסמארטפון, משתמשים צריכים לבחור תכונה מהממשק הראשי (צ'אט AI, שאל תמונה וכו'), ולאחר מכן לבחור דגם לשימוש. מכיוון שהיא פועלת על סמך ה-GPU, המכשיר עלול להתחמם במהלך תהליך ההסקה של ה-AI. |
![]() |
משתמשים יכולים גם להעלות קבצי מסמכים, בפורמט DOCX או PDF, ולאחר מכן לבקש ניתוח טקסט או סיכום. לדברי נציגי גוגל, הדור החדש של מודלים שולט ביעילות ביצירת מחרוזות תווים. המודל מגביל תהליכי חשיבה מיותרים, ומפחית את העומס החישובי על כרטיסי המסך וזיכרון המחשב. |
![]() |
גם ג'מה 4 ניתנת לתכנות. בניסוי אחד, המודל הוטל עליו להשתמש ב-HTML, CSS ו-JavaScript כדי לבנות מערכת הפעלה הפועלת ישירות בדפדפן. המשתמשים היו צריכים להגדיל את אורך ההקשר לפני ההפעלה כדי להבטיח שהמודל ייצר תשובה מלאה. למרות זאת, הבינה המלאכותית עדיין עלולה לעשות טעויות אם קובץ ה-HTML אינו שלם, וייתכן שחלק מרכיבי האפליקציה לא יעבדו. |
![]() |
באופן כללי, פקודות הדורשות שלבים מרובים או נתונים מורכבים יכולות להיות מאתגרות עבור Gemma 4. פקודות מסוימות עשויות לצרוך מספר רב של טוקנים לעיבוד. הגדרת מגבלות טוקנים גדולות מדי עלולה לצרוך הרבה זיכרון RAM או VRAM. |
מקור: https://znews.vn/ai-khong-can-internet-cua-google-lam-duoc-gi-post1652142.html


























תגובה (0)