מייסד פייסבוק יצר מודל חדש של בינה מלאכותית.

חברת האם של פייסבוק הכריזה זה עתה על שני דגמים חדשים בקולקציית Llama 4 שלה. אלו אותם דגמים המשמשים כיום עבור עוזר הבינה המלאכותית Meta באינטרנט, כמו גם בוואטסאפ, מסנג'ר ואינסטגרם, ועוזרים לאנשים ליצור חוויות מולטימדיה מותאמות אישית יותר.

שני דגמים חדשים, הזמינים כעת להורדה מ-Meta או מ-Hugging Face, הם ה-Llama 4 Scout וה-Llama 4 Maverick. מטא אומרת שהיא עדיין בתהליך אימון ה-Llama 4 Behemoth, הדגם העצום שמנכ"ל החברה, מארק צוקרברג, מכנה "דגם הפלטפורמה בעל הביצועים הגבוהים ביותר בעולם ".

לפי Meta, ל-Llama 4 Scout יש חלון הקשר של עד 10 מיליון טוקנים, פי כמה יותר מהמודל עם מספר הטוקנים הגבוה ביותר כיום, Gemini. מספר זה מייצג את זיכרון העבודה של מודל בינה מלאכותית.

מטא מתאר את הדגם כעדיף על Gemma 3 ו- Gemini 2.0 Flash-Lite של גוגל, כמו גם על Mistral 3.1, "במספר מדדי ביצועים שפורסמו באופן נרחב", ועדיין מסוגל "לרוץ על כרטיס מסך יחיד של Nvidia H100".

עבור Llama 4 Maverick, החברה העלתה טענות ביצועים דומות כאשר השוותה אותו ל-GPT-4o של OpenAI ול-Gemini 2.0 Flash של גוגל. משימות התכנות וההסקה של Maverick דומות ל-DeepSeek-V3, למרות שהוא משתמש רק בפחות ממחצית הפרמטרים.

דמויות לדגמים החדשים בקולקציית Llama 4. צילום: מטא.

בינתיים, Behemoth מתגאה ב-288 מיליארד פרמטרים פעילים מתוך סך של 2 טריליון. למרות שטרם פורסם, Meta מצהירה כי ל-Behemoth יש פוטנציאל להתעלות על מתחרותיה (במיוחד GPT-4.5 ו-Claude Sonnet 3.7) "במספר מדדי STEM".

חברת Meta הודיעה כי עברה לארכיטקטורת "תערובת מומחים" (MoE), אותה ארכיטקטורה שהפכה את DeepSeek למוצלחת כל כך. גישה זו חוסכת משאבים על ידי הפעלת חלקי המודל הנחוצים לכל משימה ספציפית בלבד. פרטים נוספים על תוכנית המוצר יפורסמו בכנס LlamaCon ב-29 באפריל.

למרות ביקורת בנוגע למגבלות הרישוי שלה, מטא ממשיכה לתייג את Llama 4 כ"קוד פתוח", בדומה למודלים הקודמים שלה. לדוגמה, רישיון Llama 4 דורש מארגונים מסחריים עם יותר מ-700 מיליון משתמשים פעילים חודשיים לקבל אישור מ-Meta לפני השימוש במודל.

על פי יוזמת הקוד הפתוח משנת 2023, תקנות כאלה "גרמו לכך שהמודל אינו מסווג עוד כקוד פתוח".

מקור: https://znews.vn/cha-de-facebook-ra-mo-hinh-ai-moi-post1543744.html