Facebooks moderbolag har precis presenterat två nya modeller i sin Llama 4-kollektion. Det är samma modeller som för närvarande används för Meta AI-assistenten på webben, såväl som i WhatsApp, Messenger och Instagram, vilket hjälper människor att skapa mer personliga multimediaupplevelser.
Två nya modeller, som nu finns tillgängliga för nedladdning från Meta eller Hugging Face, är Llama 4 Scout och Llama 4 Maverick. Meta säger att de fortfarande håller på att träna Llama 4 Behemoth, den massiva modellen som VD:n Mark Zuckerberg kallar " världens högst presterande plattformsmodell".
Enligt Meta har Llama 4 Scout ett kontextfönster på upp till 10 miljoner tokens, många gånger mer än modellen med det högsta antalet tokens för närvarande, Gemini. Detta nummer representerar arbetsminnet för en AI-modell.
Meta beskriver modellen som överlägsen Googles Gemma 3 och Gemini 2.0 Flash-Lite, såväl som Mistral 3.1, "på ett antal allmänt publicerade riktmärken", samtidigt som den fortfarande kan "köras på en enda Nvidia H100 GPU".
För Llama 4 Maverick gjorde företaget liknande prestandakrav när de jämförde det med OpenAI:s GPT-4o och Googles Gemini 2.0 Flash. Mavericks programmerings- och inferensuppgifter är jämförbara med DeepSeek-V3, även om den bara använder mindre än hälften av parametrarna.
![]() |
Figurer för de nya modellerna i Llama 4-kollektionen. Foto: Meta. |
Samtidigt har Behemoth 288 miljarder aktiva parametrar av totalt 2 biljoner. Även om det ännu inte släppts, uppger Meta att Behemoth har potential att överträffa sina konkurrenter (särskilt GPT-4.5 och Claude Sonnet 3.7) "på flera STEM-mått".
Meta meddelade att de har bytt till en "mix of experts"-arkitektur (MoE), samma arkitektur som gjorde DeepSeek så framgångsrikt. Denna metod sparar resurser genom att bara aktivera de delar av modellen som är nödvändiga för varje specifik uppgift. Mer information om produktplanen kommer att tillkännages på LlamaCon-konferensen den 29 april.
Trots kritik gällande dess licensbegränsningar fortsätter Meta att beteckna Llama 4 som "öppen källkod", i likhet med sina tidigare modeller. Till exempel kräver Llama 4-licensen att kommersiella organisationer med mer än 700 miljoner månatliga aktiva användare får tillstånd från Meta innan de använder modellen.
Enligt Open Source Initiative från 2023 har sådana regleringar "gjort att modellen inte längre klassificeras som öppen källkod".
Källa: https://znews.vn/cha-de-facebook-ra-mo-hinh-ai-moi-post1543744.html








Kommentar (0)