Facebook-grunnleggeren lager ny AI-modell.

Facebooks morselskap har nettopp annonsert to nye modeller i Llama 4-kolleksjonen sin. Dette er de samme modellene som for tiden brukes for Meta AI-assistenten på nettet, så vel som i WhatsApp, Messenger og Instagram, og hjelper folk med å skape mer personlige multimedieopplevelser.

To nye modeller, som nå er tilgjengelige for nedlasting fra Meta eller Hugging Face, er Llama 4 Scout og Llama 4 Maverick. Meta sier at de fortsatt er i ferd med å trene Llama 4 Behemoth, den massive modellen som administrerende direktør Mark Zuckerberg kaller « verdens mest effektive plattformmodell».

Ifølge Meta har Llama 4 Scout et kontekstvindu på opptil 10 millioner tokens, mange ganger mer enn modellen med det høyeste antallet tokens for øyeblikket, Gemini. Dette tallet representerer arbeidsminnet til en AI-modell.

Meta beskriver modellen som bedre enn Googles Gemma 3 og Gemini 2.0 Flash-Lite, samt Mistral 3.1, «på en rekke bredt publiserte benchmarks», samtidig som den fortsatt kan «kjøre på et enkelt Nvidia H100 GPU».

For Llama 4 Maverick kom selskapet med lignende ytelseskrav når de sammenlignet det med OpenAIs GPT-4o og Googles Gemini 2.0 Flash. Mavericks programmerings- og inferensoppgaver er sammenlignbare med DeepSeek-V3, selv om den bare bruker mindre enn halvparten av parameterne.

Figurer for de nye modellene i Llama 4-kolleksjonen. Foto: Meta.

I mellomtiden kan Behemoth skryte av 288 milliarder aktive parametere av totalt 2 billioner. Selv om det ikke er utgitt ennå, hevder Meta at Behemoth har potensial til å overgå konkurrentene (spesifikt GPT-4.5 og Claude Sonnet 3.7) «på flere STEM-målinger».

Meta annonserte at de har byttet til en «blanding av eksperter»-arkitektur (MoE), den samme arkitekturen som gjorde DeepSeek så vellykket. Denne tilnærmingen sparer ressurser ved kun å aktivere de delene av modellen som er nødvendige for hver spesifikke oppgave. Flere detaljer om produktplanen vil bli annonsert på LlamaCon-konferansen 29. april.

Til tross for kritikk angående lisensbegrensningene, fortsetter Meta å stemple Llama 4 som "åpen kildekode", i likhet med tidligere modeller. For eksempel krever Llama 4-lisensen at kommersielle organisasjoner med mer enn 700 millioner månedlige aktive brukere innhenter tillatelse fra Meta før de bruker modellen.

I følge Open Source Initiative i 2023 har slike forskrifter «ført til at modellen ikke lenger er klassifisert som åpen kildekode».

Kommentar (0)