Firma macierzysta Facebooka właśnie ogłosiła dwa nowe modele w swojej kolekcji Llama 4. Są to te same modele, które są obecnie używane w asystencie Meta AI w sieci, a także w WhatsApp, Messengerze i Instagramie, pomagając użytkownikom tworzyć bardziej spersonalizowane doświadczenia multimedialne.
Dwa nowe modele, dostępne już do pobrania z Meta lub Hugging Face, to Llama 4 Scout i Llama 4 Maverick. Meta twierdzi, że wciąż jest w trakcie szkolenia Llama 4 Behemoth, potężnego modelu, który prezes Mark Zuckerberg nazywa „najwydajniejszym modelem platformy na świecie ”.
Według Meta, Llama 4 Scout ma okno kontekstowe liczące do 10 milionów tokenów, wielokrotnie więcej niż model z największą liczbą tokenów, Gemini. Liczba ta reprezentuje pamięć roboczą modelu AI.
Meta opisuje ten model jako lepszy od modeli Google Gemma 3 i Gemini 2.0 Flash-Lite, a także Mistral 3.1, „w wielu powszechnie publikowanych testach porównawczych”, a jednocześnie mogący „działać na jednym procesorze graficznym Nvidia H100”.
W przypadku Llama 4 Maverick firma przedstawiła podobne deklaracje wydajnościowe, porównując go z GPT-4o firmy OpenAI i Gemini 2.0 Flash firmy Google. Zadania programistyczne i wnioskowanie w Maverick są porównywalne z DeepSeek-V3, mimo że wykorzystuje on tylko mniej niż połowę parametrów.
![]() |
Figurki nowych modeli z kolekcji Llama 4. Zdjęcie: Meta. |
Tymczasem Behemoth może pochwalić się 288 miliardami aktywnych parametrów z łącznej liczby 2 bilionów. Chociaż dane nie zostały jeszcze opublikowane, Meta twierdzi, że Behemoth ma potencjał, by przewyższyć konkurencję (w szczególności GPT-4.5 i Claude Sonnet 3.7) „w kilku wskaźnikach STEM”.
Firma Meta ogłosiła przejście na architekturę „mieszanki ekspertów” (MoE), tę samą, która zapewniła DeepSeek tak wielki sukces. To podejście pozwala oszczędzać zasoby, aktywując tylko te części modelu, które są niezbędne do realizacji każdego konkretnego zadania. Więcej szczegółów na temat planu produktu zostanie ogłoszonych na konferencji LlamaCon 29 kwietnia.
Pomimo krytyki dotyczącej ograniczeń licencyjnych, Meta nadal określa Llamę 4 jako „open source”, podobnie jak poprzednie modele. Na przykład, licencja Llama 4 wymaga od organizacji komercyjnych z ponad 700 milionami aktywnych użytkowników miesięcznie uzyskania zgody Meta przed korzystaniem z tego modelu.
Według Open Source Initiative z 2023 r. takie regulacje „spowodowały, że model ten nie jest już klasyfikowany jako oprogramowanie typu open source”.
Źródło: https://znews.vn/cha-de-facebook-ra-mo-hinh-ai-moi-post1543744.html







Komentarz (0)