A Facebook alapítója új mesterséges intelligencia modellt alkotott.

A Facebook anyavállalata nemrégiben két új modellt jelentett be a Llama 4 kollekciójában. Ezek ugyanazok a modellek, amelyeket jelenleg a Meta AI asszisztenshez használnak a weben, valamint a WhatsAppban, a Messengerben és az Instagramon, és amelyek segítenek az embereknek személyre szabottabb multimédiás élményeket létrehozni.

Két új modell, a Llama 4 Scout és a Llama 4 Maverick, mostantól letölthető a Meta vagy a Hugging Face oldaláról. A Meta szerint még mindig a Llama 4 Behemoth betanítása folyik, a hatalmas modellé, amelyet Mark Zuckerberg vezérigazgató a „világ legjobban teljesítő platformmodelljének” nevez.

A Meta szerint a Llama 4 Scout kontextuális ablaka akár 10 millió token is lehet, ami sokszorosa a jelenleg legtöbb tokennel rendelkező Gemini modellének. Ez a szám egy mesterséges intelligencia által generált modell munkamemóriáját jelöli.

A Meta szerint a modell „számos széles körben publikált benchmark alapján” jobb, mint a Google Gemma 3 és Gemini 2.0 Flash-Lite, valamint a Mistral 3.1, miközben továbbra is „egyetlen Nvidia H100 GPU-n fut”.

A Llama 4 Maverick esetében a vállalat hasonló teljesítmény-állításokat tett, amikor az OpenAI GPT-4o-jához és a Google Gemini 2.0 Flash-éhez hasonlította. A Maverick programozási és következtetési feladatai összehasonlíthatók a DeepSeek-V3-mal, annak ellenére, hogy csak a paraméterek kevesebb mint felét használja.

A Llama 4 kollekció új modelljeinek figurái. Fotó: Meta.

Eközben a Behemoth 288 milliárd aktív paraméterrel büszkélkedhet a 2 billióból. Bár még nem hozták nyilvánosságra, a Meta kijelenti, hogy a Behemothnak megvan a lehetősége, hogy felülmúlja versenytársait (konkrétan a GPT-4.5-öt és a Claude Sonnet 3.7-et) „számos STEM-mutatóban”.

A Meta bejelentette, hogy átálltak a „szakértők keveréke” (MoE) architektúrára, ugyanarra az architektúrára, amely a DeepSeeket is olyan sikeressé tette. Ez a megközelítés erőforrásokat takarít meg azáltal, hogy csak a modellnek az egyes feladatokhoz szükséges részeit aktiválja. A terméktervvel kapcsolatos további részleteket az április 29-i LlamaCon konferencián teszik közzé.

A licenckorlátozásokkal kapcsolatos kritikák ellenére a Meta továbbra is „nyílt forráskódúként” címkézi a Llama 4-et, hasonlóan a korábbi modelljeihez. Például a Llama 4 licenc előírja, hogy a havi 700 milliónál több aktív felhasználóval rendelkező kereskedelmi szervezeteknek engedélyt kell kérniük a Metától a modell használata előtt.

A 2023-as Nyílt Forráskódú Kezdeményezés szerint az ilyen szabályozások "arra késztették a modellt, hogy már ne minősüljön nyílt forráskódúnak".

Forrás: https://znews.vn/cha-de-facebook-ra-mo-hinh-ai-moi-post1543744.html