Perusahaan induk Facebook baru saja mengumumkan dua model baru dalam koleksi Llama 4-nya. Ini adalah model yang sama yang saat ini digunakan untuk asisten AI Meta di web, serta di WhatsApp, Messenger, dan Instagram, membantu orang menciptakan pengalaman multimedia yang lebih personal.
Dua model baru, yang kini tersedia untuk diunduh dari Meta atau Hugging Face, adalah Llama 4 Scout dan Llama 4 Maverick. Meta mengatakan bahwa mereka masih dalam proses melatih Llama 4 Behemoth, model besar yang oleh CEO Mark Zuckerberg disebut sebagai "model platform dengan kinerja tertinggi di dunia ."
Menurut Meta, Llama 4 Scout memiliki jendela konteks hingga 10 juta token, berkali-kali lipat lebih banyak daripada model dengan jumlah token tertinggi saat ini, Gemini. Angka ini mewakili memori kerja dari sebuah model AI.
Meta menggambarkan model ini lebih unggul daripada Gemma 3 dan Gemini 2.0 Flash-Lite milik Google, serta Mistral 3.1, "pada sejumlah benchmark yang dipublikasikan secara luas," sementara tetap mampu "berjalan pada satu GPU Nvidia H100."
Untuk Llama 4 Maverick, perusahaan tersebut membuat klaim kinerja serupa ketika membandingkannya dengan GPT-4o milik OpenAI dan Gemini 2.0 Flash milik Google. Tugas pemrograman dan inferensi Maverick sebanding dengan DeepSeek-V3, meskipun hanya menggunakan kurang dari setengah parameter yang digunakan DeepSeek-V3.
![]() |
Figur-figur untuk model baru dalam koleksi Llama 4. Foto: Meta. |
Sementara itu, Behemoth memiliki 288 miliar parameter aktif dari total 2 triliun. Meskipun belum dirilis, Meta menyatakan bahwa Behemoth berpotensi mengungguli para pesaingnya (khususnya GPT-4.5 dan Claude Sonnet 3.7) “pada beberapa metrik STEM.”
Meta mengumumkan bahwa mereka telah beralih ke arsitektur "campuran pakar" (MoE), arsitektur yang sama yang membuat DeepSeek begitu sukses. Pendekatan ini menghemat sumber daya dengan hanya mengaktifkan bagian-bagian model yang diperlukan untuk setiap tugas spesifik. Detail lebih lanjut tentang rencana produk akan diumumkan pada konferensi LlamaCon pada tanggal 29 April.
Terlepas dari kritik terkait pembatasan lisensinya, Meta terus melabeli Llama 4 sebagai "sumber terbuka," serupa dengan model-model sebelumnya. Misalnya, lisensi Llama 4 mengharuskan organisasi komersial dengan lebih dari 700 juta pengguna aktif bulanan untuk mendapatkan izin dari Meta sebelum menggunakan model tersebut.
Menurut Open Source Initiative pada tahun 2023, peraturan tersebut "telah menyebabkan model tersebut tidak lagi diklasifikasikan sebagai sumber terbuka."
Sumber: https://znews.vn/cha-de-facebook-ra-mo-hinh-ai-moi-post1543744.html







Komentar (0)