Syarikat induk Facebook baru sahaja mengumumkan dua model baharu dalam koleksi Llama 4. Ini adalah model yang sama yang kini digunakan untuk pembantu Meta AI di web, serta dalam WhatsApp, Messenger dan Instagram, yang membantu orang ramai mencipta pengalaman multimedia yang lebih diperibadikan.
Dua model baharu, kini boleh dimuat turun daripada Meta atau Hugging Face, ialah Llama 4 Scout dan Llama 4 Maverick. Meta berkata ia masih dalam proses melatih Llama 4 Behemoth, model besar yang digelar oleh Ketua Pegawai Eksekutif Mark Zuckerberg sebagai "model platform berprestasi tertinggi di dunia ."
Menurut Meta, Llama 4 Scout mempunyai tetingkap konteks sehingga 10 juta token, berkali-kali ganda lebih banyak daripada model dengan bilangan token tertinggi pada masa ini, Gemini. Nombor ini mewakili memori kerja model AI.
Meta menggambarkan model itu sebagai lebih baik daripada Gemma 3 dan Gemini 2.0 Flash-Lite Google, serta Mistral 3.1, "pada beberapa penanda aras yang diterbitkan secara meluas," sambil masih dapat "berjalan pada GPU Nvidia H100 tunggal."
Bagi Llama 4 Maverick, syarikat itu membuat dakwaan prestasi yang serupa apabila membandingkannya dengan GPT-4o OpenAI dan Gemini 2.0 Flash Google. Tugas pengaturcaraan dan inferens Maverick adalah setanding dengan DeepSeek-V3, walaupun ia hanya menggunakan kurang daripada separuh parameter.
![]() |
Figur untuk model baharu dalam koleksi Llama 4. Foto: Meta. |
Sementara itu, Behemoth mempunyai 288 bilion parameter aktif daripada sejumlah 2 trilion. Walaupun belum dikeluarkan, Meta menyatakan bahawa Behemoth berpotensi untuk mengatasi pesaingnya (khususnya GPT-4.5 dan Claude Sonnet 3.7) “dalam beberapa metrik STEM.”
Meta mengumumkan bahawa mereka telah beralih kepada seni bina "campuran pakar" (MoE), seni bina yang sama yang menjadikan DeepSeek begitu berjaya. Pendekatan ini menjimatkan sumber dengan hanya mengaktifkan bahagian model yang diperlukan untuk setiap tugasan tertentu. Butiran lanjut tentang pelan produk akan diumumkan di persidangan LlamaCon pada 29 April.
Walaupun terdapat kritikan mengenai sekatan pelesenannya, Meta terus melabelkan Llama 4 sebagai "sumber terbuka", serupa dengan model sebelumnya. Contohnya, lesen Llama 4 memerlukan organisasi komersial dengan lebih daripada 700 juta pengguna aktif bulanan untuk mendapatkan kebenaran daripada Meta sebelum menggunakan model tersebut.
Menurut Inisiatif Sumber Terbuka pada tahun 2023, peraturan sedemikian "telah menjadikan model itu tidak lagi diklasifikasikan sebagai sumber terbuka."
Sumber: https://znews.vn/cha-de-facebook-ra-mo-hinh-ai-moi-post1543744.html







Komen (0)