Материнская компания Facebook только что анонсировала две новые модели из коллекции Llama 4. Эта же модель используется для помощника Meta AI в веб-браузере, а также в WhatsApp, Messenger и Instagram, помогая пользователям создавать более персонализированные мультимедийные впечатления.
Две новые модели, доступные для скачивания на Meta или Hugging Face, — это Llama 4 Scout и Llama 4 Maverick. Meta сообщает, что всё ещё находится в процессе обучения Llama 4 Behemoth — сверхбольшой модели, которую генеральный директор Марк Цукерберг называет «самой производительной платформенной моделью в мире ».
По данным Meta, контекстное окно Llama 4 Scout достигает 10 миллионов токенов, что во много раз превышает возможности текущей модели Gemini с наибольшим числом токенов. Это число отражает объём оперативной памяти модели ИИ.
Meta описывает модель как превосходящую Gemma 3 и Gemini 2.0 Flash-Lite от Google, а также Mistral 3.1 «на многих популярных общедоступных тестах», при этом способную «работать на одном графическом процессоре Nvidia H100».
Компания заявляет, что Llama 4 Maverick обеспечивает схожую производительность по сравнению с OpenAI GPT-4o и Google Gemini 2.0 Flash. Задачи программирования и вывода Maverick сопоставимы с DeepSeek-V3, даже при использовании вдвое меньшего количества параметров.
![]() |
Фигурки новых моделей коллекции Llama 4. Фото: Meta. |
Между тем, у Behemoth 288 миллиардов активных параметров из 2000 миллиардов. Хотя Behemoth ещё не выпущен, Meta утверждает, что Behemoth способен превзойти конкурентов (в частности, GPT-4.5 и Claude Sonnet 3.7) «по ряду показателей STEM».
Компания Meta сообщила о переходе на архитектуру «смешанных экспертов» (MoE), которая оказалась успешной для DeepSeek. Этот подход экономит ресурсы, активируя только те части модели, которые необходимы для конкретной задачи. Более подробная информация о планах по выпуску продукта будет объявлена на конференции LlamaCon, которая состоится 29 апреля.
Несмотря на критику лицензионных ограничений, Meta по-прежнему называет Llama 4 «открытым исходным кодом», как и предыдущие модели. Например, лицензия Llama 4 обязывает коммерческие организации с более чем 700 миллионами активных пользователей в месяц запрашивать разрешение Meta перед использованием модели.
По данным Open Source Initiative, в 2023 году такое регулирование «делает модель более не имеющей открытого исходного кода».
Источник: https://znews.vn/cha-de-facebook-ra-mo-hinh-ai-moi-post1543744.html
Комментарий (0)