Facebook創設者が新しいAIモデルを発表

Facebookの親会社は、Llama 4コレクションの2つの新モデルを発表しました。これは、ウェブ上のMeta AIアシスタントやWhatsApp、Messenger、Instagramで使用されているものと同じモデルで、ユーザーがよりパーソナライズされたマルチメディア体験を構築するのに役立ちます。

MetaまたはHugging Faceからダウンロード可能な2つの新モデルは、Llama 4 ScoutとLlama 4 Maverickです。Metaによると、CEOのマーク・ザッカーバーグ氏が「世界最高性能のプラットフォームモデル」と評する特大モデル「Llama 4 Behemoth」のトレーニングはまだ進行中とのことです。

Metaによると、Llama 4 Scoutは最大1000万トークンのコンテキストウィンドウを備えており、これは現在最もトークン数が多いモデルであるGeminiの数倍に相当します。この数値はAIモデルのワーキングメモリを表しています。

Meta は、このモデルが「多くの一般的な公開ベンチマークで」Google の Gemma 3 や Gemini 2.0 Flash-Lite、Mistral 3.1 よりも優れていると説明しているが、それでも「単一の Nvidia H100 GPU で実行できる」とのことだ。

Llama 4 Maverickについては、OpenAIのGPT-4oやGoogleのGemini 2.0 Flashと同等の性能を誇ると同社は主張しています。Maverickのプログラミングおよび推論タスクは、パラメータが半分以下であるにもかかわらず、DeepSeek-V3に匹敵します。

Llama 4コレクションの新モデルのフィギュア。写真： Meta。

一方、Behemothは、総パラメータ数2兆個のうち、2880億個のアクティブパラメータを有しています。Meta社によると、Behemothはまだリリースされていませんが、競合製品（具体的にはGPT-4.5とClaude Sonnet 3.7）を「STEM関連の多くの指標において」凌駕する性能を発揮できるとのことです。

Meta社は、DeepSeekで成功を収めた「Mixture of Experts（MoE）」アーキテクチャへの移行を発表しました。このアプローチは、特定のタスクに必要なモデル部分のみをアクティブ化することでリソースを節約します。製品計画の詳細は、4月29日に開催されるLlamaConカンファレンスで発表されます。

ライセンス制限に対する批判にもかかわらず、Metaは以前のモデルと同様に、Llama 4を依然として「オープンソース」と呼んでいます。例えば、Llama 4のライセンスでは、月間アクティブユーザー数が7億人を超える商用組織は、モデルを使用する前にMetaの許可を得る必要があります。

2023 年のオープンソースイニシアチブによれば、このような規制は「モデルをもはやオープンソースではなくなる」とのことです。

出典: https://znews.vn/cha-de-facebook-ra-mo-hinh-ai-moi-post1543744.html