Hugging Faceプラットフォームからダウンロード可能なこれらのモデルは、DeepSeekがJanus-Proと呼ぶ新しいモデル群の一部です。パラメータ数は10億から70億まで様々で、パラメータ数が多いほどモデルの性能は向上します。

9rn0s3d3.png
Janus-ProとJanusのテキストから画像を生成する能力の比較。写真:DeepSeek

Janus-Proは、画像を分析・生成することができます。DeepSeekによると、AIベンチマークであるGenEvalとDPG-Benchにおいて、Janus-Pro-7BはDall-E 3だけでなく、PixArt-alpha、Emu3-Gen、Stable Diffusion XLなどの他のモデルよりも優れています。

しかし、TechCrunchによると、残りのJanus-Proモデルのほとんどは、最大解像度が384 x 384の小さな画像しか分析できないとのことだ。それでも、コンパクトなサイズを考えると、Janus-Proのパフォーマンスは印象的だ。

2023年に設立された中国のスタートアップ企業DeepSeekは、同社のチャットボットが米国のApp Storeランキングでトップに躍り出たことで、ここ数日で急激に注目を集めている。同社の大規模言語モデルは、計算効率と費用対効果の高い手法を用いて学習されており、ウォール街は米国がAI競争における主導権を維持できるのか、そしてAIチップの需要が持続可能かどうかに疑問を呈している。

1月27日、DeepSeekは、自社サービスに対する「大規模な悪意のある攻撃」のため、一時的にユーザー登録を制限すると発表しました。既存ユーザーは通常通りログイン可能です。

(TechCrunchによると)