Les modèles, téléchargeables sur la plateforme Hugging Face, font partie d'un nouvel ensemble de modèles baptisé Janus-Pro par DeepSeek. Leur taille varie de 1 à 7 milliards de paramètres. Plus le nombre de paramètres est élevé, plus le modèle est performant.

9rn0s3d3.png
Comparaison de Janus-Pro et de la capacité de Janus à générer des images à partir de texte. Photo : DeepSeek

Janus-Pro peut analyser et générer de nouvelles images. Selon DeepSeek, sur deux benchmarks d'IA, GenEval et DPG-Bench, Janus-Pro-7B surpasse Dall-E 3 ainsi que d'autres modèles tels que PixArt-alpha, Emu3-Gen et Stable Diffusion XL.

Cependant, selon TechCrunch, la plupart des modèles Janus-Pro restants ne peuvent analyser que de petites images, avec une résolution maximale de 384 x 384. Néanmoins, les performances du Janus-Pro sont impressionnantes, compte tenu de sa taille compacte.

DeepSeek, une startup chinoise fondée en 2023, a soudainement attiré l'attention ces derniers jours après que son chatbot a atteint la première place du classement de l'App Store aux États-Unis. Les vastes modèles linguistiques de la startup, entraînés grâce à des techniques informatiques efficaces et rentables, ont amené Wall Street à s'interroger sur la capacité des États-Unis à maintenir leur avance dans la course à l'IA et sur la pérennité de la demande de puces IA.

Le 27 janvier, DeepSeek a annoncé une restriction temporaire des inscriptions d'utilisateurs en raison d'« attaques malveillantes à grande échelle » visant ses services. Les utilisateurs existants pourront continuer à se connecter normalement.

(Selon TechCrunch)