Les modèles sont disponibles en téléchargement sur la plateforme Hugging Face, qui fait partie d'une nouvelle suite de modèles que DeepSeek appelle Janus-Pro. Leur taille varie de 1 à 7 milliards de paramètres. Plus le nombre de paramètres est élevé, meilleures sont les performances du modèle.

9rn0s3d3.png
Comparez la capacité de créer des images à partir de texte de Janus-Pro et Janus. Photo : DeepSeek

Janus-Pro peut analyser et générer de nouvelles images. Selon DeepSeek, sur deux benchmarks d'IA GenEval et DPG-Bench, Janus-Pro-7B bat Dall-E 3 ainsi que d'autres modèles comme PixArt-alpha, Emu3-Gen et Stable Diffusion XL.

Cependant, selon TechCrunch, la plupart des modèles Janus-Pro restants ne peuvent analyser que de petites images, avec une résolution maximale de 384 x 384. Néanmoins, les performances du Janus-Pro sont impressionnantes, compte tenu de sa taille compacte.

DeepSeek, une nouvelle startup chinoise fondée en 2023, a soudainement attiré l'attention ces derniers jours après que son chatbot soit arrivé en tête du classement de l'App Store aux États-Unis. Les modèles de langage massifs de la startup, formés à l'aide de techniques informatiques efficaces et rentables, amènent Wall Street à se demander si les États-Unis peuvent maintenir leur avance dans la course à l'IA et si la demande de puces d'IA est durable.

Le 27 janvier, DeepSeek a déclaré qu'il restreindrait temporairement les inscriptions d'utilisateurs en raison d'« attaques malveillantes à grande échelle » ciblant ses services. Les anciens utilisateurs peuvent toujours se connecter comme d'habitude.

(Selon TechCrunch)