DeepSeek, le nom le plus en vogue sur le marché de l'IA aujourd'hui, vient de publier des modèles d'IA multimodaux, prétendant battre le générateur d'images Dall-E 3 d'OpenAI.
Les modèles sont disponibles en téléchargement sur la plateforme Hugging Face, qui fait partie d'une nouvelle suite de modèles que DeepSeek appelle Janus-Pro. Leur taille varie de 1 à 7 milliards de paramètres. Plus le nombre de paramètres est élevé, meilleures sont les performances du modèle.
Janus-Pro peut analyser et générer de nouvelles images. Selon DeepSeek, sur deux benchmarks d'IA GenEval et DPG-Bench, Janus-Pro-7B bat Dall-E 3 ainsi que d'autres modèles comme PixArt-alpha, Emu3-Gen et Stable Diffusion XL.
Cependant, selon TechCrunch, la plupart des modèles Janus-Pro restants ne peuvent analyser que de petites images, avec une résolution maximale de 384 x 384. Néanmoins, les performances du Janus-Pro sont impressionnantes, compte tenu de sa taille compacte.
DeepSeek, une nouvelle startup chinoise fondée en 2023, a soudainement attiré l'attention ces derniers jours après que son chatbot soit arrivé en tête du classement de l'App Store aux États-Unis. Les modèles de langage massifs de la startup, formés à l'aide de techniques informatiques efficaces et rentables, amènent Wall Street à se demander si les États-Unis peuvent maintenir leur avance dans la course à l'IA et si la demande de puces d'IA est durable.
Le 27 janvier, DeepSeek a déclaré qu'il restreindrait temporairement les inscriptions d'utilisateurs en raison d'« attaques malveillantes à grande échelle » ciblant ses services. Les anciens utilisateurs peuvent toujours se connecter comme d'habitude.
(Selon TechCrunch)
Source : https://vietnamnet.vn/deepseek-ra-mat-bo-cong-cu-tao-anh-ai-2367126.html
Comment (0)