DeepSeek, le nom le plus en vogue sur le marché de l'IA aujourd'hui, vient de publier des modèles d'IA multimodaux, prétendant battre le générateur d'images Dall-E 3 d'OpenAI.
Les modèles, téléchargeables sur la plateforme Hugging Face, font partie d'un nouvel ensemble de modèles baptisé Janus-Pro par DeepSeek. Leur taille varie de 1 à 7 milliards de paramètres. Plus le nombre de paramètres est élevé, plus le modèle est performant.
Janus-Pro peut analyser et générer de nouvelles images. Selon DeepSeek, sur deux benchmarks d'IA, GenEval et DPG-Bench, Janus-Pro-7B surpasse Dall-E 3 ainsi que d'autres modèles tels que PixArt-alpha, Emu3-Gen et Stable Diffusion XL.
Cependant, selon TechCrunch, la plupart des modèles Janus-Pro restants ne peuvent analyser que de petites images, avec une résolution maximale de 384 x 384. Néanmoins, les performances du Janus-Pro sont impressionnantes, compte tenu de sa taille compacte.
DeepSeek, une startup chinoise fondée en 2023, a soudainement attiré l'attention ces derniers jours après que son chatbot a atteint la première place du classement de l'App Store aux États-Unis. Les vastes modèles linguistiques de la startup, entraînés grâce à des techniques informatiques efficaces et rentables, ont amené Wall Street à s'interroger sur la capacité des États-Unis à maintenir leur avance dans la course à l'IA et sur la pérennité de la demande de puces IA.
Le 27 janvier, DeepSeek a annoncé une restriction temporaire des inscriptions d'utilisateurs en raison d'« attaques malveillantes à grande échelle » visant ses services. Les utilisateurs existants pourront continuer à se connecter normalement.
(Selon TechCrunch)
Source : https://vietnamnet.vn/deepseek-ra-mat-bo-cong-cu-tao-anh-ai-2367126.html
Comment (0)