Die Modelle stehen auf der Hugging Face-Plattform zum Download bereit und sind Teil einer neuen Modellsuite, die DeepSeek Janus-Pro nennt. Ihre Größe reicht von 1 bis 7 Milliarden Parametern. Je größer die Anzahl der Parameter, desto besser ist die Leistung des Modells.

9rn0s3d3.png
Vergleichen Sie die Fähigkeit von Janus-Pro und Janus, Bilder aus Text zu erstellen. Foto: DeepSeek

Janus-Pro kann neue Bilder analysieren und generieren. Laut DeepSeek schlägt Janus-Pro-7B bei zwei KI-Benchmarks, GenEval und DPG-Bench, Dall-E 3 sowie andere Modelle wie PixArt-alpha, Emu3-Gen und Stable Diffusion XL.

Laut TechCrunch können die meisten der verbleibenden Janus-Pro-Modelle jedoch nur kleine Bilder mit einer maximalen Auflösung von 384 x 384 analysieren. Dennoch ist die Leistung des Janus-Pro angesichts seiner kompakten Größe beeindruckend.

DeepSeek, ein neues chinesisches Startup, das 2023 gegründet wurde, hat in den letzten Tagen plötzlich Aufmerksamkeit erregt, nachdem sein Chatbot an die Spitze der App Store-Rankings in den USA aufgestiegen war. Die umfangreichen Sprachmodelle des Startups, die mit rechnerisch effizienten und kostengünstigen Techniken trainiert wurden, lassen an der Wall Street daran zweifeln, ob die USA ihre Führung im KI-Rennen halten können und ob die Nachfrage nach KI-Chips nachhaltig ist.

Am 27. Januar teilte DeepSeek mit, dass es die Benutzerregistrierungen aufgrund „groß angelegter böswilliger Angriffe“ auf seine Dienste vorübergehend einschränken werde. Alte Benutzer können sich weiterhin wie gewohnt anmelden.

(Laut TechCrunch)