Die Modelle, die auf der Hugging Face-Plattform zum Download bereitstehen, sind Teil einer neuen Modellreihe, die DeepSeek Janus-Pro nennt. Ihre Größe reicht von einer bis zu sieben Milliarden Parametern. Je größer die Anzahl der Parameter, desto leistungsfähiger ist das Modell.

9rn0s3d3.png
Vergleich der Fähigkeit von Janus-Pro und Janus, Bilder aus Text zu generieren. Foto: DeepSeek

Janus-Pro kann Bilder analysieren und neue generieren. Laut DeepSeek übertrifft Janus-Pro-7B in den beiden KI-Benchmarks GenEval und DPG-Bench den Dall-E 3 sowie andere Modelle wie PixArt-Alpha, Emu3-Gen und Stable Diffusion XL.

Laut TechCrunch können die meisten der verbleibenden Janus-Pro-Modelle jedoch nur kleine Bilder mit einer maximalen Auflösung von 384 x 384 analysieren. Dennoch ist die Leistung des Janus-Pro angesichts seiner kompakten Größe beeindruckend.

DeepSeek, ein 2023 gegründetes chinesisches Startup, erregte in den letzten Tagen plötzlich Aufmerksamkeit, nachdem sein Chatbot in den USA an die Spitze der App-Store-Rankings gelangte. Die umfangreichen Sprachmodelle des Startups, die mit rechnerisch effizienten und kostengünstigen Techniken trainiert wurden, haben die Wall Street zu der Frage veranlasst, ob die USA ihre Führung im KI-Rennen halten können und ob die Nachfrage nach KI-Chips nachhaltig ist.

Am 27. Januar gab DeepSeek bekannt, dass die Nutzerregistrierung aufgrund „groß angelegter böswilliger Angriffe“ auf seine Dienste vorübergehend eingeschränkt werde. Bestehende Nutzer können sich weiterhin wie gewohnt anmelden.

(Laut TechCrunch)