Los modelos están disponibles para descargar desde la plataforma Hugging Face, parte de un nuevo conjunto de modelos que DeepSeek llama Janus-Pro. Su tamaño varía entre 1 y 7 mil millones de parámetros. Cuanto mayor sea el número de parámetros, mejor funcionará el modelo.

9rn0s3d3.png
Compare la capacidad de crear imágenes a partir de texto de Janus-Pro y Janus. Foto: DeepSeek

Janus-Pro puede analizar y generar nuevas imágenes. Según DeepSeek, en dos pruebas de rendimiento de IA, GenEval y DPG-Bench, Janus-Pro-7B supera a Dall-E 3, así como a otros modelos como PixArt-alpha, Emu3-Gen y Stable Diffusion XL.

Sin embargo, según TechCrunch, la mayoría de los modelos Janus-Pro restantes solo pueden analizar imágenes pequeñas, con una resolución máxima de 384 x 384. Aun así, el rendimiento del Janus-Pro es impresionante, considerando su tamaño compacto.

DeepSeek, una nueva startup china fundada en 2023, ha atraído repentinamente la atención en los últimos días después de que su chatbot subiera a la cima del ranking de la App Store en los EE. UU. Los modelos de lenguaje masivos de la startup, entrenados utilizando técnicas computacionalmente eficientes y rentables, hacen que Wall Street se pregunte si Estados Unidos puede mantener su liderazgo en la carrera de la IA y si la demanda de chips de IA es sostenible.

El 27 de enero, DeepSeek dijo que restringiría temporalmente los registros de usuarios debido a “ataques maliciosos a gran escala” dirigidos a sus servicios. Los usuarios antiguos aún pueden iniciar sesión como de costumbre.

(Según TechCrunch)