Los modelos, disponibles para descargar desde la plataforma Hugging Face, forman parte de un nuevo conjunto de modelos que DeepSeek denomina Janus-Pro. Su tamaño varía entre 1000 y 7000 millones de parámetros. Cuanto mayor sea el número de parámetros, mejor será el rendimiento del modelo.

9rn0s3d3.png
Comparación de la capacidad de Janus-Pro y Janus para generar imágenes a partir de texto. Foto: DeepSeek

Janus-Pro puede analizar y generar nuevas imágenes. Según DeepSeek, en dos benchmarks de IA, GenEval y DPG-Bench, Janus-Pro-7B supera a Dall-E 3 y a otros modelos como PixArt-alpha, Emu3-Gen y Stable Diffusion XL.

Sin embargo, según TechCrunch, la mayoría de los modelos Janus-Pro restantes solo pueden analizar imágenes pequeñas, con una resolución máxima de 384 x 384. Aun así, el rendimiento del Janus-Pro es impresionante, considerando su tamaño compacto.

DeepSeek, una startup china fundada en 2023, ha atraído la atención en los últimos días tras el ascenso repentino de su chatbot a la cima del ranking de la App Store en Estados Unidos. Los amplios modelos de lenguaje de la startup, entrenados con técnicas computacionalmente eficientes y rentables, han llevado a Wall Street a cuestionar si Estados Unidos puede mantener su liderazgo en la carrera de la IA y si la demanda de chips de IA es sostenible.

El 27 de enero, DeepSeek anunció que restringiría temporalmente el registro de usuarios debido a "ataques maliciosos a gran escala" contra sus servicios. Los usuarios existentes podrán seguir iniciando sesión con normalidad.

(Según TechCrunch)