DeepSeek, el nombre más destacado en el mercado de IA actual, acaba de lanzar modelos de IA multimodales y afirma superar al generador de imágenes Dall-E 3 de OpenAI.
Los modelos están disponibles para descargar desde la plataforma Hugging Face, parte de un nuevo conjunto de modelos que DeepSeek llama Janus-Pro. Su tamaño varía entre 1 y 7 mil millones de parámetros. Cuanto mayor sea el número de parámetros, mejor funcionará el modelo.
Janus-Pro puede analizar y generar nuevas imágenes. Según DeepSeek, en dos pruebas de rendimiento de IA, GenEval y DPG-Bench, Janus-Pro-7B supera a Dall-E 3, así como a otros modelos como PixArt-alpha, Emu3-Gen y Stable Diffusion XL.
Sin embargo, según TechCrunch, la mayoría de los modelos Janus-Pro restantes solo pueden analizar imágenes pequeñas, con una resolución máxima de 384 x 384. Aun así, el rendimiento del Janus-Pro es impresionante, considerando su tamaño compacto.
DeepSeek, una nueva startup china fundada en 2023, ha atraído repentinamente la atención en los últimos días después de que su chatbot subiera a la cima del ranking de la App Store en los EE. UU. Los modelos de lenguaje masivos de la startup, entrenados utilizando técnicas computacionalmente eficientes y rentables, hacen que Wall Street se pregunte si Estados Unidos puede mantener su liderazgo en la carrera de la IA y si la demanda de chips de IA es sostenible.
El 27 de enero, DeepSeek dijo que restringiría temporalmente los registros de usuarios debido a “ataques maliciosos a gran escala” dirigidos a sus servicios. Los usuarios antiguos aún pueden iniciar sesión como de costumbre.
(Según TechCrunch)
[anuncio_2]
Fuente: https://vietnamnet.vn/deepseek-ra-mat-bo-cong-cu-tao-anh-ai-2367126.html
Kommentar (0)