DeepSeek, el nombre más destacado en el mercado de IA actual, acaba de lanzar modelos de IA multimodales y afirma superar al generador de imágenes Dall-E 3 de OpenAI.
Los modelos, disponibles para descargar desde la plataforma Hugging Face, forman parte de un nuevo conjunto de modelos que DeepSeek denomina Janus-Pro. Su tamaño varía entre 1000 y 7000 millones de parámetros. Cuanto mayor sea el número de parámetros, mejor será el rendimiento del modelo.
Janus-Pro puede analizar y generar nuevas imágenes. Según DeepSeek, en dos benchmarks de IA, GenEval y DPG-Bench, Janus-Pro-7B supera a Dall-E 3 y a otros modelos como PixArt-alpha, Emu3-Gen y Stable Diffusion XL.
Sin embargo, según TechCrunch, la mayoría de los modelos Janus-Pro restantes solo pueden analizar imágenes pequeñas, con una resolución máxima de 384 x 384. Aun así, el rendimiento del Janus-Pro es impresionante, considerando su tamaño compacto.
DeepSeek, una startup china fundada en 2023, ha atraído la atención en los últimos días tras el ascenso repentino de su chatbot a la cima del ranking de la App Store en Estados Unidos. Los amplios modelos de lenguaje de la startup, entrenados con técnicas computacionalmente eficientes y rentables, han llevado a Wall Street a cuestionar si Estados Unidos puede mantener su liderazgo en la carrera de la IA y si la demanda de chips de IA es sostenible.
El 27 de enero, DeepSeek anunció que restringiría temporalmente el registro de usuarios debido a "ataques maliciosos a gran escala" contra sus servicios. Los usuarios existentes podrán seguir iniciando sesión con normalidad.
(Según TechCrunch)
[anuncio_2]
Fuente: https://vietnamnet.vn/deepseek-ra-mat-bo-cong-cu-tao-anh-ai-2367126.html
Kommentar (0)