Модели, доступные для скачивания на платформе Hugging Face, входят в новый набор моделей, который DeepSeek называет Janus-Pro. Они содержат от 1 до 7 миллиардов параметров. Чем больше параметров, тем лучше работает модель.

9rn0s3d3.png
Сравнение возможностей Janus-Pro и Janus по генерации изображений из текста. Фото: DeepSeek

Janus-Pro может анализировать и генерировать новые изображения. По данным DeepSeek, в двух бенчмарках искусственного интеллекта GenEval и DPG-Bench Janus-Pro-7B превосходит Dall-E 3, а также другие модели, такие как PixArt-alpha, Emu3-Gen и Stable Diffusion XL.

Однако, по данным TechCrunch, большинство оставшихся моделей Janus-Pro могут анализировать только небольшие изображения с максимальным разрешением 384 x 384. Тем не менее, производительность Janus-Pro впечатляет, учитывая его компактные размеры.

Китайский стартап DeepSeek, основанный в 2023 году, в последние дни неожиданно привлёк к себе внимание после того, как его чат-бот поднялся на вершину рейтингов App Store в США. Масштабные языковые модели стартапа, обучаемые с использованием вычислительно эффективных и экономичных методов, заставили Уолл-стрит задуматься о том, смогут ли США сохранить лидерство в гонке ИИ и насколько устойчив спрос на ИИ-чипы.

27 января DeepSeek объявила о временном ограничении регистрации пользователей в связи с «масштабными вредоносными атаками» на свои сервисы. Существующие пользователи по-прежнему смогут входить в систему в обычном режиме.

(По данным TechCrunch)