Модели доступны для загрузки с платформы Hugging Face, которая является частью нового набора моделей, который DeepSeek называет Janus-Pro. Их размер варьируется от 1 до 7 миллиардов параметров. Чем больше число параметров, тем лучше работает модель.

9rn0s3d3.png
Сравните возможности создания изображений из текста в Janus-Pro и Janus. Фото: DeepSeek

Janus-Pro может анализировать и генерировать новые изображения. По данным DeepSeek, в двух тестах ИИ GenEval и DPG-Bench Janus-Pro-7B превосходит Dall-E 3, а также другие модели, такие как PixArt-alpha, Emu3-Gen и Stable Diffusion XL.

Однако, по данным TechCrunch, большинство оставшихся моделей Janus-Pro могут анализировать только небольшие изображения с максимальным разрешением 384 x 384. Тем не менее, производительность Janus-Pro впечатляет, учитывая его компактные размеры.

DeepSeek, новый китайский стартап, основанный в 2023 году, в последние дни неожиданно привлек к себе внимание после того, как его чат-бот поднялся на вершину рейтинга App Store в США. Огромные языковые модели стартапа, обученные с использованием эффективных с точки зрения вычислений и экономически выгодных методов, заставляют Уолл-стрит сомневаться в том, смогут ли США сохранить лидерство в гонке за ИИ и будет ли устойчивым спрос на ИИ-чипы.

27 января DeepSeek заявила, что временно ограничит регистрацию пользователей из-за «масштабных вредоносных атак», нацеленных на ее сервисы. Старые пользователи могут входить в систему как обычно.

(По данным TechCrunch)