Говорят, что модель искусственного интеллекта s1, созданная американскими исследователями, имеет эксплуатационную стоимость всего в 50 долларов, но обеспечивает возможности рассуждения, эквивалентные гораздо более дорогой модели o1 от OpenAI. Появление s1 последовало за впечатляющим успехом DeepSeek, который в последние дни вызвал переполох в Кремниевой долине.
Война «дешевого ИИ» становится все более оживленной с появлением DeepSeek
Команда выложила исходный код s1 в открытый доступ на GitHub вместе с кодом и данными, использованными для построения модели. В статье, опубликованной на прошлой неделе, объясняется процесс разработки модели, подчеркивая умные методы, которые они использовали. Вместо того чтобы начинать с нуля с новой моделью рассуждений, команда использовала существующую языковую модель и выполнила процесс «тонкой настройки», извлекая возможности рассуждений из экспериментальной модели Gemini 2.0 Flash Thinking Experimental от Google.
Эксплуатационные расходы ИИ составляют «менее 50 долларов»
Обучение модели s1 заняло всего 30 минут с использованием 16 графических процессоров Nvidia H100. Хотя каждый графический процессор стоит около 25 000 долларов, стоимость аренды процесса составила менее 50 долларов благодаря облачным вычислительным сервисам. В частности, команда обнаружила полезный трюк: указание модели «ждать» перед выдачей окончательного ответа, что улучшило ее рассуждения и дало лучшие решения.
Хотя s1 достиг замечательных результатов при низкой стоимости, есть опасения по поводу масштабируемости модели. Использование модели Google в качестве «учителя» поднимает вопросы о способности s1 конкурировать с ведущими моделями ИИ на сегодняшний день. Google, вероятно, будет пристально следить за ситуацией, особенно в свете продолжающегося судебного разбирательства между OpenAI и DeepSeek.
Источник: https://thanhnien.vn/my-tao-ra-mo-hinh-ai-sieu-re-hoat-dong-tuong-tu-gpt-o1-185250207182535164.htm
Комментарий (0)