Модель искусственного интеллекта (ИИ) S1, созданная американскими исследователями, по имеющимся данным, обойдется всего в 50 долларов США, но при этом обладает возможностями рассуждения, эквивалентными модели O1 от OpenAI, которая стоит гораздо дороже. Появление S1 произошло после впечатляющего успеха DeepSeek, который в последние дни вызвал ажиотаж в Кремниевой долине.
Война «дешевого ИИ» разгорается с появлением DeepSeek
Команда опубликовала исходный код s1 на GitHub вместе с кодом и данными, использованными для построения модели. В статье, опубликованной на прошлой неделе, описывается процесс разработки модели, описывая использованные ими умные методы. Вместо того, чтобы начинать с нуля с новой модели рассуждений, команда использовала существующую языковую модель и провела процесс «тонкой настройки», используя возможности рассуждений из экспериментальной модели Gemini 2.0 Flash Thinking Experimental от Google.
Эксплуатационные расходы на ИИ составляют «чуть меньше 50 долларов»
Обучение модели s1 заняло всего 30 минут с использованием 16 видеокарт Nvidia H100. Хотя каждая видеокарта стоит около 25 000 долларов США, стоимость аренды всего процесса составила менее 50 долларов США благодаря сервисам облачных вычислений. В частности, команда обнаружила полезный трюк: дала модели команду «ждать» перед выдачей окончательного ответа, что улучшило её рассуждения и привело к получению более качественных решений.
Несмотря на то, что S1 добился значительных результатов при низкой стоимости, существуют опасения по поводу его масштабируемости. Использование модели Google в качестве «учителя» ставит под сомнение её способность конкурировать с ведущими современными моделями искусственного интеллекта. Google, вероятно, будет внимательно следить за ситуацией, особенно учитывая продолжающийся судебный процесс между OpenAI и DeepSeek.
Источник: https://thanhnien.vn/my-tao-ra-mo-hinh-ai-sieu-re-hoat-dong-tuong-tu-gpt-o1-185250207182535164.htm
Комментарий (0)