Az amerikai kutatók által létrehozott s1 mesterséges intelligencia modell állítólag mindössze 50 dolláros üzemeltetési költséggel működik, de az OpenAI o1 modelljével egyenértékű logikai képességeket kínál, amely jóval drágább. Az s1 megjelenése a DeepSeek lenyűgöző sikerét követően történt, amely az elmúlt napokban nagy port kavart a Szilícium-völgyben.
A DeepSeek megjelenése óta egyre hevesebb az „olcsó mesterséges intelligencia” háborúja.
A csapat nyilvánossá tette az s1 forráskódját a GitHubon, a modell felépítéséhez használt kóddal és adatokkal együtt. A múlt héten megjelent tanulmány ismerteti a modell fejlesztésének folyamatát, kiemelve az általuk használt okos technikákat. Ahelyett, hogy a nulláról kezdték volna egy új gondolkodási modellel, a csapat egy meglévő nyelvi modellt használt, és „finomhangolási” folyamatot hajtott végre a Google Gemini 2.0 Flash Thinking Experimental modelljének gondolkodási képességeinek lepárlásával.
A mesterséges intelligencia üzemeltetési költsége valamivel „50 dollár alatt”
Az s1 modell betanítása mindössze 30 percet vett igénybe, 16 Nvidia H100 GPU használatával. Bár egy GPU körülbelül 25 000 dollárba kerül, a folyamat bérlésének költsége 50 dollár alatt volt a felhőalapú számítástechnikai szolgáltatásoknak köszönhetően. A csapat felfedezett egy hasznos trükköt: arra utasították a modellt, hogy „várjon”, mielőtt megadná a végső választ, ami javította az érvelését és jobb megoldásokat eredményezett.
Bár az s1 jelentős eredményeket ért el alacsony költségek mellett, aggályok merülnek fel a skálázhatóságával kapcsolatban. A Google modelljének „tanárként” való használata kérdéseket vet fel azzal kapcsolatban, hogy képes-e versenyezni a mai vezető MI-modellekkel. A Google valószínűleg szorosan figyelemmel fogja kísérni a helyzetet, különösen az OpenAI és a DeepSeek között folyamatban lévő per miatt.
[hirdetés_2]
Forrás: https://thanhnien.vn/my-tao-ra-mo-hinh-ai-sieu-re-hoat-dong-tuong-tu-gpt-o1-185250207182535164.htm
Hozzászólás (0)