AI-modellen (artificiell intelligens) s1 som skapats av amerikanska forskare sägs ha en driftskostnad på endast 50 USD men erbjuder resonemangsfunktioner motsvarande OpenAI:s o1-modell som kostar mycket mer. s1:s framträdande kommer efter DeepSeeks imponerande framgångar som har orsakat uppståndelse i Silicon Valley de senaste dagarna.
Kriget mot "billig AI" hettar upp sedan DeepSeek kom
Teamet har publicerat källkoden för s1 på GitHub, tillsammans med koden och data som använts för att bygga modellen. En artikel som publicerades förra veckan förklarar processen för att utveckla modellen och lyfter fram de smarta tekniker de använde. Istället för att börja från början med en ny resonemangsmodell använde teamet en befintlig språkmodell och utförde en "finjusteringsprocess" genom att destillera resonemangsförmågorna från Googles Gemini 2.0 Flash Thinking Experimental-modell.
AI-driftskostnader strax under 50 dollar
Att träna s1-modellen tog bara 30 minuter med 16 Nvidia H100-grafikkort. Även om varje grafikkort kostar cirka 25 000 dollar, var kostnaden för att hyra processen under 50 dollar tack vare molntjänster. Teamet upptäckte särskilt ett användbart knep: att instruera modellen att "vänta" innan de gav ett slutgiltigt svar, vilket förbättrade dess resonemang och resulterade i bättre lösningar.
Även om s1 har gjort betydande framsteg till en låg kostnad finns det oro kring dess skalbarhet. Att använda Googles modell som en "lärare" väcker frågor om dess förmåga att konkurrera med dagens ledande AI-modeller. Google kommer sannolikt att hålla ett vakande öga på situationen, särskilt med tanke på den pågående tvisten mellan OpenAI och DeepSeek.
[annons_2]
Källa: https://thanhnien.vn/my-tao-ra-mo-hinh-ai-sieu-re-hoat-dong-tuong-tu-gpt-o1-185250207182535164.htm
Kommentar (0)