AI-modellen (kunstig intelligens) s1, som er laget av amerikanske forskere, skal visstnok ha en driftskostnad på bare 50 USD, men tilbyr resonneringsmuligheter tilsvarende OpenAIs o1-modell, som koster mye mer. S1s fremvekst kommer etter den imponerende suksessen til DeepSeek, som har skapt oppstyr i Silicon Valley de siste dagene.
Krigen om «billig AI» har blitt hetere siden DeepSeek dukket opp.
Teamet har offentliggjort kildekoden for s1 på GitHub, sammen med koden og dataene som ble brukt til å bygge modellen. En artikkel publisert forrige uke forklarer prosessen med å utvikle modellen, og fremhever de smarte teknikkene de brukte. I stedet for å starte fra bunnen av med en ny resonneringsmodell, brukte teamet en eksisterende språkmodell og utførte en «finjusteringsprosess» ved å destillere resonneringsmulighetene fra Googles Gemini 2.0 Flash Thinking Experimental-modell.
Driftskostnader for kunstig intelligens rett under 50 dollar
Det tok bare 30 minutter å trene s1-modellen med 16 Nvidia H100 GPU-er. Selv om hver GPU koster rundt 25 000 dollar, var kostnaden for å leie prosessen under 50 dollar takket være skytjenester. Spesielt oppdaget teamet et nyttig triks: å instruere modellen til å «vente» før de ga et endelig svar, noe som forbedret resonnementet og resulterte i bedre løsninger.
Selv om s1 har oppnådd betydelige fremskritt til en lav kostnad, er det bekymringer om skalerbarheten. Å bruke Googles modell som en «lærer» reiser spørsmål om dens evne til å konkurrere med dagens ledende AI-modeller. Google vil sannsynligvis følge nøye med på situasjonen, spesielt gitt den pågående rettstvisten mellom OpenAI og DeepSeek.
[annonse_2]
Kilde: https://thanhnien.vn/my-tao-ra-mo-hinh-ai-sieu-re-hoat-dong-tuong-tu-gpt-o1-185250207182535164.htm
Kommentar (0)