Het door Amerikaanse onderzoekers ontwikkelde AI (kunstmatige intelligentie) model s1 zou slechts 50 dollar kosten, maar biedt redeneermogelijkheden die vergelijkbaar zijn met die van OpenAI's o1-model, dat veel duurder is. De introductie van s1 volgt op het indrukwekkende succes van DeepSeek, dat de afgelopen dagen voor ophef heeft gezorgd in Silicon Valley.
De 'goedkope AI'-oorlog laait op sinds de opkomst van DeepSeek
Het team heeft de broncode van s1 openbaar gemaakt op GitHub, samen met de code en data die gebruikt zijn om het model te bouwen. Een vorige week gepubliceerd artikel legt het proces van de ontwikkeling van het model uit en benadrukt de slimme technieken die ze gebruikt hebben. In plaats van helemaal opnieuw te beginnen met een nieuw redeneermodel, gebruikte het team een bestaand taalmodel en voerde een "fine-tuning" uit door de redeneermogelijkheden te distilleren uit Google's Gemini 2.0 Flash Thinking Experimental-model.
AI-bedrijfskosten net geen $ 50
Het trainen van het s1-model duurde slechts 30 minuten en maakte gebruik van 16 Nvidia H100 GPU's. Hoewel elke GPU ongeveer $ 25.000 kost, kostte het huren van het proces minder dan $ 50 dankzij cloudcomputingdiensten. Het team ontdekte met name een handige truc: het model de opdracht geven om te "wachten" voordat het een definitief antwoord gaf, wat de redenering verbeterde en resulteerde in betere oplossingen.
Hoewel de s1 aanzienlijke winst heeft geboekt tegen lage kosten, zijn er zorgen over de schaalbaarheid ervan. Het gebruik van Googles model als "leraar" roept vragen op over het vermogen van Google om te concurreren met de huidige toonaangevende AI-modellen. Google zal de situatie waarschijnlijk nauwlettend in de gaten houden, vooral gezien de lopende rechtszaak tussen OpenAI en DeepSeek.
Bron: https://thanhnien.vn/my-tao-ra-mo-hinh-ai-sieu-re-hoat-dong-tuong-tu-gpt-o1-185250207182535164.htm
Reactie (0)