Das von amerikanischen Forschern entwickelte KI-Modell (künstliche Intelligenz) s1 soll lediglich 50 US-Dollar kosten, bietet aber die gleichen Schlussfolgerungsfähigkeiten wie das deutlich teurere o1-Modell von OpenAI. Das Erscheinen von s1 folgt auf den beeindruckenden Erfolg von DeepSeek, das in den letzten Tagen im Silicon Valley für Aufsehen gesorgt hat.
Der Krieg um „billige KI“ wird seit dem Aufkommen von DeepSeek immer lebhafter
Das Team hat den Quellcode für s1 zusammen mit dem Code und den Daten, die zum Erstellen des Modells verwendet wurden, auf GitHub öffentlich zugänglich gemacht. Ein letzte Woche veröffentlichtes Dokument erläutert den Entwicklungsprozess des Modells und hebt die cleveren Techniken hervor, die dabei zum Einsatz kamen. Anstatt mit einem neuen Denkmodell von Grund auf neu zu beginnen, verwendete das Team ein bestehendes Sprachmodell und führte einen „Feintuning“-Prozess durch, indem es die Denkfähigkeiten aus Googles experimentellem Modell „Gemini 2.0 Flash Thinking“ extrahierte.
Die Betriebskosten der KI liegen unter 50 US-Dollar
Das Training des s1-Modells dauerte mit 16 Nvidia H100 GPUs nur 30 Minuten. Obwohl jede GPU rund 25.000 US-Dollar kostet, betrugen die Mietkosten dank Cloud-Computing-Diensten weniger als 50 US-Dollar. Insbesondere entdeckte das Team einen nützlichen Trick: Es wies das Modell an, vor der endgültigen Antwort zu „warten“. Dies verbesserte seine Argumentation und führte zu besseren Lösungen.
Obwohl der S1 zu geringen Kosten bemerkenswerte Ergebnisse erzielt hat, bestehen Bedenken hinsichtlich der Skalierbarkeit des Modells. Die Verwendung des Google-Modells als „Lehrer“ wirft Fragen zur Wettbewerbsfähigkeit des S1 mit den führenden KI-Modellen von heute auf. Google wird die Situation voraussichtlich genau beobachten, insbesondere angesichts des laufenden Rechtsstreits zwischen OpenAI und DeepSeek.
[Anzeige_2]
Quelle: https://thanhnien.vn/my-tao-ra-mo-hinh-ai-sieu-re-hoat-dong-tuong-tu-gpt-o1-185250207182535164.htm
Kommentar (0)