In einer Antwort an CNBC bezeichnete ein Sprecher von Nvidia das R1-Modell von DeepSeek als „einen bemerkenswerten Fortschritt im Bereich der KI“. Die Arbeit von DeepSeek zeigt, wie mithilfe von Test Time Scaling-Techniken neue Modelle erstellt werden können. Bei der von Nvidia vorgeschlagenen Test Time Scaling-Technik liefert ein vollständig trainiertes KI-Modell bessere Antworten, wenn es mehr Zeit mit dem „Argumentieren“ verbringt, während es Vorhersagen trifft oder Bilder oder Text generiert.

Deepseek-Sipa
Das chinesische KI-Startup DeepSeek erregt die Aufmerksamkeit der globalen Tech-Welt. Foto: Sipa

Nvidias Kommentare kommen, nachdem DeepSeek R1 veröffentlicht hat, ein Open-Source-Inferenzmodell, das nachweislich die besten US-Modelle übertrifft. Die Kosten für das Training von R1 betrugen laut DeepSeek weniger als 6 Millionen Dollar, ein Bruchteil der Milliarden Dollar, die Silicon Valley für die Entwicklung seiner KI-Modelle ausgibt.

Der DeepSeek-„Schock“ ließ die Technologieaktien weltweit abstürzen. Am 27. Januar verlor der Aktienkurs von Nvidia 17 Prozent an Wert. Das entspricht einem „Verlust“ der Marktkapitalisierung von 600 Milliarden Dollar und stellt den größten Verlust in der Geschichte der US-Unternehmen dar.

Ein anderer großer Name in der KI-Welt – Yann LeCun, Chef-KI- Wissenschaftler bei Meta – lobte DeepSeek ebenfalls. Er sagte, es zeige, dass „Open-Source-Modelle proprietäre Modelle übertreffen“. „Sie entwickeln neue Ideen und bauen auf der Arbeit anderer auf. Da ihre Arbeit öffentlich und Open Source ist, kann jeder davon profitieren. Das ist die Stärke von Open Research und Open Source“, schrieb er auf Threads.

Die Aussage von Nvidia kann dahingehend verstanden werden, dass der Durchbruch von DeepSeek mehr Arbeitsplätze für die Grafikprozessoren (GPUs) des Unternehmens schafft. Für die Inferenz sei eine riesige Anzahl an GPUs erforderlich, erklärte ein Sprecher von Nvidia. Darüber hinaus behauptete diese Person, dass die von DeepSeek verwendeten GPUs den US-Exportkontrollbestimmungen vollständig entsprechen.

Analysten fragen sich, ob die Milliardeninvestitionen von Unternehmen wie Microsoft, Google und Meta in die KI-Infrastruktur verschwendet werden, wenn ähnliche Ergebnisse zu geringeren Kosten erzielt werden können.

Anfang Januar kündigte Microsoft an, bis 2025 allein für die KI-Infrastruktur 80 Milliarden US-Dollar auszugeben, während Meta-CEO Mark Zuckerberg kürzlich erklärte, er plane in diesem Jahr im Rahmen einer umfassenderen KI-Strategie Investitionen in Höhe von 60 bis 65 Milliarden US-Dollar. Zuckerberg selbst ist ein Befürworter von Open-Source-Modellen.

Im September 2024 sagte er, das Ziel der nächsten 10–15 Jahre bestehe darin, eine neue Generation offener Plattformen zu schaffen und offenen Plattformen zum „Sieg“ zu verhelfen, was zu einer dynamischeren Technologiebranche führe.

(Laut Insider, CNBC)