Vietnam.vn - Nền tảng quảng bá Việt Nam

DeepSeek weckt Neugierde.

Chinesische KI-Unternehmen haben angesichts wachsender Erwartungen an Modellierung der nächsten Generation neue KI-Inferenzmethoden entwickelt.

ZNewsZNews07/04/2025

DeepSeek konzentriert sich auf die Forschung und Entwicklung neuer Modelle, anstatt häufig in den Medien präsent zu sein. Foto: SCMP .

In Zusammenarbeit mit Forschern der Tsinghua-Universität hat DeepSeek eine neue Methode zur Verbesserung der Inferenzleistung großer Sprachmodelle (LLMs) entwickelt. Die Methode, die am Abend des 4. April in einem Forschungsartikel veröffentlicht wurde, hilft LLMs, bessere und schnellere Ergebnisse für häufige Anfragen zu liefern.

Diese Technik kombiniert zwei zuvor erfolgreiche Methoden von DeepSeek. Die eine ist das generative Belohnungsmodell (GRM), das es dem KI-Modell ermöglicht, seine Antworten auf der Grundlage vorheriger Ergebnisse selbst zu bewerten und zu verfeinern, die andere ist die selbstprinzipielle Kritikoptimierung.

Beide Methoden basieren auf dem „Selbstlern“-Aspekt der KI, wodurch die Abhängigkeit von direktem menschlichem Feedback oder Anleitung verringert wird, mit dem Ziel, Ergebnisse zu liefern, die den menschlichen Erwartungen näherkommen.

Laut Forschern erzielt DeepSeek-GRM trotz seiner Neuartigkeit herausragende Ergebnisse und kann sich mit den bekanntesten und effektivsten KI-Modellen messen. DeepSeek plant, die GRM-Modelle als Open Source zu veröffentlichen, hat aber noch keinen konkreten Zeitrahmen genannt.

Nachdem DeepSeek mit seinem V3-Plattformmodell und dem R1-Inferenzmodell weltweit für Aufsehen gesorgt hatte, veröffentlichte das Unternehmen diese wissenschaftliche Arbeit im Online -Wissenschaftsarchiv arXiv und weckte damit Neugierde auf die nächsten Schritte des Unternehmens.

Reuters prognostiziert, dass DeepSeek-R2, der Nachfolger von R1, aufgrund der anhaltenden Beliebtheit seines Vorgängers im April auf den Markt kommen könnte. DeepSeek-R1 sorgte zuvor weltweit für Furore in der Tech-Welt, da er im Verhältnis zu seinen Kosten ein überragendes Preis-Leistungs-Verhältnis bot und sich damit als konkurrenzfähig mit aktuellen Spitzenmodellen erwies.

DeepSeek hat sich zu den Gerüchten bisher nicht geäußert. Laut lokalen Quellen dementierte jedoch ein Kundendienstmitarbeiter von DeepSeek die Informationen in einem Gruppenchat mit Unternehmenskunden.

Das 2023 in Hangzhou vom Unternehmer Liang Wenfeng gegründete Unternehmen DeepSeek hat in den letzten Monaten schnell weltweite Aufmerksamkeit erregt. Anstatt jedoch von seinem Bekanntheitsgrad zu profitieren, konzentriert das Unternehmen seine Ressourcen auf Forschung und Entwicklung.

Zuvor hatte DeepSeek sein V3-Modell aktualisiert und die Version DeepSeek-V3-0324 veröffentlicht. Laut Ankündigung bietet dieses Update verbesserte Schlussfolgerungsfunktionen, Optimierungen für die Entwicklung von Web-Benutzeroberflächen und verbesserte Fähigkeiten im Bereich der chinesischen Schriftzeichen.

Im Februar veröffentlichte das Startup außerdem fünf Code-Repositories als Open Source und bekräftigte damit sein Engagement für „Fortschritt mit voller Transparenz“. Ebenfalls in diesem Monat kündigte das Unternehmen eine technische Studie zu „nativer spärlicher Aufmerksamkeit“ an, die dazu beiträgt, die Leistung von LLMs bei der Verarbeitung massiver Datenmengen zu verbessern.

DeepSeek gilt als Symbol für die Dynamik der chinesischen KI-Industrie, gerade in einer Zeit, in der die USA versuchen, die technologische Entwicklung des Landes einzudämmen.

Quelle: https://znews.vn/deepseek-gay-to-mo-post1543900.html


Kommentar (0)

Hinterlasse einen Kommentar, um deine Gefühle zu teilen!

Gleiche Kategorie

Gleicher Autor

Erbe

Figur

Doanh nghiệp

Aktuelles

Politisches System

Lokal

Produkt

Happy Vietnam
Die Räucherstäbchen trocknen lassen.

Die Räucherstäbchen trocknen lassen.

Durch Zweige und Geschichte

Durch Zweige und Geschichte

Wettbewerb

Wettbewerb