Huaweis großer Schritt nach vorn

Laut SCMP zeigt ein neuer technischer Bericht, dass Huaweis Ascend AI-Prozessor im Test des DeepSeek R1-Modells für künstliche Intelligenz die Leistung von Nvidia-GPUs übertroffen hat. Dieses Ergebnis stellt für das chinesische Unternehmen einen wichtigen Fortschritt dar, da es mit den Technologiekontrollaufträgen der USA konfrontiert ist.

Das gemeinsam von Forschern von Huawei und dem KI-Infrastruktur-Startup SiliconFlow verfasste Dokument beschreibt detailliert die Architektur des Rechenzentrums CloudMatrix 384. Es handelt sich dabei um ein „KI-Supersystem auf einem Chip“, das speziell für die Verarbeitung massiver Arbeitslasten von großen Sprachmodellen (LLMs) entwickelt wurde.

CloudMatrix 384 besteht aus 384 Ascend 910C-Prozessoren und 192 Kunpeng-CPUs, die über ein einheitliches Bussystem mit geringer Latenz und hoher Bandbreite miteinander verbunden sind. Huawei erwartet, dass diese Architektur die Grundlage der KI-Infrastruktur neu gestalten wird.

Das auf dieser Plattform aufgebaute CloudMatrix-Infer-System zeigt beim Einsatz des DeepSeek R1-Modells eine herausragende Leistung. In der Prefill-Phase erreichte das System einen Durchsatz von 6.688 Token/Sekunde pro NPU bei der Verarbeitung einer 4.000-Token-Anfrage eines Benutzers. Diese Leistung entspricht 4,45 Token/Sekunde pro TFLOPS (Billionen Operationen pro Sekunde).

Während der Dekodierungsphase verzeichnete CloudMatrix einen Durchsatz von 1.943 Token/Sekunde pro NPU bei einer Reaktionszeit von weniger als 50 Millisekunden pro Token. Diese Leistung von 1,29 Token/Sekunde pro TFLOPS ist höher als die von Nvidias SGLang-System mit H100-GPUs und auch der H800-GPU-Plattform mit DeepSeek R1.

Laut Zuo Pengfei, dem Hauptautor der Studie und Mitglied des „Genius Youth“-Programms von Huawei, soll der Bericht der Branche helfen, die Fähigkeiten der in China entwickelten Ascend NPU umfassend zu verstehen. Auf der Zhihu-Plattform bekräftigte er, der Bericht stelle die technologischen Fähigkeiten von Huawei CloudMatrix klar unter Beweis.

Huawei hat erstmals technische Details zum KI-Beschleuniger Ascend 910C veröffentlicht. Der Bericht wiederholt auch die jüngsten Äußerungen von Huawei-Gründer Ren Zhengfei, wonach Ascend-Chips ihren US-amerikanischen Pendants noch „eine Generation hinterherhinken“. Er betonte jedoch, dass Huawei durch die Anwendung von Methoden wie „Stacking und Clustering“ eine Rechenleistung erreicht habe, die mit den modernsten KI-Systemen von heute vergleichbar sei.

Unterdessen gab auch Nvidia-CEO Jensen Huang in einem Interview mit CNBC zu, dass es sich bei KI um ein Problem der Parallelverarbeitung handele und dass mehr Prozessoren benötigt würden, wenn nicht genügend Rechenleistung vorhanden sei.

Quelle: https://znews.vn/buoc-tien-lon-cua-huawei-post1562828.html