Большой шаг вперед Huawei

По данным SCMP , новый технический отчет показывает, что процессор Huawei Ascend AI превзошел производительность графических процессоров Nvidia в тесте модели искусственного интеллекта DeepSeek R1. Этот результат знаменует собой важный шаг вперед для китайской компании в контексте выполнения заказов по контролю технологий из США.

В статье, написанной совместно исследователями из Huawei и стартапа по разработке инфраструктуры ИИ SiliconFlow, подробно описывается архитектура центра обработки данных CloudMatrix 384. Это «суперсистема ИИ на чипе», специально разработанная для обработки огромных рабочих нагрузок от больших языковых моделей (LLM).

CloudMatrix 384 состоит из 384 процессоров Ascend 910C и 192 ЦП Kunpeng, соединенных вместе единой системой шин с низкой задержкой и высокой пропускной способностью. Ожидается, что эта архитектура изменит основу инфраструктуры ИИ.

Система CloudMatrix-Infer, построенная на этой платформе, демонстрирует выдающуюся производительность при развертывании модели DeepSeek R1. На этапе предварительного заполнения система достигла пропускной способности 6688 токенов/секунду на NPU при обработке запроса пользователя на 4000 токенов. Эта производительность эквивалентна 4,45 токенов/секунду на TFLOPS (триллион операций в секунду).

На этапе декодирования CloudMatrix зафиксировал пропускную способность 1943 токенов/секунду на NPU, с временем отклика менее 50 миллисекунд на токен. Эта производительность 1,29 токенов/секунду на TFLOPS выше, чем у системы Nvidia SGLang с использованием графических процессоров H100, а также платформы графических процессоров H800 с DeepSeek R1.

По словам Цзо Пэнфэя, ведущего автора исследования и участника программы Huawei "Genius Youth", цель отчета — помочь отрасли полностью понять возможности китайского Ascend NPU. На платформе Zhihu он подтвердил, что отчет наглядно демонстрирует технологические возможности Huawei CloudMatrix.

Huawei впервые раскрыла технические подробности об ускорителе искусственного интеллекта Ascend 910C. В отчете также повторяются недавние замечания основателя Huawei Жэня Чжэнфэя о том, что чипы Ascend все еще «отстают на поколение» от своих американских аналогов. Однако он утверждает, что применение таких методов, как «стекинг и кластеризация», помогло Huawei достичь вычислительной производительности, сопоставимой с самыми передовыми системами искусственного интеллекта на сегодняшний день.

Между тем генеральный директор Nvidia Дженсен Хуан также признал в интервью CNBC , что ИИ — это проблема параллельной обработки, и им понадобится больше процессоров, если у них не будет достаточной вычислительной мощности.

Источник: https://znews.vn/buoc-tien-lon-cua-huawei-post1562828.html