Vietnam.vn - Nền tảng quảng bá Việt Nam

Витрати на розробку DeepSeek були «завищені».

Báo Thanh niênBáo Thanh niên03/02/2025


У своєму звіті DeepSeek зазначила, що загальна вартість навчання склала 5,576 мільйона доларів, головним чином через вартість оренди графічних процесорів Nvidia. Компанія також попередила, що ця цифра відображає лише «формальне навчання» та не включає витрати, пов’язані з попередніми дослідженнями чи експериментами з архітектури, алгоритмів та даних. Це одразу привернуло увагу інвесторів і призвело до падіння акцій світових технологічних компаній на 1 трильйон доларів лише 27 січня.

Chi phí phát triển DeepSeek bị 'tâng bốc'- Ảnh 1.

Експлуатаційні витрати DeepSeek набагато вищі, ніж вони заявляють?

Тепер звіт дослідницької та консалтингової фірми з напівпровідників SemiAnalysis пропонує інший погляд на витрати на розробку DeepSeek. Компанія оцінює витрати DeepSeek на апаратне забезпечення як значно вищі, ніж заявлялося раніше, а також підкреслює значні витрати на дослідження та розробки (R&D) та загальну вартість володіння.

SemiAnalysis стверджує, що створення «синтетичних даних» для навчальних моделей вимагатиме «значних обчислювальних зусиль». Крім того, компаніям також потрібно буде тестувати та розробляти нові архітектури, збирати та очищувати дані, а також виплачувати зарплату співробітникам.

Чи потрібно DeepSeek 50 000 графічних процесорів замість трохи більше 2000?

Згідно з розрахунками, експерти стверджують, що DeepSeek керує великомасштабною обчислювальною системою, що складається приблизно з 50 000 графічних процесорів Hopper, 10 000 графічних процесорів H800 та 10 000 потужніших графічних процесорів H100, а також додаткових графічних процесорів H20. Це суперечить попередній заяві DeepSeek про використання лише 2048 графічних процесорів Nvidia. Загальні капітальні витрати на сервери оцінюються приблизно в 1,6 мільярда доларів, тоді як експлуатаційні витрати становлять 944 мільйони доларів.

Chi phí phát triển DeepSeek bị 'tâng bốc'- Ảnh 2.

SemiAnalysis вважає, що DeepSeek використовував 50 000 графічних процесорів Nvidia.

Компанію DeepSeek було засновано у 2023 році Ляном Веньфенгом, співзасновником High-Flyer, хедж-фонду, що спеціалізується на штучному інтелекті, у Китаї. Стартап розвинувся з дослідницького підрозділу фонду зі штучного інтелекту у квітні 2023 року, прагнучи розробляти великомасштабні мовні моделі та досягати загального штучного інтелекту (ШІ).

Інтерес до DeepSeek зріс, коли компанія випустила R1, модель міркування, яка конкурує з o1 від OpenAI, але пропонується з відкритим вихідним кодом, що дозволяє будь-якому розробнику штучного інтелекту використовувати її. Однак, як і багато інших китайських чат-ботів, DeepSeek також має обмеження щодо певних тем.

Генеральний директор OpenAI Сем Альтман високо оцінив модель DeepSeek, наголосивши, що це «безперечно чудова модель». Однак він також заявив, що є докази того, що DeepSeek збирав дані OpenAI для роботи, використовуючи метод «дистиляції».



Джерело: https://thanhnien.vn/chi-phi-phat-trien-deepseek-bi-tang-boc-185250203151508438.htm

Коментар (0)

Залиште коментар, щоб поділитися своїми почуттями!

У тій самій темі

У тій самій категорії

Того ж автора

Спадщина

Фігура

Бізнеси

Thời sự

Політична система

Місцевий

Продукт

Happy Vietnam
Досліджуйте світ разом зі своєю дитиною.

Досліджуйте світ разом зі своєю дитиною.

Весело

Весело

МІЙ КУМИР

МІЙ КУМИР