هزینه‌های توسعه‌ی DeepSeek «افزایش یافته» است.

دیپ‌سیک در گزارش خود اعلام کرد که کل هزینه آموزش بالغ بر ۵.۵۷۶ میلیون دلار بوده است که عمدتاً به دلیل قیمت اجاره واحدهای پردازش گرافیکی انویدیا بوده است. این شرکت همچنین هشدار داد که این رقم فقط نشان‌دهنده «آموزش رسمی» است و شامل هزینه‌های مربوط به تحقیقات یا آزمایش‌های قبلی روی معماری، الگوریتم‌ها و داده‌ها نمی‌شود. این موضوع بلافاصله توجه سرمایه‌گذاران را به خود جلب کرد و باعث شد سهام شرکت‌های فناوری جهانی تنها در ۲۷ ژانویه ۱ تریلیون دلار سقوط کند.

Chi phí phát triển DeepSeek bị 'tâng bốc'- Ảnh 1. — هزینه‌های عملیاتی DeepSeek خیلی بیشتر از چیزی است که ادعا می‌کنند؟

اکنون، گزارشی از شرکت تحقیقات و مشاوره نیمه‌هادی SemiAnalysis دیدگاه متفاوتی در مورد هزینه‌های توسعه DeepSeek ارائه می‌دهد. این شرکت تخمین می‌زند که هزینه‌های سخت‌افزاری DeepSeek به طور قابل توجهی بالاتر از آنچه قبلاً گفته شده است، باشد، در عین حال هزینه‌های قابل توجه تحقیق و توسعه (R&D) و کل هزینه مالکیت را نیز برجسته می‌کند.

SemiAnalysis اظهار می‌کند که ایجاد «داده‌های مصنوعی» برای مدل‌های آموزشی نیازمند «تلاش محاسباتی قابل توجهی» خواهد بود. علاوه بر این، شرکت‌ها همچنین نیاز به آزمایش و توسعه معماری‌های جدید، جمع‌آوری و پاکسازی داده‌ها و پرداخت حقوق کارمندان خواهند داشت.

آیا DeepSeek به جای کمی بیش از ۲۰۰۰ پردازنده گرافیکی، به ۵۰۰۰۰ پردازنده گرافیکی نیاز دارد؟

طبق محاسبات، کارشناسان می‌گویند DeepSeek یک سیستم محاسباتی در مقیاس بزرگ را اداره می‌کند که تقریباً شامل ۵۰،۰۰۰ پردازنده گرافیکی Hopper، ۱۰،۰۰۰ پردازنده گرافیکی H800 و ۱۰،۰۰۰ پردازنده گرافیکی قدرتمندتر H100 به همراه پردازنده‌های گرافیکی اضافی H20 است. این با ادعای قبلی DeepSeek مبنی بر استفاده از تنها ۲۰۴۸ پردازنده گرافیکی Nvidia در تضاد است. کل هزینه سرمایه برای سرورها حدود ۱.۶ میلیارد دلار تخمین زده می‌شود، در حالی که هزینه‌های عملیاتی ۹۴۴ میلیون دلار است.

Chi phí phát triển DeepSeek bị 'tâng bốc'- Ảnh 2. — SemiAnalysis معتقد است که DeepSeek از ۵۰،۰۰۰ پردازنده گرافیکی انویدیا استفاده کرده است.

دیپ‌سیک در سال ۲۰۲۳ توسط لیانگ ونفنگ، یکی از بنیانگذاران های-فلایر، یک صندوق پوشش ریسک متمرکز بر هوش مصنوعی در چین، تأسیس شد. این استارتاپ در آوریل ۲۰۲۳ از واحد تحقیقات هوش مصنوعی این صندوق تکامل یافت و هدف آن توسعه مدل‌های زبانی در مقیاس بزرگ و دستیابی به هوش مصنوعی عمومی (AGI) بود.

علاقه به DeepSeek زمانی افزایش یافت که این شرکت R1 را منتشر کرد، یک مدل استدلال که با o1 شرکت OpenAI رقابت می‌کند، اما به صورت متن‌باز ارائه می‌شود و به هر توسعه‌دهنده هوش مصنوعی اجازه می‌دهد از آن استفاده کند. با این حال، مانند بسیاری از چت‌بات‌های چینی دیگر، DeepSeek نیز در موضوعات خاص محدودیت‌هایی دارد.

سم آلتمن، مدیرعامل OpenAI، مدل DeepSeek را ستود و تأکید کرد که «به‌وضوح یک مدل عالی است.» با این حال، او همچنین اظهار داشت که شواهدی وجود دارد که نشان می‌دهد DeepSeek داده‌های OpenAI را برای کار با استفاده از روش «تقطیر» جمع‌آوری کرده است.

منبع: https://thanhnien.vn/chi-phi-phat-trien-deepseek-bi-tang-boc-185250203151508438.htm