دیپسیک در گزارش خود اعلام کرد که کل هزینه آموزش بالغ بر ۵.۵۷۶ میلیون دلار بوده است که عمدتاً به دلیل قیمت اجاره واحدهای پردازش گرافیکی انویدیا بوده است. این شرکت همچنین هشدار داد که این رقم فقط نشاندهنده «آموزش رسمی» است و شامل هزینههای مربوط به تحقیقات یا آزمایشهای قبلی روی معماری، الگوریتمها و دادهها نمیشود. این موضوع بلافاصله توجه سرمایهگذاران را به خود جلب کرد و باعث شد سهام شرکتهای فناوری جهانی تنها در ۲۷ ژانویه ۱ تریلیون دلار سقوط کند.
هزینههای عملیاتی DeepSeek خیلی بیشتر از چیزی است که ادعا میکنند؟
اکنون، گزارشی از شرکت تحقیقات و مشاوره نیمههادی SemiAnalysis دیدگاه متفاوتی در مورد هزینههای توسعه DeepSeek ارائه میدهد. این شرکت تخمین میزند که هزینههای سختافزاری DeepSeek به طور قابل توجهی بالاتر از آنچه قبلاً گفته شده است، باشد، در عین حال هزینههای قابل توجه تحقیق و توسعه (R&D) و کل هزینه مالکیت را نیز برجسته میکند.
SemiAnalysis اظهار میکند که ایجاد «دادههای مصنوعی» برای مدلهای آموزشی نیازمند «تلاش محاسباتی قابل توجهی» خواهد بود. علاوه بر این، شرکتها همچنین نیاز به آزمایش و توسعه معماریهای جدید، جمعآوری و پاکسازی دادهها و پرداخت حقوق کارمندان خواهند داشت.
آیا DeepSeek به جای کمی بیش از ۲۰۰۰ پردازنده گرافیکی، به ۵۰۰۰۰ پردازنده گرافیکی نیاز دارد؟
طبق محاسبات، کارشناسان میگویند DeepSeek یک سیستم محاسباتی در مقیاس بزرگ را اداره میکند که تقریباً شامل ۵۰،۰۰۰ پردازنده گرافیکی Hopper، ۱۰،۰۰۰ پردازنده گرافیکی H800 و ۱۰،۰۰۰ پردازنده گرافیکی قدرتمندتر H100 به همراه پردازندههای گرافیکی اضافی H20 است. این با ادعای قبلی DeepSeek مبنی بر استفاده از تنها ۲۰۴۸ پردازنده گرافیکی Nvidia در تضاد است. کل هزینه سرمایه برای سرورها حدود ۱.۶ میلیارد دلار تخمین زده میشود، در حالی که هزینههای عملیاتی ۹۴۴ میلیون دلار است.
SemiAnalysis معتقد است که DeepSeek از ۵۰،۰۰۰ پردازنده گرافیکی انویدیا استفاده کرده است.
دیپسیک در سال ۲۰۲۳ توسط لیانگ ونفنگ، یکی از بنیانگذاران های-فلایر، یک صندوق پوشش ریسک متمرکز بر هوش مصنوعی در چین، تأسیس شد. این استارتاپ در آوریل ۲۰۲۳ از واحد تحقیقات هوش مصنوعی این صندوق تکامل یافت و هدف آن توسعه مدلهای زبانی در مقیاس بزرگ و دستیابی به هوش مصنوعی عمومی (AGI) بود.
علاقه به DeepSeek زمانی افزایش یافت که این شرکت R1 را منتشر کرد، یک مدل استدلال که با o1 شرکت OpenAI رقابت میکند، اما به صورت متنباز ارائه میشود و به هر توسعهدهنده هوش مصنوعی اجازه میدهد از آن استفاده کند. با این حال، مانند بسیاری از چتباتهای چینی دیگر، DeepSeek نیز در موضوعات خاص محدودیتهایی دارد.
سم آلتمن، مدیرعامل OpenAI، مدل DeepSeek را ستود و تأکید کرد که «بهوضوح یک مدل عالی است.» با این حال، او همچنین اظهار داشت که شواهدی وجود دارد که نشان میدهد DeepSeek دادههای OpenAI را برای کار با استفاده از روش «تقطیر» جمعآوری کرده است.
منبع: https://thanhnien.vn/chi-phi-phat-trien-deepseek-bi-tang-boc-185250203151508438.htm






نظر (0)