अपनी रिपोर्ट में, डीपसीक ने बताया कि कुल प्रशिक्षण लागत 5.576 मिलियन डॉलर थी, जिसका मुख्य कारण एनवीडिया के ग्राफिक्स प्रोसेसिंग यूनिटों का किराया था। कंपनी ने यह भी चेतावनी दी कि यह आंकड़ा केवल "औपचारिक प्रशिक्षण" को दर्शाता है और इसमें आर्किटेक्चर, एल्गोरिदम और डेटा पर किए गए पूर्व शोध या प्रयोगों से संबंधित लागतें शामिल नहीं हैं। इससे निवेशकों का ध्यान तुरंत आकर्षित हुआ और 27 जनवरी को ही वैश्विक प्रौद्योगिकी कंपनियों के शेयरों में 1 ट्रिलियन डॉलर की गिरावट आई।
क्या डीपसीक की परिचालन लागत उनके दावे से कहीं अधिक है?
अब, सेमीकंडक्टर अनुसंधान और परामर्श फर्म सेमीएनालिसिस की एक रिपोर्ट डीपसीक की विकास लागतों पर एक अलग दृष्टिकोण प्रस्तुत करती है। कंपनी का अनुमान है कि डीपसीक का हार्डवेयर पर खर्च पहले बताए गए अनुमान से काफी अधिक है, साथ ही यह रिपोर्ट अनुसंधान और विकास (आर एंड डी) की भारी लागत और कुल स्वामित्व लागत को भी उजागर करती है।
सेमीएनालिसिस का कहना है कि मॉडल को प्रशिक्षित करने के लिए "सिंथेटिक डेटा" बनाने में "काफी अधिक कम्प्यूटेशनल प्रयास" की आवश्यकता होगी। इसके अलावा, कंपनियों को नए आर्किटेक्चर का परीक्षण और विकास करने, डेटा एकत्र करने और उसे साफ करने और कर्मचारियों के वेतन का भुगतान करने की भी आवश्यकता होगी।
क्या डीपसीक को 2,000 से कुछ अधिक जीपीयू के बजाय 50,000 जीपीयू की आवश्यकता है?
विशेषज्ञों के अनुमानों के अनुसार, डीपसीक एक विशाल कंप्यूटिंग सिस्टम का संचालन करता है जिसमें लगभग 50,000 हॉपर जीपीयू, 10,000 एच800 जीपीयू और 10,000 अधिक शक्तिशाली एच100 जीपीयू के साथ-साथ अतिरिक्त एच20 जीपीयू भी शामिल हैं। यह डीपसीक के पहले के उस दावे के विपरीत है जिसमें उसने केवल 2,048 एनवीडिया जीपीयू का उपयोग करने की बात कही थी। सर्वरों की कुल पूंजी लागत लगभग 1.6 बिलियन डॉलर होने का अनुमान है, जबकि परिचालन लागत 944 मिलियन डॉलर है।
सेमीएनालिसिस का मानना है कि डीपसीक ने 50,000 एनवीडिया जीपीयू का इस्तेमाल किया है।
डीपसीक की स्थापना 2023 में चीन के एआई-केंद्रित हेज फंड हाई-फ्लायर के सह-संस्थापक लियांग वेनफेंग द्वारा की गई थी। यह स्टार्टअप अप्रैल 2023 में फंड की एआई अनुसंधान इकाई से विकसित हुआ, जिसका उद्देश्य बड़े पैमाने पर भाषा मॉडल विकसित करना और सामान्य कृत्रिम बुद्धिमत्ता (एजीआई) प्राप्त करना है।
DeepSeek में लोगों की दिलचस्पी तब बढ़ी जब कंपनी ने R1 नामक एक तर्क मॉडल जारी किया, जो OpenAI के o1 के साथ प्रतिस्पर्धा करता है, लेकिन इसे ओपन सोर्स के रूप में पेश किया गया है, जिससे कोई भी AI डेवलपर इसका उपयोग कर सकता है। हालांकि, कई अन्य चीनी चैटबॉट की तरह, DeepSeek में भी कुछ विषयों पर सीमाएं हैं।
ओपनएआई के सीईओ सैम अल्टमैन ने डीपसीक के मॉडल की प्रशंसा करते हुए कहा कि यह "स्पष्ट रूप से एक बेहतरीन मॉडल है।" हालांकि, उन्होंने यह भी कहा कि ऐसे सबूत मौजूद हैं जो बताते हैं कि डीपसीक ने ओपनएआई के डेटा को "डिस्टिलेशन" विधि का उपयोग करके एकत्र किया है।
[विज्ञापन_2]
स्रोत: https://thanhnien.vn/chi-phi-phat-trien-deepseek-bi-tang-boc-185250203151508438.htm







टिप्पणी (0)