Vietnam.vn - Nền tảng quảng bá Việt Nam

डीपसीक अपने रहस्य उजागर करता है।

डीपसीक ने पहली बार खुलासा किया है कि उसने हार्डवेयर और सॉफ्टवेयर डिजाइन को एक साथ करने की बदौलत कम लागत पर दुनिया का अग्रणी ओपन-सोर्स एआई मॉडल कैसे बनाया।

ZNewsZNews19/05/2025

डीपसीक ने बताया कि वे कम लागत वाले एआई मॉडल कैसे बनाते हैं। फोटो: ब्लूमबर्ग

15 मई को प्रकाशित एक शोध रिपोर्ट में, डीपसीक ने पहली बार इस बात का विवरण साझा किया कि उसने अपने प्रतिस्पर्धियों की तुलना में बहुत कम लागत पर दुनिया के सबसे शक्तिशाली ओपन-सोर्स एआई सिस्टम में से एक का निर्माण कैसे किया।

“DeepSeek-V3 पर अंतर्दृष्टि: स्केलिंग चुनौतियाँ और AI आर्किटेक्चर के लिए हार्डवेयर पर विचार” शीर्षक वाले इस अध्ययन को संस्थापक लियांग वेनफेंग के साथ मिलकर लिखा गया है। DeepSeek अपनी सफलता का श्रेय हार्डवेयर और सॉफ्टवेयर के समानांतर डिज़ाइन को देता है, जो कई ऐसी कंपनियों से अलग दृष्टिकोण है जो अभी भी सॉफ्टवेयर को स्वतंत्र रूप से अनुकूलित करने पर ध्यान केंद्रित करती हैं।

“2,048 एनवीडिया एच800 जीपीयू पर प्रशिक्षित डीपसीक-वी3 ने दिखाया कि कैसे समानांतर डिजाइन चुनौतियों को कुशलतापूर्वक हल कर सकता है, जिससे बड़े पैमाने पर कुशल प्रशिक्षण और अनुमान लगाना संभव हो पाता है,” शोध टीम ने रिपोर्ट में लिखा। डीपसीक और हेज फंड हाई-फ्लायर ने 2023 से अमेरिका द्वारा चीन को एच800 चिप्स के निर्यात पर प्रतिबंध लगाने से पहले ही उनका स्टॉक कर लिया था।

लेख के अनुसार, डीपसीक अनुसंधान टीम हार्डवेयर की सीमाओं और ओपनएआई के चैटजीपीटी जैसे चैटबॉट के पीछे की अंतर्निहित तकनीक, बड़े भाषा मॉडल (एलएलएम) को प्रशिक्षित करने की अत्यधिक लागत से भलीभांति परिचित थी। इसलिए, उन्होंने मेमोरी प्रदर्शन को बढ़ाने, चिप्स के बीच संचार में सुधार करने और एआई अवसंरचना की समग्र दक्षता को बढ़ाने के लिए कई तकनीकी अनुकूलन लागू किए।

इसके अलावा, डीपसीक मिक्स्ड एक्सपर्ट मॉडल (एमओई) आर्किटेक्चर की भूमिका पर जोर देता है। यह एक मशीन लर्निंग विधि है जो एआई मॉडल को सबनेटवर्क में विभाजित करती है, जिनमें से प्रत्येक इनपुट डेटा के एक अलग हिस्से को संसाधित करता है और परिणामों को अनुकूलित करने के लिए सहयोगात्मक रूप से कार्य करता है।

शिक्षा मंत्रालय (MoE) प्रशिक्षण लागत को कम करने और तर्क क्षमता को बढ़ाने में मदद करता है। यह पद्धति अब चीनी प्रौद्योगिकी उद्योग में व्यापक रूप से अपनाई जा रही है, जिसमें अलीबाबा का नवीनतम Qwen3 मॉडल भी शामिल है।

डीपसीक ने दिसंबर 2024 में अपना बेसिक V3 मॉडल और जनवरी में अपना R1 रीजनिंग मॉडल जारी करके पहली बार ध्यान आकर्षित किया। इन उत्पादों ने वैश्विक बाजार में हलचल मचा दी, जिससे एआई से संबंधित प्रौद्योगिकी शेयरों में व्यापक गिरावट आई।

हालांकि डीपसीक ने हाल ही में अपनी आगे की योजनाओं के बारे में कोई जानकारी नहीं दी है, लेकिन नियमित रिपोर्टों के माध्यम से उसने समुदाय की रुचि बनाए रखी है। मार्च के अंत में, कंपनी ने डीपसीक-V3 का एक छोटा सा अपडेट जारी किया, और अप्रैल के अंत तक, उन्होंने चुपचाप गणितीय प्रमाण प्रसंस्करण के लिए प्रोवर-V2 सिस्टम लॉन्च कर दिया।

स्रोत: https://znews.vn/deepseek-tiet-lo-bi-mat-post1554222.html


टिप्पणी (0)

अपनी भावनाएँ साझा करने के लिए कृपया एक टिप्पणी करें!

उसी श्रेणी में

उसी लेखक की

विरासत

आकृति

व्यवसायों

सामयिकी

राजनीतिक प्रणाली

स्थानीय

उत्पाद

Happy Vietnam
वियतनाम जिंदाबाद!

वियतनाम जिंदाबाद!

मेरे दिल में बसी मातृभूमि

मेरे दिल में बसी मातृभूमि

मध्य उच्चभूमि में एक नया दिन

मध्य उच्चभूमि में एक नया दिन