चीनी स्टार्टअप डीपसीक का आर1 आर्टिफिशियल इंटेलिजेंस मॉडल - जिसने जनवरी में लॉन्च होने पर अमेरिकी शेयर बाजार को चौंका दिया था - पहले सहकर्मी-समीक्षित अध्ययन में प्रकाशित हुआ है, जिसमें दिखाया गया है कि कैसे इसने लगभग 300,000 डॉलर में एक शक्तिशाली एलएलएम विकसित किया।
आर1 को गणित और प्रोग्रामिंग जैसे तर्कपूर्ण कार्यों में उत्कृष्टता प्राप्त करने के लिए डिज़ाइन किया गया है, जिससे यह अमेरिकी प्रौद्योगिकी दिग्गजों द्वारा विकसित उपकरणों के लिए कम लागत वाला प्रतिद्वंद्वी बन गया है।
यह एक "ओपन वेट" मॉडल है, जो डाउनलोड करने के लिए निःशुल्क है और वर्तमान में 10.9 मिलियन से अधिक डाउनलोड के साथ, हगिंग फेस प्लेटफॉर्म पर सबसे लोकप्रिय मॉडल है।
नेचर अध्ययन, जो जनवरी की पांडुलिपि का अद्यतन है, ने पहली बार खुलासा किया कि आर1 के प्रशिक्षण पर केवल 294,000 डॉलर की लागत आई, इसके अतिरिक्त आधार मॉडल के निर्माण पर लगभग 6 मिलियन डॉलर खर्च किए गए।
यह आंकड़ा उन करोड़ों डॉलर से बहुत कम है जो प्रतिस्पर्धियों ने खर्च किये हैं।
डीपसीक ने कहा कि आर1 को मुख्य रूप से एनवीडिया एच800 चिप्स का उपयोग करके प्रशिक्षित किया गया था, जिसे अमेरिका ने 2023 से चीन को निर्यात करने पर प्रतिबंध लगा दिया है।
R1 की सफलता "शुद्ध सुदृढीकरण अधिगम" के उपयोग में थी, जहाँ मॉडल को मनुष्यों द्वारा चुने गए उदाहरणों से सीखने के बजाय, परीक्षण और त्रुटि के आधार पर प्रशिक्षित किया जाता है और सही उत्तरों के लिए पुरस्कृत किया जाता है। यह आंतरिक अनुमानों का उपयोग करके अपने प्रयासों का मूल्यांकन भी करता है, जिसे "सापेक्ष समूह नीति अनुकूलन" नामक तकनीक कहा जाता है, जो प्रदर्शन को बेहतर बनाने में मदद करती है।
शोधकर्ता हुआन सन (ओहायो स्टेट यूनिवर्सिटी) कहते हैं, "कठोर सहकर्मी समीक्षा प्रक्रिया मॉडल के मूल्य और विश्वसनीयता को प्रमाणित करने में मदद करती है।" "अन्य फर्मों को भी ऐसा ही करना चाहिए।"
हगिंग फेस के मशीन लर्निंग इंजीनियर लुईस टुनस्टाल ने कहा कि यह एक महत्वपूर्ण मिसाल है, क्योंकि एआई विकास में पारदर्शिता से जोखिमों का अधिक सटीक आकलन करने में मदद मिलती है।
डीपसीक का दावा है कि आर1 को ओपनएआई के मॉडलों के डेटा का उपयोग करके प्रशिक्षित नहीं किया गया था, हालांकि यह स्वीकार करता है कि अंतर्निहित मॉडल को वेब डेटा पर प्रशिक्षित किया गया था - जिसमें एआई-जनित सामग्री शामिल हो सकती है।
विशेषज्ञों का कहना है कि यद्यपि इसकी पूर्णतः पुष्टि करना कठिन है, परन्तु वर्तमान साक्ष्य यह दर्शाते हैं कि उच्च प्रदर्शन प्राप्त करने के लिए शुद्ध संवर्द्धन ही पर्याप्त है।
साइंसएजेंटबेंच परीक्षण में, R1 सटीकता चार्ट में शीर्ष पर नहीं रहा, लेकिन इसने दक्षता और लागत के बीच अच्छा संतुलन बनाए रखा। शोधकर्ता अब डीपसीक की विधि को मौजूदा एलएलएम की तर्क क्षमताओं को बढ़ाने के साथ-साथ गणित और प्रोग्रामिंग से परे के क्षेत्रों में भी लागू करने पर विचार कर रहे हैं।
श्री टुनस्टाल के अनुसार, आर1 ने कृत्रिम बुद्धिमत्ता विकास में "क्रांति शुरू कर दी है"।
स्रोत: https://www.vietnamplus.vn/nghien-cuu-moi-tiet-lo-bi-quyet-thanh-cong-cua-deepseek-post1062474.vnp






टिप्पणी (0)