अमेरिकी शोधकर्ताओं द्वारा बनाए गए AI (कृत्रिम बुद्धिमत्ता) मॉडल S1 की परिचालन लागत केवल 50 अमेरिकी डॉलर बताई गई है, लेकिन यह OpenAI के O1 मॉडल के बराबर तर्क क्षमता प्रदान करता है, जिसकी लागत कहीं अधिक है। S1 का आगमन डीपसीक की प्रभावशाली सफलता के बाद हुआ है जिसने हाल के दिनों में सिलिकॉन वैली में हलचल मचा दी है।
डीपसीक के उदय के बाद से 'सस्ते एआई' युद्ध में तेजी आई है
टीम ने मॉडल बनाने में इस्तेमाल किए गए कोड और डेटा के साथ, S1 सोर्स कोड को GitHub पर सार्वजनिक कर दिया है। पिछले हफ़्ते प्रकाशित एक पेपर में मॉडल विकसित करने की प्रक्रिया और उनके द्वारा इस्तेमाल की गई चतुर तकनीकों पर प्रकाश डाला गया है। नए रीजनिंग मॉडल के साथ बिल्कुल शुरुआत करने के बजाय, टीम ने एक मौजूदा भाषा मॉडल का इस्तेमाल किया और Google के Gemini 2.0 फ़्लैश थिंकिंग एक्सपेरिमेंटल मॉडल से रीजनिंग क्षमताओं को निकालकर एक "फाइन-ट्यूनिंग" प्रक्रिया को अंजाम दिया।
एआई परिचालन लागत केवल '50 डॉलर से कम'
16 Nvidia H100 GPU का उपयोग करके S1 मॉडल को प्रशिक्षित करने में केवल 30 मिनट लगे। हालाँकि प्रत्येक GPU की कीमत लगभग $25,000 है, लेकिन क्लाउड कंप्यूटिंग सेवाओं की बदौलत इस प्रक्रिया को किराए पर लेने की लागत $50 से कम थी। विशेष रूप से, टीम ने एक उपयोगी तरकीब खोजी: मॉडल को अंतिम उत्तर देने से पहले "प्रतीक्षा" करने का निर्देश देना, जिससे उसकी तर्क क्षमता में सुधार हुआ और बेहतर समाधान प्राप्त हुए।
हालाँकि S1 ने कम लागत में उल्लेखनीय प्रगति की है, फिर भी इसकी मापनीयता को लेकर चिंताएँ हैं। Google के मॉडल को "शिक्षक" के रूप में इस्तेमाल करने से आज के अग्रणी AI मॉडलों के साथ प्रतिस्पर्धा करने की इसकी क्षमता पर सवाल उठते हैं। Google इस स्थिति पर कड़ी नज़र रखेगा, खासकर OpenAI और DeepSeek के बीच चल रहे मुकदमे को देखते हुए।
[विज्ञापन_2]
स्रोत: https://thanhnien.vn/my-tao-ra-mo-hinh-ai-sieu-re-hoat-dong-tuong-tu-gpt-o1-185250207182535164.htm
टिप्पणी (0)