
तकनीकी दिग्गज आधुनिक, ऊर्जा-कुशल एआई मॉडल की ओर रुख कर रहे हैं
हाल के वर्षों में, कृत्रिम बुद्धिमत्ता (एआई) उद्योग ने मोटे तौर पर "बड़ा ही बेहतर है" के सिद्धांत का पालन किया है: ज़्यादा डेटा, ज़्यादा पैरामीटर, ज़्यादा गणनाएँ। हालाँकि, गूगल, एमआईटी और स्टैनफोर्ड के नए शोध एक बिल्कुल अलग दिशा दिखाते हैं।
आधुनिक मॉडलों को कम डेटा के साथ कुशलतापूर्वक प्रशिक्षित किया जा सकता है, कम ऊर्जा की खपत की जा सकती है, और फिर भी उच्च प्रदर्शन प्राप्त किया जा सकता है। इससे न केवल प्रशिक्षण लागत और समय कम होता है, बल्कि छोटी शोध टीमों और मध्यम आकार के उद्यमों के लिए भी एआई अनुप्रयोगों के द्वार खुलते हैं, जिन्हें पहले बड़े पैमाने की तकनीक तक पहुँचने में कठिनाई होती थी।
तकनीकी प्रगति एआई को "छोटा लेकिन शक्तिशाली" बनाने में मदद करती है
टुओई ट्रे ऑनलाइन के शोध के अनुसार, विज्ञापन प्रसंस्करण परीक्षण में, गूगल ने प्रशिक्षण डेटा को 100,000 नमूनों से घटाकर 500 से भी कम कर दिया, जबकि विशेषज्ञों के साथ संगतता में 65% की वृद्धि हुई।
इसके समानांतर, डेटा-कुशल प्रशिक्षण के एक व्यापक सर्वेक्षण से पता चलता है कि "डेटा की गुणवत्ता, स्मार्ट नमूनाकरण और 'आसवन' तकनीकें प्रदर्शन को निर्धारित करती हैं," न कि केवल डेटा की संख्या में वृद्धि।
सिद्धांत रूप में, "स्केलिंग कानूनों" ने सुझाव दिया है कि मॉडल पैरामीटर, डेटा और कंप्यूट को बढ़ाने से मदद मिलेगी, लेकिन मेटा में एआई के निदेशक यान लेकुन जैसे विशेषज्ञ इस बात पर जोर देते हैं: "आप केवल डेटा और कंप्यूट को बढ़ाकर एआई को स्वचालित रूप से अधिक स्मार्ट नहीं बना सकते।"
इसका मतलब यह है कि लाखों से लेकर अरबों नमूनों को बनाने और लेबल करने के बजाय, अनुसंधान दल डेटा का पुनः उपयोग करने, सिंथेटिक डेटा बनाने, छोटे मॉडलों का उपयोग करने और अधिक ऊर्जा और डेटा कुशल एल्गोरिदम पर ध्यान केंद्रित करने पर विचार कर रहे हैं।
उदाहरण के लिए, "ज्ञान आसवन" तकनीक ज्ञान को एक "शिक्षक" (एक बड़ा शिक्षक मॉडल) से एक "छात्र" (एक संक्षिप्त छात्र मॉडल) तक स्थानांतरित करने की अनुमति देती है, जबकि कई क्षमताएँ अभी भी बरकरार रहती हैं। स्टैनफोर्ड एचएआई के शोधकर्ता इस बात पर ज़ोर देते हैं कि यह प्रवृत्ति कम्प्यूटेशनल रूप से लागत-प्रभावी और पर्यावरण के अनुकूल दोनों है, साथ ही छोटे शोध समूहों या छोटे और मध्यम आकार के उद्यमों के लिए एआई को प्रभावी ढंग से लागू करने के अवसर खोलती है।
ये प्रगतियां एआई मॉडलों को कम डेटा का उपयोग करने, तेजी से चलने, कम बिजली की खपत करने, लागत कम करने, स्थिरता बढ़ाने और संसाधनों की कमी वाले वातावरण में अनुप्रयोगों का विस्तार करने में सक्षम बनाती हैं, ताकि वे बुद्धिमान अनुकूलन की ओर बढ़ सकें, तेजी से सीख सकें, कम संसाधनों का उपभोग कर सकें और फिर भी गुणवत्ता सुनिश्चित कर सकें।
डेटा-कुशल AI प्रशिक्षण के व्यावहारिक अनुप्रयोग और चुनौतियाँ
वास्तव में, कम डेटा और ऊर्जा के साथ AI को प्रशिक्षित करने का व्यापक प्रभाव पड़ता है। विकासशील देशों में छोटे व्यवसायों या शोध टीमों के लिए, "लाखों नमूनों और विशाल सर्वरों का उपयोग" संभव नहीं है। जब कोई कुछ हज़ार नमूनों और साधारण कंप्यूटरों के साथ एक मॉडल को प्रशिक्षित कर सकता है, तो AI अनुप्रयोग अंतिम उपयोगकर्ताओं और वास्तविक वातावरण के अधिक निकट होंगे।
उदाहरण के लिए, विज्ञापन मॉडरेशन संवादों में, Google यह प्रदर्शित करता है कि डेटा का "मूल्य" नमूना चुनना सैकड़ों-हजारों यादृच्छिक नमूनों से बेहतर है—जिससे आवश्यक डेटा की मात्रा कम हो जाती है और परिणाम भी प्राप्त होते हैं।
हालाँकि, चुनौती बनी हुई है: जब डेटा कम होता है, तो मॉडल ओवरफिटिंग, खराब सामान्यीकरण और पर्यावरण में बदलावों को संभालने में कठिनाई का शिकार हो सकता है। विज़ुअल ट्रांसफर लर्निंग पर शोध से पता चलता है कि जब इनपुट डेटा बहुत सीमित होता है, तो डिस्टिलेशन ज़्यादा प्रभावी होता है, लेकिन जब डेटा काफ़ी बड़ा होता है, तो पारंपरिक तरीका फिर भी कारगर होता है।
बिजली की खपत और लागत के संदर्भ में, डेटा को कम करने का मतलब गणना, सर्वर और बिजली को कम करना भी है, जो कि बड़े एआई मॉडल (एलएलएम) के संदर्भ में महत्वपूर्ण है, जिनकी प्रति प्रशिक्षण लागत लाखों डॉलर है।
स्टैनफोर्ड एचएआई की एक रिपोर्ट के अनुसार, डेटा और ऊर्जा-बचत एआई की प्रवृत्ति को 2025 में एक "बड़ा परिवर्तन" माना जा रहा है।
इसलिए पत्रकारों और सामान्य पाठकों के लिए यह ध्यान देने योग्य बात है कि जब एआई केवल "तकनीकी दिग्गजों" के लिए नहीं रह जाएगा, बल्कि इसे कम डेटा और कम लागत के साथ छोटी टीमों द्वारा बनाया जा सकेगा, तो छोटे व्यवसाय प्रबंधन, क्षेत्रीय चिकित्सा अनुप्रयोगों से लेकर व्यक्तिगत शिक्षा तक कई नए अनुप्रयोग सामने आएंगे।
लेकिन उपयोगकर्ताओं को इस बात के प्रति भी सतर्क रहना चाहिए कि यदि "डेटा" मॉडल को अच्छी तरह से नियंत्रित नहीं किया गया तो यह कम सटीक हो सकता है और पूर्वाग्रह के प्रति अधिक संवेदनशील हो सकता है।
स्रोत: https://tuoitre.vn/ai-khong-con-can-du-lieu-khong-lo-cuoc-dua-huan-luyen-ai-tiet-kiem-nang-luong-20251031115025169.htm






टिप्पणी (0)