एआई कंपनियां 'छोटे भाषा मॉडल' से अच्छा खासा मुनाफा कमाने की कोशिश कर रही हैं।

[विज्ञापन_1]

Apple, Microsoft, Meta और Google ने हाल ही में कम "पैरामीटर" वाले लेकिन फिर भी शक्तिशाली क्षमताओं वाले नए AI मॉडल जारी किए हैं। यह कदम इन तकनीकी कंपनियों द्वारा सीमित बजट वाले व्यवसायों को भी AI का उपयोग करने के लिए प्रोत्साहित करने का एक प्रयास है।

कंपनियां छोटे भाषा मॉडल से बड़ा मुनाफा कमाने की कोशिश कर रही हैं (चित्र 1)। — चित्र: एफटी

सामान्य तौर पर, पैरामीटरों की संख्या जितनी अधिक होती है, एआई सॉफ्टवेयर का प्रदर्शन उतना ही बेहतर होता है और उसके कार्य उतने ही जटिल और सूक्ष्म हो जाते हैं। ओपनएआई के नवीनतम जीपीटी-40 मॉडल और गूगल के जेमिनी 1.5 प्रो, जिनकी घोषणा इसी सप्ताह की गई है, में अनुमानित रूप से 1 ट्रिलियन से अधिक पैरामीटर हैं। वहीं, मेटा अपने ओपन-सोर्स लामा मॉडल के 400 बिलियन पैरामीटर वाले संस्करण को प्रशिक्षित कर रहा है।

डेटा और कॉपीराइट संबंधी दायित्वों को लेकर चिंताओं के कारण मेटा और गूगल जैसी बड़ी तकनीकी कंपनियों ने कुछ अरब मापदंडों वाले छोटे भाषा मॉडल जारी किए हैं जो सस्ते, अधिक ऊर्जा-कुशल, अनुकूलन योग्य हैं, प्रशिक्षण और संचालन के लिए कम बिजली की आवश्यकता होती है, और संवेदनशील डेटा के लीक होने से भी बचा सकते हैं।

"कम लागत पर इतनी उच्च गुणवत्ता प्राप्त करके, वास्तव में ग्राहकों के लिए अधिक एप्लिकेशन उपलब्ध होंगे...", माइक्रोसॉफ्ट के एज़्योर एआई प्लेटफॉर्म के उपाध्यक्ष एरिक बॉयड ने कहा, जो व्यवसायों को एआई मॉडल बेचता है।

गूगल, मेटा, माइक्रोसॉफ्ट और फ्रांसीसी स्टार्टअप मिस्ट्रल ने भी छोटे भाषा मॉडल जारी किए हैं, लेकिन उनमें अभी भी सुधार की गुंजाइश है और उन्हें विशिष्ट कार्यों पर बेहतर ढंग से केंद्रित किया जा सकता है।

मेटा के वैश्विक मामलों के अध्यक्ष निक क्लेग ने कहा कि लामा 3 का नया 8 अरब पैरामीटर वाला मॉडल जीपीटी-4 के बराबर है। माइक्रोसॉफ्ट ने कहा कि उसका छोटा फाई-3 मॉडल, जिसमें 7 अरब पैरामीटर हैं, ओपनएआई मॉडल के पिछले संस्करण जीपीटी-3.5 से बेहतर प्रदर्शन करता है।

छोटे मॉडल क्लाउड पर जानकारी भेजने के बजाय डिवाइस पर ही स्थानीय रूप से कार्यों को संभाल सकते हैं, जो गोपनीयता के प्रति जागरूक ग्राहकों को आकर्षित कर सकता है जो यह सुनिश्चित करना चाहते हैं कि जानकारी उनके आंतरिक नेटवर्क के भीतर ही रहे।

एडलेशॉ गोडार्ड लॉ फर्म में प्रशासक शार्लेट मार्शल का कहना है कि जनरेटिव एआई उत्पादों को अपनाने के दौरान "हमारे कई ग्राहकों को जिन चुनौतियों का सामना करना पड़ा है, उनमें से एक डेटा प्रोसेसिंग और ट्रांसमिशन के लिए कानूनी आवश्यकताओं का अनुपालन करना है।" उनका कहना है कि छोटे मॉडल व्यवसायों को कानूनी और लागत संबंधी चिंताओं को दूर करने का अवसर प्रदान करते हैं।

छोटे मॉडल मोबाइल फोन जैसे उपकरणों पर एआई सुविधाओं को चलाने की अनुमति भी देते हैं। Google का "Gemini Nano" मॉडल नवीनतम Pixel फोन और Samsung के नवीनतम S24 स्मार्टफोन में अंतर्निहित है।

एप्पल ने यह भी खुलासा किया है कि वह अपने सबसे ज्यादा बिकने वाले आईफोन पर चलने वाले एआई मॉडल विकसित कर रहा है। पिछले महीने, सिलिकॉन वैली की इस दिग्गज कंपनी ने ओपनईएलएम मॉडल जारी किया, जो टेक्स्ट आधारित कार्यों को करने के लिए डिज़ाइन किया गया एक छोटा मॉडल है।

माइक्रोसॉफ्ट के बॉयड ने कहा कि छोटे उपकरण "फोन और लैपटॉप तक रोमांचक अनुप्रयोगों" को जन्म देंगे।

ओपनएआई के निदेशक सैम अल्टमैन ने नवंबर में कहा था कि वे ग्राहकों को अलग-अलग आकार के एआई मॉडल भी उपलब्ध करा रहे हैं जो "विभिन्न उद्देश्यों की पूर्ति" करते हैं। उन्होंने कहा, "कुछ ऐसे काम हैं जो छोटे मॉडल बहुत अच्छे से कर सकते हैं। मैं इसके बारे में बहुत उत्साहित हूं।"

हालांकि, ऑल्टमैन ने कहा कि ओपनएआई बड़े, स्केलेबल एआई मॉडल बनाने पर ध्यान केंद्रित करना जारी रखेगा जो तर्क करने, योजना बनाने और कार्यों को निष्पादित करने में सक्षम हों, और अंततः मानव-स्तर की बुद्धिमत्ता प्राप्त कर सकें।

होआंग हाई (एफटी के अनुसार)

[विज्ञापन_2]
स्रोत: https://www.congluan.vn/cac-cong-ty-ai-dang-tim-kiem-loi-nhuan-lon-tu-cac-mo-hinh-ngon-ngu-nho-post296219.html