एप्पल, माइक्रोसॉफ्ट, मेटा और गूगल ने हाल ही में कम "पैरामीटर" के साथ नए एआई मॉडल जारी किए हैं, लेकिन फिर भी शक्तिशाली क्षमताएं हैं, यह कदम तकनीकी समूहों द्वारा वित्तीय रूप से विवश व्यवसायों को एआई का उपयोग करने के लिए प्रोत्साहित करने के प्रयास का हिस्सा है।
चित्रण: एफटी
सामान्यतः, मापदंडों की संख्या जितनी ज़्यादा होगी, AI सॉफ़्टवेयर का प्रदर्शन उतना ही बेहतर होगा और उसके कार्य उतने ही जटिल और सूक्ष्म होंगे। OpenAI के नवीनतम GPT-4o मॉडल और Google के Gemini 1.5 Pro, जिनकी घोषणा इसी सप्ताह की गई है, में 1 ट्रिलियन से ज़्यादा पैरामीटर होने का अनुमान है। इस बीच, Meta अपने ओपन-सोर्स Llama मॉडल के 400 बिलियन-पैरामीटर संस्करण का प्रशिक्षण दे रहा है।
डेटा और कॉपीराइट दायित्व के बारे में चिंताओं के कारण मेटा और गूगल जैसी बड़ी टेक कंपनियों ने कुछ अरब मापदंडों वाले छोटे भाषा मॉडल जारी किए हैं, जो सस्ते, ऊर्जा कुशल, अनुकूलन योग्य हैं, जिन्हें प्रशिक्षित करने और चलाने के लिए कम ऊर्जा की आवश्यकता होती है, और संवेदनशील डेटा को संग्रहीत होने से भी रोका जा सकता है।
माइक्रोसॉफ्ट के एज़्योर एआई प्लेटफॉर्म के कॉर्पोरेट उपाध्यक्ष एरिक बॉयड ने कहा, "कम लागत पर उच्च गुणवत्ता प्राप्त करने से, आपको वास्तव में ग्राहकों के लिए अधिक एप्लिकेशन उपलब्ध हो जाते हैं।" यह प्लेटफॉर्म व्यवसायों को एआई मॉडल बेचता है।
गूगल, मेटा, माइक्रोसॉफ्ट और फ्रांसीसी स्टार्टअप मिस्ट्रल ने भी छोटे भाषा मॉडल जारी किए हैं, लेकिन अभी भी प्रगति प्रदर्शित करते हैं और विशिष्ट कार्यों पर बेहतर ध्यान केंद्रित कर सकते हैं।
मेटा के वैश्विक मामलों के अध्यक्ष निक क्लेग ने कहा कि लामा 3 का नया 8-बिलियन-पैरामीटर मॉडल GPT-4 के बराबर है। माइक्रोसॉफ्ट ने कहा कि 7 बिलियन पैरामीटर वाला उसका छोटा फी-3 मॉडल, ओपनएआई के मॉडल के पिछले संस्करण GPT-3.5 से बेहतर प्रदर्शन करता है।
माइक्रोचिप्स क्लाउड पर सूचना भेजने के बजाय डिवाइस पर स्थानीय स्तर पर कार्यों को संसाधित कर सकती हैं, जो गोपनीयता के प्रति जागरूक ग्राहकों को आकर्षित कर सकती है, जो यह सुनिश्चित करना चाहते हैं कि सूचना नेटवर्क के भीतर ही रहे।
लॉ फर्म एडलेशॉ गोडार्ड की पार्टनर चार्लोट मार्शल ने कहा कि "मुझे लगता है कि जनरेटिव एआई उत्पादों को अपनाते समय हमारे कई ग्राहकों के सामने आने वाली चुनौतियों में से एक चुनौती डेटा प्रोसेसिंग और ट्रांसमिशन से जुड़ी नियामक आवश्यकताओं का अनुपालन करना है।" उन्होंने कहा कि छोटे मॉडल "व्यवसायों को नियामक और लागत संबंधी चिंताओं से उबरने का अवसर" प्रदान करते हैं।
छोटे मॉडल मोबाइल फ़ोन जैसे उपकरणों पर भी AI सुविधाओं को चलाने की अनुमति देते हैं। गूगल का "जेमिनी नैनो" मॉडल नवीनतम पिक्सेल फ़ोन और सैमसंग के नवीनतम S24 स्मार्टफ़ोन में अंतर्निहित है।
ऐप्पल ने यह भी खुलासा किया है कि वह अपने सबसे ज़्यादा बिकने वाले आईफ़ोन पर चलने के लिए एआई मॉडल विकसित कर रहा है। पिछले महीने, सिलिकॉन वैली की इस दिग्गज कंपनी ने ओपनईएलएम (OpenELM) जारी किया, जो टेक्स्ट-आधारित कार्यों को करने के लिए डिज़ाइन किया गया एक छोटा मॉडल है।
माइक्रोसॉफ्ट के बॉयड ने कहा कि छोटे मॉडल "फोन और लैपटॉप तक में दिलचस्प अनुप्रयोगों को जन्म देंगे।"
ओपनएआई के निदेशक सैम ऑल्टमैन ने नवंबर में कहा था कि वह ग्राहकों को "अलग-अलग उद्देश्यों के लिए" अलग-अलग आकार के एआई मॉडल भी उपलब्ध करा रहा है। उन्होंने कहा, "कुछ चीज़ें ऐसी हैं जो छोटे मॉडल वाकई अच्छी तरह से कर सकते हैं। मैं इसे लेकर उत्साहित हूँ।"
हालांकि, ऑल्टमैन ने कहा कि ओपनएआई अभी भी स्केलेबिलिटी के साथ बड़े एआई मॉडल बनाने पर ध्यान केंद्रित करेगा, जिसमें तर्क करने, योजना बनाने और कार्यों को निष्पादित करने की क्षमता और अंततः मानव-स्तर की बुद्धिमत्ता हासिल करना शामिल है।
होआंग हाई (एफटी के अनुसार)
[विज्ञापन_2]
स्रोत: https://www.congluan.vn/cac-cong-ty-ai-dang-tim-kiem-loi-nhuan-lon-tu-cac-mo-hinh-ngon-ngu-nho-post296219.html
टिप्पणी (0)