01.ai के संस्थापक और गूगल चाइना के पूर्व प्रमुख ली काई-फू ने कहा कि मुख्यभूमि की कंपनियां कम मात्रा में डेटा पर प्रशिक्षित मॉडल बनाकर लागत में कटौती करती हैं, जिसके लिए कम कंप्यूटिंग शक्ति की आवश्यकता होती है, लेकिन हार्डवेयर अनुकूलित होता है।

यूसी बर्कले स्काईलैब और एलएमएसवाईएस द्वारा हाल ही में घोषित रैंकिंग के अनुसार, स्टार्टअप 01.ai का यी-लिंग्टनिंग मॉडल तीसरे स्थान पर रहा, जो x.AI के ग्रोक-2 के साथ संयुक्त रूप से, ओपनएआई और गूगल से पीछे है। यह रैंकिंग प्रश्नों के उत्तरों के लिए उपयोगकर्ताओं के स्कोर पर आधारित है।

2d82e5b153faa85bf01e3f82affa4e298ec4f24e.avif.jpg
एआई संचालन की लागत कम करना चीन के लिए अमेरिका से प्रतिस्पर्धा करने का एक तरीका है। फोटो: एफटी

01.ai और डीपसीक मुख्य भूमि की एआई कंपनियां हैं जो मॉडलों को प्रशिक्षित करने के लिए छोटे डेटासेट पर ध्यान केंद्रित करने की रणनीति अपना रही हैं, जबकि सस्ते, उच्च कुशल जनशक्ति को काम पर रख रही हैं।

एफटी ने कहा कि यी-लाइटनिंग की अनुमान लागत प्रति दस लाख टोकन 14 सेंट है, जबकि ओपनएआई के जीपीटी ओ1-मिनी की लागत 26 सेंट है। वहीं, जीपीटी 4o की लागत प्रति दस लाख टोकन 4.40 डॉलर तक है। प्रतिक्रिया उत्पन्न करने के लिए उपयोग किए जाने वाले टोकन की संख्या प्रत्येक क्वेरी की जटिलता पर निर्भर करती है।

यी-लाइटनिंग के संस्थापकों ने बताया कि कंपनी ने अलग-अलग उपयोग के मामलों के लिए फाइन-ट्यूनिंग से पहले "प्रारंभिक प्रशिक्षण" पर 30 लाख डॉलर खर्च किए। ली ने कहा कि उनका लक्ष्य "सर्वश्रेष्ठ मॉडल बनाना नहीं" था, बल्कि एक ऐसा प्रतिस्पर्धी मॉडल बनाना था जो "5-10 गुना सस्ता" हो।

01.ai, डीपसीक, मिनीमैक्स और स्टेपफुन ने जो विधि लागू की है उसे "विशेषज्ञ मॉडलिंग" कहा जाता है - जिसका सीधा सा अर्थ है डोमेन-विशिष्ट डेटासेट पर प्रशिक्षित कई न्यूरल नेटवर्क को संयोजित करना।

शोधकर्ता इस दृष्टिकोण को बड़े डेटा मॉडल के समान बुद्धिमत्ता प्राप्त करने का एक महत्वपूर्ण तरीका मानते हैं, लेकिन कम कंप्यूटिंग शक्ति के साथ। हालाँकि, इस दृष्टिकोण की कठिनाई यह है कि इंजीनियरों को प्रशिक्षण प्रक्रिया को केवल एक सामान्य मॉडल के बजाय "कई विशेषज्ञों" के साथ संचालित करना होगा।

उच्च-स्तरीय एआई चिप्स तक पहुंच में कठिनाइयों के कारण, चीनी कंपनियों ने उच्च-गुणवत्ता वाले डेटा सेट विकसित करने की ओर रुख किया है, जिसका उपयोग विशेषज्ञ मॉडलों को प्रशिक्षित करने के लिए किया जा सकता है, जिससे वे पश्चिमी प्रतिद्वंद्वियों के साथ प्रतिस्पर्धा कर सकेंगी।

ली ने कहा कि 01.ai के पास डेटा एकत्र करने के गैर-पारंपरिक तरीके हैं, जैसे पुस्तकों को स्कैन करना या वीचैट मैसेजिंग ऐप पर लेख एकत्र करना, जो खुली वेबसाइट पर उपलब्ध नहीं हैं।

संस्थापक का मानना ​​है कि सस्ती तकनीकी प्रतिभा के विशाल भंडार के कारण चीन, अमेरिका से बेहतर स्थिति में है।

(एफटी, ब्लूमबर्ग के अनुसार)

मेटा ने 'सेल्फ-लर्निंग' एआई मॉडल लॉन्च किया सोशल मीडिया की दिग्गज कंपनी मेटा ने अभी-अभी सेल्फ-लर्निंग इवैल्यूएशन (STE) फीचर के साथ एक नए एआई मॉडल की घोषणा की है, जो एआई विकास प्रक्रिया में मानवीय हस्तक्षेप को कम कर सकता है।