DeepSeek को पदावनत कर दिया गया है।

अलीबाबा के एआई मॉडल, क्वेन3 ने लाइवबेंच परीक्षणों में आर1 चरण उत्तीर्ण कर लिया है, जो प्रोग्रामिंग, गणित और डेटा विश्लेषण में ओपन-सोर्स मॉडल की क्षमताओं का आकलन करते हैं।

ZNews•06/05/2025

अलीबाबा द्वारा लॉन्च की गई नई तकनीक क्वेन3। फोटो: एससीएमपी ।

नवीनतम एआई बेंचमार्क परीक्षणों के अनुसार, अलीबाबा द्वारा हाल ही में जारी किया गया क्वेन3 कृत्रिम बुद्धिमत्ता मॉडल, डीपसीक के आर1 को पीछे छोड़कर दुनिया का सबसे उच्च श्रेणी का ओपन-सोर्स मॉडल बन गया है।

विशेष रूप से, लाइवबेंच से प्राप्त डेटा, जो एक स्वतंत्र प्लेटफॉर्म है और बड़े भाषा मॉडल (एलएलएम) को स्कोर करता है, जो चैटजीपीटी जैसी जनरेटिव एआई सेवाओं के लिए मूलभूत तकनीक है, से पता चलता है कि क्वेन3 ने परीक्षणों में आर1 को पीछे छोड़ दिया है।

ओपन-सोर्स एआई मॉडल की क्षमताओं के मूल्यांकन में प्रोग्रामिंग, गणित, डेटा विश्लेषण और भाषा निर्देश शामिल हैं।

अलीबाबा ने 28 अप्रैल को अपनी क्वेन3 एआई मॉडल श्रृंखला लॉन्च की। कंपनी का दावा है कि यह चैटबॉट ओपनएआई या गूगल के सर्वश्रेष्ठ मौजूदा मॉडलों को टक्कर दे सकता है, या कुछ मामलों में उनसे बेहतर प्रदर्शन भी कर सकता है।

235 अरब तक के पैरामीटर क्षमता के साथ, Qwen3 का प्रदर्शन DeepSeek-V2 और OpenAI GPT-4 के बराबर है, जिनमें क्रमशः लगभग 236 अरब और 175 अरब पैरामीटर हैं। मॉडल की यह श्रृंखला जारी होने के बाद उपयोगकर्ता जल्द ही इसे AI विकास प्लेटफॉर्म Hugging Face और GitHub पर ओपन लाइसेंस के तहत डाउनलोड कर सकेंगे।

कंपनी ने बताया कि Qwen3 संग्रह में हाइब्रिड मॉडल शामिल हैं, जिसका अर्थ है कि वे जटिल समस्याओं को हल करने या सरल अनुरोधों का तुरंत जवाब देने के लिए तर्क-वितर्क हेतु समय को लचीले ढंग से आवंटित कर सकते हैं। इस मॉडल में, तर्क क्षमता सूचना की सटीकता के स्व-सत्यापन की अनुमति देती है, लेकिन इसमें काफी समय लगता है।

इस डिज़ाइन की मदद से उपयोगकर्ता प्रत्येक विशिष्ट कार्य के लिए बजट को उचित रूप से आवंटित कर सकते हैं। इसके अलावा, यह मॉडल दुनिया भर के कई प्रतिस्पर्धियों से भी सीखता है।

डीपसीक के समान "मिक्सचर ऑफ एक्सपर्ट्स" (MoE) आर्किटेक्चर का उपयोग करके, Qwen3 प्रशिक्षण लागत के केवल एक अंश का उपयोग करते हुए कम्प्यूटेशनल प्रदर्शन को अनुकूलित कर सकता है। यह विधि कार्यों को कई अलग-अलग भागों में विभाजित करती है और उन्हें पूरा करने के लिए केवल पर्याप्त मात्रा में डेटा-गहन डेटा की आवश्यकता होती है।

विकास टीम के अनुसार, Qwen3 119 भाषाओं तक का समर्थन करता है और लगभग 36 ट्रिलियन टोकन (27 ट्रिलियन शब्दों के बराबर) के डेटासेट पर प्रशिक्षित है। प्रशिक्षण डेटा पाठ्यपुस्तकों, प्रश्न-उत्तर सेट, प्रोग्रामिंग कोड या यहां तक कि एआई-जनित डेटा आदि जैसे विभिन्न स्रोतों से लिया गया है।

ओपन-सोर्स रैंकिंग में शीर्ष पर होने के बावजूद, लाइवबेंच के विस्तारित बेंचमार्क परीक्षण से पता चलता है कि क्वेन3 अभी भी दुनिया के अग्रणी क्लोज्ड-सोर्स एआई मॉडलों से पीछे है। इनमें सबसे प्रमुख हैं ओपनएआई का o3, गूगल का जेमिनी प्रो 2.5 और एंथ्रोपिक का क्लाउड 3.7।

वर्तमान में, माइक्रोसॉफ्ट द्वारा समर्थित सबसे उन्नत ओपनएआई मॉडल, o3-mini high, विश्व स्तर पर एआई मॉडलों की समग्र रैंकिंग में शीर्ष पर है।

स्रोत: https://znews.vn/deepseek-bi-soan-ngoi-post1551500.html