![]() |
डीपसीक ने नया एआई मॉडल जारी किया है जो पारंपरिक तरीकों की तुलना में 7-20 गुना कम टोकन के साथ दस्तावेज़ों को संसाधित कर सकता है। फोटो: द वर्ज । |
एससीएमपी के अनुसार, डीपसीक ने एक नया मल्टी-मॉडल आर्टिफिशियल इंटेलिजेंस (एआई) मॉडल जारी किया है जो पारंपरिक टेक्स्ट प्रोसेसिंग विधियों की तुलना में 7-20 गुना कम टोकन के साथ बड़े और जटिल दस्तावेजों को संसाधित करने में सक्षम है।
टोकन पाठ की सबसे छोटी इकाइयाँ हैं जिन्हें AI संसाधित करता है। टोकन की संख्या कम करने का अर्थ है कम्प्यूटेशनल लागत में बचत और AI मॉडल की दक्षता में वृद्धि।
इसे प्राप्त करने के लिए, डीपसीक-ओसीआर (ऑप्टिकल कैरेक्टर रिकग्निशन) मॉडल ने सूचना संपीड़न के साधन के रूप में दृश्य बोध का उपयोग किया। यह दृष्टिकोण बड़े भाषा मॉडलों को आनुपातिक रूप से बढ़ी हुई कम्प्यूटेशनल लागत के बिना विशाल मात्रा में पाठ को संसाधित करने की अनुमति देता है।
डीपसीक ने कहा, "डीपसीक-ओसीआर के माध्यम से, हमने प्रदर्शित किया है कि सूचना को संपीड़ित करने के लिए दृश्य धारणा का उपयोग करने से महत्वपूर्ण सांकेतिक कटौती प्राप्त की जा सकती है - विभिन्न ऐतिहासिक संदर्भ अवधियों के लिए 7-20 गुना तक, जो एक आशाजनक दिशा प्रदान करता है।"
कंपनी के ब्लॉग पोस्ट के अनुसार, डीपसीक-ओसीआर में दो मुख्य घटक होते हैं, डीपएनकोडर और डीपसीक3बी-एमओई-ए570एम, जो डिकोडर के रूप में कार्य करता है।
उनमें से, डीपएनकोडर मॉडल के मुख्य इंजन के रूप में कार्य करता है, जो उच्च-रिज़ॉल्यूशन इनपुट के तहत कम सक्रियण स्तर को बनाए रखने में मदद करता है, जबकि टोकन की संख्या को कम करने के लिए मजबूत संपीड़न अनुपात प्राप्त करता है।
डिकोडर एक 570 मिलियन-पैरामीटर मिक्सचर-ऑफ-एक्सपर्ट्स (MoE) मॉडल है जिसका काम मूल पाठ को पुनः प्रस्तुत करना है। MoE आर्किटेक्चर मॉडल को उप-नेटवर्क में विभाजित करता है जो इनपुट डेटा के एक उप-समूह को संसाधित करने में विशेषज्ञता रखते हैं, जिससे पूरे मॉडल को सक्रिय किए बिना प्रदर्शन का अनुकूलन होता है।
ओमनीडॉकबेंच, जो कि एक दस्तावेज़ पठनीयता बेंचमार्क है, पर डीपसीक-ओसीआर, बहुत कम टोकन का उपयोग करते हुए, जीओटी-ओसीआर 2.0 और माइनरयू 2.0 जैसे प्रमुख ओसीआर मॉडलों से बेहतर प्रदर्शन करता है।
स्रोत: https://znews.vn/deepseek-lai-co-dot-pha-post1595902.html
टिप्पणी (0)