![]() |
DeepSeek نیا AI ماڈل جاری کرتا ہے جو روایتی طریقوں سے 7-20 گنا کم ٹوکن کے ساتھ دستاویزات پر کارروائی کر سکتا ہے۔ تصویر: دی ورج ۔ |
SCMP کے مطابق، DeepSeek نے ایک نیا ملٹی موڈل مصنوعی ذہانت (AI) ماڈل جاری کیا ہے جو کہ روایتی ٹیکسٹ پروسیسنگ طریقوں سے 7-20 گنا کم ٹوکنز کے ساتھ بڑی اور پیچیدہ دستاویزات پر کارروائی کرنے کی صلاحیت رکھتا ہے۔
ٹوکن متن کی سب سے چھوٹی اکائیاں ہیں جن پر AI عمل کرتا ہے۔ ٹوکن کی تعداد کو کم کرنے کا مطلب ہے کمپیوٹیشنل اخراجات کو بچانا اور AI ماڈل کی کارکردگی میں اضافہ۔
اس کو حاصل کرنے کے لیے، ڈیپ سیک-او سی آر (آپٹیکل کریکٹر ریکگنیشن) ماڈل نے بصری ادراک کو معلومات کے کمپریشن کے ذریعہ استعمال کیا۔ یہ نقطہ نظر بڑے زبان کے ماڈلز کو متناسب طور پر بڑھے ہوئے کمپیوٹیشنل لاگت کے بغیر متن کی بڑی مقدار پر کارروائی کرنے کی اجازت دیتا ہے۔
ڈیپ سیک نے کہا، "ڈیپ سیک-او سی آر کے ذریعے، ہم نے یہ ثابت کیا ہے کہ معلومات کو کمپریس کرنے کے لیے بصری ادراک کا استعمال اہم ٹوکن کمی کو حاصل کر سکتا ہے - مختلف تاریخی سیاق و سباق کے ادوار کے لیے 7-20 بار سے، ایک امید افزا سمت فراہم کرتا ہے۔"
کمپنی کے بلاگ پوسٹ کے مطابق، DeepSeek-OCR دو اہم اجزاء پر مشتمل ہے، DeepEncoder اور DeepSeek3B-MoE-A570M، جو ایک ڈیکوڈر کے طور پر کام کرتا ہے۔
ان میں سے، DeepEncoder ماڈل کے بنیادی انجن کے طور پر کام کرتا ہے، ہائی ریزولوشن ان پٹ کے تحت کم ایکٹیویشن لیول کو برقرار رکھنے میں مدد کرتا ہے، جبکہ ٹوکنز کی تعداد کو کم کرنے کے لیے مضبوط کمپریشن ریشو حاصل کرتا ہے۔
ڈیکوڈر پھر ایک 570 ملین پیرامیٹر مکسچر آف ایکسپرٹس (MoE) ماڈل ہے جسے اصل متن کو دوبارہ تیار کرنے کا کام سونپا گیا ہے۔ MoE فن تعمیر ماڈل کو ذیلی نیٹ ورکس میں تقسیم کرتا ہے جو پورے ماڈل کو چالو کیے بغیر کارکردگی کو بہتر بناتے ہوئے، ان پٹ ڈیٹا کے سب سیٹ پر کارروائی کرنے میں مہارت رکھتے ہیں۔
OmniDocBench پر، ایک دستاویز پڑھنے کے قابل بینچ مارک، DeepSeek-OCR بڑے OCR ماڈلز جیسے GOT-OCR 2.0 اور MinerU 2.0 کو پیچھے چھوڑتا ہے، جبکہ بہت کم ٹوکن استعمال کرتا ہے۔
ماخذ: https://znews.vn/deepseek-lai-co-dot-pha-post1595902.html
تبصرہ (0)