ڈیپ سیک نے ایک اور پیش رفت کی ہے۔

DeepSeek نے ایک نیا AI ماڈل جاری کیا ہے جو روایتی طریقوں سے 7-20 گنا کم ٹوکن کے ساتھ دستاویزات پر کارروائی کرنے کے قابل ہے۔ تصویر: دی ورج ۔

SCMP کے مطابق، DeepSeek نے ایک نیا ملٹی موڈل مصنوعی ذہانت (AI) ماڈل جاری کیا ہے جو روایتی ٹیکسٹ پروسیسنگ طریقوں کے مقابلے میں نمایاں طور پر کم ٹوکن کے ساتھ بڑی اور پیچیدہ دستاویزات پر کارروائی کرنے کے قابل ہے۔

ٹوکن متن کی سب سے چھوٹی اکائیاں ہیں جن پر AI عمل کرتا ہے۔ ٹوکن کی تعداد کو کم کرنے کا مطلب ہے کمپیوٹیشنل اخراجات کو بچانا اور AI ماڈل کی کارکردگی میں اضافہ۔

اس کو حاصل کرنے کے لیے، ڈیپ سیک-او سی آر (آپٹیکل کریکٹر ریکگنیشن) ماڈل نے بصری ادراک کو معلومات کو کمپریس کرنے کے ایک ذریعہ کے طور پر استعمال کیا۔ یہ نقطہ نظر بڑے زبان کے ماڈلز کو متناسب طور پر بڑھتے ہوئے کمپیوٹیشنل اخراجات اٹھائے بغیر متن کے بڑے حجم پر کارروائی کرنے کی اجازت دیتا ہے۔

ڈیپ سیک نے کہا، "ڈیپ سیک-او سی آر کے ذریعے، ہم نے یہ ظاہر کیا ہے کہ معلومات کو کمپریس کرنے کے لیے بصری ادراک کا استعمال اہم ٹوکن کمی کو حاصل کر سکتا ہے—مختلف تاریخی سیاق و سباق کے مراحل کے لیے 7-20 بار — ایک امید افزا سمت پیش کرتے ہوئے،" ڈیپ سیک نے کہا۔

کمپنی کے بلاگ پوسٹ کے مطابق، DeepSeek-OCR دو اہم اجزاء پر مشتمل ہے: DeepEncoder اور DeepSeek3B-MoE-A570M، جو ڈیکوڈر کے طور پر کام کرتا ہے۔

اس ماڈل میں، DeepEncoder بنیادی ٹول کے طور پر کام کرتا ہے، جو ٹوکنز کی تعداد کو کم کرنے کے لیے مضبوط کمپریشن ریشو حاصل کرتے ہوئے ہائی ریزولوشن ان پٹ کے تحت کم ایکٹیویشن لیول کو برقرار رکھنے میں مدد کرتا ہے۔

اس کے بعد، ڈیکوڈر 570 ملین پیرامیٹرز کے ساتھ ایک مکسچر آف ایکسپرٹس (MoE) ماڈل ہے، جسے اصل متن کی تشکیل نو کا کام سونپا گیا ہے۔ MoE فن تعمیر ماڈل کو ذیلی نیٹ ورکس میں تقسیم کرتا ہے جو پورے ماڈل کو چالو کیے بغیر کارکردگی کو بہتر بناتے ہوئے، ان پٹ ڈیٹا کے سب سیٹ پر کارروائی کرنے میں مہارت رکھتے ہیں۔

OmniDocBench پر، دستاویز کی پڑھنے کی اہلیت کا ایک معیار، DeepSeek-OCR نمایاں طور پر کم ٹوکن استعمال کرتے ہوئے، GOT-OCR 2.0 اور MinerU 2.0 جیسے بڑے OCR ماڈلز کو پیچھے چھوڑ دیتا ہے۔

ماخذ: https://znews.vn/deepseek-lai-co-dot-pha-post1595902.html