Vietnam.vn - Nền tảng quảng bá Việt Nam

Độc lập - Tự do - Hạnh phúc

CMC متن کی شناخت میں دنیا کے ٹاپ 12 میں پہنچ گیا۔

CMC ٹیکنالوجی ایپلی کیشن انسٹی ٹیوٹ (CMC ATI) کی طرف سے تیار کردہ CATI-VLM (بصری دستاویز کی تفہیم) ماڈل نے حال ہی میں جون 2025 میں Robust Reading Competition (RRC) کی طرف سے اعلان کردہ درجہ بندی میں دنیا کے ٹاپ 12 اور ویتنام میں ٹاپ 1 تک پہنچنے کے لیے بہت سے بین الاقوامی حریفوں کو پیچھے چھوڑ دیا ہے۔

Báo Nhân dânBáo Nhân dân02/07/2025

DocVQA زمرہ 6/2025 میں RRC کی درجہ بندی۔

DocVQA زمرہ 6/2025 میں RRC کی درجہ بندی۔

ویتنام میں ڈیجیٹل تبدیلی اور مصنوعی ذہانت کی ایپلی کیشن کی تبدیلی کے تناظر میں، OCR ٹیکنالوجی (آپٹیکل کریکٹر ریکگنیشن) دستاویزات کو ڈیجیٹائز کرنے، کاروباری عمل کو خودکار بنانے، اخراجات کو بچانے اور انتظامی کارکردگی کو بہتر بنانے میں تیزی سے اہم کردار ادا کرتی ہے۔ تاہم، لہجے اور لکھاوٹ کے ساتھ ویتنامی کی خصوصیات کے ساتھ، شناخت کا مسئلہ 'الفاظ کو پڑھنے' پر نہیں رکتا، بلکہ اس کے لیے ماڈل کی ضرورت ہوتی ہے کہ وہ سیاق و سباق کو جامع طور پر سمجھنے کی صلاحیت رکھتا ہو۔

حال ہی میں، CMC ٹیکنالوجی ایپلی کیشن انسٹی ٹیوٹ (CMC ATI) نے CATI-VLM (بصری دستاویز کی تفہیم) ماڈل کا اعلان کیا - جسے تحقیقی ٹیم نے 5TB بڑے ڈیٹا گودام سے تیار کیا، بہت سے بین الاقوامی حریفوں کو پیچھے چھوڑ کر دنیا میں ٹاپ 12 اور ویتنام میں ٹاپ 1 رینکنگ میں پہلی پوزیشن حاصل کی۔ دستاویز بصری سوال کا جواب دینے والا (DocVQA) زمرہ۔

Robust Reading Competition (RRC) ایک باوقار سائنسی کھیل کا میدان ہے، (https://rrc.cvc.uab.es/) جس کا اہتمام کمپیوٹر ویژن سینٹر (CVC) Universitat Autònoma de Barcelona (UAB) اسپین کے ذریعے کیا گیا ہے، جو کمپیوٹر ویژن کے میدان میں دنیا میں ایک باوقار تحقیقی مرکز ہے۔

یہ مقابلہ 2011 میں شروع کیا گیا تھا اور ہر سال بین الاقوامی کانفرنس آن ٹیکسٹ اینالیسس اینڈ ریکگنیشن (ICDAR) کے فریم ورک کے اندر منعقد کیا جاتا ہے - جو کمپیوٹر ویژن کے شعبے میں دنیا کے معروف فورمز میں سے ایک ہے۔ مقابلہ یونیورسٹیوں، تحقیقی اداروں اور بڑے ٹیکنالوجی کارپوریشنوں جیسے سنگھوا یونیورسٹی، ہنڈائی موٹر گروپ، ٹینسنٹ کے محققین اور انجینئروں کی ایک بڑی تعداد کو اپنی طرف متوجہ کرتا ہے... RRC کے مسائل تکنیکی ترقی کو فروغ دینے کے لیے بنائے گئے ہیں، جو ترجمہ، انٹرپرائز ڈیٹا مینجمنٹ سے لے کر شہری تجزیہ اور تاریخی دستاویز کی پروسیسنگ تک عملی مسائل سے قریب سے جڑے ہوئے ہیں۔

سی ایم سی اے ٹی آئی کے ڈائریکٹر ڈاکٹر ڈانگ من ٹوان نے کہا: "ہمیں بہت خوشی ہے کہ CMC ٹیم کی تحقیقی صلاحیت کو RRC جیسے باوقار عالمی کھیل کے میدان کے ذریعے ثابت کیا گیا ہے۔ صرف بہت کم وقت میں، تحقیقی ٹیم نے ترقی یافتہ ممالک کے بڑے ناموں کے ساتھ اپنی بین الاقوامی مسابقت کا مظاہرہ کرتے ہوئے اعلیٰ درجہ بندی حاصل کی ہے۔ ویتنام میں خصوصی فیلڈز۔"

z6764757325423-eeef2a0ed90465644555dcab3096c25c.jpg

ڈاکٹر ڈانگ من ٹوان، سی ایم سی اے ٹی آئی کے ڈائریکٹر۔

CATI-VLM روایتی OCR سے اس لحاظ سے مختلف ہے کہ یہ نہ صرف حروف کو نکالتا ہے، بلکہ معلومات کی متعدد پرتوں کو بھی سمجھتا ہے: متن کا مواد، غیر متنی عناصر (ٹک باکس، چیک باکس، چارٹ، دستخط، فارمولے)، لے آؤٹ (صفحہ کا ڈھانچہ، میزیں، فارم) اور طرز (فونٹس، ہائی لائٹس، وغیرہ)۔ ماڈل ChatGPT کی طرح دستاویز کی تصاویر پر پوچھے گئے بصری سوالات کا جواب دے سکتا ہے، بغیر کسی مخصوص فارم کو پہلے سے سیکھے۔

خاص طور پر، RRC درجہ بندی پر، CATI-VLM نے صرف 3 بلین پیرامیٹرز کے ساتھ 4/7 ڈیٹا سیٹس میں سب سے زیادہ درستگی حاصل کی، جس نے بہت سے Big Tech ماڈلز جیسے Deepseek (27 بلین پیرامیٹرز)، GPT-4 Vision Turbo + Amazon Textract OCR (ٹاپ 34) یا Baidu (ٹاپ 2) کو پیچھے چھوڑ دیا۔

یہ کامیابی ایک عملی نقطہ نظر کو بھی ظاہر کرتی ہے، بنیادی ٹیکنالوجی میں مہارت حاصل کرنے پر توجہ مرکوز کرتے ہوئے، پیرامیٹر پیمانے کا پیچھا کرنے کے بجائے ویتنام کے بنیادی ڈھانچے کے حالات کے مطابق ماڈل کو بہتر بنانا۔

image-2.jpg

نمونہ کالج داخلہ درخواست فارم

image-3.jpg

مندرجہ بالا تصویر میں ہینڈ رائٹنگ سے متن کو پہچانا گیا ہے۔

جناب Nguyen Trung Chinh، بورڈ آف ڈائریکٹرز کے چیئرمین، CMC ٹیکنالوجی گروپ کے ایگزیکٹو چیئرمین، نے زور دیا: "یہ ٹیکنالوجی ریسرچ اینڈ ڈیولپمنٹ (R&D) میں ایک دہائی سے زیادہ کی مسلسل سرمایہ کاری کا نتیجہ ہے۔ بین الاقوامی ٹیکنالوجی کے کھیل کے میدان میں CMC کی اعلیٰ کامیابیاں ویتنامی ٹیکنالوجی میں مہارت حاصل کرنے کی حکمت عملی کی توثیق کرتی ہیں۔ عالمی بگ ٹیک کے ساتھ کندھے سے کندھا ملا کر کھڑا ہونے کی پوری صلاحیت رکھتا ہے، جس سے دنیا کے ٹیکنالوجی کے نقشے پر ایک قابل مقام مقام پیدا ہوتا ہے۔"

CATI-VLM کا اطلاق C.OpenAI ماحولیاتی نظام کے پروڈکٹ چین میں کیا جائے گا، بشمول: قانونی دستاویزات کا جائزہ لینے کے لیے CLS ورچوئل اسسٹنٹ، CMC SmartDoc - ڈیجیٹل دستاویز کی تبدیلی کا پلیٹ فارم، CMC KMS نالج مینجمنٹ سسٹم، سمارٹ آفسز کے لیے خودکار رپورٹنگ سسٹم اور نئی نسل کے ایجنٹی دستاویزات کی ایپلی کیشنز۔

QUANG HUY

ماخذ: https://nhandan.vn/cmc-dat-top-12-the-gioi-ve-nhan-dang-van-ban-post891252.html


تبصرہ (0)

No data
No data

اسی موضوع میں

اسی زمرے میں

Su 30-MK2 لڑاکا طیاروں نے جامنگ گولے گرائے، ہیلی کاپٹروں نے دارالحکومت کے آسمان پر پرچم بلند کیا
Su-30MK2 لڑاکا طیارہ دارالحکومت کے آسمان پر ایک چمکتا ہوا گرمی کا جال گرا رہا ہے
(لائیو) 2 ستمبر کو قومی دن منانے کے لیے جشن، پریڈ، اور مارچ کی جنرل ریہرسل
ڈوونگ ہوانگ ین ایک کیپیلا گاتا ہے "فادر لینڈ ان دی سن لائٹ" جس سے شدید جذبات پیدا ہوتے ہیں

اسی مصنف کی

ورثہ

پیکر

کاروبار

No videos available

خبریں

سیاسی نظام

مقامی

پروڈکٹ