Vietnam.vn - Nền tảng quảng bá Việt Nam

هوش مصنوعی اصلی «ساخت ویتنام» شرکت CMC در رتبه ۱۲ جهان قرار گرفت

مدل CATI-VLM که توسط تیم تحقیقاتی CMC توسعه داده شده است، در رتبه‌بندی‌هایی که اخیراً توسط Robust Reading Competition در ژوئن 2025 اعلام شده است، در بین 12 مدل برتر جهان و 1 مدل برتر ویتنام قرار گرفته است.

VietNamNetVietNamNet03/07/2025


مدل هوش مصنوعی.jpg

تحول هوش مصنوعی در ویتنام با قدرت در حال وقوع است، فناوری OCR (تشخیص نوری کاراکتر) نقش مهمی در دیجیتالی کردن اسناد ایفا می‌کند. عکس: تصویرسازی

اخیراً، موسسه کاربرد فناوری CMC (CMC ATI) مدل CATI-VLM (درک بصری اسناد) را که توسط تیم تحقیقاتی از یک انبار داده بزرگ ۵ ترابایتی توسعه داده شده است، معرفی کرد و در رتبه‌بندی اعلام شده توسط مسابقه خواندن قدرتمند (RRC) در ژوئن ۲۰۲۵ در بخش پاسخ به سوالات بصری اسناد (DocVQA) به ۱۲ رتبه برتر جهان و ۱ رتبه برتر ویتنام رسید.

آقای دانگ مین توان، مدیر CMC ATI، اظهار داشت: «ما بسیار خوشحالیم که ظرفیت تحقیقاتی تیم CMC از طریق یک زمین بازی معتبر جهانی مانند RRC تأیید شده است. ما مفتخریم که تنها در مدت کوتاهی، این تیم می‌تواند به رتبه بالایی دست یابد و شانه به شانه نام‌های بزرگ کشورهای توسعه‌یافته بایستد. مهمتر از همه، این نشان روشنی از توانایی تسلط بر فناوری برای حل مشکلات خاص ویتنام و زمینه‌های تخصصی در ویتنام است.»

در زمینه تحول دیجیتال و تحول هوش مصنوعی که به شدت در ویتنام در حال وقوع است، فناوری OCR (تشخیص نوری کاراکتر) نقش مهمی در دیجیتالی کردن اسناد، خودکارسازی فرآیندهای تجاری، صرفه‌جویی در هزینه‌ها و بهبود بهره‌وری مدیریت ایفا می‌کند.

با این حال، با توجه به ویژگی‌های زبان ویتنامی با لهجه و دست‌خط، مشکل تشخیص به «خواندن کلمات» محدود نمی‌شود، بلکه مستلزم آن است که مدل توانایی درک جامع زمینه را داشته باشد.

CATI-VLM با OCR سنتی متفاوت است، زیرا نه تنها کاراکترها را استخراج می‌کند، بلکه لایه‌های چندگانه اطلاعات را نیز درک می‌کند: محتوای متن، عناصر غیرمتنی (کادرهای تیک، چک‌باکس‌ها، نمودارها، امضاها، فرمول‌ها)، طرح‌بندی (ساختار صفحه، جداول، فرم‌ها) و سبک (فونت‌ها، هایلایت‌ها…).

این مدل می‌تواند به سوالات بصری مطرح‌شده روی تصاویر سند، مشابه ChatGPT، بدون نیاز به یادگیری فرم‌های خاص از قبل، پاسخ دهد.

CMC AI.jpg

مسابقه‌ی «خواندن قدرتمند» (RRC) یک عرصه‌ی علمی معتبر است که توسط مرکز بینایی کامپیوتر دانشگاه خودمختار بارسلونا (UAB) اسپانیا، یک مرکز تحقیقاتی معتبر در جهان در زمینه‌ی بینایی کامپیوتر، سازماندهی می‌شود.

این مسابقه که در سال ۲۰۱۱ آغاز شد و همواره همراه با کنفرانس بین‌المللی تحلیل و تشخیص متن ICDAR - یکی از بزرگترین مجامع جهان در زمینه تحلیل اسناد و بینایی کامپیوتر - برگزار می‌شود، به رویدادی مهم تبدیل شده است که محققان، مهندسان دانشگاه‌های معتبر، مؤسسات تحقیقاتی و شرکت‌های فناوری مانند دانشگاه Tsinghua، گروه هیوندای موتور و Tencent را به خود جذب می‌کند...

ماموریت‌های RRC برای پیشبرد پیشرفت‌های فناوری طراحی شده‌اند که با مشکلات دنیای واقعی از ترجمه و مدیریت داده‌های سازمانی گرفته تا تجزیه و تحلیل شهری و پردازش اسناد تاریخی مرتبط هستند.

از کار تا فرزندپروری: چگونه مدیران عامل فناوری هر روز از هوش مصنوعی استفاده می‌کنند از جنسن هوانگ گرفته تا تیم کوک، قدرتمندترین مدیران عامل فناوری جهان در حال استفاده از هوش مصنوعی در زندگی روزمره خود هستند.

منبع: https://vietnamnet.vn/ai-loi-make-in-vietnam-cua-cmc-duoc-xep-hang-top-12-the-gioi-2417479.html


نظر (0)

No data
No data

در همان موضوع

در همان دسته‌بندی

شهر هوشی مین: خیابان فانوس لونگ نهو هوک برای استقبال از جشنواره نیمه پاییز رنگارنگ است
حفظ روحیه جشنواره اواسط پاییز از طریق رنگ‌های مجسمه‌ها
تنها روستای ویتنام را در بین ۵۰ روستای زیبای جهان کشف کنید
چرا فانوس‌های پرچم قرمز با ستاره‌های زرد امسال محبوب هستند؟

از همان نویسنده

میراث

شکل

کسب و کار

No videos available

اخبار

نظام سیاسی

محلی

محصول