تحول هوش مصنوعی در ویتنام با قدرت در حال وقوع است، فناوری OCR (تشخیص نوری کاراکتر) نقش مهمی در دیجیتالی کردن اسناد ایفا میکند. عکس: تصویرسازی
اخیراً، موسسه کاربرد فناوری CMC (CMC ATI) مدل CATI-VLM (درک بصری اسناد) را که توسط تیم تحقیقاتی از یک انبار داده بزرگ ۵ ترابایتی توسعه داده شده است، معرفی کرد و در رتبهبندی اعلام شده توسط مسابقه خواندن قدرتمند (RRC) در ژوئن ۲۰۲۵ در بخش پاسخ به سوالات بصری اسناد (DocVQA) به ۱۲ رتبه برتر جهان و ۱ رتبه برتر ویتنام رسید.
آقای دانگ مین توان، مدیر CMC ATI، اظهار داشت: «ما بسیار خوشحالیم که ظرفیت تحقیقاتی تیم CMC از طریق یک زمین بازی معتبر جهانی مانند RRC تأیید شده است. ما مفتخریم که تنها در مدت کوتاهی، این تیم میتواند به رتبه بالایی دست یابد و شانه به شانه نامهای بزرگ کشورهای توسعهیافته بایستد. مهمتر از همه، این نشان روشنی از توانایی تسلط بر فناوری برای حل مشکلات خاص ویتنام و زمینههای تخصصی در ویتنام است.»
در زمینه تحول دیجیتال و تحول هوش مصنوعی که به شدت در ویتنام در حال وقوع است، فناوری OCR (تشخیص نوری کاراکتر) نقش مهمی در دیجیتالی کردن اسناد، خودکارسازی فرآیندهای تجاری، صرفهجویی در هزینهها و بهبود بهرهوری مدیریت ایفا میکند.
با این حال، با توجه به ویژگیهای زبان ویتنامی با لهجه و دستخط، مشکل تشخیص به «خواندن کلمات» محدود نمیشود، بلکه مستلزم آن است که مدل توانایی درک جامع زمینه را داشته باشد.
CATI-VLM با OCR سنتی متفاوت است، زیرا نه تنها کاراکترها را استخراج میکند، بلکه لایههای چندگانه اطلاعات را نیز درک میکند: محتوای متن، عناصر غیرمتنی (کادرهای تیک، چکباکسها، نمودارها، امضاها، فرمولها)، طرحبندی (ساختار صفحه، جداول، فرمها) و سبک (فونتها، هایلایتها…).
این مدل میتواند به سوالات بصری مطرحشده روی تصاویر سند، مشابه ChatGPT، بدون نیاز به یادگیری فرمهای خاص از قبل، پاسخ دهد.
مسابقهی «خواندن قدرتمند» (RRC) یک عرصهی علمی معتبر است که توسط مرکز بینایی کامپیوتر دانشگاه خودمختار بارسلونا (UAB) اسپانیا، یک مرکز تحقیقاتی معتبر در جهان در زمینهی بینایی کامپیوتر، سازماندهی میشود.
این مسابقه که در سال ۲۰۱۱ آغاز شد و همواره همراه با کنفرانس بینالمللی تحلیل و تشخیص متن ICDAR - یکی از بزرگترین مجامع جهان در زمینه تحلیل اسناد و بینایی کامپیوتر - برگزار میشود، به رویدادی مهم تبدیل شده است که محققان، مهندسان دانشگاههای معتبر، مؤسسات تحقیقاتی و شرکتهای فناوری مانند دانشگاه Tsinghua، گروه هیوندای موتور و Tencent را به خود جذب میکند...
ماموریتهای RRC برای پیشبرد پیشرفتهای فناوری طراحی شدهاند که با مشکلات دنیای واقعی از ترجمه و مدیریت دادههای سازمانی گرفته تا تجزیه و تحلیل شهری و پردازش اسناد تاریخی مرتبط هستند.
از کار تا فرزندپروری: چگونه مدیران عامل فناوری هر روز از هوش مصنوعی استفاده میکنند از جنسن هوانگ گرفته تا تیم کوک، قدرتمندترین مدیران عامل فناوری جهان در حال استفاده از هوش مصنوعی در زندگی روزمره خود هستند.
منبع: https://vietnamnet.vn/ai-loi-make-in-vietnam-cua-cmc-duoc-xep-hang-top-12-the-gioi-2417479.html
نظر (0)