Vietnam.vn - Nền tảng quảng bá Việt Nam

CMC, metin tanıma alanında dünya genelinde ilk 12 arasında yer almaktadır.

CMC Uygulamalı Teknoloji Enstitüsü (CMC ATI) tarafından geliştirilen CATI-VLM (Görsel Belge Anlama) modeli, Haziran 2025'te Robust Reading Competition (RRC) tarafından açıklanan Belge Görsel Soru Cevaplama (DocVQA) kategorisinde birçok uluslararası rakibini geride bırakarak küresel olarak ilk 12'ye ve Vietnam'da 1. sıraya yerleşti.

Báo Nhân dânBáo Nhân dân02/07/2025

RRC'nin DocVQA kategorisindeki sıralaması, Haziran 2025.

RRC'nin DocVQA kategorisindeki sıralaması, Haziran 2025.

Vietnam'da yaşanan hızlı dijital dönüşüm ve yapay zekanın benimsenmesiyle birlikte, optik karakter tanıma (OCR) teknolojisi, belge dijitalleştirme, iş süreçlerinin otomasyonu, maliyet tasarrufu ve yönetim verimliliğinin artırılmasında giderek daha önemli bir rol oynamaktadır. Bununla birlikte, aksanları ve el yazısı da dahil olmak üzere Vietnam dilinin kendine özgü özellikleri göz önüne alındığında, tanıma problemi sadece karakterleri 'okumanın' ötesine geçmekte; bağlamı kapsamlı bir şekilde anlayabilen bir model gerektirmektedir.

Son zamanlarda, CMC Uygulamalı Teknoloji Enstitüsü (CMC ATI), araştırma ekibi tarafından 5 TB'lık büyük bir veri deposundan geliştirilen CATI-VLM (Görsel Belge Anlama) modelinin, Haziran 2025'te Robust Reading Competition (RRC) tarafından yayınlanan Belge Görsel Soru Cevaplama (DocVQA) kategorisinde küresel olarak ilk 12'ye ve Vietnam'da 1. sıraya yerleşerek birçok uluslararası rakibini geride bıraktığını duyurdu.

Sağlam Okuma Yarışması (RRC), bilgisayar görüşü alanında dünyaca ünlü bir araştırma kurumu olan İspanya'daki Autònoma de Barcelona Üniversitesi (UAB) Bilgisayar Görüşü Merkezi (CVC) tarafından düzenlenen prestijli bir bilimsel yarışmadır (https://rrc.cvc.uab.es/).

2011 yılında başlatılan yarışma, bilgisayar görüşü alanındaki dünyanın önde gelen forumlarından biri olan Uluslararası Metin Analizi ve Tanıma Konferansı (ICDAR) çerçevesinde her yıl düzenlenmektedir. Yarışma, Tsinghua Üniversitesi, Hyundai Motor Grubu ve Tencent gibi üniversitelerden, araştırma enstitülerinden ve büyük teknoloji şirketlerinden çok sayıda araştırmacı ve mühendisi kendine çekmektedir. RRC problemleri, çeviri ve kurumsal veri yönetiminden kentsel analiz ve tarihi belge işlemeye kadar uzanan pratik sorunlarla yakından bağlantılı olarak teknolojik ilerlemeyi teşvik etmek üzere tasarlanmıştır.

CMC ATI Direktörü Dr. Dang Minh Tuan şunları söyledi: "CMC ekibinin araştırma yeteneklerinin RRC gibi prestijli bir küresel yarışma aracılığıyla onaylanmasından dolayı çok mutluyuz. Araştırma ekibi kısa sürede yüksek bir sıralama elde ederek gelişmiş ülkelerden önemli isimlerle uluslararası rekabet gücünü göstermiştir. Daha da önemlisi, bu, Vietnam dili ve Vietnam'daki özel alanlarla ilgili belirli sorunları çözmek için teknolojiyi kullanma yeteneğimizin açık bir kanıtıdır."

z6764757325423-eeef2a0ed90465644555dcab3096c25c.jpg

Dr. Dang Minh Tuan, CMC ATI Direktörü.

CATI-VLM, geleneksel OCR'den farklı olarak yalnızca karakterleri ayıklamakla kalmaz, aynı zamanda metin içeriği, metin dışı öğeler (onay kutuları, grafikler, imzalar, formüller), düzen (sayfa yapısı, tablolar, formlar) ve stil (yazı tipleri, vurgulama vb.) gibi çok katmanlı bilgileri de anlar. Model, ChatGPT'ye benzer şekilde, her bir formu önceden öğrenmeye gerek kalmadan belge görüntülerinde sorulan görsel soruları yanıtlayabilir.

Özellikle RRC sıralamasında, yalnızca 3 milyar parametreye sahip CATI-VLM, 7 veri setinden 4'ünde en yüksek doğruluğa ulaşarak Deepseek (27 milyar parametre), GPT-4 Vision Turbo + Amazon Textract OCR (ilk 34) ve Baidu (ilk 22) gibi birçok büyük teknoloji şirketinin modelini geride bıraktı.

Bu başarı aynı zamanda, ölçeklenebilirlik parametrelerinin peşinden koşmak yerine, temel teknolojilerde uzmanlaşmaya ve modelleri Vietnam'ın altyapı koşullarına uyacak şekilde optimize etmeye odaklanan pratik bir yaklaşımı da göstermektedir.

resim-2.jpg

Üniversiteye giriş başvuru formu örneği

resim-3.jpg

Yukarıdaki resimdeki el yazısından metnin kimliği tespit edilmiştir.

CMC Teknoloji Grubu Yönetim Kurulu Başkanı ve İcra Kurulu Başkanı Sayın Nguyen Trung Chinh şunları vurguladı: "Bu, on yılı aşkın süredir teknoloji araştırma ve geliştirme (Ar-Ge) alanındaki sürekli yatırımlarımızın sonucudur. CMC'nin uluslararası teknoloji arenasındaki yüksek başarıları, yapay zeka dönüşümüne ve küresel pazara yayılmaya yönelik yönelimimizle birlikte, Vietnam teknolojisine hakim olma stratejimizi teyit etmektedir. Vietnam zekasının küresel büyük teknoloji şirketleriyle rekabet edebilecek ve dünya teknoloji haritasında hak ettiği yeri alabilecek kapasitede olduğuna inanıyoruz."

CATI-VLM, C.OpenAI ürün ekosisteminde kullanılacak olup, bu ekosistemde yasal belgeleri incelemek için kullanılan CLS sanal asistanı, dijital belge dönüştürme platformu CMC SmartDoc, bilgi yönetim sistemi CMC KMS, akıllı ofisler için otomatik raporlama sistemi ve yeni nesil Agentic Documents uygulamaları yer almaktadır.

QUANG HUY

Kaynak: https://nhandan.vn/cmc-dat-top-12-the-gioi-ve-nhan-dang-van-ban-post891252.html


Yorum (0)

Duygularınızı paylaşmak için lütfen bir yorum bırakın!

Aynı konuda

Aynı kategoride

Aynı yazardan

Miras

Figür

İşletmeler

Güncel Olaylar

Siyasi Sistem

Yerel

Ürün

Happy Vietnam
Yaz Dalgalarına Binmek

Yaz Dalgalarına Binmek

Köklerimize geri dönmek

Köklerimize geri dönmek

DENİZDEN GELEN HEDİYELER

DENİZDEN GELEN HEDİYELER