Transformasi AI di Vietnam sedang berlaku dengan kuat, teknologi OCR (pengiktirafan aksara optik) memainkan peranan yang semakin penting dalam pendigitalan dokumen. Foto: Ilustrasi
Baru-baru ini, Institut Aplikasi Teknologi CMC (CMC ATI) mengumumkan model CATI-VLM (Pemahaman Dokumen Visual) yang dibangunkan oleh pasukan penyelidik daripada gudang data besar 5TB, mencapai 12 Teratas di dunia dan 1 Teratas di Vietnam dalam ranking yang baru diumumkan oleh Pertandingan Membaca Teguh (RRC) pada Jun 2025 dalam kategori Menjawab Soalan VisualVQA (Doc.
Encik Dang Minh Tuan, Pengarah CMC ATI, berkongsi: "Kami amat berbesar hati kerana kapasiti penyelidikan pasukan CMC telah diperakui melalui taman permainan global yang berprestij seperti RRC. Kami berbangga bahawa dalam masa yang singkat, pasukan itu boleh mencapai kedudukan tinggi, berdiri bahu-membahu dengan nama-nama besar dari negara maju. Lebih penting lagi, ini adalah demonstrasi jelas mengenai teknologi dan kebolehan khusus di Vietnam."
Dalam konteks transformasi digital dan transformasi AI di Vietnam berlaku dengan kukuh, teknologi OCR (Optical Character Recognition) memainkan peranan yang semakin penting dalam mendigitalkan dokumen, mengautomasikan proses perniagaan, menjimatkan kos dan meningkatkan kecekapan pengurusan.
Namun, dengan ciri-ciri bahasa Vietnam dengan loghat dan tulisan tangan, masalah pengecaman tidak terhenti pada 'membaca perkataan', tetapi memerlukan model itu mempunyai kebolehan memahami konteks secara menyeluruh.
CATI-VLM berbeza daripada OCR tradisional kerana ia bukan sahaja mengekstrak aksara, tetapi juga memahami pelbagai lapisan maklumat: kandungan teks, elemen bukan teks (kotak tanda, kotak semak, carta, tandatangan, formula), reka letak (struktur halaman, jadual, borang) dan gaya (fon, sorotan…).
Model ini boleh menjawab soalan visual yang dikemukakan pada imej dokumen, serupa dengan ChatGPT, tanpa perlu mempelajari borang tertentu terlebih dahulu.
Pertandingan Membaca Teguh (RRC) ialah taman permainan saintifik yang berprestij, dianjurkan oleh Pusat Visi Komputer Universitat Autònoma de Barcelona (UAB) Sepanyol, sebuah kemudahan penyelidikan berprestij di dunia dalam bidang penglihatan komputer.
Dimulakan pada tahun 2011, sentiasa mengiringi Persidangan Antarabangsa mengenai Analisis Teks dan Pengiktirafan ICDAR - salah satu forum terbesar di dunia mengenai analisis dokumen dan visi komputer, pertandingan ini telah menjadi acara penting, menarik penyelidik, jurutera dari universiti berprestij, institut penyelidikan dan syarikat teknologi seperti Tsinghua University, Hyundai Motor Group, dan Tencent...
Misi RRC direka bentuk untuk memacu kemajuan teknologi, terikat dengan masalah dunia sebenar daripada terjemahan dan pengurusan data perusahaan kepada analitik bandar dan pemprosesan dokumen sejarah.
Daripada kerja kepada keibubapaan: Cara CEO teknologi menggunakan AI setiap hariDari Jensen Huang hingga Tim Cook, CEO teknologi paling berkuasa di dunia memanfaatkan AI dalam kehidupan seharian mereka.
Sumber: https://vietnamnet.vn/ai-loi-make-in-vietnam-cua-cmc-duoc-xep-hang-top-12-the-gioi-2417479.html
Komen (0)