
ในบริบทของการเปลี่ยนแปลงทางดิจิทัลและการเปลี่ยนแปลงการประยุกต์ใช้ปัญญาประดิษฐ์ที่เกิดขึ้นอย่างแพร่หลายในเวียดนาม เทคโนโลยี OCR (การจดจำอักขระด้วยแสง) มีบทบาทสำคัญเพิ่มมากขึ้นในการแปลงเอกสารเป็นดิจิทัล การทำให้กระบวนการทางธุรกิจเป็นอัตโนมัติ การประหยัดต้นทุน และปรับปรุงประสิทธิภาพการบริหารจัดการ
อย่างไรก็ตาม ด้วยลักษณะเฉพาะของชาวเวียดนามที่มีสำเนียงและลายมือ ปัญหาการจดจำไม่ได้หยุดอยู่แค่การ "อ่านคำศัพท์" เท่านั้น แต่ยังต้องอาศัยแบบจำลองที่มีความสามารถในการเข้าใจบริบทอย่างครอบคลุมด้วย
เมื่อเผชิญกับความท้าทายดังกล่าว สถาบันการประยุกต์ใช้เทคโนโลยี CMC ( CMC ATI) ได้พัฒนาโมเดล CATI-VLM ซึ่งเป็นระบบสำหรับการทำความเข้าใจเอกสารโดยใช้คอมพิวเตอร์วิทัศน์ (Visual Document Understanding)
โดยอิงจากคลังข้อมูลขนาดใหญ่ถึง 5TB โมเดลนี้เพิ่งได้รับการจัดอันดับให้อยู่ในอันดับ 12 ของโลก และอันดับ 1 ในประเทศเวียดนามในการแข่งขัน Robust Reading Competition (RRC) ระดับนานาชาติ ประเภท Document Visual Question Answering (DocVQA) ซึ่งจัดขึ้นในเดือนมิถุนายน พ.ศ. 2568
ที่มา: https://nhandan.vn/infographic-tri-tue-nhan-tao-viet-vao-top-12-the-gioi-ve-nhan-dang-van-ban-post892567.html
การแสดงความคิดเห็น (0)