Vietnam.vn - Nền tảng quảng bá Việt Nam

CMC ຈັດອັນດັບທີ 12 ໃນໂລກໃນການຮັບຮູ້ຂໍ້ຄວາມ

ຮູບແບບ CATI-VLM (Visual Document Understanding) ພັດທະນາໂດຍ CMC Technology Application Institute (CMC ATI) ໄດ້ລື່ນກາຍບັນດາຄູ່ແຂ່ງຂັນສາກົນເພື່ອບັນລຸ 12 ອັນດັບ 1 ຂອງໂລກ ແລະ ອັນດັບ 1 ຂອງຫວຽດນາມ ໃນການຈັດອັນດັບທີ່ປະກາດໂດຍ Robust Reading Competition (RRC) ໃນເດືອນ ມິຖຸນາ 2025 ໃນລາຍການ Document Visual Question Answering (DocVQA).

Báo Nhân dânBáo Nhân dân02/07/2025

ການຈັດອັນດັບ RRC ໃນໝວດ DocVQA 6/2025.

ການຈັດອັນດັບ RRC ໃນໝວດ DocVQA 6/2025.

​ໃນ​ສະພາບ​ການ​ຫັນ​ເປັນ​ດິຈິ​ຕອລ ​ແລະ ການ​ຜັນ​ຂະຫຍາຍ​ການ​ນຳ​ໃຊ້​ປັນຍາ​ປະດິດ​ຢູ່ ຫວຽດນາມ ພວມ​ດຳ​ເນີນ​ຢ່າງ​ແຮງ, ​ເຕັກ​ໂນ​ໂລ​ຢີ OCR (Optical Character Recognition) ​ໄດ້​ມີ​ບົດບາດ​ສຳຄັນ​ກວ່າ​ອີກ​ໃນ​ການ​ຫັນ​ເອກະສານ​ເປັນ​ດິຈິ​ຕອລ, ດຳ​ເນີນ​ທຸລະ​ກິດ​ຢ່າງ​ອັດຕະ​ໂນ​ມັດ, ປະຢັດ​ຕົ້ນ​ທຶນ ​ແລະ ຍົກ​ສູງ​ປະສິດທິ​ຜົນ​ການ​ຄຸ້ມ​ຄອງ. ​ເຖິງ​ຢ່າງ​ໃດ​ກໍ​ຕາມ, ດ້ວຍ​ລັກສະນະ​ພາສາ​ຫວຽດນາມ ດ້ວຍ​ສຳນຽງ ​ແລະ ການ​ຂຽນ​ດ້ວຍ​ມື, ບັນຫາ​ການ​ຮັບ​ຮູ້​ບໍ່​ໄດ້​ຢຸດ​ຢູ່​ທີ່ 'ການ​ອ່ານ​ຄຳ', ​ແຕ່​ຮຽກຮ້ອງ​ໃຫ້​ຕົວ​ແບບ​ມີ​ຄວາມ​ສາມາດ​ເຂົ້າ​ໃຈ​ສະພາບ​ການ​ຢ່າງ​ຄົບ​ຖ້ວນ.

ບໍ່ດົນມານີ້, CMC Technology Institute (CMC ATI) ໄດ້ປະກາດຕົວແບບ CATI-VLM (Visual Document Understanding) - ພັດທະນາໂດຍທີມວິໄຈຈາກສາງຂໍ້ມູນຂະໜາດໃຫຍ່ 5TB, ລື່ນກາຍຄູ່ແຂ່ງສາກົນຫຼາຍຄົນເພື່ອບັນລຸອັນດັບທີ 12 ໃນໂລກ ແລະ ອັນດັບ 1 ຂອງຫວຽດນາມ ໃນການຈັດອັນດັບພຽງແຕ່ປະກາດໂດຍການແຂ່ງຂັນອ່ານ Robust Reading Competition (RRC) ໃນເດືອນມິຖຸນາ 2020 ຜ່ານມາ (Quoc 2025). ປະເພດ.

Robust Reading Competition (RRC) ເປັນສະຫນາມເດັກຫຼິ້ນ ວິທະຍາສາດ ທີ່ມີຊື່ສຽງ, (https://rrc.cvc.uab.es/) ຈັດໂດຍ Computer Vision Center (CVC) ຂອງ Universitat Autònoma de Barcelona (UAB) ສະເປນ, ສະຖານທີ່ຄົ້ນຄ້ວາທີ່ມີຊື່ສຽງໃນໂລກໃນພາກສະຫນາມຂອງວິໄສທັດຄອມພິວເຕີ.

ການແຂ່ງຂັນໄດ້ຖືກລິເລີ່ມໃນປີ 2011 ແລະຖືກຈັດຂຶ້ນໃນທຸກໆປີໃນຂອບເຂດຂອງກອງປະຊຸມສາກົນກ່ຽວກັບການວິເຄາະຂໍ້ຄວາມແລະການຮັບຮູ້ (ICDAR) - ຫນຶ່ງໃນເວທີປຶກສາຫາລືດ້ານຄອມພິວເຕີຊັ້ນນໍາ ຂອງໂລກ . ການແຂ່ງຂັນໄດ້ດຶງດູດນັກຄົ້ນຄ້ວາແລະວິສະວະກອນຈໍານວນຫລາຍຈາກມະຫາວິທະຍາໄລ, ສະຖາບັນຄົ້ນຄ້ວາແລະບໍລິສັດເຕັກໂນໂລຢີຂະຫນາດໃຫຍ່ເຊັ່ນ: ມະຫາວິທະຍາໄລ Tsinghua, Hyundai Motor Group, Tencent ... ບັນຫາຂອງ RRC ຖືກອອກແບບມາເພື່ອສົ່ງເສີມຄວາມກ້າວຫນ້າທາງດ້ານເຕັກໂນໂລຢີ, ເຊື່ອມໂຍງຢ່າງໃກ້ຊິດກັບບັນຫາພາກປະຕິບັດຈາກການແປພາສາ, ການຄຸ້ມຄອງຂໍ້ມູນວິສາຫະກິດກັບການວິເຄາະຕົວເມືອງແລະການປຸງແຕ່ງເອກະສານປະຫວັດສາດ.

ທ່ານ ດັ້ງມິງຕ໋ວນ, ຜູ້ອຳນວຍການໃຫຍ່ CMC ATI ແບ່ງປັນວ່າ: “ພວກເຮົາດີໃຈຫຼາຍທີ່ຄວາມສາມາດຄົ້ນຄວ້າຂອງທີມ CMC ໄດ້ຮັບການຢັ້ງຢືນຜ່ານສະໜາມຫຼິ້ນລະດັບໂລກທີ່ມີຊື່ສຽງຄື RRC. ໃນເວລາສັ້ນໆ, ຄະນະຄົ້ນຄວ້າໄດ້ບັນລຸລະດັບສູງ, ສະແດງໃຫ້ເຫັນຄວາມສາມາດແຂ່ງຂັນສາກົນກັບບັນດາປະເທດທີ່ພັດທະນາແລ້ວ. ຫວຽດນາມ."

z6764757325423-eeef2a0ed90465644555dcab3096c25c.jpg

ດຣ ດັ້ງມິງຕວນ, ຜູ້ອໍານວຍການ CMC ATI.

CATI-VLM ແຕກຕ່າງຈາກ OCR ແບບດັ້ງເດີມທີ່ມັນບໍ່ພຽງແຕ່ສະກັດຕົວອັກສອນ, ແຕ່ຍັງເຂົ້າໃຈຫຼາຍຊັ້ນຂອງຂໍ້ມູນ: ເນື້ອໃນຂໍ້ຄວາມ, ອົງປະກອບທີ່ບໍ່ແມ່ນຂໍ້ຄວາມ (ກ່ອງຫມາຍຕິກ, ກ່ອງກາເຄື່ອງຫມາຍ, ຕາຕະລາງ, ລາຍເຊັນ, ສູດ), ຮູບແບບ (ໂຄງສ້າງຫນ້າ, ຕາຕະລາງ, ແບບຟອມ) ແລະຮູບແບບ (ຕົວອັກສອນ, ຈຸດເດັ່ນ, ແລະອື່ນໆ). ຮູບແບບດັ່ງກ່າວສາມາດຕອບຄໍາຖາມທີ່ເຫັນໃນຮູບພາບເອກະສານ, ຄ້າຍຄືກັບ ChatGPT, ໂດຍບໍ່ຕ້ອງຮຽນຮູ້ແບບຟອມສະເພາະກ່ອນ.

ໂດຍສະເພາະ, ໃນການຈັດອັນດັບ RRC, CATI-VLM ທີ່ມີພຽງແຕ່ 3 ຕື້ພາລາມິເຕີໄດ້ບັນລຸຄວາມຖືກຕ້ອງສູງສຸດໃນຊຸດຂໍ້ມູນ 4/7, ລື່ນກາຍຕົວແບບ Big Tech ຈໍານວນຫຼາຍເຊັ່ນ Deepseek (27 ຕື້ພາລາມິເຕີ), GPT-4 Vision Turbo + Amazon Textract OCR (ເທິງ 34) ຫຼື Baidu (ເທິງ 22).

ໝາກຜົນ​ດັ່ງກ່າວ​ຍັງ​ສະ​ແດງ​ໃຫ້​ເຫັນ​ວິທີ​ປະຕິບັດ, ສຸມ​ໃສ່​ເປັນ​ເຈົ້າ​ການ​ເຕັກ​ໂນ​ໂລ​ຊີ​ຫຼັກ​ແຫຼ່ງ, ປັບປຸງ​ຕົວ​ແບບ​ໃຫ້​ເໝາະ​ສົມ​ກັບ​ເງື່ອນ​ໄຂ​ພື້ນຖານ​ໂຄງ​ລ່າງ​ຂອງ​ຫວຽດນາມ ​ແທນ​ທີ່​ຈະ​ນັບ​ແຕ່​ຂະ​ບວນການ​ຂະ​ບວນການ.

ຮູບພາບ-2.jpg

ຕົວຢ່າງແບບຟອມສະຫມັກເຂົ້າວິທະຍາໄລ

ຮູບພາບ-3.jpg

ຂໍ້ຄວາມໄດ້ຖືກຮັບຮູ້ຈາກການຂຽນດ້ວຍມືໃນຮູບຂ້າງເທິງ.

ທ່ານ Nguyen Trung Chinh, ປະທານ​ສະພາ​ບໍລິຫານ, ປະທານ​ບໍລິຫານ​ກຸ່ມ​ເຕັກ​ໂນ​ໂລ​ຊີ CMC ​ເນັ້ນ​ໜັກ​ວ່າ: “ນີ້​ແມ່ນ​ໝາກຜົນ​ແຫ່ງ​ການ​ລົງທຶນ​ຢ່າງ​ບໍ່​ຢຸດ​ຢັ້ງ​ໃນ​ການ​ຄົ້ນ​ຄ້ວາ ​ແລະ ພັດທະນາ​ເຕັກ​ໂນ​ໂລ​ຊີ (R&D), CMC ບັນລຸ​ໄດ້​ບັນດາ​ຜົນງານ​ທີ່​ສູງ​ໃນ​ສະໜາມ​ກິລາ​ເຕັກ​ໂນ​ໂລ​ຊີ​ສາກົນ​ຢືນຢັນ​ຍຸດ​ທະ​ສາດ​ຊຳນານ​ເຕັກ​ໂນ​ໂລ​ຊີ​ຂອງ​ຫວຽດນາມ, ຄຽງ​ຄູ່​ກັບ​ທິດ​ຫັນ​ການ​ຫັນ​ເປັນ AI ປັນຍາ​ຊົນ ​ແລະ ​ເຂົ້າ​ສູ່​ຕະຫຼາດ​ເຕັກ​ໂນ​ໂລ​ຊີ​ສາກົນ​ຂອງ​ຫວຽດນາມ. ສ້າງຕໍາແຫນ່ງທີ່ສົມຄວນຢູ່ໃນແຜນທີ່ເຕັກໂນໂລຢີໂລກ."

CATI-VLM ຈະຖືກນໍາໄປໃຊ້ໃນລະບົບນິເວດຂອງ C.OpenAI, ລວມທັງ: ຜູ້ຊ່ວຍ virtual CLS ສໍາລັບການທົບທວນຄືນເອກະສານທາງດ້ານກົດຫມາຍ, CMC SmartDoc - ແພລະຕະຟອມການແປງເອກະສານດິຈິຕອນ, ລະບົບການຄຸ້ມຄອງຄວາມຮູ້ CMC KMS, ລະບົບການລາຍງານອັດຕະໂນມັດສໍາລັບຫ້ອງການ smart ແລະຄໍາຮ້ອງສະຫມັກ Agentic Documents ຮຸ່ນໃຫມ່.

ກວາງຮຸຍ

ທີ່ມາ: https://nhandan.vn/cmc-dat-top-12-the-gioi-ve-nhan-dang-van-ban-post891252.html


(0)

No data
No data

ດອກ​ຕາ​ເວັນ​ປ່າ​ຍ້ອມ​ຕົວ​ເມືອງ​ພູ​ດອຍ​ເປັນ​ສີ​ເຫຼືອງ, ດ່າ​ລາດ ໃນ​ລະ​ດູ​ທີ່​ສວຍ​ງາມ​ທີ່​ສຸດ​ຂອງ​ປີ
G-Dragon ໄດ້ລະເບີດຂຶ້ນກັບຜູ້ຊົມໃນລະຫວ່າງການສະແດງຂອງລາວຢູ່ຫວຽດນາມ
ແຟນເພດຍິງໃສ່ຊຸດແຕ່ງງານໄປຄອນເສີດ G-Dragon ທີ່ເມືອງ Hung Yen
ປະທັບໃຈກັບຄວາມງາມຂອງບ້ານ Lo Lo Chai ໃນລະດູການດອກໄມ້ buckwheat

ມໍລະດົກ

ຮູບ

ທຸລະກິດ

ປະທັບໃຈກັບຄວາມງາມຂອງບ້ານ Lo Lo Chai ໃນລະດູການດອກໄມ້ buckwheat

ເຫດການປະຈຸບັນ

ລະບົບການເມືອງ

ທ້ອງຖິ່ນ

ຜະລິດຕະພັນ