Vietnam.vn - Nền tảng quảng bá Việt Nam

Độc lập - Tự do - Hạnh phúc

CMC ບັນລຸອັນດັບ 12 ຂອງໂລກໃນການຮັບຮູ້ຂໍ້ຄວາມ

ຮູບແບບ CATI-VLM (Visual Document Understanding) ພັດທະນາໂດຍ CMC Technology Application Institute (CMC ATI) ໄດ້ລື່ນກາຍບັນດາຄູ່ແຂ່ງຂັນສາກົນເພື່ອບັນລຸ 12 ອັນດັບ 1 ຂອງໂລກ ແລະ ອັນດັບ 1 ຂອງຫວຽດນາມ ໃນການຈັດອັນດັບທີ່ປະກາດໂດຍ Robust Reading Competition (RRC) ໃນເດືອນ ມິຖຸນາ 2025 ໃນລາຍການ Document Visual Question Answering (DocVQA).

Báo Nhân dânBáo Nhân dân02/07/2025

ການຈັດອັນດັບ RRC ໃນໝວດ DocVQA 6/2025.

ການຈັດອັນດັບ RRC ໃນໝວດ DocVQA 6/2025.

​ໃນ​ສະພາບ​ການ​ຫັນ​ເປັນ​ດິຈິ​ຕອລ ​ແລະ ການ​ຜັນ​ຂະຫຍາຍ​ການ​ນຳ​ໃຊ້​ປັນຍາ​ປະດິດ​ຢູ່​ຫວຽດນາມ, ​ເຕັກ​ໂນ​ໂລ​ຊີ OCR (Optical Character Recognition) ​ໄດ້​ມີ​ບົດບາດ​ສຳຄັນ​ກວ່າ​ອີກ​ໃນ​ການ​ຫັນ​ເອກະສານ​ເປັນ​ດິຈິ​ຕອລ, ​ເຮັດ​ໃຫ້​ຂະ​ບວນການ​ດຳ​ເນີນ​ທຸລະ​ກິດ​ອັດ​ຕະໂນ​ມັດ, ປະຢັດ​ຕົ້ນ​ທຶນ ​ແລະ ປັບປຸງ​ປະສິດທິ​ຜົນ​ການ​ຄຸ້ມ​ຄອງ. ​ເຖິງ​ຢ່າງ​ໃດ​ກໍ​ຕາມ, ດ້ວຍ​ລັກສະນະ​ພາສາ​ຫວຽດນາມ ດ້ວຍ​ສຳນຽງ ​ແລະ ການ​ຂຽນ​ດ້ວຍ​ມື, ບັນຫາ​ການ​ຮັບ​ຮູ້​ບໍ່​ໄດ້​ຢຸດ​ຢູ່​ທີ່ 'ການ​ອ່ານ​ຄຳ', ​ແຕ່​ຮຽກຮ້ອງ​ໃຫ້​ຕົວ​ແບບ​ມີ​ຄວາມ​ສາມາດ​ເຂົ້າ​ໃຈ​ສະພາບ​ການ​ຢ່າງ​ຄົບ​ຖ້ວນ.

ບໍ່ດົນມານີ້, CMC Technology Institute (CMC ATI) ໄດ້ປະກາດຕົວແບບ CATI-VLM (Visual Document Understanding) - ພັດທະນາໂດຍທີມວິໄຈຈາກສາງຂໍ້ມູນຂະໜາດໃຫຍ່ 5TB, ລື່ນກາຍຄູ່ແຂ່ງສາກົນຫຼາຍຄົນເພື່ອບັນລຸອັນດັບທີ 12 ໃນໂລກ ແລະ ອັນດັບ 1 ຂອງຫວຽດນາມ ໃນການຈັດອັນດັບພຽງແຕ່ປະກາດໂດຍການແຂ່ງຂັນອ່ານ Robust Reading Competition (RRC) ໃນເດືອນມິຖຸນາ 2020 ຜ່ານມາ (Quoc 2025). ປະເພດ.

Robust Reading Competition (RRC) ເປັນສະຫນາມເດັກຫຼິ້ນ ວິທະຍາສາດ ທີ່ມີຊື່ສຽງ, (https://rrc.cvc.uab.es/) ຈັດໂດຍ Computer Vision Center (CVC) ຂອງ Universitat Autònoma de Barcelona (UAB) ສະເປນ, ສະຖານທີ່ຄົ້ນຄ້ວາທີ່ມີຊື່ສຽງໃນໂລກໃນພາກສະຫນາມຂອງວິໄສທັດຄອມພິວເຕີ.

ການແຂ່ງຂັນໄດ້ຖືກລິເລີ່ມໃນປີ 2011 ແລະຖືກຈັດຂຶ້ນໃນທຸກໆປີໃນຂອບເຂດຂອງກອງປະຊຸມສາກົນກ່ຽວກັບການວິເຄາະຂໍ້ຄວາມແລະການຮັບຮູ້ (ICDAR) - ຫນຶ່ງໃນເວທີປຶກສາຫາລືດ້ານຄອມພິວເຕີຊັ້ນນໍາ ຂອງໂລກ . ການແຂ່ງຂັນໄດ້ດຶງດູດນັກຄົ້ນຄ້ວາແລະວິສະວະກອນຈໍານວນຫລາຍຈາກມະຫາວິທະຍາໄລ, ສະຖາບັນຄົ້ນຄ້ວາແລະບໍລິສັດເຕັກໂນໂລຢີຂະຫນາດໃຫຍ່ເຊັ່ນ: ມະຫາວິທະຍາໄລ Tsinghua, Hyundai Motor Group, Tencent ... ບັນຫາຂອງ RRC ຖືກອອກແບບມາເພື່ອສົ່ງເສີມຄວາມກ້າວຫນ້າທາງດ້ານເຕັກໂນໂລຢີ, ເຊື່ອມໂຍງຢ່າງໃກ້ຊິດກັບບັນຫາພາກປະຕິບັດຈາກການແປພາສາ, ການຄຸ້ມຄອງຂໍ້ມູນວິສາຫະກິດກັບການວິເຄາະຕົວເມືອງແລະການປຸງແຕ່ງເອກະສານປະຫວັດສາດ.

ທ່ານ ດັ້ງມິງຕ໋ວນ, ຜູ້ອຳນວຍການໃຫຍ່ CMC ATI ແບ່ງປັນວ່າ: “ພວກເຮົາດີໃຈຫຼາຍທີ່ຄວາມສາມາດບົ່ມຊ້ອນຂອງທີມ CMC ໄດ້ຮັບການຢັ້ງຢືນຜ່ານສະໜາມຫຼິ້ນລະດັບໂລກທີ່ມີຊື່ສຽງຄື RRC. ໃນເວລາສັ້ນໆ, ຄະນະວິໄຈໄດ້ບັນລຸລະດັບສູງ, ສະແດງໃຫ້ເຫັນຄວາມສາມາດແຂ່ງຂັນສາກົນກັບບັນດາປະເທດທີ່ພັດທະນາແລ້ວ. ສິ່ງສຳຄັນກວ່ານັ້ນແມ່ນຄວາມສາມາດບົ່ມຊ້ອນສະເພາະຂອງຫວຽດນາມ ເພື່ອແກ້ໄຂບັນດາບັນຫາພິເສດຂອງຫວຽດນາມ.

z6764757325423-eeef2a0ed90465644555dcab3096c25c.jpg

ດຣ ດັ້ງມິງຕວນ, ຜູ້ອໍານວຍການ CMC ATI.

CATI-VLM ແຕກຕ່າງຈາກ OCR ແບບດັ້ງເດີມທີ່ມັນບໍ່ພຽງແຕ່ສະກັດຕົວອັກສອນ, ແຕ່ຍັງເຂົ້າໃຈຫຼາຍຊັ້ນຂອງຂໍ້ມູນ: ເນື້ອໃນຂໍ້ຄວາມ, ອົງປະກອບທີ່ບໍ່ແມ່ນຂໍ້ຄວາມ (ກ່ອງຫມາຍຕິກ, ກ່ອງກາເຄື່ອງຫມາຍ, ຕາຕະລາງ, ລາຍເຊັນ, ສູດ), ຮູບແບບ (ໂຄງສ້າງຫນ້າ, ຕາຕະລາງ, ແບບຟອມ) ແລະຮູບແບບ (ຕົວອັກສອນ, ຈຸດເດັ່ນ, ແລະອື່ນໆ). ຮູບແບບດັ່ງກ່າວສາມາດຕອບຄໍາຖາມທີ່ເຫັນໃນຮູບພາບເອກະສານ, ຄ້າຍຄືກັບ ChatGPT, ໂດຍບໍ່ຕ້ອງຮຽນຮູ້ແບບຟອມສະເພາະລ່ວງຫນ້າ.

ໂດຍສະເພາະ, ໃນການຈັດອັນດັບ RRC, CATI-VLM ທີ່ມີພຽງແຕ່ 3 ຕື້ພາລາມິເຕີໄດ້ບັນລຸຄວາມຖືກຕ້ອງສູງສຸດໃນຊຸດຂໍ້ມູນ 4/7, ລື່ນກາຍຕົວແບບ Big Tech ຈໍານວນຫຼາຍເຊັ່ນ Deepseek (27 ຕື້ພາລາມິເຕີ), GPT-4 Vision Turbo + Amazon Textract OCR (ເທິງ 34) ຫຼື Baidu (ເທິງ 22).

ໝາກຜົນ​ດັ່ງກ່າວ​ຍັງ​ສະ​ແດງ​ໃຫ້​ເຫັນ​ວິທີ​ປະຕິບັດ, ສຸມ​ໃສ່​ເປັນ​ເຈົ້າ​ການ​ເຕັກ​ໂນ​ໂລ​ຊີ​ຫຼັກ​ແຫຼ່ງ, ປັບປຸງ​ຕົວ​ແບບ​ໃຫ້​ເໝາະ​ສົມ​ກັບ​ເງື່ອນ​ໄຂ​ພື້ນຖານ​ໂຄງ​ລ່າງ​ຂອງ​ຫວຽດນາມ ​ແທນ​ທີ່​ຈະ​ນັບ​ແຕ່​ຂະ​ບວນການ​ຂະ​ບວນການ.

ຮູບພາບ-2.jpg

ຕົວຢ່າງແບບຟອມສະຫມັກເຂົ້າວິທະຍາໄລ

ຮູບພາບ-3.jpg

ຂໍ້ຄວາມໄດ້ຖືກຮັບຮູ້ຈາກການຂຽນດ້ວຍມືໃນຮູບຂ້າງເທິງ.

ທ່ານ Nguyen Trung Chinh, ປະທານ​ຄະນະ​ກຳມະການ, ປະທານ​ບໍລິຫານ​ກຸ່ມ​ເຕັກ​ໂນ​ໂລ​ຊີ CMC ​ເນັ້ນ​ໜັກ​ວ່າ: “ນີ້​ແມ່ນ​ໝາກຜົນ​ຂອງ​ຫຼາຍ​ທົດ​ສະ​ວັດ​ແຫ່ງ​ການ​ລົງທຶນ​ຢ່າງ​ບໍ່​ຢຸດ​ຢັ້ງ​ເຂົ້າ​ໃນ​ການ​ຄົ້ນ​ຄ້ວາ ​ແລະ ພັດທະນາ​ເຕັກ​ໂນ​ໂລ​ຊີ (R&D). ສ້າງຕໍາແຫນ່ງທີ່ສົມຄວນຢູ່ໃນແຜນທີ່ເຕັກໂນໂລຢີໂລກ."

CATI-VLM ຈະຖືກນໍາໄປໃຊ້ໃນລະບົບນິເວດຂອງ C.OpenAI, ລວມທັງ: ຜູ້ຊ່ວຍ virtual CLS ສໍາລັບການທົບທວນຄືນເອກະສານທາງດ້ານກົດຫມາຍ, CMC SmartDoc - ແພລະຕະຟອມການແປງເອກະສານດິຈິຕອນ, ລະບົບການຄຸ້ມຄອງຄວາມຮູ້ CMC KMS, ລະບົບການລາຍງານອັດຕະໂນມັດສໍາລັບຫ້ອງການ smart ແລະຄໍາຮ້ອງສະຫມັກ Agentic Documents ຮຸ່ນໃຫມ່.

ກວາງຮຸຍ

ທີ່ມາ: https://nhandan.vn/cmc-dat-top-12-the-gioi-ve-nhan-dang-van-ban-post891252.html


(0)

No data
No data

ຍົນ​ຮົບ Su 30-MK2 ​ໄດ້​ຍິງ​ລູກ​ສອນ​ໄຟ​ທີ່​ຕິດ​ຂັດ, ​ເຮືອບິນ​ເຮ​ລິ​ຄອບ​ເຕີ​ຍົກ​ທຸງ​ຂຶ້ນ​ສູ່​ທ້ອງຟ້າ​ນະຄອນຫຼວງ.
ຊົມ​ເບິ່ງ​ຍົນ​ສູ້​ຮົບ Su-30MK2 ຕົກ​ໃສ່​ກັບ​ດັກ​ຄວາມ​ຮ້ອນ​ທີ່​ສ່ອງ​ແສງ​ຢູ່​ເທິງ​ທ້ອງ​ຟ້າ​ຂອງ​ນະຄອນຫຼວງ.
(ສົດ) ການຊ້ອມຮົບທົ່ວໄປຂອງການສະເຫລີມສະຫລອງ, ຂະບວນແຫ່ ແລະ ແຫ່ຂະບວນສະເຫຼີມສະຫຼອງວັນຊາດ 2 ກັນຍາ
Duong Hoang Yen ຮ້ອງເພງ “ບັນພະບຸລຸດຢູ່ແສງຕາເວັນ” ເຮັດໃຫ້ອາລົມແຂງແຮງ

ມໍລະດົກ

ຮູບ

ທຸລະກິດ

No videos available

ຂ່າວ

ລະບົບການເມືອງ

ທ້ອງຖິ່ນ

ຜະລິດຕະພັນ