![]() |
DeepSeek ປ່ອຍຕົວແບບ AI ໃໝ່ ທີ່ສາມາດປະມວນຜົນເອກະສານທີ່ມີ tokens ໜ້ອຍກວ່າວິທີການແບບດັ້ງເດີມ 7-20 ເທົ່າ. ພາບ: The Verge . |
ອີງຕາມການ SCMP , DeepSeek ໄດ້ປ່ອຍຕົວແບບ multi-modal artificial intelligence (AI) ທີ່ມີຄວາມສາມາດໃນການປຸງແຕ່ງເອກະສານຂະຫນາດໃຫຍ່ແລະສະລັບສັບຊ້ອນທີ່ມີຈໍານວນ tokens ຕ່ໍາຢ່າງຫຼວງຫຼາຍ, 7-20 ເວລາຫນ້ອຍກ່ວາວິທີການປຸງແຕ່ງຂໍ້ຄວາມແບບດັ້ງເດີມ.
ໂຕເຄັນແມ່ນເປັນຫົວໜ່ວຍນ້ອຍທີ່ສຸດຂອງຂໍ້ຄວາມທີ່ AI ປະມວນຜົນ. ການຫຼຸດຜ່ອນຈໍານວນ tokens ຫມາຍເຖິງການປະຫຍັດຄ່າໃຊ້ຈ່າຍໃນຄອມພິວເຕີ້ແລະການເພີ່ມປະສິດທິພາບຂອງຕົວແບບ AI.
ເພື່ອບັນລຸສິ່ງດັ່ງກ່າວ, ຮູບແບບ DeepSeek-OCR (ການຮັບຮູ້ຕົວອັກສອນ optical) ໄດ້ໃຊ້ການຮັບຮູ້ທາງສາຍຕາເປັນວິທີການບີບອັດຂໍ້ມູນ. ວິທີການນີ້ອະນຸຍາດໃຫ້ຕົວແບບພາສາຂະຫນາດໃຫຍ່ສາມາດປຸງແຕ່ງຂໍ້ຄວາມຈໍານວນຫຼວງຫຼາຍໂດຍບໍ່ຈໍາເປັນຕ້ອງມີຄ່າໃຊ້ຈ່າຍໃນຄອມພິວເຕີ້ເພີ່ມຂຶ້ນຕາມອັດຕາສ່ວນ.
"ຜ່ານ DeepSeek-OCR, ພວກເຮົາໄດ້ສະແດງໃຫ້ເຫັນວ່າການນໍາໃຊ້ການຮັບຮູ້ທາງສາຍຕາເພື່ອບີບອັດຂໍ້ມູນສາມາດບັນລຸການຫຼຸດລົງທີ່ສໍາຄັນ - ຈາກ 7-20 ເທື່ອສໍາລັບໄລຍະເວລາປະຫວັດສາດທີ່ແຕກຕ່າງກັນ, ສະຫນອງທິດທາງທີ່ດີ," DeepSeek ເວົ້າ.
ອີງຕາມການຕອບ blog ຂອງບໍລິສັດ, DeepSeek-OCR ປະກອບດ້ວຍສອງອົງປະກອບຕົ້ນຕໍ, DeepEncoder ແລະ DeepSeek3B-MoE-A570M, ເຊິ່ງເຮັດຫນ້າທີ່ເປັນຕົວຖອດລະຫັດ.
ໃນບັນດາພວກເຂົາ, DeepEncoder ເຮັດຫນ້າທີ່ເປັນເຄື່ອງຈັກຫຼັກຂອງຕົວແບບ, ຊ່ວຍຮັກສາລະດັບການກະຕຸ້ນຕ່ໍາພາຍໃຕ້ການປ້ອນຂໍ້ມູນທີ່ມີຄວາມລະອຽດສູງ, ໃນຂະນະທີ່ບັນລຸອັດຕາສ່ວນການບີບອັດທີ່ເຂັ້ມແຂງເພື່ອຫຼຸດຜ່ອນຈໍານວນ tokens.
ຫຼັງຈາກນັ້ນ, ຕົວຖອດລະຫັດແມ່ນຮູບແບບ 570 ລ້ານພາລາມິເຕີ Mixture-of-Experts (MoE) ທີ່ຖືກມອບຫມາຍໃຫ້ກັບການຜະລິດຂໍ້ຄວາມຕົ້ນສະບັບ. ສະຖາປັດຕະຍະກຳ MoE ແບ່ງຕົວແບບອອກເປັນເຄືອຂ່າຍຍ່ອຍທີ່ມີຄວາມຊ່ຽວຊານໃນການປະມວນຜົນຊຸດຍ່ອຍຂອງຂໍ້ມູນການປ້ອນຂໍ້ມູນ, ເພີ່ມປະສິດທິພາບການເຮັດວຽກໂດຍບໍ່ຈໍາເປັນຕ້ອງເປີດໃຊ້ຕົວແບບທັງໝົດ.
ໃນ OmniDocBench, ມາດຕະຖານການອ່ານເອກະສານ, DeepSeek-OCR ປະຕິບັດຕົວແບບ OCR ທີ່ສໍາຄັນເຊັ່ນ GOT-OCR 2.0 ແລະ MinerU 2.0, ໃນຂະນະທີ່ໃຊ້ tokens ຫນ້ອຍລົງ.
ທີ່ມາ: https://znews.vn/deepseek-lai-co-dot-pha-post1595902.html
(0)