Vietnam.vn - Nền tảng quảng bá Việt Nam

ການຄົ້ນຄວ້າໃຫມ່ເປີດເຜີຍຄວາມລັບເພື່ອຄວາມສໍາເລັດຂອງ DeepSeek

ອີງຕາມ DeepSeek, ຮູບແບບປັນຍາປະດິດ R1 ບໍ່ໄດ້ຖືກຝຶກອົບຮົມໂດຍນໍາໃຊ້ຂໍ້ມູນຈາກຕົວແບບຂອງ OpenAI, ເຖິງແມ່ນວ່າມັນຍອມຮັບວ່າຕົວແບບພື້ນຖານໄດ້ຮັບການຝຶກອົບຮົມກ່ຽວກັບຂໍ້ມູນເວັບ - ເຊິ່ງສາມາດປະກອບມີເນື້ອຫາທີ່ສ້າງ AI.

VietnamPlusVietnamPlus18/09/2025

ຮູບແບບປັນຍາປະດິດຂອງຈີນ DeepSeek ຂອງ R1 - ເຊິ່ງເຮັດໃຫ້ຕະຫຼາດຫຼັກຊັບສະຫະລັດຕົກໃຈໃນເວລາທີ່ມັນເປີດຕົວໃນເດືອນມັງກອນ - ໄດ້ຖືກຈັດພີມມາໃນການສຶກສາທົບທວນຄືນຄັ້ງທໍາອິດ, ສະແດງໃຫ້ເຫັນວິທີການພັດທະນາ LLM ທີ່ມີປະສິດທິພາບພຽງແຕ່ປະມານ $ 300,000.

R1 ຖືກອອກແບບມາໃຫ້ດີເລີດໃນວຽກງານທີ່ສົມເຫດສົມຜົນເຊັ່ນ: ຄະນິດສາດແລະການຂຽນໂປລແກລມ, ເຮັດໃຫ້ມັນເປັນຄູ່ແຂ່ງທີ່ມີລາຄາຖືກກັບເຄື່ອງມືທີ່ພັດທະນາໂດຍຍັກໃຫຍ່ເຕັກໂນໂລຢີຂອງສະຫະລັດ.

ນີ້​ແມ່ນ​ຮູບ​ແບບ “open weight”, ເຊິ່ງ​ແມ່ນ​ໃຫ້​ດາວ​ໂຫລດ​ຟຣີ​ແລະ​ໃນ​ປັດ​ຈຸ​ບັນ​ເປັນ​ຮູບ​ແບບ​ທີ່​ນິ​ຍົມ​ທີ່​ສຸດ​ໃນ​ເວ​ທີ​ການ Hugging Face​, ມີ​ຫຼາຍ​ກວ່າ 10.9 ລ້ານ​ດາວ​ໂຫລດ​.

ການສຶກສາທໍາມະຊາດ, ສະບັບປັບປຸງຂອງຫນັງສືໃບລານເດືອນມັງກອນ, ໄດ້ເປີດເຜີຍຄັ້ງທໍາອິດວ່າການຝຶກອົບຮົມ R1 ມີຄ່າໃຊ້ຈ່າຍພຽງແຕ່ $ 294,000, ນອກເຫນືອໄປຈາກປະມານ $ 6 ລ້ານໃຊ້ໃນການກໍ່ສ້າງຕົວແບບພື້ນຖານ.

ຕົວເລກນີ້ແມ່ນຕໍ່າກວ່າຫຼາຍສິບລ້ານໂດລາທີ່ຄູ່ແຂ່ງໄດ້ເວົ້າວ່າໄດ້ໃຊ້ຈ່າຍ.

DeepSeek ກ່າວວ່າ R1 ໄດ້ຮັບການຝຶກອົບຮົມຕົ້ນຕໍໂດຍໃຊ້ຊິບ Nvidia H800, ເຊິ່ງສະຫະລັດໄດ້ຫ້າມບໍ່ໃຫ້ສົ່ງອອກໄປຈີນຕັ້ງແຕ່ປີ 2023.

ຄວາມກ້າວຫນ້າຂອງ R1 ແມ່ນການນໍາໃຊ້ "ການຮຽນຮູ້ເສີມທີ່ບໍລິສຸດ", ບ່ອນທີ່ຕົວແບບໄດ້ຖືກຝຶກອົບຮົມກ່ຽວກັບການທົດລອງແລະຄວາມຜິດພາດແລະໄດ້ຮັບລາງວັນສໍາລັບຄໍາຕອບທີ່ຖືກຕ້ອງ, ແທນທີ່ຈະຮຽນຮູ້ຈາກຕົວຢ່າງທີ່ມະນຸດເລືອກ. ມັນຍັງໃຫ້ຄະແນນຄວາມພະຍາຍາມຂອງຕົນເອງໂດຍໃຊ້ການຄາດຄະເນພາຍໃນ, ເຕັກນິກທີ່ເອີ້ນວ່າ "ການເພີ່ມປະສິດທິພາບນະໂຍບາຍຂອງກຸ່ມພີ່ນ້ອງ," ເຊິ່ງຊ່ວຍເພີ່ມປະສິດທິພາບ.

"ຂະບວນການທົບທວນມິດສະຫາຍຢ່າງເຂັ້ມງວດຊ່ວຍກວດສອບມູນຄ່າແລະຄວາມຫນ້າເຊື່ອຖືຂອງຕົວແບບ," ນັກຄົ້ນຄວ້າ Huan Sun (ມະຫາວິທະຍາໄລ Ohio State). "ບໍລິສັດອື່ນໆຄວນເຮັດເຊັ່ນດຽວກັນ."

Lewis Tunstall, ວິສະວະກອນການຮຽນຮູ້ເຄື່ອງຈັກຢູ່ Hugging Face, ກ່າວວ່ານີ້ແມ່ນແບບຢ່າງທີ່ສໍາຄັນເພາະວ່າຄວາມໂປ່ງໃສໃນການພັດທະນາ AI ຊ່ວຍໃຫ້ປະເມີນຄວາມສ່ຽງໄດ້ຢ່າງຖືກຕ້ອງ.

DeepSeek ອ້າງວ່າ R1 ບໍ່ໄດ້ຮັບການຝຶກອົບຮົມໂດຍໃຊ້ຂໍ້ມູນຈາກແບບຈໍາລອງຂອງ OpenAI, ເຖິງແມ່ນວ່າມັນຍອມຮັບວ່າຕົວແບບທີ່ຕິດພັນແມ່ນໄດ້ຮັບການຝຶກອົບຮົມກ່ຽວກັບຂໍ້ມູນເວັບ - ເຊິ່ງສາມາດປະກອບມີເນື້ອຫາທີ່ສ້າງໂດຍ AI.

ຜູ້ຊ່ຽວຊານກ່າວວ່າໃນຂະນະທີ່ມັນຍາກທີ່ຈະກວດສອບຢ່າງແທ້ຈິງ, ຫຼັກຖານໃນປະຈຸບັນຊີ້ໃຫ້ເຫັນວ່າການເພີ່ມປະສິດທິພາບອັນບໍລິສຸດແມ່ນພຽງພໍທີ່ຈະບັນລຸປະສິດທິພາບສູງ.

ໃນການທົດສອບ ScienceAgentBench, R1 ບໍ່ໄດ້ຢູ່ເທິງສຸດຂອງຕາຕະລາງຄວາມຖືກຕ້ອງ, ແຕ່ມັນໄດ້ສ້າງຄວາມສົມດຸນທີ່ດີລະຫວ່າງປະສິດທິພາບແລະຄ່າໃຊ້ຈ່າຍ. ນັກຄົ້ນຄວ້າໃນປັດຈຸບັນກໍາລັງຊອກຫາການນໍາໃຊ້ວິທີການຂອງ DeepSeek ເພື່ອເພີ່ມຄວາມສາມາດໃນການສົມເຫດສົມຜົນຂອງ LLMs ທີ່ມີຢູ່ແລ້ວ, ເຊັ່ນດຽວກັນກັບການຂະຫຍາຍມັນໄປສູ່ພື້ນທີ່ນອກເຫນືອຈາກຄະນິດສາດແລະການຂຽນໂປຼແກຼມ.

ອີງຕາມທ່ານ Tunstall, R1 ໄດ້ "ເລີ່ມຕົ້ນການປະຕິວັດ" ໃນການພັດທະນາປັນຍາປະດິດ./.

(TTXVN/Vietnam+)

ທີ່ມາ: https://www.vietnamplus.vn/nghien-cuu-moi-tiet-lo-bi-quyet-thanh-cong-cua-deepseek-post1062474.vnp


(0)

No data
No data

G-Dragon ໄດ້ລະເບີດຂຶ້ນກັບຜູ້ຊົມໃນລະຫວ່າງການສະແດງຂອງລາວຢູ່ຫວຽດນາມ
ແຟນເພດຍິງໃສ່ຊຸດແຕ່ງງານໄປຄອນເສີດ G-Dragon ທີ່ເມືອງ Hung Yen
ປະທັບໃຈກັບຄວາມງາມຂອງບ້ານ Lo Lo Chai ໃນລະດູການດອກໄມ້ buckwheat
​ເຂົ້າ​ໜຸ່ມ​ມີ​ໄຕ​ພວມ​ຈູດ​ໄຟ, ຟົດ​ຟື້ນ​ດ້ວຍ​ຈັງຫວະ​ການ​ຕຳ​ຂອງ​ສັດຕູ​ພືດ​ເພື່ອ​ປູກ​ພືດ​ໃໝ່.

ມໍລະດົກ

ຮູບ

ທຸລະກິດ

​ເຂົ້າ​ໜຸ່ມ​ມີ​ໄຕ​ພວມ​ຈູດ​ໄຟ, ຟົດ​ຟື້ນ​ດ້ວຍ​ຈັງຫວະ​ການ​ຕຳ​ຂອງ​ສັດຕູ​ພືດ​ເພື່ອ​ປູກ​ພືດ​ໃໝ່.

ເຫດການປະຈຸບັນ

ລະບົບການເມືອງ

ທ້ອງຖິ່ນ

ຜະລິດຕະພັນ