ຮູບແບບປັນຍາປະດິດຂອງຈີນ DeepSeek ຂອງ R1 - ເຊິ່ງເຮັດໃຫ້ຕະຫຼາດຫຼັກຊັບສະຫະລັດຕົກໃຈໃນເວລາທີ່ມັນເປີດຕົວໃນເດືອນມັງກອນ - ໄດ້ຖືກຈັດພີມມາໃນການສຶກສາທົບທວນຄືນຄັ້ງທໍາອິດ, ສະແດງໃຫ້ເຫັນວິທີການພັດທະນາ LLM ທີ່ມີປະສິດທິພາບພຽງແຕ່ປະມານ $ 300,000.
R1 ຖືກອອກແບບມາໃຫ້ດີເລີດໃນວຽກງານທີ່ສົມເຫດສົມຜົນເຊັ່ນ: ຄະນິດສາດແລະການຂຽນໂປລແກລມ, ເຮັດໃຫ້ມັນເປັນຄູ່ແຂ່ງທີ່ມີລາຄາຖືກກັບເຄື່ອງມືທີ່ພັດທະນາໂດຍຍັກໃຫຍ່ເຕັກໂນໂລຢີຂອງສະຫະລັດ.
ນີ້ແມ່ນຮູບແບບ “open weight”, ເຊິ່ງແມ່ນໃຫ້ດາວໂຫລດຟຣີແລະໃນປັດຈຸບັນເປັນຮູບແບບທີ່ນິຍົມທີ່ສຸດໃນເວທີການ Hugging Face, ມີຫຼາຍກວ່າ 10.9 ລ້ານດາວໂຫລດ.
ການສຶກສາທໍາມະຊາດ, ສະບັບປັບປຸງຂອງຫນັງສືໃບລານເດືອນມັງກອນ, ໄດ້ເປີດເຜີຍຄັ້ງທໍາອິດວ່າການຝຶກອົບຮົມ R1 ມີຄ່າໃຊ້ຈ່າຍພຽງແຕ່ $ 294,000, ນອກເຫນືອໄປຈາກປະມານ $ 6 ລ້ານໃຊ້ໃນການກໍ່ສ້າງຕົວແບບພື້ນຖານ.
ຕົວເລກນີ້ແມ່ນຕໍ່າກວ່າຫຼາຍສິບລ້ານໂດລາທີ່ຄູ່ແຂ່ງໄດ້ເວົ້າວ່າໄດ້ໃຊ້ຈ່າຍ.
DeepSeek ກ່າວວ່າ R1 ໄດ້ຮັບການຝຶກອົບຮົມຕົ້ນຕໍໂດຍໃຊ້ຊິບ Nvidia H800, ເຊິ່ງສະຫະລັດໄດ້ຫ້າມບໍ່ໃຫ້ສົ່ງອອກໄປຈີນຕັ້ງແຕ່ປີ 2023.
ຄວາມກ້າວຫນ້າຂອງ R1 ແມ່ນການນໍາໃຊ້ "ການຮຽນຮູ້ເສີມທີ່ບໍລິສຸດ", ບ່ອນທີ່ຕົວແບບໄດ້ຖືກຝຶກອົບຮົມກ່ຽວກັບການທົດລອງແລະຄວາມຜິດພາດແລະໄດ້ຮັບລາງວັນສໍາລັບຄໍາຕອບທີ່ຖືກຕ້ອງ, ແທນທີ່ຈະຮຽນຮູ້ຈາກຕົວຢ່າງທີ່ມະນຸດເລືອກ. ມັນຍັງໃຫ້ຄະແນນຄວາມພະຍາຍາມຂອງຕົນເອງໂດຍໃຊ້ການຄາດຄະເນພາຍໃນ, ເຕັກນິກທີ່ເອີ້ນວ່າ "ການເພີ່ມປະສິດທິພາບນະໂຍບາຍຂອງກຸ່ມພີ່ນ້ອງ," ເຊິ່ງຊ່ວຍເພີ່ມປະສິດທິພາບ.
"ຂະບວນການທົບທວນມິດສະຫາຍຢ່າງເຂັ້ມງວດຊ່ວຍກວດສອບມູນຄ່າແລະຄວາມຫນ້າເຊື່ອຖືຂອງຕົວແບບ," ນັກຄົ້ນຄວ້າ Huan Sun (ມະຫາວິທະຍາໄລ Ohio State). "ບໍລິສັດອື່ນໆຄວນເຮັດເຊັ່ນດຽວກັນ."
Lewis Tunstall, ວິສະວະກອນການຮຽນຮູ້ເຄື່ອງຈັກຢູ່ Hugging Face, ກ່າວວ່ານີ້ແມ່ນແບບຢ່າງທີ່ສໍາຄັນເພາະວ່າຄວາມໂປ່ງໃສໃນການພັດທະນາ AI ຊ່ວຍໃຫ້ປະເມີນຄວາມສ່ຽງໄດ້ຢ່າງຖືກຕ້ອງ.
DeepSeek ອ້າງວ່າ R1 ບໍ່ໄດ້ຮັບການຝຶກອົບຮົມໂດຍໃຊ້ຂໍ້ມູນຈາກແບບຈໍາລອງຂອງ OpenAI, ເຖິງແມ່ນວ່າມັນຍອມຮັບວ່າຕົວແບບທີ່ຕິດພັນແມ່ນໄດ້ຮັບການຝຶກອົບຮົມກ່ຽວກັບຂໍ້ມູນເວັບ - ເຊິ່ງສາມາດປະກອບມີເນື້ອຫາທີ່ສ້າງໂດຍ AI.
ຜູ້ຊ່ຽວຊານກ່າວວ່າໃນຂະນະທີ່ມັນຍາກທີ່ຈະກວດສອບຢ່າງແທ້ຈິງ, ຫຼັກຖານໃນປະຈຸບັນຊີ້ໃຫ້ເຫັນວ່າການເພີ່ມປະສິດທິພາບອັນບໍລິສຸດແມ່ນພຽງພໍທີ່ຈະບັນລຸປະສິດທິພາບສູງ.
ໃນການທົດສອບ ScienceAgentBench, R1 ບໍ່ໄດ້ຢູ່ເທິງສຸດຂອງຕາຕະລາງຄວາມຖືກຕ້ອງ, ແຕ່ມັນໄດ້ສ້າງຄວາມສົມດຸນທີ່ດີລະຫວ່າງປະສິດທິພາບແລະຄ່າໃຊ້ຈ່າຍ. ນັກຄົ້ນຄວ້າໃນປັດຈຸບັນກໍາລັງຊອກຫາການນໍາໃຊ້ວິທີການຂອງ DeepSeek ເພື່ອເພີ່ມຄວາມສາມາດໃນການສົມເຫດສົມຜົນຂອງ LLMs ທີ່ມີຢູ່ແລ້ວ, ເຊັ່ນດຽວກັນກັບການຂະຫຍາຍມັນໄປສູ່ພື້ນທີ່ນອກເຫນືອຈາກຄະນິດສາດແລະການຂຽນໂປຼແກຼມ.
ອີງຕາມທ່ານ Tunstall, R1 ໄດ້ "ເລີ່ມຕົ້ນການປະຕິວັດ" ໃນການພັດທະນາປັນຍາປະດິດ./.
ທີ່ມາ: https://www.vietnamplus.vn/nghien-cuu-moi-tiet-lo-bi-quyet-thanh-cong-cua-deepseek-post1062474.vnp






(0)