GPU ແມ່ນສະຫມອງຂອງຄອມພິວເຕີ AI
ເວົ້າງ່າຍໆ, ໜ່ວຍປະມວນຜົນກາຟິກ (GPU) ເຮັດໜ້າທີ່ເປັນສະໝອງຂອງຄອມພິວເຕີ AI.
ດັ່ງທີ່ທ່ານອາດຈະຮູ້, ຫນ່ວຍປະມວນຜົນກາງ (CPU) ແມ່ນສະຫມອງຂອງຄອມພິວເຕີ. ປະໂຫຍດຂອງ GPU ແມ່ນວ່າມັນເປັນ CPU ພິເສດທີ່ສາມາດປະຕິບັດການຄິດໄລ່ທີ່ສັບສົນ. ວິທີທີ່ໄວທີ່ສຸດທີ່ຈະເຮັດນີ້ແມ່ນເພື່ອໃຫ້ກຸ່ມ GPUs ແກ້ໄຂບັນຫາດຽວກັນ. ຢ່າງໃດກໍຕາມ, ການຝຶກອົບຮົມແບບຈໍາລອງ AI ຍັງສາມາດໃຊ້ເວລາຫຼາຍອາທິດຫຼືແມ້ກະທັ້ງເດືອນ. ເມື່ອສ້າງແລ້ວ, ມັນຖືກຈັດໃສ່ໃນລະບົບຄອມພິວເຕີທາງຫນ້າແລະຜູ້ໃຊ້ສາມາດຖາມຄໍາຖາມກັບຮູບແບບ AI, ຂະບວນການທີ່ເອີ້ນວ່າ inference.
ຄອມພິວເຕີ AI ທີ່ມີ GPU ຫຼາຍອັນ
ສະຖາປັດຕະຍະກໍາທີ່ດີທີ່ສຸດສໍາລັບບັນຫາ AI ແມ່ນການນໍາໃຊ້ກຸ່ມ GPUs ໃນ rack, ເຊື່ອມຕໍ່ກັບສະຫຼັບຢູ່ເທິງຂອງ rack ໄດ້. racks GPU ຫຼາຍສາມາດເຊື່ອມຕໍ່ໃນລໍາດັບຊັ້ນຂອງເຄືອຂ່າຍ. ເນື່ອງຈາກບັນຫາກາຍເປັນຄວາມສັບສົນຫຼາຍ, ຄວາມຕ້ອງການ GPU ເພີ່ມຂຶ້ນ, ແລະບາງໂຄງການອາດຈະຈໍາເປັນຕ້ອງໄດ້ນໍາໃຊ້ກຸ່ມ GPU ຫຼາຍພັນຄົນ.
ແຕ່ລະກຸ່ມ AI ແມ່ນເຄືອຂ່າຍຂະຫນາດນ້ອຍ
ເມື່ອສ້າງກຸ່ມ AI, ມັນຈໍາເປັນຕ້ອງຕັ້ງເຄືອຂ່າຍຄອມພິວເຕີຂະຫນາດນ້ອຍເພື່ອເຊື່ອມຕໍ່ແລະອະນຸຍາດໃຫ້ GPUs ເຮັດວຽກຮ່ວມກັນແລະແບ່ງປັນຂໍ້ມູນຢ່າງມີປະສິດທິພາບ.
ຮູບຂ້າງເທິງສະແດງໃຫ້ເຫັນເຖິງ AI Cluster ທີ່ວົງມົນຢູ່ດ້ານລຸ່ມເປັນຕົວແທນຂອງຂັ້ນຕອນການເຮັດວຽກທີ່ເຮັດວຽກຢູ່ໃນ GPUs. GPUs ເຊື່ອມຕໍ່ກັບສະວິດເທິງສຸດຂອງ rack (ToR). ສະວິດ ToR ຍັງເຊື່ອມຕໍ່ກັບສະວິດກະດູກສັນຫຼັງຂອງເຄືອຂ່າຍທີ່ສະແດງຢູ່ຂ້າງເທິງແຜນວາດ, ສະແດງໃຫ້ເຫັນເຖິງລໍາດັບຊັ້ນຂອງເຄືອຂ່າຍທີ່ຊັດເຈນທີ່ຕ້ອງການເມື່ອ GPU ຫຼາຍຕົວມີສ່ວນຮ່ວມ.
ເຄືອຂ່າຍເປັນຂໍ້ບົກຜ່ອງໃນການນຳໃຊ້ AI
ໃນລະດູໃບໄມ້ປົ່ງທີ່ຜ່ານມາ, ທີ່ກອງປະຊຸມສຸດຍອດໂລກ Open Computer Project (OCP), ບ່ອນທີ່ບັນດາຜູ້ແທນພວມເຮັດວຽກເພື່ອສ້າງພື້ນຖານໂຄງລ່າງ AI ລຸ້ນຕໍ່ໄປ, ຜູ້ຕາງໜ້າ Loi Nguyen ຈາກ Marvell Technology ໄດ້ໃຫ້ຂໍ້ສັງເກດວ່າ: “ເຄືອຂ່າຍແມ່ນຂອດຂອດໃໝ່.”
ທາງດ້ານເຕັກນິກ, packet latency ສູງຫຼືການສູນເສຍແພັກເກັດເນື່ອງຈາກຄວາມແອອັດຂອງເຄືອຂ່າຍສາມາດເຮັດໃຫ້ແພັກເກັດຖືກສົ່ງຄືນ, ເຮັດໃຫ້ເວລາສໍາເລັດວຽກ (JCT) ເພີ່ມຂຶ້ນຢ່າງຫຼວງຫຼາຍ. ດັ່ງນັ້ນ, GPUs ມູນຄ່າຫຼາຍລ້ານຫຼືຫຼາຍສິບລ້ານໂດລາໄດ້ຖືກສູນເສຍໄປໂດຍທຸລະກິດເນື່ອງຈາກລະບົບ AI ທີ່ບໍ່ມີປະສິດທິພາບ, ເຮັດໃຫ້ທຸລະກິດມີຄ່າໃຊ້ຈ່າຍທັງລາຍໄດ້ແລະເວລາໃນການຕະຫຼາດ.
ການວັດແທກເປັນເງື່ອນໄຂທີ່ສໍາຄັນສໍາລັບການດໍາເນີນງານສົບຜົນສໍາເລັດຂອງເຄືອຂ່າຍ AI
ເພື່ອດໍາເນີນການກຸ່ມ AI ໃຫ້ມີປະສິດຕິຜົນ, GPUs ຈໍາເປັນຕ້ອງໄດ້ຖືກນໍາໃຊ້ຢ່າງເຕັມທີ່ເພື່ອເຮັດໃຫ້ໄລຍະເວລາການຝຶກອົບຮົມສັ້ນລົງແລະເອົາຮູບແບບການຮຽນຮູ້ເຂົ້າໃນການນໍາໃຊ້ເພື່ອເພີ່ມຜົນຕອບແທນຈາກການລົງທຶນ. ດັ່ງນັ້ນ, ມັນເປັນສິ່ງຈໍາເປັນທີ່ຈະທົດສອບແລະປະເມີນຜົນການປະຕິບັດຂອງກຸ່ມ AI (ຮູບ 2). ຢ່າງໃດກໍ່ຕາມ, ວຽກງານນີ້ບໍ່ແມ່ນເລື່ອງງ່າຍ, ເພາະວ່າໃນແງ່ຂອງສະຖາປັດຕະຍະກໍາລະບົບ, ມີຫຼາຍການຕັ້ງຄ່າແລະຄວາມສໍາພັນລະຫວ່າງ GPUs ແລະໂຄງສ້າງເຄືອຂ່າຍທີ່ຕ້ອງປະກອບເຊິ່ງກັນແລະກັນເພື່ອແກ້ໄຂບັນຫາ.
ອັນນີ້ສ້າງສິ່ງທ້າທາຍຫຼາຍຢ່າງໃນການວັດແທກເຄືອຂ່າຍ AI:
- ຄວາມຫຍຸ້ງຍາກໃນການຜະລິດເຄືອຂ່າຍການຜະລິດທັງຫມົດໃນຫ້ອງທົດລອງເນື່ອງຈາກຂໍ້ຈໍາກັດໃນຄ່າໃຊ້ຈ່າຍ, ອຸປະກອນ, ການຂາດແຄນຂອງວິສະວະກອນເຄືອຂ່າຍ AI ທີ່ມີຄວາມຊໍານິຊໍານານ, ພື້ນທີ່, ພະລັງງານແລະອຸນຫະພູມ.
- ການວັດແທກກ່ຽວກັບລະບົບການຜະລິດຫຼຸດລົງຄວາມສາມາດໃນການປຸງແຕ່ງທີ່ມີຢູ່ຂອງລະບົບການຜະລິດຂອງມັນເອງ.
- ຄວາມຫຍຸ້ງຍາກໃນການຜະລິດຄືນບັນຫາທີ່ຖືກຕ້ອງເນື່ອງຈາກຄວາມແຕກຕ່າງຂອງຂະຫນາດແລະຂອບເຂດຂອງບັນຫາ.
- ຄວາມສັບສົນຂອງວິທີການ GPU ເຊື່ອມຕໍ່ລວມ.
ເພື່ອແກ້ໄຂສິ່ງທ້າທາຍເຫຼົ່ານີ້, ທຸລະກິດສາມາດທົດສອບຊຸດຍ່ອຍຂອງການຕິດຕັ້ງທີ່ແນະນໍາໃນສະພາບແວດລ້ອມຫ້ອງທົດລອງເພື່ອວັດແທກຕົວຊີ້ວັດທີ່ສໍາຄັນເຊັ່ນ: ເວລາສໍາເລັດວຽກ (JCT), ແບນວິດທີ່ທີມງານ AI ສາມາດບັນລຸໄດ້, ແລະປຽບທຽບມັນກັບການໃຊ້ເວທີການປ່ຽນແລະການນໍາໃຊ້ cache. ການປຽບທຽບນີ້ຊ່ວຍຊອກຫາຄວາມສົມດູນທີ່ເໝາະສົມລະຫວ່າງ GPU/ການປະມວນຜົນວຽກ ແລະການອອກແບບ/ການຕັ້ງຄ່າເຄືອຂ່າຍ. ເມື່ອພໍໃຈກັບຜົນໄດ້ຮັບ, ສະຖາປະນິກຄອມພິວເຕີແລະວິສະວະກອນເຄືອຂ່າຍສາມາດເອົາການຕິດຕັ້ງເຫຼົ່ານີ້ເພື່ອຜະລິດແລະວັດແທກຜົນໄດ້ຮັບໃຫມ່.
ຫ້ອງທົດລອງການຄົ້ນຄວ້າຂອງບໍລິສັດ, ສະຖາບັນການສຶກສາ, ແລະມະຫາວິທະຍາໄລກໍາລັງເຮັດວຽກເພື່ອວິເຄາະທຸກດ້ານຂອງການກໍ່ສ້າງແລະປະຕິບັດເຄືອຂ່າຍ AI ທີ່ມີປະສິດທິພາບເພື່ອແກ້ໄຂສິ່ງທ້າທາຍຂອງການເຮັດວຽກໃນເຄືອຂ່າຍຂະຫນາດໃຫຍ່, ໂດຍສະເພາະແມ່ນການປະຕິບັດທີ່ດີທີ່ສຸດຍັງສືບຕໍ່ພັດທະນາ. ວິທີການຮ່ວມມື, ຊ້ໍາກັນນີ້ແມ່ນວິທີດຽວສໍາລັບບໍລິສັດທີ່ຈະປະຕິບັດການວັດແທກຊ້ໍາຊ້ອນແລະການທົດສອບຢ່າງໄວວາ "ສິ່ງທີ່ຖ້າ" ສະຖານະການທີ່ເປັນພື້ນຖານຂອງການເພີ່ມປະສິດທິພາບເຄືອຂ່າຍສໍາລັບ AI.
(ທີ່ມາ: Keysight Technologies)
ທີ່ມາ: https://vietnamnet.vn/ket-noi-mang-ai-5-dieu-can-biet-2321288.html
(0)