AI Kimi K2 ຈາກຈີນຖືກຕັດສິດໃນການເຄື່ອນໄຫວຜິດກົດໝາຍຊ້ຳແລ້ວຊ້ຳອີກ - ຮູບພາບ: chess.com
ດ້ວຍໄຊຊະນະ 4-0, Gemini 2.5 Pro, o4-mini, Grok 4 ແລະ o3 ໄດ້ກ້າວເຂົ້າສູ່ຮອບຮອງຊະນະເລີດຂອງການແຂ່ງຂັນ AI chess, ເອົາຊະນະ Claude 4 Opus, DeepSeek R1, Gemini 2.5 Flash ແລະ Kimi k2 ຕາມລໍາດັບ.
ໃນຮອບຮອງຊະນະເລີດທີ່ໂດດເດັ່ນທີ່ສຸດ, ຮູບແບບ Kimi K2 ຂອງ Moonshot AI (ຈີນ) ໄດ້ປະສົບກັບໄພພິບັດ 0-4 defeat ຕໍ່ o3, LLM ຂອງ OpenAI - ຜູ້ພັດທະນາ ChatGPT.
ທັງສີ່ເກມໄດ້ສິ້ນສຸດລົງຢ່າງໄວວາໃນການເຄື່ອນໄຫວໜ້ອຍກວ່າແປດເທື່ອ, ຍ້ອນວ່າ Kimi K2 ເຮັດການເຄື່ອນໄຫວທີ່ຜິດກົດໝາຍຊ້ຳແລ້ວຊ້ຳອີກ.
ຕົວຢ່າງ, ໃນເກມທີສາມ, ເຖິງວ່າຈະມີຄວາມເຂົ້າໃຈຢ່າງຖືກຕ້ອງກ່ຽວກັບຕໍາແຫນ່ງໃນເວລາທີ່ o3 ກວດເບິ່ງທາງຫລັງ, Kimi K2 ຍັງບໍ່ສາມາດຊອກຫາການເຄື່ອນໄຫວທາງກົດຫມາຍດຽວໃນຄວາມພະຍາຍາມທັງຫມົດສີ່ຄັ້ງ, ແລະຖືກບັງຄັບໃຫ້ຍອມຮັບຄວາມພ່າຍແພ້. ເປີເຊັນຂອງການເຄື່ອນໄຫວທີ່ກົງກັບເຄື່ອງມື Stockfish ຂອງ o3 ແມ່ນສູງເຖິງ 100%, ສະແດງໃຫ້ເຫັນວ່າຄວາມແຕກຕ່າງໃນລະດັບທັກສະແມ່ນໃຫຍ່ເກີນໄປ.
ຜູ້ຕາງຫນ້າຂອງຈີນອື່ນໆ, DeepSeek, ບໍ່ໄດ້ດີກວ່າ, ສູນເສຍ 0-4 ກັບ o4-mini ຂອງ OpenAI. ເຖິງແມ່ນວ່າພວກເຂົາເຮັດໄດ້ດີກວ່າເພື່ອນຮ່ວມຊາດຂອງພວກເຂົາໂດຍການຖືຢູ່ໃນເກມທໍາອິດ, DeepSeek ຍັງເຮັດຜິດພາດແລະຖືກກວດສອບໃນເກມຕໍ່ໄປນີ້.
ຢ່າງໃດກໍ່ຕາມ, ລັກສະນະທີ່ຫນ້າປະທັບໃຈທີ່ສຸດໃນຮອບຮອງຊະນະເລີດແມ່ນ Grok 4, ຮູບແບບຈາກບໍລິສັດ xAI ຂອງມະຫາເສດຖີ Elon Musk. Grok 4 ເອົາຊະນະ Google's Gemini 2.5 Flash ໄດ້ຢ່າງງ່າຍດາຍດ້ວຍຄະແນນ 4-0. ດ້ວຍຄວາມສາມາດໃນການລົງໂທດທຸກໆຄວາມຜິດພາດຂອງ opponent, ອັດຕາຄວາມຖືກຕ້ອງຂອງການເຄື່ອນໄຫວຂອງ Grok 4 ໄດ້ບັນລຸລະດັບສູງສຸດຂອງຮອບ, ປະມານ 97.5%.
ຄໍາເຫັນກ່ຽວກັບການແຂ່ງຂັນ, Hikaru Nakamura ນັກກິລາອັນດັບ 2 ຂອງໂລກ ໄດ້ປະຫລາດໃຈວ່າ: "Grok 4 ແມ່ນ LLM ທີ່ແຂງແຮງທີ່ສຸດໃນການແຂ່ງຂັນນີ້. ຊ່ອງຫວ່າງລະຫວ່າງມັນກັບຮຸ່ນອື່ນໆແມ່ນບໍ່ນ້ອຍ."
ຄໍາຄິດຄໍາເຫັນນີ້ໄດ້ຖືກເພີ່ມກໍາລັງຕື່ມອີກໃນເວລາທີ່ທ່ານ Musk ໄດ້ແບ່ງປັນຮູບພາບຄໍາຄິດເຫັນຂອງ Nakamura ອີກເທື່ອຫນຶ່ງໃນເຄືອຂ່າຍສັງຄົມ X, ພ້ອມກັບຄໍາຄິດຄໍາເຫັນທີ່ຫມັ້ນໃຈວ່າ: "ນີ້ແມ່ນພຽງແຕ່ຜົນກະທົບຂ້າງຄຽງ. xAI ໃຊ້ເວລາເກືອບບໍ່ມີເວລາຢູ່ໃນຫມາກຮຸກ."
ຜູ້ນຫມາກຮຸກ Nakamura ກ່າວວ່າ Grok 4 ແມ່ນຫມົດ "ອອກຈາກລີກຂອງລາວ" ໃນການແຂ່ງຂັນ AI - ຮູບພາບ: screenshot
ໃນດ້ານຂອງ Google, ເຖິງແມ່ນວ່າ Gemini 2.5 Flash ໄດ້ຖືກກໍາຈັດ, ຜູ້ຕາງຫນ້າທີ່ຍັງເຫຼືອຂອງພວກເຂົາ, Gemini 2.5 Pro, ມີຄວາມເຊື່ອຫມັ້ນ 4-0 ເອົາຊະນະ Claude 4 Opus ຂອງບໍລິສັດ Anthropic, ຢືນຢັນຕໍາແຫນ່ງຂອງຕົນໃນການແຂ່ງຂັນ.
ຮອບຮອງຊະນະເລີດຈະໄຂຂຶ້ນໃນເວລາ 0:30 ໂມງຂອງວັນທີ 7 ສິງຫາ (ຕາມເວລາຫວຽດນາມ). ຮອບຮອງຊະນະເລີດທຳອິດແມ່ນການແຂ່ງຂັນທີ່ມີສະເຕກສູງລະຫວ່າງ Grok 4 ແລະ Gemini 2.5 Pro. ການແຂ່ງຂັນອື່ນໆແມ່ນ "OpenAI derby" ຢ່າງຫຼວງຫຼາຍລະຫວ່າງ o3 ແລະ o4-mini.
ຕູ່ນ ລອງ
ທີ່ມາ: https://tuoitre.vn/my-thang-tuyet-doi-tai-giai-co-vua-danh-cho-ai-20250806111234074.htm
(0)