អ្នកលេង Nakamura បាននិយាយថា Grok 4 ហាក់ដូចជាបានលេងជាមួយនឹងអារម្មណ៍តានតឹងក្នុងការប្រកួតចុងក្រោយ - រូបថត៖ រូបថតអេក្រង់
មុនពេលការប្រកួត OpenAI បានធ្វើឱ្យមានការរំជើបរំជួលនៅពេលដែលវាបានប្រកាសពីការចាប់ផ្តើមនៃ LLM ជំនាន់ទី 11, GPT-5 ។
ទោះជាយ៉ាងណាក៏ដោយ គំរូ o3 - ChatGPT ដែលប្រើក្នុងវគ្គផ្តាច់ព្រ័ត្រនៅតែបង្ហាញពីសមត្ថភាពសន្និដ្ឋានដ៏រឹងមាំ ជាមួយនឹងអត្រាផ្លាស់ទីត្រឹមត្រូវជាមធ្យមរហូតដល់ 90.8% ដែលលើសទាំងស្រុងពី Grok 4's 80.2% ។
នៅក្នុងការប្រកួតទាំងបួន ChatGPT មិនបានផ្តល់ឱកាសឱ្យ Grok 4 ណាមួយឡើយ ដោយពិនិត្យមើលគូប្រកួតរបស់គាត់បន្ទាប់ពីផ្លាស់ទី 35, 30, 28 និង 54 រៀងគ្នា។
យោងតាមលោក Hikaru Nakamura ចំណាត់ថ្នាក់លេខ 2 ពិភពលោក Grok 4 ហាក់ដូចជាកំពុងលេងដោយភាពតានតឹង និងបង្កើតកំហុសច្រើនជាងការប្រកួតមុនៗ។ ជាពិសេស វាបានបាត់បង់បំណែកយ៉ាងងាយស្រួល ដែលជាការកើតឡើងដ៏កម្រមួយ នៅពេលដែលវាបានយកឈ្នះយ៉ាងលើសលប់នូវ Gemini 2.5 Flash និង Gemini 2.5 Pro របស់ Google ។
ជាមួយនឹងការឈ្នះបីដងជាប់គ្នាជាមួយនឹងពិន្ទុ 4-0 និងអត្រាភាពត្រឹមត្រូវជាមធ្យមរហូតដល់ 91% o3 បានបញ្ចប់ការប្រកួតយ៉ាងល្អឥតខ្ចោះ។
ទោះបីជាកម្លាំងរបស់ o3 មិនអាចប្រៀបធៀបទៅនឹងមេអុកអាជីពក៏ដោយ វាគ្រប់គ្រាន់ក្នុងការបង្កបញ្ហាដល់អ្នកលេងដែលមាន Elo ក្រោម 2,000 ។ ជាពិសេសនៅក្នុងប្រភេទ blitz និង super blitz ។
ការប្រកួតដែលរៀបចំដោយ Google បានបញ្ចប់ដោយភាពលេចធ្លោទាំងស្រុងរបស់អ្នកតំណាងអាមេរិក។ ខណៈពេលដែលម៉ូដែលចិនទាំងពីរគឺ Kimi K4 និង DeepSeek ត្រូវបានលុបចោលមុនកាលកំណត់ ការប្រកួតចំណាត់ថ្នាក់លេខ 3 ត្រូវបានឈ្នះដោយ Gemini 2.5 Pro លើ o4-mini ដោយបញ្ជាក់ពីទីតាំងរបស់ក្រុមហ៊ុនបច្ចេកវិទ្យាឈានមុខគេរបស់អាមេរិក។
ព្រឹត្តិការណ៍នេះមិនត្រឹមតែបង្ហាញពីសមត្ថភាពដ៏អស្ចារ្យនៃម៉ូដែល AI ទូទៅក្នុងវិស័យឯកទេសប៉ុណ្ណោះទេ។ វាក៏បើកនូវទស្សនវិស័យថ្មីលើសក្តានុពលនៃការអភិវឌ្ឍន៍នៃបញ្ញាសិប្បនិម្មិតនាពេលអនាគតផងដែរ។
ទោះជាយ៉ាងណាក៏ដោយ វាក៏ជាការរំលឹកផងដែរថា ខណៈពេលដែល LLMs កំពុងអភិវឌ្ឍយ៉ាងឆាប់រហ័ស ពួកគេនៅតែមិនអាចផ្គូផ្គងនឹងកម្រិតនៃម៉ាស៊ីនអុកដែលមានជំនាញវិជ្ជាជីវៈ ដែលការវាយតម្លៃ Elo មានលើសពីមនុស្ស។
ប្រភព៖ https://tuoitre.vn/chatgpt-dang-quang-giai-co-vua-danh-cho-ai-20250808090405997.htm
Kommentar (0)