អ្នកលេង Nakamura បាននិយាយថា Grok 4 ហាក់ដូចជាលេងជាមួយនឹងភាពតានតឹងក្នុងការប្រកួតចុងក្រោយ - រូបថត៖ រូបថតអេក្រង់
មុនពេលការប្រកួត OpenAI បានធ្វើឱ្យមានការរំជើបរំជួលនៅពេលដែលវាបានប្រកាសពីការចាប់ផ្តើមនៃ LLM ជំនាន់ទី 11 របស់ខ្លួន GPT-5 ។
ទោះជាយ៉ាងណាក៏ដោយ គំរូ o3 - ChatGPT ដែលប្រើក្នុងវគ្គផ្តាច់ព្រ័ត្រនៅតែបង្ហាញពីសមត្ថភាពវែកញែកដ៏រឹងមាំ ជាមួយនឹងអត្រាផ្លាស់ទីត្រឹមត្រូវជាមធ្យមរហូតដល់ 90.8% ដែលលើសពី Grok 4's 80.2% ទាំងស្រុង។
នៅក្នុងការប្រកួតទាំងបួន ChatGPT មិនបានផ្តល់ឱកាសឱ្យ Grok 4 ណាមួយឡើយ ដោយពិនិត្យមើលគូប្រកួតរបស់គាត់បន្ទាប់ពីផ្លាស់ទី 35, 30, 28 និង 54 រៀងគ្នា។
យោងតាមលោក Hikaru Nakamura ចំណាត់ថ្នាក់លេខ 2 ពិភពលោក Grok 4 ហាក់ដូចជាកំពុងលេងដោយភាពតានតឹង និងបង្កើតកំហុសច្រើនជាងការប្រកួតមុនៗ។ ជាពិសេស វាបានបាត់បង់បំណែកយ៉ាងងាយស្រួល ដែលជាការកើតឡើងដ៏កម្រមួយ នៅពេលដែលវាបានយកឈ្នះយ៉ាងលើសលប់នូវ Gemini 2.5 Flash និង Gemini 2.5 Pro របស់ Google ។
ជាមួយនឹងការឈ្នះបីដងជាប់គ្នាជាមួយនឹងពិន្ទុ 4-0 និងអត្រាភាពត្រឹមត្រូវជាមធ្យមរហូតដល់ 91% o3 បានបញ្ចប់ការប្រកួតយ៉ាងល្អឥតខ្ចោះ។
ទោះបីជាថាមពលរបស់ o3 មិនអាចប្រៀបធៀបទៅនឹងមេអុកអាជីពក៏ដោយ វាគ្រប់គ្រាន់ក្នុងការបង្កការលំបាកដល់អ្នកលេងដែលមាន Elo ក្រោម 2,000 ។ ជាពិសេសនៅក្នុងប្រភេទ blitz និង super blitz ។
ការប្រកួតដែលរៀបចំដោយ Google បានបញ្ចប់ដោយភាពលេចធ្លោទាំងស្រុងរបស់អ្នកតំណាងអាមេរិក។ ខណៈពេលដែលម៉ូដែលចិនទាំងពីរគឺ Kimi K4 និង DeepSeek ទាំងពីរត្រូវបានដកចេញពីដំបូង ការប្រកួតចំណាត់ថ្នាក់ទីបីបានឃើញការទទួលជ័យជម្នះរបស់ Gemini 2.5 Pro លើ o4-mini ដោយបញ្ជាក់ពីទីតាំងរបស់ក្រុមហ៊ុនបច្ចេកវិទ្យាឈានមុខគេរបស់អាមេរិក។
ព្រឹត្តិការណ៍នេះមិនត្រឹមតែបង្ហាញពីសមត្ថភាពដ៏អស្ចារ្យនៃម៉ូដែល AI ទូទៅក្នុងវិស័យឯកទេសប៉ុណ្ណោះទេ។ វាក៏បើកនូវទស្សនវិស័យថ្មីលើការអភិវឌ្ឍន៍សក្តានុពលនៃបញ្ញាសិប្បនិម្មិតនាពេលអនាគតផងដែរ។
ទោះជាយ៉ាងណាក៏ដោយ វាក៏ជាការរំលឹកផងដែរថា ខណៈពេលដែល LLMs កំពុងអភិវឌ្ឍយ៉ាងឆាប់រហ័ស ពួកគេនៅតែមិនអាចផ្គូផ្គងនឹងកម្រិតនៃម៉ាស៊ីនអុកដែលមានជំនាញវិជ្ជាជីវៈ ដែលការវាយតម្លៃ Elo មានលើសពីមនុស្ស។
ប្រភព៖ https://tuoitre.vn/chatgpt-dang-quang-giai-co-vua-danh-cho-ai-20250808090405997.htm
Kommentar (0)