ចុងសប្តាហ៍មួយនៅពាក់កណ្តាលខែឧសភា កិច្ចប្រជុំបិទទ្វារមួយរបស់គណិតវិទូបានធ្វើឡើង។ គណិតវិទូឈានមុខគេចំនួនសាមសិបនាក់ របស់ពិភពលោក បានធ្វើដំណើរដោយសម្ងាត់ទៅកាន់ទីក្រុងប៊ើកលី រដ្ឋកាលីហ្វ័រញ៉ា សហរដ្ឋអាមេរិក ដើម្បីចូលរួមក្នុងការប្រឈមមុខដាក់គ្នាជាមួយ chatbot ដែលមានសមត្ថភាព "វែកញែក"។ chatbot នេះត្រូវបានប្រគល់ភារកិច្ចឱ្យដោះស្រាយបញ្ហាដែលបង្កើតឡើងដោយគណិតវិទូខ្លួនឯង ដើម្បីសាកល្បងសមត្ថភាពដោះស្រាយបញ្ហារបស់វា។
បន្ទាប់ពីរយៈពេលពីរថ្ងៃជាប់ៗគ្នានៃការសួរសំណួរកម្រិតសាស្ត្រាចារ្យទៅកាន់ពួកគេ អ្នកជំនាញខាងគណិតវិទ្យាមានការភ្ញាក់ផ្អើលយ៉ាងខ្លាំងនៅពេលដឹងថា chatbot នេះអាចដោះស្រាយបញ្ហាដ៏លំបាកបំផុតមួយចំនួនដែលមិនធ្លាប់មានក្នុងប្រវត្តិសាស្ត្រ។
លោក Ken Ono សាស្ត្រាចារ្យនៅសាកលវិទ្យាល័យ Virginia និងជាប្រធាន និងជាចៅក្រមនៃកិច្ចប្រជុំ បានប្រាប់ Scientific American ថា “ខ្ញុំបានឃើញមិត្តរួមការងារនិយាយដោយផ្ទាល់ថា គំរូភាសាទ្រង់ទ្រាយធំនេះកំពុងខិតជិតកម្រិតនៃភាពប៉ិនប្រសប់ខាងគណិតវិទ្យា”។
chatbot ដែលបានរៀបរាប់ខាងលើគឺផ្អែកលើ o4-mini ដែលជាគំរូភាសាធំ (LLM) ដែលត្រូវបានរចនាឡើងសម្រាប់ការវែកញែកស្មុគស្មាញ។ ផលិតផលរបស់ OpenAI នេះត្រូវបានបណ្តុះបណ្តាលឱ្យអនុវត្តជំហានវែកញែកដ៏ស្មុគស្មាញ។ គំរូស្រដៀងគ្នាមួយពី Google ដែលមានឈ្មោះថា Gemini 2.5 Flash ក៏មានសមត្ថភាពស្រដៀងគ្នានេះដែរ។
ដូចកម្មវិធី ChatGPT LLM មុនៗដែរ o4-mini រៀនទស្សន៍ទាយពាក្យបន្ទាប់ក្នុងខ្សែអក្សរ។ ទោះជាយ៉ាងណាក៏ដោយ ភាពខុសគ្នាស្ថិតនៅត្រង់ថា o4-mini គឺជាកំណែដែលស្រាលជាង និងអាចបត់បែនបានជាងមុន ដែលបានហ្វឹកហាត់លើទិន្នន័យស៊ីជម្រៅ និងទទួលបានការលៃតម្រូវយ៉ាងជិតស្និទ្ធពីមនុស្ស ដែលអនុញ្ញាតឱ្យវាស្វែងយល់ពីបញ្ហាគណិតវិទ្យាដែលម៉ូដែលមុនៗមិនអាចធ្វើទៅបាន។
ដើម្បីប្រកួតប្រជែង និងវាយតម្លៃសមត្ថភាពរបស់ o4-mini ក្រុមហ៊ុន OpenAI បានចាត់តាំង Epoch AI ដែលជាអង្គការមិនស្វែងរកប្រាក់ចំណេញដែលមានជំនាញក្នុងការសាកល្បងគំរូ LLM ដើម្បីបង្កើតសំណួរគណិតវិទ្យាចំនួន 300 ដែលមិនទាន់បានបោះពុម្ពផ្សាយពីមុនមក។ ខណៈពេលដែល LLM បែបប្រពៃណីអាចដោះស្រាយបញ្ហាស្មុគស្មាញជាច្រើន នៅពេលដែលត្រូវបានជំទាស់ជាមួយនឹងសំណួរថ្មីទាំងស្រុង ភាគច្រើននៃពួកវាដោះស្រាយបានត្រឹមតែតិចជាង 2% ប៉ុណ្ណោះត្រឹមត្រូវ។ នេះបង្ហាញថាពួកគេខ្វះសមត្ថភាពវែកញែកពិតប្រាកដ។
នៅក្នុងគម្រោងវាយតម្លៃចុងក្រោយរបស់ខ្លួន Epoch AI បានជ្រើសរើសលោក Elliot Glazer ដែលជាបណ្ឌិតផ្នែកគណិតវិទ្យាវ័យក្មេង ជាអ្នកដឹកនាំ។ គម្រោងថ្មីនេះ ដែលមានឈ្មោះថា FrontierMath នឹងត្រូវដាក់ឱ្យដំណើរការនៅក្នុងខែកញ្ញា ឆ្នាំ២០២៤។
គម្រោងនេះបានប្រមូលសំណួរថ្មីៗនៅទូទាំងកម្រិតលំបាកចំនួនបួន ចាប់ពីថ្នាក់បរិញ្ញាបត្រ និងក្រោយឧត្តមសិក្សា រហូតដល់ការស្រាវជ្រាវស៊ីជម្រៅ។ នៅក្នុងខែមេសា ឆ្នាំ២០២៥ លោក Glazer បានរកឃើញថា o4-mini អាចដោះស្រាយបញ្ហាបានប្រហែល ២០%។ ដូច្នេះ លោកបានផ្លាស់ប្តូរវាទៅកម្រិតទី ៤ ភ្លាមៗ ដោយទាមទារឱ្យវាដោះស្រាយបញ្ហាដែលសូម្បីតែអ្នកគណិតវិទូកម្រិតខ្ពស់ក៏នឹងជួបការលំបាកដែរ។
អ្នកចូលរួមត្រូវបានតម្រូវឱ្យចុះហត្ថលេខាលើកិច្ចព្រមព្រៀងរក្សាការសម្ងាត់ ដោយទំនាក់ទំនងតាមរយៈកម្មវិធី Signal ដែលបានអ៊ិនគ្រីបតែប៉ុណ្ណោះ ព្រោះការប្រើប្រាស់អ៊ីមែលអាចត្រូវបានស្កេន ហើយខ្លឹមសាររបស់វាត្រូវបាន "រៀន" ដោយ LLM ដោយហេតុនេះក្លែងបន្លំទិន្នន័យវាយតម្លៃ។
សម្រាប់បញ្ហានីមួយៗដែល o4-mini មិនអាចដោះស្រាយបាន អ្នកដោះស្រាយបញ្ហានឹងទទួលបានរង្វាន់ជាទឹកប្រាក់ ៧.៥០០ ដុល្លារ។
ក្រុមការងារដំបូងមានភាពយឺតយ៉ាវ ប៉ុន្តែមានស្ថិរភាពក្នុងការឆ្លើយសំណួរ។ ទោះជាយ៉ាងណាក៏ដោយ លោក Glazer បានសម្រេចចិត្តពន្លឿនការងារដោយរៀបចំកិច្ចប្រជុំផ្ទាល់រយៈពេលពីរថ្ងៃនៅថ្ងៃទី 17-18 ខែឧសភា។ គណិតវិទូចំនួនសាមសិបនាក់បានចូលរួម ដោយបែងចែកជាក្រុមចំនួនប្រាំមួយនាក់ ដោយប្រកួតប្រជែងគ្នា មិនមែនដើម្បីដោះស្រាយបញ្ហាទេ ប៉ុន្តែដើម្បីបង្កើតបញ្ហាដែល AI មិនអាចដោះស្រាយបាន។
នៅល្ងាចថ្ងៃទី១៧ ខែឧសភា លោក Ken Ono ចាប់ផ្តើមមានអារម្មណ៍ខកចិត្តជាមួយនឹង chatbot ដែលបង្ហាញកម្រិតសមត្ថភាពគណិតវិទ្យាលើសពីការរំពឹងទុក ដែលធ្វើឱ្យក្រុមពិបាក "ចាប់" វា។ គាត់បានរៀបរាប់ថា "ខ្ញុំបានរកឃើញបញ្ហាមួយដែលអ្នកជំនាញក្នុងឧស្សាហកម្មនឹងទទួលស្គាល់ថាជាបញ្ហាបើកចំហមួយនៅក្នុងទ្រឹស្តីលេខ - បញ្ហាដែលសមរម្យសម្រាប់និស្សិតបណ្ឌិត"។
ជាលទ្ធផល នៅពេលដែលគាត់បានសួរ o4-mini គាត់មានការភ្ញាក់ផ្អើលយ៉ាងខ្លាំងនៅពេលឃើញ chatbot វិភាគ វែកញែក និងផ្តល់ដំណោះស្រាយត្រឹមត្រូវក្នុងរយៈពេលត្រឹមតែ 10 នាទីប៉ុណ្ណោះ។ ជាពិសេស ក្នុងរយៈពេលពីរនាទីដំបូង វាបានស្រាវជ្រាវ និងយល់អំពីសម្ភារៈពាក់ព័ន្ធទាំងអស់។ បន្ទាប់មក វាបានស្នើឱ្យពិសោធន៍ជាមួយនឹងកំណែសាមញ្ញជាងនៃបញ្ហា ដើម្បីរៀនវិធីសាស្រ្ត។
ប្រាំនាទីក្រោយមក chatbot បានផ្តល់ចម្លើយត្រឹមត្រូវ អមដោយសម្លេងដែលមានទំនុកចិត្ត — សូម្បីតែក្រអឺតក្រទមបន្តិច —។ Ono បានរៀបរាប់ថា “វាចាប់ផ្តើមធ្វើសកម្មភាពដោយល្បិចកល” “ហើយវាថែមទាំងបានបន្ថែមថា ‘មិនចាំបាច់ដកស្រង់ទេ ខ្ញុំបានគណនាលេខអាថ៌កំបាំងរួចហើយ!’”
ដោយបរាជ័យក្នុងការប្រឆាំងនឹងបញ្ញាសិប្បនិម្មិត (AI) នៅព្រឹកថ្ងៃទី 18 ខែឧសភា លោក Ono បានផ្ញើសារជូនដំណឹងភ្លាមៗទៅក្រុមតាមរយៈ Signal។ លោកបាននិយាយថា "ខ្ញុំមិនបានត្រៀមខ្លួនទាំងស្រុងដើម្បីដោះស្រាយជាមួយគំរូបែបនេះទេ។ ខ្ញុំមិនដែលឃើញហេតុផលបែបនេះនៅក្នុងគំរូកុំព្យូទ័រទេ។ វាគិតដូច អ្នកវិទ្យាសាស្ត្រ ពិតគិត។ ហើយនោះជារឿងគួរឲ្យខ្លាច"។
ទោះបីជាអ្នកគណិតវិទូនៅទីបំផុតទទួលបានជោគជ័យក្នុងការរកឃើញសំណួរចំនួន 10 ដែលធ្វើឱ្យ o4-mini ងឿងឆ្ងល់ក៏ដោយ ក៏ពួកគេមិនអាចលាក់បាំងការភ្ញាក់ផ្អើលរបស់ពួកគេចំពោះល្បឿននៃការអភិវឌ្ឍ AI ក្នុងរយៈពេលត្រឹមតែមួយឆ្នាំនោះទេ។
អូណូ បានប្រៀបធៀបបទពិសោធន៍នៃការធ្វើការជាមួយ o4-mini ទៅនឹងការសហការជាមួយមិត្តរួមការងារដ៏មានទេពកោសល្យម្នាក់។ យ៉ាង ហ៊ុយ ហេ ដែលជាអ្នកគណិតវិទូនៅវិទ្យាស្ថានវិទ្យាសាស្ត្រគណិតវិទ្យានៅទីក្រុងឡុងដ៍ និងជាអ្នកត្រួសត្រាយផ្លូវក្នុងការអនុវត្តបញ្ញាសិប្បនិម្មិត (AI) ទៅលើគណិតវិទ្យា បានអត្ថាធិប្បាយថា “នេះជាអ្វីដែលនិស្សិតបញ្ចប់ការសិក្សាដ៏ល្អម្នាក់អាចធ្វើបាន — ច្រើនជាងនេះទៅទៀត”។
ហើយវាគួរឱ្យកត់សម្គាល់ថា AI ដំណើរការលឿនជាងមនុស្ស។ ខណៈពេលដែលវាត្រូវការពេលឱ្យមនុស្សច្រើនសប្តាហ៍ ឬច្រើនខែដើម្បីដោះស្រាយ o4-mini ចំណាយពេលត្រឹមតែប៉ុន្មាននាទីប៉ុណ្ណោះ។
ភាពរំភើបជុំវិញសមរភូមិប្រាជ្ញាជាមួយ o4-mini ត្រូវបានអមដោយការព្រួយបារម្ភយ៉ាងខ្លាំង។ ទាំង Ono និង He បានព្រមានថាសមត្ថភាពរបស់ o4-mini អាចនាំឱ្យមានទំនុកចិត្តលើសលប់។ He បាននិយាយថា "យើងមានភស្តុតាងដោយអាំងឌុចស្យុង ភស្តុតាងដោយភាពផ្ទុយគ្នា ហើយឥឡូវនេះភស្តុតាងដោយ... កម្លាំងដ៏លើសលប់"។ "ប្រសិនបើអ្នកនិយាយអ្វីមួយដោយមានទំនុកចិត្តគ្រប់គ្រាន់ អ្នកដទៃនឹងមានអារម្មណ៍ភ័យខ្លាច។ ខ្ញុំគិតថា o4-mini បានស្ទាត់ជំនាញភស្តុតាងប្រភេទនេះ៖ អ្វីក៏ដោយដែលវានិយាយគឺប្រាកដណាស់"។
នៅពេលដែលកិច្ចប្រជុំបានបញ្ចប់ អ្នកគណិតវិទូបានចាប់ផ្តើមពិចារណាអំពីអនាគតនៃគណិតវិទ្យា។ ពួកគេបានពិភាក្សាអំពីលទ្ធភាពនៃ "កម្រិតទីប្រាំ" - សំណួរដែលសូម្បីតែអ្នកគណិតវិទូល្អបំផុតរបស់ពិភពលោកក៏មិនអាចដោះស្រាយបានដែរ។ ប្រសិនបើ AI ឈានដល់កម្រិតនោះ តួនាទីរបស់អ្នកគណិតវិទូនឹងផ្លាស់ប្តូរយ៉ាងខ្លាំង៖ បន្ទាប់មកពួកគេអាចក្លាយជាអ្នកសួរសំណួរ ធ្វើអន្តរកម្មជាមួយ និងណែនាំ AI ក្នុងហេតុផលរបស់វាដើម្បី ស្វែងរក សច្ចភាពគណិតវិទ្យាថ្មីៗ - ស្រដៀងគ្នាទៅនឹងរបៀបដែលសាស្ត្រាចារ្យធ្វើការជាមួយនិស្សិតបញ្ចប់ការសិក្សា។
លោក Ono បានមានប្រសាសន៍ថា “ខ្ញុំបានប្រាប់មិត្តរួមការងាររបស់ខ្ញុំមួយរយៈហើយថា វានឹងជាកំហុសធ្ងន់ធ្ងរមួយក្នុងការសន្មត់ថា បញ្ញាសិប្បនិម្មិតទូទៅនឹងមិនដែលលេចឡើងឡើយ ថាវាគ្រាន់តែជាកុំព្យូទ័រមួយប៉ុណ្ណោះ”។ “ខ្ញុំមិនចង់ភ័យស្លន់ស្លោទេ ប៉ុន្តែក្នុងន័យខ្លះ គំរូភាសាធំៗទាំងនេះបានចាប់ផ្តើមមានដំណើរការល្អជាងនិស្សិតបញ្ចប់ការសិក្សាល្អបំផុតរបស់ពិភពលោកភាគច្រើនរួចទៅហើយ”។
ប្រភព៖ https://www.vietnamplus.vn/cuoc-gap-go-dac-biet-noi-cac-nha-toan-hoc-tim-cach-danh-bai-tri-tue-nhan-tao-post1043183.vnp






Kommentar (0)