ចុងសប្តាហ៍មួយនៅពាក់កណ្តាលខែឧសភា ការប្រជុំសម្ងាត់នៃពិភពគណិតវិទ្យាបានកើតឡើង។ គណិតវិទូឈានមុខគេ របស់ពិភពលោក ចំនួន 30 នាក់បានធ្វើដំណើរដោយសម្ងាត់ទៅកាន់ទីក្រុង Berkeley រដ្ឋកាលីហ្វ័រញ៉ា សហរដ្ឋអាមេរិក ដើម្បីចូលរួមការប្រឈមមុខជាមួយ chatbot ដែលមានសមត្ថភាព "វែកញែក" ។ chatbot មានភារកិច្ចដោះស្រាយបញ្ហាដែលសរសេរដោយគណិតវិទូខ្លួនឯង ដើម្បីសាកល្បងសមត្ថភាពដោះស្រាយបញ្ហារបស់វា។
បន្ទាប់ពីពីរថ្ងៃនៃការបន្តសំណួរកម្រិតសាស្រ្តាចារ្យ គណិតវិទូមានការភ្ញាក់ផ្អើលដោយដឹងថា chatbot នេះអាចដោះស្រាយបញ្ហាលំបាកបំផុតមួយចំនួនដែលមិនធ្លាប់មានក្នុងប្រវត្តិសាស្ត្រ។
លោក Ken Ono សាស្ត្រាចារ្យនៅសាកលវិទ្យាល័យ Virginia និងជាប្រធាន និងចៅក្រមនៃកិច្ចប្រជុំបានប្រាប់ Scientific American ថា "ខ្ញុំបានឃើញសហសេវិកនិយាយយ៉ាងច្បាស់ថាគំរូភាសាដ៏ធំនេះកំពុងខិតជិតដល់កម្រិតនៃទេពកោសល្យគណិតវិទ្យា" ។
chatbot ដែលទាក់ទាញការចាប់អារម្មណ៍របស់យើងគឺដំណើរការដោយ o4-mini ដែលជាគំរូភាសាធំ (LLM) ដែលត្រូវបានរចនាឡើងសម្រាប់ហេតុផលស្មុគស្មាញ។ វាគឺជាផលិតផលរបស់ OpenAI ហើយត្រូវបានបណ្តុះបណ្តាលដើម្បីអនុវត្តការវែកញែកដ៏ទំនើប។ ម៉ូដែលសមមូលពី Google គឺ Gemini 2.5 Flash មានសមត្ថភាពស្រដៀងគ្នា។
ដូច ChatGPT LLMs ពីមុនដែរ o4-mini រៀនទាយពាក្យបន្ទាប់ក្នុងខ្សែអក្សរ។ ទោះជាយ៉ាងណាក៏ដោយ o4-mini គឺជាកំណែដែលស្រាលជាងមុន និងអាចបត់បែនបានដែលត្រូវបានបណ្តុះបណ្តាលលើទិន្នន័យស៊ីជម្រៅ និងត្រូវបានកែតម្រូវយ៉ាងជិតស្និទ្ធដោយមនុស្ស ដែលអនុញ្ញាតឱ្យវាស្វែងយល់ពីបញ្ហាគណិតវិទ្យាដែលម៉ូដែលមុនៗមិនអាចទៅដល់បាន។
ដើម្បីសាកល្បងសមត្ថភាពរបស់ o4-mini OpenAI បានសួរ Epoch AI ដែលជាអង្គការមិនរកប្រាក់ចំណេញដែលមានជំនាញក្នុងការសាកល្បងគំរូ LLM ដើម្បីបង្កើត 300 សំណួរគណិតវិទ្យាដែលមិនបានផ្សព្វផ្សាយពីមុន។ ខណៈពេលដែល LLMs បែបប្រពៃណីអាចដោះស្រាយបញ្ហាស្មុគស្មាញជាច្រើន នៅពេលប្រឈមនឹងសំណួរថ្មីទាំងស្រុង ភាគច្រើននៃពួកគេទទួលបានភាពត្រឹមត្រូវតិចជាង 2% ដែលបង្ហាញថាពួកគេពិតជាមិនមានសមត្ថភាពក្នុងការវែកញែក។
នៅក្នុងគម្រោងវាយតម្លៃថ្មី Epoch AI បានជ្រើសរើសគណិតវិទូវ័យក្មេង Dr. Elliot Glazer ជាអ្នកដឹកនាំរបស់ខ្លួន។ គម្រោងថ្មីដែលមានឈ្មោះថា FrontierMath នឹងត្រូវដាក់ឱ្យប្រើប្រាស់ចាប់ពីខែកញ្ញា ឆ្នាំ 2024។
គម្រោងនេះប្រមូលសំណួរថ្មីនៅកម្រិតលំបាកចំនួនបួន ចាប់ពីថ្នាក់បរិញ្ញាបត្រ បញ្ចប់ការសិក្សា រហូតដល់ការស្រាវជ្រាវកម្រិតខ្ពស់។ នៅខែមេសាឆ្នាំ 2025 Glazer បានរកឃើញថា o4-mini អាចដោះស្រាយបញ្ហាបានប្រហែល 20% ។ ដូច្នេះគាត់បានផ្លាស់ប្តូរផ្លូវទាំងអស់ទៅកម្រិតទី 4 ដោយសុំឱ្យវាដោះស្រាយបញ្ហាដែលសូម្បីតែគណិតវិទូកម្រិតខ្ពស់នឹងតស៊ូជាមួយ។
អ្នកចូលរួមត្រូវបានបង្ខំឱ្យចុះហត្ថលេខាលើកិច្ចព្រមព្រៀងរក្សាការសម្ងាត់ ហើយអាចទំនាក់ទំនងបានតែតាមរយៈកម្មវិធីដែលបានអ៊ិនគ្រីប Signal ព្រោះថាការប្រើអ៊ីមែលអាចអនុញ្ញាតឱ្យ LLM ស្កេន និង "sniff" មាតិកា ដោយហេតុនេះការក្លែងបន្លំទិន្នន័យវាយតម្លៃ។
បញ្ហានីមួយៗដែល o4-mini មិនអាចដោះស្រាយបាន នឹងនាំមកជូនអ្នកសួរនូវរង្វាន់ 7,500 ដុល្លារ។
ក្រុមដំបូងបានដំណើរការយឺត ប៉ុន្តែមានការរីកចម្រើនជាលំដាប់ ក្នុងការស្វែងរកសំណួរ។ ប៉ុន្តែ Glazer បានសម្រេចចិត្តបង្កើនល្បឿនដោយរៀបចំការប្រជុំដោយផ្ទាល់នៅថ្ងៃទី 17-18 ខែឧសភា។ គណិតវិទូចំនួន 30 នាក់ដែលចូលរួមត្រូវបានបែងចែកទៅជាក្រុមចំនួន 6 ដោយប្រកួតប្រជែងគ្នា មិនមែនដើម្បីដោះស្រាយបញ្ហានោះទេ ប៉ុន្តែដើម្បីដោះស្រាយបញ្ហាដែល AI មិនអាចដោះស្រាយបាន។
នៅល្ងាចថ្ងៃទី 17 ឧសភា Ken Ono ចាប់ផ្តើមខកចិត្តនឹង chatbot ដែលកំពុងបង្ហាញកម្រិតនៃជំនាញគណិតវិទ្យាលើសពីអ្វីដែលរំពឹងទុក ដែលធ្វើឱ្យក្រុមពិបាក "ចាប់" វា។ គាត់បាននិយាយថា "ខ្ញុំបានដោះស្រាយបញ្ហាដែលអ្នកជំនាញក្នុងវិស័យនេះនឹងទទួលស្គាល់ថាជាបញ្ហាបើកចំហនៅក្នុងទ្រឹស្តីចំនួន - ជាបញ្ហាដែលសមរម្យសម្រាប់បណ្ឌិត" ។
ជាលទ្ធផលនៅពេលដែលគាត់បានសួរ o4-mini គាត់មានការភ្ញាក់ផ្អើលនៅពេលឃើញ chatbot វិភាគហេតុផល និងចេញមកជាមួយនឹងដំណោះស្រាយត្រឹមត្រូវក្នុងរយៈពេលត្រឹមតែ 10 នាទីប៉ុណ្ណោះ។ ជាពិសេសក្នុងរយៈពេលពីរនាទីដំបូង វាបានរៀន និងចាប់យកឯកសារពាក់ព័ន្ធទាំងអស់។ បន្ទាប់មក វាបានស្នើឱ្យសាកល្បងកំណែសាមញ្ញនៃបញ្ហា ដើម្បីរៀនពីរបៀបចូលទៅជិតវា។
ប្រាំនាទីក្រោយមក chatbot បានផ្តល់ចម្លើយត្រឹមត្រូវ ដោយនិយាយដោយទំនុកចិត្ត - សូម្បីតែក្រអឺតក្រទម - សម្លេង។ អូណូនិយាយថា “វាចាប់ផ្តើមឆេវឆាវ” ហើយវាបានបន្ថែមថា “មិនចាំបាច់មានសម្រង់ទេ ព្រោះខ្ញុំរកឃើញលេខសម្ងាត់ហើយ!”
ដោយចាញ់ AI នៅព្រឹកព្រលឹមថ្ងៃទី 18 ឧសភា Ono បានផ្ញើសារព្រមានភ្លាមៗទៅកាន់ក្រុមតាមរយៈ Signal ។ គាត់បាននិយាយថា “ខ្ញុំមិនបានត្រៀមខ្លួនទាំងស្រុងក្នុងការដោះស្រាយជាមួយនឹងតារាម៉ូដែលបែបនេះទេ។ "ខ្ញុំមិនដែលឃើញការវែកញែកបែបនេះនៅក្នុងគំរូកុំព្យូទ័រទេ។ វាគិតដូច អ្នកវិទ្យាសាស្ត្រ ពិតគិតអញ្ចឹង។ ហើយវាគួរឱ្យខ្លាចណាស់"។
ទោះបីជាទីបំផុតគណិតវិទូបានជោគជ័យក្នុងការស្វែងរកសំណួរចំនួន 10 ដែលធ្វើឱ្យ o4-mini ជាប់គាំងក៏ដោយ ក៏ពួកគេនៅតែមិនអាចលាក់បាំងភាពតក់ស្លុតរបស់ពួកគេចំពោះល្បឿននៃការអភិវឌ្ឍន៍របស់ AI ក្នុងរយៈពេលត្រឹមតែមួយឆ្នាំប៉ុណ្ណោះ។
អូណូ ប្រៀបធៀបបទពិសោធន៍នៃការធ្វើការជាមួយ o4-mini ទៅនឹងការសហការជាមួយសហការីដែលមានទេពកោសល្យ។ ហើយ Yang Hui He ដែលជាគណិតវិទូនៅវិទ្យាស្ថានវិទ្យាសាស្ត្រគណិតវិទ្យាទីក្រុងឡុងដ៍ និងជាអ្នកត្រួសត្រាយផ្លូវក្នុងការអនុវត្ត AI ទៅនឹងគណិតវិទ្យា បានផ្តល់យោបល់ថា "នេះគឺជាអ្វីដែលសិស្ស PhD ដ៏ប៉ិនប្រសប់ម្នាក់អាចធ្វើបាន ហើយថែមទាំងមានច្រើនទៀត។"
ហើយគួរកត់សំគាល់ថា AI ធ្វើវាលឿនជាងមនុស្ស។ ខណៈពេលដែលវាត្រូវការមនុស្សច្រើនសប្តាហ៍ ឬច្រើនខែដើម្បីដោះស្រាយវា o4-mini ចំណាយពេលតែប៉ុន្មាននាទីប៉ុណ្ណោះ។
ភាពរំភើបជុំវិញ o4-mini គឺមិនមែនដោយគ្មានកង្វល់របស់វានោះទេ។ ទាំង Ono និង He ព្រមានថាសមត្ថភាពរបស់ o4-mini អាចធ្វើឱ្យមនុស្សមានទំនុកចិត្តខ្លាំងពេក។ គាត់និយាយថា៖ «យើងមានភ័ស្តុតាងដោយការបញ្ឆេះ ភស្តុតាងដោយភាពផ្ទុយគ្នា ហើយឥឡូវនេះភស្តុតាងដោយ... លើសលប់។ "ប្រសិនបើអ្នកនិយាយអ្វីមួយដោយមានទំនុកចិត្តគ្រប់គ្រាន់ មនុស្សនឹងមានការបំភិតបំភ័យ។ ខ្ញុំគិតថា o4-mini បានស្ទាត់ជំនាញភស្តុតាងបែបនេះ៖ វានិយាយគ្រប់យ៉ាងដោយភាពជឿជាក់ដ៏អស្ចារ្យ"។
នៅពេលដែលកិច្ចប្រជុំបានបញ្ចប់ គណិតវិទូចាប់ផ្តើមគិតអំពីអនាគតនៃគណិតវិទ្យា។ ពួកគេបានពិភាក្សាអំពីលទ្ធភាពនៃ "កម្រិតទីប្រាំ" ដែលជាសំណួរដែលសូម្បីតែគណិតវិទូដ៏ល្អបំផុតរបស់ពិភពលោកមិនអាចដោះស្រាយបាន។ ប្រសិនបើ AI ឈានដល់កម្រិតនោះ តួនាទីរបស់គណិតវិទូនឹងផ្លាស់ប្តូរយ៉ាងខ្លាំង៖ ប្រហែលជាពួកគេនឹងក្លាយជាអ្នកសួរ ធ្វើអន្តរកម្មជាមួយ និងណែនាំហេតុផល AI ដើម្បី ស្វែងរក ការពិតគណិតវិទ្យាថ្មីៗ ដែលស្រដៀងនឹងវិធីសាស្រ្តាចារ្យធ្វើការជាមួយនិស្សិតបញ្ចប់ការសិក្សា។
លោក Ono បាននិយាយថា "ខ្ញុំបានប្រាប់សហការីរបស់ខ្ញុំអស់រយៈពេលជាយូរមកហើយថា វាជាកំហុសដ៏ធំមួយក្នុងការគិតថា AI ទូទៅនឹងមិនកើតឡើងនោះទេ វាគ្រាន់តែជាកុំព្យូទ័រប៉ុណ្ណោះ"។ "ខ្ញុំមិនចង់ភ័យស្លន់ស្លោទេ ប៉ុន្តែតាមវិធីខ្លះគំរូភាសាធំៗទាំងនេះកំពុងតែចាប់ផ្តើមលើសនិស្សិត PhD ល្អបំផុតរបស់ពិភពលោកហើយ"។
ប្រភព៖ https://www.vietnamplus.vn/cuoc-gap-go-dac-biet-noi-cac-nha-toan-hoc-tim-cach-danh-bai-tri-tue-nhan-tao-post1043183.vnp
Kommentar (0)