ទូរសព្ទ o3 pro លេចធ្លោដោយសារសមត្ថភាពរបស់វាក្នុងការដោះស្រាយសំណើស្មុគស្មាញ។ រូបភាព៖ OpenAI។ |
OpenAI បានដាក់ឱ្យដំណើរការ o3 pro ក្នុងកញ្ចប់ Pro ដែលមានតម្លៃ 200 ដុល្លារ/ខែ ជាមួយ Team តាមរយៈ API។ កំណែដែលបានធ្វើឱ្យប្រសើរឡើងរបស់ o3 ដែលត្រូវបានណែនាំកាលពីប៉ុន្មានខែមុន o3 pro ត្រូវបានក្រុមហ៊ុនផ្សព្វផ្សាយថាជាកំណែដ៏មានឥទ្ធិពលបំផុតដែលមាននាពេលបច្ចុប្បន្ន។
កំណែទាំងអស់ដែលមានពាក្យបន្ថែមថា "pro" ត្រូវបានផ្សារភ្ជាប់ជាមួយនឹងសមត្ថភាពក្នុងការឆ្លើយសំណួរដែលពិបាក និងវែងជាង។ មិនដូចកំណែ AI ធម្មតាទេ គំរូវែកញែកដំណើរការបញ្ហាជាជំហានៗ ដែលអនុញ្ញាតឱ្យវាដំណើរការកាន់តែមានស្ថេរភាព និងអាចទុកចិត្តបាននៅក្នុងវិស័យដូចជារូបវិទ្យា គណិតវិទ្យា និងការសរសេរកម្មវិធី។
ក្រុមហ៊ុនបានបញ្ជាក់ថា “យើងសូមណែនាំឱ្យប្រើប្រាស់ o3-pro សម្រាប់សំណួរពិបាកៗដែលភាពជឿជាក់មានសារៈសំខាន់ជាងល្បឿន ហើយការរង់ចាំពីរបីនាទីគឺជាការដោះដូរដ៏មានតម្លៃ”។ នៅក្នុងការពិនិត្យសាកល្បងរួម o3-pro សម្រេចបានលទ្ធផលល្អជាងបើធៀបនឹងកំណែ o3 និង o1-pro។
ដោយធ្វើអត្ថាធិប្បាយលើម៉ូដែលថ្មីនេះ លោក Ben Hylak អតីតបុគ្គលិក Apple និងជាសហស្ថាបនិកក្រុមហ៊ុនអភិវឌ្ឍន៍ AI Raindrop បាននិយាយថា វាឆ្លាតជាង។ គាត់បានចងក្រងប្រវត្តិនៃកិច្ចប្រជុំមុនៗទាំងអស់នៅក្រុមហ៊ុនរបស់គាត់ បន្ទាប់មកបានស្នើសុំឱ្យ o3-pro បង្កើតផែនការមួយ។
លទ្ធផលគឺគួរឱ្យចាប់អារម្មណ៍ ជាក់លាក់ និងវិភាគយ៉ាងច្បាស់ — ដូចដែលគាត់តែងតែសង្ឃឹមថាការធ្វើគំរូភាសាទ្រង់ទ្រាយធំ (LLM) អាចសម្រេចបាន។ ផែនការនេះរួមមានរង្វាស់គោលដៅ ពេលវេលា អាទិភាព និងការណែនាំយ៉ាងតឹងរ៉ឹងអំពីអ្វីដែលត្រូវលុបចោលទាំងស្រុង។ គាត់បានសរសេរថា "វាមានភាពជាក់លាក់ និងមានមូលដ្ឋានល្អ ដែលខ្ញុំត្រូវគិតឡើងវិញអំពីអនាគតរបស់ក្រុមហ៊ុនរបស់ខ្ញុំ"។
លទ្ធផលដែលទទួលបានពី o3 pro (ខាងឆ្វេង) មានភាពជាក់លាក់ និងអាចទុកចិត្តបានជាង។ រូបថត៖ Ben Hylak/X។ |
O3-pro មានតម្លៃ 20 ដុល្លារក្នុងមួយលានថូខឹនដែលបានវិនិយោគ និង 80 ដុល្លារក្នុងមួយលានថូខឹនដែលបាននាំចេញនៅពេលប្រើប្រាស់តាមរយៈ API។ នេះគឺដោយសារតែសមត្ថភាពរបស់ AI ក្នុងការទន្ទេញចាំ និងដំណើរការទិន្នន័យ។ ថូខឹនមួយលានដែលបានវិនិយោគគឺស្មើនឹងប្រហែល 750,000 ពាក្យ ដែលវែងជាងសៀវភៅ *សង្គ្រាម និង សន្តិភាព* ដូចដែល The Verge បានប្រៀបធៀប។
OpenAI បានបញ្ជាក់ថា អ្នកជំនាញតែងតែវាយតម្លៃ o3 pro ខ្ពស់ជាង o3 នៅក្នុងគ្រប់ប្រភេទដែលបានសាកល្បង។ អ្នកវាយតម្លៃក៏ផ្តល់ចំណាត់ថ្នាក់ខ្ពស់ជាង o3 pro សម្រាប់ភាពស៊ីសង្វាក់គ្នាក្នុងលក្ខណៈវិនិច្ឆ័យជាច្រើនដូចជា ភាពច្បាស់លាស់ ភាពងាយស្រួលតាមដាន និងភាពត្រឹមត្រូវ ជាពិសេសនៅក្នុងវិស័យសំខាន់ៗដូចជា វិទ្យាសាស្ត្រ ការអប់រំ ការសរសេរកម្មវិធី អាជីវកម្ម និងការគាំទ្រការសរសេរ។
នៅក្នុងការធ្វើតេស្ត AIME 2024 ដែលជាការធ្វើតេស្តវាយតម្លៃសមត្ថភាពគណិតវិទ្យារបស់ម៉ូដែលនេះ o3 pro ទទួលបានពិន្ទុខ្ពស់ជាង Gemini 2.5 Pro ដែលជា AI កំពូលរបស់ Google។ លើសពីនេះ ម៉ូដែលនេះក៏បានវ៉ាដាច់ Claude 4 Opus របស់ Anthropic ក្នុង GPQA Diamond ដែលជាការធ្វើតេស្តចំណេះដឹង វិទ្យាសាស្ត្រ កម្រិតបណ្ឌិត។
o3 pro ក៏រួមបញ្ចូលឧបករណ៍ដែលអនុញ្ញាតឱ្យវាស្វែងរកគេហទំព័រ វិភាគឯកសារ ប្រើប្រាស់ Python សម្រាប់ការគណនា និងការសរសេរកម្មវិធី និងកំណត់ការឆ្លើយតបផ្ទាល់ខ្លួនដោយប្រើប្រាស់អង្គចងចាំ។ ដោយធ្វើអត្ថាធិប្បាយលើទិដ្ឋភាពនេះ លោក Ben Hylak បានកត់សម្គាល់ថា ឧបករណ៍នេះបង្ហាញយ៉ាងច្បាស់ពីសមត្ថភាពរបស់វាក្នុងការសម្គាល់បរិស្ថានជុំវិញខ្លួន ដោយដឹងពីពេលណាត្រូវសួរអំពីពិភពខាងក្រៅ (ជំនួសឱ្យការធ្វើពុតជាដឹង) និងជ្រើសរើសឧបករណ៍ត្រឹមត្រូវសម្រាប់កិច្ចការនីមួយៗ។
ទោះជាយ៉ាងណាក៏ដោយ ចំណុចខ្វះខាតធំបំផុតរបស់ម៉ូដែលនេះគឺស្ថិតនៅក្នុងពេលវេលាឆ្លើយតបរបស់វា ដែលវាថែមទាំងយឺតជាង o1 pro ទៀតផង។ អ្នកប្រើប្រាស់ YouTube លោក Bijan Bowen យល់ស្របនឹងចំណុចនេះ។ លោកបានមានប្រសាសន៍ថា "ទោះបីជាការឆ្លើយតបរបស់ម៉ូដែលនេះមានភាពច្បាស់លាស់ក៏ដោយ ក្នុងរយៈពេលត្រឹមតែប្រយោគពិពណ៌នាមួយចំនួន ពេលវេលាឆ្លើយតបគឺវែងណាស់"។ លោក Ben Hylak បានបន្ថែមថា ជាពិសេសក្នុងករណីដែលមានទិន្នន័យខាងក្រៅមិនគ្រប់គ្រាន់ ម៉ូដែលនេះងាយនឹងគិតច្រើនពេក។
O3-pro ក៏មានដែនកំណត់មួយចំនួនផ្សេងទៀតដែរ ដូចជាអសមត្ថភាពក្នុងការបង្កើតរូបភាព ក៏ដូចជាការគាំទ្រសម្រាប់មុខងារ Canvas។ មុខងារជជែកបណ្ដោះអាសន្នជាមួយម៉ូដែលនេះនៅក្នុង ChatGPT បច្ចុប្បន្នត្រូវបានបិទ ខណៈពេលដែល OpenAI ជួសជុល "បញ្ហាបច្ចេកទេស"។
ទោះជាយ៉ាងណាក៏ដោយ Hylak អះអាងថា នេះមិនមែនជាគំរូសម្រាប់ការជជែកដែលងាយស្រួលប្រើដូច Claude 3.5 Sonnet ឬ ChatGPT 4o នោះទេ។ Nate B. Jones ប្រធានផលិតផលនៅ Rockerbox ណែនាំថា o3 pro គួរតែត្រូវបានប្រើសម្រាប់កិច្ចការដ៏លំបាកដែលត្រូវការការគិតរយៈពេល 15-20 នាទី។
ប្រភព៖ https://znews.vn/mo-hinh-suy-luan-moi-cua-chatgpt-post1560084.html






Kommentar (0)