o3 pro លេចធ្លោសម្រាប់សមត្ថភាពរបស់វាក្នុងការដោះស្រាយសំណើស្មុគស្មាញ។ រូបថត៖ OpenAI ។ |
OpenAI បានបើកដំណើរការ o3 pro នៅក្នុងកញ្ចប់ Pro របស់ខ្លួនក្នុងតម្លៃ $200/ខែ និង Team តាមរយៈ API ។ កំណែអាប់ដេតរបស់ o3 ដែលត្រូវបានណែនាំកាលពីប៉ុន្មានខែមុន o3 pro ត្រូវបានក្រុមហ៊ុនចាត់ទុកថាជាកំណែដែលមានឥទ្ធិពលបំផុតនៅឡើយ។
កំណែទាំងអស់ដែលមានស្លាក "គាំទ្រ" នឹងត្រូវបានភ្ជាប់ជាមួយនឹងសមត្ថភាពក្នុងការឆ្លើយសំណួរដែលពិបាក និងវែងជាងនេះ។ មិនដូចកំណែធម្មតារបស់ AI ទេ គំរូការសន្និដ្ឋានដោះស្រាយបញ្ហាមួយជំហានម្តងៗ ដែលអនុញ្ញាតឱ្យពួកគេធ្វើការកាន់តែមានភាពជឿជាក់ និងជាប់លាប់ក្នុងផ្នែកដូចជា រូបវិទ្យា គណិតវិទ្យា និងការសរសេរកម្មវិធី។
ក្រុមហ៊ុនបាននិយាយថា "យើងណែនាំ o3-pro សម្រាប់សំណួរពិបាក ដែលភាពជឿជាក់មានសារៈសំខាន់ជាងល្បឿន ហើយការរង់ចាំពីរបីនាទីគឺមានតម្លៃក្នុងការដោះដូរ" ។ នៅក្នុងការពិនិត្យសាកល្បងរួមគ្នា o3-pro បានដំណើរការជាងកំណែ o3 និង o1-pro ។
Ben Hylak អតីតបុគ្គលិក Apple និងជាសហស្ថាបនិកនៃក្រុមហ៊ុន AI startup Raindrop បាននិយាយថា ម៉ូដែលថ្មីនេះឆ្លាតជាង។ គាត់បានប្រមូលប្រវត្តិនៃកិច្ចប្រជុំមុនៗទាំងអស់នៅក្រុមហ៊ុនរបស់គាត់ ហើយបន្ទាប់មកបានស្នើសុំឱ្យ o3-pro បង្កើតផែនការមួយ។
លទ្ធផលគឺគួរឱ្យចាប់អារម្មណ៍ ជាក់លាក់ និងការវិភាគដូចដែលគាត់បានសង្ឃឹមថាគំរូភាសាដ៏ធំ (LLM) នឹងមាន។ ផែនការនេះរួមមានរង្វាស់គោលដៅ ការកំណត់ពេលវេលា អាទិភាព និងការណែនាំយ៉ាងតឹងរឹងលើអ្វីដែលត្រូវលុបបំបាត់ទាំងស្រុង។ គាត់បានសរសេរថា "វាមានលក្ខណៈជាក់លាក់ និងមានមូលដ្ឋានដែលខ្ញុំត្រូវគិតឡើងវិញអំពីអនាគតនៃក្រុមហ៊ុនរបស់ខ្ញុំ" ។
លទ្ធផលពី o3 pro (ឆ្វេង) គឺកាន់តែជាក់លាក់ និងមូលដ្ឋាន។ រូបថត៖ Ben Hylak/X. |
O3-pro មានតម្លៃ 20 ដុល្លារក្នុង 1 លាននិមិត្តសញ្ញាបញ្ចូល និង 80 ដុល្លារក្នុង 1 លាននិមិត្តសញ្ញាលទ្ធផល នៅពេលប្រើតាមរយៈ API ។ នោះគឺជាសមត្ថភាពរបស់ AI ក្នុងការចងចាំ និងដំណើរការទិន្នន័យ។ និមិត្តសញ្ញាបញ្ចូលមួយលានគឺស្មើនឹងប្រហែល 750,000 ពាក្យ ដែលវែងជាងសៀវភៅ War and Peace , The Verge ប្រៀបធៀប។
OpenAI សរសេរថាអ្នកជំនាញបានផ្តល់ឱ្យ o3 pro នូវចំណាត់ថ្នាក់ខ្ពស់ជាង o3 នៅគ្រប់ប្រភេទដែលបានសាកល្បង។ អ្នកវាយតម្លៃក៏បានផ្តល់ឱ្យ o3 pro នូវចំណាត់ថ្នាក់ខ្ពស់ជាងសម្រាប់ភាពស៊ីសង្វាក់គ្នាលើលក្ខណៈវិនិច្ឆ័យមួយចំនួន រួមទាំងភាពច្បាស់លាស់ ភាពងាយស្រួលនៃការធ្វើតាមការណែនាំ និងភាពត្រឹមត្រូវ ជាពិសេសនៅក្នុងផ្នែកសំខាន់ៗដូចជា វិទ្យាសាស្រ្ត ការអប់រំ ការសរសេរកម្មវិធី អាជីវកម្ម និងការគាំទ្រការសរសេរ។
នៅលើ AIME 2024 ការធ្វើតេស្តដែលវាយតម្លៃសមត្ថភាពគណិតវិទ្យារបស់ម៉ូដែល o3 pro ទទួលបានពិន្ទុខ្ពស់ជាង Gemini 2.5 Pro ដែលជា AI របស់ Google ។ លើសពីនេះ ម៉ូដែលនេះក៏បានវ៉ាដាច់ Anthropic's Claude 4 Opus នៅលើ GPQA Diamond ដែលជាការសាកល្បងចំណេះដឹង ផ្នែកវិទ្យាសាស្ត្រ កម្រិតបណ្ឌិត។
o3 pro ក៏មានភ្ជាប់មកជាមួយនូវឧបករណ៍ដែលភ្ជាប់មកជាមួយដែលអនុញ្ញាតឱ្យវាស្វែងរកគេហទំព័រ វិភាគឯកសារ ប្រើប្រាស់ Python សម្រាប់ការគណនា និងការសរសេរកម្មវិធី និងកំណត់ការឆ្លើយតបផ្ទាល់ខ្លួនដោយប្រើប្រាស់អង្គចងចាំ។ ដោយបញ្ចេញមតិលើទិដ្ឋភាពនេះ លោក Ben Hylak បាននិយាយថា ឧបករណ៍នេះបង្ហាញយ៉ាងច្បាស់នូវសមត្ថភាពរបស់ខ្លួនក្នុងការទទួលស្គាល់ជុំវិញខ្លួន នៅពេលដែលត្រូវសួរអំពីពិភពខាងក្រៅ (ជំនួសឱ្យការក្លែងបន្លំដឹង) និងជ្រើសរើសឧបករណ៍ត្រឹមត្រូវសម្រាប់កិច្ចការនីមួយៗ។
ទោះជាយ៉ាងណាក៏ដោយ គុណវិបត្តិដ៏ធំបំផុតរបស់ម៉ូដែលនេះគឺពេលវេលាឆ្លើយតបរបស់វា ដែលសូម្បីតែយឺតជាង o1 pro។ YouTuber Bijan Bowen យល់ស្រប។ លោកបានមានប្រសាសន៍ថា “ទោះបីជាចម្លើយរបស់តារាម៉ូដែលគឺច្បាស់លាស់ ប៉ុន្តែក្នុងប្រយោគមួយចំនួននៃការពិពណ៌នា ពេលវេលានៃការឆ្លើយតបគឺវែងណាស់”។ លោក Ben Hylak បានបន្ថែមថា ជាពិសេសនៅក្នុងករណីដែលមិនមានទិន្នន័យខាងក្រៅគ្រប់គ្រាន់ គំរូនេះទំនងជាគិតដោយចៃដន្យ។
O3-pro ក៏មានដែនកំណត់មួយចំនួនផ្សេងទៀត ដូចជាអសមត្ថភាពក្នុងការបង្កើតរូបភាព ក៏ដូចជាការគាំទ្រសម្រាប់មុខងារ Canvas ផងដែរ។ មុខងារជជែកបណ្ដោះអាសន្នរបស់ ChatGPT ជាមួយម៉ូដែលនេះបច្ចុប្បន្នត្រូវបានបិទខណៈពេលដែល OpenAI ជួសជុល "បញ្ហាបច្ចេកទេស"។
ទោះជាយ៉ាងណាក៏ដោយ លោក ហ៊ីលឡាក់ បាននិយាយថា នេះមិនមែនជាគំរូសម្រាប់អ្នកប្រើប្រាស់ក្នុងការជជែកដូច Claude 3.5 Sonnet ឬ ChatGPT 4o នោះទេ។ ដំបូន្មានពី Nate B. Jones ប្រធានផ្នែកផលិតផលនៅ Rockerbox បាននិយាយថា o3 pro គួរតែត្រូវបានប្រើសម្រាប់កិច្ចការពិបាកដែលទាមទារ 15-20 នាទីនៃការគិត។
ប្រភព៖ https://znews.vn/mo-hinh-suy-luan-moi-cua-chatgpt-post1560084.html
Kommentar (0)