គំរូភាសាថ្មីរបស់ OpenAI គឺផ្អែកលើក្របខ័ណ្ឌ GPT-4 ពីមុន ប៉ុន្តែត្រូវបានពង្រីក និងកែលម្អក្នុងអំឡុងពេលបណ្តុះបណ្តាល។ ខណៈពេលដែលមិនមែនជាកម្រិតខ្ពស់បំផុត GPT-4.5 មានចំណេះដឹងបន្ថែម ជំនាញសរសេរកាន់តែប្រសើរឡើង និងបុគ្គលិកលក្ខណៈដែលចម្រាញ់ជាងជំនាន់មុនរបស់វា។
យោងតាមទិន្នន័យគោល GPT-4.5 គឺជាការធ្វើឱ្យប្រសើរឡើងតិចតួចជាង GPT-4 ។ នៅលើ SWE-bench Verified benchmark គំរូនេះសម្រេចបាន 38% ដែលជាការកែលម្អ 2-7% លើ GPT-4 ប៉ុន្តែនៅតែ 30% ទាបជាងការរៀនស៊ីជម្រៅដែលមានមូលដ្ឋានលើ OpenAI o3 ។ សម្រាប់ការប្រៀបធៀប ម៉ូដែល Claude 3.7 Sonnet របស់ Anthropic សម្រេចបានប្រសិទ្ធភាព 62.3% នៅលើស្តង់ដារដូចគ្នា។ នៅលើស្តង់ដារភាពត្រឹមត្រូវរបស់ SimpleQA GPT-4.5 ទទួលបានពិន្ទុ 62.5% បើប្រៀបធៀបទៅនឹង 38.2% របស់ GPT-4 ។ ទោះយ៉ាងណាក៏ដោយ នៅលើស្តង់ដារអត្រា Hallucination Rate របស់ SimpleQA GPT-4.5 ទទួលបានពិន្ទុទាបបំផុតក្នុងចំណោមគំរូភាសាធំៗរបស់ OpenAI ។
បំពេញតាមស្តង់ដារថ្មីរបស់ OpenAI
ថ្មីៗនេះ ក្រុមការត្រៀមលក្ខណៈរបស់ OpenAI បានបង្កើតស្តង់ដារថ្មីមួយដែលហៅថា SWE-Lancer ដើម្បីវាយតម្លៃការអនុវត្តនៃគំរូភាសាធំៗលើការងារវិស្វកម្មផ្នែកទន់ក្នុងពិភពពិត ដូចជាការអភិវឌ្ឍន៍មុខងារ និងការជួសជុលកំហុសជាដើម។ នៅក្នុងគោលនេះ GPT-4.5 អាចដោះស្រាយបាន 20% នៃកិច្ចការ IC SWE និង 44% នៃភារកិច្ច SWE Manager ដែលជាការកែលម្អបន្តិចបន្តួចជាងគំរូមុន។
ទាក់ទងនឹងសុវត្ថិភាព ក្រុមប្រឹក្សាសុវត្ថិភាពរបស់ OpenAI បានចាត់ថ្នាក់ GPT-4.5 ថាមានហានិភ័យមធ្យម ជាមួយនឹងពិន្ទុទាបនៅក្នុងផ្នែកនៃសុវត្ថិភាពតាមអ៊ីនធឺណិត និងស្វ័យភាពនៃគំរូ។
ឥឡូវនេះ អ្នកប្រើប្រាស់ ChatGPT Pro អាចជួបប្រទះការមើលជាមុននៃម៉ូដែល GPT-4.5 តាមរយៈកម្មវិធីជ្រើសរើសម៉ូដែលនៅលើគេហទំព័រ ទូរសព្ទ និងកុំព្យូទ័រ។ ម៉ូដែលនេះគាំទ្រការស្វែងរក ទាញយកឯកសារ រូបភាព និងមុខងារផ្ទាំងក្រណាត់នៅលើ ChatGPT។ មុខងារពហុមុខងារដូចជាមុខងារសំឡេង វីដេអូ និងការចែករំលែកអេក្រង់នឹងត្រូវបានបន្ថែមនាពេលអនាគត។
GPT-4.5 នឹងមានលក់ជាផ្លូវការនៅសប្តាហ៍ក្រោយសម្រាប់អ្នកប្រើប្រាស់ ChatGPT Plus និង Teams ក៏ដូចជាសម្រាប់អ្នកអភិវឌ្ឍន៍ដែលបានបង់ប្រាក់ទាំងអស់តាមរយៈ Chat Completions API, Assistants API និង Batch API ជាមួយនឹងមុខងារគួរឱ្យកត់សម្គាល់ដូចជាការហៅមុខងារ លទ្ធផលដែលមានរចនាសម្ព័ន្ធ ការផ្សាយ និងការផ្ញើសារជាប្រព័ន្ធ។
Kommentar (0)