ការសរសេរកម្មវិធី និងការធ្វើតេស្តគណិតវិទ្យាបង្ហាញថា S1 (ឈ្មោះម៉ូដែល) ដំណើរការដូចគ្នានឹងគំរូ AI ដ៏ទំនើបបំផុតដែលមានហេតុផលដូចជា OpenAI's o1 និង DeepSeek's R1។

គួរកត់សម្គាល់ថា S1 គឺជាគំរូប្រភពបើកចំហដែលមាននៅលើឃ្លាំង GitHub សម្រាប់នរណាម្នាក់ចូលប្រើ។

ក្រុមអភិវឌ្ឍន៍បានចែករំលែកថាពួកគេបានចាប់ផ្តើមពីគំរូដែលមានមូលដ្ឋាន បន្ទាប់មកចម្រាញ់វាតាមរយៈ "ការចម្រាញ់" ដែលជាដំណើរការនៃការទាញយកសមត្ថភាព "ហេតុផល" ពីគំរូ AI ផ្សេងទៀតដោយការបណ្តុះបណ្តាលលើចម្លើយរបស់វា។

ជាពិសេស S1 ត្រូវបានចម្រាញ់ចេញពីគំរូ Gemini 2.0 Flash Thinking Experimental របស់ Google ។ ដំណើរការ​ចម្រោះ​គឺ​ស្រដៀង​នឹង​អ្វី​ដែល​អ្នក​វិទ្យាសាស្ត្រ​នៅ​សាកលវិទ្យាល័យ Berkeley បាន​បង្កើត​គំរូ​មួយ​ដែល​មាន​តម្លៃ​ប្រហែល ៤៥០ ដុល្លារ។

រូបភាព Getty 1168836247 1.jpg.jpeg
DeepSeek បើកការប្រណាំងដើម្បីបង្កើត AI ថោក។ រូបថត៖ TechCrunch

អ្នកស្រាវជ្រាវនៅពីក្រោយ s1 បានរកឃើញវិធីសាមញ្ញបំផុតដើម្បីសម្រេចបាននូវការអនុវត្តហេតុផលដ៏រឹងមាំ និង "ពង្រីកកំឡុងពេលធ្វើតេស្ត" ដែលមានន័យថាអនុញ្ញាតឱ្យគំរូ AI គិតបន្ថែមទៀតមុនពេលឆ្លើយសំណួរ។

នេះគឺជារបកគំហើញមួយនៅក្នុង o1 របស់ OpenAI ដែល DeepSeek និងមន្ទីរពិសោធន៍ AI ផ្សេងទៀតបានព្យាយាមចម្លងតាមបច្ចេកទេសផ្សេងៗ។

ក្រដាស S1 បង្ហាញថាគំរូហេតុផលអាចត្រូវបានចម្រាញ់ជាមួយនឹងសំណុំទិន្នន័យតូចល្មមតាមរយៈដំណើរការដែលហៅថាការត្រួតពិនិត្យការលៃតម្រូវការផាកពិន័យ (SFT) ដែលគំរូ AI ត្រូវបានណែនាំយ៉ាងច្បាស់លាស់ដើម្បីធ្វើត្រាប់តាមឥរិយាបថមួយចំនួននៅក្នុងសំណុំទិន្នន័យ។

SFT ជាទូទៅមានតម្លៃថោកជាងវិធីសាស្រ្តរៀនពង្រឹងទ្រង់ទ្រាយធំដែល DeepSeek បានប្រើដើម្បីបណ្តុះបណ្តាលគំរូ R1 ។

Google កំពុងផ្តល់ការចូលប្រើដោយឥតគិតថ្លៃទៅកាន់ Gemini 2.0 Flash Thinking Experimental ទោះបីជាមានដែនកំណត់ប្រេកង់ប្រចាំថ្ងៃក៏ដោយ តាមរយៈវេទិកា Google AI Studio ។

ទោះជាយ៉ាងណាក៏ដោយ លក្ខខណ្ឌរបស់ Google ហាមប្រាមផ្នែកវិស្វកម្មបញ្ច្រាសម៉ូដែលរបស់ខ្លួនក្នុងការអភិវឌ្ឍន៍សេវាកម្មដែលប្រកួតប្រជែងជាមួយផលិតផល AI របស់ក្រុមហ៊ុន។

S1 គឺផ្អែកលើគំរូ AI តូចមួយដែលអាចរកបានពី AI lab Qwen ដែលជាកម្មសិទ្ធិរបស់ Alibaba ដែលអាចទាញយកដោយឥតគិតថ្លៃ។ ដើម្បីបណ្តុះបណ្តាល S1 អ្នកស្រាវជ្រាវបានបង្កើតសំណុំទិន្នន័យនៃសំណួរចំនួន 1,000 ដែលបានជ្រើសរើសយ៉ាងយកចិត្តទុកដាក់ រួមជាមួយនឹងចម្លើយ និងដំណើរការ "ការគិត" នៅពីក្រោយចម្លើយនីមួយៗពី Gemini 2.0 Flash Thinking Experimental របស់ Google ។

ដំណើរការបណ្តុះបណ្តាលនេះចំណាយពេលតិចជាង 30 នាទីជាមួយនឹង Nvidia H100 GPUs ចំនួន 16 ប៉ុន្តែនៅតែបង្កើតលទ្ធផលខ្លាំងនៅលើ AI benchmarks ជាច្រើន។ Niklas Muennighoff អ្នកស្រាវជ្រាវមកពី Stanford បាននិយាយថា តម្លៃជួលកុំព្យូទ័រដែលចាំបាច់គឺប្រហែល 20 ដុល្លារប៉ុណ្ណោះ។

អ្នកស្រាវជ្រាវបានប្រើល្បិចមួយដើម្បីឱ្យ S1 ពិនិត្យមើលការងាររបស់វា និងពង្រីក "ពេលវេលាគិត" របស់វា ដូចជាការសួរម៉ូដែលឱ្យរង់ចាំ ដោយបន្ថែមពាក្យ "រង់ចាំ" ទៅក្នុងដំណើរការវែកញែករបស់វា ដែលជួយឱ្យម៉ូដែលទទួលបានចម្លើយត្រឹមត្រូវជាងមុន។

នៅឆ្នាំ 2025 ក្រុមហ៊ុន Meta, Google និង Microsoft គ្រោងនឹងវិនិយោគរាប់រយពាន់លានដុល្លារក្នុងហេដ្ឋារចនាសម្ព័ន្ធ AI ដែលផ្នែកមួយនឹងត្រូវបានប្រើប្រាស់ដើម្បីបណ្តុះបណ្តាលម៉ូដែល AI ជំនាន់ក្រោយ។ កម្រិតនៃការវិនិយោគនេះអាចនៅតែត្រូវការដើម្បីជំរុញការបង្កើតថ្មីនៅក្នុង AI ។

Distillation បានបង្ហាញថាជាមធ្យោបាយដ៏ល្អក្នុងការចម្លងសមត្ថភាពគំរូ AI ក្នុងតម្លៃទាប ប៉ុន្តែវាមិនបង្កើតគំរូ AI ថ្មីដែលល្អជាងអ្វីដែលមានសព្វថ្ងៃនេះទេ។

(យោងតាម ​​TechCrunch)

Google បានបញ្ចេញ Gemini 2.0 ជាផ្លូវការដើម្បីប្រកួតប្រជែងជាមួយ AI ចិន Google ទើបតែចេញជាផ្លូវការនូវ chatbot ជំនាន់ក្រោយ Gemini 2.0 ជាមួយនឹងកំណែ និងការអាប់ដេតជាច្រើន។