ការសរសេរកម្មវិធី និងការធ្វើតេស្តគណិតវិទ្យាបង្ហាញថា S1 (ឈ្មោះម៉ូដែល) ដំណើរការដូចគ្នានឹងគំរូ AI ដ៏ទំនើបបំផុតដែលមានហេតុផលដូចជា OpenAI's o1 និង DeepSeek's R1។

គួរកត់សម្គាល់ថា S1 គឺជាគំរូប្រភពបើកចំហដែលមាននៅលើឃ្លាំង GitHub សម្រាប់នរណាម្នាក់ចូលប្រើ។

ក្រុមអភិវឌ្ឍន៍បានចែករំលែកថាពួកគេបានចាប់ផ្តើមពីគំរូដែលមានមូលដ្ឋាន បន្ទាប់មកចម្រាញ់វាតាមរយៈ "ការចម្រាញ់" ដែលជាដំណើរការនៃការទាញយកសមត្ថភាព "ហេតុផល" ពីគំរូ AI ផ្សេងទៀតដោយការបណ្តុះបណ្តាលលើចម្លើយរបស់វា។

ជាពិសេស S1 ត្រូវបានចម្រាញ់ចេញពីគំរូ Gemini 2.0 Flash Thinking Experimental របស់ Google ។ ដំណើរការចម្រោះគឺស្រដៀងគ្នាទៅនឹងវិធីដែល អ្នកវិទ្យាសាស្ត្រ នៅសាកលវិទ្យាល័យ Berkeley បានបង្កើតគំរូដោយចំណាយអស់ប្រហែល 450 ដុល្លារ (ប្រហែល 11.3 លានដុង)។

រូបភាព Getty 1168836247 1.jpg.jpeg
DeepSeek បើកការប្រណាំងដើម្បីបង្កើត AI ថោក។ រូបថត៖ TechCrunch

អ្នកស្រាវជ្រាវនៅពីក្រោយ s1 បានរកឃើញវិធីសាមញ្ញបំផុតដើម្បីសម្រេចបាននូវការអនុវត្តហេតុផលដ៏រឹងមាំ និង "ពង្រីកកំឡុងពេលធ្វើតេស្ត" ដែលមានន័យថាអនុញ្ញាតឱ្យគំរូ AI គិតបន្ថែមទៀតមុនពេលឆ្លើយសំណួរ។

នេះគឺជារបកគំហើញមួយនៅក្នុង o1 របស់ OpenAI ដែល DeepSeek និងមន្ទីរពិសោធន៍ AI ផ្សេងទៀតបានព្យាយាមចម្លងតាមបច្ចេកទេសផ្សេងៗ។

ក្រដាស S1 បង្ហាញថាគំរូហេតុផលអាចត្រូវបានចម្រាញ់ជាមួយនឹងសំណុំទិន្នន័យតូចល្មមតាមរយៈដំណើរការដែលហៅថាការត្រួតពិនិត្យការលៃតម្រូវការផាកពិន័យ (SFT) ដែលគំរូ AI ត្រូវបានណែនាំយ៉ាងច្បាស់លាស់ដើម្បីធ្វើត្រាប់តាមឥរិយាបថមួយចំនួននៅក្នុងសំណុំទិន្នន័យ។

SFT ជាទូទៅមានតម្លៃថោកជាងវិធីសាស្រ្តរៀនពង្រឹងទ្រង់ទ្រាយធំដែល DeepSeek បានប្រើដើម្បីបណ្តុះបណ្តាលគំរូ R1 ។

Google កំពុងផ្តល់ការចូលប្រើដោយឥតគិតថ្លៃទៅកាន់ Gemini 2.0 Flash Thinking Experimental ទោះបីជាមានដែនកំណត់ប្រេកង់ប្រចាំថ្ងៃក៏ដោយ តាមរយៈវេទិកា Google AI Studio ។

ទោះជាយ៉ាងណាក៏ដោយ លក្ខខណ្ឌរបស់ Google ហាមប្រាមផ្នែកវិស្វកម្មបញ្ច្រាសម៉ូដែលរបស់ខ្លួនក្នុងការអភិវឌ្ឍន៍សេវាកម្មដែលប្រកួតប្រជែងជាមួយផលិតផល AI របស់ក្រុមហ៊ុន។

S1 គឺផ្អែកលើគំរូ AI តូចមួយដែលអាចទាញយកដោយឥតគិតថ្លៃពីមន្ទីរពិសោធន៍ AI ដែលគ្រប់គ្រងដោយក្រុមហ៊ុន Alibaba Qwen ។ ដើម្បីបណ្តុះបណ្តាល S1 អ្នកស្រាវជ្រាវបានបង្កើតសំណុំទិន្នន័យនៃសំណួរចំនួន 1,000 ដែលបានជ្រើសរើសយ៉ាងយកចិត្តទុកដាក់ រួមជាមួយនឹងចម្លើយ និងដំណើរការ "ការគិត" នៅពីក្រោយចម្លើយនីមួយៗពី Gemini 2.0 Flash Thinking Experimental របស់ Google ។

ដំណើរការបណ្តុះបណ្តាលបានចំណាយពេលតិចជាង 30 នាទីជាមួយនឹង Nvidia H100 GPUs ចំនួន 16 ប៉ុន្តែនៅតែបង្កើតលទ្ធផលខ្លាំងលើ AI metrics ជាច្រើន។ Niklas Muennighoff អ្នកស្រាវជ្រាវនៅ Stanford បាននិយាយថា តម្លៃជួលកុំព្យូទ័រចាំបាច់គឺត្រឹមតែ 20 ដុល្លារប៉ុណ្ណោះ។

អ្នកស្រាវជ្រាវបានប្រើល្បិចមួយដើម្បីឱ្យ S1 ពិនិត្យមើលការងាររបស់វា និងពង្រីក "ពេលវេលាគិត" របស់វា ដូចជាការសួរម៉ូដែលឱ្យរង់ចាំ ដោយបន្ថែមពាក្យ "រង់ចាំ" ទៅក្នុងដំណើរការវែកញែករបស់វា ដែលជួយឱ្យម៉ូដែលទទួលបានចម្លើយត្រឹមត្រូវជាងមុន។

នៅឆ្នាំ 2025 ក្រុមហ៊ុន Meta, Google និង Microsoft គ្រោងនឹងវិនិយោគរាប់រយពាន់លានដុល្លារក្នុងហេដ្ឋារចនាសម្ព័ន្ធ AI ដែលមួយចំនួននឹងត្រូវប្រើប្រាស់ដើម្បីបណ្តុះបណ្តាលម៉ូដែល AI ជំនាន់ក្រោយ។ កម្រិតនៃការវិនិយោគនោះប្រហែលជានៅតែចាំបាច់ដើម្បីជំរុញការបង្កើតថ្មីនៅក្នុង AI

Distillation បានបង្ហាញថាជាមធ្យោបាយដ៏ល្អក្នុងការចម្លងសមត្ថភាពគំរូ AI ក្នុងតម្លៃទាប ប៉ុន្តែវាមិនបង្កើតគំរូ AI ថ្មីដែលល្អជាងអ្វីដែលមានសព្វថ្ងៃនេះទេ។

(យោងតាម TechCrunch)

Google បានបញ្ចេញ Gemini 2.0 ជាផ្លូវការដើម្បីប្រកួតប្រជែងជាមួយ AI ចិន Google ទើបតែចេញជាផ្លូវការនូវ chatbot ជំនាន់ក្រោយ Gemini 2.0 ជាមួយនឹងកំណែ និងការអាប់ដេតជាច្រើន។