អ្នកស្រាវជ្រាវនៅសាកលវិទ្យាល័យ Stanford និង Washington University បានចំណាយត្រឹមតែ 50 ដុល្លារប៉ុណ្ណោះដើម្បីបង្កើតគំរូ AI ប្រកបដោយហេតុផល។
ការសរសេរកម្មវិធី និងការធ្វើតេស្តគណិតវិទ្យាបង្ហាញថា S1 (ឈ្មោះម៉ូដែល) ដំណើរការដូចគ្នានឹងគំរូ AI ដ៏ទំនើបបំផុតដែលមានហេតុផលដូចជា OpenAI's o1 និង DeepSeek's R1។
គួរកត់សម្គាល់ថា S1 គឺជាគំរូប្រភពបើកចំហដែលមាននៅលើឃ្លាំង GitHub សម្រាប់នរណាម្នាក់ចូលប្រើ។
ក្រុមអភិវឌ្ឍន៍បានចែករំលែកថាពួកគេបានចាប់ផ្តើមពីគំរូដែលមានមូលដ្ឋាន បន្ទាប់មកចម្រាញ់វាតាមរយៈ "ការចម្រាញ់" ដែលជាដំណើរការនៃការទាញយកសមត្ថភាព "ហេតុផល" ពីគំរូ AI ផ្សេងទៀតដោយការបណ្តុះបណ្តាលលើចម្លើយរបស់វា។
ជាពិសេស S1 ត្រូវបានចម្រាញ់ចេញពីគំរូ Gemini 2.0 Flash Thinking Experimental របស់ Google ។ ដំណើរការចម្រោះគឺស្រដៀងនឹងអ្វីដែលអ្នកវិទ្យាសាស្ត្រនៅសាកលវិទ្យាល័យ Berkeley បានបង្កើតគំរូមួយដែលមានតម្លៃប្រហែល ៤៥០ ដុល្លារ។
អ្នកស្រាវជ្រាវនៅពីក្រោយ s1 បានរកឃើញវិធីសាមញ្ញបំផុតដើម្បីសម្រេចបាននូវការអនុវត្តហេតុផលដ៏រឹងមាំ និង "ពង្រីកកំឡុងពេលធ្វើតេស្ត" ដែលមានន័យថាអនុញ្ញាតឱ្យគំរូ AI គិតបន្ថែមទៀតមុនពេលឆ្លើយសំណួរ។
នេះគឺជារបកគំហើញមួយនៅក្នុង o1 របស់ OpenAI ដែល DeepSeek និងមន្ទីរពិសោធន៍ AI ផ្សេងទៀតបានព្យាយាមចម្លងតាមបច្ចេកទេសផ្សេងៗ។
ក្រដាស S1 បង្ហាញថាគំរូហេតុផលអាចត្រូវបានចម្រាញ់ជាមួយនឹងសំណុំទិន្នន័យតូចល្មមតាមរយៈដំណើរការដែលហៅថាការត្រួតពិនិត្យការលៃតម្រូវការផាកពិន័យ (SFT) ដែលគំរូ AI ត្រូវបានណែនាំយ៉ាងច្បាស់លាស់ដើម្បីធ្វើត្រាប់តាមឥរិយាបថមួយចំនួននៅក្នុងសំណុំទិន្នន័យ។
SFT ជាទូទៅមានតម្លៃថោកជាងវិធីសាស្រ្តរៀនពង្រឹងទ្រង់ទ្រាយធំដែល DeepSeek បានប្រើដើម្បីបណ្តុះបណ្តាលគំរូ R1 ។
Google កំពុងផ្តល់ការចូលប្រើដោយឥតគិតថ្លៃទៅកាន់ Gemini 2.0 Flash Thinking Experimental ទោះបីជាមានដែនកំណត់ប្រេកង់ប្រចាំថ្ងៃក៏ដោយ តាមរយៈវេទិកា Google AI Studio ។
ទោះជាយ៉ាងណាក៏ដោយ លក្ខខណ្ឌរបស់ Google ហាមប្រាមផ្នែកវិស្វកម្មបញ្ច្រាសម៉ូដែលរបស់ខ្លួនក្នុងការអភិវឌ្ឍន៍សេវាកម្មដែលប្រកួតប្រជែងជាមួយផលិតផល AI របស់ក្រុមហ៊ុន។
S1 គឺផ្អែកលើគំរូ AI តូចមួយដែលអាចរកបានពី AI lab Qwen ដែលជាកម្មសិទ្ធិរបស់ Alibaba ដែលអាចទាញយកដោយឥតគិតថ្លៃ។ ដើម្បីបណ្តុះបណ្តាល S1 អ្នកស្រាវជ្រាវបានបង្កើតសំណុំទិន្នន័យនៃសំណួរចំនួន 1,000 ដែលបានជ្រើសរើសយ៉ាងយកចិត្តទុកដាក់ រួមជាមួយនឹងចម្លើយ និងដំណើរការ "ការគិត" នៅពីក្រោយចម្លើយនីមួយៗពី Gemini 2.0 Flash Thinking Experimental របស់ Google ។
ដំណើរការបណ្តុះបណ្តាលនេះចំណាយពេលតិចជាង 30 នាទីជាមួយនឹង Nvidia H100 GPUs ចំនួន 16 ប៉ុន្តែនៅតែបង្កើតលទ្ធផលខ្លាំងនៅលើ AI benchmarks ជាច្រើន។ Niklas Muennighoff អ្នកស្រាវជ្រាវមកពី Stanford បាននិយាយថា តម្លៃជួលកុំព្យូទ័រដែលចាំបាច់គឺប្រហែល 20 ដុល្លារប៉ុណ្ណោះ។
អ្នកស្រាវជ្រាវបានប្រើល្បិចមួយដើម្បីឱ្យ S1 ពិនិត្យមើលការងាររបស់វា និងពង្រីក "ពេលវេលាគិត" របស់វា ដូចជាការសួរម៉ូដែលឱ្យរង់ចាំ ដោយបន្ថែមពាក្យ "រង់ចាំ" ទៅក្នុងដំណើរការវែកញែករបស់វា ដែលជួយឱ្យម៉ូដែលទទួលបានចម្លើយត្រឹមត្រូវជាងមុន។
នៅឆ្នាំ 2025 ក្រុមហ៊ុន Meta, Google និង Microsoft គ្រោងនឹងវិនិយោគរាប់រយពាន់លានដុល្លារក្នុងហេដ្ឋារចនាសម្ព័ន្ធ AI ដែលផ្នែកមួយនឹងត្រូវបានប្រើប្រាស់ដើម្បីបណ្តុះបណ្តាលម៉ូដែល AI ជំនាន់ក្រោយ។ កម្រិតនៃការវិនិយោគនេះអាចនៅតែត្រូវការដើម្បីជំរុញការបង្កើតថ្មីនៅក្នុង AI ។
Distillation បានបង្ហាញថាជាមធ្យោបាយដ៏ល្អក្នុងការចម្លងសមត្ថភាពគំរូ AI ក្នុងតម្លៃទាប ប៉ុន្តែវាមិនបង្កើតគំរូ AI ថ្មីដែលល្អជាងអ្វីដែលមានសព្វថ្ងៃនេះទេ។
(យោងតាម TechCrunch)
ប្រភព៖ https://vietnamnet.vn/he-lo-bi-mat-tao-ra-mo-hinh-ai-ly-luan-sieu-re-chua-den-2-trieu-dong-2369052.html
Kommentar (0)