លាតត្រដាងអាថ៌កំបាំងក្នុងការបង្កើតគំរូហេតុផល AI ដែលថោកបំផុតក្នុងតម្លៃក្រោម ១,៥ លានដុង

អ្នកស្រាវជ្រាវនៅសាកលវិទ្យាល័យ Stanford និង Washington University បានចំណាយត្រឹមតែ 50 ដុល្លារប៉ុណ្ណោះដើម្បីបង្កើតគំរូ AI ប្រកបដោយហេតុផល។

ការសរសេរកម្មវិធី និងការធ្វើតេស្តគណិតវិទ្យាបង្ហាញថា S1 (ឈ្មោះម៉ូដែល) ដំណើរការដូចគ្នានឹងគំរូ AI ដ៏ទំនើបបំផុតដែលមានហេតុផលដូចជា OpenAI's o1 និង DeepSeek's R1។

គួរកត់សម្គាល់ថា S1 គឺជាគំរូប្រភពបើកចំហដែលមាននៅលើឃ្លាំង GitHub សម្រាប់នរណាម្នាក់ចូលប្រើ។

ក្រុមអភិវឌ្ឍន៍បានចែករំលែកថាពួកគេបានចាប់ផ្តើមពីគំរូដែលមានមូលដ្ឋាន បន្ទាប់មកចម្រាញ់វាតាមរយៈ "ការចម្រាញ់" ដែលជាដំណើរការនៃការទាញយកសមត្ថភាព "ហេតុផល" ពីគំរូ AI ផ្សេងទៀតដោយការបណ្តុះបណ្តាលលើចម្លើយរបស់វា។

ជាពិសេស S1 ត្រូវបានចម្រាញ់ចេញពីគំរូ Gemini 2.0 Flash Thinking Experimental របស់ Google ។ ដំណើរការចម្រោះគឺស្រដៀងគ្នាទៅនឹងវិធីដែល អ្នកវិទ្យាសាស្ត្រ នៅសាកលវិទ្យាល័យ Berkeley បានបង្កើតគំរូដោយចំណាយអស់ប្រហែល 450 ដុល្លារ (ប្រហែល 11.3 លានដុង)។

រូបភាព Getty 1168836247 1.jpg.jpeg — DeepSeek បើកការប្រណាំងដើម្បីបង្កើត AI ថោក។ រូបថត៖ TechCrunch

អ្នកស្រាវជ្រាវនៅពីក្រោយ s1 បានរកឃើញវិធីសាមញ្ញបំផុតដើម្បីសម្រេចបាននូវការអនុវត្តហេតុផលដ៏រឹងមាំ និង "ពង្រីកកំឡុងពេលធ្វើតេស្ត" ដែលមានន័យថាអនុញ្ញាតឱ្យគំរូ AI គិតបន្ថែមទៀតមុនពេលឆ្លើយសំណួរ។

នេះគឺជារបកគំហើញមួយនៅក្នុង o1 របស់ OpenAI ដែល DeepSeek និងមន្ទីរពិសោធន៍ AI ផ្សេងទៀតបានព្យាយាមចម្លងតាមបច្ចេកទេសផ្សេងៗ។

ក្រដាស S1 បង្ហាញថាគំរូហេតុផលអាចត្រូវបានចម្រាញ់ជាមួយនឹងសំណុំទិន្នន័យតូចល្មមតាមរយៈដំណើរការដែលហៅថាការត្រួតពិនិត្យការលៃតម្រូវការផាកពិន័យ (SFT) ដែលគំរូ AI ត្រូវបានណែនាំយ៉ាងច្បាស់លាស់ដើម្បីធ្វើត្រាប់តាមឥរិយាបថមួយចំនួននៅក្នុងសំណុំទិន្នន័យ។

SFT ជាទូទៅមានតម្លៃថោកជាងវិធីសាស្រ្តរៀនពង្រឹងទ្រង់ទ្រាយធំដែល DeepSeek បានប្រើដើម្បីបណ្តុះបណ្តាលគំរូ R1 ។

Google កំពុងផ្តល់ការចូលប្រើដោយឥតគិតថ្លៃទៅកាន់ Gemini 2.0 Flash Thinking Experimental ទោះបីជាមានដែនកំណត់ប្រេកង់ប្រចាំថ្ងៃក៏ដោយ តាមរយៈវេទិកា Google AI Studio ។

ទោះជាយ៉ាងណាក៏ដោយ លក្ខខណ្ឌរបស់ Google ហាមប្រាមផ្នែកវិស្វកម្មបញ្ច្រាសម៉ូដែលរបស់ខ្លួនក្នុងការអភិវឌ្ឍន៍សេវាកម្មដែលប្រកួតប្រជែងជាមួយផលិតផល AI របស់ក្រុមហ៊ុន។

S1 គឺផ្អែកលើគំរូ AI តូចមួយដែលអាចទាញយកដោយឥតគិតថ្លៃពីមន្ទីរពិសោធន៍ AI ដែលគ្រប់គ្រងដោយក្រុមហ៊ុន Alibaba Qwen ។ ដើម្បីបណ្តុះបណ្តាល S1 អ្នកស្រាវជ្រាវបានបង្កើតសំណុំទិន្នន័យនៃសំណួរចំនួន 1,000 ដែលបានជ្រើសរើសយ៉ាងយកចិត្តទុកដាក់ រួមជាមួយនឹងចម្លើយ និងដំណើរការ "ការគិត" នៅពីក្រោយចម្លើយនីមួយៗពី Gemini 2.0 Flash Thinking Experimental របស់ Google ។

ដំណើរការបណ្តុះបណ្តាលបានចំណាយពេលតិចជាង 30 នាទីជាមួយនឹង Nvidia H100 GPUs ចំនួន 16 ប៉ុន្តែនៅតែបង្កើតលទ្ធផលខ្លាំងលើ AI metrics ជាច្រើន។ Niklas Muennighoff អ្នកស្រាវជ្រាវនៅ Stanford បាននិយាយថា តម្លៃជួលកុំព្យូទ័រចាំបាច់គឺត្រឹមតែ 20 ដុល្លារប៉ុណ្ណោះ។

អ្នកស្រាវជ្រាវបានប្រើល្បិចមួយដើម្បីឱ្យ S1 ពិនិត្យមើលការងាររបស់វា និងពង្រីក "ពេលវេលាគិត" របស់វា ដូចជាការសួរម៉ូដែលឱ្យរង់ចាំ ដោយបន្ថែមពាក្យ "រង់ចាំ" ទៅក្នុងដំណើរការវែកញែករបស់វា ដែលជួយឱ្យម៉ូដែលទទួលបានចម្លើយត្រឹមត្រូវជាងមុន។

នៅឆ្នាំ 2025 ក្រុមហ៊ុន Meta, Google និង Microsoft គ្រោងនឹងវិនិយោគរាប់រយពាន់លានដុល្លារក្នុងហេដ្ឋារចនាសម្ព័ន្ធ AI ដែលមួយចំនួននឹងត្រូវប្រើប្រាស់ដើម្បីបណ្តុះបណ្តាលម៉ូដែល AI ជំនាន់ក្រោយ។ កម្រិតនៃការវិនិយោគនោះប្រហែលជានៅតែចាំបាច់ដើម្បីជំរុញការបង្កើតថ្មីនៅក្នុង AI

Distillation បានបង្ហាញថាជាមធ្យោបាយដ៏ល្អក្នុងការចម្លងសមត្ថភាពគំរូ AI ក្នុងតម្លៃទាប ប៉ុន្តែវាមិនបង្កើតគំរូ AI ថ្មីដែលល្អជាងអ្វីដែលមានសព្វថ្ងៃនេះទេ។

(យោងតាម TechCrunch)

Google បានបញ្ចេញ Gemini 2.0 ជាផ្លូវការដើម្បីប្រកួតប្រជែងជាមួយ AI ចិន Google ទើបតែចេញជាផ្លូវការនូវ chatbot ជំនាន់ក្រោយ Gemini 2.0 ជាមួយនឹងកំណែ និងការអាប់ដេតជាច្រើន។

ប្រភព៖ https://vietnamnet.vn/he-lo-bi-mat-tao-ra-mo-hinh-ai-ly-luan-sieu-re-chua-den-2-trieu-dong-2369052.html

Kommentar (0)

Top -Interessen

Neueste

No data