Model AI (kecerdasan buatan) s1 yang dicipta oleh penyelidik AS dikatakan mempunyai kos operasi hanya 50 USD tetapi menyediakan keupayaan penaakulan yang setara dengan model o1 OpenAI yang berharga lebih tinggi. Kemunculan s1 datang selepas kejayaan mengagumkan DeepSeek yang telah menyebabkan kekecohan di Silicon Valley sejak beberapa hari kebelakangan ini.
Perang 'AI murah' semakin panas sejak kemunculan DeepSeek
Pasukan itu telah menjadikan kod sumber s1 awam di GitHub, bersama-sama dengan kod dan data yang digunakan untuk membina model. Kertas kerja yang diterbitkan minggu lepas menerangkan proses membangunkan model itu, menonjolkan teknik pintar yang mereka gunakan. Daripada bermula dari awal dengan model penaakulan baharu, pasukan itu menggunakan model bahasa sedia ada dan melakukan proses "penalaan halus" dengan menyaring keupayaan penaakulan daripada model Eksperimen Pemikiran Kilat Gemini 2.0 Google.
Kos operasi AI hanya 'di bawah $50'
Latihan model s1 hanya mengambil masa 30 minit, menggunakan 16 GPU Nvidia H100. Walaupun setiap GPU berharga sekitar $25,000, kos menyewa proses tersebut adalah di bawah $50 terima kasih kepada perkhidmatan pengkomputeran awan. Khususnya, pasukan itu menemui helah yang berguna: mengarahkan model untuk "menunggu" sebelum memberikan jawapan muktamad, yang meningkatkan penaakulannya dan menghasilkan penyelesaian yang lebih baik.
Walaupun s1 telah membuat keuntungan yang ketara pada kos yang rendah, terdapat kebimbangan mengenai kebolehskalaannya. Menggunakan model Google sebagai "guru" menimbulkan persoalan tentang keupayaannya untuk bersaing dengan model AI terkemuka masa kini. Google berkemungkinan akan memerhatikan situasi ini dengan teliti, terutamanya memandangkan litigasi berterusan antara OpenAI dan DeepSeek.
Sumber: https://thanhnien.vn/my-tao-ra-mo-hinh-ai-sieu-re-hoat-dong-tuong-tu-gpt-o1-185250207182535164.htm
Komen (0)