Model AI (kecerdasan buatan) s1 yang diciptakan oleh para peneliti AS disebut-sebut hanya berbiaya operasional 50 dolar AS, tetapi menawarkan kemampuan penalaran yang setara dengan model o1 OpenAI yang jauh lebih mahal. Kemunculan s1 muncul setelah kesuksesan DeepSeek yang mengesankan, yang telah menggemparkan Silicon Valley dalam beberapa hari terakhir.
Perang 'AI murah' memanas sejak munculnya DeepSeek
Tim telah mempublikasikan kode sumber s1 di GitHub, beserta kode dan data yang digunakan untuk membangun model tersebut. Sebuah makalah yang diterbitkan minggu lalu menjelaskan proses pengembangan model tersebut, menyoroti teknik-teknik cerdas yang mereka gunakan. Alih-alih memulai dari awal dengan model penalaran baru, tim menggunakan model bahasa yang sudah ada dan melakukan proses "penyempurnaan" dengan menyaring kemampuan penalaran dari model Eksperimental Berpikir Flash Gemini 2.0 milik Google.
Biaya operasional AI hanya 'di bawah $50'
Pelatihan model s1 hanya membutuhkan waktu 30 menit, menggunakan 16 GPU Nvidia H100. Meskipun setiap GPU berharga sekitar $25.000, biaya sewanya di bawah $50 berkat layanan komputasi awan. Khususnya, tim menemukan trik yang bermanfaat: menginstruksikan model untuk "menunggu" sebelum memberikan jawaban akhir, yang meningkatkan penalarannya dan menghasilkan solusi yang lebih baik.
Meskipun s1 telah mencapai kemajuan signifikan dengan biaya rendah, terdapat kekhawatiran mengenai skalabilitasnya. Penggunaan model Google sebagai "guru" menimbulkan pertanyaan tentang kemampuannya untuk bersaing dengan model-model AI terkemuka saat ini. Google kemungkinan akan terus memantau situasi ini, terutama mengingat litigasi yang sedang berlangsung antara OpenAI dan DeepSeek.
[iklan_2]
Sumber: https://thanhnien.vn/my-tao-ra-mo-hinh-ai-sieu-re-hoat-dong-tuong-tu-gpt-o1-185250207182535164.htm
Komentar (0)