Raksasa teknologi Alibaba, Baidu, dan ByteDance berlomba-lomba untuk memangkas biaya AI “inferensi”, dengan menawarkan harga yang 90% lebih rendah dibandingkan harga yang ditawarkan oleh rekan-rekan mereka di AS.
Perusahaan-perusahaan daratan memangkas biaya dengan membangun model yang dilatih pada jumlah data yang lebih kecil, membutuhkan daya komputasi yang lebih sedikit tetapi perangkat keras yang dioptimalkan, kata Lee Kai-Fu, pendiri 01.ai dan mantan kepala Google China.
Menurut peringkat yang baru-baru ini diumumkan oleh UC Berkeley SkyLab dan LMSYS, model Yi-Lingtning dari startup 01.ai berada di peringkat ketiga, imbang dengan Grok-2 dari x.AI, di belakang OpenAI dan Google. Peringkat ini didasarkan pada skor pengguna untuk jawaban pertanyaan.
01.ai dan DeepSeek adalah perusahaan AI daratan yang mengadopsi strategi berfokus pada kumpulan data yang lebih kecil untuk melatih model, sambil mempekerjakan tenaga kerja yang murah dan sangat terampil.
FT menyatakan biaya inferensi Yi-Lightning adalah 14 sen per juta token, dibandingkan dengan 26 sen untuk GPT o1-mini OpenAI. Sementara itu, GPT 4o berbiaya hingga $4,40 per juta token. Jumlah token yang digunakan untuk menghasilkan respons bergantung pada kompleksitas setiap kueri.
Para pendiri Yi-Lightning mengungkapkan bahwa perusahaan menghabiskan $3 juta untuk "pelatihan awal" sebelum menyempurnakannya untuk berbagai kasus penggunaan. Lee mengatakan bahwa tujuan mereka "bukan untuk menciptakan model terbaik", melainkan untuk membangun model pesaing yang "5-10 kali lebih murah".
Metode yang diterapkan oleh 01.ai, DeepSeek, MiniMax, dan Stepfun disebut “pemodelan ahli” – yang berarti menggabungkan beberapa jaringan saraf yang dilatih pada kumpulan data spesifik domain.
Para peneliti memandang pendekatan ini sebagai cara kunci untuk mencapai tingkat kecerdasan yang sama dengan model big data, tetapi dengan daya komputasi yang lebih rendah. Namun, kesulitan dengan pendekatan ini adalah para insinyur harus mengorkestrasi proses pelatihan dengan "beberapa pakar", alih-alih hanya satu model umum.
Karena kesulitan dalam mengakses chip AI kelas atas, perusahaan Tiongkok beralih ke pengembangan set data berkualitas tinggi, yang dapat digunakan untuk melatih model ahli, sehingga bersaing dengan pesaing Barat.
Lee mengatakan 01.ai memiliki cara non-tradisional untuk mengumpulkan data, seperti memindai buku atau mengumpulkan artikel di aplikasi pesan WeChat yang tidak dapat diakses di situs web terbuka.
Pendirinya yakin bahwa China memiliki posisi yang lebih baik daripada AS, dengan banyaknya talenta teknis murah.
(Menurut FT, Bloomberg)
[iklan_2]
Sumber: https://vietnamnet.vn/trung-quoc-giam-90-chi-phi-ai-suy-luan-so-voi-my-2334520.html
Komentar (0)