DeepSeek telah digulingkan dari tahtanya.

Qwen3, teknologi baru yang diluncurkan oleh Alibaba. Foto: SCMP .

Menurut uji benchmark AI terbaru, model kecerdasan buatan Qwen3 yang baru dirilis oleh Alibaba telah melampaui R1 milik DeepSeek dan menjadi model open-source dengan peringkat tertinggi di dunia .

Secara spesifik, data dari LiveBench, sebuah platform independen yang memberi skor pada model bahasa besar (LLM), teknologi dasar untuk layanan AI generatif seperti ChatGPT, menunjukkan bahwa Qwen3 telah melampaui R1 dalam pengujian.

Penilaian kemampuan model AI sumber terbuka mencakup pemrograman, matematika, analisis data, dan pengajaran bahasa.

Alibaba merilis seri model AI Qwen3 pada tanggal 28 April. Perusahaan tersebut mengklaim bahwa chatbot ini dapat menyaingi, atau bahkan melampaui, model-model terbaik saat ini dari OpenAI atau Google dalam beberapa kasus.

Dengan ukuran hingga 235 miliar parameter, Qwen3 memiliki kinerja yang sebanding dengan DeepSeek-V2 dan OpenAI GPT-4, yang masing-masing memiliki sekitar 236 miliar dan 175 miliar parameter. Pengguna akan segera dapat mengunduhnya di bawah lisensi terbuka di platform pengembangan AI Hugging Face dan Github setelah seri model ini dirilis.

Perusahaan menyatakan bahwa koleksi Qwen3 mencakup model hibrida, yang berarti mereka dapat secara fleksibel mengalokasikan waktu untuk penalaran guna memecahkan masalah kompleks atau dengan cepat menanggapi permintaan sederhana. Dalam model ini, kemampuan penalaran memungkinkan verifikasi mandiri atas keakuratan informasi, tetapi hal ini disertai dengan jeda waktu yang signifikan.

Desain ini memudahkan pengguna untuk mengalokasikan anggaran secara tepat untuk setiap tugas tertentu. Selain itu, model ini juga belajar dari banyak pesaing di seluruh dunia.

Dengan menggunakan arsitektur "campuran pakar" (MoE) yang mirip dengan DeepSeek, Qwen3 dapat mengoptimalkan kinerja komputasi sambil hanya menggunakan sebagian kecil biaya pelatihan. Metode ini memecah tugas menjadi banyak bagian terpisah dan hanya membutuhkan sejumlah data intensif yang cukup untuk melaksanakannya.

Menurut tim pengembang, Qwen3 mendukung hingga 119 bahasa dan dilatih menggunakan kumpulan data yang terdiri dari hampir 36 triliun token, setara dengan 27 triliun kata. Data pelatihan bersumber dari berbagai sumber seperti buku teks, kumpulan tanya jawab, kode pemrograman, atau bahkan data yang dihasilkan oleh AI, dan lain sebagainya.

Meskipun menduduki peringkat teratas dalam peringkat open-source, uji benchmark ekstensif LiveBench menunjukkan bahwa Qwen3 masih tertinggal di belakang model AI closed-source terkemuka di dunia. Yang paling menonjol di antaranya adalah o3 dari OpenAI, Gemini Pro 2.5 dari Google, dan Claude 3.7 dari Anthropic.

Saat ini, model OpenAI tercanggih yang didukung oleh Microsoft, o3-mini high, menduduki peringkat teratas dalam peringkat keseluruhan model AI di seluruh dunia.

Sumber: https://znews.vn/deepseek-bi-soan-ngoi-post1551500.html