Qwen3, teknologi baru yang diluncurkan Alibaba. Foto: SCMP . |
Menurut uji tolok ukur terkini dunia AI, model kecerdasan buatan baru Alibaba, Qwen3, telah melampaui R1 milik DeepSeek dan menjadi model sumber terbuka dengan peringkat tertinggi di dunia .
Secara khusus, data dari LiveBench, platform independen yang menguji model bahasa besar (LLM), teknologi yang mendukung layanan AI generatif seperti ChatGPT, menunjukkan bahwa Qwen3 mengungguli R1 dalam pengujian.
Tinjauan kemampuan model AI sumber terbuka meliputi pemrograman, matematika, analisis data, dan instruksi bahasa.
Seri model AI bernama Qwen3 dirilis oleh Alibaba pada 28 April. Perusahaan tersebut mengklaim bahwa chatbot ini dapat menyamai, dan bahkan melampaui, model-model terbaik yang saat ini tersedia dari OpenAI atau Google dalam beberapa kasus.
Dengan ukuran hingga 235 miliar parameter, Qwen3 setara dengan DeepSeek-V2 dan OpenAI GPT-4, yang masing-masing memiliki sekitar 236 miliar dan 175 miliar parameter. Pengguna akan segera dapat mengunduhnya di bawah lisensi terbuka di platform pengembangan AI Hugging Face dan Github setelah rangkaian model ini dirilis.
Perusahaan menyatakan bahwa koleksi Qwen3 mencakup model hibrida, yang berarti mereka dapat menyesuaikan waktu untuk melakukan inferensi guna memecahkan masalah kompleks atau merespons permintaan sederhana dengan cepat. Dalam hal ini, inferensi memungkinkan model untuk memeriksa sendiri keakuratan informasi, tetapi menimbulkan latensi yang tinggi.
Desain ini memudahkan pengguna untuk mengalokasikan anggaran yang sesuai untuk setiap tugas spesifik. Selain itu, model ini juga belajar dari banyak pesaing di seluruh dunia.
Dengan menggunakan arsitektur "campuran pakar" (MoE) yang serupa dengan DeepSeek, Qwen3 dapat memaksimalkan efisiensi komputasi dengan biaya pelatihan yang jauh lebih rendah. Pendekatan ini memecah tugas menjadi beberapa bagian dan hanya merekomendasikan data mendalam yang cukup untuk dijalankan.
Menurut tim pengembang, Qwen3 mendukung hingga 119 bahasa dan dilatih menggunakan set data yang terdiri dari hampir 36.000 miliar token, setara dengan 27.000 miliar kata. Data pelatihan diambil dari berbagai sumber seperti buku teks, kumpulan soal-jawab, kode pemrograman, atau AI yang dihasilkan sendiri.
Meskipun menduduki peringkat teratas dalam peringkat sumber terbuka, pengujian ekstensif oleh LiveBench menunjukkan bahwa Qwen3 tertinggal dari model AI sumber tertutup terkemuka di dunia, terutama o3 milik OpenAI, Gemini Pro 2.5 milik Google, dan Claude 3.7 milik Anthropic.
Saat ini, model terbaik OpenAI yang didukung oleh Microsoft, o3-mini high, berada di puncak peringkat model AI keseluruhan di dunia.
Sumber: https://znews.vn/deepseek-bi-soan-ngoi-post1551500.html










Komentar (0)