Vietnam.vn - Nền tảng quảng bá Việt Nam

DeepSeek digulingkan

Model AI Alibaba, yang disebut Qwen3, lulus R1 dalam pengujian LiveBench yang menilai kemampuan model sumber terbuka termasuk pemrograman, matematika, dan analisis data.

ZNewsZNews06/05/2025

Qwen3, teknologi baru yang diluncurkan Alibaba. Foto: SCMP .

Menurut uji tolok ukur terkini dunia AI, model kecerdasan buatan baru Alibaba, Qwen3, telah melampaui R1 milik DeepSeek dan menjadi model sumber terbuka dengan peringkat tertinggi di dunia .

Secara khusus, data dari LiveBench, platform independen yang menguji model bahasa besar (LLM), teknologi yang mendukung layanan AI generatif seperti ChatGPT, menunjukkan bahwa Qwen3 mengungguli R1 dalam pengujian.

Tinjauan kemampuan model AI sumber terbuka meliputi pemrograman, matematika, analisis data, dan instruksi bahasa.

Seri model AI bernama Qwen3 dirilis oleh Alibaba pada 28 April. Perusahaan tersebut mengklaim bahwa chatbot ini dapat menyamai, dan bahkan melampaui, model-model terbaik yang saat ini tersedia dari OpenAI atau Google dalam beberapa kasus.

Dengan ukuran hingga 235 miliar parameter, Qwen3 setara dengan DeepSeek-V2 dan OpenAI GPT-4, yang masing-masing memiliki sekitar 236 miliar dan 175 miliar parameter. Pengguna akan segera dapat mengunduhnya di bawah lisensi terbuka di platform pengembangan AI Hugging Face dan Github setelah rangkaian model ini dirilis.

Perusahaan menyatakan bahwa koleksi Qwen3 mencakup model hibrida, yang berarti mereka dapat menyesuaikan waktu untuk melakukan inferensi guna memecahkan masalah kompleks atau merespons permintaan sederhana dengan cepat. Dalam hal ini, inferensi memungkinkan model untuk memeriksa sendiri keakuratan informasi, tetapi menimbulkan latensi yang tinggi.

Desain ini memudahkan pengguna untuk mengalokasikan anggaran yang sesuai untuk setiap tugas spesifik. Selain itu, model ini juga belajar dari banyak pesaing di seluruh dunia.

Dengan menggunakan arsitektur "campuran pakar" (MoE) yang serupa dengan DeepSeek, Qwen3 dapat memaksimalkan efisiensi komputasi dengan biaya pelatihan yang jauh lebih rendah. Pendekatan ini memecah tugas menjadi beberapa bagian dan hanya merekomendasikan data mendalam yang cukup untuk dijalankan.

Menurut tim pengembang, Qwen3 mendukung hingga 119 bahasa dan dilatih menggunakan set data yang terdiri dari hampir 36.000 miliar token, setara dengan 27.000 miliar kata. Data pelatihan diambil dari berbagai sumber seperti buku teks, kumpulan soal-jawab, kode pemrograman, atau AI yang dihasilkan sendiri.

Meskipun menduduki peringkat teratas dalam peringkat sumber terbuka, pengujian ekstensif oleh LiveBench menunjukkan bahwa Qwen3 tertinggal dari model AI sumber tertutup terkemuka di dunia, terutama o3 milik OpenAI, Gemini Pro 2.5 milik Google, dan Claude 3.7 milik Anthropic.

Saat ini, model terbaik OpenAI yang didukung oleh Microsoft, o3-mini high, berada di puncak peringkat model AI keseluruhan di dunia.

Sumber: https://znews.vn/deepseek-bi-soan-ngoi-post1551500.html


Komentar (0)

Silakan tinggalkan komentar untuk berbagi perasaan Anda!

Dalam kategori yang sama

Katedral Notre Dame di Kota Ho Chi Minh diterangi dengan terang benderang untuk menyambut Natal 2025
Gadis-gadis Hanoi "berdandan" cantik untuk menyambut Natal
Cerah setelah badai dan banjir, desa krisan Tet di Gia Lai berharap tidak akan ada pemadaman listrik untuk menyelamatkan tanaman.
Ibu kota aprikot kuning di wilayah Tengah mengalami kerugian besar setelah bencana alam ganda

Dari penulis yang sama

Warisan

Angka

Bisnis

Kedai kopi Dalat mengalami peningkatan pelanggan sebesar 300% karena pemiliknya berperan dalam film 'silat'

Peristiwa terkini

Sistem Politik

Lokal

Produk

Footer Banner Agribank
Footer Banner LPBank
Footer Banner MBBank
Footer Banner VNVC
Footer Banner Agribank
Footer Banner LPBank
Footer Banner MBBank
Footer Banner VNVC
Footer Banner Agribank
Footer Banner LPBank
Footer Banner MBBank
Footer Banner VNVC
Footer Banner Agribank
Footer Banner LPBank
Footer Banner MBBank
Footer Banner VNVC