Qwen3, teknologi baharu yang dilancarkan oleh Alibaba. Foto: SCMP . |
Menurut ujian penanda aras terkini dunia AI, model kecerdasan buatan Alibaba yang baru dikeluarkan Qwen3 telah mengatasi R1 DeepSeek untuk menjadi model sumber terbuka kedudukan tertinggi di dunia .
Khususnya, data daripada LiveBench, platform bebas yang menanda aras model bahasa besar (LLM), teknologi yang menyokong perkhidmatan AI generatif seperti ChatGPT, menunjukkan bahawa Qwen3 mengatasi prestasi R1 dalam ujian.
Semakan keupayaan model AI sumber terbuka termasuk pengaturcaraan, matematik, analisis data dan arahan bahasa.
Siri model AI yang dipanggil Qwen3 telah dikeluarkan oleh Alibaba pada 28 April. Syarikat itu mendakwa bahawa chatbot ini boleh dibandingkan dengan, dan bahkan mengatasi, model terbaik yang tersedia pada masa ini daripada OpenAI atau Google dalam beberapa kes.
Dengan saiz sehingga 235 bilion parameter, Qwen3 setanding dengan DeepSeek-V2 dan OpenAI GPT-4, yang masing-masing mempunyai kira-kira 236 bilion dan 175 bilion parameter. Pengguna tidak lama lagi akan dapat memuat turunnya di bawah lesen terbuka pada platform pembangunan AI Hugging Face dan Github sebaik sahaja siri model itu dikeluarkan.
Syarikat itu berkata koleksi Qwen3 termasuk model hibrid, bermakna mereka boleh melenturkan masa mereka untuk membuat kesimpulan untuk menyelesaikan masalah yang rumit atau bertindak balas dengan cepat kepada permintaan mudah. Dalam kes ini, inferens membenarkan model menyemak sendiri ketepatan maklumat, tetapi menimbulkan kependaman yang tinggi.
Reka bentuk ini memudahkan pengguna untuk memperuntukkan belanjawan yang sesuai untuk setiap tugas tertentu. Selain itu, model ini juga belajar daripada banyak pesaing di seluruh dunia.
Menggunakan seni bina "campuran pakar" (MoE) yang serupa dengan DeepSeek, Qwen3 boleh memaksimumkan kecekapan pengiraan pada sebahagian kecil daripada kos latihan. Ini ialah pendekatan yang memecahkan tugas kepada bahagian yang berasingan dan hanya mengesyorkan data mendalam yang mencukupi untuk dilaksanakan.
Menurut pasukan pembangunan, Qwen3 menyokong sehingga 119 bahasa dan dilatih pada set data hampir 36,000 bilion token, bersamaan dengan 27,000 bilion perkataan. Data latihan diambil daripada banyak sumber seperti buku teks, set soalan-jawapan, kod pengaturcaraan, atau AI yang dijana sendiri,...
Walaupun mendahului kedudukan sumber terbuka, ujian meluas oleh LiveBench menunjukkan bahawa Qwen3 ketinggalan di belakang model AI sumber tertutup terkemuka di dunia, terutamanya OpenAI's o3, Google Gemini Pro 2.5, dan Anthropic's Claude 3.7.
Pada masa ini, model teratas OpenAI yang disokong oleh Microsoft, o3-mini tinggi, berada di kedudukan teratas keseluruhan model AI di dunia.
Sumber: https://znews.vn/deepseek-bi-soan-ngoi-post1551500.html










Komen (0)