DeepSeek telah digulingkan.

Qwen3, teknologi baharu yang dilancarkan oleh Alibaba. Foto: SCMP .

Menurut ujian penanda aras AI terkini, model kecerdasan buatan Qwen3 yang baru dikeluarkan oleh Alibaba telah mengatasi R1 DeepSeek untuk menjadi model sumber terbuka dengan penarafan tertinggi di dunia .

Secara khususnya, data daripada LiveBench, sebuah platform bebas yang menilai model bahasa besar (LLM), teknologi asas untuk perkhidmatan AI generatif seperti ChatGPT, menunjukkan bahawa Qwen3 telah mengatasi R1 dalam ujian tersebut.

Penilaian keupayaan model AI sumber terbuka merangkumi pengaturcaraan, matematik, analisis data dan pengajaran bahasa.

Alibaba melancarkan siri model AI Qwen3 pada 28 April. Syarikat itu mendakwa bahawa chatbot ini boleh menyaingi, atau mengatasi, model semasa terbaik daripada OpenAI atau Google dalam beberapa kes.

Dengan saiz sehingga 235 bilion parameter, Qwen3 mempunyai prestasi yang setanding dengan DeepSeek-V2 dan OpenAI GPT-4, yang masing-masing mempunyai kira-kira 236 bilion dan 175 bilion parameter. Pengguna tidak lama lagi akan dapat memuat turunnya di bawah lesen terbuka pada platform pembangunan AI Hugging Face dan Github sebaik sahaja siri model ini dikeluarkan.

Syarikat itu menyatakan bahawa koleksi Qwen3 merangkumi model hibrid, yang bermaksud ia boleh memperuntukkan masa secara fleksibel untuk penaakulan bagi menyelesaikan masalah yang kompleks atau bertindak balas dengan cepat terhadap permintaan mudah. Dalam model ini, keupayaan penaakulan membolehkan pengesahan kendiri ketepatan maklumat, tetapi ini datang dengan lag masa yang ketara.

Reka bentuk ini memudahkan pengguna memperuntukkan bajet yang sewajarnya untuk setiap tugasan tertentu. Tambahan pula, model ini juga belajar daripada ramai pesaing di seluruh dunia.

Menggunakan seni bina "campuran pakar" (MoE) yang serupa dengan DeepSeek, Qwen3 boleh mengoptimumkan prestasi pengiraan sambil hanya menggunakan sebahagian kecil daripada kos latihan. Kaedah ini memecahkan tugasan kepada banyak bahagian berasingan dan hanya memerlukan jumlah data intensif data yang mencukupi untuk melaksanakannya.

Menurut pasukan pembangunan, Qwen3 menyokong sehingga 119 bahasa dan dilatih menggunakan set data hampir 36 trilion token, bersamaan dengan 27 trilion perkataan. Data latihan diperoleh daripada pelbagai sumber seperti buku teks, set soal jawab, kod pengaturcaraan atau data yang dijana AI, dsb.

Walaupun menduduki tempat teratas dalam ranking sumber terbuka, ujian penanda aras lanjutan LiveBench menunjukkan bahawa Qwen3 masih ketinggalan di belakang model AI sumber tertutup yang terkemuka di dunia. Yang paling menonjol antaranya ialah o3 OpenAI, Gemini Pro 2.5 Google dan Claude 3.7 Anthropic.

Pada masa ini, model OpenAI paling canggih yang disokong oleh Microsoft, o3-mini tinggi, menduduki tempat teratas dalam kedudukan keseluruhan model AI di seluruh dunia.

Sumber: https://znews.vn/deepseek-bi-soan-ngoi-post1551500.html