DeepSeek tahtından indirildi.

Alibaba'nın piyasaya sürdüğü yeni bir teknoloji olan Qwen3. Fotoğraf: SCMP .

Son yapay zeka kıyaslama testlerine göre, Alibaba'nın yeni piyasaya sürdüğü Qwen3 yapay zeka modeli, DeepSeek'in R1 modelini geride bırakarak dünyanın en yüksek puanlı açık kaynaklı modeli oldu.

Özellikle, ChatGPT gibi üretken yapay zeka hizmetlerinin temel teknolojisi olan büyük dil modellerini (LLM) değerlendiren bağımsız bir platform olan LiveBench'ten elde edilen veriler, Qwen3'ün testlerde R1'i geride bıraktığını gösteriyor.

Açık kaynaklı yapay zeka modellerinin yeteneklerinin değerlendirilmesi programlama, matematik, veri analizi ve dil öğretimini içerir.

Alibaba, 28 Nisan'da Qwen3 yapay zeka model serisini piyasaya sürdü. Şirket, bu sohbet robotunun bazı durumlarda OpenAI veya Google'ın en iyi mevcut modelleriyle rekabet edebileceğini, hatta onları geçebileceğini iddia ediyor.

235 milyara kadar parametreye sahip olan Qwen3, sırasıyla yaklaşık 236 milyar ve 175 milyar parametreye sahip DeepSeek-V2 ve OpenAI GPT-4 ile karşılaştırılabilir bir performansa sahiptir. Bu model serisi yayınlandıktan sonra, kullanıcılar yakında yapay zeka geliştirme platformu Hugging Face ve Github üzerinden açık lisans altında indirebilecekler.

Şirket, Qwen3 koleksiyonunun hibrit modeller içerdiğini, yani karmaşık sorunları çözmek veya basit isteklere hızlı bir şekilde yanıt vermek için mantıksal düşünme süresini esnek bir şekilde ayırabildiklerini belirtti. Bu modelde, mantıksal düşünme yeteneği, bilginin doğruluğunun kendi kendine doğrulanmasına olanak tanır, ancak bu önemli bir zaman gecikmesiyle birlikte gelir.

Bu tasarım, kullanıcıların her bir göreve uygun bütçeyi ayırmasını kolaylaştırır. Dahası, bu model dünya çapındaki birçok rakibinden de öğrenir.

DeepSeek'e benzer bir "uzman karışımı" (MoE) mimarisi kullanan Qwen3, eğitim maliyetinin yalnızca küçük bir kısmını kullanarak hesaplama performansını optimize edebilir. Bu yöntem, görevleri birçok ayrı parçaya böler ve bunları gerçekleştirmek için yalnızca yeterli miktarda veri yoğun veri gerektirir.

Geliştirme ekibine göre, Qwen3 119'a kadar dili destekliyor ve yaklaşık 36 trilyon belirteçten (27 trilyon kelimeye eşdeğer) oluşan bir veri kümesi üzerinde eğitiliyor. Eğitim verileri, ders kitapları, soru-cevap setleri, programlama kodları ve hatta yapay zeka tarafından üretilen veriler gibi çeşitli kaynaklardan elde ediliyor.

Açık kaynak sıralamasında zirvede yer almasına rağmen, LiveBench'in genişletilmiş kıyaslama testi, Qwen3'ün dünyanın önde gelen kapalı kaynak yapay zeka modellerinin gerisinde kaldığını gösteriyor. Bunların en öne çıkanları arasında OpenAI'nin o3'ü, Google'ın Gemini Pro 2.5'i ve Anthropic'in Claude 3.7'si yer alıyor.

Şu anda Microsoft tarafından desteklenen en gelişmiş OpenAI modeli olan o3-mini high, dünya çapındaki yapay zeka modelleri sıralamasında birinci sırada yer alıyor.

Kaynak: https://znews.vn/deepseek-bi-soan-ngoi-post1551500.html