Vietnam.vn - Nền tảng quảng bá Việt Nam

DeepSeek tahtından indirildi

Alibaba'nın Qwen3 adı verilen yapay zeka modeli, programlama, matematik ve veri analizi gibi açık kaynaklı model yeteneklerini değerlendiren LiveBench testlerinde R1'i geçti.

ZNewsZNews06/05/2025

Alibaba'nın piyasaya sürdüğü yeni teknoloji Qwen3. Fotoğraf: SCMP .

Yapay zeka dünyasının son kıyaslama testlerine göre Alibaba'nın yeni çıkardığı yapay zeka modeli Qwen3, DeepSeek'in R1'ini geride bırakarak dünyanın en üst sıradaki açık kaynaklı modeli oldu.

Özellikle ChatGPT gibi üretken yapay zeka hizmetlerinin temelini oluşturan teknoloji olan büyük dil modelleri (LLM) konusunda kıyaslama yapan bağımsız bir platform olan LiveBench'ten alınan veriler, Qwen3'ün testlerde R1'den daha iyi performans gösterdiğini gösteriyor.

Açık kaynaklı yapay zeka modellerinin yeteneklerinin incelenmesi, programlama, matematik, veri analizi ve dil eğitimini içerir.

Alibaba, Qwen3 adlı AI model serisini 28 Nisan'da yayınladı. Şirket, bu chatbot'un şu anda OpenAI veya Google'da bulunan en iyi modellerle karşılaştırılabileceğini, hatta bazı durumlarda onları geçebileceğini iddia ediyor.

235 milyara varan parametre boyutuyla Qwen3, sırasıyla yaklaşık 236 milyar ve 175 milyar parametreye sahip DeepSeek-V2 ve OpenAI GPT-4 ile aynı seviyede. Model serisinin yayınlanmasının ardından kullanıcılar, açık lisans altında yapay zeka geliştirme platformu Hugging Face ve Github üzerinden indirebilecekler.

Şirket, Qwen3 koleksiyonunun hibrit modeller içerdiğini, yani karmaşık sorunları çözmek veya basit taleplere hızlı yanıt vermek için çıkarım yapma sürelerini esnekleştirebileceklerini belirtiyor. Bu durumda çıkarım, modelin bilginin doğruluğunu kendi kendine kontrol etmesini sağlıyor, ancak yüksek gecikmeye neden oluyor.

Bu tasarım, kullanıcıların her bir görev için uygun bütçeyi ayırmasını kolaylaştırır. Ayrıca, bu model dünya çapındaki birçok rakipten de ders alır.

DeepSeek'e benzer bir "uzman karışımı" (MoE) mimarisi kullanan Qwen3, eğitim maliyetinin çok altında bir maliyetle hesaplama verimliliğini en üst düzeye çıkarabilir. Bu yaklaşım, bir görevi ayrı parçalara böler ve yalnızca gerçekleştirilecek kadar derin veri önerir.

Geliştirme ekibine göre Qwen3, 119 dile kadar destek veriyor ve yaklaşık 36.000 milyar token'dan (27.000 milyar kelime) oluşan bir veri kümesi üzerinde eğitiliyor. Eğitim verileri, ders kitapları, soru-cevap setleri, programlama kodları veya kendi kendine oluşturulan yapay zeka gibi birçok kaynaktan alınıyor.

Açık kaynak sıralamalarında zirvede yer almasına rağmen, LiveBench tarafından yapılan kapsamlı testler Qwen3'ün dünyanın önde gelen kapalı kaynaklı yapay zeka modellerinin, özellikle OpenAI'nin o3'ünün, Google'ın Gemini Pro 2.5'inin ve Anthropic'in Claude 3.7'sinin gerisinde kaldığını gösteriyor.

Şu anda Microsoft'un desteklediği OpenAI'nin en üst düzey modeli olan o3-mini high, dünyadaki genel yapay zeka modeli sıralamasında en üst sırada yer alıyor.

Kaynak: https://znews.vn/deepseek-bi-soan-ngoi-post1551500.html


Yorum (0)

Duygularınızı paylaşmak için lütfen bir yorum bırakın!

Aynı kategoride

Ho Chi Minh şehrindeki Notre Dame Katedrali, 2025 Noel'ini parlak ışıklarla karşıladı
Hanoi kızları Noel sezonu için güzelce "giyiniyor"
Fırtına ve selden sonra aydınlanan Gia Lai'deki Tet krizantem köyü, bitkileri kurtarmak için elektrik kesintisi olmayacağını umuyor.
Orta Anadolu'nun sarı kayısı başkenti, iki doğal afet sonrası ağır kayıplar yaşadı

Aynı yazardan

Miras

Figür

İşletme

Dalat'taki kahve dükkanının müşteri sayısı, sahibinin 'dövüş sanatları filmi' rolü oynaması sayesinde %300 arttı

Güncel olaylar

Siyasi Sistem

Yerel

Ürün

Footer Banner Agribank
Footer Banner LPBank
Footer Banner MBBank
Footer Banner VNVC
Footer Banner Agribank
Footer Banner LPBank
Footer Banner MBBank
Footer Banner VNVC
Footer Banner Agribank
Footer Banner LPBank
Footer Banner MBBank
Footer Banner VNVC
Footer Banner Agribank
Footer Banner LPBank
Footer Banner MBBank
Footer Banner VNVC