Bu yeni model, yalnızca Amerikan devlerinin hakimiyetine meydan okumakla kalmıyor, aynı zamanda oyunun tamamını açık kaynak kodlu olarak yeniden şekillendiriyor (İllüstrasyon: DS).
685 milyar parametreye sahip olan model, açık kaynaklı bir lisans altında yayınlanıyor. İlk test sonuçları, performansının OpenAI veya Anthropic'in tescilli sistemleriyle aynı seviyede olduğunu ve gelişmiş yapay zeka modellerinin geliştirilmesi ve dağıtımı için yeni bir yaklaşım sunduğunu gösteriyor.
Performans ve maliyet
DeepSeek V3.1, Hugging Face platformunda yayınlanmasının hemen ardından Aider programlama testinde %71,6 puan aldı. Teknik olarak model, 128.000 token'a (yaklaşık 400 sayfalık bir kitaba eşdeğer) kadar bağlamları işleyebiliyor. Mimari, konuşma, akıl yürütme ve programlama işlevlerini entegre eden bir "hibrit" olarak tanıtıldı.
Yapay zeka araştırmacısı Andrew Christianson, sosyal ağ X'te yaptığı açıklamada, "DeepSeek V3.1, Aider'da %71,6'lık bir başarıya ulaştı; bu, Claude Opus 4'ten yaklaşık %1 daha iyi olmasına rağmen maliyeti önemli ölçüde daha düşük." dedi.
V3.1 kullanılarak bir programlama görevinin tamamlanmasının ortalama maliyetinin 1,01 dolar civarında olduğu tahmin edilirken, eşdeğer sistemlerin maliyeti 70 dolara yakın olabilir.
Bazı topluluk geliştiricileri, mimaride modelin gerçek zamanlı web aramasını entegre etmesini ve karmaşık çıkarım süreçlerini yönetmesini sağlayan dört "özel belirtecin" varlığına da dikkat çekti.
Bu fark, her gün binlerce yapay zeka etkileşimini yöneten işletmeler için milyonlarca dolarlık tasarruf anlamına geliyor.
Oyunu değiştiren avantajlar
V3.1 lansmanı, OpenAI ve Anthropic'in yeni modellerini duyurmasından sadece birkaç hafta sonra gerçekleşti. DeepSeek, açık kaynaklı bir yaklaşım seçerek, ücretli API'ler aracılığıyla yapay zeka modellerini ticarileştiren birçok ABD şirketinden farklı bir strateji izliyor.
Bazıları, gelişmiş yeteneklerin yaygın olarak kullanılabilir hale getirilmesinin, kuruluşların ve işletmelerin daha hızlı dağıtım yapmasını sağlayabileceğini ve aynı zamanda teknoloji tekelciliğine dayalı iş modellerine meydan okuyabileceğini savunuyor.
DeepSeek V3.1'in ortaya çıkışı, gelişmiş yapay zekanın yalnızca büyük şirketlerin değil, aynı zamanda daha küçük araştırma gruplarının da ilgi alanı olduğunu gösteriyor.
Bu alandaki rekabet artık sadece en güçlü sistemi kurmakla sınırlı değil, aynı zamanda teknolojiyi erişilebilir ve uygun fiyatlı hale getirmekle de ilgili.
Bu bağlamda teknoloji şirketlerinin önündeki soru, giderek daha fazla rekabetçi performans ve maliyete sahip açık kaynaklı modellerin ortaya çıkmasıyla ticari değerini nasıl koruyacağıdır.
Kaynak: https://dantri.com.vn/cong-nghe/deepseek-am-tham-ra-phien-ban-ai-moi-20250820121017977.htm






Yorum (0)