Yeni araştırma DeepSeek'in başarısının sırrını ortaya koyuyor

Çinli startup DeepSeek'in Ocak ayında piyasaya sürüldüğünde ABD borsasını şok eden R1 yapay zeka modeli, ilk hakemli çalışmada yayınlandı ve şirketin sadece 300.000 dolar civarında bir parayla nasıl güçlü bir LLM derecesi geliştirdiğini gösterdi.

R1, matematik ve programlama gibi muhakeme gerektiren görevlerde üstün performans gösterecek şekilde tasarlandı ve bu özelliğiyle ABD'li teknoloji devlerinin geliştirdiği araçlara düşük maliyetli bir rakip haline geldi.

Bu, ücretsiz olarak indirilebilen ve şu anda Hugging Face platformunda 10,9 milyondan fazla indirmeyle en popüler model olan "açık ağırlık" modelidir.

Ocak ayında yayınlanan bir makalenin güncellenmesi olan Nature araştırması, temel modelin oluşturulması için harcanan yaklaşık 6 milyon dolara ek olarak, R1 eğitiminin yalnızca 294.000 dolara mal olduğunu ortaya koydu.

Bu rakam, rakiplerin harcadığı söylenen on milyonlarca doların çok altında.

DeepSeek, R1'in öncelikli olarak ABD'nin 2023'ten beri Çin'e ihracatını yasakladığı Nvidia H800 yongaları kullanılarak eğitildiğini belirtti.

R1'in çığır açan özelliği, modelin insanlar tarafından seçilen örneklerden öğrenmek yerine, deneme yanılma yoluyla eğitildiği ve doğru cevaplar için ödüllendirildiği "saf takviyeli öğrenme" yönteminin kullanımıydı. Ayrıca, performansı artırmaya yardımcı olan "göreceli grup politikası optimizasyonu" adı verilen bir teknik olan dahili tahminleri kullanarak kendi çabalarını puanlıyor.

Araştırmacı Huan Sun (Ohio Eyalet Üniversitesi), "Titiz akran değerlendirme süreci, modelin değerini ve güvenilirliğini doğrulamaya yardımcı oluyor," diyor. "Diğer firmalar da aynısını yapmalı."

Hugging Face'de makine öğrenimi mühendisi olan Lewis Tunstall, bunun önemli bir emsal olduğunu, çünkü yapay zeka geliştirmede şeffaflığın riskleri daha doğru bir şekilde değerlendirmeye yardımcı olduğunu söyledi.

DeepSeek, R1'in OpenAI'nin modellerinden gelen veriler kullanılarak eğitilmediğini iddia ediyor ancak temel modelin web verileriyle eğitildiğini kabul ediyor; bu veriler arasında yapay zeka tarafından oluşturulan içerikler de olabilir.

Uzmanlar kesin olarak doğrulamanın zor olduğunu, ancak mevcut kanıtların saf iyileştirmenin yüksek performans elde etmek için yeterli olduğunu gösterdiğini söylüyor.

R1, ScienceAgentBench testinde doğruluk sıralamasında zirveye yerleşmese de verimlilik ve maliyet arasında iyi bir denge kurdu. Araştırmacılar şimdi DeepSeek'in yöntemini mevcut hukuk yüksek lisans programlarının (LL.M.) muhakeme yeteneklerini geliştirmek ve matematik ve programlamanın ötesine taşımak için uygulamayı hedefliyor.

Tunstall'a göre R1, yapay zeka gelişiminde "bir devrim başlattı."

(TTXVN/Vietnam+)

Kaynak: https://www.vietnamplus.vn/nghien-cuu-moi-tiet-lo-bi-quyet-thanh-cong-cua-deepseek-post1062474.vnp