ABD'li araştırmacılar tarafından geliştirilen AI (yapay zeka) modeli s1'in işletme maliyetinin yalnızca 50 ABD doları olduğu, ancak çok daha pahalı olan OpenAI'nin o1 modeline eşdeğer akıl yürütme yetenekleri sağladığı belirtiliyor. s1'in ortaya çıkışı, son günlerde Silikon Vadisi'nde büyük yankı uyandıran DeepSeek'in etkileyici başarısının ardından geldi.
DeepSeek'in ortaya çıkışından bu yana 'ucuz yapay zeka' savaşı kızışıyor
Ekip, modeli oluşturmak için kullanılan kod ve verilerle birlikte s1 kaynak kodunu GitHub'da herkese açık hale getirdi. Geçen hafta yayınlanan bir makale, modelin geliştirilme sürecini açıklıyor ve kullandıkları akıllıca teknikleri vurguluyor. Ekip, yeni bir akıl yürütme modeliyle sıfırdan başlamak yerine, mevcut bir dil modelini kullandı ve Google'ın Gemini 2.0 Flash Düşünme Deneysel modelindeki akıl yürütme yeteneklerini özümseyerek bir "ince ayar" süreci gerçekleştirdi.
Yapay zekanın işletme maliyeti 50 doların biraz altında
s1 modelinin eğitimi, 16 Nvidia H100 GPU kullanılarak yalnızca 30 dakika sürdü. Her GPU yaklaşık 25.000 dolara mal olsa da, bulut bilişim hizmetleri sayesinde sürecin kiralanması 50 doların altında gerçekleşti. Ekip özellikle faydalı bir yöntem keşfetti: Modele nihai bir cevap vermeden önce "beklemesini" söylemek, modelin muhakemesini geliştirerek daha iyi çözümlere ulaşmasını sağladı.
S1 düşük maliyetle önemli kazanımlar elde etmiş olsa da, ölçeklenebilirliği konusunda endişeler mevcut. Google'ın modelini bir "öğretmen" olarak kullanmak, günümüzün önde gelen yapay zeka modelleriyle rekabet etme becerisi hakkında soru işaretleri doğuruyor. Özellikle OpenAI ve DeepSeek arasında devam eden dava göz önüne alındığında, Google muhtemelen durumu yakından takip edecektir.
[reklam_2]
Kaynak: https://thanhnien.vn/my-tao-ra-mo-hinh-ai-sieu-re-hoat-dong-tuong-tu-gpt-o1-185250207182535164.htm
Yorum (0)