OpenAI, 2019'da GPT-2'yi piyasaya sürdüğünden beri ilk kez 5 Ağustos'ta iki açık ağırlıklı dil modeli duyurdu.
Bir yapay zeka modelinin parametreleri, yani eğitim sırasında çıktıyı ve tahminleri iyileştirmeye yardımcı olan faktörler kamuya açıksa, bu model açık ağırlıklandırma olarak kabul edilir.
Açık ağırlıklandırma modelleri şeffaflık ve kontrol sağlayabilir, ancak kaynak kodunun tamamını herkesin kullanımına ve değişikliğine açık hale getiren açık kaynaklı modellerden farklıdır.
OpenAI, gpt-oss-120b ve gpt-oss-20b olarak adlandırılan yalnızca metinden oluşan bu modellerin, geliştiricilere, araştırmacılara ve şirketlere kullanımı ve özelleştirmesi kolay, daha düşük maliyetli seçenekler sunmak için tasarlandığını söylüyor.
OpenAI'nin her iki yeni modeli de gelişmiş çıkarım, araç kullanımı ve sinirsel işlem görevlerini gerçekleştirebiliyor. Tüketici donanımlarından bulut platformlarına ve cihaz içi uygulamalara kadar her yerde çalışacak şekilde tasarlandılar.
OpenAI, kullanıcıların gpt-oss-20b'yi dizüstü bilgisayarlarında çalıştırıp dosyalar arasında arama yapabilen ve yazabilen kişisel bir asistan olarak kullanabileceklerini söylüyor.
Şirket, bu modellerin çeşitli yongalarda iyi çalışmasını sağlamak için Nvidia, Advanced Micro Devices (AMD), Cerebras ve Groq ile ortaklık kurdu.
OpenAI'nin açık ağırlıklandırma modellerini yayınlaması büyük bir merakla bekleniyordu. Bunun bir nedeni de şirketin ek güvenlik testleri yapmak ve yüksek riskli alanları incelemek için daha fazla zamana ihtiyaç duyması nedeniyle lansmanı defalarca ertelemesiydi.
OpenAI, 5 Ağustos'ta açık ağırlık modelleri üzerinde kapsamlı eğitim ve güvenlik testleri gerçekleştirdiğini açıkladı. Şirket, ön eğitim sırasında zararlı kimyasal, biyolojik, radyolojik ve nükleer verileri filtreledi ve kötü niyetli kişilerin modelleri kötü amaçlı amaçlar için nasıl hassaslaştırmaya çalışabileceğini simüle etti.
OpenAI ayrıca, bu kötü amaçlı ayarlama sürecine ilişkin değerlendirmesine ilişkin geri bildirim almak için üç bağımsız uzman grubuyla çalıştığını söyledi.
Son yıllarda Meta, Microsoft destekli Mistral AI ve Çinli startup DeepSeek gibi diğer bazı teknoloji şirketleri de açık ağırlıklandırma modelleri yayınladı.
Kaynak: https://www.vietnamplus.vn/openai-lan-dau-phat-hanh-mo-hinh-ai-trong-so-mo-ke-tu-nam-2019-post1054037.vnp
Yorum (0)