O3 Pro, karmaşık istekleri işleme yeteneğiyle öne çıkıyor. Görsel: OpenAI. |
OpenAI, o3 pro'yu aylık 200 dolarlık bir Pro paketiyle ve API üzerinden ekip desteğiyle piyasaya sürdü. Birkaç ay önce tanıtılan o3'ün yükseltilmiş bir sürümü olan o3 pro, şirket tarafından şu anda mevcut olan en güçlü sürüm olarak lanse ediliyor.
"Pro" kelimesi eklenmiş tüm sürümler, daha zor ve uzun soruları yanıtlayabilme yeteneğiyle ilişkilidir. Tipik yapay zeka sürümlerinden farklı olarak, akıl yürütme modeli problemleri adım adım işler; bu da fizik, matematik ve programlama gibi alanlarda daha istikrarlı ve güvenilir bir şekilde çalışmasını sağlar.
Şirket, "Güvenilirliğin hızdan daha önemli olduğu ve birkaç dakika beklemenin göze alınabilir bir ödün olduğu zor sorular için o3-pro'yu kullanmanızı öneririz" açıklamasında bulundu. Paylaşılan test değerlendirmelerinde, o3-pro, o3 ve o1-pro sürümlerine kıyasla üstün sonuçlar elde etti.
Eski Apple çalışanı ve yapay zeka geliştirme şirketi Raindrop'un kurucu ortağı Ben Hylak, bu yeni model hakkında yorum yaparken, bunun çok daha akıllıca olduğunu söyledi. Şirketindeki tüm önceki toplantıların geçmişini derledikten sonra, o3-pro'dan bir plan oluşturmasını istedi.
Sonuçlar oldukça etkileyici, spesifik ve net bir şekilde analiz edilmişti; tıpkı büyük ölçekli bir dil modellemesinin (LLM) her zaman başarabileceğini umduğu gibi. Plan, hedef ölçütleri, zaman çizelgelerini, öncelikleri ve tamamen ortadan kaldırılacak şeylere ilişkin katı yönergeleri içeriyordu. "O kadar spesifik ve sağlam temellere dayanıyordu ki, şirketimin geleceğini yeniden düşünmek zorunda kaldım," diye yazdı.
o3 pro'dan (solda) elde edilen sonuçlar daha spesifik ve güvenilirdir. Fotoğraf: Ben Hylak/X. |
O3-pro, API üzerinden kullanıldığında yatırılan her milyon token için 20 dolar, ihraç edilen her milyon token için ise 80 dolar maliyetle sunulmaktadır. Bunun nedeni, yapay zekanın verileri ezberleme ve işleme yeteneğidir. Yatırılan bir milyon token yaklaşık 750.000 kelimeye eşdeğerdir ki bu , The Verge'ün de belirttiği gibi, *Savaş ve Barış* kitabından bile daha uzundur.
OpenAI, uzmanların test edilen her kategoride o3 pro'yu o3'ten sürekli olarak daha yüksek puanladığını belirtiyor. Değerlendirme yapanlar ayrıca, özellikle bilim, eğitim , programlama, işletme ve yazma desteği gibi önemli alanlarda, açıklık, takip edilebilirlik ve doğruluk gibi çeşitli kriterlerdeki tutarlılık açısından o3 pro'ya daha yüksek puanlar veriyor.
Modelin matematiksel yeteneklerini değerlendiren AIME 2024 testinde, o3 pro, Google'ın en iyi yapay zekası olan Gemini 2.5 Pro'dan bile daha yüksek puan aldı. Ek olarak, model, doktora düzeyinde bilimsel bilgi testi olan GPQA Diamond'da da Anthropic'in Claude 4 Opus'unu geride bıraktı.
O3 Pro ayrıca web'de arama yapmayı, dosyaları analiz etmeyi, Python'ı hesaplama ve programlama için kullanmayı ve belleği kullanarak yanıtları kişiselleştirmeyi sağlayan araçları da entegre ediyor. Bu yönüyle ilgili olarak Ben Hylak, aracın çevresini tanıma, dış dünya hakkında ne zaman soru sorması gerektiğini (biliyormuş gibi yapmak yerine) bilme ve her görev için doğru aracı seçme yeteneğini açıkça gösterdiğini belirtti.
Ancak modelin en büyük dezavantajı, o1 pro'dan bile daha yavaş olan tepki süresidir. YouTuber Bijan Bowen da buna katılıyor. "Modelin tepkisi oldukça açık olsa da, sadece birkaç açıklayıcı cümle içinde bile tepki süresi oldukça uzun," dedi. Ben Hylak ise özellikle yetersiz dış veri durumlarında modelin aşırı düşünmeye meyilli olduğunu ekledi.
O3-pro'nun ayrıca görüntü oluşturma yeteneğinin olmaması ve Canvas özelliğine destek vermemesi gibi bazı başka sınırlamaları da bulunmaktadır. OpenAI bir "teknik sorunu" düzeltene kadar ChatGPT'deki bu modelle geçici sohbet özelliği şu anda devre dışı bırakılmıştır.
Ancak Hylak, bunun Claude 3.5 Sonnet veya ChatGPT 4o gibi kullanıcı dostu sohbet uygulamaları için bir model olmadığını savunuyor. Rockerbox Ürün Müdürü Nate B. Jones ise o3 pro'nun 15-20 dakika düşünmeyi gerektiren zorlu görevler için kullanılması gerektiğini belirtiyor.
Kaynak: https://znews.vn/mo-hinh-suy-luan-moi-cua-chatgpt-post1560084.html






Yorum (0)