
Oyuncu Nakamura, Grok 4'ün final maçında gergin bir zihniyetle oynadığını söyledi - Fotoğraf: ekran görüntüsü
Maç öncesinde OpenAI, LLM'nin 11. nesli olan GPT-5'in lansmanını duyurarak büyük bir heyecan yarattı.
Ancak finalde kullanılan o3 - ChatGPT modeli yine de güçlü çıkarım yetenekleri gösterdi ve ortalama %90,8'e varan doğru hamle oranıyla Grok 4'ün %80,2'lik oranını tamamen geride bıraktı.
ChatGPT, dört oyunda da Grok 4'e hiç şans tanımadı ve rakibini sırasıyla 35, 30, 28 ve 54 hamlede mat etti.
Dünya 2 numarası Hikaru Nakamura'ya göre, Grok 4 önceki turlara göre daha gergin oynuyor ve daha fazla hata yapıyor gibi görünüyor. Özellikle, Google'ın Gemini 2.5 Flash ve Gemini 2.5 Pro'yu ezici bir şekilde yendiğinde nadir görülen bir durum olan kolayca taş kaybediyor.
Üst üste 4-0'lık skorla aldığı 3 galibiyet ve %91'e varan isabet oranıyla o3 turnuvayı kusursuz bir şekilde tamamladı.
o3'ün gücü profesyonel satranç büyükustalarıyla kıyaslanamaz olsa da, Elo'su 2.000'in altında olan oyuncular için özellikle blitz ve süper blitz kategorilerinde sorun yaratacak düzeydedir.
Google tarafından düzenlenen turnuva, Amerikalı temsilcilerin mutlak hakimiyetiyle sona erdi. İki Çinli model Kimi K4 ve DeepSeek erken elenirken, üçüncülük mücadelesini Gemini 2.5 Pro, o4-mini karşısında kazanarak, önde gelen Amerikan teknoloji şirketlerinin konumunu pekiştirdi.
Bu etkinlik, yalnızca genel amaçlı yapay zekâ modellerinin uzmanlık gerektiren bir alandaki inanılmaz yeteneklerini göstermekle kalmıyor, aynı zamanda yapay zekânın gelecekteki gelişim potansiyeline dair yeni bir bakış açısı da sunuyor.
Ancak, LLM'lerin hızla gelişmesine rağmen, Elo reytingleri insanlarınkini çok aşan profesyonel satranç motorlarının seviyesine henüz ulaşamadıkları da bir hatırlatmadır.
Kaynak: https://tuoitre.vn/chatgpt-dang-quang-giai-co-vua-danh-cho-ai-20250808090405997.htm






Yorum (0)