Çin'den AI Kimi K2, defalarca yasadışı hamleler yaptığı için diskalifiye edildi - Fotoğraf: chess.com
Gemini 2.5 Pro, o4-mini, Grok 4 ve o3 takımları 4-0'lık ezici bir zaferle AI satranç turnuvasının yarı finallerine yükseldi ve sırasıyla Claude 4 Opus, DeepSeek R1, Gemini 2.5 Flash ve Kimi k2'yi mağlup etti.
Çeyrek finalin en dikkat çekeni ise Moonshot AI'nın Kimi K2 modeli (Çin), ChatGPT geliştiricisi OpenAI'nin LLM'si o3'e karşı 0-4'lük feci bir yenilgi aldı.
Kimi K2'nin defalarca yaptığı kural dışı hamleler nedeniyle dört oyun da sekiz hamleden kısa bir sürede sona erdi.
Örneğin, üçüncü oyunda, o3'ün geride kaldığı pozisyonu doğru bir şekilde anlamasına rağmen, Kimi K2 dört denemede de tek bir geçerli hamle bulamadı ve yenilgiyi kabul etmek zorunda kaldı. o3'ün Stockfish aracıyla eşleşen hamlelerin yüzdesi %100'e kadar çıktı ve bu da beceri seviyesi farkının çok büyük olduğunu gösterdi.
Diğer Çin temsilcisi DeepSeek ise OpenAI'nin o4-mini takımına 0-4 yenilerek daha iyi bir performans sergileyemedi. İlk maçta rakiplerinden daha iyi bir performans sergileyerek tutunmalarına rağmen, DeepSeek yine de hatalar yaptı ve sonraki maçlarda mat oldu.
Ancak çeyrek finaldeki en etkileyici karakter, milyarder Elon Musk'ın xAI Company'sinden bir model olan Grok 4 oldu. Grok 4, Google'ın Gemini 2.5 Flash'ını 4-0'lık skorla kolayca yendi. Rakibinin her hatasını cezalandırma yeteneğine sahip olan Grok 4'ün hareket isabet oranı, yaklaşık %97,5 ile turun en yüksek seviyesine ulaştı.
Maçı yorumlayan dünya 2 numarası Hikaru Nakamura, şaşkınlığını şu sözlerle dile getirdi: "Grok 4, bu turnuvadaki en güçlü LLM kesinlikle. Diğer modellerle arasındaki seviye farkı hiç de az değil."
Bu yorum, Bay Musk'ın Nakamura'nın yorumunun görselini sosyal medya ağı X'te hemen yeniden paylaşmasıyla daha da güçlendi ve şu özgüvenli yorumu ekledi: "Bu sadece bir yan etki. xAI satranca neredeyse hiç zaman ayırmıyor."
Satranç oyuncusu Nakamura, Grok 4'ün yapay zeka turnuvasında tamamen "kendi liginin dışında" olduğunu söyledi - Fotoğraf: ekran görüntüsü
Google tarafında ise Gemini 2.5 Flash elenmesine rağmen, kalan temsilcisi Gemini 2.5 Pro, Anthropic Company'den Claude 4 Opus'u 4-0'lık net bir skorla yenerek turnuvadaki yerini sağlamlaştırdı.
Yarı finaller 7 Ağustos saat 00:30'da (Vietnam saati) gerçekleşecek. İlk yarı final, Grok 4 ve Gemini 2.5 Pro arasında yüksek bahisli bir maç olacak. Diğer maç ise o3 ve o4-mini arasında heyecan verici bir "OpenAI derbisi" olacak.
TUAN LONG
Kaynak: https://tuoitre.vn/my-thang-tuyet-doi-tai-giai-co-vua-danh-cho-ai-20250806111234074.htm






Yorum (0)