Model sztucznej inteligencji o3 firmy OpenAI pokonał w finale Groka 4 firmy X z wynikiem 4-0, zdobywając mistrzostwo na targach szachów AI Kaggle Game Arena 2025, organizowanych przez Google.

Osiem modeli sztucznej inteligencji bierze udział w turnieju Kaggle AI Chess Championship 2025. (Źródło: Chess.com)
Grok 4 był kiedyś uważany za najmocniejszego pretendenta, ale w końcowej rozgrywce popełnił kilka poważnych błędów, takich jak wczesna utrata figur i wykonywanie nielogicznych ruchów.
Grok 3 wykazał się lepszą analizą taktyczną i strategicznym zrozumieniem szachów, szczególnie w grze środkowej i końcówkach. Grok 4, mimo że był silny we wczesnych etapach turnieju, okazał się słaby w późniejszych partiach i nie wykazał się umiejętnością radzenia sobie ze złożonymi sytuacjami.
Na pozostałych pozycjach, Google Gemini 2.5 Pro zapewnił sobie trzecie miejsce, pokonując o4-mini z wynikiem 3,5-0,5. Pomimo wygranej, Gemini został uznany za grę o niższej jakości niż o3, z wieloma chaotycznymi rozgrywkami i błędami.
W konkursie AI Kaggle 2025, który odbył się w dniach 5-7 sierpnia, wzięło udział osiem dużych modeli językowych (LLM) rywalizujących w systemie pucharowym. Wśród ośmiu reprezentantów znaleźli się o3 i o4-mini z OpenAI, Grok 4, Gemini 2.5 Pro i Gemini 2.5 Flash z Google, Claude 4 Opus z Anthropic oraz Deepseek R1 i Kimi R2 z Chin.
Jest to testowe wydarzenie Google, którego celem jest ocena potencjału sztucznej inteligencji w obszarach myślenia strategicznego i ogólnej inteligencji.
Źródło: https://vtcnews.vn/openai-o3-vo-dich-giai-co-vua-ai-kaggle-2025-ar958595.html






Komentarz (0)