나카무라 선수는 그록4가 마지막 경기에서 긴장된 마음으로 경기를 펼친 것 같다고 말했다 - 사진: 스크린샷
경기 전, OpenAI는 11세대 LLM인 GPT-5 출시를 발표해 큰 화제를 모았습니다.
하지만 최종적으로 사용된 o3-ChatGPT 모델은 여전히 강력한 추론 능력을 보여주었으며, 평균 정확한 이동률이 최대 90.8%에 달해 Grok 4의 80.2%를 훌쩍 뛰어넘었습니다.
네 게임 모두에서 ChatGPT는 Grok 4에게 기회를 주지 않고 각각 35, 30, 28, 54수 만에 상대를 체크메이트했습니다.
세계 랭킹 2위 히카루 나카무라에 따르면, 그록 4는 이전 라운드보다 더 긴장감 있게 플레이하고 실수도 더 많았습니다. 특히, 그록 4는 기물을 쉽게 잃어버렸는데, 이는 구글의 제미니 2.5 플래시와 제미니 2.5 프로를 압도적으로 이긴 드문 사례입니다.
o3는 4-0의 스코어로 3연승을 거두고 평균 정확도가 최대 91%에 달하며 토너먼트를 완벽하게 마무리했습니다.
o3의 실력이 프로 체스 그랜드마스터들과는 비교할 수 없지만, Elo 2,000 미만의 플레이어들에게는 충분히 위협적입니다. 특히 블리츠와 슈퍼 블리츠 종목에서 더욱 그렇습니다.
구글이 주최한 토너먼트는 미국 대표단의 압도적인 우세로 마무리되었습니다. 두 중국 모델인 키미 K4와 딥시크는 초반에 탈락했지만, 3위 결정전에서는 제미니 2.5 프로가 o4-mini를 누르고 승리하며 미국 대표 기술 기업들의 위상을 다시 한번 확인시켜 주었습니다.
이 행사는 전문 분야에서 범용 AI 모델의 놀라운 역량을 보여줄 뿐만 아니라, 미래 인공지능의 발전 가능성에 대한 새로운 시각을 제시합니다.
하지만 LLM이 급속히 발전하고 있음에도 불구하고, Elo 등급이 인간을 훨씬 능가하는 전문 체스 엔진의 수준에는 아직 미치지 못한다는 점을 상기시켜줍니다.
출처: https://tuoitre.vn/chatgpt-dang-quang-giai-co-vua-danh-cho-ai-20250808090405997.htm
댓글 (0)