나카무라 선수는 그록4가 마지막 경기에서 긴장된 마음으로 플레이한 것 같다고 말했습니다. - 사진: 스크린샷
경기 전, OpenAI는 11세대 LLM인 GPT-5 출시를 발표하며 큰 화제를 모았습니다.
하지만 최종 결과에 사용된 o3-ChatGPT 모델은 여전히 강력한 추론 능력을 보여주었으며, 평균 정확한 이동률이 최대 90.8%에 달해 Grok 4의 80.2%를 훌쩍 뛰어넘었습니다.
4개의 게임 모두에서 ChatGPT는 Grok 4에게 기회를 주지 않고 각각 35, 30, 28, 54수 만에 상대방을 체크메이트했습니다.
세계 랭킹 2위 히카루 나카무라에 따르면, 그록 4는 이전 라운드보다 더 긴장감 넘치고 실수도 더 많았습니다. 특히, 그록 4는 기물을 쉽게 잃어버렸는데, 이는 구글의 제미니 2.5 플래시와 제미니 2.5 프로를 압도적으로 이긴 드문 사례입니다.
o3는 4-0의 스코어로 3연승을 거두고, 평균 정확도가 최대 91%에 달하며 토너먼트를 완벽하게 마무리했습니다.
o3의 위력은 프로 체스 그랜드마스터들과는 비교할 수 없지만, Elo 2,000 미만의 플레이어들에게는 어려움을 주기에 충분합니다. 특히 블리츠와 슈퍼 블리츠 부문에서 그렇습니다.
구글이 주최한 토너먼트는 미국 대표단의 압도적인 우세로 마무리되었습니다. 두 중국 모델인 키미 K4와 딥시크는 모두 조기에 탈락했지만, 3위 결정전에서는 제미니 2.5 프로가 o4-mini를 누르고 승리하며 미국을 대표하는 기술 기업들의 위상을 다시 한번 확인시켜 주었습니다.
이 행사는 전문 분야에서 범용 AI 모델의 놀라운 역량을 보여줄 뿐만 아니라, 미래 인공지능의 잠재적 발전 가능성에 대한 새로운 시각을 제시합니다.
하지만 LLM이 급속히 발전하고 있음에도 불구하고, Elo 등급이 인간의 등급을 훨씬 뛰어넘는 전문 체스 엔진의 수준에는 아직 미치지 못한다는 점을 상기시켜줍니다.
출처: https://tuoitre.vn/chatgpt-dang-quang-giai-co-vua-danh-cho-ai-20250808090405997.htm
댓글 (0)