구글, 차세대 사고 AI 모델 '제미니 2.5' 출시

새로운 세대의 AI는 멀티모달 AI 모델인 제미니 2.5 프로 익스페리멘탈(Gemini 2.5 Pro Experimental)을 기반으로 합니다. 제미니는 이 모델이 역대 가장 똑똑한 사고 능력을 갖추고 있다고 주장합니다. 오늘(3월 26일)부터 Google AI Studio 개발자 플랫폼과 제미니 어드밴스드 구독자용 제미니 앱(월 20달러)에서 이용 가능합니다.

제미니 2.5는 대답하기 전에 "잠시 생각을 멈추는" 능력을 가지고 있습니다. (사진: 구글)

AI를 생각하다 – 구글의 새로운 방향

구글은 이제 모든 새로운 AI 모델에 사고 기능이 내장될 것이라고 발표했습니다.

OpenAI가 2024년 9월 최초의 생각하는 AI 모델인 o1을 선보인 이후, 기술 업계는 OpenAI의 역량을 따라잡거나 능가하기 위해 경쟁해 왔습니다. Anthropic, DeepSeek, Google, 그리고 xAI는 모두 추가적인 컴퓨팅 성능을 활용하여 정보를 검토하고 문제를 분석한 후 답을 도출하는 생각하는 AI 모델을 보유하고 있습니다.

인지 AI의 발전으로 모델은 수학과 프로그래밍을 능가하는 성능을 발휘하게 되었습니다. 많은 기술 전문가들은 이것이 AI 에이전트, 즉 인간의 개입 없이 작업을 수행할 수 있는 자동화 시스템의 중요한 기반이 될 것이라고 믿습니다. 그러나 인지 AI는 더 많은 리소스를 소모하여 운영 비용 증가로 이어집니다.

구글은 이전에 2024년 12월에 제미니의 특별 버전을 통해 AI에 대한 사고를 실험했습니다. 하지만 제미니 2.5는 OpenAI의 "o" 시리즈와 경쟁하기 위한 이 회사의 가장 진지한 움직임입니다.

다양한 기준에서 뛰어난 성과

Gemini 2.5 Pro는 여러 테스트에서 여러 상위 경쟁 제품을 능가합니다. (사진: Google)

Google은 Gemini 2.5 Pro가 이전 AI 모델보다 성능이 뛰어날 뿐만 아니라, 여러 테스트에서 상위 경쟁 제품보다 우수하다고 주장합니다.

프로그래밍 코드 편집 능력을 측정하는 Aider Polyglot 벤치마크에서 Gemini 2.5 Pro는 68.6%의 점수를 받아 OpenAI, Anthropic, DeepSeek의 상위 모델을 뛰어넘었습니다.

그러나 소프트웨어 개발 역량을 평가하는 SWE-bench Verified 테스트에서 Gemini 2.5 Pro는 63.8%의 점수를 받아 OpenAI o3-mini와 DeepSeek R1보다 높았지만 Anthropic의 Claude 3.7 Sonnet(70.3%)보다는 낮았습니다.

수학, 사회 과학 , 자연 과학에 걸쳐 수천 개의 문제가 포함된 다학제 테스트인 Humanity's Last Exam에서 Gemini 2.5 Pro는 다른 대부분의 주요 AI 모델보다 높은 18.8%의 성적을 기록했습니다.

특히, 제미니 2.5 프로는 한 번에 100만 개의 토큰을 처리할 수 있는데, 이는 약 75만 단어에 해당하며, 반지의 제왕 소설 시리즈 전체보다 더 깁니다. 구글은 또한 이 모델이 가까운 시일 내에 최대 200만 개의 토큰을 지원하여 긴 맥락을 분석하고 기억하는 능력을 크게 향상시킬 것이라고 밝혔습니다.

구글은 아직 제미니 2.5 프로의 API 가격을 공개하지 않았습니다. 구글은 앞으로 몇 주 안에 더 자세한 정보를 제공할 것이라고 밝혔습니다.

Khanh Huyen (출처: Tech Crunch)

출처: https://vtcnews.vn/google-ra-mat-gemini-2-5-the-he-mo-hinh-ai-tu-duy-moi-ar933854.html