![]() |
구글 제미니 로고. 사진: 블룸버그 . |
구글은 11월 말에 제미니 3 모델을 출시했습니다. 이 제품에는 향상된 코딩 기능, 시각적 이미지 생성 기능, 사용자를 대신하여 특정 작업을 수행하는 에이전트 등 주목할 만한 여러 가지 업그레이드 기능이 포함되어 있습니다.
구글은 제미니 3를 소개하면서 이것이 자사에서 개발한 "가장 똑똑한 모델"이라고 강조했습니다. 실제 경험에 따르면 이 모델은 처리 속도가 더 빠르고 추론 능력이 더 뛰어나지만, 개선의 여지는 여전히 남아 있습니다.
빠르게 인터랙티브 인터페이스를 만드세요.
Gemini 3의 주요 업그레이드 중 하나는 Canvas와 관련된 기능입니다. Canvas는 Gemini 내의 대화형 작업 공간으로, 챗봇에게 코드를 작성하도록 요청하고, 결과를 시각화하고, 콘텐츠를 편집할 수 있습니다.
제미니 3호가 축구공, 지구, 태양, 은하수 사이의 크기 차이를 3D 모델로 생성하라는 요청을 받으면, 코딩 인터페이스가 활성화되어 사용자가 객체의 크기를 선택하고 비교할 수 있는 대화형 환경을 처리하고 생성합니다.
![]() |
Gemini 3의 Canvas 기능을 사용하여 상호 작용 공간을 만들 수 있는 기능. |
구글 데모와 비교했을 때 이미지 품질은 다소 떨어지지만, 객체에 대한 정보는 명확하고 이해하기 쉽습니다. 처리 시간은 약 2분입니다. 캔버스 인터페이스에서 사용자는 코드를 직접 편집하거나 콘텐츠를 복사 또는 공유할 수 있습니다.
또 다른 명령으로, 제미니 3는 나뭇가지에 앉아 있는 독수리의 3D 큐브형(복셀) 모델을 생성하도록 요청받았습니다. 도구는 약 45초 만에 결과를 생성했고, 사용자는 마우스를 사용하여 확대 및 회전할 수 있었습니다. 그러나 이미지의 일부 세부 사항에 그래픽 오류가 발생하여 안정적으로 표시되지 않았습니다.
나무 가지에 앉아 있는 독수리도 있었지만, 요구 조건은 더 까다로웠습니다(3D 모델). 처음에는 제미니 3호가 생성한 코드가 오류를 일으켜 실행되지 않았습니다. 수정을 요청한 후에야 이미지가 나타났고 상호작용이 가능해졌습니다.
![]() |
제미니 3호의 상호작용 환경 조성 능력. |
몇 가지 해결해야 할 문제가 남아있긴 하지만, 질문과 답변 방식에서 협업 편집 방식으로의 전환은 흥미로운 방향이며, 이러한 변화 덕분에 Gemini 3는 복잡하고 장기적인 작업에 유용하게 활용될 수 있습니다.
물론 제미니 3는 단순히 그래픽이나 시각 모델을 만드는 데만 사용되는 것은 아닙니다. 구글은 AI Pro 사용자를 위해 "생성형 UI" 기능을 테스트 중입니다. 특정 명령어를 사용하면 모델이 인터랙티브한 잡지 스타일 인터페이스나 시각적인 웹사이트를 만들 수 있습니다.
구글은 이 기능이 단계적으로 출시되고 있다고 밝혔습니다. 더 버지 의 경험에 따르면, 사용자는 시각적 레이아웃 기능을 선택한 다음 "로마 3일 여행 계획하기"와 같은 명령어를 입력해야 합니다.
Gemini 3는 데이터 처리를 거쳐여행 웹사이트와 유사한 결과를 생성합니다. 여기에는 여행 일정, 상세 이미지, 여행 선호도 및 식습관에 대한 질문 등이 포함됩니다. 그런 다음 모델은 답변을 그에 맞게 조정합니다. 이 기능은 컴퓨터 조립 방법이나 수족관 제작 방법과 같은 주제에도 매우 유용합니다.
더욱 효과적인 추론 및 분석 능력.
구글에 따르면 제미니 3는 이전 모델보다 추론 능력이 향상되었습니다. 구글은 제미니 3 프로의 추론 능력이 박사 수준에 달하며, 인류 최후의 시험(Humanity's Last Exam)에서 37.5%, GPQA 다이아몬드 시험에서 91.9%의 점수를 기록했다고 주장합니다.
물론 사용자는 모델과 직접 상호 작용할 때 비로소 그 차이를 진정으로 체감할 수 있습니다. GPQA Diamond 참조 문제 세트(박사 과정에 초점을 맞춘 문제)에서 문제를 풀도록 요청받았을 때, Gemini 3 Pro는 단계별 지침과 설명 이미지를 포함한 자세한 해결책을 제공하는 데 약 30초가 걸렸습니다.
![]() |
제미니 3는 복잡한 질문에도 답할 수 있으며, 박사 학위 수준에 필적하는 사고 능력을 보여줍니다. |
평가 결과에 따르면, 해당 풀이는 상당히 상세하며 올바른 절차를 따르고 있습니다. 비교하자면, GPT-5.1도 정답을 맞추는 데 약 30초가 걸렸지만, 풀이의 상세함은 떨어졌습니다. 마찬가지로, Claude 4.5 Sonnet은 Gemini 3보다 더 빠르게 정답을 맞혔지만, 풀이의 상세함은 부족했습니다.
구글에 따르면 제미니 3는 텍스트, 이미지, 비디오 등 여러 소스에서 동시에 문서를 추출할 수 있습니다. 또한, 이전에는 학습되지 않았던 작업도 제미니 3에서 더 잘 처리합니다.
![]() |
제미니 3호의 비디오 분석 기능. |
예를 들어, 57분짜리 비디오의 주요 주제를 분석해 달라는 요청을 받았을 때, Gemini 3는 요청된 인수와 해당 비디오 부분의 타임스탬프를 포함한 결과를 제공하는 데 약 1분밖에 걸리지 않았습니다. 마찬가지로, 이 모델은 테니스 비디오를 정확하게 식별하고 경기 내용과 각 선수의 플레이 스타일을 분석했습니다.
사용자는 Gemini 3에게 동영상 시청과 외부 자료 참조를 동시에 요청하고, 더 심층적인 분석을 위해 질문까지 할 수 있습니다. 전반적으로 Gemini 3는 Google 검색 데이터베이스와의 연동 덕분에 분석 및 문서 참조 작업에서 매우 빠른 응답 속도를 보여줍니다.
상담원은 친절했지만, 여전히 문제가 있습니다.
에이전트 기능 또한 Gemini 3의 주목할 만한 업그레이드입니다. AI Ultra 플랜 사용자(현재 미국 시장에서만 이용 가능)는 이 모드를 통해 이메일 분류 및 정리, 정보 검색, 여행 티켓 예약과 같은 복잡한 작업을 사용자 대신 수행할 수 있습니다.
구글은 제미니 3 출시 당시 지메일에서 받은 편지함을 정리하는 기능을 예시로 들었습니다. 더 버지 의 경험에 따르면, 이 기능은 요청한 대로 정확하게 작동하여 일주일 동안 읽지 않은 이메일 목록을 완벽하게 생성해 줍니다.
캔버스 기능과 유사하게 이메일 목록과 권장 조치 사항은 별도의 영역에 표시됩니다. 제미니는 중요한 이메일에 대한 알림 설정, 프로모션 이메일 보관 등 다양한 옵션을 제공합니다.
![]() |
Gemini 3의 에이전트 기능은 Gmail 받은편지함을 관리하는 데 도움이 됩니다. 이미지: The Verge . |
청구서 납부 알림을 생성하라는 메시지가 표시되면 Gemini는 관련 정보를 Google Tasks에 신속하게 입력합니다. 결제 작업의 경우, 에이전트는 사용자가 결제 정보를 입력해야 하는 부분으로 자동으로 이동하여 거기서 멈춥니다.
전반적으로 Gemini 3 에이전트는 사용자가 잊어버리기 쉬운 이메일을 찾아내는 데 매우 유용합니다. 또한 이 도구는 더 이상 필요 없는 광고성 이메일을 찾아 수신 거부할 수도 있습니다.
실제로 Perplexity와 ChatGPT 같은 일부 챗봇 에이전트는 이미 Gmail과의 연동을 지원합니다. 하지만 Gemini는 가장 다양한 연동 기능을 제공합니다. 예를 들어 Perplexity 사용자는 보존하거나 삭제할 이메일을 직접 입력해야 하지만, Gemini에서는 버튼을 통해 이러한 작업을 간편하게 수행할 수 있습니다.
![]() |
제미니 3호의 대화형 인터페이스 생성 기능. 사진: 더 버지 . |
ChatGPT의 이메일 정렬 기능도 불안정합니다. 게다가 Gemini의 이메일 전송 속도는 Perplexity보다 느립니다. 식당 예약과 같은 일부 작업에서는 가끔 문제가 발생하기도 합니다.
결제나 이메일 전송과 같은 민감한 작업을 수행하기 전에 항상 사용자 확인이 필요하지만, 특정 작업을 AI에 위임하는 것에 대해 사용자들은 여전히 주저합니다. 제미니 3의 에이전트 모드는 매우 유용하지만, 사용자는 여전히 결과물을 모니터링해야 합니다.
출처: https://znews.vn/gemini-3-tot-den-dau-post1607493.html













댓글 (0)