Vietnam.vn - Nền tảng quảng bá Việt Nam

ChatGPT의 새로운 추론 모델

많은 사용자들이 O3 Pro를 여러 면에서 다른 챗봇보다 우수하다고 평가합니다. 하지만 이 모델에는 중대한 단점과 특정 용도에만 적합한 점이 있습니다.

ZNewsZNews16/06/2025

o3 pro는 복잡한 요청을 처리하는 능력이 뛰어납니다. 이미지: OpenAI.

OpenAI는 API를 통해 팀과 함께 사용할 수 있는 o3 Pro 패키지를 월 200달러에 출시했습니다. 몇 달 전에 출시된 o3의 업그레이드 버전인 o3 Pro는 현재 사용 가능한 버전 중 가장 강력한 버전이라고 회사 측은 강조하고 있습니다.

"프로"라는 단어가 추가된 모든 버전은 더 어렵고 긴 질문에 답할 수 있는 능력을 갖추고 있습니다. 일반적인 AI 버전과 달리, 이 추론 모델은 문제를 단계별로 처리하므로 물리학, 수학, 프로그래밍과 같은 분야에서 더욱 안정적이고 신뢰할 수 있게 작동합니다.

"신뢰성이 속도보다 더 중요하고 몇 분 정도 기다리는 것이 가치 있는 경우, 어려운 문제에는 o3-pro 사용을 권장합니다."라고 회사 측은 밝혔습니다. 공동 테스트 결과, o3-pro는 o3 및 o1-pro 버전보다 우수한 성능을 보였습니다.

애플 출신이자 AI 개발 회사 레인드롭의 공동 창업자인 벤 힐락은 이 새로운 모델에 대해 "훨씬 더 스마트하다"고 평했습니다. 그는 자신의 회사에서 진행된 모든 이전 회의 기록을 정리한 후 o3-pro에 계획 수립을 의뢰했습니다.

결과는 매우 인상적이었고, 구체적이었으며, 분석도 명확했습니다. 그가 항상 대규모 언어 모델링(LLM)이 달성할 수 있기를 바랐던 바로 그 모습이었습니다. 계획에는 목표 지표, 일정, 우선순위, 그리고 완전히 제거해야 할 사항에 대한 엄격한 지침이 포함되어 있었습니다. 그는 "계획이 너무 구체적이고 탄탄해서 회사의 미래를 다시 생각해봐야 했습니다."라고 썼습니다.

새로운 추론 모델 이미지 1

o3 pro(왼쪽)에서 얻은 결과는 더욱 구체적이고 신뢰할 수 있습니다. 사진: Ben Hylak/X.

O3-pro는 투자된 토큰 백만 개당 20달러, API를 통해 내보낼 경우 백만 개당 80달러의 비용이 발생합니다. 이는 AI가 데이터를 기억하고 처리하는 능력 때문입니다. 백만 개의 토큰을 투자하면 약 75만 단어에 해당하는 양이 되는데, 이는 The Verge의 비교처럼 소설 *전쟁과 평화*보다도 긴 분량입니다.

OpenAI에 따르면 전문가들은 테스트한 모든 항목에서 o3 pro를 o3보다 일관되게 높게 평가합니다. 또한 리뷰어들은 명확성, 이해 용이성, 정확성 등 여러 기준에서 일관성이 뛰어난 o3 pro를 더 높이 평가하며, 특히 과학, 교육 , 프로그래밍, 비즈니스, 글쓰기 지원과 같은 주요 분야에서 이러한 경향이 두드러집니다.

모델의 수학적 능력을 평가하는 AIME 2024 테스트에서 o3 pro는 구글의 최고급 AI인 Gemini 2.5 Pro보다 높은 점수를 기록했습니다. 또한, 박사 수준의 과학 지식 테스트인 GPQA Diamond에서도 Anthropic의 Claude 4 Opus를 능가하는 성능을 보였습니다.

o3 pro는 웹 검색, 파일 분석, 파이썬을 사용한 연산 및 프로그래밍, 메모리를 활용한 개인 맞춤형 응답 등 다양한 기능을 통합하고 있습니다. 벤 힐락은 이러한 측면에 대해 이 도구가 주변 환경을 인식하고, 외부 세계에 대해 언제 질문해야 하는지(아는 척하는 것이 아니라) 정확히 알고 있으며, 각 작업에 적합한 도구를 선택하는 능력을 명확하게 보여준다고 언급했습니다.

하지만 이 모델의 가장 큰 단점은 응답 속도가 o1 pro보다도 느리다는 점입니다. 유튜버 비잔 보웬도 이에 동의합니다. 그는 "모델의 응답은 꽤 명확하지만, 단 몇 개의 설명 문장만으로도 응답 시간이 상당히 오래 걸린다"고 말했습니다. 벤 힐락은 특히 외부 데이터가 부족한 경우 모델이 과도하게 생각하는 경향이 있다고 덧붙였습니다.

O3-pro는 이미지 생성 불가, Canvas 기능 미지원 등 몇 가지 제한 사항도 있습니다. 또한, OpenAI에서 "기술적인 문제"를 해결하는 동안 ChatGPT에서 이 모델과의 임시 채팅 기능은 현재 비활성화되어 있습니다.

하지만 힐락은 이것이 클로드 3.5 소네트나 ChatGPT 4o처럼 사용자 친화적인 채팅 모델이 아니라고 주장합니다. 로커박스의 제품 책임자인 네이트 B. 존스는 o3 pro는 15~20분 정도의 사고력이 필요한 까다로운 작업에 사용하는 것이 좋다고 조언합니다.


출처: https://znews.vn/mo-hinh-suy-luan-moi-cua-chatgpt-post1560084.html


댓글 (0)

댓글을 남겨 여러분의 감정을 공유해주세요!

같은 태그

같은 카테고리

같은 저자

유산

수치

기업들

시사

정치 체제

현지의

제품

Happy Vietnam
모시산에 거주하는 뿔다오족 소가족의 일상.

모시산에 거주하는 뿔다오족 소가족의 일상.

불교 축제

불교 축제

피우 스카프를 드릴게요.

피우 스카프를 드릴게요.