OpenAI는 고급 추론에 탁월하고 자사의 독점적인 40-미니 추론 모델과 비슷한 성능 수준의 노트북에서 실행되도록 최적화된 두 개의 개방형 언어 모델을 출시했다고 밝혔습니다.
개방형 가중치 언어 모델의 훈련된 매개변수 또는 가중치는 공개적으로 접근 가능하며, 개발자는 이를 사용하여 원래의 훈련 데이터가 필요 없이 특정 작업에 맞게 모델을 분석하고 미세 조정할 수 있습니다.
"개방형 모델의 독특한 점 중 하나는 사람들이 로컬에서 이를 운영할 수 있다는 것입니다. 사람들은 자체 방화벽 뒤에서, 자체 인프라에서 이를 운영할 수 있습니다."라고 OpenAI의 공동 창립자 그렉 브록먼은 보도자료에서 말했습니다.

120B와 20B gpt-oss 버전은 노트북에서 기본적으로 실행될 수 있습니다.
오픈 가중치 언어 모델은 전체 소스 코드, 교육 데이터 및 방법론에 대한 액세스를 제공한다는 점에서 오픈 소스 모델과 다릅니다.
아마존은 이와 별도로 OpenAI의 개방형 가중치 모델을 아마존 웹 서비스의 베드록 생성 AI 마켓플레이스에서 이용할 수 있다고 발표했습니다. 베드록의 제품 매니저인 아툴 데오는 OpenAI 모델이 베드록에서 제공되는 것은 이번이 처음이라고 밝혔습니다.
"OpenAI는 훌륭한 모델을 개발해 왔으며, 이러한 모델이 훌륭한 오픈소스 옵션 또는 고객을 위한 오픈 모델링 옵션이 될 것이라고 믿습니다."라고 Deo는 인터뷰에서 말했습니다. 그는 AWS와 OpenAI 간의 계약 내용에 대해서는 언급을 거부했습니다.
Amazon은 지난주 자사의 AWS 사업부 성장이 둔화되었다고 보고했는데, 특히 경쟁사에 비해 그렇습니다.

gpt-oss-20b 모델은 Sage Maker 전자상거래 플랫폼에서 판매됩니다.
오픈소스 AI 모델과 오픈 가중치의 환경은 올해 논쟁의 여지가 있었습니다. 한동안 META의 Llama 모델이 최고로 여겨졌지만, 올해 초 중국의 DeepSeek이 강력하고 비용 효율적인 추론 모델을 출시한 반면, Meta는 Llama 4 개발에 어려움을 겪으면서 상황이 바뀌었습니다.
두 개의 새로운 OpenAI 모델은 2019년에 출시된 GPT-2 이후 OpenAI가 출시한 최초의 개방형 모델입니다.
OpenAI에 따르면, 더 큰 모델인 gpt-oss-120b는 단일 GPU에서 실행될 수 있고, 두 번째 모델인 gpt-oss-20b는 개인용 컴퓨터에서 직접 실행할 수 있을 만큼 작다고 합니다.
OpenAI는 이러한 모델이 o3-mini 및 o4-mini라는 자체 추론 모델과 비슷한 성능을 보이며, 특히 프로그래밍, 경쟁 수학, 건강 관련 쿼리에서 뛰어난 성능을 보인다고 밝혔습니다.
이 모델은 일반 지식 외에도 과학 , 수학, 프로그래밍에 중점을 둔 텍스트 전용 데이터셋을 사용하여 학습됩니다. OpenAI는 자사의 오픈웨이트 모델을 DeepSeek-R1과 같은 경쟁 모델과 비교하는 벤치마크를 공개하지 않습니다.
현재 3,000억 달러 규모의 기업 가치를 지닌 마이크로소프트의 OpenAI가 소프트뱅크 그룹이 주도하는 새로운 자금 조달 라운드에서 최대 400억 달러를 모금하고 있습니다.
출처: https://khoahocdoisong.vn/openai-phat-hanh-phien-ban-open-weight-co-the-chay-tren-laptop-post2149044060.html
댓글 (0)