OpenAI는 2019년 GPT-2를 출시한 이후 처음으로 두 개의 개방형 가중치 언어 모델을 8월 5일에 발표했습니다.
인공 지능 모델은 매개변수(즉, 학습 중 출력과 예측을 개선하는 데 도움이 되는 요소)가 공개적으로 사용 가능한 경우 개방형 가중치로 간주됩니다.
오픈 가중치 모델은 투명성과 통제력을 제공할 수 있지만, 전체 소스 코드를 누구나 사용하고 수정할 수 있도록 공개하는 오픈 소스 모델과는 다릅니다.
OpenAI에 따르면, gpt-oss-120b와 gpt-oss-20b라는 텍스트 전용 모델은 개발자, 연구자, 기업에 운영과 사용자 정의가 쉬운 저렴한 옵션을 제공하도록 설계되었습니다.
OpenAI의 두 가지 새로운 모델 모두 고급 추론, 도구 사용 및 신경망 처리 작업을 처리할 수 있습니다. 소비자용 하드웨어부터 클라우드 플랫폼, 온디바이스 애플리케이션까지 어디에서나 실행되도록 설계되었습니다.
OpenAI에 따르면 사용자는 노트북에서 gpt-oss-20b를 실행하여 파일을 검색하고 쓸 수 있는 개인 비서처럼 사용할 수 있다고 합니다.
이 회사는 다양한 칩에서 이러한 모델이 잘 작동하도록 보장하기 위해 Nvidia, Advanced Micro Devices(AMD), Cerebras 및 Groq와 협력했습니다.
OpenAI가 공개 가중치 모델을 출시할 것이라는 기대가 컸는데, 그 이유는 회사가 추가 안전 테스트를 실시하고 고위험 지역을 검토하는 데 시간이 더 필요하기 때문에 출시를 반복적으로 연기해 왔기 때문입니다.
OpenAI는 8월 5일, 자사의 개방형 중량 모델에 대한 광범위한 훈련 및 안전 테스트를 수행했다고 밝혔습니다. 사전 훈련 단계에서 유해한 화학, 생물, 방사선 및 핵 데이터를 걸러내고, 악의적인 행위자가 악의적인 목적으로 모델을 미세 조정하는 방식을 시뮬레이션했습니다.
OpenAI는 또한 이 악의적인 조정 프로세스에 대한 평가에 대한 피드백을 얻기 위해 세 개의 독립적인 전문가 그룹과 협력했다고 밝혔습니다.
최근 몇 년 동안 Meta, Microsoft가 지원하는 Mistral AI, 중국 스타트업 DeepSeek 등 여러 기술 회사도 공개 가중치 모델을 출시했습니다.
출처: https://www.vietnamplus.vn/openai-lan-dau-phat-hanh-mo-hinh-ai-trong-so-mo-ke-tu-nam-2019-post1054037.vnp
댓글 (0)