알리바바가 출시한 신기술, Qwen3. 사진: 로이터 . |
4월 28일, 중국 기술 대기업 알리바바가 Qwen3이라는 일련의 AI 모델을 출시했습니다. 이 회사는 이 챗봇이 어떤 경우에는 OpenAI나 Google의 최신 최고 모델과 동등하거나 더 나은 성능을 낼 수 있다고 주장합니다.
최대 2,350억 개의 매개변수를 가진 Qwen3의 성능은 각각 약 2,360억 개와 1,750억 개의 매개변수를 가진 DeepSeek-V2와 OpenAI GPT-4와 동등합니다. 이 모델 시리즈가 출시되면 사용자들은 Hugging Face AI 개발 플랫폼과 Github에서 오픈 라이선스로 이를 다운로드할 수 있게 됩니다.
이 회사에 따르면 Qwen3 컬렉션에는 하이브리드 모델이 포함되어 있어 복잡한 문제를 추론하거나 간단한 요청에 빠르게 대응하기 위해 시간을 유연하게 조절할 수 있습니다. 이 경우 추론 능력은 모델이 정보의 정확성을 스스로 확인하는 데 도움이 되지만 높은 지연 시간이 발생합니다.
이러한 디자인을 통해 사용자는 각각의 특정 작업에 적합한 예산을 쉽게 할당할 수 있습니다. 또한 이 모델은 전 세계의 많은 경쟁자로부터도 학습합니다.
Qwen3는 DeepSeek와 동일한 "전문가 혼합"(MoE) 아키텍처를 사용하여 계산 효율성을 최적화하면서도 학습 비용의 일부만 사용합니다. 이는 작업을 여러 부분으로 나누고 이를 수행하는 데 필요한 심층적인 데이터만 제안하는 방법입니다.
개발팀에 따르면 Qwen3는 최대 119개 언어를 지원하고 약 36조 개의 토큰, 즉 27조 개의 단어로 구성된 데이터 세트를 기반으로 학습됩니다. 훈련 데이터는 교과서, 질문-답변 세트, 프로그래밍 코드 등 다양한 출처에서 가져오거나 AI에서 생성됩니다.
이러한 개선 사항과 그 외 여러 가지 개선 사항을 통해 이 챗봇은 이전 모델인 Qwen2에 비해 성능이 크게 향상되었습니다. Techcrunch는 Qwen 3가 OpenAI의 o3나 o4-mini 등 최근 최고 모델보다 성능이 뛰어나지는 않지만 여전히 인상적인 성능을 보여준다고 언급했습니다.
![]() |
평가 시험의 점수를 비교합니다. 사진: Qwen/X. |
컬렉션에서 가장 큰 모델인 Qwen-3-235B-A22B는 인기 있는 프로그래밍 경연 플랫폼인 Codeforces 에서 OpenAI의 o3-mini와 Google의 Gemini 2.5 Pro를 이겼습니다. 또한 이 소프트웨어는 모델의 추론 능력을 평가하는 AIME 및 BFCL 난이도 테스트에서도 o3-mini보다 우수한 성능을 보였습니다.
Qwen-3-235B-A22B는 아직 공식적으로 대중에게 출시되지 않았습니다. 이 기간 동안 사용자는 Qwen3-32B를 다운로드할 수 있습니다. 이 모델은 LiveCodeBench 프로그래밍 테스트를 포함한 여러 벤치마크에서 OpenAI의 o1보다 우수한 성능을 보였습니다.
알리바바는 Qwen3가 도구 호출, 지침 준수 및 데이터 형식의 정확한 복제 측면에서 뛰어나다고 말합니다. 이 요소는 다른 많은 도구에 없는 요소입니다. 카네기 멜론 대학의 연구에 따르면, 많은 AI가 구체적인 요청을 받았음에도 불구하고 정보를 조작하고 형식을 변경하는 것으로 나타났습니다.
위 플랫폼에서 다운로드하는 것 외에도 사용자는 Fireworks AI 및 Hyperbolic과 같은 클라우드 서비스 제공업체를 통해 Qwen3를 찾을 수 있습니다. 이를 통해 대기업과 중소기업, 개인 개발자 모두 장벽을 넘어 접근하고 실험할 수 있습니다.
Qwen과 같은 일부 중국 AI의 등장으로 미국 연구실은 압박을 받고 있으며, 이로 인해 더욱 강력한 기술을 개발해야 하는 상황이 되었습니다. 그 결과, 해당 국가의 정책 입안자들은 중국의 칩 접근을 제한하는 제한 조치를 제정했습니다.
클라우드 AI 호스팅 회사 Baseten의 CEO인 투힌 스리바스타바는 Qwen3가 오픈 소스 모델이 OpenAI와 같은 폐쇄 소스 시스템을 따라잡고 있는 또 다른 예라고 말했습니다.
미국 정부 의 제한에도 불구하고 Qwen3는 국내에서는 여전히 널리 사용될 것입니다. 그는 "이것은 중국 기술 기업이 Anthropic 및 OpenAI와 같은 기존 모델에 의존하는 것 외에도 자체 소프트웨어를 개발할 수 있음을 보여줍니다."라고 말했습니다.
출처: https://znews.vn/them-loat-ai-manh-me-tu-trung-quoc-post1549756.html
댓글 (0)