알리바바가 출시한 신기술, Qwen3. 사진: SCMP . |
AI계의 최신 벤치마크 테스트에 따르면, 알리바바가 새롭게 출시한 인공지능 모델 Qwen3가 DeepSeek의 R1을 제치고 세계에서 가장 높은 순위의 오픈소스 모델이 되었습니다.
구체적으로, ChatGPT와 같은 생성 AI 서비스의 기반 기술인 대규모 언어 모델(LLM)을 벤치마킹하는 독립 플랫폼인 LiveBench의 데이터에 따르면 Qwen3가 테스트에서 R1보다 우수한 성능을 보였습니다.
이 리뷰에서는 프로그래밍, 수학, 데이터 분석, 언어 교육을 포함한 오픈 소스 AI 모델의 역량을 평가합니다.
알리바바는 4월 28일 Qwen3라는 AI 모델 시리즈를 출시했습니다. 알리바바는 이 챗봇이 어떤 경우에는 OpenAI나 구글에서 현재 제공하는 최고 모델과 비슷하거나 더 뛰어날 수도 있다고 주장합니다.
최대 2,350억 개의 매개변수를 가진 Qwen3는 각각 약 2,360억 개와 1,750억 개의 매개변수를 가진 DeepSeek-V2와 OpenAI GPT-4와 동등합니다. 모델 시리즈가 출시되면 사용자들은 AI 개발 플랫폼 Hugging Face와 Github에서 오픈 라이선스로 Qwen3를 다운로드할 수 있습니다.
Qwen3 컬렉션에는 하이브리드 모델이 포함되어 있어 복잡한 문제를 해결하거나 간단한 요청에 신속하게 대응하기 위해 유연한 추론을 수행할 수 있다고 회사 측은 설명합니다. 이 경우, 추론 기능을 통해 모델은 정보의 정확성을 자체적으로 확인할 수 있지만, 지연 시간이 길어질 수 있습니다.
이러한 설계를 통해 사용자는 각 작업에 적합한 예산을 쉽게 할당할 수 있습니다. 또한, 이 모델은 전 세계 여러 경쟁사로부터 학습합니다.
Qwen3는 DeepSeek와 유사한 "전문가 혼합(MoE)" 아키텍처를 사용하여 학습 비용의 극히 일부만으로 연산 효율성을 극대화할 수 있습니다. 이는 작업을 여러 부분으로 나누고 해당 작업을 수행하는 데 필요한 심층 데이터 양만 추천하는 방식입니다.
개발팀에 따르면 Qwen3는 최대 119개 언어를 지원하며, 약 36조 개의 토큰(27조 단어에 해당)으로 구성된 데이터 세트를 기반으로 학습됩니다. 학습 데이터는 교과서, 질의응답 세트, 프로그래밍 코드, 자체 생성 AI 등 다양한 출처에서 수집됩니다.
오픈소스 순위에서 1위를 차지했음에도 불구하고 LiveBench의 광범위한 테스트 결과, Qwen3는 여전히 세계 최고의 폐쇄소스 AI 모델, 특히 OpenAI의 o3, Google의 Gemini Pro 2.5, Anthropic의 Claude 3.7에 비해 뒤처진 것으로 나타났습니다.
현재 Microsoft가 지원하는 OpenAI의 최고급 모델인 o3-mini high가 전 세계 AI 모델 순위에서 1위를 차지하고 있습니다.
출처: https://znews.vn/deepseek-bi-soan-ngoi-post1551500.html
댓글 (0)