DeepSeek이 왕좌를 잃었습니다.

알리바바가 출시한 새로운 기술, Qwen3. 사진: SCMP

최신 AI 벤치마크 테스트에 따르면 알리바바가 새롭게 선보인 Qwen3 인공지능 모델이 딥시크의 R1을 넘어 세계 최고 등급의 오픈소스 모델로 등극했습니다.

구체적으로, ChatGPT와 같은 생성형 AI 서비스의 기반 기술인 대규모 언어 모델(LLM)을 평가하는 독립 플랫폼인 LiveBench의 데이터에 따르면 Qwen3가 테스트에서 R1을 넘어섰습니다.

오픈소스 AI 모델의 역량 평가는 프로그래밍, 수학, 데이터 분석 및 언어 교육을 포함합니다.

알리바바는 4월 28일 Qwen3 AI 모델 시리즈를 공개했습니다. 알리바바는 이 챗봇이 경우에 따라 오픈AI나 구글의 최신 모델들과 견줄 만하거나 심지어 능가할 수 있다고 주장합니다.

최대 2350억 개의 파라미터를 가진 Qwen3는 약 2360억 개와 1750억 개의 파라미터를 가진 DeepSeek-V2 및 OpenAI GPT-4와 유사한 성능을 보입니다. 이 모델 시리즈가 출시되면 사용자는 AI 개발 플랫폼인 Hugging Face와 Github에서 오픈 라이선스로 다운로드할 수 있습니다.

회사 측은 Qwen3 컬렉션에 하이브리드 모델이 포함되어 있어 복잡한 문제를 해결하기 위해 추론에 시간을 유연하게 할당하거나 간단한 요청에 신속하게 대응할 수 있다고 밝혔습니다. 이 모델의 추론 기능은 정보 정확성에 대한 자체 검증을 가능하게 하지만, 상당한 시간 지연이 발생합니다.

이 설계 덕분에 사용자는 각 특정 작업에 예산을 적절하게 할당하기 쉽습니다. 또한 이 모델은 전 세계 여러 경쟁업체의 데이터를 학습합니다.

Qwen3는 DeepSeek과 유사한 "전문가 혼합(MoE)" 아키텍처를 사용하여 학습 비용을 크게 줄이면서 계산 성능을 최적화할 수 있습니다. 이 방법은 작업을 여러 개의 개별 부분으로 나누고, 작업을 수행하는 데 필요한 충분한 양의 데이터만 필요로 합니다.

개발팀에 따르면 Qwen3는 최대 119개 언어를 지원하며, 약 36조 개의 토큰(27조 단어에 해당)으로 구성된 데이터셋을 기반으로 학습되었습니다. 학습 데이터는 교과서, 문제-답변 세트, 프로그래밍 코드, AI 생성 데이터 등 다양한 소스에서 가져왔습니다.

오픈 소스 순위에서 1위를 차지했음에도 불구하고, LiveBench의 확장 벤치마크 테스트 결과에 따르면 Qwen3는 여전히 세계 최고 수준의 클로즈드 소스 AI 모델들에 비해 뒤처지는 것으로 나타났습니다. 그중 가장 대표적인 모델로는 OpenAI의 o3, Google의 Gemini Pro 2.5, 그리고 Anthropic의 Claude 3.7 등이 있습니다.

현재 마이크로소프트가 지원하는 가장 진보된 OpenAI 모델인 o3-mini high가 전 세계 AI 모델 순위에서 종합 1위를 차지하고 있습니다.

출처: https://znews.vn/deepseek-bi-soan-ngoi-post1551500.html