알리바바가 출시한 신기술, Qwen3. 사진: SCMP . |
AI 세계의 최신 벤치마크 테스트에 따르면, 알리바바가 새롭게 출시한 인공지능 모델 Qwen3가 DeepSeek의 R1을 제치고 세계에서 가장 높은 순위의 오픈소스 모델이 되었습니다.
구체적으로, ChatGPT와 같은 생성적 AI 서비스의 기반이 되는 기술인 대규모 언어 모델(LLM)을 벤치마킹하는 독립 플랫폼인 LiveBench의 데이터에 따르면 Qwen3가 테스트에서 R1보다 우수한 성능을 보였습니다.
오픈 소스 AI 모델 기능에 대한 검토에는 프로그래밍, 수학, 데이터 분석, 언어 교육이 포함됩니다.
알리바바는 4월 28일 Qwen3라는 AI 모델 시리즈를 출시했습니다. 알리바바는 이 챗봇이 어떤 경우에는 OpenAI나 구글에서 현재 제공하는 최고 모델과 비슷하거나 더 뛰어날 수도 있다고 주장합니다.
최대 2,350억 개의 매개변수를 처리할 수 있는 Qwen3는 각각 약 2,360억 개와 1,750억 개의 매개변수를 처리하는 DeepSeek-V2와 OpenAI GPT-4와 비슷한 수준입니다. 모델 시리즈가 출시되면 사용자들은 AI 개발 플랫폼 Hugging Face와 Github에서 오픈 라이선스로 Qwen3를 다운로드할 수 있습니다.
Qwen3 컬렉션에는 하이브리드 모델이 포함되어 있어 복잡한 문제를 해결하거나 간단한 요청에 신속하게 대응하기 위해 추론 시간을 유연하게 조절할 수 있다고 회사 측은 설명합니다. 이 경우 추론을 통해 모델이 정보의 정확성을 자체적으로 확인할 수 있지만, 지연 시간이 길어집니다.
이러한 설계를 통해 사용자는 각 작업에 적합한 예산을 쉽게 할당할 수 있습니다. 또한, 이 모델은 전 세계 여러 경쟁사로부터 학습을 거칩니다.
Qwen3는 DeepSeek와 유사한 "전문가 혼합(MoE)" 아키텍처를 사용하여 학습 비용의 일부만으로 연산 효율성을 극대화할 수 있습니다. 이는 작업을 여러 부분으로 나누고 수행할 만큼 충분한 심층 데이터만 추천하는 방식입니다.
개발팀에 따르면 Qwen3는 최대 119개 언어를 지원하며, 약 36조 개의 토큰(27조 단어에 해당)으로 구성된 데이터 세트를 기반으로 학습됩니다. 학습 데이터는 교과서, 질의응답 세트, 프로그래밍 코드, 자체 생성 AI 등 다양한 출처에서 수집됩니다.
오픈소스 순위에서 1위를 차지했음에도 불구하고 LiveBench의 광범위한 테스트에 따르면 Qwen3는 세계 최고의 폐쇄소스 AI 모델, 특히 OpenAI의 o3, Google의 Gemini Pro 2.5, Anthropic의 Claude 3.7보다 뒤처지는 것으로 나타났습니다.
현재 Microsoft가 지원하는 OpenAI의 최고급 모델인 o3-mini high가 전 세계 AI 모델 순위에서 1위를 차지하고 있습니다.
출처: https://znews.vn/deepseek-bi-soan-ngoi-post1551500.html










댓글 (0)