DeepSeek از سلطنت خلع شده است.

Qwen3، فناوری جدیدی که توسط علی‌بابا راه‌اندازی شده است. عکس: SCMP .

بر اساس آخرین آزمایش‌های بنچمارک هوش مصنوعی، مدل هوش مصنوعی Qwen3 که به تازگی توسط علی‌بابا منتشر شده، از R1 شرکت DeepSeek پیشی گرفته و به بالاترین امتیاز در بین مدل‌های متن‌باز جهان رسیده است.

به طور خاص، داده‌های LiveBench، یک پلتفرم مستقل که مدل‌های زبانی بزرگ (LLM) را امتیازدهی می‌کند، فناوری بنیادی برای سرویس‌های هوش مصنوعی مولد مانند ChatGPT، نشان می‌دهد که Qwen3 در آزمایش‌ها از R1 پیشی گرفته است.

ارزیابی قابلیت‌های مدل‌های هوش مصنوعی متن‌باز شامل برنامه‌نویسی، ریاضیات، تحلیل داده‌ها و آموزش زبان می‌شود.

علی‌بابا سری مدل‌های هوش مصنوعی Qwen3 خود را در 28 آوریل منتشر کرد. این شرکت ادعا می‌کند که این چت‌بات می‌تواند در برخی موارد با بهترین مدل‌های فعلی OpenAI یا گوگل رقابت کند یا حتی از آنها پیشی بگیرد.

با اندازه‌ای تا ۲۳۵ میلیارد پارامتر، Qwen3 عملکردی قابل مقایسه با DeepSeek-V2 و OpenAI GPT-4 دارد که به ترتیب تقریباً ۲۳۶ میلیارد و ۱۷۵ میلیارد پارامتر دارند. کاربران به زودی می‌توانند پس از انتشار این سری از مدل‌ها، آن را تحت مجوز باز در پلتفرم توسعه هوش مصنوعی Hugging Face و Github دانلود کنند.

این شرکت اظهار داشت که مجموعه Qwen3 شامل مدل‌های ترکیبی است، به این معنی که آنها می‌توانند به صورت انعطاف‌پذیر، زمان را برای استدلال جهت حل مسائل پیچیده یا پاسخ سریع به درخواست‌های ساده اختصاص دهند. در این مدل، قابلیت استدلال امکان تأیید خودکار صحت اطلاعات را فراهم می‌کند، اما این امر با تأخیر زمانی قابل توجهی همراه است.

این طراحی، تخصیص بودجه مناسب به هر وظیفه خاص را برای کاربران آسان می‌کند. علاوه بر این، این مدل از بسیاری از رقبا در سراسر جهان نیز الگوبرداری می‌کند.

با استفاده از معماری «ترکیبی از متخصصان» (MoE) مشابه DeepSeek، Qwen3 می‌تواند عملکرد محاسباتی را بهینه کند و در عین حال تنها کسری از هزینه آموزش را استفاده کند. این روش وظایف را به بخش‌های جداگانه زیادی تقسیم می‌کند و برای انجام آنها فقط به مقدار کافی از داده‌های فشرده نیاز دارد.

طبق گفته تیم توسعه، Qwen3 تا ۱۱۹ زبان را پشتیبانی می‌کند و بر روی مجموعه داده‌ای با نزدیک به ۳۶ تریلیون توکن، معادل ۲۷ تریلیون کلمه، آموزش دیده است. داده‌های آموزشی از منابع مختلفی مانند کتاب‌های درسی، مجموعه‌های پرسش و پاسخ، کد برنامه‌نویسی یا حتی داده‌های تولید شده توسط هوش مصنوعی و غیره تهیه می‌شوند.

با وجود صدرنشینی در رتبه‌بندی‌های متن‌باز، آزمایش بنچمارک گسترده‌ی LiveBench نشان می‌دهد که Qwen3 هنوز از مدل‌های هوش مصنوعی متن‌باز پیشرو در جهان عقب مانده است. برجسته‌ترین این مدل‌ها عبارتند از: o3 از OpenAI، Gemini Pro 2.5 از Google و Claude 3.7 از Anthropic.

در حال حاضر، پیشرفته‌ترین مدل OpenAI که توسط مایکروسافت پشتیبانی می‌شود، یعنی o3-mini high، در صدر رتبه‌بندی کلی مدل‌های هوش مصنوعی در سراسر جهان قرار دارد.

منبع: https://znews.vn/deepseek-bi-soan-ngoi-post1551500.html