Qwen3، فناوری جدیدی که توسط علیبابا راهاندازی شده است. عکس: SCMP . |
بر اساس آخرین آزمایشهای بنچمارک هوش مصنوعی، مدل هوش مصنوعی Qwen3 که به تازگی توسط علیبابا منتشر شده، از R1 شرکت DeepSeek پیشی گرفته و به بالاترین امتیاز در بین مدلهای متنباز جهان رسیده است.
به طور خاص، دادههای LiveBench، یک پلتفرم مستقل که مدلهای زبانی بزرگ (LLM) را امتیازدهی میکند، فناوری بنیادی برای سرویسهای هوش مصنوعی مولد مانند ChatGPT، نشان میدهد که Qwen3 در آزمایشها از R1 پیشی گرفته است.
ارزیابی قابلیتهای مدلهای هوش مصنوعی متنباز شامل برنامهنویسی، ریاضیات، تحلیل دادهها و آموزش زبان میشود.
علیبابا سری مدلهای هوش مصنوعی Qwen3 خود را در 28 آوریل منتشر کرد. این شرکت ادعا میکند که این چتبات میتواند در برخی موارد با بهترین مدلهای فعلی OpenAI یا گوگل رقابت کند یا حتی از آنها پیشی بگیرد.
با اندازهای تا ۲۳۵ میلیارد پارامتر، Qwen3 عملکردی قابل مقایسه با DeepSeek-V2 و OpenAI GPT-4 دارد که به ترتیب تقریباً ۲۳۶ میلیارد و ۱۷۵ میلیارد پارامتر دارند. کاربران به زودی میتوانند پس از انتشار این سری از مدلها، آن را تحت مجوز باز در پلتفرم توسعه هوش مصنوعی Hugging Face و Github دانلود کنند.
این شرکت اظهار داشت که مجموعه Qwen3 شامل مدلهای ترکیبی است، به این معنی که آنها میتوانند به صورت انعطافپذیر، زمان را برای استدلال جهت حل مسائل پیچیده یا پاسخ سریع به درخواستهای ساده اختصاص دهند. در این مدل، قابلیت استدلال امکان تأیید خودکار صحت اطلاعات را فراهم میکند، اما این امر با تأخیر زمانی قابل توجهی همراه است.
این طراحی، تخصیص بودجه مناسب به هر وظیفه خاص را برای کاربران آسان میکند. علاوه بر این، این مدل از بسیاری از رقبا در سراسر جهان نیز الگوبرداری میکند.
با استفاده از معماری «ترکیبی از متخصصان» (MoE) مشابه DeepSeek، Qwen3 میتواند عملکرد محاسباتی را بهینه کند و در عین حال تنها کسری از هزینه آموزش را استفاده کند. این روش وظایف را به بخشهای جداگانه زیادی تقسیم میکند و برای انجام آنها فقط به مقدار کافی از دادههای فشرده نیاز دارد.
طبق گفته تیم توسعه، Qwen3 تا ۱۱۹ زبان را پشتیبانی میکند و بر روی مجموعه دادهای با نزدیک به ۳۶ تریلیون توکن، معادل ۲۷ تریلیون کلمه، آموزش دیده است. دادههای آموزشی از منابع مختلفی مانند کتابهای درسی، مجموعههای پرسش و پاسخ، کد برنامهنویسی یا حتی دادههای تولید شده توسط هوش مصنوعی و غیره تهیه میشوند.
با وجود صدرنشینی در رتبهبندیهای متنباز، آزمایش بنچمارک گستردهی LiveBench نشان میدهد که Qwen3 هنوز از مدلهای هوش مصنوعی متنباز پیشرو در جهان عقب مانده است. برجستهترین این مدلها عبارتند از: o3 از OpenAI، Gemini Pro 2.5 از Google و Claude 3.7 از Anthropic.
در حال حاضر، پیشرفتهترین مدل OpenAI که توسط مایکروسافت پشتیبانی میشود، یعنی o3-mini high، در صدر رتبهبندی کلی مدلهای هوش مصنوعی در سراسر جهان قرار دارد.
منبع: https://znews.vn/deepseek-bi-soan-ngoi-post1551500.html






نظر (0)