Qwen3، فناوری جدیدی که توسط علیبابا راهاندازی شده است. عکس: SCMP . |
بر اساس آخرین آزمایشهای بنچمارک دنیای هوش مصنوعی، مدل هوش مصنوعی تازه منتشر شدهی علیبابا، Qwen3، از R1 شرکت DeepSeek پیشی گرفته و به برترین مدل متنباز جهان تبدیل شده است.
به طور خاص، دادههای LiveBench، یک پلتفرم مستقل که مدلهای زبانی بزرگ (LLM) را محک میزند، فناوریای که زیربنای سرویسهای هوش مصنوعی مولد مانند ChatGPT است، نشان میدهد که Qwen3 در آزمایشها از R1 بهتر عمل کرده است.
بررسی قابلیتهای مدلهای هوش مصنوعی متنباز شامل برنامهنویسی، ریاضیات، تحلیل دادهها و آموزش زبان میشود.
سری مدلهای هوش مصنوعی به نام Qwen3 در ۲۸ آوریل توسط علیبابا منتشر شد. این شرکت ادعا میکند که این چتبات میتواند با بهترین مدلهای موجود در OpenAI یا گوگل قابل مقایسه باشد و حتی در برخی موارد از آنها پیشی بگیرد.
با اندازهای تا ۲۳۵ میلیارد پارامتر، Qwen3 با DeepSeek-V2 و OpenAI GPT-4 که به ترتیب حدود ۲۳۶ میلیارد و ۱۷۵ میلیارد پارامتر دارند، برابری میکند. کاربران به زودی میتوانند پس از انتشار این سری از مدلها، آن را تحت مجوز باز در پلتفرم توسعه هوش مصنوعی Hugging Face و Github دانلود کنند.
این شرکت میگوید مجموعه Qwen3 شامل مدلهای ترکیبی است، به این معنی که میتوانند زمان خود را برای استنتاج جهت حل مسائل پیچیده یا پاسخ سریع به درخواستهای ساده، منعطف کنند. در این حالت، استنتاج به مدل اجازه میدهد تا صحت اطلاعات را خودآزمایی کند، اما تأخیر بالایی را متحمل میشود.
این طراحی، تخصیص بودجه مناسب برای هر کار خاص را برای کاربران آسان میکند. علاوه بر این، این مدل از بسیاری از رقبا در سراسر جهان نیز الگوبرداری میکند.
با استفاده از معماری «ترکیبی از متخصصان» (MoE) مشابه DeepSeek، Qwen3 میتواند با کسری از هزینه آموزش، کارایی محاسباتی را به حداکثر برساند. این رویکردی است که یک کار را به بخشهای جداگانه تقسیم میکند و فقط دادههای عمیق کافی را برای اجرا توصیه میکند.
طبق گفته تیم توسعه، Qwen3 تا ۱۱۹ زبان را پشتیبانی میکند و بر روی مجموعه دادهای متشکل از نزدیک به ۳۶۰۰۰ میلیارد توکن، معادل ۲۷۰۰۰ میلیارد کلمه، آموزش دیده است. دادههای آموزشی از منابع مختلفی مانند کتابهای درسی، مجموعههای پرسش و پاسخ، کد برنامهنویسی یا هوش مصنوعی خودساخته گرفته شده است...
با وجود صدرنشینی در رتبهبندیهای متنباز، آزمایشهای گسترده توسط LiveBench نشان میدهد که Qwen3 از مدلهای هوش مصنوعی متنباز پیشرو در جهان، بهویژه o3 از OpenAI، Gemini Pro 2.5 از Google و Claude 3.7 از Anthropic، عقب مانده است.
در حال حاضر، مدل برتر OpenAI با پشتیبانی مایکروسافت، o3-mini high، در صدر رتبهبندی کلی مدلهای هوش مصنوعی در جهان قرار دارد.
منبع: https://znews.vn/deepseek-bi-soan-ngoi-post1551500.html










نظر (0)