مدل Qwen-3-Max-Preview بیش از یک تریلیون پارامتر دارد. عکس: رویترز . |
گروه هلدینگ علیبابا به تازگی بزرگترین مدل هوش مصنوعی خود تا به امروز را منتشر کرده است که گامی جدید در رقابت جهانی هوش مصنوعی محسوب میشود. این مدل که Qwen-3-Max-Preview نام دارد، اولین مدل از این گروه فناوری چینی است که از آستانه یک تریلیون پارامتر عبور کرده و علیبابا را در ردیف «غولهایی» مانند OpenAI، Google DeepMind یا Anthropic قرار میدهد.
مدل جدید که در ۵ سپتامبر منتشر شد، اکنون در Alibaba Cloud و بازار اصلی مدلهای زبانی OpenRouter در دسترس است. Qwen-3-Max-Preview دنبالهروی سری Qwen3 است که اولین بار در ماه مه با نسخههایی از ۶۰۰ میلیون تا ۲۳۵ میلیارد پارامتر معرفی شد.
در هوش مصنوعی، پارامترها به عنوان «هوش» یک سیستم در نظر گرفته میشوند، متغیرهایی که در طول آموزش تنظیم میشوند. تعداد بیشتر پارامترها معمولاً به معنای قابلیتهای قدرتمندتر است، اما به قدرت محاسباتی عظیمی نیز نیاز دارد. برای مقایسه، تخمین زده میشود که GPT-4.5 از OpenAI، یکی از بزرگترین مدلهای موجود امروز، 5 تا 7 تریلیون پارامتر داشته باشد.
طبق این اطلاعیه، Qwen-3-Max-Preview یک مدل پردازش متن است که از Qwen3-235B-A22B-2507 عملکرد بهتری دارد. در آزمایشهای داخلی، Qwen-3-Max-Preview از Kimi K2 از MoonShot AI، نسخه غیر استنتاجی Claude Opus 4، و DeepSeek V3.1 که از فرمت Anthropic پشتیبانی میکند، عملکرد بهتری داشته است. با این حال، این معیارها در گزارش فنی رسمی گنجانده نشدهاند.
علیبابا در بیانیهای اعلام کرد: «Qwen-3-Max-Preview پیشرفتهای چشمگیری در قابلیتهای کلی، از درک متن چینی و انگلیسی گرفته تا انجام دستورالعملهای پیچیده، مدیریت وظایف ذهنی، پشتیبانی از چندین زبان و استفاده از ابزارها، نشان میدهد. این توسعه هنوز ادامه دارد و انتشار رسمی آن شگفتیهای بیشتری را به همراه خواهد داشت.»
در طول این سالها، Qwen به Alibaba کمک کرده است تا در اکوسیستم هوش مصنوعی متنباز جهانی برجسته شود. این مدلها به بیش از 20 میلیون دانلود رسیدهاند و 100000 مدل مشتق شده در پلتفرم Hugging Face ایجاد کردهاند. با این حال، Qwen-3-Max-Preview متنباز نیست. کاربران فقط میتوانند از طریق Alibaba Cloud یا OpenRouter به آن دسترسی داشته باشند، مشابه Qwen2.5-Max.
بینیوان هوی، مهندس هوش مصنوعی در علیبابا، در رسانههای اجتماعی فاش کرد که نسخه «استدلالی» این مدل هنوز در دست توسعه است.
هزینه دسترسی به Qwen-3-Max-Preview در Alibaba Cloud نیز جزو بالاترین هزینهها در خانواده Qwen است. قیمت اولیه 0.861 دلار برای هر میلیون توکن ورودی و 3.441 دلار برای هر میلیون توکن خروجی است. در همین حال، نسخه Qwen3-235B-A22B-2507 تنها 0.287 دلار برای هر میلیون توکن ورودی و 1.147 دلار برای هر میلیون توکن خروجی هزینه دارد.
منبع: https://znews.vn/alibaba-cong-bo-mo-hinh-thach-thuc-openai-post1583459.html
نظر (0)