این مدل جدید نه تنها تسلط غولهای آمریکایی را به چالش میکشد، بلکه کل بازی را با متنباز تغییر شکل میدهد (تصویر: DS).
این مدل ۶۸۵ میلیارد پارامتر دارد و تحت مجوز متنباز منتشر شده است. نتایج اولیه آزمایش نشان میدهد که عملکرد آن با سیستمهای اختصاصی OpenAI یا Anthropic برابری میکند و رویکرد جدیدی را برای توسعه و توزیع مدلهای پیشرفته هوش مصنوعی ایجاد میکند.
عملکرد و هزینه
اندکی پس از انتشار آن در پلتفرم Hugging Face، DeepSeek V3.1 در آزمون برنامهنویسی Aider امتیاز ۷۱.۶٪ را کسب کرد. از نظر فنی، این مدل قادر به مدیریت زمینههایی تا ۱۲۸۰۰۰ توکن (معادل یک کتاب حدود ۴۰۰ صفحهای) است. این معماری به عنوان یک "ترکیبی" معرفی شده است که عملکردهای مکالمه، استدلال و برنامهنویسی را ادغام میکند.
اندرو کریستینسون، محقق هوش مصنوعی، در شبکه اجتماعی X گفت: «DeepSeek V3.1 در Aider به ۷۱.۶ درصد رسید که حدود ۱ درصد بهتر از Claude Opus 4 است، در حالی که هزینه آن به طور قابل توجهی کمتر است.»
تخمین زده میشود که میانگین هزینه برای انجام یک کار برنامهنویسی با استفاده از نسخه ۳.۱ حدود ۱.۰۱ دلار است، در حالی که سیستمهای معادل میتوانند نزدیک به ۷۰ دلار هزینه داشته باشند.
برخی از توسعهدهندگان جامعه همچنین به وجود چهار «توکن ویژه» در معماری اشاره کردند که به مدل اجازه میدهد جستجوی وب در زمان واقعی را ادغام کرده و فرآیندهای استنتاج پیچیده را مدیریت کند.
این تفاوت به معنای میلیونها دلار صرفهجویی برای کسبوکارهایی است که روزانه هزاران تعامل با هوش مصنوعی را مدیریت میکنند.
مزایای تغییر دهنده بازی
عرضه نسخه ۳.۱ تنها چند هفته پس از اعلام مدلهای جدید توسط OpenAI و Anthropic انجام میشود. با انتخاب رویکرد متنباز، DeepSeek استراتژی متفاوتی را نسبت به بسیاری از شرکتهای آمریکایی که مدلهای هوش مصنوعی را از طریق APIهای پولی تجاریسازی میکنند، دنبال میکند.
برخی معتقدند که در دسترس قرار دادن گسترده قابلیتهای پیشرفته میتواند سازمانها و کسبوکارها را قادر سازد تا سریعتر مستقر شوند، در عین حال مدلهای کسبوکار مبتنی بر انحصار فناوری را نیز به چالش بکشد.
ظهور DeepSeek V3.1 نشان میدهد که هوش مصنوعی پیشرفته نه تنها در حوزه شرکتهای بزرگ، بلکه در گروههای تحقیقاتی کوچکتر نیز قرار دارد.
رقابت در این فضا دیگر محدود به ساخت قدرتمندترین سیستم نیست، بلکه حول محور قابل دسترس و مقرون به صرفه کردن فناوری نیز میچرخد.
در این زمینه، سوال شرکتهای فناوری این است که چگونه میتوانند ارزش تجاری خود را حفظ کنند، در حالی که مدلهای متنباز بیشتری با عملکرد و هزینه رقابتی ظاهر میشوند.
منبع: https://dantri.com.vn/cong-nghe/deepseek-am-tham-ra-phien-ban-ai-moi-20250820121017977.htm






نظر (0)