DeepSeek کنجکاوی را برمی‌انگیزد.

دیپ‌سیک به جای حضور مکرر در رسانه‌ها، بر تحقیق و توسعه مدل‌های جدید تمرکز دارد. عکس: SCMP

شرکت DeepSeek با همکاری محققان دانشگاه Tsinghua، روش جدیدی را برای بهبود قابلیت‌های استنتاج مدل‌های زبانی بزرگ (LLM) معرفی کرده است. این روش که در یک مقاله تحقیقاتی در عصر ۴ آوریل منتشر شد، به LLMها کمک می‌کند تا نتایج بهتر و سریع‌تری برای پرس‌وجوهای رایج تولید کنند.

این تکنیک دو روش موفق قبلی از DeepSeek را ترکیب می‌کند. یکی مدل‌سازی پاداش مولد (GRM) است که به مدل هوش مصنوعی اجازه می‌دهد تا پاسخ‌های خود را بر اساس نتایج قبلی خودارزیابی و اصلاح کند و دیگری تنظیم انتقاد خودمحور است.

هر دو روش بر جنبه «خودآموزی» هوش مصنوعی تکیه دارند و وابستگی به بازخورد یا راهنمایی مستقیم انسان را کاهش می‌دهند، اما با هدف ارائه نتایجی که به انتظارات انسان نزدیک‌تر هستند.

به گفته محققان، با وجود اینکه DeepSeek-GRM یک روش جدید است، به نتایج برجسته‌ای دست می‌یابد و با شناخته‌شده‌ترین و مؤثرترین مدل‌های هوش مصنوعی موجود در حال حاضر رقابت می‌کند. DeepSeek قصد دارد مدل‌های GRM را متن‌باز کند، اما هیچ بازه زمانی مشخصی برای آن ارائه نشده است.

پس از ایجاد تأثیر جهانی با مدل پلتفرم V3 و مدل استنتاج R1، DeepSeek این مقاله دانشگاهی را در آرشیو علمی آنلاین arXiv منتشر کرد و کنجکاوی در مورد حرکت بعدی این شرکت را برانگیخت.

رویترز پیش‌بینی می‌کند که با توجه به محبوبیت مداوم مدل قبلی، DeepSeek-R2، جانشین R1، می‌تواند در ماه آوریل عرضه شود. DeepSeek-R1 پیش از این به لطف عملکرد برتر نسبت به هزینه، در دنیای فناوری توجه جهانی را به خود جلب کرده بود و آن را با مدل‌های پیشرو فعلی رقابت‌پذیر می‌کرد.

دیپ‌سیک در مورد این شایعات سکوت کرده است. با این حال، طبق منابع محلی، یک حساب کاربری خدمات مشتریان دیپ‌سیک در یک چت گروهی با مشتریان سازمانی، این اطلاعات را تکذیب کرده است.

شرکت DeepSeek که در سال ۲۰۲۳ توسط کارآفرین لیانگ ونفنگ در هانگژو تأسیس شد، در چند ماه گذشته به سرعت توجه جهانی را به خود جلب کرده است. اما این شرکت به جای بهره‌برداری از شهرت عمومی خود، منابع خود را بر تحقیق و توسعه متمرکز کرده است.

پیش از این، DeepSeek مدل V3 خود را ارتقا داده و نسخه DeepSeek-V3-0324 را منتشر کرده بود. طبق این اطلاعیه، این به‌روزرسانی شامل قابلیت‌های استدلال پیشرفته، بهینه‌سازی برای توسعه رابط کاربری وب front-end و بهبود مهارت‌های نوشتاری چینی است.

در ماه فوریه، این استارتاپ همچنین پنج مخزن کد را متن‌باز کرد و تعهد خود را به «پیشرفت با شفافیت کامل» تأیید کرد. همچنین در همان ماه، این شرکت از یک مطالعه فنی در مورد «توجه پراکنده بومی» خبر داد که به بهبود عملکرد LLMها در مدیریت حجم عظیمی از داده‌ها کمک می‌کند.

دیپ‌سیک به عنوان نمادی از پویایی صنعت هوش مصنوعی چین دیده می‌شود، آن هم در زمانی که ایالات متحده در تلاش است تا توسعه فناوری این کشور را مهار کند.

منبع: https://znews.vn/deepseek-gay-to-mo-post1543900.html