دیپسیک به جای حضور مکرر در رسانهها، بر تحقیق و توسعه مدلهای جدید تمرکز دارد. عکس: SCMP |
شرکت DeepSeek با همکاری محققان دانشگاه Tsinghua، روش جدیدی را برای بهبود قابلیتهای استنتاج مدلهای زبانی بزرگ (LLM) معرفی کرده است. این روش که در یک مقاله تحقیقاتی در عصر ۴ آوریل منتشر شد، به LLMها کمک میکند تا نتایج بهتر و سریعتری برای پرسوجوهای رایج تولید کنند.
این تکنیک دو روش موفق قبلی از DeepSeek را ترکیب میکند. یکی مدلسازی پاداش مولد (GRM) است که به مدل هوش مصنوعی اجازه میدهد تا پاسخهای خود را بر اساس نتایج قبلی خودارزیابی و اصلاح کند و دیگری تنظیم انتقاد خودمحور است.
هر دو روش بر جنبه «خودآموزی» هوش مصنوعی تکیه دارند و وابستگی به بازخورد یا راهنمایی مستقیم انسان را کاهش میدهند، اما با هدف ارائه نتایجی که به انتظارات انسان نزدیکتر هستند.
به گفته محققان، با وجود اینکه DeepSeek-GRM یک روش جدید است، به نتایج برجستهای دست مییابد و با شناختهشدهترین و مؤثرترین مدلهای هوش مصنوعی موجود در حال حاضر رقابت میکند. DeepSeek قصد دارد مدلهای GRM را متنباز کند، اما هیچ بازه زمانی مشخصی برای آن ارائه نشده است.
پس از ایجاد تأثیر جهانی با مدل پلتفرم V3 و مدل استنتاج R1، DeepSeek این مقاله دانشگاهی را در آرشیو علمی آنلاین arXiv منتشر کرد و کنجکاوی در مورد حرکت بعدی این شرکت را برانگیخت.
رویترز پیشبینی میکند که با توجه به محبوبیت مداوم مدل قبلی، DeepSeek-R2، جانشین R1، میتواند در ماه آوریل عرضه شود. DeepSeek-R1 پیش از این به لطف عملکرد برتر نسبت به هزینه، در دنیای فناوری توجه جهانی را به خود جلب کرده بود و آن را با مدلهای پیشرو فعلی رقابتپذیر میکرد.
دیپسیک در مورد این شایعات سکوت کرده است. با این حال، طبق منابع محلی، یک حساب کاربری خدمات مشتریان دیپسیک در یک چت گروهی با مشتریان سازمانی، این اطلاعات را تکذیب کرده است.
شرکت DeepSeek که در سال ۲۰۲۳ توسط کارآفرین لیانگ ونفنگ در هانگژو تأسیس شد، در چند ماه گذشته به سرعت توجه جهانی را به خود جلب کرده است. اما این شرکت به جای بهرهبرداری از شهرت عمومی خود، منابع خود را بر تحقیق و توسعه متمرکز کرده است.
پیش از این، DeepSeek مدل V3 خود را ارتقا داده و نسخه DeepSeek-V3-0324 را منتشر کرده بود. طبق این اطلاعیه، این بهروزرسانی شامل قابلیتهای استدلال پیشرفته، بهینهسازی برای توسعه رابط کاربری وب front-end و بهبود مهارتهای نوشتاری چینی است.
در ماه فوریه، این استارتاپ همچنین پنج مخزن کد را متنباز کرد و تعهد خود را به «پیشرفت با شفافیت کامل» تأیید کرد. همچنین در همان ماه، این شرکت از یک مطالعه فنی در مورد «توجه پراکنده بومی» خبر داد که به بهبود عملکرد LLMها در مدیریت حجم عظیمی از دادهها کمک میکند.
دیپسیک به عنوان نمادی از پویایی صنعت هوش مصنوعی چین دیده میشود، آن هم در زمانی که ایالات متحده در تلاش است تا توسعه فناوری این کشور را مهار کند.
منبع: https://znews.vn/deepseek-gay-to-mo-post1543900.html






نظر (0)