تركز شركة DeepSeek على البحث والتطوير لنماذج جديدة، بدلاً من الظهور المتكرر في وسائل الإعلام. الصورة: SCMP . |
بالتعاون مع باحثين من جامعة تسينغهوا، قدمت شركة DeepSeek طريقة جديدة لتحسين قدرات الاستدلال لنماذج اللغة الكبيرة (LLMs). وتساعد هذه الطريقة، التي نُشرت في ورقة بحثية مساء يوم 4 أبريل، نماذج اللغة الكبيرة على إنتاج نتائج أفضل وأسرع للاستعلامات الشائعة.
تجمع هذه التقنية بين طريقتين ناجحتين سابقتين من DeepSeek. الأولى هي نمذجة المكافأة التوليدية (GRM)، والتي تسمح لنموذج الذكاء الاصطناعي بتقييم نفسه وتحسين استجاباته بناءً على النتائج السابقة، والأخرى هي ضبط النقد الذاتي.
تعتمد كلتا الطريقتين على جانب "التعلم الذاتي" للذكاء الاصطناعي، مما يقلل الاعتماد على التغذية الراجعة أو التوجيه البشري المباشر، ولكن بهدف تقديم نتائج أقرب إلى التوقعات البشرية.
بحسب الباحثين، على الرغم من حداثة أسلوب DeepSeek-GRM، إلا أنه يحقق نتائج باهرة وينافس أشهر نماذج الذكاء الاصطناعي وأكثرها فعاليةً المتوفرة حاليًا. وتعتزم DeepSeek إتاحة نماذج GRM كمصدر مفتوح، ولكن لم يُحدد موعد زمني لذلك.
بعد أن أحدثت شركة DeepSeek تأثيراً عالمياً من خلال نموذج منصتها V3 ونموذج الاستدلال R1، نشرت هذه الورقة الأكاديمية على الأرشيف العلمي عبر الإنترنت arXiv، مما أثار الفضول حول الخطوة التالية للشركة.
تتوقع رويترز إطلاق جهاز DeepSeek-R2، خليفة جهاز R1، في أبريل، نظراً للشعبية المستمرة التي يحظى بها سلفه. وقد أحدث جهاز DeepSeek-R1 ضجة عالمية في عالم التكنولوجيا بفضل أدائه المتميز مقارنةً بتكلفته، مما جعله منافساً قوياً للنماذج الرائدة الحالية.
التزمت شركة DeepSeek الصمت حيال الشائعات. ومع ذلك، ووفقًا لمصادر محلية، نفى حساب خدمة عملاء DeepSeek هذه المعلومات في محادثة جماعية مع عملاء من الشركات.
تأسست شركة DeepSeek في مدينة هانغتشو عام 2023 على يد رجل الأعمال ليانغ وينفنغ، وسرعان ما حظيت باهتمام عالمي واسع خلال الأشهر القليلة الماضية. ولكن بدلاً من استغلال شهرتها، تركز الشركة مواردها على البحث والتطوير.
في السابق، قامت شركة DeepSeek بتحديث نموذجها V3، حيث أصدرت الإصدار DeepSeek-V3-0324. ووفقًا للإعلان، يتميز هذا التحديث بقدرات استدلال محسّنة، وتحسين لتطوير واجهة المستخدم الأمامية للويب، ومهارات كتابة صينية محسّنة.
في فبراير، قامت الشركة الناشئة أيضًا بفتح خمسة مستودعات للبرمجيات مفتوحة المصدر، مؤكدة التزامها بـ "التقدم بشفافية كاملة". وفي نفس الشهر، أعلنت الشركة عن دراسة تقنية حول "الانتباه المتفرق الأصلي"، والذي يساعد على تحسين أداء نماذج التعلم الموجه في التعامل مع كميات هائلة من البيانات.
يُنظر إلى DeepSeek على أنه رمز لديناميكية صناعة الذكاء الاصطناعي في الصين، في الوقت الذي تحاول فيه الولايات المتحدة كبح التطور التكنولوجي للبلاد.
المصدر: https://znews.vn/deepseek-gay-to-mo-post1543900.html






تعليق (0)