تظهر الاختبارات البرمجية والرياضية أن أداء S1 (اسم النموذج) يتساوى مع أداء نماذج الذكاء الاصطناعي المتطورة مثل o1 من OpenAI و R1 من DeepSeek.

من الجدير بالذكر أن S1 هو نموذج مفتوح المصدر، ومتاح على مستودع GitHub ليتمكن أي شخص من الوصول إليه.

وأوضح فريق التطوير أنهم بدأوا من نموذج أساسي متاح، ثم قاموا بتحسينه من خلال "التقطير" - عملية استخراج القدرة على "التفكير" من نموذج ذكاء اصطناعي آخر من خلال التدريب على إجاباته.

على وجه التحديد، S1 مُستخلص من نموذج جوجل التجريبي للتفكير السريع جيميني 2.0. عملية الاستخلاص مشابهة لتلك التي اتبعها علماء جامعة بيركلي لإنشاء النموذج بتكلفة حوالي 450 دولارًا أمريكيًا (حوالي 11.3 مليون دونج فيتنامي).

جيتي إيماجيس 1168836247 1.jpg.jpeg
DeepSeek تفتح باب المنافسة لتطوير ذكاء اصطناعي رخيص. الصورة: TechCrunch

توصل الباحثون وراء s1 إلى أبسط طريقة لتحقيق أداء قوي في التفكير و"التوسع أثناء الاختبار"، مما يعني السماح لنموذج الذكاء الاصطناعي بالتفكير أكثر قبل الإجابة على سؤال.

وهذا أحد الإنجازات التي حققتها OpenAI في o1، والتي حاولت DeepSeek ومختبرات الذكاء الاصطناعي الأخرى تكرارها من خلال تقنيات مختلفة.

تُظهِر ورقة S1 أنه من الممكن تقطير نماذج التفكير باستخدام مجموعة بيانات صغيرة إلى حد ما من خلال عملية تسمى الضبط الدقيق الخاضع للإشراف (SFT)، حيث يتم توجيه نموذج الذكاء الاصطناعي بشكل صريح لمحاكاة سلوكيات معينة في مجموعة البيانات.

تعتبر SFT عمومًا أرخص من نهج التعلم التعزيزي واسع النطاق الذي استخدمته DeepSeek لتدريب نموذج R1.

توفر Google إمكانية الوصول المجاني إلى Gemini 2.0 Flash Thinking Experimental، وإن كان ذلك بحد تردد يومي، عبر منصة Google AI Studio.

ومع ذلك، تحظر شروط جوجل إجراء هندسة عكسية لنماذجها لتطوير خدمات تتنافس مع منتجات الذكاء الاصطناعي الخاصة بالشركة.

يعتمد S1 على نموذج ذكاء اصطناعي صغير متاح للتنزيل مجانًا من مختبر الذكاء الاصطناعي Qwen التابع لشركة علي بابا. لتدريب S1، أنشأ الباحثون مجموعة بيانات تضم 1000 سؤال مُختار بعناية، بالإضافة إلى إجاباتها وعملية التفكير وراء كل إجابة من برنامج Gemini 2.0 Flash Thinking Experimental من جوجل.

استغرقت عملية التدريب أقل من 30 دقيقة باستخدام 16 وحدة معالجة رسومية من نوع Nvidia H100، ومع ذلك حققت نتائج ممتازة في العديد من مقاييس الذكاء الاصطناعي. وصرح نيكلاس موينجوف، الباحث في جامعة ستانفورد، بأن تكلفة استئجار قوة الحوسبة اللازمة بلغت حوالي 20 دولارًا فقط.

استخدم الباحثون خدعة لجعل S1 يتحقق من عمله ويمدد "وقت تفكيره"، مثل مطالبة النموذج بالانتظار عن طريق إضافة كلمة "انتظار" إلى عملية التفكير، مما ساعد النموذج على التوصل إلى إجابة أكثر دقة.

بحلول عام ٢٠٢٥، تخطط ميتا وجوجل ومايكروسوفت لاستثمار مئات المليارات من الدولارات في البنية التحتية للذكاء الاصطناعي، وسيُستخدم جزء منها لتدريب نماذج الذكاء الاصطناعي من الجيل التالي. وقد يظل هذا المستوى من الاستثمار ضروريًا لدفع عجلة الابتكار في مجال الذكاء الاصطناعي.

لقد ثبت أن التقطير طريقة جيدة لتكرار قدرات نموذج الذكاء الاصطناعي بتكلفة منخفضة، لكنه لا يخلق نماذج ذكاء اصطناعي جديدة متفوقة على ما هو موجود اليوم.

(وفقا لTechCrunch)

جوجل تطلق رسميًا برنامج Gemini 2.0 للتنافس مع الذكاء الاصطناعي الصيني أطلقت شركة جوجل رسميًا مؤخرًا برنامج المحادثة الآلي من الجيل التالي، Gemini 2.0 مع العديد من الإصدارات والتحديثات.