Vietnam.vn - Nền tảng quảng bá Việt Nam

اجتماع خاص يسعى فيه علماء الرياضيات إلى هزيمة الذكاء الاصطناعي

اجتمع أفضل علماء الرياضيات في العالم سراً لإيجاد طريقة لهزيمة الذكاء الاصطناعي، لكنهم انبهروا بقدرات الذكاء الاصطناعي.

VietnamPlusVietnamPlus20/05/2025

في إحدى عطلات نهاية الأسبوع في منتصف شهر مايو، عُقد اجتماع سري لعالم الرياضيات. سافر 30 من أبرز علماء الرياضيات في العالم سرًا إلى بيركلي، كاليفورنيا، الولايات المتحدة الأمريكية، لحضور مواجهة مع روبوت محادثة قادر على "التفكير المنطقي". كُلّف الروبوت بحل مسائل وضعها علماء الرياضيات أنفسهم، لاختبار قدراته على حل المسائل.

بعد يومين من إطلاق أسئلة على مستوى الأساتذة بشكل متواصل، فوجئ علماء الرياضيات بإدراك أن هذا الروبوت المحادثة يمكنه حل بعض أصعب المشكلات التي تم حلها على الإطلاق في التاريخ.

وقال كين أونو، أستاذ في جامعة فيرجينيا ورئيس الاجتماع ومحكمه، لمجلة ساينتفك أميركان: "لقد رأيت زملاء يقولون صراحة إن نموذج اللغة الكبير هذا يقترب من مستوى العبقرية الرياضية".

روبوت المحادثة الذي لفت انتباهنا يعمل بنظام o4-mini ، وهو نموذج لغوي كبير (LLM) مصمم للاستدلال المعقد. وهو منتج من OpenAI، ومُدرّب على إجراء استدلالات معقدة. يتمتع النموذج المكافئ من جوجل، Gemini 2.5 Flash، بقدرات مماثلة.

مثل برامج ChatGPT LLM السابقة، يتعلم o4-mini التنبؤ بالكلمة التالية في سلسلة نصية. ومع ذلك، يُعد o4-mini نسخة أخف وأكثر مرونة، مُدرَّبة على بيانات عميقة، ومُصمَّمة بدقة من قِبل البشر، مما يسمح له بالتعمق في مسائل رياضية لم تتمكن النماذج السابقة من حلها.

لاختبار قدرات o4-mini، طلبت OpenAI من Epoch AI، وهي منظمة غير ربحية متخصصة في اختبار نماذج ماجستير القانون، إعداد 300 سؤال رياضي لم يُنشر سابقًا. في حين أن برامج ماجستير القانون التقليدية قادرة على حل العديد من المسائل المعقدة، إلا أنه عند طرح أسئلة جديدة كليًا، كانت نسبة إجابات معظمها أقل من 2%، مما يشير إلى أنها لم تكن قادرة على التفكير المنطقي.

في مشروع التقييم الجديد، عيّنت شركة Epoch AI عالم الرياضيات الشاب الدكتور إليوت جلازر قائدًا لها. سيبدأ المشروع الجديد، المسمى FrontierMath ، العمل اعتبارًا من سبتمبر 2024.

يجمع المشروع أسئلة جديدة بأربعة مستويات صعوبة، من البكالوريوس والدراسات العليا إلى البحث المتقدم. بحلول أبريل 2025، وجد جليزر أن o4-mini قادر على حل حوالي 20% من المسائل. لذا انتقل إلى المستوى الرابع، طالبًا منه حل مسائل يصعب حتى على علماء الرياضيات المتقدمين حلها.

أُجبر المشاركون على توقيع اتفاقية سرية ولم يتمكنوا من التواصل إلا عبر تطبيق Signal المشفر، حيث أن استخدام البريد الإلكتروني قد يسمح لـ LLM بمسح المحتوى و"استنشاقه"، وبالتالي تزوير بيانات التقييم.

كل مشكلة لا يستطيع o4-mini حلها سيحصل السائل على جائزة قدرها 7500 دولار أمريكي.

حقق الفريق الأولي تقدمًا بطيئًا، وإن كان ثابتًا، في طرح الأسئلة. لكن جليزر قرر تسريع الأمور بعقد اجتماع شخصي يومي 17 و18 مايو. قُسّم علماء الرياضيات الثلاثون المشاركون إلى مجموعات من ستة، يتنافسون فيما بينهم - ليس لحل المسائل، بل لإيجاد حلول لمسائل لا يستطيع الذكاء الاصطناعي حلها.

بحلول مساء 17 مايو، بدأ كين أونو يشعر بالإحباط من روبوت المحادثة، الذي أظهر مستوىً من الكفاءة الرياضية يفوق المتوقع بكثير، مما صعّب على الفريق "احتجازه". قال: "لقد توصلتُ إلى مشكلة سيُعرّفها الخبراء في هذا المجال على أنها مشكلة مفتوحة في نظرية الأعداد - مشكلة مناسبة لرسالة الدكتوراه".

نتيجةً لذلك، عندما طلب من o4-mini، اندهش لرؤية روبوت المحادثة يُحلل ويُعلّل ويُقدّم الحل الصحيح في غضون عشر دقائق فقط. تحديدًا، في الدقيقتين الأوليين، تعلّم واستوعب جميع المستندات ذات الصلة. ثم اقترح تجربة نسخة أبسط من المشكلة لمعرفة كيفية التعامل معها.

بعد خمس دقائق، أعطى روبوت المحادثة الإجابة الصحيحة، متحدثًا بنبرة واثقة - بل ومتغطرسة. يقول أونو: "بدأ الأمر يبدو وقحًا، وأضاف: لا حاجة لرقم تعريفي لأنني عرفت الرقم السري!"

بعد هزيمته أمام الذكاء الاصطناعي، أرسل أونو على الفور رسالة تحذير إلى الفريق عبر سيجنال في صباح يوم 18 مايو. قال: "لم أكن مستعدًا تمامًا للتعامل مع نموذج كهذا. لم أرَ هذا النوع من التفكير في نموذج حاسوبي من قبل. كان التفكير يُشبه تفكير عالم حقيقي. وكان ذلك مُخيفًا".

وعلى الرغم من أن علماء الرياضيات نجحوا في النهاية في العثور على 10 أسئلة تركت o4-mini في حيرة، إلا أنهم لم يتمكنوا من إخفاء صدمتهم من سرعة تطور الذكاء الاصطناعي في عام واحد فقط.

يُشبّه أونو تجربة العمل مع o4-mini بالتعاون مع زميل موهوب للغاية. ويُعلّق يانغ هوي هي، عالم الرياضيات في معهد لندن للعلوم الرياضية والرائد في تطبيق الذكاء الاصطناعي على الرياضيات، قائلاً: "هذا ما يُمكن لطالب دكتوراه موهوب للغاية أن يفعله، بل وأكثر من ذلك".

وتجدر الإشارة إلى أن الذكاء الاصطناعي يُنجز هذه المهمة أسرع بكثير من البشر. فبينما يستغرق البشر أسابيع أو أشهرًا لحلها، لا يستغرق o4-mini سوى بضع دقائق.

الإثارة المحيطة بجهاز o4-mini لا تخلو من المخاوف. يُحذّر كلٌّ من أونو وهي من أن قدرات o4-mini قد تُثير ثقةً مفرطةً لدى الناس. يقول أونو: "لدينا إثباتٌ بالاستقراء، وإثباتٌ بالتناقض، والآن إثباتٌ بالجبر. إذا قلتَ شيئًا بثقةٍ كافية، سيشعر الناس بالرهبة. أعتقد أن o4-mini قد أتقن هذا النوع من الإثبات: إنه يقول كل شيء بثقةٍ كبيرة".

مع انتهاء الاجتماع، بدأ علماء الرياضيات بالتفكير في مستقبل الرياضيات. ناقشوا إمكانية وجود "مستوى خامس" - أسئلة يعجز حتى أمهر علماء الرياضيات في العالم عن حلها. إذا وصل الذكاء الاصطناعي إلى هذا المستوى، فسيتغير دور علماء الرياضيات جذريًا: ربما يصبحون مُستطلعين، يتفاعلون مع منطق الذكاء الاصطناعي ويوجهونه لاكتشاف حقائق رياضية جديدة - تمامًا كما يعمل الأستاذ الجامعي مع طالب الدراسات العليا.

قال أونو: "لطالما قلت لزملائي إنه من الخطأ الفادح الاعتقاد بأن الذكاء الاصطناعي العام لن يظهر أبدًا، وأنه مجرد حاسوب. لا أريد أن أثير الذعر، ولكن في بعض النواحي، بدأت هذه النماذج اللغوية الضخمة تتفوق بالفعل على معظم أفضل طلاب الدكتوراه في العالم".

(فيتنام+)

المصدر: https://www.vietnamplus.vn/cuoc-gap-go-dac-biet-noi-cac-nha-toan-hoc-tim-cach-danh-bai-tri-tue-nhan-tao-post1043183.vnp


تعليق (0)

No data
No data

نفس الفئة

من هدية الطفولة إلى عمل فني بمليون دولار
جهود للحفاظ على حرفة صناعة الألعاب التقليدية في منتصف الخريف في قرية أونج هاو
ضائع في صيد السحاب في تا شوا
الإعجاب بحقول طاقة الرياح الساحلية في جيا لاي المخفية في السحب

نفس المؤلف

إرث

شكل

عمل

No videos available

الأحداث الجارية

النظام السياسي

محلي

منتج