مئی کے وسط میں ایک ہفتے کے آخر میں، ریاضی دانوں کی ایک بند کمرے کی میٹنگ ہوئی۔ دنیا کے تیس سرکردہ ریاضی دانوں نے خفیہ طور پر برکلے، کیلیفورنیا، USA کا سفر کیا تاکہ ایک چیٹ بوٹ کے ساتھ تصادم میں حصہ لیا جا سکے جو "استدلال" کے قابل ہے۔ اس چیٹ بوٹ کو خود ریاضی دانوں کے وضع کردہ مسائل کو حل کرنے کا کام سونپا گیا تھا، تاکہ اس کی مسئلہ حل کرنے کی صلاحیتوں کو جانچا جا سکے۔
پروفیسر کی سطح کے سوالات کے ساتھ مسلسل دو دن تک ان پر بمباری کرنے کے بعد، ریاضی دان یہ جان کر حیران رہ گئے کہ یہ چیٹ بوٹ تاریخ میں حل کیے گئے کچھ مشکل ترین مسائل کو حل کر سکتا ہے۔
یونیورسٹی آف ورجینیا کے پروفیسر اور میٹنگ کے چیئر اور جج کین اونو نے سائنٹیفک امریکن کو بتایا، "میں نے ساتھیوں کو یہ کہتے ہوئے دیکھا ہے کہ یہ بڑے پیمانے پر زبان کا ماڈل ریاضیاتی ذہانت کی سطح پر پہنچ رہا ہے۔"
مذکورہ بالا چیٹ بوٹ o4-mini پر مبنی ہے، ایک بڑے لینگویج ماڈل (LLM) کو پیچیدہ استدلال کے لیے ڈیزائن کیا گیا ہے۔ OpenAI کے اس پروڈکٹ کو نفیس استدلال کے اقدامات کرنے کی تربیت دی گئی ہے۔ گوگل کا ایک ایسا ہی ماڈل، جسے جیمنی 2.5 فلیش کہا جاتا ہے، بھی اسی طرح کی صلاحیتوں کا حامل ہے۔
پچھلے ChatGPT LLMs کی طرح، o4-mini ٹیکسٹ سٹرنگ میں اگلے لفظ کی پیشین گوئی کرنا سیکھتا ہے۔ تاہم، فرق اس حقیقت میں مضمر ہے کہ o4-mini ایک ہلکا، زیادہ لچکدار ورژن ہے، جو گہرے ڈیٹا پر تربیت یافتہ ہے اور قریبی انسانی ٹیوننگ حاصل کرتا ہے—اسے ریاضی کے مسائل تک پہنچنے کی اجازت دیتا ہے جن تک پچھلے ماڈلز نہیں پہنچ سکتے تھے۔
o4-mini کی صلاحیتوں کو چیلنج کرنے اور ان کا جائزہ لینے کے لیے، OpenAI نے Epoch AI - جو کہ LLM ماڈلز کی جانچ میں مہارت حاصل کرنے والی ایک غیر منافع بخش تنظیم ہے، کو 300 پہلے سے غیر مطبوعہ ریاضی کے سوالات تخلیق کرنے کا حکم دیا۔ جبکہ روایتی LLMs بہت سے پیچیدہ مسائل کو حل کر سکتے ہیں، جب مکمل طور پر نئے سوالات کے ساتھ چیلنج کیا جاتا ہے، ان میں سے اکثر نے صرف 2% سے بھی کم درست طریقے سے حل کیا ہے۔ اس سے ظاہر ہوتا ہے کہ ان میں صحیح استدلال کی صلاحیت نہیں ہے۔
اپنے تازہ ترین تشخیصی منصوبے میں، Epoch AI نے ریاضی کے نوجوان PhD Elliot Glazer کو اپنے لیڈ کے طور پر بھرتی کیا ہے۔ نیا پروجیکٹ، جسے فرنٹیئر میتھ کہا جاتا ہے، ستمبر 2024 میں شروع کیا جائے گا۔
پروجیکٹ نے مشکل کی چار سطحوں پر نئے سوالات جمع کیے، انڈرگریجویٹ اور پوسٹ گریجویٹ سے لے کر گہرائی سے تحقیق تک۔ اپریل 2025 میں، گلیزر نے پایا کہ o4-mini تقریباً 20% مسائل کو حل کر سکتا ہے۔ لہٰذا، اس نے اسے فوری طور پر سطح 4 پر منتقل کر دیا – جس سے اس سے ایسے مسائل کو حل کرنے کی ضرورت ہوتی ہے جن سے اعلیٰ درجے کے ریاضی دان بھی جدوجہد کریں گے۔
شرکاء کو رازداری کے معاہدے پر دستخط کرنے کی ضرورت تھی، صرف انکرپٹڈ سگنل ایپ کے ذریعے بات چیت کرتے ہوئے، کیونکہ ای میل کے استعمال کو اسکین کیا جا سکتا ہے اور اس کے مواد کو LLM کے ذریعے "سیکھا" جا سکتا ہے، اس طرح تشخیصی ڈیٹا کو غلط ثابت کیا جا سکتا ہے۔
ہر اس مسئلے کے لیے جسے o4-mini حل نہیں کر سکتا، مسئلہ طے کرنے والے کو $7,500 کا انعام ملے گا۔
ابتدائی ورکنگ گروپ سوالات کے ساتھ آنے میں سست لیکن مستحکم تھا۔ تاہم، گلیزر نے 17-18 مئی کو دو روزہ ذاتی ملاقات کا اہتمام کرکے چیزوں کو تیز کرنے کا فیصلہ کیا۔ تیس ریاضی دانوں نے شرکت کی، چھ کے گروپوں میں بٹے ہوئے، ایک دوسرے کے خلاف مقابلہ کیا- مسائل کو حل کرنے کے لیے نہیں، بلکہ ایسے مسائل وضع کرنے کے لیے جنہیں AI حل نہیں کر سکتا تھا۔
17 مئی کی شام تک، کین اونو نے چیٹ بوٹ سے مایوسی محسوس کرنا شروع کر دی، جس نے ریاضیاتی صلاحیت کی سطح کو توقعات سے کہیں زیادہ ظاہر کیا، جس سے ٹیم کے لیے اسے "ٹریپ" کرنا مشکل ہو گیا۔ "میں ایک مسئلہ لے کر آیا ہوں جسے صنعت کے ماہرین نمبر تھیوری میں ایک کھلے مسئلے کے طور پر تسلیم کریں گے - یہ مسئلہ پی ایچ ڈی کے لیے موزوں ہے،" اس نے بیان کیا۔
نتیجے کے طور پر، جب اس نے o4-mini سے پوچھا، تو وہ چیٹ بوٹ کا تجزیہ، وجہ، اور صرف 10 منٹ میں صحیح حل فراہم کرتے ہوئے دیکھ کر دنگ رہ گیا۔ خاص طور پر، پہلے دو منٹوں میں، اس نے تحقیق کی اور تمام متعلقہ مواد کو پکڑ لیا۔ پھر، اس نے نقطہ نظر کو سیکھنے کے لیے مسئلے کے آسان ورژن کے ساتھ تجربہ کرنے کا مشورہ دیا۔
پانچ منٹ بعد، چیٹ بوٹ نے درست جواب فراہم کیا، اس کے ساتھ ایک پُراعتماد — یہاں تک کہ کچھ مغرور — لہجے میں۔ "اس نے چالاکی سے کام کرنا شروع کر دیا،" اونو نے کہا، "اور اس نے یہ بھی کہا: 'کوٹ کرنے کی ضرورت نہیں، میں نے پہلے ہی اسرار نمبر کا حساب لگا لیا ہے!'"
اے آئی کے خلاف ناکام ہونے کے بعد، 18 مئی کی صبح، اونو نے فوری طور پر سگنل کے ذریعے ٹیم کو ایک الرٹ پیغام بھیجا۔ "میں اس طرح کے ماڈل سے نمٹنے کے لیے مکمل طور پر تیار نہیں تھا،" انہوں نے کہا۔ "میں نے کمپیوٹر ماڈل میں اس قسم کی استدلال کبھی نہیں دیکھی تھی۔ یہ ایسا سوچا جیسا کہ ایک حقیقی سائنسدان سوچتا ہے۔ اور یہ خوفناک تھا۔"
اگرچہ ریاضی دان آخرکار 10 سوالات تلاش کرنے میں کامیاب ہو گئے جنہوں نے o4-mini کو حیران کر دیا، لیکن وہ صرف ایک سال میں AI کی ترقی کی رفتار پر اپنی حیرت کو چھپا نہیں سکے۔
اونو نے o4-mini کے ساتھ کام کرنے کے تجربے کا موازنہ ایک انتہائی باصلاحیت ساتھی کے ساتھ کام کرنے سے کیا۔ لندن میں انسٹی ٹیوٹ فار میتھمیٹیکل سائنسز کے ایک ریاضی دان اور ریاضی میں اے آئی کو لاگو کرنے کے علمبردار، یانگ ہوئی ہی نے تبصرہ کیا: "یہ وہی ہے جو ایک بہت اچھا گریجویٹ طالب علم کر سکتا ہے - اس سے بھی زیادہ۔"
اور یہ بات قابل غور ہے کہ AI انسانوں سے زیادہ تیزی سے کام کرتا ہے۔ اگرچہ اسے حل کرنے میں انسانوں کو ہفتوں یا مہینے لگتے ہیں، o4-mini میں صرف چند منٹ لگتے ہیں۔
o4-mini کے ساتھ wits کی جنگ کے ارد گرد جوش و خروش کافی تشویش کے ساتھ تھا۔ Ono اور He دونوں نے خبردار کیا کہ o4-mini کی صلاحیتیں زیادہ اعتماد کا باعث بن سکتی ہیں۔ انہوں نے کہا، "ہمارے پاس ثبوت کے ذریعے ثبوت، تضاد کا ثبوت، اور اب ثبوت… زبردست قوت سے،" انہوں نے کہا۔ "اگر آپ کافی اعتماد کے ساتھ کچھ بیان کرتے ہیں، تو دوسرے خوفزدہ محسوس کریں گے۔ میرے خیال میں o4-mini نے اس قسم کے ثبوت میں مہارت حاصل کی ہے: جو کچھ بھی کہتا ہے وہ یقینی ہے۔"
جیسے ہی میٹنگ ختم ہوئی، ریاضی دانوں نے ریاضی کے مستقبل پر غور شروع کیا۔ انہوں نے "پانچویں سطح" کے امکان پر تبادلہ خیال کیا - ایسے سوالات جنہیں دنیا کے بہترین ریاضی دان بھی حل نہیں کر سکتے۔ اگر AI اس سطح تک پہنچ جاتا ہے، تو ریاضی دان کا کردار ڈرامائی طور پر تبدیل ہو جائے گا: وہ پھر سوال کرنے والے بن سکتے ہیں، نئے ریاضیاتی سچائیوں کو دریافت کرنے کے لیے اس کے استدلال میں AI کے ساتھ بات چیت اور رہنمائی کر سکتے ہیں۔
اونو نے کہا، "میں ابھی کچھ عرصے سے اپنے ساتھیوں کو بتا رہا ہوں کہ یہ سمجھنا کہ عام مصنوعی ذہانت کبھی ظاہر نہیں ہوگی، یہ ایک کمپیوٹر ہے، ایک سنگین غلطی ہوگی۔" "میں گھبرانا نہیں چاہتا، لیکن کچھ معاملات میں، زبان کے ان بڑے ماڈلز نے پہلے ہی دنیا کے بہترین گریجویٹ طلباء کو پیچھے چھوڑنا شروع کر دیا ہے۔"
ماخذ: https://www.vietnamplus.vn/cuoc-gap-go-dac-biet-noi-cac-nha-toan-hoc-tim-cach-danh-bai-tri-tue-nhan-tao-post1043183.vnp






تبصرہ (0)