ChatGPT نے مشین انسانی شناخت کا اہم امتحان پاس کر لیا ہے۔

GPT-4.5 OpenAI کا اب تک کا سب سے بڑا ماڈل ہے۔ ماخذ: دی ورج ۔

کیلیفورنیا یونیورسٹی، سان ڈیاگو کے شعبہ علمی سائنس کی ایک نئی تحقیق مصنوعی ذہانت کے شعبے میں ایک سنگ میل کی نشاندہی کرتی ہے: OpenAI کے GPT-4.5 ماڈل نے "شخصیت" پر مبنی تعامل کے طریقہ کار کا استعمال کرتے ہوئے ٹورنگ ٹیسٹ پر اعلیٰ کارکردگی حاصل کی ہے۔

اسے اب تک کا سب سے زیادہ انسانی جیسا AI گفتگو کا نظام سمجھا جاتا ہے، جو سماجی ذہانت کے میدان میں بہت سے ممکنہ ایپلی کیشنز کو کھولتا ہے۔

GPT-4.5 کو OpenAI نے "پری ٹریننگ اور پوسٹ ٹریننگ کی پیمائش کرنے میں ایک بڑی چھلانگ کے طور پر بل کیا ہے۔" یہ اوپن اے آئی کا اب تک کا سب سے بڑا ماڈل ہے، جس میں سائز اور کمپیوٹیشنل طاقت ہے جو پچھلے ورژنز کو پیچھے چھوڑ دیتی ہے۔

27 فروری کو OpenAI کی آفیشل بلاگ پوسٹ کے مطابق، GPT-4.5 نے اپنے اعلان کے دن سے ChatGPT پرو صارفین کے لیے رول آؤٹ کرنا شروع کر دیا۔

کیا AI انسانوں کو بیوقوف بنا سکتا ہے؟

تجربے نے چار نمائندہ AI سسٹمز کا موازنہ کیا: 1960 کی چیٹ بوٹ ELIZA، Meta AI کا LLaMa-3.1-405B، اور OpenAI کا GPT-4o اور GPT-4.5۔ ٹیم نے پرولیفک جیسے آن لائن پلیٹ فارمز سے کل 500 افراد کے لیے 250 شرکاء کے ساتھ دو آزاد ٹیسٹ ڈیزائن کیے ہیں۔ ایک متنوع نمونے کو یقینی بنانے کے لیے شرکاء مختلف عمروں، جنسوں اور تعلیمی سطحوں کے تھے۔

چار عام AI سسٹمز کا موازنہ ٹیبل۔ ماخذ: AIbase

ٹیسٹ روایتی ٹورنگ فارمیٹ کا استعمال کرتا ہے: ہر شریک ایک ٹیکسٹ انٹرفیس کے ذریعے دو مضامین (ایک انسان، ایک AI) کے ساتھ 5 منٹ تک چیٹ کرتا ہے، پھر درجہ بندی کرتا ہے کہ کون سا انسان ہے۔

نتائج حیران کن تھے: GPT-4.5 نے انسانی اوسط (60-70%) کو پیچھے چھوڑتے ہوئے، 73% تک "ٹورنگ ٹیسٹ پاسنگ" کی شرح حاصل کی۔ یہ پہلا موقع ہے جب کسی AI ماڈل نے واقعی معیاری ٹورنگ ٹیسٹ کو "پاس" کیا ہے۔ دریں اثنا، GPT-4o نے تھوڑا کم اسکور کیا، LLaMa-3.1-405B کچھ سیاق و سباق میں انسانی کارکردگی تک پہنچا یا اس تک پہنچ گیا، اور ELIZA بہت کم رہ گیا۔

انسان کی طرح بات چیت کرنے کی صلاحیت

GPT-4.5 کے بارے میں جو چیز نمایاں تھی وہ نہ صرف اس کی زبان میں روانی تھی، بلکہ اس کی جذبات کا اظہار کرنے اور اس کے جوابات کو اس کے مکالمے کی بات چیت کی باریکیوں کے مطابق ڈھالنے کی صلاحیت بھی تھی۔ بہت سے شرکاء نے اسے "دوستانہ" اور "مستند" قرار دیا۔

خاص طور پر، جب صارفین الجھن یا تناؤ کا شکار نظر آتے ہیں، تو GPT-4.5 مزاحیہ یا تسلی بخش جوابات پیش کر سکتا ہے، جس سے بہت سے لوگوں کو یقین ہو جاتا ہے کہ وہ ایک حقیقی شخص کے ساتھ بات چیت کر رہے ہیں۔

ٹیسٹ کے دوران دو مضامین (ایک AI، ایک انسان) کے درمیان گفتگو۔ تصویر: یو سی سان ڈیاگو ۔

دریں اثنا، LLaMa-3.1-405B، جبکہ تکنیکی طور پر متاثر کن ہے، GPT-4.5 کے مقابلے میں کم اظہار اور کم سیاق و سباق کے مطابق موافق ہے۔ GPT-4o، طاقتور ہونے کے باوجود، ذاتی نوعیت اور حالات کے ردعمل کی موافقت کے لحاظ سے کمتر ہے۔

GPT-4.5 کی پیش رفت ورچوئل ٹیوٹرز سے لے کر کسٹمر کیئر تک نفسیاتی مدد تک عملی ایپلی کیشنز کی ایک رینج کھول سکتی ہے۔ تاہم، جیسے جیسے AI زیادہ انسان نما ہوتا جائے گا، حقیقت اور ورچوئلٹی کے درمیان فرق کرنا اور اس ٹیکنالوجی کے استعمال کے طریقہ کار کو منظم کرنا ایک اہم سماجی چیلنج بن جائے گا۔

یہ تحقیق AI میں تیز رفتار ترقی کے درمیان سامنے آئی ہے۔ GPT-4.5 کی کامیابی نہ صرف OpenAI کے لیے ایک تکنیکی فتح ہے، بلکہ انسانوں اور مشینوں کے درمیان تعلق کے بارے میں بھی گہرے سوالات اٹھاتی ہے۔ ایک ٹیسٹر نے تبصرہ کیا کہ ایسا محسوس ہوتا ہے کہ وہ کسی دوست سے بات کر رہا ہے – جب تک کہ اسے یہ احساس نہ ہو کہ یہ سب صرف کوڈ کی لائنیں ہیں۔ انسانوں اور AI کے درمیان مکالمہ شاید ابھی ابھی شروع ہوا ہے۔

ماخذ: https://znews.vn/chatgpt-da-vuot-qua-bai-danh-gia-quan-trong-xac-dinh-may-nguoi-post1542945.html