GPT-4.5 OpenAI کا اب تک کا سب سے بڑا ماڈل ہے۔ ماخذ: دی ورج ۔ |
کیلیفورنیا یونیورسٹی، سان ڈیاگو کے شعبہ علمی سائنس کی ایک نئی تحقیق مصنوعی ذہانت کے شعبے میں ایک سنگ میل کی نشاندہی کرتی ہے: OpenAI کے GPT-4.5 ماڈل نے "شخصیت" پر مبنی تعامل کے طریقہ کار کا استعمال کرتے ہوئے ٹورنگ ٹیسٹ پر اعلیٰ کارکردگی حاصل کی ہے۔
اسے اب تک کا سب سے زیادہ انسانی جیسا AI گفتگو کا نظام سمجھا جاتا ہے، جو سماجی ذہانت کے میدان میں بہت سے ممکنہ ایپلی کیشنز کو کھولتا ہے۔
GPT-4.5 کو OpenAI نے "پری ٹریننگ اور پوسٹ ٹریننگ کی پیمائش کرنے میں ایک اہم قدم" کے طور پر بل کیا ہے۔ یہ اوپن اے آئی کا اب تک کا سب سے بڑا ماڈل ہے، جس میں سائز اور کمپیوٹیشنل طاقت ہے جو پچھلے ورژنز کو پیچھے چھوڑ دیتی ہے۔
27 فروری کو OpenAI کی آفیشل بلاگ پوسٹ کے مطابق، GPT-4.5 نے اپنے اعلان کے دن سے ChatGPT پرو صارفین کے لیے رول آؤٹ کرنا شروع کر دیا۔
کیا AI انسانوں کو بیوقوف بنا سکتا ہے؟
تجربے نے چار نمائندہ AI سسٹمز کا موازنہ کیا: 1960 کی چیٹ بوٹ ELIZA، Meta AI کا LLaMa-3.1-405B، اور OpenAI کا GPT-4o اور GPT-4.5۔ ٹیم نے پرولیفک جیسے آن لائن پلیٹ فارمز سے کل 500 افراد کے لیے 250 شرکاء کے ساتھ دو آزاد ٹیسٹ ڈیزائن کیے ہیں۔ ایک متنوع نمونے کو یقینی بنانے کے لیے شرکاء مختلف عمروں، جنسوں اور تعلیمی سطحوں کے تھے۔
![]() |
چار عام AI سسٹمز کا موازنہ ٹیبل۔ ماخذ: AIbase |
ٹیسٹ روایتی ٹورنگ فارمیٹ کا استعمال کرتا ہے: ہر شریک ایک ٹیکسٹ انٹرفیس کے ذریعے دو مضامین (ایک انسان، ایک AI) کے ساتھ 5 منٹ تک چیٹ کرتا ہے، پھر درجہ بندی کرتا ہے کہ کون سا انسان ہے۔
نتائج حیران کن تھے: GPT-4.5 نے 73% کی "ٹورنگ ٹیسٹ پاسنگ" کی شرح حاصل کی، جو انسانی اوسط (60-70%) سے آگے نکل گئی۔ یہ پہلا موقع ہے جب کسی AI ماڈل نے واقعی معیاری ٹورنگ ٹیسٹ کو "پاس" کیا ہے۔ دریں اثنا، GPT-4o نے تھوڑا کم اسکور کیا، LLaMa-3.1-405B کچھ سیاق و سباق میں انسانی کارکردگی تک پہنچا یا اس تک پہنچ گیا، اور ELIZA بہت کم رہ گیا۔
انسان کی طرح بات چیت کرنے کی صلاحیت
GPT-4.5 کو جو چیز نمایاں کرتی ہے وہ نہ صرف اس کی زبان میں روانی ہے، بلکہ جذبات کا اظہار کرنے اور اس کے جوابات کو اس کے مکالمہ کرنے والے کی بات چیت کی باریکیوں کے مطابق ڈھالنے کی صلاحیت بھی ہے۔ بہت سے شرکاء نے اسے "دوستانہ" اور "مستند" قرار دیا۔
خاص طور پر، جب صارفین الجھن یا تناؤ کا شکار نظر آتے ہیں، تو GPT-4.5 مزاحیہ یا تسلی بخش جوابات دے سکتا ہے، جس سے بہت سے لوگوں کو یقین ہوتا ہے کہ وہ ایک حقیقی شخص کے ساتھ بات چیت کر رہے ہیں۔
![]() |
ٹیسٹ کے دوران دو مضامین (ایک AI، ایک انسان) کے درمیان گفتگو۔ تصویر: یو سی سان ڈیاگو ۔ |
دریں اثنا، LLaMa-3.1-405B، اگرچہ تکنیکی طور پر متاثر کن ہے، GPT-4.5 کے مقابلے میں کم اظہار اور کم سیاق و سباق کے مطابق موافق ہے۔ GPT-4o، اگرچہ طاقتور ہے، ذاتی نوعیت اور حالات کے ردعمل کے موافقت کے لحاظ سے کمتر ہے۔
GPT-4.5 کی پیش رفت ورچوئل ٹیوٹرز سے لے کر کسٹمر سروس تک نفسیاتی مدد تک عملی ایپلی کیشنز کی ایک رینج کھول سکتی ہے۔ لیکن جیسے جیسے AI زیادہ انسان نما ہوتا جائے گا، حقیقت اور خیالی کے درمیان فرق کرنا اور ٹیکنالوجی کے استعمال کے طریقہ کار کو منظم کرنا ایک بڑا سماجی چیلنج بن جائے گا۔
یہ تحقیق AI میں تیز رفتار ترقی کے درمیان سامنے آئی ہے۔ GPT-4.5 کی کامیابی نہ صرف OpenAI کے لیے ایک تکنیکی فتح ہے، بلکہ انسانوں اور مشینوں کے درمیان تعلق کے بارے میں بھی گہرے سوالات اٹھاتی ہے۔ ایک ٹیسٹر نے تبصرہ کیا کہ ایسا محسوس ہوتا ہے کہ وہ کسی دوست سے بات کر رہا ہے — جب تک کہ اسے احساس نہ ہو کہ یہ سب صرف کوڈ کی لائنیں ہیں۔ انسانوں اور AI کے درمیان مکالمہ شاید ابھی ابھی شروع ہوا ہے۔
ماخذ: https://znews.vn/chatgpt-da-vuot-qua-bai-danh-gia-quan-trong-xac-dinh-may-nguoi-post1542945.html
تبصرہ (0)