دو نئے لانچ کیے گئے ChatGPT ماڈلز میں پچھلی نسل کے مقابلے من گھڑت معلومات کی فریکوئنسی زیادہ ہے۔ تصویر: فائر فلائیز ۔ |
GPT-4.1 کا اعلان کرنے کے صرف دو دن بعد، OpenAI نے باضابطہ طور پر ایک نہیں بلکہ دو نئے ماڈل متعارف کرائے، جن کا نام o3 اور o4-mini ہے۔ دونوں ماڈل بہت سے طاقتور اصلاحات کے ساتھ اعلیٰ استدلال کی صلاحیتوں کا مظاہرہ کرتے ہیں۔
تاہم، TechCrunch کے مطابق، یہ دو نئے ماڈل اب بھی "ہیلوسینیٹ" یا خود ایجاد کا شکار ہیں۔ درحقیقت، وہ OpenAI کے کچھ پرانے ماڈلز کے مقابلے زیادہ فریب نظروں کی نمائش کرتے ہیں۔
IBM کے مطابق، ہیلوسینیشن مظاہر ہیں جہاں بڑے لینگویج ماڈلز (LLMs) - اکثر چیٹ بوٹس یا کمپیوٹر ویژن ٹولز - ایسے ڈیٹا پیٹرن حاصل کرتے ہیں جو موجود نہیں ہوتے یا انسانوں کے لیے ناقابل شناخت ہوتے ہیں، اس طرح بے معنی یا غلط نتائج برآمد ہوتے ہیں۔
دوسرے لفظوں میں، صارفین اکثر AI سے تربیت یافتہ ڈیٹا کی بنیاد پر درست نتائج کی توقع کرتے ہیں۔ تاہم، بعض صورتوں میں، AI کے نتائج درست اعداد و شمار پر مبنی نہیں ہوتے، جس سے "غلط" ردعمل پیدا ہوتا ہے۔
اپنی تازہ ترین رپورٹ میں، OpenAI نے دریافت کیا کہ o3 پرسن کیو اے کے 33% سوالات کے جوابات دیتے وقت "فریب" تھا۔
مقابلے کے لیے، یہ اعداد و شمار OpenAI کے سابقہ استدلال کے ماڈلز، o1 اور o3-mini، جو بالترتیب 16% اور 14.8% تھے۔ دریں اثنا، O4-mini ماڈل نے PersonQA پر اور بھی بدتر کارکردگی کا مظاہرہ کیا، ٹیسٹ کی مدت کے 48% تک "وہم" کا سامنا کرنا پڑا۔
مزید تشویشناک بات یہ ہے کہ "ChatGPT کا باپ" دراصل نہیں جانتا کہ ایسا کیوں ہو رہا ہے۔ خاص طور پر، o3 اور o4-mini پر اپنی تکنیکی رپورٹ میں، OpenAI کہتا ہے کہ "مزید تحقیق کی ضرورت ہے یہ سمجھنے کے لیے کہ کیوں 'فریب' خراب ہوتے ہیں"
O3 اور o4-mini کچھ شعبوں میں بہتر کارکردگی کا مظاہرہ کرتے ہیں، بشمول پروگرامنگ اور ریاضی کے کام۔ تاہم، کیونکہ انہیں "عام بیانات سے زیادہ بیانات دینے کی ضرورت ہے،" دونوں ماڈلز کے نتیجے میں "زیادہ درست بیانات، بلکہ زیادہ غلط بیانات" بھی سامنے آئے ہیں۔
ماخذ: https://znews.vn/canh-bao-ve-chatgpt-ao-giac-post1547242.html







تبصرہ (0)