GPT-4.5 بزرگترین مدلی است که OpenAI تاکنون ساخته است. منبع: The Verge |
یک مطالعه جدید از گروه علوم شناختی دانشگاه کالیفرنیا، سن دیگو، نقطه عطفی در حوزه هوش مصنوعی را نشان میدهد: مدل GPT-4.5 شرکت OpenAI با استفاده از رویکرد تعامل مبتنی بر «شخصیت» به عملکرد برتر در آزمون تورینگ دست یافته است.
این سیستم، شبیهترین سیستم مکالمه هوش مصنوعی به انسان تا به امروز محسوب میشود و کاربردهای بالقوه زیادی را در زمینه هوش اجتماعی ایجاد میکند.
OpenAI مدل GPT-4.5 را «یک جهش بزرگ رو به جلو در مقیاسبندی پیش از آموزش و پس از آموزش» توصیف میکند. این مدل، بزرگترین مدلی است که OpenAI تاکنون ساخته است، با اندازه و قدرت محاسباتی که از نسخههای قبلی پیشی میگیرد.
طبق پست وبلاگ رسمی OpenAI در تاریخ ۲۷ فوریه، GPT-4.5 از همان روز اعلام، برای کاربران ChatGPT Pro منتشر شد.
آیا هوش مصنوعی میتواند انسانها را فریب دهد؟
این آزمایش چهار سیستم هوش مصنوعی نمونه را با هم مقایسه کرد: چتبات ELIZA مربوط به دهه ۱۹۶۰، LLaMa-3.1-405B از Meta AI و GPT-4o و GPT-4.5 از OpenAI. این تیم دو آزمایش مستقل با ۲۵۰ شرکتکننده در هر کدام، در مجموع ۵۰۰ نفر از پلتفرمهای آنلاین مانند Prolific، طراحی کرد. شرکتکنندگان از سنین، جنسیتها و سطوح تحصیلی مختلف بودند تا نمونهای متنوع حاصل شود.
![]() |
جدول مقایسه چهار سیستم هوش مصنوعی معمول. منبع: AIbase |
این آزمون از قالب سنتی تورینگ استفاده میکند: هر شرکتکننده از طریق یک رابط متنی با دو سوژه (یکی انسان، یکی هوش مصنوعی) به مدت ۵ دقیقه چت میکند، سپس امتیاز میدهد که کدام یک انسان است.
نتایج شگفتانگیز بود: GPT-4.5 به نرخ «قبولی در آزمون تورینگ» تا ۷۳ درصد دست یافت که از میانگین انسانی (۶۰-۷۰ درصد) پیشی گرفت. این اولین باری است که یک مدل هوش مصنوعی واقعاً آزمون استاندارد تورینگ را «قبول» میکند. در همین حال، GPT-4o امتیاز کمی پایینتری کسب کرد، LLaMa-3.1-405B در برخی زمینهها به عملکرد انسانی نزدیک شد یا به آن رسید، و ELIZA بسیار عقب ماند.
توانایی تعامل مانند یک انسان
آنچه در مورد GPT-4.5 برجسته بود، نه تنها تسلط آن بر زبان، بلکه توانایی آن در ابراز احساسات و تطبیق پاسخهایش با ظرافتهای ارتباطی مخاطبش نیز بود. بسیاری از شرکتکنندگان آن را «دوستانه» و «اصیل» توصیف کردند.
نکته قابل توجه این است که وقتی کاربران گیج یا مضطرب به نظر میرسیدند، GPT-4.5 میتوانست پاسخهای طنزآمیز یا آرامشبخش ارائه دهد، و همین باعث میشد بسیاری باور کنند که با یک شخص واقعی چت میکنند.
![]() |
مکالمه بین دو آزمودنی (یکی هوش مصنوعی، یکی انسان) در طول آزمون. عکس: دانشگاه کالیفرنیا، سن دیگو . |
در همین حال، LLaMa-3.1-405B، اگرچه از نظر فنی چشمگیر است، اما از GPT-4.5 کمتر بیانگر و از نظر زمینهای سازگار است. GPT-4o، اگرچه قدرتمند است، اما از نظر شخصیسازی و سازگاری با موقعیت، در سطح پایینتری قرار دارد.
پیشرفت GPT-4.5 میتواند طیف وسیعی از کاربردهای عملی، از معلمان مجازی گرفته تا پشتیبانی روانشناختی و مراقبت از مشتری، را ایجاد کند. با این حال، با نزدیکتر شدن هوش مصنوعی به انسان، تمایز بین واقعیت و مجازیت و تنظیم نحوه استفاده از این فناوری به یک چالش کلیدی اجتماعی تبدیل خواهد شد.
این تحقیق در بحبوحه پیشرفتهای سریع در هوش مصنوعی انجام میشود. موفقیت GPT-4.5 نه تنها یک پیروزی فنی برای OpenAI است، بلکه سوالات عمیقی را در مورد رابطه بین انسانها و ماشینها مطرح میکند. یکی از آزمایشکنندگان اظهار داشت که احساس میکرد با یک دوست صحبت میکند - تا اینکه متوجه شد همه اینها فقط چند خط کد است. گفتگوی بین انسانها و هوش مصنوعی ممکن است تازه آغاز شده باشد.
منبع: https://znews.vn/chatgpt-da-vuot-qua-bai-danh-gia-quan-trong-xac-dinh-may-nguoi-post1542945.html
نظر (0)