ChatGPT آزمون مهم شناسایی ماشین از انسان را با موفقیت پشت سر گذاشت

GPT-4.5 بزرگترین مدلی است که OpenAI تاکنون ساخته است. منبع: The Verge

یک مطالعه جدید از گروه علوم شناختی دانشگاه کالیفرنیا، سن دیگو، نقطه عطفی در حوزه هوش مصنوعی را نشان می‌دهد: مدل GPT-4.5 شرکت OpenAI با استفاده از رویکرد تعامل مبتنی بر «شخصیت» به عملکرد برتر در آزمون تورینگ دست یافته است.

این سیستم، شبیه‌ترین سیستم مکالمه هوش مصنوعی به انسان تا به امروز محسوب می‌شود و کاربردهای بالقوه زیادی را در زمینه هوش اجتماعی ایجاد می‌کند.

OpenAI مدل GPT-4.5 را «یک جهش بزرگ رو به جلو در مقیاس‌بندی پیش از آموزش و پس از آموزش» توصیف می‌کند. این مدل، بزرگترین مدلی است که OpenAI تاکنون ساخته است، با اندازه و قدرت محاسباتی که از نسخه‌های قبلی پیشی می‌گیرد.

طبق پست وبلاگ رسمی OpenAI در تاریخ ۲۷ فوریه، GPT-4.5 از همان روز اعلام، برای کاربران ChatGPT Pro منتشر شد.

آیا هوش مصنوعی می‌تواند انسان‌ها را فریب دهد؟

این آزمایش چهار سیستم هوش مصنوعی نمونه را با هم مقایسه کرد: چت‌بات ELIZA مربوط به دهه ۱۹۶۰، LLaMa-3.1-405B از Meta AI و GPT-4o و GPT-4.5 از OpenAI. این تیم دو آزمایش مستقل با ۲۵۰ شرکت‌کننده در هر کدام، در مجموع ۵۰۰ نفر از پلتفرم‌های آنلاین مانند Prolific، طراحی کرد. شرکت‌کنندگان از سنین، جنسیت‌ها و سطوح تحصیلی مختلف بودند تا نمونه‌ای متنوع حاصل شود.

جدول مقایسه چهار سیستم هوش مصنوعی معمول. منبع: AIbase

این آزمون از قالب سنتی تورینگ استفاده می‌کند: هر شرکت‌کننده از طریق یک رابط متنی با دو سوژه (یکی انسان، یکی هوش مصنوعی) به مدت ۵ دقیقه چت می‌کند، سپس امتیاز می‌دهد که کدام یک انسان است.

نتایج شگفت‌انگیز بود: GPT-4.5 به نرخ «قبولی در آزمون تورینگ» تا ۷۳ درصد دست یافت که از میانگین انسانی (۶۰-۷۰ درصد) پیشی گرفت. این اولین باری است که یک مدل هوش مصنوعی واقعاً آزمون استاندارد تورینگ را «قبول» می‌کند. در همین حال، GPT-4o امتیاز کمی پایین‌تری کسب کرد، LLaMa-3.1-405B در برخی زمینه‌ها به عملکرد انسانی نزدیک شد یا به آن رسید، و ELIZA بسیار عقب ماند.

توانایی تعامل مانند یک انسان

آنچه در مورد GPT-4.5 برجسته بود، نه تنها تسلط آن بر زبان، بلکه توانایی آن در ابراز احساسات و تطبیق پاسخ‌هایش با ظرافت‌های ارتباطی مخاطبش نیز بود. بسیاری از شرکت‌کنندگان آن را «دوستانه» و «اصیل» توصیف کردند.

نکته قابل توجه این است که وقتی کاربران گیج یا مضطرب به نظر می‌رسیدند، GPT-4.5 می‌توانست پاسخ‌های طنزآمیز یا آرامش‌بخش ارائه دهد، و همین باعث می‌شد بسیاری باور کنند که با یک شخص واقعی چت می‌کنند.

مکالمه بین دو آزمودنی (یکی هوش مصنوعی، یکی انسان) در طول آزمون. عکس: دانشگاه کالیفرنیا، سن دیگو .

در همین حال، LLaMa-3.1-405B، اگرچه از نظر فنی چشمگیر است، اما از GPT-4.5 کمتر بیانگر و از نظر زمینه‌ای سازگار است. GPT-4o، اگرچه قدرتمند است، اما از نظر شخصی‌سازی و سازگاری با موقعیت، در سطح پایین‌تری قرار دارد.

پیشرفت GPT-4.5 می‌تواند طیف وسیعی از کاربردهای عملی، از معلمان مجازی گرفته تا پشتیبانی روانشناختی و مراقبت از مشتری، را ایجاد کند. با این حال، با نزدیک‌تر شدن هوش مصنوعی به انسان، تمایز بین واقعیت و مجازیت و تنظیم نحوه استفاده از این فناوری به یک چالش کلیدی اجتماعی تبدیل خواهد شد.

این تحقیق در بحبوحه پیشرفت‌های سریع در هوش مصنوعی انجام می‌شود. موفقیت GPT-4.5 نه تنها یک پیروزی فنی برای OpenAI است، بلکه سوالات عمیقی را در مورد رابطه بین انسان‌ها و ماشین‌ها مطرح می‌کند. یکی از آزمایش‌کنندگان اظهار داشت که احساس می‌کرد با یک دوست صحبت می‌کند - تا اینکه متوجه شد همه اینها فقط چند خط کد است. گفتگوی بین انسان‌ها و هوش مصنوعی ممکن است تازه آغاز شده باشد.

منبع: https://znews.vn/chatgpt-da-vuot-qua-bai-danh-gia-quan-trong-xac-dinh-may-nguoi-post1542945.html