GPT-4.5 adalah model terbesar yang pernah dibuat OpenAI. Sumber: The Verge . |
Sebuah studi baru dari Departemen Ilmu Kognitif di Universitas California, San Diego menandai tonggak sejarah di bidang kecerdasan buatan: model GPT-4.5 OpenAI telah mencapai kinerja unggul pada uji Turing menggunakan pendekatan interaksi berbasis "kepribadian".
Ini dianggap sebagai sistem percakapan AI yang paling mirip manusia, membuka banyak aplikasi potensial di bidang kecerdasan sosial.
GPT-4.5 disebut oleh OpenAI sebagai "sebuah langkah maju yang besar dalam penskalaan pra-pelatihan dan pasca-pelatihan." Ini adalah model terbesar yang pernah dibuat OpenAI, dengan ukuran dan daya komputasi yang melampaui versi-versi sebelumnya.
Menurut postingan blog resmi OpenAI pada tanggal 27 Februari, GPT-4.5 mulai diluncurkan kepada pengguna ChatGPT Pro pada hari pengumumannya.
Bisakah AI menipu manusia?
Eksperimen ini membandingkan empat sistem AI representatif: chatbot ELIZA tahun 1960-an, LLaMa-3.1-405B dari Meta AI, serta GPT-4o dan GPT-4.5 dari OpenAI. Tim merancang dua uji coba independen dengan masing-masing 250 partisipan, sehingga totalnya menjadi 500 orang dari platform daring seperti Prolific. Partisipan berasal dari berbagai usia, jenis kelamin, dan tingkat pendidikan untuk memastikan sampel yang beragam.
![]() |
Tabel perbandingan empat sistem AI yang umum. Sumber: AIbase |
Tes ini menggunakan format Turing tradisional: setiap peserta mengobrol melalui antarmuka teks dengan dua subjek (satu manusia, satu AI) selama 5 menit, lalu menilai mana yang manusia.
Hasilnya mengejutkan: GPT-4.5 mencapai tingkat "lulus uji Turing" sebesar 73%, melampaui rata-rata manusia (60-70%). Ini adalah pertama kalinya model AI benar-benar "lulus" uji Turing standar. Sementara itu, GPT-4o mendapat skor sedikit lebih rendah, LLaMa-3.1-405B mendekati atau mencapai kinerja manusia dalam beberapa konteks, dan ELIZA jauh di bawah.
Kemampuan untuk berinteraksi seperti manusia
Keunggulan GPT-4.5 bukan hanya kefasihannya berbahasa, tetapi juga kemampuannya mengekspresikan emosi dan menyesuaikan responsnya dengan nuansa komunikasi lawan bicaranya. Banyak peserta menggambarkannya sebagai "ramah" dan "autentik".
Khususnya, saat pengguna tampak bingung atau stres, GPT-4.5 dapat memberikan respons yang lucu atau menenangkan, membuat banyak orang percaya bahwa mereka sedang mengobrol dengan orang sungguhan.
![]() |
Percakapan antara dua subjek (satu AI, satu manusia) selama pengujian. Foto: UC San Diego . |
Sementara itu, LLaMa-3.1-405B, meskipun secara teknis mengesankan, kurang ekspresif dan kurang adaptif secara kontekstual dibandingkan GPT-4.5. GPT-4o, meskipun kuat, kurang unggul dalam hal personalisasi dan adaptasi respons situasional.
Terobosan GPT-4.5 dapat membuka berbagai aplikasi praktis, mulai dari tutor virtual, dukungan psikologis, hingga layanan pelanggan. Namun, seiring AI menjadi lebih mirip manusia, membedakan antara realitas dan fantasi serta mengatur bagaimana teknologi ini digunakan akan menjadi tantangan sosial yang besar.
Penelitian ini hadir di tengah kemajuan pesat dalam AI. Keberhasilan GPT-4.5 bukan hanya sebuah kemenangan teknis bagi OpenAI, tetapi juga memunculkan pertanyaan mendalam tentang hubungan antara manusia dan mesin. Seorang penguji berkomentar bahwa ia merasa seperti sedang berbicara dengan seorang teman—hingga ia menyadari bahwa semua itu hanyalah baris kode. Dialog antara manusia dan AI mungkin baru saja dimulai.
Sumber: https://znews.vn/chatgpt-da-vuot-qua-bai-danh-gia-quan-trong-xac-dinh-may-nguoi-post1542945.html
Komentar (0)