Apakah AI benar-benar bisa berpikir?

Perusahaan seperti OpenAI dan DeepSeek mendorong batasan chatbot logis, yang dapat berkinerja lebih baik dalam tugas komputasi tertentu.

ZNews•06/04/2025

Chatbot OpenAI terus berkembang melalui teknologi baru. Foto: New York Times .

Pada September 2024, OpenAI meluncurkan ChatGPT, sebuah versi AI yang mengintegrasikan model o1, yang mampu melakukan penalaran dalam tugas-tugas yang berkaitan dengan matematika, sains , dan pemrograman komputer.

Berbeda dengan versi ChatGPT sebelumnya, teknologi baru ini akan membutuhkan waktu untuk "berpikir" tentang solusi untuk masalah kompleks sebelum memberikan respons.

Setelah OpenAI, banyak pesaing seperti Google, Anthropic, dan DeepSeek juga memperkenalkan model penalaran serupa. Meskipun tidak sempurna, ini tetap merupakan teknologi peningkatan chatbot yang dipercaya oleh banyak pengembang.

Bagaimana AI bernalar

Pada dasarnya, kemampuan penalaran berarti bahwa chatbot dapat menghabiskan lebih banyak waktu untuk menyelesaikan masalah yang diajukan oleh pengguna.

"Penalaran adalah bagaimana sistem melakukan pekerjaan tambahan setelah menerima pertanyaan," kata Dan Klein, seorang profesor ilmu komputer di Universitas California, kepada New York Times .

Sistem logika dapat memecah masalah menjadi langkah-langkah yang lebih kecil dan terpisah, atau menyelesaikannya melalui metode coba-coba.

Saat pertama kali diluncurkan, ChatGPT dapat menjawab pertanyaan secara instan dengan mengekstrak dan mensintesis informasi. Sebaliknya, sistem penalaran membutuhkan beberapa detik (atau bahkan menit) lebih lama untuk menyelesaikan masalah dan memberikan respons.

AI ly luan, OpenAI o1 va ChatGPT, mo hinh ly luan, tri tue nhan tao anh 1

Contoh proses penalaran model O1 dalam chatbot layanan pelanggan. Gambar: OpenAI .

Dalam beberapa kasus, sistem penalaran akan mengubah pendekatannya terhadap masalah, terus menerus meningkatkan solusi. Selain itu, model tersebut dapat menguji beberapa solusi sebelum membuat pilihan optimal, atau memeriksa keakuratan respons sebelumnya.

Secara umum, sistem penalaran akan mempertimbangkan semua kemungkinan jawaban atas pertanyaan tersebut. Ini mirip dengan siswa sekolah dasar yang menuliskan banyak pilihan di atas kertas sebelum memilih solusi yang paling tepat untuk suatu soal matematika.

Menurut New York Times , AI kini mampu bernalar tentang hampir semua topik. Namun, AI akan paling efektif untuk pertanyaan yang berkaitan dengan matematika, sains, dan pemrograman komputer.

Bagaimana sistem teori tersebut dilatih?

Pada chatbot biasa, pengguna masih dapat meminta penjelasan tentang proses atau memverifikasi keakuratan respons. Bahkan, banyak dataset pelatihan ChatGPT sudah menyertakan prosedur pemecahan masalah.

Sistem penalaran menjadi lebih canggih lagi ketika dapat melakukan operasi tanpa masukan dari pengguna. Proses ini lebih kompleks dan luas. Perusahaan menggunakan kata "penalaran" karena sistem tersebut beroperasi mirip dengan cara manusia berpikir.

Banyak perusahaan, seperti OpenAI, memperkirakan sistem penalaran akan menjadi solusi terbaik untuk meningkatkan kinerja chatbot saat ini. Selama bertahun-tahun, mereka percaya bahwa chatbot akan berkinerja lebih baik jika semakin banyak informasi yang diberikan kepada mereka di internet.

Pada tahun 2024, sistem AI akan menggunakan hampir semua teks yang tersedia di internet. Ini berarti perusahaan perlu menemukan solusi baru untuk meningkatkan kemampuan chatbot, termasuk sistem penalaran.

AI ly luan, OpenAI o1 va ChatGPT, mo hinh ly luan, tri tue nhan tao anh 2

Startup DeepSeek pernah引起 sensasi dengan model penalaran mereka yang memiliki biaya lebih rendah daripada OpenAI. Foto: Bloomberg .

Sejak tahun lalu, perusahaan seperti OpenAI telah fokus pada teknik pembelajaran penguatan (reinforcement learning). Proses ini biasanya memakan waktu beberapa bulan, di mana AI mempelajari perilaku melalui uji coba dan kesalahan.

Sebagai contoh, dengan menyelesaikan ribuan masalah, sistem dapat mengidentifikasi metode optimal untuk mendapatkan jawaban yang benar. Dari situ, para peneliti membangun mekanisme umpan balik yang canggih yang membantu sistem membedakan antara solusi yang benar dan yang salah.

"Ini mirip dengan cara Anda melatih anjing. Jika sistemnya bekerja dengan baik, Anda memberinya hadiah. Jika tidak, Anda mengatakan, 'Anjing itu nakal,'" jelas Jerry Tworek, seorang peneliti di OpenAI.

Apakah AI adalah masa depan?

Menurut New York Times , teknik pembelajaran penguatan (reinforcement learning) efektif ketika berurusan dengan persyaratan dalam matematika, sains, dan pemrograman komputer. Ini adalah bidang-bidang di mana jawaban yang benar atau salah dapat didefinisikan dengan jelas.

Sebaliknya, pembelajaran penguatan tidak efektif dalam penulisan, filsafat, atau etika—bidang-bidang di mana membedakan antara baik dan buruk itu sulit. Meskipun demikian, para peneliti menegaskan bahwa teknik ini masih dapat meningkatkan kinerja AI, bahkan dengan pertanyaan-pertanyaan non-matematis.

"Sistem akan mempelajari jalur yang mengarah ke hasil positif dan negatif," kata Jared Kaplan, Kepala Petugas Ilmiah di Anthropic.

AI ly luan, OpenAI o1 va ChatGPT, mo hinh ly luan, tri tue nhan tao anh 3

Situs web Anthropic, perusahaan rintisan yang memiliki model AI Claude. Foto: Bloomberg .

Penting untuk dicatat bahwa pembelajaran penguatan (reinforcement learning) dan sistem penalaran (reasoning systems) adalah dua konsep yang berbeda. Secara spesifik, pembelajaran penguatan adalah metode untuk membangun sistem penalaran. Ini adalah tahap pelatihan terakhir untuk memungkinkan chatbot melakukan penalaran.

Karena masih relatif baru, para ilmuwan belum dapat memastikan apakah penalaran chatbot atau pembelajaran penguatan dapat membantu AI berpikir seperti manusia. Perlu dicatat bahwa banyak tren pelatihan AI saat ini berkembang sangat cepat di awal dan kemudian secara bertahap melambat.

Selain itu, penalaran chatbot masih dapat membuat kesalahan. Berdasarkan probabilitas, sistem akan memilih proses yang paling mirip dengan data yang telah dipelajarinya, baik dari internet maupun melalui pembelajaran penguatan (reinforcement learning). Oleh karena itu, chatbot masih dapat memilih solusi yang salah atau tidak logis.

Sumber: https://znews.vn/ai-ly-luan-nhu-the-nao-post1541477.html