Vietnam.vn - Nền tảng quảng bá Việt Nam

Pertemuan khusus di mana para matematikawan berusaha mengalahkan kecerdasan buatan

Para matematikawan top dunia bertemu secara rahasia untuk menemukan cara mengalahkan kecerdasan buatan (AI), tetapi mereka kagum dengan kemampuan AI.

VietnamPlusVietnamPlus20/05/2025

Pada suatu akhir pekan di pertengahan Mei, sebuah pertemuan rahasia dunia matematika berlangsung. Tiga puluh matematikawan terkemuka dunia diam-diam pergi ke Berkeley, California, AS, untuk menghadiri konfrontasi dengan sebuah chatbot yang mampu "bernalar". Chatbot tersebut ditugaskan untuk memecahkan soal-soal yang ditulis oleh para matematikawan itu sendiri, untuk menguji kemampuannya dalam memecahkan masalah.

Setelah dua hari terus-menerus mengajukan pertanyaan tingkat profesor, para matematikawan terkejut saat menyadari bahwa chatbot ini dapat memecahkan beberapa masalah tersulit yang pernah dipecahkan dalam sejarah.

"Saya melihat rekan-rekan mengatakan secara langsung bahwa model bahasa yang besar ini mendekati tingkat kejeniusan matematika," ujar Ken Ono, seorang profesor di Universitas Virginia sekaligus ketua dan juri pertemuan tersebut, kepada Scientific American.

Chatbot yang menarik perhatian kami didukung oleh o4-mini , sebuah model bahasa besar (LLM) yang dirancang untuk penalaran kompleks. Model ini merupakan produk OpenAI dan dilatih untuk melakukan penalaran yang canggih. Model serupa dari Google, Gemini 2.5 Flash, memiliki kemampuan serupa.

Seperti LLM ChatGPT sebelumnya, o4-mini belajar memprediksi kata berikutnya dalam string teks. Namun, o4-mini adalah versi yang lebih ringan dan lebih fleksibel yang dilatih pada data mendalam dan disetel secara cermat oleh manusia — memungkinkannya untuk mendalami masalah matematika yang tidak dapat dijangkau oleh model sebelumnya.

Untuk menguji kemampuan o4-mini, OpenAI meminta Epoch AI, sebuah lembaga nirlaba yang mengkhususkan diri dalam pengujian model LLM, untuk membuat 300 soal matematika yang belum pernah dipublikasikan sebelumnya. Meskipun LLM tradisional dapat memecahkan banyak soal kompleks, ketika dihadapkan dengan soal yang benar-benar baru, kebanyakan dari mereka hanya menjawab kurang dari 2% dengan benar, menunjukkan bahwa mereka tidak benar-benar mampu bernalar.

Dalam proyek evaluasi baru ini, Epoch AI merekrut matematikawan muda Dr. Elliot Glazer sebagai pemimpinnya. Proyek baru ini, yang disebut FrontierMath , akan diluncurkan mulai September 2024.

Proyek ini mengumpulkan pertanyaan-pertanyaan baru dalam empat tingkat kesulitan, mulai dari tingkat sarjana, pascasarjana, hingga penelitian lanjutan. Pada April 2025, Glazer menemukan bahwa o4-mini dapat menyelesaikan sekitar 20% dari soal-soal tersebut. Oleh karena itu, ia meningkatkannya hingga ke tingkat 4—memintanya untuk menyelesaikan soal-soal yang bahkan sulit dipecahkan oleh matematikawan tingkat lanjut.

Peserta dipaksa menandatangani perjanjian kerahasiaan dan hanya dapat berkomunikasi melalui aplikasi terenkripsi Signal, karena penggunaan email dapat memungkinkan LLM memindai dan “mengendus” konten, sehingga memalsukan data evaluasi.

Setiap masalah yang tidak dapat dipecahkan oleh o4-mini akan memberikan hadiah sebesar 7.500 USD kepada penanya.

Tim awal menunjukkan kemajuan yang lambat namun stabil dalam mengajukan pertanyaan. Namun, Glazer memutuskan untuk mempercepat proses dengan mengadakan pertemuan tatap muka pada 17-18 Mei. Ke-30 matematikawan yang berpartisipasi dibagi menjadi enam kelompok, yang saling berkompetisi—bukan untuk memecahkan masalah, melainkan untuk menemukan masalah yang tidak dapat dipecahkan oleh AI.

Menjelang malam tanggal 17 Mei, Ken Ono mulai frustrasi dengan chatbot tersebut, yang menunjukkan tingkat kemahiran matematika jauh melampaui yang diharapkan, sehingga menyulitkan tim untuk "menjebaknya". "Saya menemukan sebuah masalah yang oleh para ahli di bidang ini akan dikenali sebagai masalah terbuka dalam teori bilangan—masalah yang cocok untuk gelar PhD," ujarnya.

Hasilnya, ketika ia bertanya kepada o4-mini, ia terkejut melihat chatbot tersebut menganalisis, bernalar, dan menghasilkan solusi yang tepat hanya dalam 10 menit. Lebih tepatnya, dalam dua menit pertama, chatbot tersebut mempelajari dan memahami semua dokumen yang relevan. Kemudian, chatbot tersebut mengusulkan untuk mencoba versi masalah yang lebih sederhana guna mempelajari cara menyelesaikannya.

Lima menit kemudian, chatbot itu memberikan jawaban yang benar, berbicara dengan nada percaya diri — bahkan arogan. "Mulai berani," kata Ono, "Dan menambahkan: 'Tidak perlu kutipan karena saya sudah menemukan nomor rahasianya!'"

Dikalahkan oleh AI, pada dini hari tanggal 18 Mei, Ono langsung mengirimkan pesan peringatan kepada tim melalui Signal. "Saya sama sekali tidak siap menghadapi model seperti ini," ujarnya. "Saya belum pernah melihat penalaran seperti ini dalam model komputer. Ia berpikir seperti ilmuwan sungguhan. Dan itu menakutkan."

Meskipun para matematikawan akhirnya berhasil menemukan 10 pertanyaan yang membuat o4-mini bingung, mereka tetap tidak dapat menyembunyikan keterkejutan mereka pada kecepatan perkembangan AI hanya dalam satu tahun.

Ono membandingkan pengalaman bekerja dengan o4-mini dengan berkolaborasi dengan seorang kolega yang sangat berbakat. Dan Yang Hui He, seorang matematikawan di London Institute of Mathematical Sciences dan pelopor dalam penerapan AI pada matematika, berkomentar: "Inilah yang dapat dilakukan oleh seorang mahasiswa PhD yang sangat, sangat berbakat — dan bahkan lebih."

Dan perlu dicatat bahwa AI melakukannya jauh lebih cepat daripada manusia. Manusia membutuhkan waktu berminggu-minggu atau berbulan-bulan untuk menyelesaikannya, sementara o4-mini hanya membutuhkan beberapa menit.

Kegembiraan seputar o4-mini bukannya tanpa kekhawatiran. Baik Ono maupun He memperingatkan bahwa kemampuan o4-mini dapat membuat orang terlalu percaya diri. "Kita punya bukti dengan induksi, bukti dengan kontradiksi, dan sekarang bukti dengan... luar biasa," kata He. "Jika Anda mengatakan sesuatu dengan cukup yakin, orang-orang akan terintimidasi. Saya pikir o4-mini telah menguasai jenis bukti ini: ia mengatakan segalanya dengan sangat yakin."

Menjelang akhir pertemuan, para matematikawan mulai memikirkan masa depan matematika. Mereka membahas kemungkinan "tingkat kelima"—pertanyaan yang bahkan tidak dapat dipecahkan oleh matematikawan terbaik dunia. Jika AI mencapai ambang batas tersebut, peran matematikawan akan berubah drastis: mungkin mereka akan menjadi penanya, berinteraksi dengan dan memandu penalaran AI untuk menemukan kebenaran matematika baru—mirip dengan cara seorang profesor bekerja dengan mahasiswa pascasarjana.

"Saya sudah lama memberi tahu rekan-rekan saya bahwa menganggap AI umum tidak akan pernah terjadi, bahwa itu hanyalah komputer, adalah kesalahan besar," kata Ono. "Saya tidak ingin panik, tetapi dalam beberapa hal, model-model bahasa besar ini sudah mulai melampaui sebagian besar mahasiswa PhD terbaik dunia."

(Vietnam+)

Sumber: https://www.vietnamplus.vn/cuoc-gap-go-dac-biet-noi-cac-nha-toan-hoc-tim-cach-danh-bai-tri-tue-nhan-tao-post1043183.vnp


Komentar (0)

No data
No data

Dalam kategori yang sama

Habiskan jutaan untuk belajar merangkai bunga, temukan pengalaman kebersamaan selama Festival Pertengahan Musim Gugur
Ada bukit bunga Sim ungu di langit Son La
Tersesat dalam perburuan awan di Ta Xua
Keindahan Teluk Ha Long telah diakui oleh UNESCO sebagai situs warisan tiga kali.

Dari penulis yang sama

Warisan

;

Angka

;

Bisnis

;

No videos available

Peristiwa terkini

;

Sistem Politik

;

Lokal

;

Produk

;