Banyak kandidat berkomentar bahwa tes matematika itu panjang dan sulit diselesaikan dalam 90 menit. Namun, hal ini bukan halangan bagi AI. Foto: Duy Hieu . |
Pada sore hari tanggal 26 Juni, para peserta menyelesaikan tes matematika dalam ujian kelulusan SMA tahun 2025, dengan batas waktu 90 menit. Ini merupakan ujian pertama setelah Kementerian Pendidikan dan Pelatihan menerapkan format baru, yang kabarnya lebih sulit dibandingkan tahun-tahun sebelumnya.
Meskipun soal matematika tahun ini mungkin sulit bagi para kandidat karena panjang dan memakan waktu, chatbot AI tidak membutuhkan banyak waktu untuk diproses. Untuk menguji efektivitas AI, Tri Thuc - Znews menggunakan 4 chatbot, termasuk ChatGPT, Google Gemini, Claude AI, dan Grok AI, untuk menyelesaikan beberapa soal esai ujian kelulusan SMA tahun ini.
Pemrosesan cepat, hasil "cocok atau tidak"
Chatbot digunakan untuk menjawab pertanyaan singkat pada kode tes 0109. Di antara keduanya, ChatGPT dan Gemini memberikan hasil paling akurat dengan penundaan paling singkat. Kedua chatbot menjawab 6 pertanyaan dengan waktu 7-15 detik untuk setiap pertanyaan. Namun, Gemini mampu menyelesaikan soal-soal di atas dengan model Flash 2.5 (tanpa penalaran), yang membantu pemrosesan lebih cepat dan komprehensif.
Sementara itu, Claude gagal total dalam perhitungannya, selalu memberikan hasil yang salah. Meskipun diminta menghitung ulang, chatbot Anthropic tetap memberikan jawaban yang sama. Grok menjawab sekitar separuh pertanyaan dengan benar, tetapi dengan waktu respons yang lama (lebih dari 2 menit untuk setiap pertanyaan).
Untuk ChatGPT dan Grok, penyelesaian pertanyaan-pertanyaan ini membutuhkan versi inferensi, yang membutuhkan waktu lebih lama. Gemini sangat cepat, mungkin 5 detik untuk pertanyaan tercepat, dan hanya menggunakan model Flash 2.5.
ChatGPT menyajikan proses berpikir dengan sangat jelas. |
Dalam hal kecepatan, Gemini memiliki waktu pemrosesan tercepat, rata-rata kurang dari 10 detik per soal, tetapi memiliki solusi yang lebih kompleks, bertele-tele, dan sulit dipahami. Berikutnya adalah model inferensi ChatGPT, yang rata-rata membutuhkan waktu 25 detik. Sementara itu, meskipun masih mendapatkan hasil yang benar, Grok membutuhkan waktu lama untuk bernalar, dengan 148 detik untuk soal yang cukup sulit.
Meskipun ditanyakan dalam bahasa Vietnam, ketiga model menyajikan proses penalaran mereka dalam bahasa Inggris. ChatGPT memiliki deskripsi yang paling ringkas, dengan banyak ilustrasi, grafik, dan analisis yang mudah dipahami. Gemini juga mengklarifikasi dan menyajikan pemikiran model secara berurutan.
Grok, khususnya, memiliki proses berpikir yang paling mirip manusia. Modelnya terus-menerus bertanya pada dirinya sendiri, "Namun, tunggu, sebaliknya," seperti yang dilakukan siswa ketika memecahkan soal matematika. Hal ini dapat menyebabkan chatbot terlalu banyak berpikir dan memperlambat waktu respons.
Grok membutuhkan waktu 148 detik untuk menguraikan hasilnya. |
AI memecahkan matematika secara berbeda dari manusia
Sebuah studi dari Apple menemukan bahwa model inferensi tidak benar-benar menggunakan otak mereka, melainkan hanya belajar dari hafalan data yang ada. Studi ini juga menunjukkan bahwa AI memiliki proses berpikir yang sama sekali berbeda dengan manusia, sehingga mereka mencoba meniru cara kita memecahkan masalah. Namun, ada kemungkinan bahwa proses penalaran tersebut hanya dibuat oleh model.
Di tengah ujian kelulusan SMA yang semakin sulit dan menuntut kemampuan berpikir analitis yang tinggi, penggunaan AI untuk referensi dan pembelajaran bukan lagi hal yang asing bagi siswa. Di antara chatbot yang telah disebutkan, ChatGPT dan Gemini adalah dua pilihan yang tepat bagi pembelajar mandiri untuk merujuk solusi atas soal-soal sulit.
![]() |
Siswa Hanoi mengikuti ujian kelulusan SMA tahun 2025. Foto: Viet Ha . |
Namun, meskipun AI menghasilkan hasil dengan cepat dan mudah, proses penalarannya belum sepenuhnya dipahami oleh para pengembang. Dalam lingkungan akademis, kemampuan berpikir manusia masih menjadi faktor inti. Bapak Tuan Nguyen, seorang dosen di sebuah universitas internasional di Kota Ho Chi Minh, mengatakan bahwa penggunaan AI adalah hal yang wajar, tetapi mahasiswa perlu memahami materi, melatih berpikir kritis, dan menguasai perangkat cerdas agar dapat belajar lebih efektif.
Bapak Tran Manh Tung, Kepala Departemen Matematika di Sekolah Menengah Newton, berkomentar bahwa format ujian tersebut serupa dengan ujian contoh yang sebelumnya dirilis oleh Kementerian Pendidikan dan Pelatihan. "Namun, jika kita bandingkan, ujian yang sebenarnya lebih sulit dan memiliki lebih banyak perbedaan dibandingkan ujian tiruan," komentarnya.
Ujian tahun ini terdiri dari tiga bagian yang sesuai dengan tiga angka Romawi. Dua bagian pertama berupa pilihan ganda, tidak terlalu sulit bagi para kandidat untuk mendapatkan poin dengan mudah, kata Bapak Tung. Namun, bagian-bagian selanjutnya berupa pertanyaan singkat, mirip dengan format esai dari beberapa tahun yang lalu, hanya saja para kandidat hanya perlu mengisi hasil dan tidak perlu mempresentasikannya.
Sumber: https://znews.vn/ai-chi-mat-10-giay-de-giai-bai-toan-thi-tot-nghiep-thpt-post1563990.html











Komentar (0)