![]() |
Logo Google Gemini. Foto: Bloomberg . |
Google meluncurkan model Gemini 3 pada akhir November. Perusahaan ini menghadirkan serangkaian peningkatan penting seperti peningkatan kemampuan pengkodean, visualisasi, dan agen yang menjalankan tugas-tugas tertentu untuk pengguna.
Saat memperkenalkan Gemini 3, Google menekankan bahwa ini adalah "model terpintar" perusahaan tersebut. Pengalaman praktis menunjukkan bahwa model ini memproses lebih cepat dan memiliki kemampuan penalaran yang lebih baik, meskipun ada beberapa faktor yang perlu ditingkatkan.
Buat antarmuka interaktif dengan cepat
Salah satu peningkatan besar dalam Gemini 3 berkisar pada Canvas, ruang kerja interaktif di Gemini yang memungkinkan Anda meminta chatbot untuk menulis kode, memvisualisasikan hasil, dan mengedit konten.
Saat Gemini 3 diminta untuk membuat model 3D mengenai perbedaan antara ukuran bola sepak, Bumi, Matahari, dan Bima Sakti, alat tersebut memicu antarmuka pengkodean, pemrosesan, dan pembuatan interaktif yang memungkinkan objek dipilih dan dibandingkan ukurannya.
![]() |
Kemampuan untuk membuat ruang interaktif dengan fitur Canvas di Gemini 3. |
Dibandingkan dengan demo Google, hasilnya sedikit lebih buruk dalam hal kualitas gambar. Sebagai gantinya, informasi tentang objek diberikan dengan jelas dan mudah dipahami. Waktu pemrosesan sekitar 2 menit. Di antarmuka Canvas, pengguna dapat langsung mengedit kode, menyalin, atau membagikan konten.
Dengan perintah lain, Gemini 3 diminta untuk membuat elang bergaya voxel yang sedang bertengger di dahan pohon. Alat tersebut memberikan hasil setelah sekitar 45 detik, dan pengguna dapat memperbesar dan memutar tampilan menggunakan tetikus. Namun, beberapa detail pada gambar memiliki kesalahan grafis dan tidak ditampilkan dengan benar.
Juga dengan seekor elang bertengger di dahan pohon, tetapi dengan permintaan yang lebih sulit (model 3D). Pertama kali kode yang dihasilkan oleh Gemini 3 mengalami crash dan gagal dijalankan. Setelah meminta perbaikan, gambar tersebut muncul dan bersifat interaktif.
![]() |
Kemampuan pembuatan lingkungan interaktif Gemini 3. |
Meskipun ada beberapa masalah, peralihan dari model tanya jawab ke penyuntingan kolaboratif merupakan arah menarik yang akan membuat Gemini 3 berguna untuk tugas-tugas kompleks dan jangka panjang.
Tentu saja, Gemini 3 bukan hanya untuk membuat grafik atau model visual. Google sedang menguji fitur "Generative UI" untuk pengguna AI Pro. Dengan beberapa perintah, model ini dapat membuat antarmuka interaktif bergaya majalah atau situs web visual.
Google mengatakan fitur ini diluncurkan secara bertahap. Seperti yang dialami The Verge , pengguna perlu memilih fitur Tata Letak Visual , lalu mengetik perintah seperti "Rencanakan perjalanan 3 hari ke Roma."
Setelah diproses, Gemini 3 menghasilkan hasil yang mirip dengan situs web perjalanan dengan jadwal dan gambar detail, beserta sejumlah pertanyaan tentang preferensi perjalanan dan gaya makan. Dari sana, model akan menyesuaikan jawaban. Fitur ini juga cukup berguna untuk topik-topik seperti cara merakit komputer, membuat akuarium, dll.
Berpikir dan menganalisis dengan lebih efektif
Menurut Google, Gemini 3 memiliki kemampuan penalaran yang lebih baik daripada pendahulunya. Perusahaan mengklaim bahwa kemampuan penalaran Gemini 3 Pro berada di level doktoral, dengan skor 37,5% pada Ujian Akhir Kemanusiaan, dan 91,9% pada ujian GPQA Diamond.
Tentu saja, pengguna hanya dapat merasakan perbedaannya ketika berinteraksi langsung dengan model tersebut. Ketika diminta untuk menyelesaikan soal yang diambil dari rangkaian referensi GPQA Diamond (yang berfokus pada tingkat doktoral), Gemini 3 Pro membutuhkan waktu sekitar 30 detik untuk memberikan solusi yang detail, termasuk setiap langkah soal dan gambar ilustrasi.
![]() |
Gemini 3 dapat menjawab pertanyaan yang rumit, kemampuan berpikir setara dengan tingkat PhD. |
Menurut penilaian, solusinya cukup detail dan mengikuti prosedur. Sebagai perbandingan, GPT-5.1 juga membutuhkan waktu sekitar 30 detik, dijawab dengan benar, tetapi solusinya kurang detail. Demikian pula, Claude 4.5 Sonnet menjawab dengan benar, lebih cepat daripada Gemini 3, tetapi dengan detail yang lebih sedikit.
Google mengklaim Gemini 3 dapat mengekstrak dokumen dari berbagai sumber sekaligus, seperti teks, gambar, dan video . Tugas-tugas yang belum pernah dilatih sebelumnya juga ditangani dengan lebih baik di Gemini 3.
![]() |
Kemampuan analisis video Gemini 3. |
Misalnya, ketika diminta menganalisis topik utama video berdurasi 57 menit, Gemini 3 hanya membutuhkan waktu sekitar satu menit untuk menampilkan hasil yang mencakup argumen yang diminta, beserta stempel waktu untuk bagian video yang bersangkutan. Demikian pula, model tersebut dengan tepat mengidentifikasi video tentang tenis, menganalisis pertandingan dan cara bermain setiap pemain.
Pengguna dapat meminta Gemini 3 untuk menonton video sambil merujuk sumber eksternal, dan bahkan mengajukan pertanyaan untuk analisis yang lebih mendalam. Secara keseluruhan, Gemini 3 cukup responsif dalam menganalisis dan merujuk dokumen, sebagian berkat koneksinya ke basis data Google Penelusuran.
Agen membantu tetapi memiliki masalah
Agent juga merupakan peningkatan penting pada Gemini 3. Bagi pengguna paket AI Ultra (saat ini hanya mendukung pasar AS), mode ini dapat melakukan proses kompleks atas nama pengguna seperti menyortir dan mengatur email, mencari informasi, memesan tiket perjalanan, dan sebagainya.
Saat Google meluncurkan Gemini 3, ia memamerkan kemampuan untuk mengatur kotak masuk di Gmail, dan berdasarkan pengalaman The Verge , ia bekerja persis seperti yang seharusnya: ia menghasilkan daftar lengkap email yang belum dibaca dari seminggu.
Mirip dengan fitur Canvas, daftar email dan saran tindakan ditampilkan di area terpisah. Gemini menyediakan beberapa opsi seperti mengatur pengingat untuk email penting, mengarsipkan email promosi, dan sebagainya.
![]() |
Fitur agen Gemini 3 mendukung pengelolaan kotak masuk Gmail. Foto: The Verge . |
Ketika diminta untuk membuat pengingat pembayaran tagihan, Gemini dengan cepat memasukkan informasi yang relevan ke Google Tasks. Untuk tugas pembayaran, agen secara otomatis menavigasi dan berhenti ketika pengguna perlu memasukkan informasi pembayaran.
Secara keseluruhan, agen Gemini 3 cukup berguna dalam mendeteksi email yang kemungkinan besar terlupakan oleh pengguna. Alat ini juga dapat menemukan dan berhenti berlangganan email dari alamat iklan yang tidak lagi berguna.
Faktanya, beberapa agen chatbot seperti Perplexity dan ChatGPT sudah mendukung integrasi Gmail. Namun, kemampuan integrasi Gemini sangat beragam. Misalnya, pengguna Perplexity harus memasukkan email yang ingin mereka simpan atau hapus secara spesifik, sementara Gemini dapat melakukan operasi melalui tombol.
![]() |
Fitur pembuatan antarmuka interaktif Gemini 3. Foto: The Verge . |
Fitur penjadwalan email ChatGPT juga tidak konsisten. Namun, kecepatan pengiriman email Gemini lebih lambat daripada Perplexity. Beberapa tugas, seperti memesan tempat di restoran, terkadang bermasalah.
Meskipun selalu memerlukan konfirmasi pengguna sebelum melakukan tindakan sensitif seperti melakukan pembayaran atau mengirim email, menyerahkan beberapa tugas kepada AI masih membuat pengguna ragu. Mode agen pada Gemini 3 cukup berguna, tetapi pengguna tetap harus memantau hasilnya.
Sumber: https://znews.vn/gemini-3-tot-den-dau-post1607493.html

















Komentar (0)