![]() |
Logo Google Gemini. Foto: Bloomberg . |
Google melancarkan model Gemini 3 pada akhir November. Syarikat itu memperkenalkan beberapa peningkatan ketara seperti keupayaan pengekodan yang dipertingkatkan, penciptaan imej visual dan ejen yang melaksanakan tugas tertentu bagi pihak pengguna.
Semasa memperkenalkan Gemini 3, Google menekankan bahawa ia merupakan "model paling pintar syarikat setakat ini." Pengalaman dunia sebenar menunjukkan bahawa model tersebut diproses dengan lebih pantas dan mempunyai keupayaan penaakulan yang lebih baik, walaupun masih terdapat beberapa perkara yang perlu diperbaiki.
Cipta antara muka interaktif dengan cepat.
Salah satu penaiktarafan utama dalam Gemini 3 berkisar pada Canvas. Ini adalah ruang kerja interaktif dalam Gemini yang membolehkan anda meminta chatbot untuk menulis kod, menggambarkan hasil dan mengedit kandungan.
Apabila Gemini 3 diminta untuk mencipta model 3D bagi perbezaan saiz antara bola sepak, Bumi, Matahari dan Bima Sakti, alat tersebut mengaktifkan antara muka pengekodan, memproses dan mewujudkan persekitaran interaktif, yang membolehkan pengguna memilih dan membandingkan saiz objek.
![]() |
Keupayaan untuk mencipta ruang interaktif menggunakan ciri Kanvas dalam Gemini 3. |
Berbanding dengan demo Google, kualiti imejnya sedikit rendah. Walau bagaimanapun, maklumat tentang objek adalah jelas dan mudah difahami. Masa pemprosesan adalah lebih kurang 2 minit. Dalam antara muka Canvas, pengguna boleh mengedit kod secara langsung, menyalin atau berkongsi kandungan.
Dengan arahan lain, Gemini 3 diminta untuk mencipta model 3D ala kiub (voxel) seekor helang yang bertenggek di dahan pokok. Alat tersebut menghasilkan keputusan dalam masa kira-kira 45 saat, dan pengguna boleh mengezum masuk dan memutarkan paparan menggunakan tetikus. Walau bagaimanapun, beberapa butiran dalam imej mempunyai ralat grafik dan tidak dipaparkan dengan stabil.
Helang yang hinggap di dahan pokok juga ada, tetapi keperluannya lebih sukar (model 3D). Pada mulanya, kod yang dijana oleh Gemini 3 gagal dan tidak dapat dijalankan. Selepas meminta pengubahsuaian, imej tersebut muncul dan menjadi interaktif.
![]() |
Keupayaan Gemini 3 untuk mewujudkan persekitaran interaktif. |
Walaupun terdapat beberapa isu yang masih berlarutan, peralihan daripada model soal jawab kepada pendekatan penyuntingan kolaboratif merupakan hala tuju yang menarik, menjadikan Gemini 3 berguna untuk tugasan jangka panjang yang kompleks.
Sudah tentu, Gemini 3 bukan sekadar untuk mencipta grafik atau model visual. Google sedang menguji ciri "UI Generatif" untuk pengguna AI Pro. Dengan arahan tertentu, model ini boleh mencipta antara muka interaktif ala majalah atau laman web visual.
Google mengatakan ciri ini sedang dilancarkan secara berperingkat. Menurut pengalaman The Verge , pengguna perlu memilih ciri Tata Letak Visual , kemudian masukkan arahan seperti "Rancang perjalanan 3 hari saya ke Rom."
Selepas diproses, Gemini 3 menjana hasil yang serupa dengan laman web pelancongan , lengkap dengan jadual perjalanan, imej terperinci dan beberapa soalan tentang pilihan perjalanan dan tabiat pemakanan. Model tersebut kemudiannya melaraskan jawapan dengan sewajarnya. Ciri ini juga agak berguna untuk topik seperti cara memasang komputer atau membina akuarium.
Penaakulan dan analisis yang lebih berkesan.
Menurut Google, Gemini 3 mempunyai keupayaan penaakulan yang lebih baik berbanding pendahulunya. Syarikat itu mendakwa bahawa keupayaan penaakulan Gemini 3 Pro mencapai tahap kedoktoran, mendapat markah 37.5% dalam Peperiksaan Terakhir Humanity dan 91.9% dalam peperiksaan GPQA Diamond.
Sudah tentu, pengguna hanya dapat benar-benar menghargai perbezaannya apabila berinteraksi secara langsung dengan model tersebut. Apabila diminta untuk menyelesaikan masalah daripada set soalan rujukan GPQA Diamond (difokuskan pada peringkat kedoktoran), Gemini 3 Pro mengambil masa kira-kira 30 saat untuk memberikan penyelesaian terperinci, termasuk arahan langkah demi langkah dan imej ilustrasi.
![]() |
Gemini 3 boleh menjawab soalan yang rumit, menunjukkan kebolehan berfikir yang setaraf dengan peringkat PhD. |
Menurut penilaian, penyelesaiannya agak terperinci dan mengikut prosedur yang betul. Sebagai perbandingan, GPT-5.1 juga mengambil masa kira-kira 30 saat untuk menjawab dengan betul, tetapi penyelesaiannya kurang terperinci. Begitu juga, Claude 4.5 Sonnet menjawab dengan betul dan lebih pantas daripada Gemini 3, tetapi kurang terperinci.
Google mengatakan Gemini 3 boleh mengekstrak dokumen secara serentak daripada pelbagai sumber, seperti teks, imej dan video . Tugas yang belum pernah dilatih sebelum ini juga dikendalikan dengan lebih baik pada Gemini 3.
![]() |
Keupayaan analisis video Gemini 3. |
Contohnya, apabila diminta untuk menganalisis topik utama video berdurasi 57 minit, Gemini 3 hanya mengambil masa kira-kira seminit untuk memberikan hasil termasuk hujah dan cap masa yang diminta kepada segmen video yang sepadan. Begitu juga, model tersebut mengenal pasti video tenis dengan betul, menganalisis perlawanan dan gaya permainan setiap atlet.
Pengguna boleh meminta Gemini 3 untuk menonton video dan merujuk kepada sumber luaran secara serentak, malah boleh bertanya soalan untuk analisis yang lebih mendalam. Secara keseluruhan, Gemini 3 agak responsif dalam tugasan analitikal dan rujukan dokumen, sebahagiannya disebabkan oleh hubungannya dengan pangkalan data Carian Google.
Ejen itu membantu, tetapi masih ada masalah.
Ciri Ejen juga merupakan peningkatan ketara pada Gemini 3. Bagi pengguna pelan AI Ultra (pada masa ini hanya tersedia di pasaran AS), mod ini boleh melaksanakan tugas kompleks bagi pihak pengguna, seperti mengkategorikan dan menyusun e-mel, mencari maklumat dan menempah tiket perjalanan.
Semasa melancarkan Gemini 3, Google menggunakan contoh keupayaan untuk mengatur peti masuk dalam Gmail. Menurut pengalaman The Verge , ciri ini berfungsi seperti yang diminta: mencipta senarai lengkap e-mel yang belum dibaca selama seminggu.
Sama seperti ciri Canvas, senarai e-mel dan tindakan yang dicadangkan dipaparkan di kawasan berasingan. Gemini menawarkan beberapa pilihan seperti menetapkan peringatan untuk e-mel penting, mengarkibkan e-mel promosi, dsb.
![]() |
Ciri ejen Gemini 3 membantu mengurus peti masuk Gmail. Imej: The Verge . |
Apabila diminta untuk membuat peringatan pembayaran bil, Gemini dengan cepat memasukkan maklumat yang berkaitan ke dalam Google Tasks. Untuk tugasan pembayaran, ejen akan menavigasi dan berhenti secara automatik apabila pengguna memerlukan maklumat pembayaran.
Secara keseluruhannya, ejen Gemini 3 agak berguna dalam mengesan e-mel yang pengguna cenderung lupa. Alat ini juga boleh mencari dan berhenti melanggan e-mel daripada alamat pengiklanan, yang tidak lagi berguna.
Malah, ejen sesetengah chatbot seperti Perplexity dan ChatGPT sudah menyokong penyepaduan dengan Gmail. Walau bagaimanapun, Gemini menawarkan keupayaan penyepaduan yang paling pelbagai. Contohnya, pengguna Perplexity perlu memasukkan e-mel yang ingin disimpan atau dipadam secara khusus, manakala tindakan ini boleh dilakukan melalui butang pada Gemini.
![]() |
Ciri penciptaan antara muka interaktif Gemini 3. Foto: The Verge . |
Ciri penyusunan e-mel pada ChatGPT juga tidak stabil. Walau bagaimanapun, kelajuan penghantaran e-mel Gemini adalah lebih perlahan daripada Perplexity. Sesetengah tugas, seperti membuat tempahan restoran, kadangkala menghadapi masalah.
Walaupun ia sentiasa memerlukan pengesahan pengguna sebelum melakukan tindakan sensitif seperti pembayaran atau menghantar e-mel, mendelegasikan tugas tertentu kepada AI masih membuatkan pengguna teragak-agak. Mod ejen pada Gemini 3 agak berguna, tetapi pengguna masih perlu memantau output.
Sumber: https://znews.vn/gemini-3-tot-den-dau-post1607493.html













Komen (0)