![]() |
Logo Google Gemini. Foto: Bloomberg . |
Google melancarkan model Gemini 3 pada akhir November. Syarikat itu membawa satu siri peningkatan ketara seperti keupayaan pengekodan yang dipertingkatkan, visualisasi dan ejen, melaksanakan tugas tertentu bagi pihak pengguna.
Apabila memperkenalkan Gemini 3, Google menekankan bahawa ini adalah "model paling pintar lagi" syarikat itu. Pengalaman praktikal menunjukkan bahawa model memproses lebih cepat, mempunyai keupayaan penaakulan yang lebih baik, walaupun terdapat beberapa faktor yang perlu diperbaiki.
Cipta antara muka interaktif dengan cepat
Salah satu peningkatan besar dalam Gemini 3 berkisar tentang Canvas, ruang kerja interaktif dalam Gemini yang membolehkan anda meminta chatbots menulis kod, memvisualisasikan hasil dan mengedit kandungan.
Apabila Gemini 3 diminta untuk mencipta model 3D perbezaan antara saiz bola sepak, Bumi, Matahari dan Bima Sakti, alat tersebut mencetuskan antara muka pengekodan, pemprosesan dan penciptaan interaktif yang membolehkan objek dipilih dan dibandingkan dalam saiz.
![]() |
Keupayaan untuk mencipta ruang interaktif dengan ciri Kanvas dalam Gemini 3. |
Berbanding dengan demo Google, hasilnya lebih teruk sedikit dari segi kualiti imej. Sebagai balasan, maklumat tentang objek disediakan dengan jelas dan mudah difahami. Masa pemprosesan mengambil masa kira-kira 2 minit. Dalam antara muka Kanvas, pengguna boleh terus mengedit kod, menyalin atau berkongsi kandungan.
Dengan arahan lain, Gemini 3 diminta untuk mencipta helang gaya voxel duduk di atas dahan pokok. Alat ini memberikan hasil selepas kira-kira 45 saat, dan pengguna boleh mengezum masuk dan memutarkan paparan menggunakan tetikus. Walau bagaimanapun, beberapa butiran dalam imej mempunyai ralat grafik dan tidak dipaparkan dengan betul.
Juga dengan helang yang hinggap di dahan pokok tetapi dengan permintaan yang lebih sukar (model 3D). Kali pertama kod yang dijana oleh Gemini 3 ranap dan gagal dijalankan. Selepas meminta pembetulan imej itu muncul dan interaktif.
![]() |
Keupayaan penciptaan persekitaran interaktif Gemini 3. |
Walaupun terdapat beberapa isu, peralihan daripada model soal jawab kepada penyuntingan kolaboratif adalah arah yang menarik yang akan menjadikan Gemini 3 berguna untuk tugasan yang kompleks dan jangka panjang.
Sudah tentu, Gemini 3 bukan hanya untuk mencipta grafik atau model visual. Google sedang menguji ciri "UI Generatif" untuk pengguna AI Pro. Dengan beberapa arahan, model boleh mencipta antara muka gaya majalah interaktif atau laman web visual.
Google mengatakan ciri itu dilancarkan secara berperingkat. Seperti yang dialami The Verge , pengguna perlu memilih ciri reka letak Visual , kemudian taip perintah seperti "Rancangkan saya perjalanan 3 hari ke Rom."
Selepas pemprosesan, Gemini 3 menjana hasil yang serupa dengan tapak web perjalanan dengan jadual dan imej terperinci, bersama-sama dengan beberapa soalan tentang pilihan perjalanan dan gaya pemakanan. Dari situ, model akan menyesuaikan jawapan dengan sewajarnya. Ciri ini juga agak berguna untuk topik seperti cara memasang komputer, membina tangki ikan, dsb.
Menaakul dan menganalisis dengan lebih berkesan
Menurut Google, Gemini 3 mempunyai kebolehan penaakulan yang lebih baik daripada pendahulunya. Syarikat itu mendakwa bahawa keupayaan penaakulan Gemini 3 Pro berada di peringkat kedoktoran, dengan skor 37.5% pada Peperiksaan Terakhir Kemanusiaan, dan 91.9% pada peperiksaan GPQA Diamond.
Sudah tentu, pengguna hanya dapat merasakan perbezaannya apabila berinteraksi secara langsung dengan model. Apabila diminta untuk menyelesaikan masalah yang diambil daripada set rujukan GPQA Diamond (tertumpu pada peringkat kedoktoran), Gemini 3 Pro mengambil masa kira-kira 30 saat untuk memberikan penyelesaian terperinci, termasuk setiap langkah masalah dan imej ilustrasi.
![]() |
Gemini 3 boleh menjawab soalan yang kompleks, keupayaan berfikir yang setara dengan tahap PhD. |
Mengikut penilaian, penyelesaiannya agak terperinci dan mengikut prosedur. Sebagai perbandingan, GPT-5.1 juga mengambil masa kira-kira 30 saat, menjawab dengan betul tetapi penyelesaiannya kurang terperinci. Begitu juga, Claude 4.5 Sonnet menjawab dengan betul, lebih cepat daripada Gemini 3 tetapi kurang terperinci.
Google berkata Gemini 3 boleh mengekstrak dokumen daripada berbilang sumber serentak, seperti teks, imej dan video . Tugasan yang belum pernah dilatih sebelum ini juga dikendalikan dengan lebih baik pada Gemini 3.
![]() |
Keupayaan analisis video Gemini 3. |
Sebagai contoh, apabila diminta menganalisis topik utama video berdurasi 57 minit, Gemini 3 mengambil masa kira-kira seminit untuk mengembalikan hasil yang menyertakan hujah yang diminta, bersama-sama dengan cap masa ke bahagian video yang sepadan. Begitu juga, model itu mengenal pasti dengan betul video tentang tenis, menganalisis perlawanan dan cara setiap pemain bermain.
Pengguna boleh meminta Gemini 3 menonton video sambil merujuk sumber luaran, dan juga bertanya soalan untuk analisis yang lebih mendalam. Secara keseluruhan, Gemini 3 agak responsif dalam menganalisis dan merujuk dokumen, sebahagiannya berkat sambungannya ke pangkalan data Carian Google.
Ejen membantu tetapi mempunyai masalah
Ejen juga merupakan peningkatan ketara pada Gemini 3. Bagi pengguna pakej AI Ultra (kini hanya menyokong pasaran AS), mod ini boleh melakukan proses yang kompleks bagi pihak pengguna seperti menyusun dan mengatur e-mel, mencari maklumat, menempah tiket perjalanan...
Apabila Google melancarkan Gemini 3, ia menunjukkan keupayaan untuk mengatur peti masuk anda dalam Gmail, dan dalam pengalaman The Verge , ia berfungsi tepat seperti yang sepatutnya: ia menjana senarai penuh e-mel yang belum dibaca dari seminggu.
Sama seperti ciri Kanvas, senarai e-mel dan tindakan yang dicadangkan dipaparkan di kawasan yang berasingan. Gemini menyediakan beberapa pilihan seperti menetapkan peringatan untuk e-mel penting, mengarkibkan e-mel promosi...
![]() |
Ciri ejen Gemini 3 menyokong pengurusan peti masuk Gmail. Foto: The Verge . |
Apabila diminta untuk membuat peringatan pembayaran bil, Gemini dengan pantas menarik maklumat yang berkaitan ke dalam Google Tasks. Untuk tugas pembayaran, ejen secara automatik menavigasi dan berhenti apabila ia memerlukan pengguna memasukkan maklumat pembayaran.
Secara keseluruhannya, ejen Gemini 3 agak berguna dalam mengesan e-mel yang pengguna mungkin lupa. Alat ini juga boleh mencari dan menyahlanggan e-mel daripada alamat pengiklanan yang tidak lagi berguna.
Malah, beberapa ejen chatbot seperti Perplexity dan ChatGPT sudah menyokong integrasi Gmail. Walau bagaimanapun, keupayaan integrasi Gemini adalah yang paling pelbagai. Sebagai contoh, pengguna Perplexity perlu memasukkan secara khusus e-mel yang ingin disimpan atau dipadamkan, manakala operasi Gemini boleh dilakukan melalui butang.
![]() |
Ciri penciptaan antara muka interaktif Gemini 3. Foto: The Verge . |
Ciri penjadualan e-mel ChatGPT juga tidak konsisten. Walau bagaimanapun, kelajuan penghantaran e-mel Gemini adalah lebih perlahan daripada Perplexity. Sesetengah tugas, seperti membuat tempahan restoran, kadangkala mempunyai masalah.
Walaupun ia sentiasa memerlukan pengesahan pengguna sebelum melakukan tindakan sensitif seperti membuat pembayaran atau menghantar e-mel, menyerahkan beberapa tugas kepada AI masih membuat pengguna teragak-agak. Mod ejen pada Gemini 3 agak berguna, tetapi pengguna masih perlu memantau output.
Sumber: https://znews.vn/gemini-3-tot-den-dau-post1607493.html

















Komen (0)