Google DeepMind baru sahaja memperkenalkan satu lonjakan besar dalam bidang kecerdasan buatan generatif (GenAI): model Imej Flash Gemini 2.5.

Dikenali mesra sebagai "Nano Banana" oleh komuniti, model ini merupakan alat yang berkuasa yang mampu mengubah teks menjadi imej dan mengedit imej sedia ada dengan ketepatan dan fleksibiliti yang tinggi.

Ini merupakan pengganti kepada rangkaian model Gemini, tetapi dioptimumkan khusus untuk tugasan berkaitan imej.

c732a0fbdcce57900edf.jpg
Kata kunci Gemini menduduki tempat teratas dalam senarai trending di Google Trends di Vietnam pada 4 September. (Tangkapan skrin)

Dengan keupayaannya yang luar biasa dalam penciptaan dan penyuntingan imej, Nano Banana menarik perhatian yang ketara daripada pengguna teknologi di seluruh dunia, termasuk Vietnam.

Menurut Google Trends, carian untuk Gemini dan Nano Banana telah melonjak dalam tempoh 24 jam yang lalu. Statistik dari 4 September menunjukkan bahawa kata kunci "Gemini" menduduki tempat teratas dalam carta Trending merentasi semua topik.

Di forum dan kumpulan media sosial, pengguna juga berkongsi dan bereksperimen dengan arahan dan senario penciptaan imej menggunakan Nano Banana.

Kebanyakan orang menghargai keupayaan alat ini untuk menghasilkan imej dengan cepat dan cekap, serta kualiti hasilnya.

Selain sekadar mencipta imej daripada penerangan teks, Gemini 2.5 Flash Image cemerlang dalam beberapa bidang teras: penyuntingan imej berasaskan arahan, mengekalkan konsistensi aksara, kelajuan pemprosesan yang mengagumkan dan teknologi keselamatan SynthID.

Pengguna boleh menggunakan bahasa semula jadi untuk menukar elemen dalam foto. Contohnya, hanya dengan memasukkan arahan "tambah kerusi merah di sebelah meja" atau "tukar latar belakang kepada hutan", model akan melakukan suntingan dengan tepat dan lancar.

Mengekalkan konsistensi watak dianggap sebagai ciri yang paling inovatif. Model boleh mengingati dan menghasilkan semula imej watak atau objek dengan ciri-ciri yang konsisten (seperti wajah, pakaian, gaya) merentasi pelbagai imej yang berbeza.

Ini amat berguna untuk projek kreatif yang perlu menghasilkan satu siri imej berkaitan, daripada komik hinggalah kempen pemasaran.

Dengan seni bina yang dioptimumkan, Gemini 2.5 Flash Image boleh menghasilkan hasil yang berkualiti tinggi dalam beberapa saat sahaja, sekali gus mempercepatkan proses kreatif dengan ketara.

Semua imej yang dicipta atau diedit oleh model ditag dengan tera air digital halimunan proprietari daripada Google, yang membolehkan pengenalpastian imej yang dicipta dengan AI, sekali gus membantu memastikan ketelusan dan asal usul kandungan.

Model Gemini 2.5 Flash Image sedang membuka banyak aplikasi yang berpotensi, daripada pengguna individu hinggalah pembangun profesional.

Pembangun boleh mengakses model melalui Gemini API dan Google AI Studio untuk membina aplikasi mereka sendiri, manakala perniagaan boleh menggunakan model pada platform Vertex AI.

Bagi pengguna biasa, model ini disepadukan terus ke dalam Google Gemini dan aplikasi lain, menjadikan penciptaan imej AI alat yang mudah diakses dan intuitif.

Dengan ciri-cirinya yang luar biasa, terutamanya keupayaannya untuk mengekalkan konsistensi watak, Gemini 2.5 Flash Image dijangka menjadi pesaing yang hebat kepada perisian penyuntingan foto tradisional seperti Photoshop, sekali gus mengubah cara pencipta dan pengguna berinteraksi dengan imej digital.

China secara tidak dijangka mengatasi AS dalam pertandingan terjemahan AI global . Model sumber terbuka Tencent (China) Hunyuan-MT-7B mencapai kemenangan hampir mutlak ke atas syarikat gergasi Amerika dalam pertandingan terjemahan mesin antarabangsa yang diadakan di persidangan WMT25.

Sumber: https://vietnamnet.vn/nano-banana-la-gi-ma-khien-moi-nguoi-xon-xao-dung-dau-google-trends-viet-nam-2439283.html