Google DeepMind baru sahaja memperkenalkan satu langkah besar ke hadapan dalam bidang kecerdasan buatan generatif (GenAI): model Gemini 2.5 Flash Image.

Dikenali dengan mesra sebagai "Nano Banana" oleh komuniti, model ini merupakan alat yang berkuasa, mampu mengubah teks kepada imej dan mengedit imej sedia ada dengan ketepatan dan fleksibiliti yang tinggi.

Ini adalah kesinambungan daripada barisan model Gemini, tetapi dioptimumkan khusus untuk tugas berkaitan imej.

c732a0fbdcce57900edf.jpg
Kata kunci Gemini mendahului senarai sohor kini di Google Trends di Vietnam pada 4 September. Petikan skrin.

Dengan kelebihan luar biasa dalam penciptaan foto dan keupayaan menyunting, Nano Banana menarik perhatian besar daripada pengguna teknologi global, termasuk Vietnam.

Menurut Google Trends, carian untuk Gemini dan Nano Banana telah melonjak dalam tempoh 24 jam yang lalu. Statistik dari 4 September menunjukkan bahawa kata kunci "Gemini" mendahului carta Arah Aliran merentas semua topik.

Di forum dan kumpulan rangkaian sosial, pengguna turut berkongsi dan menguji arahan dan skrip penciptaan imej menggunakan Banana Nano.

Kebanyakan orang menghargai keupayaan alat untuk mencipta imej "dengan pantas, kemas dan pantas" serta kualiti produk keluaran.

Lebih daripada sekadar mencipta imej daripada huraian teks, Gemini 2.5 Flash Image cemerlang dalam beberapa aspek teras: pengeditan imej atas permintaan, ketekalan aksara, kelajuan pemprosesan yang mengagumkan dan teknologi keselamatan SynthID.

Pengguna boleh menggunakan bahasa semula jadi untuk menukar elemen dalam foto. Sebagai contoh, hanya taip perintah "tambah kerusi merah di sebelah meja" atau "tukar latar belakang kepada hutan" dan model akan membuat pengeditan dengan tepat dan lancar.

Konsistensi watak dianggap sebagai ciri yang paling hebat. Model boleh mengingati dan mencipta semula imej watak atau objek dengan ciri yang konsisten (seperti muka, pakaian, gaya) merentas berbilang foto.

Ini amat berguna untuk projek kreatif yang memerlukan penciptaan satu siri imej yang berkaitan, daripada komik kepada kempen pemasaran.

Dengan seni bina yang dioptimumkan, Gemini 2.5 Flash Image boleh menghasilkan hasil berkualiti tinggi dalam beberapa saat, mempercepatkan aliran kerja kreatif dengan ketara.

Semua imej yang dibuat atau diedit oleh model ditandakan dengan tera air digital halimunan proprietari daripada Google, membolehkan pengecaman imej yang dibuat dengan AI, menyumbang kepada memastikan ketelusan dan asal kandungan.

Model Imej Flash Gemini 2.5 membuka pelbagai potensi aplikasi, daripada pengguna individu kepada pembangun profesional.

Pembangun boleh mengakses model melalui API Gemini dan Google AI Studio untuk membina aplikasi mereka sendiri, manakala perusahaan boleh menggunakan model tersebut pada platform Vertex AI.

Bagi pengguna biasa, model ini dibina terus ke dalam Google Gemini dan apl lain, menjadikan pengimejan AI sebagai alat yang boleh diakses dan intuitif.

Dengan ciri-ciri cemerlangnya, terutamanya keupayaan untuk mengekalkan konsistensi watak, Gemini 2.5 Flash Image dijangka menjadi pesaing hebat kepada perisian penyuntingan foto tradisional seperti Photoshop, mengubah cara pencipta dan pengguna berinteraksi dengan imej digital.

China secara tidak dijangka mengatasi AS pada pertandingan terjemahan AI global . Model sumber terbuka Tencent Hunyuan-MT-7B (China) menang hampir sepenuhnya menentang 'gergasi' Amerika itu pada pertandingan terjemahan mesin antarabangsa dalam rangka persidangan WMT25.

Sumber: https://vietnamnet.vn/nano-banana-la-gi-ma-khien-moi-nguoi-xon-xao-dung-dau-google-trends-viet-nam-2439283.html