Google DeepMind baru saja memperkenalkan lompatan besar ke depan di bidang kecerdasan buatan generatif (GenAI): model gambar Flash Gemini 2.5.

Dikenal dengan sebutan "Nano Banana" oleh komunitas, model ini adalah alat canggih yang mampu mengubah teks menjadi gambar dan mengedit gambar yang sudah ada dengan presisi dan fleksibilitas tinggi.

Ini adalah penerus dari lini model Gemini, tetapi secara khusus dioptimalkan untuk tugas-tugas yang berkaitan dengan pengolahan gambar.

c732a0fbdcce57900edf.jpg
Kata kunci Gemini menduduki puncak daftar tren di Google Trends di Vietnam pada tanggal 4 September. (Screenshot)

Dengan kemampuannya yang luar biasa dalam pembuatan dan pengeditan gambar, Nano Banana menarik perhatian yang signifikan dari pengguna teknologi di seluruh dunia, termasuk Vietnam.

Menurut Google Trends, pencarian untuk Gemini dan Nano Banana melonjak dalam 24 jam terakhir. Statistik dari tanggal 4 September menunjukkan bahwa kata kunci "Gemini" menduduki puncak tangga lagu Trending di semua topik.

Di forum dan grup media sosial, pengguna juga berbagi dan bereksperimen dengan perintah dan skenario pembuatan gambar menggunakan Nano Banana.

Sebagian besar orang menghargai kemampuan alat ini untuk membuat gambar dengan cepat dan efisien, serta kualitas hasilnya.

Selain sekadar membuat gambar dari deskripsi teks, Gemini 2.5 Flash Image unggul dalam beberapa area inti: pengeditan gambar berbasis perintah, menjaga konsistensi karakter, kecepatan pemrosesan yang mengesankan, dan teknologi keamanan SynthID.

Pengguna dapat menggunakan bahasa alami untuk mengubah elemen dalam foto. Misalnya, hanya dengan memasukkan perintah "tambahkan kursi merah di sebelah meja" atau "ubah latar belakang menjadi hutan," model akan melakukan pengeditan secara akurat dan lancar.

Mempertahankan konsistensi karakter dianggap sebagai fitur paling inovatif. Model ini dapat mengingat dan mereproduksi gambar karakter atau objek dengan karakteristik yang konsisten (seperti wajah, pakaian, gaya) di berbagai gambar yang berbeda.

Ini sangat berguna untuk proyek-proyek kreatif yang perlu menghasilkan serangkaian gambar terkait, mulai dari komik hingga kampanye pemasaran.

Dengan arsitektur yang dioptimalkan, Gemini 2.5 Flash Image dapat menghasilkan hasil berkualitas tinggi hanya dalam hitungan detik, secara signifikan mempercepat proses kreatif.

Semua gambar yang dibuat atau diedit oleh model diberi tanda air digital tak terlihat milik Google, yang memungkinkan identifikasi gambar yang dibuat dengan AI, sehingga membantu memastikan transparansi dan asal usul konten.

Model Flash Image Gemini 2.5 membuka banyak potensi aplikasi, mulai dari pengguna individu hingga pengembang profesional.

Pengembang dapat mengakses model melalui API Gemini dan Google AI Studio untuk membangun aplikasi mereka sendiri, sementara bisnis dapat menggunakan model tersebut di platform Vertex AI.

Bagi pengguna awam, model ini terintegrasi langsung ke dalam Google Gemini dan aplikasi lainnya, menjadikan pembuatan gambar berbasis AI sebagai alat yang mudah diakses dan intuitif.

Dengan fitur-fitur unggulannya, terutama kemampuannya untuk mempertahankan konsistensi karakter, Gemini 2.5 Flash Image diharapkan menjadi pesaing tangguh bagi perangkat lunak pengeditan foto tradisional seperti Photoshop, mengubah cara para kreator dan pengguna berinteraksi dengan gambar digital.

China secara tak terduga mengungguli AS dalam kompetisi penerjemahan AI global . Model sumber terbuka Hunyuan-MT-7B dari Tencent (China) meraih kemenangan hampir mutlak atas raksasa Amerika dalam kompetisi penerjemahan mesin internasional yang diadakan di konferensi WMT25.

Sumber: https://vietnamnet.vn/nano-banana-la-gi-ma-khien-moi-nguoi-xon-xao-dung-dau-google-trends-viet-nam-2439283.html