Pembaruan Google Gemini menggunakan model gambar "nano banana" yang dikembangkan oleh Google DeepMind. Fitur ini kini tersedia secara global untuk pengguna gratis maupun berbayar. Keunggulan terbesarnya terletak pada kemampuannya menjaga konsistensi wajah dan objek dalam foto, sesuatu yang seringkali sulit dilakukan oleh alat AI lainnya.
"Kami benar-benar meningkatkan kualitas gambar dan kemampuan model untuk mengikuti instruksi," ujar Nicole Brichtova, pimpinan produk di DeepMind. "Pembaruan ini membuat proses penyuntingan lebih lancar dan hasilnya cukup baik untuk digunakan untuk keperluan apa pun."
Tetaplah “kamu” di setiap foto
Salah satu hal yang membuat foto AI terlihat palsu adalah detail-detail kecilnya terdistorsi. Google mengatakan Gemini memecahkan masalah ini, memungkinkan Anda mengubah seluruh pemandangan sambil tetap mempertahankan wajah dan ekspresi yang sama. Anda dapat mencoba gaya rambut baru, mengubah warna dinding, atau membawa hewan peliharaan ke dalam pemandangan tanpa khawatir distorsi gambar.

Gemini juga memungkinkan Anda mengunggah beberapa foto untuk digabungkan menjadi satu, misalnya menggabungkan potret kucing Anda untuk membuat foto Anda berdua yang sedang berkendara bersama di jalan.
Gemini mendukung pengeditan multi-putaran, memungkinkan pengguna menambahkan setiap detail ke suatu ruangan: mulai dari wallpaper, furnitur, hingga warna cat. Keunggulannya adalah hanya bagian yang perlu diedit yang berubah, sisanya tetap sama.
Selain itu, Gemini bisa memadukan gaya antarfoto. Misalnya, ubah sepatu bot hujan menjadi sepatu bermotif bunga, atau buat gaun bermotif kupu-kupu.
Perlombaan Pembuatan Gambar AI Antar Raksasa Teknologi
Peningkatan Google ini hadir di tengah memanasnya persaingan pencitraan AI. OpenAI sebelumnya meluncurkan GPT-4o, yang dapat menghasilkan gambar secara langsung, dan menjadi viral dengan serangkaian meme bergaya Studio Ghibli. CEO Sam Altman mengungkapkan bahwa jumlah pengguna meningkat pesat sehingga GPU perusahaan "hampir meleleh".
Agar tetap bertahan, Meta mengumumkan kemitraan dengan Midjourney, sementara perusahaan rintisan Jerman Black Forest Labs dengan model FLUX-nya mendominasi banyak grafik.

Google berharap Gemini dapat mengejar ketertinggalan dengan ChatGPT. Gemini saat ini memiliki 450 juta pengguna bulanan, menurut CEO Sundar Pichai, jauh di belakang ChatGPT yang memiliki lebih dari 700 juta pengguna mingguan.
Brichtova mengatakan Gemini dirancang untuk skenario dunia nyata, mulai dari memvisualisasikan ruang tamu dan taman hingga menciptakan foto-foto yang menghibur. Model ini memiliki "pengetahuan dunia " yang lebih baik, dan dapat menggabungkan beberapa foto dan palet warna menjadi satu rendering.
Namun, Google juga menerapkan batasan yang ketat. Semua gambar yang dihasilkan memiliki tanda air yang jelas dan tanda pengenal tersembunyi di metadata. Perusahaan ini secara tegas melarang pembuatan gambar sensitif tanpa izin untuk mencegah penyalahgunaan deepfake.
Google sebelumnya telah meminta maaf atas citra historis Gemini yang tidak akurat. Kali ini, perusahaan yakin telah mencapai keseimbangan antara kreativitas dan keamanan. "Kami ingin pengguna berkreasi, tetapi tidak semuanya diperbolehkan," tegas Brichtova.
Dengan Gemini 2.5 Flash Image, Google bertaruh untuk meningkatkan pengalaman penyuntingan foto AI, berharap dapat mempertahankan pengguna lama dan menarik pengguna baru dalam perlombaan teknologi yang sengit dengan OpenAI, Meta, dan pesaing lainnya.
(Menurut TechCrunch, Panduan Tom)

Sumber: https://vietnamnet.vn/google-gemini-nang-tam-ai-tao-anh-doi-nen-kieu-toc-chi-bang-mot-cau-lenh-2436782.html
Komentar (0)