Peningkatan Google Gemini menggunakan model imej "banana nano" yang dibangunkan oleh Google DeepMind. Ciri ini kini tersedia secara global untuk pengguna percuma dan berbayar. Kekuatan terbesarnya ialah keupayaannya untuk memastikan wajah dan objek konsisten dalam foto, sesuatu yang sering dihadapi oleh alat AI lain.

"Kami benar-benar telah meningkatkan kualiti imej dan keupayaan model untuk mengikut arahan," kata Nicole Brichtova, ketua produk di DeepMind. "Kemas kini ini menjadikan pengeditan lebih lancar dan hasilnya cukup baik untuk digunakan untuk sebarang tujuan."

Simpan "anda" dalam setiap foto

Salah satu perkara yang menjadikan foto AI kelihatan palsu ialah butiran kecil menjadi herot. Google berkata Gemini menyelesaikan masalah ini, membolehkan anda menukar keseluruhan adegan sambil mengekalkan wajah dan ekspresi yang sama. Anda boleh mencuba gaya rambut baharu, menukar warna dinding atau membawa haiwan peliharaan ke tempat kejadian tanpa perlu risau tentang herotan imej.

Gaul foto bersama.gif
Gabungkan foto dengan konteks baharu daripada dua imej sedia ada menggunakan Google Gemini. Sumber: Google

Gemini juga membenarkan anda memuat naik berbilang foto untuk digabungkan menjadi satu, seperti menggabungkan potret dengan kucing anda untuk mencipta foto anda berdua menunggang bersama di jalan raya.

Gemini menyokong pengeditan berbilang pusingan, membolehkan pengguna menambahkan setiap butiran pada ruang: daripada kertas dinding, perabot, hingga warna cat. Kelebihannya ialah hanya bahagian yang perlu diedit berubah, selebihnya tetap sama.

Selain itu, Gemini boleh mencampurkan gaya antara foto. Contohnya, tukarkan but hujan kepada kasut cetakan bunga atau cipta pakaian bercorak rama-rama.

Perlumbaan Penciptaan Imej AI Antara Gergasi Teknologi

Peningkatan Google datang ketika perang pengimejan AI semakin panas. OpenAI sebelum ini melancarkan GPT-4o, yang boleh menjana imej secara langsung, dan menjadi viral dengan satu siri meme gaya Studio Ghibli. Ketua Pegawai Eksekutif Sam Altman mendedahkan bahawa bilangan pengguna meningkat dengan begitu banyak sehingga GPU syarikat "hampir cair."

Untuk mengikuti perkembangan, Meta mengumumkan perkongsian dengan Midjourney, manakala syarikat permulaan Jerman Black Forest Labs dengan model FLUXnya mendominasi banyak carta.

penyuntingan berbilang giliran.gif
Keupayaan menyunting foto berbilang langkah Google Gemini. Sumber: Google

Google berharap Gemini dapat merapatkan jurang dengan ChatGPT. Gemini kini mempunyai 450 juta pengguna bulanan, menurut CEO Sundar Pichai, jauh di belakang ChatGPT, yang mempunyai lebih daripada 700 juta pengguna mingguan.

Brichtova berkata Gemini direka untuk senario dunia sebenar, daripada menggambarkan ruang tamu dan taman kepada mencipta foto yang menghiburkan. Model ini mempunyai "pengetahuan dunia " yang lebih baik dan boleh menggabungkan berbilang foto dan palet warna menjadi satu pemaparan.

Walau bagaimanapun, Google juga mengenakan had yang ketat. Semua imej yang dijana mempunyai tera air yang jelas dan tanda pengenalan yang tersembunyi dalam metadata. Syarikat itu melarang keras penciptaan imej sensitif tanpa kebenaran untuk mencegah penyalahgunaan deepfake.

Google sebelum ini telah memohon maaf atas imejan sejarah Gemini yang tidak tepat. Kali ini, syarikat percaya ia telah mencapai keseimbangan antara kreativiti dan keselamatan. "Kami mahu pengguna menjadi kreatif, tetapi tidak semuanya dibenarkan," Brichtova menegaskan.

Dengan Gemini 2.5 Flash Image, Google bertaruh untuk meningkatkan pengalaman penyuntingan foto AI, dengan harapan dapat mengekalkan pengguna lama dan menarik pengguna baharu dalam perlumbaan teknologi yang sengit dengan OpenAI, Meta dan pesaing lain.

(Menurut TechCrunch, Panduan Tom)

Untuk 85 juta VND setiap 'otak', Nvidia membuka jalan kepada era manusia membuat robot. Nvidia baru sahaja melancarkan Jetson AGX Thor - cip yang digelar "otak robot", yang mampu membantu mesin melihat, berfikir dan bertindak seperti manusia, membuka perlumbaan AI fizikal pada harga 3,499 USD.

Sumber: https://vietnamnet.vn/google-gemini-nang-tam-ai-tao-anh-doi-nen-kieu-toc-chi-bang-mot-cau-lenh-2436782.html