Google DeepMind, üretken yapay zeka (GenAI) alanında büyük bir atılımı duyurdu: Gemini 2.5 Flash Görüntü modeli.

Topluluk tarafından sevgiyle "Nano Banana" olarak bilinen bu model, metni görüntülere dönüştürme ve mevcut görüntüleri yüksek hassasiyet ve esneklikle düzenleme yeteneğine sahip güçlü bir araçtır.

Bu, Gemini model serisinin halefi olup, özellikle görüntüyle ilgili görevler için optimize edilmiştir.

c732a0fbdcce57900edf.jpg
"İkizler" anahtar kelimesi, 4 Eylül'de Vietnam'da Google Trends'te en çok konuşulan konular listesinin zirvesinde yer aldı. (Ekran görüntüsü)

Görüntü oluşturma ve düzenleme alanındaki üstün yetenekleriyle Nano Banana, Vietnam da dahil olmak üzere dünya çapındaki teknoloji kullanıcılarının büyük ilgisini çekiyor.

Google Trends'e göre, son 24 saatte İkizler burcu ve Nano Muz aramaları önemli ölçüde arttı. 4 Eylül tarihli istatistikler, "İkizler" anahtar kelimesinin tüm konular arasında Trendler listesinin zirvesinde yer aldığını gösteriyor.

Forumlar ve sosyal medya gruplarında kullanıcılar, Nano Banana kullanarak görüntü oluşturma komutlarını ve senaryolarını paylaşıyor ve deniyorlar.

Çoğu insan, aracın hızlı ve verimli bir şekilde görüntü oluşturma yeteneğini ve çıktı kalitesini takdir ediyor.

Gemini 2.5 Flash Image, metin açıklamalarından görüntü oluşturmanın ötesinde, komut tabanlı görüntü düzenleme, karakter tutarlılığını koruma, etkileyici işlem hızı ve SynthID güvenlik teknolojisi gibi çeşitli temel alanlarda üstün performans sergiliyor.

Kullanıcılar, fotoğraftaki öğeleri değiştirmek için doğal dil kullanabilirler. Örneğin, "masanın yanına kırmızı bir sandalye ekle" veya "arka planı ormana çevir" komutunu girmeniz yeterlidir; model düzenlemeleri doğru ve sorunsuz bir şekilde gerçekleştirecektir.

Karakter tutarlılığının korunması en çığır açıcı özellik olarak kabul ediliyor. Model, bir karakterin veya nesnenin görüntüsünü (yüz, kıyafet, stil gibi) tutarlı özelliklerle birden fazla farklı görüntüde hatırlayabilir ve yeniden üretebilir.

Bu özellik, özellikle çizgi romanlardan pazarlama kampanyalarına kadar birbiriyle ilişkili bir dizi görsel oluşturmayı gerektiren yaratıcı projeler için son derece kullanışlıdır.

Optimize edilmiş mimarisiyle Gemini 2.5 Flash Image, yüksek kaliteli sonuçları sadece saniyeler içinde üreterek yaratıcı süreci önemli ölçüde hızlandırır.

Model tarafından oluşturulan veya düzenlenen tüm görüntüler, Google'ın tescilli görünmez dijital filigranıyla etiketlenir; bu da görüntülerin yapay zeka ile oluşturulduğunun belirlenmesine olanak tanıyarak içeriğin şeffaflığını ve kaynağını güvence altına almaya yardımcı olur.

Gemini 2.5 Flash Görüntü modeli, bireysel kullanıcılardan profesyonel geliştiricilere kadar birçok potansiyel uygulama alanının önünü açıyor.

Geliştiriciler, kendi uygulamalarını oluşturmak için Gemini API ve Google AI Studio aracılığıyla modele erişebilirken, işletmeler de Vertex AI platformunda modeli kullanabilirler.

Ortalama kullanıcı için bu model, Google Gemini ve diğer uygulamalara doğrudan entegre edilmiştir; bu da yapay zeka ile görüntü oluşturmayı erişilebilir ve sezgisel bir araç haline getirir.

Özellikle karakter tutarlılığını koruma yeteneği gibi olağanüstü özellikleriyle Gemini 2.5 Flash Image'ın, Photoshop gibi geleneksel fotoğraf düzenleme yazılımlarına güçlü bir rakip olması ve içerik oluşturucuların ve kullanıcıların dijital görüntülerle etkileşim biçimini değiştirmesi bekleniyor.

Çin, küresel yapay zeka çeviri yarışmasında beklenmedik bir şekilde ABD'yi geride bıraktı . Tencent'in (Çin) açık kaynaklı modeli Hunyuan-MT-7B, WMT25 konferansında düzenlenen uluslararası makine çevirisi yarışmasında Amerikan devlerine karşı neredeyse mutlak bir zafer elde etti.

Kaynak: https://vietnamnet.vn/nano-banana-la-gi-ma-khien-moi-nguoi-xon-xao-dung-dau-google-trends-viet-nam-2439283.html