(CLO) Google, kullanıcıların herhangi bir metin girmeden bile yapay zeka tarafından oluşturulmuş birleşik görüntüler elde etmek için fotoğraf yüklemelerine olanak tanıyan "Whist" adlı yeni bir yapay zeka (YZ) aracını piyasaya sürdü.
Whisk, yüklenen fotoğrafın konusunu, bağlamını ve stilini bir araya getirmek için yapay zekayı kullanır ve böylece yeni ve daha benzersiz bir görüntü oluşturur.
Google tarafından "yaratıcı bir araç" olarak tanımlanan Whisk, kullanıcıların profesyonel fotoğraf düzenleme becerilerine ihtiyaç duymadan hızlı bir şekilde yeni görsel fikirler üretmelerine yardımcı oluyor. Google'a göre bu araç geleneksel bir görüntü düzenleyici değil, yaratıcılığı ve hızlı keşfi tetiklemek için tasarlanmış heyecan verici bir yapay zeka aracı.
Kullanıcı bir görsel yüklediğinde, Whisk, Google'ın yapay zeka hizmeti Gemini ve Google'ın DeepMind'dan satın aldığı metni görsele dönüştürme aracı Imagen 3 teknolojisinin bir kombinasyonunu kullanır.
Gemini fotoğrafı analiz edip bir alt yazı oluşturacak, ardından Imagen 3, fotoğrafın unsurlarını yaratıcı bir şekilde birleştirerek, konunun "özünü" birebir kopyalamak yerine koruyacak.
Çırpma teli arayüzü. Ekran görüntüsü.
Bu, nihai sonucun orijinal görüntüyle %100 aynı olmayabileceği anlamına gelir. Örneğin, yeni görüntüdeki kişilerin boyu, saç stili veya ten rengi orijinalinden farklı olabilir. Bununla birlikte, kullanıcılar yine de giriş bilgilerini ayarlayabilir, arka planı, stili değiştirebilir veya farklı görüntüler oluşturmak için birden fazla temayı birleştirebilirler.
Whisk, yalnızca metinden değil, orijinal görüntülerden de resimler üretebiliyor ve kullanıcıların fotoğraf düzenleme deneyimine sahip olmalarına gerek kalmadan yaratıcı olanakları genişletiyor. Google Labs'ın ürün yönetimi direktörü Thomas Iljic şunları söyledi: "Whisk, kullanıcıların konuları, arka planları ve stilleri yaratıcı bir şekilde yeniden düzenlemelerine yardımcı olmak, her bir pikseli titizlikle düzenlemek yerine görsel olarak keşfetmelerini sağlamak için tasarlandı."
Whisk henüz geliştirme aşamasının başlarında olsa da, araç Google Labs'te bir web sitesi olarak kullanıma sunuldu ve şu anda ABD'deki kullanıcıların erişimine açık.
Wedbush Securities'in genel müdürü ve kıdemli analisti Dan Ives, Whisk'in Google için teknoloji yarışında bir başka "güç anı" olduğunu söyledi.
Ives ayrıca, Google'ın 2014'te satın aldığı yapay zeka laboratuvarı DeepMind'ın, Google'ın yapay zeka alanındaki konumunu korumasına yardımcı olan çok önemli bir varlık olduğunu belirtti. Whisk de dahil olmak üzere yapay zeka ürünleri, Google'ın önümüzdeki yıllardaki ürün geliştirme stratejisinin önemli bir parçasını oluşturuyor ve 2025'te birçok yeni ürünün piyasaya sürülmesi bekleniyor.
Whisk'in araçları, minimum kullanıcı müdahalesiyle yenilikçi ürünler oluşturmak için yapay zekayı kullanmanın yeni yollarını açıyor. Bu, yapay zekanın görsel unsurları anlama ve yaratıcı bir şekilde birleştirme konusundaki ilerlemesini gösteriyor.
Whisk, Google ve OpenAI dahil olmak üzere büyük teknoloji şirketleri arasında tüketiciler için yapay zeka araçları geliştirmeye yönelik güçlü bir eğilimin parçasıdır. Bu araçlar, görüntü ve metin oluşturmadan videoya kadar yenilikçi yaratıcı deneyimler sunmayı amaçlamaktadır. Son zamanlarda OpenAI, Whisk'in doğrudan rakibi olan Sora adlı bir metinden videoya dönüştürme aracı da tanıttı.
Ngoc Anh (CNN, The Verge, ZDNET'e göre)
[reklam_2]
Kaynak: https://www.congluan.vn/google-ra-mat-cong-cu-tao-hinh-anh-ai-tu-hinh-anh-that-post326441.html










Yorum (0)