![]() |
Google'ın Nano Banana Pro'su oldukça gerçekçi görüntü kalitesi sunuyor. Fotoğraf: Mashable . |
Yapay zekâ (YZ) görüntüleme teknolojisinin ilk yıllarında, ortaya çıkan ürünler genellikle kolayca sahte olarak tanımlanabiliyordu. Çok fazla parmak içeren görüntüler, bo distorted vücut detayları veya gerçekçi olmayan aydınlatma, sık rastlanan ayırt edici işaretlerdi.
Ancak bu dönem sona ermek üzere. Yapay zekâ destekli görüntü oluşturma araçları, görüntünün kendisini mükemmelleştirmek yerine, gerçek fotoğrafları taklit eden kusurları kasıtlı olarak dahil ederek giderek daha ikna edici hale geliyor.
Yapay zekâ ile görüntü oluşturmadaki trendler
OpenAI, DALL-E görüntü oluşturma aracını beş yıldan kısa bir süre önce piyasaya sürdü. İlk sürüm yalnızca 256 x 256 piksel çözünürlüğünde görüntüler oluşturabiliyordu, bu da onu pratik olmaktan çok deneysel kılıyordu. DALL-E 2 ile çözünürlük 1024 x 1024 piksele çıkarıldı ve bu da önemli ölçüde daha gerçekçi görüntüler elde edilmesini sağladı. Bununla birlikte, bulanık yüzeylerden görsel olarak açıklanması zor nesnelere kadar ayrıntılarda hala anormallikler görülüyor.
Aynı zamanda, Midjourney ve Stable Diffusion da yaratıcı topluluğun dikkatini hızla çekti. Sonraki birkaç yıl içinde modeller sürekli olarak geliştirildi, geometrik hatalar azaltıldı ve metin görünürlüğü artırıldı. Bununla birlikte, yapay zekanın büyük bir kısmı hala "fazla mükemmel" görünüyordu; aydınlatma, kompozisyon ve pürüzsüzlük gerçek fotoğraflardan ziyade illüstrasyonlara benziyordu.
![]() |
Birçok yapay zeka modeli, gerçek hayattan çok daha gerçekçi görüntüler üretiyor. Fotoğraf: Bloomberg . |
Bu eğilim değişiyor. Geliştiriciler gerçekçiliğe doğru yönelmeye, özellikle telefon kameralarıyla çekilen fotoğraflarda doğal olarak bulunan kusurları yeniden yaratmaya başlıyorlar.
2025 yılının ikinci yarısında Google, Gemini uygulamasında Nano Banana görüntü oluşturma modelini tanıttı ve ardından Nano Banana Pro ile daha da geliştirdi. Arama devine göre bu, gerçek dünya bilgilerini kullanma ve metni daha etkili bir şekilde görüntüleme yeteneğiyle bugüne kadarki en gerçekçi görüntü modelidir.
Dikkat çekici bir şekilde, bu model tarafından üretilen birçok görüntü, kontrast ve perspektiften aydınlatma ve keskinliğe kadar akıllı telefonlarla çekilen görüntülere oldukça benziyor.
Akıllı telefon kameralarıyla çekilen fotoğrafların kendine özgü bir tarzı vardır. Sensör ve lens boyutundaki sınırlamalar nedeniyle, akıllı telefonlar görüntü kalitesini iyileştirmek için çoklu kare işlemeye güvenir. Bu, karanlık alanları belirginleştiren, ayrıntıları vurgulayan ve küçük ekranlarda görüntülenmeye optimize edilmiş fotoğraflar oluşturur. Yapay zekanın bu stili öğrenmesi, görüntüleri izleyiciler için daha tanıdık hale getirerek yapaylık hissini azaltır.
Gerçekçi Görüntülerin Paradoksu
Google tek örnek değil. Adobe Firefly, kullanıcıların yapay zekâ görüntülerinin gerçekçiliğini azaltarak gerçek fotoğraflara daha çok benzemesini sağlayan bir "görüntü iyileştirme" seçeneği sunuyor. Meta ayrıca, kullanıcıların gerçekçilik seviyesini ayarlamasına olanak tanıyan bir "stil" kaydırıcısı da içeriyor.
Video alanında, OpenAI'nin Sora'sı veya Google'ın Veo'su gibi araçlar, güvenlik kameralarından alınan görüntülere benzeyen, inandırıcı olacak kadar "kötü" olan düşük kaliteli, grenli videolar oluşturmak için kullanılır.
![]() |
Yapay zekâ kullanılarak üretilen videolar giderek daha gerçekçi hale geliyor. Fotoğraf: Bloomberg . |
Bazı fotoğrafçılık uzmanlarına göre, yapay zekanın tanıdık kusurları simüle etme yeteneği, modellerin "alışılmadık vadi"ye düşmesini önlemeye yardımcı olabilir; bu durum, görüntülerin gerçeğe çok benzemesine rağmen izleyici için yine de bir huzursuzluk hissi yaratmasıdır. Yapay zeka, gerçekliği yeniden yaratmak yerine, insanların görüntüleri tüm doğal sınırlamaları ve yanlışlıklarıyla nasıl yakaladığını taklit etmelidir.
Bu gelişme, gerçek ve sahte görüntüler arasında ayrım yapma yeteneği açısından önemli bir zorluk teşkil etmektedir. Yapay zekâ görüntüleri giderek geleneksel fotoğraflara benzedikçe, bunların kaynağını belirlemek daha da zorlaşmaktadır. Buna karşılık, görüntülere kriptografik imzalar eklemek ve oluşturulma anından itibaren izlenebilirliği sağlamak amacıyla C2PA İçerik Kimlik Bilgileri standardı uygulanmaktadır.
Şu anda akıllı telefonlarla çekilen fotoğrafların çoğunda kimlik doğrulama bilgisi bulunmuyor; dijital olarak düzenlenmiş görüntüler ile tamamen yapay zeka tarafından oluşturulan görüntüler arasındaki çizgi ise giderek bulanıklaşıyor. Donanım ve paylaşım platformlarında standartlar tek tip olarak uygulanana kadar, kullanıcıların dijital alandaki görüntüler konusunda gerekli önlemleri almaları gerekiyor.
Kaynak: https://znews.vn/nghich-ly-cua-ai-tao-anh-post1612058.html









Yorum (0)