ChatGPT "fotoğraf gibi çizim yapıyor"
26 Mart'ta, OpenAI'nin akıllı modelinin kullanıcıları için görüntü oluşturmaya odaklanan bir araç olan Images in ChatGPT'yi resmi olarak yayınlamasıyla küresel ve Vietnamlı yapay zeka kullanıcı toplulukları heyecanlandı. Daha önce ChatGPT'nin de görüntü oluşturma yetenekleri vardı, ancak bunlar sınırlıydı ve DALL-E adı verilen başka bir bilinen metinden görüntüye dönüştürme modeline dayanıyordu.
Aracın metni çizimlere dönüştürme ve "Photoshop kalitesinde görüntü birleştirme" yeteneği hızla dikkat çekti. Birçok kullanıcı, elde edilen görüntü kalitesini "şaşırtıcı" olarak nitelendirirken, çoğu piyasadaki diğer popüler yapay zeka modellerine göre "üstün" olarak değerlendirdi.
ChatGPT, basit bir komutla gerçekçi kahve fincanı resimleri oluşturur.
OpenAI'nin araştırma başkanı Gabriel Goh'a göre, ChatGPT'nin GPT-4o modeli kullanılarak görüntü oluşturma yeteneklerindeki önemli gelişme, "Bağlama" olarak adlandırılan ve yapay zeka görüntü oluşturucunun öznitelikler ve nesneler arasındaki bağlantıları ne kadar iyi koruduğunu ifade eden bir terimdir. Goh, GPT-4o'nun 15-20 farklı nesne için öznitelikleri hatasız bir şekilde doğru bir şekilde bağlayabildiğini ve oluşturulan içeriğin doğruluğunu ve güvenilirliğini önemli ölçüde artırdığını belirtiyor.
ChatGPT'deki görseller yalnızca görsel oluşturmada mükemmel olmakla kalmıyor, aynı zamanda diğer yapay zeka destekli görsel oluşturma araçlarındaki kritik bir zayıflığı da gideriyor: görseller içindeki metinlerin işlenmesi. Aslında, metin içeren birçok görsel doğru bir şekilde işleniyor ve bu da gerçek ve sahte görselleri ayırt etmeyi giderek zorlaştırıyor.
Aracın dezavantajı, görüntü oluşturma süresinin nispeten uzun olmasıdır; ancak bu gecikme, doğru ayrıntılara sahip ve kullanıcının açıklamasına uyan yüksek kaliteli görüntüler elde etmenin her zaman sabır gerektirmesinden kaynaklandığı için makul kabul edilmektedir. Araştırma ekibi, gecikme sorununun gelecekte iyileştirileceğini belirtti.
Görüntü manipülasyonu olasılığı konusunda birçok endişe dile getirildi.
ChatGPT ve OpenAI'nin kullanıcılara sunduğu ilk keyfin ötesinde, bilgi güvenliği, gizlilik ve istismar riskiyle ilgili endişeler bir kez daha ön plana çıktı. Vietnam'da bir Facebook kullanıcısı, "Yakında, çevrimiçi gördüğünüz görüntüler mutlaka gerçek olmayabilir," diyerek endişesini dile getirdi; çünkü ChatGPT'den tamamen uydurma, fotoğraf kadar gerçekçi görünen görüntüler oluşturmasını isteyebilir, örneğin aktör ve eski güreşçi Dwayne Johnson'ın (The Rock) bir sakız markasının reklamını yaptığı bir fotoğraf veya ocakta oturan, tıpkı bir fotoğraf gibi görünen bir kedi resmi.
Kullanıcılar, sağlanan ayrıntılı komutlar sayesinde, geleneksel fotoğraf düzenleme araçları hakkında derinlemesine bilgiye ihtiyaç duymadan şaşırtıcı sonuçlar elde edebilirler.
Aslında birçok kişi yeni aracın "soyunma" özelliğini bile denedi. TN ( Hanoi ), internetten bir modelin fotoğrafını kullanarak ChatGPT'den istediği gibi kıyafetlerini değiştirmesini istediğini ve neredeyse tüm isteklerin yüksek doğrulukla yerine getirildiğini söyledi. TN, "Ancak, telif hakkıyla korunan görsellerin veya aşırı müstehcen içeriğin oluşturulmasına ilişkin sistem politikasının ihlali nedeniyle isteklerin reddedildiği birkaç durum oldu" diye belirtti.
Thanh Nien gazetesinin yaptığı testlerde, ChatGPT gerçek dünyadaki veya film ve çizgi romanlardaki ünlü veya telif hakkıyla korunan karakterlerle ilgili görseller oluşturmayı reddetti. Sistem, Vietnam'da buzlu çay içerken oturan Doctor Strange'in bir görüntüsünü oluşturması istendiğinde şu yanıtı verdi: "İstediğiniz görseli oluşturamıyorum çünkü gönderdiğiniz referans görseli açıkça Marvel'ın telif hakkıyla korunan bir karakteri olan Doctor Strange'i gösteriyor ve bu mevcut içerik politikamızı ihlal ediyor."
ChatGPT'nin çok modlu ürün yöneticisi Jackie Shannon, ChatGPT'deki görsellerin deepfake, pornografik veya sahte içeriklere karşı güçlü bir koruma sağladığını doğruluyor. Özellikle, oluşturulan görseller, yapay zeka ürünleri olduklarını belirlemek için standart C2PA meta verilerini içeriyor, ancak doğrulama için ayrı bir araç gerektiriyor.
Ancak birçok kişi hâlâ kuralları başarıyla "aşıyor" ve ünlülerin görüntülerini eğlence amaçlı kullanıyor. Örneğin, CEO Tim Cook'un iPhone yerine Samsung telefon tutarken çekilmiş bir fotoğrafı, aktör Robert Downey Jr.'ın sebzeli şeker çiğnerken çekilmiş bir fotoğrafı veya Cristiano Ronaldo ve Lionel Messi'nin Vietnam'da küçük bir sokakta birçok izleyicinin önünde top için mücadele ederken gösterildiği bir dizi tablo...
[reklam_2]
Kaynak: https://thanhnien.vn/lo-ngai-gia-mao-voi-kha-nang-tao-anh-nhu-that-cua-chatgpt-185250327005110274.htm






Yorum (0)