ChatGPT, makine-insan tanımlamasının önemli testini geçti

GPT-4.5, OpenAI'nin bugüne kadar geliştirdiği en büyük modeldir. Kaynak: The Verge .

Kaliforniya Üniversitesi San Diego Bilişsel Bilimler Bölümü'nden gelen yeni bir çalışma, yapay zeka alanında bir dönüm noktasını işaret ediyor: OpenAI'nin GPT-4.5 modeli, "kişilik" tabanlı etkileşim yaklaşımını kullanarak Turing testinde üstün bir performans elde etti.

Bu, şimdiye kadarki en insan benzeri yapay zeka konuşma sistemi olarak kabul ediliyor ve sosyal zeka alanında pek çok potansiyel uygulamaya kapı açıyor.

GPT-4.5, OpenAI tarafından "eğitim öncesi ve sonrası ölçeklendirmede büyük bir ilerleme" olarak tanımlanıyor. Bu, OpenAI'nin şimdiye kadar oluşturduğu en büyük model olup, önceki sürümleri geride bırakan bir boyuta ve hesaplama gücüne sahip.

OpenAI'nin 27 Şubat'ta yayınladığı resmi blog yazısına göre GPT-4.5, duyurulduğu gün ChatGPT Pro kullanıcılarına sunulmaya başlandı.

Yapay zeka insanları kandırabilir mi?

Deneyde dört temsili yapay zeka sistemi karşılaştırıldı: 1960'ların sohbet robotu ELIZA, Meta AI'nın LLaMa-3.1-405B'si ve OpenAI'nin GPT-4o ve GPT-4.5'i. Ekip, Prolific gibi çevrimiçi platformlardan toplam 500 kişi olmak üzere, her biri 250 katılımcıdan oluşan iki bağımsız test tasarladı. Katılımcılar, çeşitli bir örneklem sağlamak için farklı yaş, cinsiyet ve eğitim seviyelerindendi.

Dört tipik yapay zeka sisteminin karşılaştırma tablosu. Kaynak: AIbase

Testte geleneksel Turing formatı kullanılıyor: Her katılımcı, 5 dakika boyunca iki denekle (bir insan, bir yapay zeka) bir metin arayüzü üzerinden sohbet ediyor ve ardından hangisinin insan olduğunu derecelendiriyor.

Sonuçlar şaşırtıcıydı: GPT-4.5, insan ortalamasını (%60-70) geride bırakarak %73'e varan bir "Turing testi geçme" oranına ulaştı. Bu, bir yapay zeka modelinin standart Turing testini gerçekten "geçtiği" ilk seferdi. Bu arada, GPT-4o biraz daha düşük puan aldı, LLaMa-3.1-405B bazı durumlarda insan performansına yaklaştı veya ulaştı ve ELIZA çok geride kaldı.

İnsan gibi etkileşim kurma yeteneği

GPT-4.5'in öne çıkan özelliği sadece dil akıcılığı değil, aynı zamanda duyguları ifade etme ve tepkilerini muhatabının iletişimindeki nüanslara göre uyarlama yeteneğiydi. Birçok katılımcı onu "samimi" ve "özgün" olarak nitelendirdi.

Özellikle kullanıcılar kafası karışık veya stresli göründüğünde, GPT-4.5 esprili veya rahatlatıcı yanıtlar sunabiliyor ve bu da birçok kişinin gerçek bir kişiyle sohbet ettiklerini düşünmesine yol açıyor.

Test sırasında iki denek (bir yapay zeka, bir insan) arasındaki konuşma. Fotoğraf: UC San Diego .

Bu arada, LLaMa-3.1-405B, teknik olarak etkileyici olmasına rağmen, GPT-4.5'ten daha az ifade edici ve bağlamsal olarak daha az uyumludur. GPT-4o, güçlü olmasına rağmen, kişiselleştirme ve durumsal tepki adaptasyonu açısından yetersizdir.

GPT-4.5 atılımı, sanal eğitmenlerden psikolojik desteğe ve müşteri hizmetlerine kadar bir dizi pratik uygulama alanı açabilir. Ancak, yapay zekâ giderek daha insansı hale geldikçe, gerçeklik ile sanallık arasında ayrım yapmak ve bu teknolojinin nasıl kullanılacağını düzenlemek önemli bir toplumsal zorluk haline gelecektir.

Araştırma, yapay zekâ alanındaki hızlı gelişmelerin ortasında geliyor. GPT-4.5'in başarısı, OpenAI için yalnızca teknik bir zafer değil, aynı zamanda insanlar ve makineler arasındaki ilişki hakkında derin sorular da gündeme getiriyor. Bir testçi, sanki bir arkadaşıyla konuşuyormuş gibi hissettiğini, ta ki her şeyin sadece kod satırlarından ibaret olduğunu fark edene kadar. İnsanlar ve yapay zekâ arasındaki diyalog daha yeni başlamış olabilir.

Yapay zeka insanları kandırabilir mi?

İnsan gibi etkileşim kurma yeteneği

Yorum (0)