Vietnam.vn - Nền tảng quảng bá Việt Nam

Matematikçilerin yapay zekayı yenmeyi amaçladığı özel bir toplantı

Dünyanın en iyi matematikçileri, yapay zekayı (YZ) alt etmenin bir yolunu bulmak için gizlice bir araya geldiler, ancak YZ'nin yetenekleri karşısında hayrete düştüler.

VietnamPlusVietnamPlus20/05/2025

Mayıs ortalarında bir hafta sonu, matematik dünyasının gizli bir toplantısı gerçekleşti. Dünyanın önde gelen 30 matematikçisi, "akıl yürütme" yeteneğine sahip bir sohbet robotuyla karşılaşmak için gizlice ABD, Kaliforniya, Berkeley'e gitti. Sohbet robotunun görevi, matematikçiler tarafından yazılan problemleri çözerek problem çözme yeteneklerini test etmekti.

Matematikçiler, iki gün boyunca sürekli olarak profesör seviyesinde sorular sorduktan sonra, bu sohbet robotunun tarihte çözülmüş en zor problemlerden bazılarını çözebileceğini fark edince şaşırdılar.

Toplantının başkanı ve jüri üyesi olan Virginia Üniversitesi profesörü Ken Ono, Scientific American'a yaptığı açıklamada, "Meslektaşlarımın bu büyük dil modelinin matematiksel deha seviyesine yaklaştığını açıkça söylediklerini gördüm" dedi.

Dikkatimizi çeken sohbet robotu, karmaşık akıl yürütme için tasarlanmış büyük bir dil modeli (LLM) olan o4-mini tarafından destekleniyor. OpenAI'nin bir ürünü olan bu robot, karmaşık akıl yürütmeler gerçekleştirmek üzere eğitilmiş. Google'ın eşdeğer modeli olan Gemini 2.5 Flash da benzer yeteneklere sahip.

Önceki ChatGPT LLM'leri gibi, o4-mini de bir metin dizisindeki bir sonraki kelimeyi tahmin etmeyi öğrenir. Ancak o4-mini, derin verilerle eğitilmiş ve insanlar tarafından yakından ayarlanmış, daha hafif ve daha esnek bir versiyondur; bu da önceki modellerin ulaşamadığı matematiksel problemlere derinlemesine inmesine olanak tanır.

OpenAI, o4-mini'nin yeteneklerini test etmek için LLM modellerini test etme konusunda uzmanlaşmış kâr amacı gütmeyen bir kuruluş olan Epoch AI'dan daha önce yayınlanmamış 300 matematik sorusu oluşturmasını istedi. Geleneksel LLM'ler birçok karmaşık problemi çözebilirken, tamamen yeni sorularla karşılaştıklarında çoğu %2'den az doğru cevap verdi; bu da onların gerçek anlamda akıl yürütme yeteneğine sahip olmadıklarını gösteriyor.

Epoch AI, yeni değerlendirme projesinde genç matematikçi Dr. Elliot Glazer'ı lider olarak işe aldı. FrontierMath adlı yeni proje, Eylül 2024'ten itibaren hayata geçirilecek.

Proje, lisans, lisansüstü ve ileri düzey araştırma olmak üzere dört zorluk seviyesinde yeni sorular topluyor. Nisan 2025'e kadar Glazer, o4-mini'nin problemlerin yaklaşık %20'sini çözebildiğini keşfetti. Bu yüzden 4. seviyeye kadar ilerledi ve ileri düzey matematikçilerin bile zorlanacağı problemleri çözmesini istedi.

Katılımcılar gizlilik sözleşmesi imzalamaya zorlandı ve yalnızca şifreli Signal uygulaması üzerinden iletişim kurabildiler; çünkü e-posta kullanımı LLM'nin içeriği tarayıp "koklamasına" ve dolayısıyla değerlendirme verilerini tahrif etmesine olanak tanıyabilirdi.

o4-mini'nin çözemediği her soru, soruyu soran kişiye 7.500 USD ödül kazandıracak.

İlk ekip, soru üretme konusunda yavaş ama istikrarlı bir ilerleme kaydetti. Ancak Glazer, 17-18 Mayıs tarihlerinde yüz yüze bir toplantı düzenleyerek işleri hızlandırmaya karar verdi. Katılımcı 30 matematikçi altı kişilik gruplara ayrıldı ve birbirleriyle yarıştılar; problemleri çözmek için değil, yapay zekanın çözemeyeceği problemler bulmak için.

17 Mayıs akşamı, Ken Ono, beklenenin çok ötesinde bir matematiksel yeterlilik gösteren ve ekibin onu "yakalamasını" zorlaştıran sohbet robotundan bıkmaya başlamıştı. "Alandaki uzmanların sayılar teorisinde açık bir problem olarak tanıyacağı, doktora derecesine uygun bir problem ortaya koydum," dedi.

Sonuç olarak, o4-mini'ye sorduğunda, chatbot'un sadece 10 dakika içinde analiz edip akıl yürütüp doğru çözümü bulduğunu görünce şaşkına döndü. Daha doğrusu, ilk iki dakika içinde ilgili tüm belgeleri öğrenip kavradı. Ardından, soruna nasıl yaklaşacağını öğrenmek için daha basit bir versiyonunu denemeyi önerdi.

Beş dakika sonra, chatbot doğru cevabı verdi ve kendinden emin, hatta kibirli bir tonla konuştu. Ono, "Küstahlaşmaya başladı," diyor. "Ve ekledi: 'Alıntıya gerek yok çünkü gizli numarayı buldum!'"

Yapay zekâya yenilen Ono, 18 Mayıs sabahının erken saatlerinde Signal aracılığıyla ekibe hemen bir uyarı mesajı gönderdi. "Böyle bir modelle başa çıkmaya tamamen hazırlıksızdım," dedi. "Daha önce bir bilgisayar modelinde böyle bir mantık görmemiştim. Gerçek bir bilim insanının düşüneceği gibi düşünüyordu. Ve bu korkutucuydu."

Matematikçiler sonunda o4-mini'yi şaşkına çeviren 10 soru bulmayı başarsalar da, yapay zekanın sadece bir yılda gösterdiği gelişim hızı karşısında duydukları şaşkınlığı gizleyemediler.

Ono, o4-mini ile çalışma deneyimini çok yetenekli bir meslektaşıyla iş birliği yapmaya benzetiyor. Londra Matematik Bilimleri Enstitüsü'nde matematikçi ve yapay zekâyı matematiğe uygulamada öncü olan Yang Hui He ise şöyle diyor: "Çok yetenekli bir doktora öğrencisinin yapabileceği şey bu, hatta daha fazlasını."

Ayrıca, yapay zekanın bunu insanlardan çok daha hızlı başardığını da belirtmek gerekir. İnsanların bunu çözmesi haftalar hatta aylar alırken, o4-mini yalnızca birkaç dakika sürüyor.

o4-mini'yi çevreleyen heyecan, endişelerden yoksun değil. Hem Ono hem de He, o4-mini'nin yeteneklerinin insanları aşırı özgüvenli hale getirebileceği konusunda uyarıyor. "Tümevarım yoluyla kanıtımız var, çelişki yoluyla kanıtımız var ve şimdi de... ezici bir şekilde kanıtımız var," diyor He. "Bir şeyi yeterince güvenle söylerseniz, insanlar korkar. Bence o4-mini bu tür kanıtlamada ustalaştı: her şeyi büyük bir özgüvenle söylüyor."

Toplantı sona erdiğinde, matematikçiler matematiğin geleceği hakkında düşünmeye başladılar. Dünyanın en iyi matematikçilerinin bile çözemediği sorular olan "beşinci seviye" olasılığını tartıştılar. Yapay zekâ bu eşiğe ulaşırsa, matematikçilerin rolü önemli ölçüde değişecek: belki de sorgulayıcılar haline gelecekler, yeni matematiksel gerçekleri keşfetmek için yapay zekânın akıl yürütmesiyle etkileşime girecek ve onu yönlendirecekler; tıpkı bir profesörün bir lisansüstü öğrencisiyle çalışma şekli gibi.

Ono, "Uzun zamandır meslektaşlarıma, genel yapay zekanın asla gerçekleşmeyeceğini, sadece bir bilgisayar olduğunu düşünmenin büyük bir hata olacağını söylüyorum," dedi. "Panik yapmak istemiyorum ama bazı açılardan bu büyük dil modelleri şimdiden dünyanın en iyi doktora öğrencilerinin çoğunu geride bırakmaya başladı."

(Vietnam+)

Kaynak: https://www.vietnamplus.vn/cuoc-gap-go-dac-biet-noi-cac-nha-toan-hoc-tim-cach-danh-bai-tri-tue-nhan-tao-post1043183.vnp


Yorum (0)

No data
No data

Aynı kategoride

Ta Xua'da bulut avında kaybolmak
Son La'nın gökyüzünde mor Sim çiçekleriyle dolu bir tepe var
Fener - Orta Sonbahar Festivali anısına bir hediye
Tò he – çocukluk hediyesinden milyon dolarlık bir sanat eserine

Aynı yazardan

Miras

;

Figür

;

İşletme

;

No videos available

Güncel olaylar

;

Siyasi Sistem

;

Yerel

;

Ürün

;