Yapay zeka, 25 yıldır konuşma yeteneğini kaybetmiş İngiliz bir kadının sesini yeniden oluşturdu.

Motor nöron hastalığı (MND) nedeniyle konuşma yeteneğini kaybeden İngiliz bir kadın, yapay zeka (AI) teknolojisi ve eski bir aile videosundan alınan sekiz saniyelik bir kayıt sayesinde kendi sesiyle tekrar iletişim kurabildi.

Kuzey Londra'da yaşayan sanatçı Sarah Ezekiel, 25 yıl önce ikinci hamileliği sırasında 34 yaşında ALS teşhisi konulduktan sonra konuşma yeteneğini kaybetti.

Bu hastalık sinir sistemine zarar vererek dil, ağız ve boğaz kaslarını zayıflatır ve bazı hastaların konuşma yeteneğini tamamen kaybetmesine neden olur.

Yıllarca Ezekiel iletişim kurmak için bilgisayar ve ses üreten teknoloji kullandı, ancak ses onunki gibi değildi. İki çocuğu Aviva ve Eric, annelerinin gerçek sesini hiç tanımadan büyüdüler.

Son yıllarda uzmanlar, teknolojiyi kullanarak bir kişinin orijinal sesini yeniden oluşturmayı başardılar. Ancak bu teknik, uzun ve yüksek kaliteli kayıtlar gerektiriyor ve ortaya çıkan ses genellikle "monoton" olarak değerlendiriliyor.

İngiliz tıbbi medya şirketi Smartbox'ın temsilcisi Simon Poole, şirketin başlangıçta Bayan Ezekiel'den 60 dakikalık bir kayıt sağlamasını istediğini söyledi.

Ancak Bayan Ezekiel, 1990'lardan kalma bir ev videosundan alınmış, çok kısa ve kalitesiz bir klip bulabildi. Klip sadece 8 saniye uzunluğundaydı, sesi bozuktu ve televizyondan gelen gürültü vardı.

Bay Poole, gerçekçi sesleri çok az veriyle yeniden oluşturabilen, New York merkezli bir yapay zeka ses üretme şirketi olan ElevenLabs tarafından geliştirilen teknolojiye yöneldi.

Bay Poole, eski kayıttan sesi çıkarmak için bir yapay zeka aracı kullandı, ardından gerçek ses verileri üzerinde eğitilmiş başka bir araç kullanarak nihai ürünü oluşturdu.

Sonuçlar Bayan Ezekiel'i derinden etkiledi. Yeniden yaratılan ses, daha önce hoşlanmadığı kendine özgü Londra aksanı ve hafif peltekliğiyle kendi sesine çok benziyordu.

MND UK'ye göre, bu rahatsızlığa sahip kişilerin onda sekizine yakını teşhisten sonra konuşma güçlüğü yaşıyor. Bununla birlikte, mevcut bilgisayar tarafından üretilen seslerin genellikle ritim ve duygudan yoksun olduğu değerlendiriliyor.

Bay Poole, günümüzdeki yapay zeka teknolojisinin ilerlemesinin, insan benzeri ve duygusal sesler yaratma yeteneği olduğunu ve böylece daha önce kuru olan bilgisayar seslerine "hayat verdiğini" söyledi. Sesin kişiselleştirilmesinin aynı zamanda kişisel kimliği korumanın bir yolu olduğunu da vurguladı.

ALS gibi rahatsızlıklar nedeniyle konuşma yeteneğini kaybetme riski taşıyan kişilerin, kimliklerini korumak ve gelecekteki iletişimi kolaylaştırmak için mümkün olan en kısa sürede seslerini kaydetmeleri teşvik ediliyor.

Ancak akıllı telefonlar yaygınlaşmadan önce düzgün kayıtlar almak kolay değildi.

(VNA/Vietnam+)

Kaynak: https://www.vietnamplus.vn/ai-tai-tao-giong-noi-cho-mot-phu-nu-anh-mat-kha-nang-noi-25-nam-post1057350.vnp