Zalo AI'nın "GenZ" mühendisi Le Duy Khanh'ın gerçek zamanlı konuşma tanıma modellerinin (Akışlı Otomatik Konuşma Tanıma) doğruluğunu artırmaya yönelik araştırma çalışması, ilk kez Eylül 2024'te Yunanistan'da düzenlenecek Uluslararası Bilimsel Konferans'ta duyurulacak.
" Zaman Kaydırmalı Bağlamsal Dikkat ve Dinamik Doğru Bağlam Maskeleme ile Akışlı Konuşma Tanıma'nın Geliştirilmesi " konulu , 2000 doğumlu Zalo yapay zeka mühendisinin araştırma makalesi, Interspeech Konferansı'nda sözlü oturum şeklinde sunulacak 2.000'den fazla katılımcının yer aldığı zorlu inceleme turunu geçerek neredeyse mükemmel bir puan - 11/12 puan - elde etti.
Le Duy Khanh, " İlk bilimsel makalemin prestijli bir bilimsel konferansta tanınmasından ve Vietnam'ın araştırma başarılarını büyük teknoloji şirketlerine, uzmanlara ve uluslararası topluma tanıtma fırsatına sahip olmaktan büyük gurur duyuyorum " dedi.
Zalo AI Araştırma ve Geliştirme Bölüm Başkanı ve Ho Chi Minh City Ulusal Üniversitesi Doğa Bilimleri Üniversitesi Öğretim Üyesi Dr. Chau Thanh Duc'un rehberliğinde yürütülen bu araştırma projesinin, Zalo uygulamasında konuşma tanıma modellerinin iyileştirilmesine, ses diktesinin ve sesten metne dönüştürmenin doğruluğunun artırılmasına önemli katkı sağlaması bekleniyor.
Dr. Chau Thanh Duc , " Zalo AI'nın son derece pratik araştırmalarını bilimsel makalelere dönüştürmek ve bunları prestijli uluslararası konferanslarda sunmak çok anlamlı. Bu, yalnızca Vietnamlı mühendislerin kapasitesini değil, aynı zamanda deneyimleri paylaşma ve küresel yapay zeka topluluğunun gelişimine katkıda bulunma arzusunu da gösteriyor," dedi.
Zalo, bu araştırmayı 2023 yılı sonundan itibaren mesajlaşma uygulamasına entegre ederek "sesli mesaj oluşturma" özelliğinin doğruluğunu önemli ölçüde artırdı. Bu özellik, kullanıcıların elle yazmak yerine sesli mesaj oluşturmalarına olanak tanıyarak zamandan tasarruf sağlıyor ve birçok kullanım durumunda daha kullanışlı hale getiriyor. Aynı zamanda, bu özelliğin pratikteki doğruluğu %95'e ulaştı; sesli mesaj yazdıktan sonra metni yeniden düzenleme ihtiyacı %6,4'ten yalnızca %4,8'e düştü.
Zalo istatistiklerine göre, özellik hala test aşamasında olmasına rağmen günde yaklaşık 4,5 milyon mesaj üretiyor ve aylık yaklaşık 3,2 milyon kullanıcı çekiyor (veriler Haziran 2024'e kadar güncellendi).
Zalo, 2017 yılında yapay zeka araştırmalarında öncü yolculuğuna başladığından beri, genç nesli "güçlendirmeye" her zaman inanmıştır. Şu anda, Zalo çalışanlarının %31'i Z kuşağındandır. 2021 yılında, Zalo yapay zeka mühendislik ekibinin konuşma işleme teknolojisiyle ilgili iki araştırma konusu daha Asya- Pasifik Uluslararası Yapay Zeka Konferansı'nda (PRICAI 2021) ödüllendirildi. Bu iki konunun yazarlarının hepsinin 30 yaşın altındaki genç araştırmacılar olması dikkat çekicidir.
Interspeech, Uluslararası Konuşma İletişimi Derneği tarafından düzenlenen, köklü, kapsamlı ve prestijli bir uluslararası Konuşma İşleme konferansıdır. Bu yıl, "Konuşma ve Ötesi " temalı konferans , 1-5 Eylül 2024 tarihleri arasında Kos Adası'nda (Yunanistan) gerçekleşecektir.






Yorum (0)