ABD'de büyük bir yapay zeka organizasyonunda çalıştıktan sonra neden Vietnam'a dönüp VinBigdata'ya katılmaya karar verdiniz?
ABD'de çalışırken birçok büyük devlet projesinde yer almama rağmen, elde ettiğim sonuçlar genellikle büyük bir sürecin sadece birkaç adımıydı. Çoğu zaman, projelerin sıkı gizliliği nedeniyle, geliştirdiğim çözümlerin nasıl kullanıldığını bile bilmiyordum.
2017'de Vietnam'a döndüğümde, henüz geliştirme aşamasındaydı ve çözülmesi gereken büyük veri ve yapay zeka ile ilgili birçok sorun vardı. Profesör Vu Ha Van'ın, Vietnam halkının yaşamlarına hizmet edecek Vietnam teknoloji çözümleri geliştirme hedefini birlikte hayata geçirme davetini kabul ettim. Vietnam'a dönüşümün çok daha anlamlı olduğunu gördüm çünkü daha büyük etki yaratan sorunlar üzerinde çalışabilecektim.
Dr. Dao Duc Minh bir atölyede
Yapay zekânın geliştirilme stratejisinde büyük verinin rolü ve etkisi nedir efendim?
Veriler, yapay zeka eğitiminde büyük ve değerli bir rol oynar. Yüksek kaliteli bir yapay zeka modelinin eğitimi genellikle büyük bir veritabanının eğitilmesiyle başlar. Bu nedenle, kaliteli bir yapay zekaya sahip olmak için öncelikle iyi verilere sahip olmamız gerekir.
İyi veri, nicelik ve ölçek, kalite, çeşitlilik ve evrensellik açısından standartları karşılamalıdır. Yapay zekâ modellerine aktarılacak en yüksek kalitede verileri oluşturmak için ham veri temizleme adımından binlerce saatlik veri toplama ve işleme süreci oldukça pahalı ve karmaşıktır. Buna karşılık, büyük verileri analiz etmek için, verileri büyük ölçekte doğru bir şekilde işleyebilme yeteneğini sağlamak ve böylece daha iyi kesin veya öngörücü sonuçlar elde etmek için yapay zekâdan yararlanmamız gerekir.
Örneğin, Vietnam halkı için bir sanal asistan ürünü (ViVi) geliştirme sürecinde, farklı bölgelerden, farklı yaş ve cinsiyetlerden, yüzlerce alanı kapsayan içeriklerle yüz binlerce saatlik yüksek kaliteli ses verisini toplamamız ve işlememiz gerekiyordu...
Veya en son olarak, tamamen VinBigdata'ya ait bir Büyük Dil Modeli kullanılarak geliştirilen "Son kullanıcılar için ChatGPT'nin ilk Vietnamca versiyonu" olan ViGPT'nin lansmanı. Bu model, birçok farklı alandan 600 GB'lık rafine Vietnamca veriye dayanarak eğitilmiştir. Vietnamca veri ve dil konusundaki bilgimizle, ChatGPT'nin doğuşundan sadece 9 ay sonra ViGPT'nin lansman süresini kısaltmak için yeni bir yaklaşım bulduk.
İşte büyük veri ile yapay zekanın sinerjisi.
Araştırmayı topluma hizmet edecek pratik değerle ilişkilendirme konusunda görüşünüz nedir?
- Teknoloji araştırmalarının ancak hayata girdiğinde, toplumsal sorunları çözdüğünde ve insanların hayatlarını iyileştirdiğinde gerçek anlamda başarılı olduğuna inanıyorum.
İş ve toplumsal sorunları çözen pratik ticari ürünler yaratmak için her zaman şu soruya dikkat etmeli ve sormalıyız: Veri hayata ne gibi bir değer katacak?
Bugüne kadar çeşitli sektörler ve alanlar için çok çeşitli ürünler ve çözümler araştırdık ve geliştirdik. Bunlar arasında ViGPT, tıbbi görüntüleme tanısında yapay zeka çözümleri sağlayan VinDr, biyo-yapay zeka platformu VinBase ve akıllı görüntü analizi çözüm seti Vizone yer alıyor.
Vingroup Corporation'ın bir etkinliğinde VinBigdata'nın kilit personeliyle birlikte
4. Sanayi Devrimi küresel ölçekte güçlü bir şekilde yaşanıyor. Sizce Vietnam'ın avantajları neler?
Önceki devrimlerle karşılaştırıldığında, Vietnam'ın şu anda bu 4.0 sanayi devriminde öne çıkmak için birçok avantajı olduğuna ve ülkenin dünya haritasındaki konumunu iyileştirmeye yardımcı olacağına inanıyorum. Bu hedefe ulaşmanın iki anahtarı veri ve insandır.
Vietnam'da şu anda yaklaşık 100 milyon insan yaşıyor ve bunların büyük bir kısmı telefon ve kişisel bilgisayar kullanıyor. Ayrıca, yapay zeka alanında saygın uzmanlarımız, bilgi teknolojileri alanında kaliteli genç personelimiz ve matematik alanında çok iyi bir temelimiz var.
Peki sınırlamalar neler?
İlk belirgin sınırlama, kalabalık bir nüfusa sahip olmamıza rağmen, verilerde ustalaşma, özellikle tesis, iş ve idari birimlerde verilerin standardizasyonu ve senkronizasyonu konusunda hâlâ zorluk yaşıyor olmamızdır.
Ayrıca, özellikle yüksek performanslı bilgi işlem altyapısına yatırım konusunda sınırlı yatırım kaynakları gibi başka kısıtlamalarla da karşı karşıyayız.
Sizce, Vietnam halkının hayatına hizmet edecek teknolojiyi yaratma ve yönetme yolculuğunda Vietnam verilerine hakim olmanın rolü ne kadar önemli?
Şu anda dünyada birçok önde gelen yapay zeka ürünü bulunmaktadır; bunlar arasında OpenAI'dan ChatGPT veya Google'dan Bard gibi büyük dil modellerine dayalı yapay zeka uygulamaları yer almaktadır. Ancak, Vietnamca bu ürünlerin geliştirilmesinde ana dil grubu değildir.
Dolayısıyla, kullanıcılara geri dönen Vietnamca'ya özgü içeriklerin kalitesi az veya çok etkileniyor ve hata olasılığı yüksek, daha da tehlikelisi temel bilgi hataları.
Vietnamlılar olarak kendi veri kaynaklarımıza erişme avantajına sahibiz. Vietnam verilerinin özelliklerini, Vietnam halkının ihtiyaçlarını ve özelliklerini anlama yeteneğine yalnızca biz sahibiz. Bu nedenle, Vietnam verilerine hakim olmak, Vietnam halkına hizmet edecek temel teknolojilere hakim olmanın anahtarıdır.
VinBigdata üyeleri için dahili eğitim
Özellikle günümüzde çoğu Vietnamlının sosyal paylaşım sitelerini yurt dışından kullandığı bir ortamda, belirli veri kaynaklarına nasıl erişebiliriz?
Aslında, günümüzde en büyük insan verisi kaynağı (sadece Vietnamlılar değil) internet ve sosyal ağlardır. Ancak, her projenin belirlediği özelliklere bağlı olarak, Vietnam veri özelliklerini anlayarak farklı kaynaklardan veriye erişebilir ve toplayabiliriz.
Örneğin, OpenAI'nin GPT modelleri yüzlerce, hatta trilyonlarca parametreye sahip, devasa miktarda veri üzerinde eğitiliyor ve milyarlarca dolara mal oluyor. Biz ise araştırmalarımıza, yeteneklerimize ve kaynaklarımıza dayanarak tamamen farklı bir yol seçtik: Sadece birkaç milyar parametreden oluşan bir mimariye sahip, kendi topladığımız ve geliştirdiğimiz 600 GB'lık bir Vietnamca veri kümesi üzerinde eğitilmiş, ancak Vietnamcayı işleme konusunda eşdeğer yeteneklere sahip bir Vietnamca dil modeli oluşturmak. Sonuçlar, kendi geliştirdiğimiz mimarinin kendi kendini optimize edebildiğini, dil modeli eğitim süresini kısaltabildiğini, maliyetleri düşürebildiğini ve yine de model kalitesini sağlayabildiğini gösteriyor.
Yapay zeka ürünleri araştırma ve geliştirme sürecinde siz ve ekibiniz ne gibi zorluklarla karşılaştınız?
İlk zorluk kesinlikle zaman. Yapay zeka teknolojisi dalgası çok hızlı geliyor ve patlama döneminde. Dünyanın önde gelen teknoloji şirketleri, sürekli güncellenen ve iyileştirilen, son derece kapsamlı ürünleri hızla piyasaya sürdü. Yavaş davranır ve ürünleri zamanında piyasaya sürmezsek, kesinlikle geride kalacağız.
Öte yandan, uygulanabilir ve pratik toplumsal sorunları çözebilecek ürünler yaratmak istiyorsak, ürünün öne çıkan, özel ve benzersiz özelliklerini bulup geliştirmeyi de göz önünde bulundurmalıyız.
Vietnam Yapay Zeka Günü'nde (AI4VN 2023) sunum
Aslında, Vietnam'da ve dünya genelinde birçok kişi ve kuruluş veri sızıntıları nedeniyle büyük kayıplar yaşadı. Veri güvenliği konusuna nasıl bakıyorsunuz?
Günümüzde her uygulamanın veriden kaynaklandığı söylenebilir. Verilerle çalışırken, bir yandan verileri yaşam için en iyi teknolojiyi yaratmak amacıyla kullanma hedefini sağlamalı, diğer yandan da bireyler ve kurumlar için veri güvenliğini sağlamalıyız.
İnsan faktörü, veri güvenliği güvence sürecinde çok önemli bir halkadır. Geliştiriciler, ürün kullanıcıları ve kullanıcıları içerir. Geliştiriciler için veri güvenliği bilinci, veri toplama ve işleme sürecinin en başından itibaren mevcut olmalıdır.
Çoğu zaman, hiçbir sorun yaşanmadığında veri güvenliğinin öneminin farkında olmayız. Ancak bir veri sızıntısı meydana gelirse, zarar çok büyük olabilir. Veri sızıntıları, teknik sorunlar veya veri çalma amaçlı kasıtlı saldırılar nedeniyle meydana gelebilir. Veri sızıntıları, bireylerin veya kuruluşların bilgilerinin kötü niyetli kişiler tarafından yasa dışı amaçlarla kullanılmasına yol açabilir ve işletmeler, ilgili sorunları gidermek için maddi kayıplara uğrayabilir, hatta markalarına zarar verebilir.
Dr. Dao Duc Minh ve VinBigdata ekibi bir etkinlikte
Vietnam halkına hizmet edecek teknolojiye hakim olma özleminin ardından dünyaya açılmak için adımlar atılacak mı?
Ürünlerini uluslararası pazara sunmak isteyen her kuruluş veya işletmenin uluslararası standartlara uyması gerekir. VinBigdata'nın çözüm ve teknoloji alanında güçlü yanları vardır, bu nedenle dünyayı fethetme vizyonunu belirlemesi doğaldır.
Elbette, birçok farklı ürün ve uygulamaya dağıtım yapmak için, dünya çapındaki kullanıcıların uzun yıllara dayanan deneyimi ve anlayışına sahip uluslararası birimlerin desteğine ihtiyaç vardır.
Teşekkür ederim!
[reklam_2]
Kaynak: https://thanhnien.vn/ts-dao-duc-minh-lam-chu-du-lieu-viet-la-buoc-dau-phat-trien-va-nam-giu-cong-nghe-viet-18524052710263732.htm
Yorum (0)