Üretken yapay zekânın (Generative AI) patlaması, küresel teknoloji manzarasını tamamen değiştirdi.
OpenAI'nin 2022 sonlarında ChatGPT'yi piyasaya sürmesinden bu yana, sağlık, eğitim , finans, hukuk gibi birçok alanda uygulanan bir dizi benzer LLM modeli sürekli olarak ortaya çıktı. Yarış, yalnızca kurumsal ölçekte değil, aynı zamanda eğitim kapasitesi, bilgi işlem altyapısı ve veriler açısından ulusal ölçekte de kızıştı.
Finansal potansiyeli ve uygun koşulları olan OpenAI, Google, Meta veya Microsoft gibi büyük şirketler, LLM modellerinin eğitimi için temel faktör olan Nvidia H100 gibi binlerce üst düzey GPU'ya sahip olmak için "hızla" milyarlarca dolar yatırım yaptı. Nvidia'nın hisse senedi fiyatı, o dönemde dünyanın altyapıya olan açlığını yansıtacak şekilde hızla yükseldi.
Bu arada, gelişmekte olan ülkelerdeki teknoloji şirketleri, maliyet sorunlarının yanı sıra, ABD'den yapay zekâ çipi ekipmanlarının ithalat ve ihracatında da kısıtlamalarla karşı karşıya. Bu durum, eğitim ekipmanı eksikliğine ve teknoloji devlerine kıyasla "daha yavaş" olmalarına yol açıyor. Yurt içi hedefleri olan Zalo da bir istisna değil.
Veri açısından, önceki makine öğrenimi problemleri büyük miktarda eğitim verisi gerektiriyordu, ancak büyük dil modelleri için bu çok büyük bir veri miktarıdır. Yeterince iyi bir modele sahip olmak için, LLM sistemi onlarca hatta yüz milyarlarca giriş metni belirteci gerektirir. Bu arada, popülerlik açısından Vietnamca, İngilizce ve Çince ile "eşit" değildir. Bu durum, Vietnamlı LLM geliştiricileri için zorluğu kat kat artırmıştır.
2023 yılında GPT-3.5, GPT-4 gibi büyük dil modelleri (LLM) teknoloji dünyasını kasıp kavururken, birçok Vietnamlı işletme de LLM eğitim sürecinde kısa yoldan ilerlemek ve öne geçmek için yabancı yapımı ince ayarlı modelleri tercih ediyor.
Zalo farklı bir yol seçti - daha meşakkatli ama daha özerk: Modeli sıfırdan kendi kendine eğitmek (sıfırdan model). Verilerden, model mimarisinden tüm eğitim sürecine kadar her şeyin sıfırdan oluşturulmasını gerektiren bir yol. Bu karar, devlerle rekabet etmek için değil, Vietnam halkının özlemini gerçekleştirmek içindi: LLM modeline anadillerinde hakim olmak.
"Zorlukları öngördük ve yine de oyuna erken katılmaya karar verdik. "Büyük oyuncularla" doğrudan rekabet etmedik, daha iyisini yapabileceğimiz niş bir pazar seçtik. Amacımız, Vietnam halkının verilerden algoritmalara kadar tamamen kontrol edebileceği bir model oluşturmak," diye paylaştı Zalo AI Bilim Direktörü Dr. Nguyen Truong Son.
Altyapı, veri ve eğitim seviyesi gibi üç ana faktörde birçok engelle karşılaşmalarına rağmen, Vietnamlı mühendisler zorlukların üstesinden gelmek için proaktif çözümler ürettiler. Bu, Vietnam halkının zor koşullarda gösterdiği kararlılığı ve iradeyi, özellikle de Vietnam halkı için LLM geliştirme sürecindeki zorlukların üstesinden gelmeyi gösterdiğini göstermektedir.
LLM eğitimi almak için mühendislerin doğru altyapıya ihtiyacı vardı. Ancak o zamanlar, Nvidia'nın H100 gibi GPU'ları neredeyse "dünya çapında nadir bulunan" ürünlerdi. Bu arada, büyük şirketler bunları bir yıllığına ön sipariş etmiş ve sahip olmak için milyonlarca dolar ödemişti. Vietnam'da Zalo da 8 adet DGX H100 sunucusu satın almaya çalıştı, ancak üreticiden gelen her parti teslimatı beklemek zorunda kaldığı için bu kolay olmadı.
Nvidia GPU'larının yokluğunda, Vietnamlı mühendisler her kod satırında denemeler yapmak ve her küçük modeli çalıştırmak için tüketici GPU'larını esnek bir şekilde kullanmak zorunda kaldılar. Mühendisler beklemek yerine, modern ekipmanlara sahip olduklarında her şeyin hazır olması için proaktif bir şekilde hazırlık yaptılar.
Veri açısından, Zalo mevcut kaynaklara güvenmek yerine, İngilizce ve Çince ile karşılaştırıldığında ciddi bir açığı kapatmak için, özellikle Vietnamca için yüksek kaliteli bir veri ambarı oluşturmaya yatırım yaptı.
Esnek geliştirme stratejisi sayesinde Zalo, büyük dil modelinin geliştirme süresini beklenen 18 aydan 6 aya indirmeyi başardı. 2023'ün sonunda, Zalo'nun Vietnamca büyük dil modeli, Vietnam'ın önde gelen teknoloji ve yapay zeka topluluğunu bir araya getiren Zalo Yapay Zeka Zirvesi adlı bir etkinlikte resmen tanıtıldı. Zalo'nun LLM modeli, Tinhte.vn tarafından düzenlenen Kahoot yarışmasında ilk kez sahneye çıktı ve şaşırtıcı bir şekilde, o dönemde dünyanın en güçlü modeli olarak kabul edilen GPT4'ün hemen arkasında, GPT 3.5'i geride bıraktı.
VMLU (Büyük Dil Modelleri için Vietnamca Çoklu Görev Dili Anlama Ölçüt Paketi) değerlendirme platformuna göre Zalo'nun modeli, OpenAI'nin GPT-3.5'inden 1,5 kat daha güçlü. 2024 yılı sonuna kadar bu model, VMLU'nun sıralamalarında Vietnamca işleme yeteneği açısından GPT-4 (OpenAI), Gemma-2-9B (Google) veya Phi-3-small (Microsoft) gibi büyük isimleri geride bırakacak ve sadece Meta'nın LLaMA-3-70B'sinin gerisinde kalacak.
Zalo sadece araştırmayla yetinmiyor, LLM'den gelen uygulama ürünlerini ticarileştirerek ve popülerleştirerek laboratuvardaki teknolojiyi yavaş yavaş hayata geçiriyor.
2025'in başlarında, Zalo platformunda resmi bir hesap olarak faaliyet gösteren genel soru-cevap asistanı Kiki Info, 2 aydan kısa bir sürede 1 milyondan fazla kullanıcıya ulaştı. Bir diğer uygulama olan Thiep AI da sadece 2 ayda 15 milyon kart oluşturarak etkileyici bir sayıya ulaştı.
Zalo'nun yolculuğu, yalnızca teknoloji geliştirmek isteyen bir şirketten ibaret değil. Vietnam'ın, bilim ve teknoloji geliştirme ve ulusal dijital dönüşüm konulu 57-NQ/TW sayılı Karar'daki politikalarıyla inovasyonu agresif bir şekilde teşvik ettiği daha büyük resmin bir parçası. Özellikle yapay zekâ alanı vurgulanıyor.
Zalo'dan Vietnamca LLM'nin ortaya çıkışı ve hızlı gelişimi, yalnızca bir işletme için teknolojik bir adım değil, aynı zamanda Vietnam teknoloji ekibinin içsel kapasitesinin ve azminin de bir kanıtıdır.
"Sıfırdan" tekniğiyle - yani sıfırdan model eğitimiyle - Zalo uzun yolu seçti, ancak Vietnam'ın yapay zekada gerçek anlamda ustalaşmasına yardımcı oldu. Sadece sonuçlar açısından değil, aynı zamanda model mimarisinden, verilerden, algoritmalardan ve uygulama ürünlerine kadar tüm süreç açısından da. Zalo'nun başarısı, Vietnam'ın yerel bir LLM modeline sahip olan birkaç Güneydoğu Asya ülkesinden biri olmasına da yardımcı oldu - giderek artan küresel teknoloji rekabeti bağlamında stratejik bir dönüm noktası.
Zalo, önümüzdeki uzun yolculukta yalnızca bir model veya birkaç ürünle yetinmeyecek, aynı zamanda hem kullanıcılara hizmet etmek hem de rekabetçi kalitede bir Vietnam yapay zeka platformu oluşturmak için modeli mükemmelleştirmeye devam edecek: "Zalo'nun yapay zeka geliştirme yolculuğu hala uzun. Modeli hem genişlikte hem de derinlikte optimize etmeye devam ederken, pratik uygulamayı da destekleyeceğiz. Nihai hedefimiz, Vietnam halkına pratik olarak hizmet eden kaliteli yapay zeka ürünleri yaratmak," diye ekledi Bay Son.
Zalo'nun Vietnamca LLM alanındaki başarılı gelişimi, yalnızca bir işletme için çığır açıcı bir gelişme olmakla kalmıyor, aynı zamanda Vietnam yapay zekası için potansiyel bir gelecek de sunuyor. Vietnam halkının azmi ve azmi, değerli sonuçlara ulaşma yolculuğunu yönlendirdi. Vietnam yapay zekasının geleceğinde yalnızca bir "Zalo" değil, aynı zamanda teknoloji dünyasını takip edecek, miras alacak ve fethedecek cesur bir mühendis nesli de olacak.
Kaynak: https://znews.vn/zalo-va-hanh-trinh-lam-chu-llm-tieng-viet-post1561765.html






Yorum (0)