Üretken yapay zekanın (YZ) patlaması, küresel teknoloji manzarasını tamamen değiştirdi.
OpenAI'nin 2022 sonlarında ChatGPT'yi piyasaya sürmesinden bu yana, sağlık, eğitim , finans ve hukuk gibi birçok alanda uygulanan bir dizi benzer LLM modeli sürekli olarak ortaya çıktı. Eğitim kapasitesi, bilgi işlem altyapısı ve veri açısından rekabet, yalnızca kurumsal düzeyde değil, ulusal düzeyde de kızıştı.
OpenAI, Google, Meta ve Microsoft gibi büyük şirketler, sahip oldukları mali kaynaklar ve elverişli koşullar sayesinde, LLM modellerinin eğitimi için temel bir bileşen olan Nvidia H100 gibi binlerce üst düzey GPU'yu satın almak için hızla milyarlarca dolar yatırım yaptı. Bu dönemde Nvidia'nın hisse senedi fiyatı, altyapıya yönelik küresel talebi yansıtacak şekilde hızla yükseldi.
Bu arada, gelişmekte olan ülkelerdeki teknoloji şirketleri, maliyet sorunlarına ek olarak, ABD'den yapay zeka çip ekipmanı ithalatı ve ihracatında da kısıtlamalarla karşı karşıya kalıyor. Bu durum, eğitim ekipmanı eksikliğine ve teknoloji devlerine kıyasla daha yavaş bir tempoya yol açıyor. Yurtiçi başarı hırsıyla hareket eden Zalo da bu girdabın içinde kalmış durumda.
Veriler açısından, önceki makine öğrenimi problemleri büyük miktarda eğitim verisi gerektiriyordu, ancak büyük ölçekli dil modelleri için bu muazzam bir miktardır. Yeterince iyi bir modele sahip olmak için, bir dil öğrenme sistemi on milyarlarca, hatta yüz milyarlarca girdi metin belirteci gerektirir. Bu arada, popülerlik açısından Vietnamca, İngilizce ve Çince ile boy ölçüşemez. Bu durum, Vietnamca dil öğrenme sistemi geliştiricileri için zorlukları büyük ölçüde artırmıştır.
2023 yılında GPT-3.5 ve GPT-4 gibi büyük dil modelleri (LLM'ler) teknoloji dünyasında devrim yarattı ve birçok Vietnamlı işletme de LLM eğitim sürecinde kısayollar kullanarak öne geçmek için yurtdışından kolayca temin edilebilen, ince ayarlı modelleri tercih etti.
Zalo farklı bir yol seçti – daha zorlu ama daha bağımsız bir yol: modelini sıfırdan eğitmek. Bu yaklaşım, verilerden ve model mimarisinden tüm eğitim sürecine kadar her şeyin sıfırdan inşa edilmesini gerektiriyor. Bu karar, devlerle rekabet etmekle ilgili değil, Vietnam halkının özlemlerini gerçekleştirmekle ilgiliydi: LLM modelini kendi ana dillerinde ustaca kullanmak.
Zalo AI Bilim Direktörü Dr. Nguyen Truong Son, “Zorlukları önceden tahmin ettik ve yine de oyuna erken girmeye karar verdik. Doğrudan 'büyük oyuncularla' rekabet etmedik, daha iyi yapabileceğimiz niş bir pazarı seçtik. Amacımız, Vietnamlıların veriden algoritmalara kadar her şeyi tamamen kavrayabileceği bir model oluşturmak” dedi.
Vietnamlı mühendisler, altyapı, veri ve eğitim olmak üzere üç temel alanda sayısız engelle karşılaşmalarına rağmen, bu zorlukların üstesinden gelmek için proaktif bir şekilde çözümler aradılar. Bu, özellikle Vietnamlılar için LLM geliştirme zorluklarının üstesinden gelme konusunda, Vietnam halkının zor koşullar altındaki azmini ve iradesini göstermektedir.
Seviye Öğrenme (LLM) eğitimi için mühendislerin doğru altyapıya ihtiyacı vardı. Ancak o zamanlar Nvidia'nın H100 gibi GPU'ları neredeyse "küresel bir nadirlik"ti. Bu arada, büyük şirketler bunları bir yıl önceden sipariş etmiş ve milyonlarca dolar ödeyerek satın almışlardı. Vietnam'da Zalo da 8 adet DGX H100 sunucu satın almaya çalıştı ancak bu kolay olmadı; üreticiden her teslimat için beklemeleri gerekti.
Nvidia GPU'larının yokluğunda, Vietnamlı mühendisler, tek tek kod satırları ve küçük ölçekli modeller üzerinde deneyler yapmak için tüketici sınıfı GPU'ları esnek bir şekilde kullanmak zorunda kaldılar. Beklemek yerine, mühendisler proaktif bir şekilde hazırlık yaparak, modern ekipman edindiklerinde her şeyin hazır olmasını sağladılar.
Veri açısından bakıldığında, Zalo hazır kaynaklara güvenmek yerine, İngilizce ve Çince'ye kıyasla ciddi bir eksiklik olan Vietnamca veri açığını telafi etmek amacıyla kendi yüksek kaliteli veri deposunu kurmaya yatırım yapıyor.
Esnek geliştirme stratejisi sayesinde Zalo, büyük dil modelinin geliştirme süresini öngörülen 18 aydan sadece 6 aya indirdi. 2023 yılının sonunda, Zalo'nun Vietnamca büyük dil modeli, Vietnam'daki önde gelen teknoloji ve yapay zeka uzmanlarını bir araya getiren Zalo Yapay Zeka Zirvesi'nde resmi olarak tanıtıldı. Orada, Zalo'nun LLM modeli, Tinhte.vn tarafından ortaya atılan bir Kahoot yarışmasıyla ilk kez görücüye çıktı ve şaşırtıcı bir şekilde GPT 3.5'i geride bırakarak, o zamanlar dünyanın en güçlü LLM modeli olarak kabul edilen GPT4'ün hemen arkasında yer aldı.
VMLU (Vietnamese Multitask Language Understanding Benchmark Suite for Large Language Models) kıyaslama platformunda, Zalo'nun modeli OpenAI'nin GPT-3.5 modelinin performansının 1,5 katına ulaştı. 2024 yılının sonuna kadar bu model, GPT-4 (OpenAI), Gemma-2-9B (Google) ve Phi-3-small (Microsoft) gibi büyük oyuncuları bile geride bırakarak, VMLU sıralamasında Vietnamca dil işleme yeteneklerinde yalnızca Meta'nın LLaMA-3-70B modelinin gerisinde kaldı.
Zalo, sadece araştırma yapmakla kalmayıp, LLM'den türetilen ürün ve uygulamaları ticarileştirerek ve yaygınlaştırarak teknolojiyi laboratuvardan gerçek hayata kademeli olarak taşıyor.
2025 yılının başlarında, Zalo platformunda Resmi Hesap olarak faaliyet gösteren kapsamlı Soru-Cevap asistanı Kiki Info, iki aydan kısa bir sürede 1 milyondan fazla kullanıcıyı kendine çekti. Bir diğer uygulama olan AI Greeting Cards da sadece iki ayda etkileyici bir şekilde 15 milyon tebrik kartı oluşturulup gönderilmesini sağladı.
Zalo'nun yolculuğu sadece teknoloji geliştirmek isteyen bir şirketin öyküsü değil. Bu, Vietnam'ın bilim, teknoloji ve ulusal dijital dönüşümün geliştirilmesine ilişkin 57-NQ/TW sayılı Karardan kaynaklanan politikalarla inovasyonu agresif bir şekilde teşvik ettiği daha büyük bir resmin parçasıdır. Özellikle yapay zeka alanına vurgu yapmaktadır.
Zalo'nun Vietnam'daki LLM platformunun ortaya çıkışı ve hızlı gelişimi, yalnızca bir işletme için teknolojik bir ilerleme değil, aynı zamanda Vietnamlı teknoloji ekibinin doğuştan gelen yeteneklerinin ve azminin de bir kanıtıdır.
"Sıfırdan model geliştirme" tekniğiyle Zalo, uzun vadeli ancak Vietnam'ın yapay zekayı gerçekten ustalaştırmasına yardımcı olan bir yol seçti. Bu, sadece sonuçlar için değil, model mimarisinden, verilerden, algoritmalardan nihai uygulamaya kadar tüm süreç için geçerlidir. Zalo'nun başarısı, Vietnam'ı yerli bir LLM modeline sahip olan birkaç Güneydoğu Asya ülkesinden biri haline getirdi; bu da giderek daha da kızışan küresel teknoloji rekabetinde stratejik bir dönüm noktasıdır.
Önümüzdeki uzun yolculukta Zalo, tek bir model veya birkaç ürünle yetinmeyecek, hem kullanıcılara hizmet etmek hem de rekabetçi, yüksek kaliteli bir Vietnam yapay zeka platformu oluşturmak için modeli geliştirmeye devam edecektir: “Zalo'nun yapay zeka geliştirme yolculuğu hala uzun. Pratik uygulamaları teşvik ederken, modeli hem kapsam hem de derinlik açısından optimize etmeye devam edeceğiz. Nihai hedefimiz, Vietnam halkına pratik olarak hizmet eden yüksek kaliteli yapay zeka ürünleri yaratmaktır,” diye ekledi Bay Son.
Zalo'nun Vietnamca dilinde bir yapay zeka modeli geliştirme başarısı, şirket için çığır açan bir adım olmanın yanı sıra, Vietnam'da yapay zeka için umut vadeden bir geleceğin kapılarını da açıyor. Vietnam halkının azmi ve hırsı, bu hak edilmiş sonuçlara giden yolculuğu mümkün kıldı. Vietnam'da yapay zekanın geleceği sadece bir "Zalo"yu değil, aynı zamanda onun izinden gidecek, mirasını devralacak ve teknoloji dünyasını fethedecek cesur mühendislerden oluşan bir nesli de içerecektir.
Kaynak: https://znews.vn/zalo-va-hanh-trinh-lam-chu-llm-tieng-viet-post1561765.html






Yorum (0)