Ürün, Vietnam bilim ve teknoloji camiasında kısa sürede büyük ilgi gördü.
Vietnam sorununu çözmek için zor yolu seçin
2022'nin sonunda ChatGPT, teknoloji alanındaki ülkeler ve devler arasında yapay zekâyı fethetme yarışının başlangıcını oluşturan "büyük bir patlama" yarattı. O dönemde, Vietnam teknoloji topluluğu da teknoloji alanında kendi kendine yetebilen ve uluslararası ürünlere bağımlılığı azaltan Vietnam ürünleri geliştirmeye hevesliydi. Ancak, her birim VinBigdata gibi bu arzuyu gerçekleştirecek yetenek ve kararlılığa sahip değil.
"Üretken yapay zeka zorlu bir problem. OpenAI veya Google gibi büyük şirketler de gördüğümüz ürünlere benzer ürünler yaratabilmek için araştırmaya çok fazla kaynak ve zaman ayırmak zorunda. Bu ürünler çok iyi, ancak bilim insanları hala çalışma mekanizmasını tam olarak anlayamıyor. Hataları olduğunda ve bu hataların ne olacağını çok az kişi tahmin edebiliyor. Vietnamlılar için ChatGPT benzeri bir ürünü bir yıldan kısa bir sürede geliştirmek birçok zorlukla karşı karşıya. Ancak "risk almayı" seçtik çünkü ChatGPT'nin Vietnam versiyonu Vietnamlılar tarafından yapılmazsa, onu kim yapacak?" - VinBigdata Bilim Direktörü Profesör Vu Ha Van paylaştı.
Aslında, çok az şirket kendi Büyük Dil Modellerini sıfırdan oluşturmayı tercih ediyor. Örneğin, OpenAI'nin GPT 3'ü 175 milyar parametreye sahip ve 45 terabaytlık bir veri kümesi üzerinde eğitilmiş olup 4,6 milyon dolara mal olmuştur. Hesaplamalara göre, GPT 4'ü geliştirmenin maliyeti 100 milyon dolara bile ulaşabilir. VinBigdata Ürün Direktörü Dr. Nguyen Kim Anh, "Böylesine büyük sayılarla, bu teknolojiye yatırım yapabilecek bir şirket bulmak çok zor," dedi.
VinBigdata, Vietnamlı işletmelerin yeni nesil yapay zeka teknolojisine optimum maliyet ve altyapıyla erişebilmesi için tamamen farklı bir yol seçti: yalnızca 1,6 milyar parametreye sahip, ancak milyarlarca parametreye sahip büyük dil modellerine eşdeğer yeteneklere sahip bir dil modeli oluşturmak. Dr. Nguyen Kim Anh, "Sonuçlar, VinBigdata'nın kendi geliştirdiği mimariyle dil modeli eğitim sürecini optimize edip hızlandırmanın, altyapı maliyetlerini (eğitim ve kullanım maliyetleri dahil) düşürmenin ve yine de modelin kalitesini korumanın tamamen mümkün olduğunu gösteriyor" diye ekledi.
Büyük dil modeli boyutunun yarattığı sorunu çözdükten sonra, ViGPT'yi "tasarlama" sürecinde, yabancı modeller üzerinde araştırma yapan VinBigdata ekibi, istatistiksel olasılık modellerinin doğasında var olan bir diğer zorluğun da "illüzyon" olduğunu fark etti.
Buna göre, dünyanın en büyük dil modelleri genellikle İngilizce veri kaynaklarıyla eğitilmektedir. Dolayısıyla, bu model Vietnam halkının bağlamını ve kültürünü tam olarak anlayamaz ve doğru şekilde yanıt veremez. Bu durum, büyük dil modellerinin yanlış cevaplar "üretmesine" neden olan halüsinasyonlara yol açar.
En uygun çözümü en kısa sürede bulabilmek için VinBigdata Doğal Dil İşleme (NLP) ekibi küçük gruplara ayrılarak farklı fikirleri analiz ediyor ve tartışıyor, böylece en uygun nihai yönü buluyor.
Dr. Nguyen Kim Anh, "Son olarak, mevcut büyük dil modellerinin çoğundan farklı bir mimari geliştirmeye ve 600 GB'lık ince ayarlı bir Vietnam veri kümesi üzerinde eğitim yürütmeye karar verdik; böylece Vietnam halkının bağlamına göre anlayabilen ve yanıtlar verebilen 'akıllı sanal asistan' yarattık" diye ekledi.
Vietnam teknoloji ekosistemine yönelik özlem
Vietnamca Dil Yeterlilik Değerlendirme Standartları (VMLU) değerlendirme sonuçlarına göre, ViGPT %42,24 ortalama puan alarak, ChatGPT'nin (%48,54) hemen arkasında yer aldı. Bu sonuç, ViGPT'nin Vietnam'a özgü konularda hızlı bir şekilde bilgi aramasına ve soruları yanıtlamasına olanak tanıyor.
Sanal asistanın yeteneklerine ek olarak, geliştirme ekibinin arzusu, ViGPT'yi Vietnam halkının yaşamlarında değişiklikler yaratmak için bilindik, günlük kullanım ürünlerine entegre etmektir. Bu, VinBigdata ekibini ViGPT'yi uygulayan bir dil ve ses ürünleri ekosistemi oluşturmaya motive eden itici güçtür - "Vi" ekosistemi şunları içerir: ViChat, ViVoice, ViVi Sanal Asistan. Bu ürünler, otomotiv endüstrisinden bankacılık ve finansa, sigortacılıktan ulaşıma ve daha birçok alana kadar birçok sektörde kullanılabilir.
VinBigdata Ürün Direktörü, "Teknolojiyle, özellikle de yapay zekayla çalışırken, yalnızca ilginç, karmaşık ve anlaşılması zor sistemleri fethetmek istemiyoruz. Yapay zekanın hayatta doğrudan değişim yaratan etken olduğu, somut ve uygulanabilirliği yüksek ürünler yaratmak istiyoruz," diye belirtti.
Bu nedenle, ViGPT'nin başarılı bir şekilde geliştirilmesi, milyonlarca Vietnamlının hayatına "tamamen Vietnam'a özgü" teknoloji ve verileri sunma yolculuğunun sadece ilk adımıdır. VinBigdata temsilcisi, bu birimin ViGPT'yi VinBase 2.0 çok-bilişsel yapay zeka platformuna entegre ederek, çeşitli ölçek ve sektörlerdeki kuruluşlar ve işletmeler için olağanüstü çözümler sunmayı hedeflediğini söyledi.
ViGPT'den önce, dil ve konuşma işleme teknolojisi alanında uzman ve mühendislerden oluşan VinBigdata ekibi, VinFast elektrikli otomobillerde, Vinhomes Resident uygulamalarında ve Vinhomes Online e-ticaret platformunda uygulanan ve dağıtılan ilk kapsamlı Vietnam sanal asistanı olan ViVi'yi piyasaya sürerek adından söz ettirmişti. Aynı zamanda Ses Biyometrisi veya Ses Klonlama gibi dünyanın en gelişmiş teknolojilerine tamamen hakimdi.
Tüm bu teknolojiler, VinBigdata tarafından toplanan, analiz edilen ve geliştirilen Vietnam'a özgü verilere odaklanan 3.500 terabaytlık bir veritabanına dayanarak geliştirilmektedir. Nihai hedef, Vietnam veri ve bilgi sistemlerini kullanarak dünya teknolojisini Vietnamlıların yaşamına taşımaktır.
| ViGPT, VinBigdata tarafından geliştirilen Vietnamca büyük dil modeli (LLM) üzerine kurulu, son kullanıcılar için ChatGPT'nin ilk "Vietnamca sürümü"dür. ViGPT, olağanüstü özelliklere sahiptir ve içerik oluşturma, bilgi arama ve Vietnamca özellikleriyle sık sorulan soruları yanıtlama gibi Vietnamlıların ihtiyaçlarını en iyi şekilde karşılamak üzere tasarlanmıştır. ViGPT'ye kaydolun ve deneyimleyin: vigpt.vinbigdata.com |
Thanh Ha
[reklam_2]
Kaynak






Yorum (0)