Firma VinBigdata ogłosiła 21 sierpnia pomyślne opracowanie wietnamskiego modelu języka wielkiego, który stworzył podwaliny pod opanowanie technologii generatywnej sztucznej inteligencji.
Duże Modele Językowe (LLM) to modele trenowane technikami głębokiego uczenia na ogromnych zbiorach danych tekstowych lub graficznych. Modele te potrafią rozumieć wiedzę, samodzielnie generować tekst i wykonywać różnorodne zadania związane z przetwarzaniem języka naturalnego. Są one uważane za kluczowe dla rozwoju generatywnej technologii sztucznej inteligencji – zdolnej do tworzenia nowych treści i idei w różnych formach (tekst, obrazy, dźwięk itp.).
Dzięki udanemu rozwojowi modelu języka wietnamskiego na dużą skalę, VinBigdata zintegruje technologię, aby uczynić VinBase (kompleksową platformę multikognitywnej sztucznej inteligencji) wiodącą platformą generacji AI w Wietnamie, a także dostarczać rozwiązania opracowane w oparciu o tę technologię, takie jak generatywne chatboty AI, callboty i wirtualny asystent nowej generacji ViVi. Technologia ta zwiększa naturalność komunikacji maszyn i pomaga użytkownikom wyszukiwać i syntetyzować informacje szybciej i łatwiej niż kiedykolwiek wcześniej.
Profesor Vu Ha Van – dyrektor naukowy firmy VinBigdata. Zdjęcie: VinBigdata
Profesor Vu Ha Van, dyrektor ds. naukowych w VinBigdata, stwierdził, że kilka dużych korporacji na całym świecie z powodzeniem przeprowadziło badania i wprowadziło na rynek produkty oparte na modelach big-language, takich jak OpenAI z ChatGPT i Google z Bard. W Wietnamie VinBigdata jest rozwijany przez Vingroup w celu zbudowania wietnamskiego modelu big-language. Według profesora Vana, model ten koncentruje się na rozwiązaniu trzech podstawowych problemów: zwiększeniu dokładności, obniżeniu kosztów infrastruktury i zapewnieniu bezpieczeństwa.
„Zamiast potrzebować około 175 miliardów parametrów, jak ChatGPT, VinBigdata może stworzyć model językowy na dużą skalę z kilkoma miliardami parametrów, a jednocześnie być w stanie generować wysoce autentyczne teksty, koncentrując się na danych i wiedzy wietnamskiej” – powiedział lider jednostki.
Opanowanie technologii, opracowanie jej od podstaw i zbudowanie modelu języka wietnamskiego na dużą skalę są uważane za kluczowe kroki dla VinBigdata w procesie integracji technologii generowania sztucznej inteligencji z ekosystemem produktów i usług na rynku. Obecnie firma początkowo wdraża tę nową technologię w swojej linii produktów VinBase KB (Portal Bazy Wiedzy VinBase). Produkt ten umożliwia wyszukiwanie informacji i automatyczne generowanie odpowiedzi w oparciu o dane zebrane z ogromnych zbiorów danych w swojej bazie wiedzy.
Przedstawiciele VinBigdata podzielili się tymi informacjami podczas wydarzenia inaugurującego generację sztucznej inteligencji. Zdjęcie: VinBigdata
Oczekuje się, że Vingroup w grudniu wprowadzi na rynek dwie główne linie produktów: VinBase 2.0 i aplikację ViGPT. VinBase 2.0 to platforma sztucznej inteligencji (AI), która generuje odpowiedzi multikognitywne, oferując rozwiązania dla firm i agencji rządowych . Jednocześnie aplikacja ViGPT, wprowadzona przez firmę jako „wietnamska wersja ChatGPT”, będzie dostępna dla społeczności i testowana. Dzięki ViGPT użytkownicy będą mogli zadawać pytania i udzielać odpowiedzi na temat konkretnych informacji wietnamskich (przepisów, dokumentów prawnych) lub lokalnych (historii, literatury, miejsc widokowych, lokalnych specjałów).
Firma VinBigdata Joint Stock Company dysponuje systemem baz danych o pojemności do 3500 terabajtów. System zawiera setki tysięcy godzin danych głosowych, obrazów i informacji, które zostały oczyszczone, przetworzone, sklasyfikowane i wykorzystane do celów szkoleniowych i badawczo-rozwojowych w zakresie sztucznej inteligencji. Infrastruktura ta obejmuje dziesiątki klastrów serwerów Nvidia DGX A100. Firma może się również pochwalić zespołem wietnamskich profesorów, naukowców i ekspertów technologicznych z całego świata.
Hoai Phuong
Link źródłowy










