Produkt szybko wywołał poruszenie w wietnamskim środowisku naukowo- technicznym.
Wybierz trudną drogę do rozwiązania problemu wietnamskiego
Pod koniec 2022 roku ChatGPT wywołał „wielki wybuch”, otwierając wyścig o podbój sztucznej inteligencji między krajami i gigantami w dziedzinie technologii. W tym czasie wietnamska społeczność technologiczna również dążyła do rozwoju wietnamskich produktów, aby osiągnąć samowystarczalność technologiczną, zmniejszając zależność od produktów międzynarodowych. Jednak nie każda jednostka ma możliwości i determinację, aby zrealizować to pragnienie tak jak VinBigdata.
„Generatywna sztuczna inteligencja to trudny problem. Duże firmy, takie jak OpenAI czy Google, muszą również inwestować dużo zasobów i czasu w badania, aby móc tworzyć produkty takie, jak te, które widzimy. Produkty te są bardzo dobre, ale w rzeczywistości naukowcy wciąż nie do końca rozumieją mechanizm ich działania. Niewielu jest w stanie przewidzieć, kiedy wystąpią błędy i jakie to będą błędy. Stworzenie produktu podobnego do ChatGPT dla Wietnamczyków w krótkim czasie, krótszym niż rok, wiąże się z wieloma wyzwaniami. Zdecydowaliśmy się jednak na „zaryzykowanie”, ponieważ jeśli Wietnamczycy nie stworzą wietnamskiej wersji ChatGPT, to kto ją stworzy?” – powiedział profesor Vu Ha Van, dyrektor ds. naukowych w VinBigdata.
W rzeczywistości bardzo niewiele firm decyduje się na budowę własnych modeli LLM od podstaw. Na przykład, GPT 3 firmy OpenAI ma 175 miliardów parametrów i został wytrenowany na 45-terabajtowym zbiorze danych, a jego koszt wyniósł 4,6 miliona dolarów. Według szacunków, koszty opracowania GPT 4 mogą sięgnąć nawet 100 milionów dolarów. „Przy tak ogromnej liczbie danych bardzo trudno znaleźć firmę, która mogłaby sobie pozwolić na inwestycję w tę technologię” – powiedział dr Nguyen Kim Anh, dyrektor ds. produktów w VinBigdata.
Aby wietnamskie firmy miały dostęp do technologii AI nowej generacji, przy optymalnych kosztach i infrastrukturze, VinBigdata obrała zupełnie inny kierunek, jakim jest stworzenie modelu językowego z zaledwie 1,6 miliarda parametrów, ale o możliwościach równoważnych dużym modelom językowym z miliardami parametrów. „Wyniki pokazują, że dzięki architekturze opracowanej przez samą firmę VinBigdata, możliwe jest całkowite zoptymalizowanie i przyspieszenie procesu uczenia modelu językowego, obniżenie kosztów infrastruktury (w tym kosztów szkolenia i użytkowania), przy jednoczesnym zapewnieniu jakości modelu” – dodał dr Nguyen Kim Anh.
Po rozwiązaniu problemu dużego rozmiaru modelu językowego, w trakcie procesu „koncepcji” ViGPT i po zbadaniu modeli zagranicznych, zespół VinBigdata zdał sobie również sprawę z kolejnego wyzwania, jakim jest „złudzenie”, wynikające z inherentnej natury modeli prawdopodobieństwa statystycznego.
W związku z tym największe na świecie modele językowe są często trenowane z wykorzystaniem źródeł danych w języku angielskim. W związku z tym model ten nie do końca rozumie kontekst i kulturę Wietnamczyków i nie reaguje na nie prawidłowo. Prowadzi to do halucynacji, które sprawiają, że duże modele językowe „fabrykują” niepoprawne odpowiedzi.
Aby znaleźć optymalne rozwiązanie w jak najkrótszym czasie, zespół przetwarzania języka naturalnego (NLP) firmy VinBigdata dzieli się na małe grupy, analizując i omawiając różne pomysły w celu znalezienia najwłaściwszego kierunku końcowego.
„Ostatecznie zdecydowaliśmy się opracować architekturę odmienną od większości obecnych dużych modeli językowych i przeprowadzić szkolenie na 600-gigabajtowym, precyzyjnie dostrojonym zestawie danych wietnamskich, aby stworzyć „inteligentnego wirtualnego asystenta”, który będzie rozumiał i udzielał odpowiedzi zgodnie z kontekstem Wietnamczyków” – dodał dr Nguyen Kim Anh.
Dążenie do stworzenia wietnamskiego ekosystemu technologicznego
Według wyników oceny z Wietnamskiego Standardu Oceny Znajomości Języka (VMLU), ViGPT uzyskał średni wynik 42,24%, ustępując jedynie ChatGPT (48,54%). Ten wynik pozwala ViGPT szybko wyszukiwać informacje i odpowiadać na pytania dotyczące konkretnych zagadnień wietnamskich.
Oprócz możliwości wirtualnego asystenta, zespół programistów dąży do zintegrowania ViGPT ze znanymi, codziennymi produktami, aby wprowadzić zmiany w życiu Wietnamczyków. To właśnie motywuje zespół VinBigdata do zbudowania ekosystemu produktów językowych i głosowych wykorzystujących ViGPT – ekosystem „Vi” obejmuje: ViChat, ViVoice, ViVi Virtual Assistant. Produkty te mogą znaleźć zastosowanie w wielu branżach, od motoryzacji, przez bankowość i finanse, ubezpieczenia, transport i wiele innych.
„Pracując z technologią, a zwłaszcza ze sztuczną inteligencją, nie chcemy tylko zgłębiać interesujących, złożonych i trudnych do zauważenia systemów. Chcemy tworzyć namacalne, wysoce użyteczne produkty, w których sztuczna inteligencja jest bezpośrednim czynnikiem zmieniającym życie” – potwierdził dyrektor ds. produktów VinBigdata.
Zatem pomyślny rozwój ViGPT to dopiero pierwszy krok w procesie wdrażania „czysto wietnamskiej” technologii i danych, które mają służyć milionom Wietnamczyków. Przedstawiciel VinBigdata powiedział, że celem tej jednostki jest integracja ViGPT z wielopoznawczą platformą sztucznej inteligencji VinBase 2.0, aby zapewnić wyjątkowe rozwiązania dla organizacji i firm różnej wielkości i z różnych branż.
Przed powstaniem ViGPT zespół ekspertów i inżynierów z dziedziny technologii przetwarzania języka i mowy VinBigdata wyróżnił się, wprowadzając na rynek ViVi – pierwszego wszechstronnego wietnamskiego asystenta wirtualnego (zastosowanego i wdrożonego w samochodach elektrycznych VinFast , aplikacjach Vinhomes Resident i platformie e-commerce Vinhomes Online), który jednocześnie w pełni opanował najnowocześniejsze technologie na świecie, takie jak biometria głosu czy klonowanie głosu.
Wszystkie te technologie są opracowywane w oparciu o bazę danych o pojemności 3500 terabajtów, koncentrującą się głównie na danych dotyczących Wietnamu, gromadzonych, analizowanych i udoskonalanych przez VinBigdata. Ostatecznym celem jest wprowadzenie światowej technologii do życia Wietnamczyków, z wykorzystaniem wietnamskich danych i systemów wiedzy.
ViGPT to pierwsza wietnamska wersja ChatGPT dla użytkowników końcowych, oparta na modelu LLM (Light Language Model) opracowanym przez VinBigdata. ViGPT oferuje wyjątkowe funkcje i został zaprojektowany tak, aby jak najlepiej odpowiadać potrzebom Wietnamczyków, takim jak tworzenie treści, wyszukiwanie informacji i udzielanie odpowiedzi na często zadawane pytania z wykorzystaniem języka wietnamskiego. Zarejestruj się i poznaj ViGPT na stronie: vigpt.vinbigdata.com |
Thanh Ha
Źródło
Komentarz (0)