Podczas wydarzenia Artificial Intelligence Day 2023, którego tematem przewodnim było „AI – projektowanie rzeczywistości na nowo”, odbywającego się w dniach 5 i 6 grudnia, firma VinAI Artificial Intelligence Research and Application Company ( Vingroup Corporation) ogłosiła projekt badawczy typu open source dotyczący dużego modelu językowego dla języka wietnamskiego, PhoGPT.
PhoGPT to projekt open source, a nie oprogramowanie własnościowe, takie jak ChatGPT firmy OpenAI. Ponieważ jest on open source, nie ma ograniczeń komercyjnych – wszystkie strony mogą używać PhoGPT do tworzenia własnych aplikacji, w tym modułów aplikacji do celów komercyjnych. Oznacza to, że PhoGPT jest platformą udostępniającą społeczności tworzącej aplikacje związane z technologią AI w kraju.
Według dr. Bui Hai Hunga, dyrektora generalnego VinAI Artificial Intelligence Research and Application Company, ograniczenia modeli wietnamskich dowodzą, że modele te nie osiągnęły optymalnej wydajności i brakuje im otwartego kodu źródłowego. Dlatego jednym z pilnych zadań dla społeczności zajmującej się sztuczną inteligencją, a w szczególności dla środowiska zajmującego się przetwarzaniem języka naturalnego (NLP), jest zbudowanie nowego, wydajniejszego modelu, który przetwarzałby język wietnamski z wysoką dokładnością i wydajnością.
Eksperci ds. sztucznej inteligencji twierdzą, że dzięki modelowi języka dużych zbiorów danych obejmującemu 7,5 miliarda parametrów, zbudowanemu na platformie dekodującej Transformer, model ten jest trenowany od podstaw z wykorzystaniem najbardziej zaawansowanych dostępnych technik, takich jak mechanizm Flash Attention, ekstrapolacja długości kontekstu AliBi...
Techniki te nie tylko pomagają modelowi lepiej zrozumieć kontekst, ale także wzmacniają naturalne możliwości dialogu i interakcji PhoGPT. Dzięki temu model ten jest wszechstronnym i wielozadaniowym narzędziem, zdolnym do zaspokojenia szerokiego zakresu potrzeb językowych użytkowników.
Dr Bui Hai Hung dodał, że PhoGPT został opracowany przez firmę od samego początku, niezależnie od wszystkich innych modeli na świecie . Dzięki modelowi open source społeczność w Wietnamie może go lepiej wykorzystywać i ulepszać. Upublicznienie kodu źródłowego PhoGPT i udostępnienie go użytkownikom pomaga stworzyć środowisko, w którym społeczność użytkowników może tworzyć spersonalizowane i unikalne aplikacje.
Jednym z celów open source jest stworzenie fundamentów, dzięki którym użytkownicy nie będą musieli tracić czasu na ponowne tworzenie, a jednostki będą mogły rozwijać bardziej rozbudowane modele językowe, takie jak PhoGPT. To pomoże społeczeństwu stworzyć wysokiej jakości społeczność open source dla rozbudowanych modeli języka wietnamskiego, co przełoży się na korzyści dla wielu firm, które będą mogły uczestniczyć w projektach i stosować je w określonych dziedzinach. Firma VinAI zajmująca się badaniami i aplikacjami sztucznej inteligencji (VinAI Artificial Intelligence Research and Application Company) poinformowała, że dzięki PhoGPT planuje badania i rozwój aplikacji dla użytkowników indywidualnych oraz pakietu specjalistycznych rozwiązań wsparcia dla firm w języku wietnamskim w takich branżach jak opieka zdrowotna, edukacja itp.
Projekt PhoGPT położył podwaliny pod rozwój wydajnych modeli języka wietnamskiego, które będą podstawą do opracowywania praktycznych i efektywnych aplikacji zgodnie z rządową strategią rozwoju sztucznej inteligencji do roku 2030.
BA TAN
Źródło
Komentarz (0)