Společnost VinBigdata 21. srpna oznámila úspěšné vytvoření rozsáhlého vietnamského jazykového modelu, čímž vytvořila základ pro zvládnutí technologie generativní umělé inteligence.
Velké jazykové modely (LLM) jsou modely trénované pomocí technik hlubokého učení na obrovských textových nebo obrazových datových sadách. Tyto modely jsou schopny porozumět znalostem, generovat text a provádět různé úkoly zpracování přirozeného jazyka. Jsou považovány za klíč k rozvoji technologie generativní umělé inteligence – schopné generovat nový obsah a nápady v mnoha různých formách (text, obrázky, zvuk atd.).
Díky úspěšné konstrukci rozsáhlého vietnamského jazykového modelu společnost VinBigdata integruje technologii, díky níž se VinBase (komplexní multikognitivní platforma umělé inteligence) stane generativní platformou umělé inteligence ve Vietnamu a zároveň poskytne vývojová řešení založená na této technologii, jako je chatbot s generativní umělou inteligencí, callbot nebo virtuální asistent nové generace ViVi... Tato technologie pomáhá zvýšit přirozenost strojové komunikace a zároveň podporuje uživatele v rychlejším a jednodušším vyhledávání a syntéze informací než dříve.
Profesor Vu Ha Van - vědecký ředitel společnosti VinBigdata. Foto: VinBigdata
Profesor Vu Ha Van – ředitel vědeckého oddělení společnosti VinBigdata – uvedl, že ve světě existuje řada velkých korporací, které úspěšně vyzkoumaly a uvedly na trh produkty založené na rozsáhlých jazykových modelech, jako je OpenAI s ChatGPT nebo Google s Bardem. Ve Vietnamu investovala společnost Vingroup do společnosti VinBigdata do vybudování rozsáhlého vietnamského jazykového modelu. Podle pana Vana se tento model zaměřuje na řešení tří klíčových problémů, mezi které patří zlepšení přesnosti, snížení nákladů na infrastrukturu a zajištění bezpečnosti.
„Místo toho, aby potřeboval zhruba 175 miliard parametrů jako ChatGPT, dokáže VinBigdata vytvořit rozsáhlý jazykový model s několika miliardami parametrů, ale stále má schopnost generovat vysoce autentické dokumenty se zaměřením na vietnamská data a vietnamské znalosti,“ uvedl vedoucí jednotky.
Zvládnutí technologií, samostatný rozvoj od prvních kroků a budování rozsáhlého vietnamského jazykového modelu je považováno za krok vpřed, který pomůže společnosti VinBigdata zavést generativní technologii umělé inteligence do ekosystému produktů a služeb na trhu. V současné době podnik nejprve aplikoval novou technologii v produktové řadě VinBase KB (VinBase Knowledge Base Portal). Produkt má schopnost načítat informace a automaticky generovat odpovědi na základě informací shromážděných z extrémně velkých datových sad ve znalostním systému.
Zástupce VinBigdata se na akci oznamující generativní umělou inteligenci podělil o své zkušenosti. Foto: VinBigdata
Očekává se, že v prosinci letošního roku členové Vingroup uvedou na trh dvě hlavní produktové řady: VinBase2.0 a aplikaci ViGPT. VinBase 2.0 je platforma s umělou inteligencí, která vytváří vícenásobné vnímání pomocí řešení sloužících firmám a vládním agenturám. Aplikaci ViGPT zároveň podnik představuje jako „vietnamskou verzi ChatGPT“, která je otevřená pro přístup a testování komunity. S ViGPT se uživatelé mohou ptát a odpovídat na otázky týkající se konkrétních informací o Vietnamu (předpisy, právní dokumenty) nebo místních informací (historie, literatura, malebná místa, místní speciality).
Akciová společnost VinBigdata disponuje databázovým systémem o velikosti až 3 500 terabajtů. Systém obsahuje stovky tisíc hodin hlasových dat, obrázků a informací, které jsou čištěny, zpracovávány, klasifikovány a používány pro školení umělé inteligence spolu s infrastrukturou výzkumu a vývoje. Tato infrastruktura zahrnuje desítky serverových clusterů NvidiaDGX A100. Společnost také vlastní tým vietnamských profesorů, vědců a technologických expertů z celého světa.
Hoai Phuong
Zdrojový odkaz
Komentář (0)