Výše uvedené sdělení poskytl profesor Vu Ha Van, vědecký ředitel společnosti VinBigdata, na diskusi s novináři na okraji nedávné akce ke spuštění ViGPT.

anhvuhavan.jpg
Profesor Vu Ha Van, hlavní vědecký pracovník společnosti VinBigdata.

ViGPT potřebuje příspěvky od technických pracovníků a komunity

Profesor Vu Ha Van uvedl, že velké společnosti jako Google si při vývoji rozsáhlých jazyků vybírají jako hlavní jazyk angličtinu nebo francouzštinu. Přestože existuje i vietnamština, výsledky vyhledávání budou ve srovnání s jinými jazyky relativně pomalé. Do určité míry nebudou odpovědi těchto rozsáhlých jazykových modelů na otázky z vietnamštiny úplné a přesné.

Proto VinBigdata doufá, že je ViGPT časem překoná v přesnosti v otázkách přímo souvisejících s kulturou, historií, geografií... informacemi s charakteristikami a vlastnostmi Vietnamců. To je to, co chtějí a o co usilují lidé, kteří vytvořili vietnamský jazykový model, když se Vietnamcům budou ptát, bude to lepší zdroj srovnání než zahraniční země.

Ředitel vědy společnosti VinBigdata šel hlouběji a analyzoval například otázku v „citlivém“ politickém období o historii měst Truong Sa a Hoang Sa. Je pro nás velmi obtížné zaručit, že odpověď od Googlu nebo OpenAI nebude mít politickou zaujatost zakladatelů nebo lidí stojících za těmito společnostmi. Ve Vietnamu máme i jiné možnosti, bylo by lepší, kdybychom se nad touto otázkou zamysleli.

„Naším cílem při budování rozsáhlého jazykového modelu pro Vietnamce je poskytnout Vietnamcům ty nejlepší odpovědi. Nemůžeme znát jejich cíle,“ sdělil profesor Vu Ha Van.

Připouštíme, že existuje mnoho věcí, které ViGPT v současné době nedokáže tak dobře jako ChatGPT nebo Google Bard, protože míra investic těchto firem a čas, který stráví implementací, jsou tisíckrát vyšší. Profesor Vu Ha Van však uvedl, že v některých otázkách, které jsou zaměřené na Vietnam, jako například „Čí vlajka je vyšita šesti zlatými slovy?“, ViGPT odpoví, že je to vlajka Tran Quoc Toana, zatímco ostatní verze mohou být špatné. V budoucnu si ViGPT s takovými hloubkovými otázkami povede lépe, pokud bude mít zpětnou vazbu od domácích uživatelů.

„Pokud uživatelé jen kritizují nebo si myslí, že tento velký jazykový model je hloupý, zatímco moje desetileté dítě zná otázky, které ne, nebo klade záludné otázky, aby dokázalo, že jsme chytřejší než umělá inteligence. Jsme chytřejší než umělá inteligence, ale to není z nějakého důvodu. Nevylepšujeme produkt, ale zarmucujeme ty, kteří produkt vytvářejí. Proto VinBigdata potřebuje společný příspěvek technických pracovníků a komunity, potřebujeme společnost Vietnamců při zdokonalování produktu, aby nebyl jen jednoduchým servisním nástrojem, ale také hrdostí Vietnamců,“ zdůraznil profesor Vu Ha Van.

Připraveni podporovat a doprovázet vietnamský jazykový model

V rozhovoru pro VietNamNet zástupci startupů pracujících na umělé inteligenci ve Vietnamu uvedli, že jsou připraveni podporovat a doprovázet vietnamský jazykový model VinBigdata.

ViGPT.jpg
Podpora a doprovod ViGPT je nezbytná pro rozvoj rozsáhlého vietnamského jazykového modelu.

Pan Dinh Tran Tuan Linh, technologický ředitel společnosti Unikon Joint Stock Company, vlastníka platformy Aicontent.vn, uvedl, že v současné době se v Asii jen málo zemí snaží úspěšně vycvičit své vlastní velké jazykové modely, přičemž v tomto ohledu vedou Čína, Korea, Japonsko... ViGPT je proto důležitým signálem pro úsilí vietnamského lidu investovat do klíčových technologií. Podle pana Dinh Tran Tuan Linha musí každá tisícmilní cesta začít prvními kroky. Jako průkopník v oblasti aplikací umělé inteligence je Unikon ochoten přispívat, testovat, poskytovat zpětnou vazbu a dokonce i používat ViGPT v některých projektech vhodného rozsahu.

Mezitím pan Dang Huu Son, spoluzakladatel Lovinbotu, uvedl, že naslouchání komunitě a komentářům odborníků ze strany VinBigdata je velmi dobré pro vývoj rozsáhlého jazykového modelu speciálně pro Vietnamce. Jako technik pan Dang Huu Son také poskytl technickému týmu VinBigdata zpětnou vazbu po použití produktu.

Podle pana Dang Huu Sona nelze nově spuštěný produkt dokončit okamžitě, ale také nemůže hned získat plnou podporu komunity, protože Vietnamci si dlouho mysleli, že Vietnam tuto technologii nezvládne, takže to stále potřebuje čas. Zároveň VinBigdata potřebuje konkrétní pokyny, jak jej komunita může lépe podporovat a doprovázet.

Pan Dang Huu Loc, zakladatel platformy Mindmaid, se také podělil o to, že v současné době existuje jen velmi málo zemí na světě , které si dokážou vybudovat model rodného jazyka. Ani bohaté země se silnými informačními technologiemi, jako je Indie, nebo země s vyšším HDP než Vietnam, jako je Indonésie, Blízký východ... to nemohou udělat jen proto, že chtějí, protože to také závisí na jazykových charakteristikách. Z širšího hlediska má tedy Vietnam strategickou výhodu v budování modelu rodného jazyka, což bude strategickou výhodou pro Vietnamce, aby mohli konkurovat na globální úrovni.

Podle pana Dang Huu Loca je jakékoli úsilí o vybudování rozsáhlého vietnamského jazykového modelu cenné a je třeba k němu specificky přistupovat, aby byl model každý den kompletnější, namísto používání některých současných nedostatků k popírání veškerého úsilí domácích technologických jednotek. Vietnamci by také měli široce propagovat význam technologie rozsáhlých jazyků v éře umělé inteligence a více diskutovat o tom, jak ji aplikovat k vytváření hodnoty pro sebe a vietnamské podniky, namísto srovnávání modelu rozsáhlého vietnamského jazyka s nejlepšími modely rozsáhlých jazyků na dnešním světě. Protože rozsáhlý jazyk je obecná technologie umělé inteligence, nemusí být v tomto problému dobrý, ale je vhodný pro jiné specifické problémy. Zejména model rozsáhlého vietnamského jazyka bude mít větší výhodu v problémech souvisejících s porozuměním a generováním vietnamštiny.

Komunitní ViGPT bude neziskovým organizacím poskytován zdarma . Komunitní ViGPT bude neziskovým organizacím poskytován zdarma společností VinBigdata. Organizace používající tuto verzi však budou muset při nasazení hradit náklady na infrastrukturu, jako je cloud a další zdroje.