A termék gyorsan felháborodást keltett a vietnami tudományos és technológiai közösségben.
Válaszd a nehéz utat a vietnami probléma megoldásához
2022 végén a ChatGPT „nagy durranást” produkált, megnyitva a mesterséges intelligencia meghódításáért folytatott versenyt a technológiai területen működő országok és óriások között. Abban az időben a vietnami technológiai közösség is lelkesen igyekezett olyan vietnami termékeket fejleszteni, amelyek önellátóak a technológia terén, csökkentve ezzel a nemzetközi termékektől való függőséget. Azonban nem minden egység rendelkezik a VinBigdatához hasonlóan a képességgel és az elszántsággal ennek a vágynak a megvalósításához.
„A generatív mesterséges intelligencia egy nehéz probléma. A nagyvállalatoknak, mint az OpenAI vagy a Google, szintén sok erőforrást és időt kell befektetniük a kutatásba, hogy olyan termékeket tudjanak létrehozni, mint amilyeneket mi látunk. Ezek a termékek nagyon jók, de valójában a tudósok még mindig nem értik teljesen a működési mechanizmusukat. Azt, hogy mikor és milyen hibák keletkeznek, kevesen tudják megjósolni. Egy ChatGPT-hez hasonló termék vietnamiak számára történő fejlesztése kevesebb mint egy év alatt számos kihívással jár. De úgy döntöttünk, hogy „kockáztatunk”, mert ha a ChatGPT vietnami verzióját nem vietnamiak készítik, akkor ki fogja?” – osztotta meg Vu Ha Van professzor, a VinBigdata tudományos igazgatója.
Valójában nagyon kevés vállalat dönt úgy, hogy a nulláról építi fel saját nagyméretű nyelvi modelljét. Például az OpenAI GPT 3-a 175 milliárd paraméterrel rendelkezik, egy 45 terabájtos adathalmazon képezték ki, és 4,6 millió dollárba került. Számítások szerint a GPT 4 fejlesztésének összege elérheti a 100 millió dollárt is. „Ilyen hatalmas számok mellett nagyon nehéz olyan vállalatot találni, amely megengedheti magának, hogy befektessen ebbe a technológiába” – mondta Dr. Nguyen Kim Anh, a VinBigdata termékigazgatója.
Annak érdekében, hogy a vietnami vállalkozások optimális költségekkel és infrastruktúrával férjenek hozzá az új generációs mesterséges intelligencia technológiához, a VinBigdata egy teljesen más irányt választott, nevezetesen egy mindössze 1,6 milliárd paraméterrel rendelkező nyelvi modell létrehozását, amely azonban a több milliárd paraméterrel rendelkező nagy nyelvi modellek képességeivel egyenértékű. „Az eredmények azt mutatják, hogy a VinBigdata által fejlesztett architektúrával teljesen lehetséges optimalizálni és felgyorsítani a nyelvi modell betanítási folyamatát, csökkenteni az infrastrukturális költségeket (beleértve a betanítási és a használati költségeket), miközben továbbra is biztosított a modell minősége” – tette hozzá Dr. Nguyen Kim Anh.
Miután a VinBigdata csapata a ViGPT „kitalálása” során, külföldi modellek kutatása után megoldotta a nagy nyelvi modell problémáját, egy másik kihívásra is rájött, az „illúzióra”, amely a statisztikai valószínűségi modellek inherens természetéből fakad.
Ennek megfelelően a világ legnagyobb nyelvi modelljeit gyakran angol adatforrásokkal képezik ki. Ezért ez a modell nem igazán érti és nem reagál helyesen a vietnami emberek kontextusára és kultúrájára. Ez hallucinációkhoz vezet, amelyek miatt a nagy nyelvi modellek helytelen válaszokat „fabrikálnak”.
A VinBigdata természetes nyelvi feldolgozási (NLP) csapata a lehető legrövidebb idő alatt megtalálja az optimális megoldást, ezért kis csoportokra oszlik, és különböző ötleteket elemeznek és vitatnak meg, hogy megtalálják a legmegfelelőbb végső irányt.
„Végül úgy döntöttünk, hogy a jelenlegi nagyméretű nyelvi modellek többségétől eltérő architektúrát fejlesztünk, és egy 600 GB-os, finomhangolt vietnami adathalmazon végzünk betanítást, hogy létrehozzunk egy »intelligens virtuális asszisztenst«, amely képes megérteni és válaszokat adni a vietnami emberek kontextusának megfelelően” – tette hozzá Dr. Nguyen Kim Anh.
Törekvés egy vietnami technológiai ökoszisztémára
A vietnami nyelvvizsgák standardjainak (VMLU) értékelési eredményei szerint a ViGPT átlagosan 42,24%-os pontszámot ért el, amivel csak a ChatGPT (48,54%) előzi meg. Ez az eredmény lehetővé teszi a ViGPT számára, hogy gyorsan információkat keressen és kérdésekre válaszoljon Vietnammal kapcsolatos konkrét témákban.
A virtuális asszisztens képességei mellett a fejlesztőcsapat célja, hogy a ViGPT-t integrálja az ismerős, mindennapi használatú termékekbe, és ezáltal változást hozzon a vietnami emberek életében. Ez a hajtóerő motiválja a VinBigdata csapatát egy olyan nyelvi és hangalapú termékekből álló ökoszisztéma kiépítésében, amelyek a ViGPT-t alkalmazzák – a „Vi” ökoszisztéma magában foglalja: ViChat, ViVoice, ViVi Virtual Assistant. Ezek a termékek számos iparágban használhatók, az autóipartól, a banki és pénzügyi szektoron, a biztosításon át a szállítmányozásig és sok más területen.
„Amikor technológiával, különösen a mesterséges intelligenciával dolgozunk, nem csak érdekes, összetett és nehezen áttekinthető rendszereket akarunk meghódítani. Kézzelfogható, könnyen alkalmazható termékeket akarunk létrehozni, ahol a mesterséges intelligencia az a közvetlen tényező, amely változásokat hoz létre az életben” – erősítette meg a VinBigdata termékigazgatója.
A ViGPT sikeres fejlesztése tehát csupán az első lépés azon az úton, amelynek célja, hogy a „tisztán vietnami” technológia és adatok több millió vietnami ember életét szolgálják. A VinBigdata képviselője elmondta, hogy ennek az egységnek a célja a ViGPT integrálása a VinBase 2.0 multikognitív mesterséges intelligencia platformba, hogy kiemelkedő megoldásokat kínáljon a különböző méretű és iparágú szervezetek és vállalkozások számára.
A ViGPT előtt a VinBigdata nyelvi és beszédfeldolgozási technológia szakértőiből és mérnökeiből álló csapata a ViVi - az első átfogó vietnami virtuális asszisztens - elindításával tette le a névjegyét (alkalmazva és telepítve VinFast elektromos autókban, Vinhomes Resident alkalmazásokban és Vinhomes Online e-kereskedelmi platformon), ugyanakkor teljes mértékben elsajátította a világ legfejlettebb technológiáit, mint például a hangbiometria vagy a hangklónozás.
Mindezeket a technológiákat egy 3500 terabájtos adatbázisra alapozva fejlesztik, főként vietnami-specifikus adatokra összpontosítva, melyeket a VinBigdata gyűjtött, elemzett és finomított. A végső cél a világ technológiájának vietnami életre keltése vietnami adatok és tudásrendszerek felhasználásával.
| A ViGPT a ChatGPT első vietnami verziója végfelhasználók számára, amely a VinBigdata által fejlesztett vietnami nagynyelvi modellre (LLM) épül. A ViGPT kiemelkedő funkciókkal rendelkezik, és úgy lett kialakítva, hogy a lehető legjobban megfeleljen a vietnami emberek igényeinek, mint például a tartalomkészítés, az információkeresés és a vietnami jellegzetességekkel kapcsolatos gyakori kérdések megválaszolása. Regisztráljon és tapasztalja meg a ViGPT használatát a következő címen: vigpt.vinbigdata.com |
Thanh Ha
[hirdetés_2]
Forrás






Hozzászólás (0)