A világ érdeklődése a mesterséges intelligencia iránt egyre növekszik, a figyelem nagy része azokra az országokra irányul, amelyek a világ számos vezető mesterséges intelligencia modelljével rendelkeznek, mint például az Egyesült Államok és Kína. Délkelet-Ázsia – a világ egyik legfontosabb gazdasági régiója – fokozatosan a mesterséges intelligencia új gócpontjává válik, olyan jelentős előrelépésekkel, amelyek érdekelhetik a globális politikai döntéshozókat, befektetőket és technológiai szakértőket.

Vietnámban a párt és a kormány eltökélt abban, hogy alakítsa és előmozdítsa az ország technológiai fejlődésének korszakát, amint azt a tudományos és technológiai fejlesztés, az innováció és a nemzeti digitális átalakulás terén elért áttörésről szóló 57-NQ/TW határozat is bizonyítja. Ez az irányultság erős hajtóerőt teremtett a hazai technológiai vállalatok számára a befektetésekhez és a fejlett globális technológia lehetőségeinek kiaknázásához.
Jelenleg Vietnam azon kevés délkelet-ázsiai ország egyike, amely rendelkezik belföldi nagynyelvi modellel (LLM). Konkrétan 2023 óta a Zalo sikeresen képzett és indított el egy vietnami nyelvre fókuszáló LLM modellt, amelyet teljes egészében vietnami mérnökökből álló csapat kutatott és fejlesztett.
Válaszd a tréninget már a legelején, és érj el váratlan eredményeket
Jelenleg a mesterséges intelligencia modelleknek két betanítási technikájuk van, ezek közé tartozik: a finomhangolt modellezési technika, amely a korábban betanított LLM-ek optimalizálásának módszere új LLM-ek létrehozása céljából speciális célokra; a nulláról történő modellezési technika, amely egy teljesen új modell felépítésének folyamata, a paraméterek inicializálásától a modellarchitektúra kiválasztásán át a betanítási algoritmusig egy adott adathalmazon.
Ezek közül sok vállalkozás a finomhangolási technikákat választja olyan előnyei miatt, mint az egyszerű megvalósítás, az erőforrás-megtakarítás és a jobb hatékonyság. Különösen Vietnámban, ahol korlátozottak a képzési eszközök és az adatok, a finomhangolási technikák kiváló megoldást jelentenek.
Zalo azonban már a kezdetektől fogva a képzési technikát választotta. Ennél a módszernél a teljes képzési folyamatot és modellt teljes mértékben a vietnami emberek birtokolják és irányítják. Ennek köszönhetően Vietnam Délkelet-Ázsia azon kevés országai közé tartozik, amelyek rendelkeznek egy belföldön fejlesztett nagyszabású nyelvi modellel (LLM).
A 2023-as induláskor a Zalo első, nagyméretű, 7 milliárd paraméterrel rendelkező, vietnami nyelvre fókuszáló nyelvi modellje 150%-os teljesítményt ért el az OpenAI GPT3.5-höz képest a VMLU vietnami LLM kompetenciaértékelési benchmarkon. A betanítási idő mindössze 6 hónapot vett igénybe, ami jóval rövidebb az eredeti 18 hónapos tervnél. Ez a gyors betanítási folyamat meglepte a Zalo teljes fejlesztőcsapatát.

A Zalo LLM modellje a 3. helyen végzett a Kahoot kihívásban, amikor 2023-ban először piacra dobták (Fotó: Zalo).
2024-ben a Zalo 13 milliárd paraméteres modellje megelőzi a világ nagy neveit, megerősítve pozícióját, mint a két legjobb, nulláról képzett vietnami LLM modell a VMLU vietnami LLM kompetencia rangsorában.
Az eredmények azt mutatják, hogy a nagy nyelvi modellek betanítási szintje nem marad el a világ szintjétől egy saját MI-modell fejlesztéséhez Vietnamban, különösen a kezdeti fejlesztési nehézségek fényében.
Vietnami erőfeszítések mesterséges intelligencia modellek fejlesztésére
A Zalo képviselője elmondta, hogy az LLM képzés 3 alapvető elemet igényel: oktatóeszközöket, adatmennyiséget és technikai szintet. Korábban Vietnámban mindhárom szempontból számos korlátozás volt jelen. Míg a világ nagyvállalatai több ezer új, nagy teljesítményű Nvidia GPU-val rendelkeznek, Vietnámban a mérnökök még mindig nincsenek teljesen felszerelve a szükséges szerver infrastruktúrával. Ugyanakkor a vietnami nyelv a gyengébb adatforrásokkal rendelkezők csoportjába tartozik, mint az angol vagy a kínai. Vietnam emberi erőforrásai és LLM képzési tapasztalatai is korlátozottak a fejlett országokhoz képest.
A Zalo csapatnak akkoriban kis polgári GPU-kon kellett kutatnia és kísérleteznie, hogy felvértezzék magukat tudással és LLM képzési képességekkel, amint nagyméretű számítási infrastruktúra elérhetővé vált.
A mesterséges intelligencia által kiképzett chipek szűkösen állnak rendelkezésre, így hiába rendelt a Zalo 8 Nvidia DGX H100 szervert, nem birtokolhatja egyszerre az összes eszközt, és minden egyes szállítmányra várnia kell a gyártótól. Ezért a hiányos számítási infrastruktúra optimalizálása a betanítási idő megtakarítása érdekében szintén egy olyan probléma, amelyet a Zalo csapatának meg kell oldania.
Ugyanakkor minőségi betanítási adatokba is befektetnek, hogy kompenzálják a vietnami adatforrások hiányát.

„Bár a kiindulópont nehéz volt a világ nagyvállalataihoz képest, a Zalo mégis úgy döntött, hogy csatlakozik a versenyhez azzal a céllal, hogy sikeresen fejlessze Vietnam saját mesterséges intelligencia modelljét. Számos vezető kutatóintézet kutatóival és mérnökeivel konzultáltunk a megfelelő fejlesztési stratégia kidolgozása érdekében.
„A jelenlegi siker mérföldkövei motiválják a Zalo mérnökeit arra, hogy továbbra is optimalizálják a modellt, hogy nagyobb mennyiségben és jobb minőségben gyártsák. Ugyanakkor kihasználják az alkalmazhatóságot számos világszínvonalú mesterséges intelligencia termék létrehozására a vietnami felhasználók számára” – osztotta meg Dr. Nguyen Truong Son, a Zalo AI tudományos igazgatója.

A Zalo DGX H100 szervert az Nvidiától rendelte (Fotó: Zalo).
A fejlesztés nehéz korai szakaszaiban mutatott rugalmas alkalmazkodásnak köszönhetően a Zalo fokozatosan elérte a sikeres mérföldköveket, és a mai globális mesterséges intelligencia technológia elsajátítása felé haladt.
Zalo mesterséges intelligencia modellje jelenleg nemcsak a képzési kutatások terén sikeres, hanem alkalmazásban is, elősegítve a fejlett új technológiákhoz való hozzáférést és az azokból származó értékek kiaknázását a vietnami emberek számára.
A Zalo idén korábban elindította a Kiki Info Q&A Assistant szolgáltatást, amely hivatalos fiókként (OA) működik a Zalo üzenetküldő platformján. Az asszisztens az élet, a tartalomkészítés és a szórakozás különböző témáiban támogatja a kérdéseket és válaszokat. A Zalo statisztikái szerint a Kiki Info asszisztensnek kevesebb mint 2 hónap alatt akár 1 millió felhasználója is hozzáfért a Zalo OA fiókjához.

Zalo LLM modelljét alkalmazzák a Kiki Info Assistant fejlesztéséhez (Fotó: Zalo).
A Zalo LLM modelljének egy másik alkalmazása az AI kártyák, amelyek szintén elérték a 15 millió elkészített és elküldött kártya mérföldkövét mindössze 2 hónap alatt. Ez egy olyan alkalmazás, amely iránt sok Zalo-felhasználó érdeklődik, hogy jókívánságokat küldhessen rokonainak és barátainak fontos ünnepek alkalmából.
Jelenleg a Zalo folyamatosan bővíti és fejleszti a nagy nyelvi modellekből származó alkalmazásokat, ígéretet téve arra, hogy számos hasznos értéket nyújt a hazai felhasználóknak.
Forrás: https://dantri.com.vn/cong-nghe/zalo-phat-trien-mo-hinh-ai-do-nguoi-viet-lam-chu-20250616161352610.htm






Hozzászólás (0)