Op 21 augustus maakte VinBigdata bekend dat het met succes een grootschalig Vietnamees taalmodel heeft gebouwd. Daarmee is de basis gelegd voor het beheersen van generatieve AI-technologie.
Large Language Models (LLM's) zijn modellen die met behulp van deep learning-technieken zijn getraind op enorme hoeveelheden tekst of afbeeldingen. Deze modellen zijn in staat kennis te begrijpen, tekst te genereren en diverse taken op het gebied van natuurlijke taalverwerking uit te voeren. Ze worden beschouwd als de sleutel tot de ontwikkeling van generatieve AI-technologie, die in staat is nieuwe content en ideeën te genereren in vele verschillende vormen (tekst, afbeeldingen, geluiden, enz.).
Met de succesvolle constructie van een groot Vietnamees taalmodel zal VinBigdata technologie integreren om van VinBase (een uitgebreid multicognitief platform voor kunstmatige intelligentie) een generatief AI-platform in Vietnam te maken. Tegelijkertijd worden er ontwikkelingsoplossingen op basis van deze technologie aangeboden, zoals de generatieve AI-chatbot, callbot of de nieuwe generatie virtuele assistent ViVi. Deze technologie helpt de natuurlijkheid van machinecommunicatie te vergroten en ondersteunt gebruikers bij het sneller en eenvoudiger dan ooit tevoren zoeken en synthetiseren van informatie.
Professor Vu Ha Van - wetenschappelijk directeur van VinBigdata Company. Foto: VinBigdata
Professor Vu Ha Van, directeur wetenschappen bij VinBigdata Company, zei dat er wereldwijd een aantal grote bedrijven zijn die met succes producten hebben onderzocht en gelanceerd op basis van grote taalmodellen, zoals OpenAI met ChatGPT of Google met Bard. In Vietnam investeert Vingroup in VinBigdata om een groot Vietnamees taalmodel te ontwikkelen. Volgens de heer Van richt dit model zich op het oplossen van drie kernproblemen: het verbeteren van de nauwkeurigheid, het verlagen van infrastructuurkosten en het waarborgen van de beveiliging.
"In plaats van de 175 miljard parameters die ChatGPT nodig heeft, kan VinBigdata een groot taalmodel creëren met meerdere miljarden parameters en toch zeer authentieke documenten genereren, waarbij de nadruk ligt op Vietnamese gegevens en Vietnamese kennis", aldus de leider van de eenheid.
Het beheersen van de technologie, zelfontwikkeling vanaf de eerste stappen en het bouwen van een groot Vietnamees taalmodel, wordt beschouwd als een stap voorwaarts om VinBigdata te helpen generatieve AI-technologie te integreren in het ecosysteem van producten en diensten op de markt. Momenteel heeft het bedrijf de nieuwe technologie in eerste instantie toegepast op de VinBase KB-productlijn (VinBase Knowledge Base Portal). Het product kan informatie ophalen en automatisch antwoorden genereren op basis van informatie die is verzameld uit extreem grote datasets in het kennissysteem.
Een vertegenwoordiger van VinBigdata deelde tijdens het evenement de aankondiging van generatieve AI. Foto: VinBigdata
Naar verwachting zullen Vingroup-leden in december van dit jaar twee belangrijke productlijnen lanceren: VinBase2.0 en de ViGPT-applicatie. VinBase 2.0 is een AI-platform dat meerdere percepties creëert met oplossingen voor bedrijven en overheidsinstanties . Tegelijkertijd wordt de ViGPT-applicatie door het bedrijf geïntroduceerd als de "Vietnamese versie van ChatGPT", die openstaat voor de community om te raadplegen en te testen. Met ViGPT kunnen gebruikers vragen stellen en beantwoorden over specifieke informatie over Vietnam (regelgeving, juridische documenten) of lokale informatie (geschiedenis, literatuur, bezienswaardigheden, lokale specialiteiten).
VinBigdata Joint Stock Company beschikt over een databasesysteem van maar liefst 3500 terabyte. Het systeem bevat honderdduizenden uren aan spraakgegevens, afbeeldingen en informatie die worden opgeschoond, verwerkt, geclassificeerd en gebruikt voor AI-training en R&D-infrastructuur. Deze infrastructuur omvat tientallen NvidiaDGX A100-serverclusters. Het bedrijf beschikt ook over een team van Vietnamese professoren, wetenschappers en technologie-experts van over de hele wereld.
Hoai Phuong
Bronlink
Reactie (0)