Nguyen Hoang Quan og kollegene hans ved VILM forlot USA for å reise hjem, og utviklet et gratis kunstig intelligens (KI)-system som vietnamesere kan bruke i kundeservice, med mer enn 100 000 nedlastinger per måned.
I juni 2023 grunnla Nguyen Hoang Quan, 25 år gammel, og kollegene hans, Pham Nhut Huy, 23 år gammel, en kunstig intelligens-ingeniør ved ZaloAI, og Dao Minh Dung, 24 år gammel, en doktorgradsstudent ved University of Cork, Irland, den ideelle organisasjonen VILM, med ønsket om å hjelpe vietnamesere med å oppleve den mest avanserte AI-teknologien på den mest optimale måten.
Etter nesten seks måneder med forskning og anvendelse har teamet utviklet tre gratis AI-modeller, inkludert OpenHermes, VinaLlama og Vistral. Dette er de grunnleggende studiene for å utvikle AI-systemer som kan forstå og handle i henhold til brukerens ønsker (Large Action Model). Disse modellene er for anvendelse innen teknologifelt som maskinstyring, roboter for å hjelpe mennesker med funksjonsnedsettelser bedre uten omsorgspersoner, eller hjelpe programmerere med å fikse feil, og virtuelle assistenter for å ta vare på kunder eller stille spørsmål gratis.
OpenHermes når 85 000 nedlastinger per måned, og er dermed en av de 10 mest nedlastede språkmodellene på HuggingFace ( verdens største nettsted for deling av AI-modeller). Skjermbilde
OpenHermes-modellen er en stor språkmodell som støtter engelsk, i likhet med ChatGPT, men med bedre resultater. De lar brukere laste ned modellen til sine personlige datamaskiner for bruk uten internett. Det er verdt å merke seg at treningsdataene til OpenHermes bare er 1/100 av treningsdataene til ChatGPT fra OpenAI. For øyeblikket mottar denne applikasjonen mer enn 50 000 nedlastinger per måned. OpenHermes-2.5 og OpenHermes-2.5-Vision brukes av mer enn 40 oppstartsbedrifter i Silicon Valley (USA).
VinaLlama og Vistral er to språkmodeller som fokuserer på å betjene det vietnamesiske markedet, med mål om å hjelpe innenlandske brukere med å oppleve den mest avanserte AI-teknologien enklere.
Hoang Quan studerte i USA i sju år og jobbet hos OpenAI som forskningsingeniør for kunstig intelligens-modellen ChatGPT, selv om han ikke hadde fullført universitetet. I 2022 jobbet han som dataingeniør for Microsoft og OpenAIs Bing Chat-produkt, og tjente tusenvis av dollar. I 2023, stilt overfor en bølge av teknologioppsigelser i USA, innså Quan at arbeidsmarkedet etter endt utdanning var svært dystert, men da han så mulighetene i Vietnam, bestemte han seg for å returnere hjem.
Nguyen Hoang Quan. Foto: NVCC
Hos VILM er Quan sjefingeniør med ansvar for forskning på dataforbedringsteknikker samt AI-opplæring. Nhut Huy tar på seg rollen som teknisk forskning i AI-opplæring, og Minh Dung foreslår nye metoder i teoretisk forskning.
Quan forklarte at nåværende store språkmodeller som ChatGPT (Large Language Model) bare kan gi tekstutdata, mens mennesker har mange måter å kommunisere og tilegne seg kunnskap på. Derfor tar teamet sikte på å lage et system som kan operere fleksibelt mellom ulike typer input og output (kan motta og sende ut data som språk, bilder, videoer , lyder), og ikke bare stoppe på språknivå.
For å oppnå målet om å lage store handlingsmodeller, måtte teamet overvinne to problemer: sikkerhet og hastighet. Nåværende AI-applikasjoner bruker for det meste brukerdata og sender dem til serverne til selskaper som OpenAI for behandling, noe som reiser sikkerhetsbekymringer. Teamet fokuserte på å lage AI-modeller som er små og raske nok til å behandles direkte på mobile enheter, samtidig som de balanserte ytelse og hastighet for å unngå å påvirke brukeropplevelsen.
Eksperimentteamet brukte data generert fra AI til å trene selve AI-en, i stedet for å gå ned stien med å bruke data fra reelle kilder. I starten hadde de problemer med å finne beregningsressurser (datamaskiner for å trene AI), men overbeviste senere store selskaper og laboratorier over hele verden om å sponse.
Quan sa at hovedformålet med å lage disse produktene er å hjelpe folk med å få tilgang til AI-applikasjoner raskt og med en kvalitet som ikke er dårligere enn ChatGPT eller Bing Chat, og å gjøre forskning og opprettelse av AI-modeller i fremtiden enklere. I stedet for å bruke ChatGPT, som er begrenset i vietnamesisk språk og kultur, kan vietnamesiske bedrifter laste ned VinaLlama på vietnamesisk.
VinaLlama-språkmodellen håndterer enkelt et matematisk problem på vietnamesisk. Bildet viser en demonstrasjon av VinaLlama-produktet for løsning av matematiske problemer. Skjermbilde.
Dang Hai Loc, grunnlegger av Mindmaid, en plattform for bygging av AI-chatboter, sa at han, fra perspektivet til en AI-applikasjonsutvikler, innså at kostnader og personvern er de to problemstillingene bedrifter er mest opptatt av når de distribuerer AI-applikasjoner. Den mest tilfredsstillende løsningen på dette problemet er LLM-modeller med åpen kildekode, som kan kjøre på bedriftens infrastruktur og kan lære (finjustere) mer av bedriftens egne data. Derfor er vietnamesiske LLM-modeller med åpen kildekode, som VinaLlama, Vistral..., svært verdifulle for å promotere AI-applikasjoner i Vietnam.
«Disse modellene med åpen kildekode gjør det også mulig for flere programmerere og teknologientusiaster å få tilgang til feltet AI-ingeniør med bare en MacBook i stedet for å måtte investere i dyr GPU-infrastruktur (grafikkort). Dette vil også fremme AI-ingeniørstyrken i Vietnam, en rolle som er svært etterspurt i nær fremtid», sa Loc.
Ifølge Quan har vietnamesere et veldig godt grunnlag i vitenskapelig teori, er flinke til AI, og ChatGPT har også menneskelige ressurser som deltar i forskning, men de har vanskeligere for å raskt ta igjen den stadig skiftende teknologibølgen. «Det vietnamesere trenger er erfaring med å lage produkter for sluttbrukere for å virkelig forstå problemene de møter for å kunne orientere forskningen sin riktig», sa Quan om grunnen til å forske på gratis AI-modeller for å støtte vietnamesere innen teknologi. Han sa at han har samarbeidet med mange internasjonale grupper og alltid er klar til å samarbeide med forskningsgrupper i Vietnam.
Nhu Quynh
[annonse_2]
Kildekobling






Kommentar (0)