
Kunstig intelligens endrer måten bedrifter lagrer og får tilgang til data på. Dette er fordi tradisjonelle datalagringssystemer ble utviklet for å behandle enkle kommandoer fra noen få brukere om gangen, mens dagens AI-systemer med millioner av agenter må få tilgang til og behandle enorme mengder data kontinuerlig og parallelt.
Tradisjonelle lagringssystemer har nå mange lag med kompleksitet, noe som bremser ned AI fordi data må passere gjennom mange lag før de når GPU-en – grafikkprosessoren, som regnes som «hjernecellen» til AI.
Cloudian – medgrunnlagt av Michael Tso (fra MIT) og Hiroshi Ohta – hjelper datalagring med å holde tritt med AI-revolusjonen. Selskapet har utviklet et skalerbart lagringssystem for bedrifter som bidrar til at data flyter jevnt mellom lagring og AI-modeller.
Systemet reduserer kompleksiteten ved å bruke parallell databehandling til lagring, og konsolidere AI- og datafunksjonalitet på én parallell prosesseringsplattform som er i stand til å lagre, hente og behandle store datasett, med høyhastighets direkte tilkobling mellom lagring og både GPU-er og CPU-er.
Cloudians integrerte datalagringsplattform forenkler bygging av AI-verktøy i kommersiell skala, samtidig som den gir bedrifter en lagringsinfrastruktur som kan holde tritt med AI-eksplosjonen.
«Én ting folk ofte glemmer med AI er at det handler om data», sier Tso. «Du kan ikke få en 10 % økning i AI-ytelse med 10 % mer data, og selv 10 ganger mer data er ikke nok – du trenger 1000 ganger mer data. Å lagre data på en måte som er enkel å administrere, og bygge inn beregninger der og da, slik at du kan gjøre det når det kommer inn, uten å måtte flytte det – det er dit bransjen er på vei.»
Objektlagring og AI
For tiden bruker Cloudians plattform en objektlagringsarkitektur, der alle typer data – dokumenter, videoer , sensordata – lagres som enkeltstående objekter med metadata. Objektlagring kan håndtere enorme mengder data i en flat struktur, noe som gjør den ideell for ustrukturerte data og AI-systemer, men tidligere var det umulig å sende data direkte til en AI-modell uten først å kopiere dem til datamaskinens minne – noe som forårsaket forsinkelse og energisløsing.
I juli annonserte Cloudian at de hadde utvidet objektlagringssystemet sitt med en vektordatabase, som lagrer data i en form som er umiddelbart tilgjengelig for bruk med AI. Etter hvert som data innhentes, beregner Cloudian vektorformen av dataene i sanntid for å støtte AI-verktøy som anbefalingsmotorer, søk og AI-assistenter.
Cloudian annonserte også et samarbeid med NVIDIA for å få lagringssystemet sitt til å fungere direkte med GPU-ene. Cloudian sa at det nye systemet muliggjør raskere AI-prosessering og lavere databehandlingskostnader.
«NVIDIA kontaktet oss for omtrent halvannet år siden fordi GPU-er bare er nyttige når det finnes data å forsyne dem med», sa Tso. «Nå innser folk at det er enklere å bringe AI til dataene enn å flytte enorme datamengder. Lagringssystemet vårt har mange AI-funksjoner innebygd, slik at vi kan forhånds- og etterbehandle dataene nær der vi samler inn og lagrer dem.»
AI-prioritert lagring
Cloudian hjelper omtrent 1000 bedrifter over hele verden med å få mest mulig ut av dataene sine, inkludert store produsenter, finansinstitusjoner, helseinstitusjoner og offentlige etater.
For eksempel hjelper Cloudians lagringsplattform en stor bilprodusent med å bruke AI til å bestemme når hver av produksjonsrobotene deres trenger vedlikehold. Cloudian samarbeider også med U.S. National Library of Medicine for å lagre forskningsartikler og patenter, og med National Cancer Database for å lagre tumor-DNA-sekvenser – rike datasett som AI kan behandle for å hjelpe til med utviklingen av nye behandlinger eller oppdagelser.
«GPU-er er en flott muliggjører», sier Tso. «Moores lov dobler datakraften hvert andre år, men GPU-er kan parallellisere oppgaver på en brikke, kjede flere GPU-er sammen og gå utover Moores lov. Denne skalaen presser AI til nye intelligensnivåer, men den eneste måten å få GPU-er til å yte sitt beste på er å mate data i samme hastighet som datakraften deres – og den eneste måten å gjøre det på er å fjerne alle lagene med mellomledd mellom GPU-en og dataene dine.»
(Ifølge MIT)
Kilde: https://vietnamnet.vn/cloudian-dua-du-lieu-den-gan-ai-hon-bao-gio-het-2433241.html
Kommentar (0)