Taipeissa, Taiwanissa, järjestetyssä globaalissa teknologiatapahtumassa Computex 2026 puolijohde- ja laskentateollisuudessa keskustelujen painopiste siirtyi merkittävästi "pilvipalvelutekoälystä" "reunatyöskentelyyn". Laitteistoteollisuus on läpikäymässä uudelleenjärjestelyä, kun datakeskustason laskentateho integroidaan suoraan työtilaan sijoitettuihin henkilökohtaisiin laitteisiin.
Siirtyminen responsiivisesta tekoälystä autonomisiin agentteihin (Agent AI)
Tekoälyaallon alkuvaiheissa yleinen toimintaprosessi sisälsi datapyyntöjen lähettämisen pilvipalvelimille, kuten OpenAI:lle, Googlelle tai Microsoftille, ja vastausten vastaanottamisen. Tämä arkkitehtuuri paljasti kuitenkin monia rajoituksia lähetysviiveen, kaistanleveyden kustannusten ja lähdedatan turvallisuuden suhteen.

Nvidia DGX Spark on erityisesti tekoälylle suunniteltu henkilökohtaisten tietokoneiden sarja, jota jaellaan Vietnamissa.
Kuva: Anh Quân
Agenttisen tekoälyn – autonomisten ohjelmistoagenttien sukupolven, jotka kykenevät suunnittelemaan, päättelemään ja olemaan vuorovaikutuksessa suoraan paikallisten tiedostojärjestelmien kanssa – kehitys asettaa uusia vaatimuksia laitteistoinfrastruktuurille. Passiivisen reagoinnin sijaan nämä agentit toimivat digitaalisina henkilöstöresursseina, jotka käsittelevät jatkuvaa tietovirtaa reaaliajassa. Tietojen eheyden ja turvallisuuden varmistamiseksi tekoälymallien tuominen toimimaan offline-tilassa käyttäjien laitteilla on tullut olennaiseksi tekniseksi ratkaisuksi.
Erinomainen esimerkki tästä trendistä on Computex 2026 -messuilla esitelty DGX Spark -tekoälytietokone. Laite on kompakti pöytätietokoneen kokoinen, mutta tarjoaa miniatyyrisupertietokoneen suorituskyvyn yhden Nvidia GB10 Grace Blackwell Superchipin ansiosta.
Laitteen itsenäinen toiminta perustuu 128 Gt:n LPDDR5X Unified Memory -järjestelmään, jolla on nopea kaistanleveys. Tekoälyarkkitehtuurissa muistikapasiteetti ja nopeus määräävät kyvyn käsitellä suuria kielimalleja (LLM). Tämä mahdollistaa datainsinöörien jopa 200 miljardin parametrin mallien suorittamisen suoraan laitteella sen sijaan, että ne otettaisiin käyttöön pilvipalvelimilla.
Teknisten tietojen osalta Blackwell-arkkitehtuurin GPU integroi 5. sukupolven Tensor-ytimet (FP4-tarkkuusformaatti), jotka tarjoavat 1 petaFLOPin laskentatehon. 20-ytiminen ARM-suoritin vastaa datan koordinoinnista paikallisen tiedostojärjestelmän ja tekoälymallin välillä.

Yritysten reunalla tekoälytarpeita palvelevat työasemat ovat nyt kompakteja, joten ne on helppo ottaa käyttöön eri mittakaavoissa.
Kuva: Anh Quân
Messuosastoilla tämän trendin infrastruktuuriratkaisut erottuivat selvästi alkuperäisten valmistajien synkronoiduilla järjestelmillä ja erikoistuneiden laitteistointegraatioratkaisujen tarjoajilla. Hyvä esimerkki tästä on Leadtek, joka esittelee Nvidia-sertifioitujen järjestelmiensä työasemia ja palvelimia. Pienten ja keskisuurten yritysten paikallisiin (sisäisiin) operatiivisiin tarpeisiin suunnattu WinFast WS950 AI -työasema tukee usean GPU:n kokoonpanoja kahdella ammattimaisella Nvidia RTX PRO 6000 Blackwell Workstation Edition -näytönohjaimella, jotka tarjoavat yhteensä jopa 192 Gt GDDR7-grafiikkasuoritinmuistia. Laajemmassa mittakaavassa heidän WinFast GS5855T -palvelinjärjestelmänsä mahdollistaa jopa kahdeksan RTX PRO Blackwell -arkkitehtuurin GPU:n integroinnin intensiivisten tekoälyn päättely- ja koulutustehtävien vaatimusten täyttämiseksi.
Tietoturvan ja käyttökustannusten optimointi.
Tekoälyn käyttäminen reunalla paikallisen laitteistojärjestelmän kautta ratkaisee nykypäivän teknologiainfrastruktuurin kolme keskeistä haastetta. Ensimmäinen on tietoturva. Kaikki liiketoimintatiedot, sisäinen lähdekoodi ja henkilötiedot tallennetaan ja käsitellään internetistä eristetyssä hiekkalaatikkoympäristössä, mikä rajoittaa tietovuotojen riskiä kolmansille osapuolille.
Uusia Edge-tekoälyratkaisuja esiteltiin Computex 2026 -tapahtumassa
Seuraavaksi on kiinteiden laskentakustannusten kysymys. Pilvi-infrastruktuurin vuokraaminen, josta veloitetaan token-summien perusteella, aiheuttaa merkittäviä muuttuvia kustannuksia skaalautuessaan. Offline-laitteistolla toimiminen muuttaa nämä kustannukset käyttöomaisuusinvestoinniksi, mikä optimoi pitkän aikavälin toimintaa. Lopuksi on paikallisen skaalautuvuuden kysymys: Nopeiden yhteysprotokollien avulla käyttäjät voivat linkittää reunalaskentajärjestelmiä resurssien jakamiseksi, skaalaten reunamallinnuksen käsittelyominaisuudet valtaviin kokoihin.
Lähde: https://thanhnien.vn/ai-roi-dam-may-ve-ban-lam-viec-185260605224532968.htm









