Pada acara teknologi global Computex 2026 yang diadakan di Taipei, Taiwan, fokus diskusi di industri semikonduktor dan komputasi bergeser secara signifikan dari "Cloud AI" ke "Edge AI." Industri perangkat keras sedang mengalami restrukturisasi karena daya komputasi tingkat pusat data diintegrasikan ke dalam perangkat pribadi yang ditempatkan langsung di ruang kerja.
Pergeseran dari AI responsif ke agen otonom (AI Agen)
Pada tahap awal gelombang kecerdasan buatan, proses operasional umum melibatkan pengguna yang mengirimkan permintaan data ke server cloud seperti OpenAI, Google, atau Microsoft dan menerima respons. Namun, arsitektur ini mengungkapkan banyak keterbatasan terkait latensi transmisi, biaya bandwidth, dan keamanan data sumber.

Nvidia DGX Spark adalah lini komputer pribadi yang dirancang khusus untuk AI dan akan didistribusikan di Vietnam.
Foto: Anh Quân
Pengembangan AI Agentik—generasi agen perangkat lunak otonom yang mampu merencanakan, bernalar, dan berinteraksi langsung dengan sistem file lokal—menimbulkan tuntutan baru pada infrastruktur perangkat keras. Alih-alih merespons secara pasif, agen-agen ini bertindak sebagai sumber daya manusia digital, memproses aliran informasi berkelanjutan secara real-time. Untuk memastikan integritas dan keamanan data, membawa model AI untuk beroperasi secara offline pada perangkat pengguna telah menjadi solusi teknis yang penting.
Salah satu contoh utama tren ini adalah komputer pribadi DGX Spark AI, yang diperkenalkan di Computex 2026. Perangkat ini menawarkan desain desktop yang ringkas tetapi memberikan kinerja sistem superkomputer mini berkat satu chip super Nvidia GB10 Grace Blackwell.
Pengoperasian independen perangkat ini bergantung pada sistem Memori Terpadu LPDDR5X 128GB dengan bandwidth kecepatan tinggi. Dalam arsitektur AI, kapasitas dan kecepatan memori menentukan kemampuan untuk memproses model bahasa besar (LLM). Hal ini memungkinkan para insinyur data untuk menjalankan model dengan hingga 200 miliar parameter secara langsung pada perangkat itu sendiri, alih-alih menyebarkannya di server cloud.
Dari segi spesifikasi, GPU arsitektur Blackwell mengintegrasikan inti Tensor generasi ke-5 (format presisi FP4) yang menyediakan daya komputasi 1 petaFLOP. CPU ARM 20 inti bertanggung jawab untuk mengkoordinasikan data antara sistem file lokal dan model AI.

Workstation yang melayani kebutuhan AI di enterprise edge kini hadir dalam ukuran yang ringkas, sehingga mudah diterapkan dalam berbagai skala.
Foto: Anh Quân
Di stan pameran, solusi infrastruktur untuk tren ini dibedakan secara jelas melalui sistem yang disinkronkan dari produsen asli dan penyedia solusi integrasi perangkat keras khusus. Contoh utamanya adalah Leadtek, yang memamerkan berbagai workstation dan server dari Sistem Bersertifikasi Nvidia-nya. Ditujukan untuk kebutuhan operasional internal (on-premises) perusahaan kecil dan menengah, workstation AI WinFast WS950 mendukung konfigurasi multi-GPU dengan dua kartu grafis profesional Nvidia RTX PRO 6000 Blackwell Workstation Edition, menyediakan total hingga 192 GB memori GPU GDDR7. Dalam skala yang lebih besar, sistem server WinFast GS5855T mereka memungkinkan integrasi hingga delapan GPU arsitektur RTX PRO Blackwell untuk memenuhi tuntutan tugas inferensi dan pelatihan AI yang intensif.
Mengoptimalkan keamanan dan biaya operasional.
Pengoperasian AI di edge melalui sistem perangkat keras lokal mengatasi tiga tantangan inti infrastruktur teknologi saat ini. Pertama adalah keamanan data. Semua informasi bisnis, kode sumber internal, dan data pribadi disimpan dan diproses dalam lingkungan sandbox yang terisolasi dari internet, sehingga membatasi risiko kebocoran data ke pihak ketiga.
Solusi Edge AI terbaru dipamerkan di Computex 2026.
Selanjutnya adalah masalah biaya komputasi tetap. Menyewa infrastruktur cloud, yang dikenakan biaya berdasarkan jumlah token, menimbulkan biaya variabel yang signifikan seiring dengan peningkatan skalanya. Beroperasi pada perangkat keras offline mengubah biaya ini menjadi investasi aset tetap, mengoptimalkan operasi jangka panjang. Terakhir, ada masalah skalabilitas lokal: Melalui protokol konektivitas berkecepatan tinggi, pengguna dapat menghubungkan sistem komputasi edge untuk berbagi sumber daya, meningkatkan kemampuan pemrosesan pemodelan edge hingga ukuran yang sangat besar.
Sumber: https://thanhnien.vn/ai-roi-dam-may-ve-ban-lam-viec-185260605224532968.htm








