Di acara teknologi global Computex 2026 yang diadakan di Taipei, Taiwan, fokus perbincangan dalam industri semikonduktor dan pengkomputeran telah beralih dengan ketara daripada "AI Awan" kepada "AI Tepi." Industri perkakasan sedang menjalani penstrukturan semula apabila kuasa pengkomputeran peringkat pusat data disepadukan ke dalam peranti peribadi yang diletakkan terus di ruang kerja.
Peralihan daripada AI responsif kepada ejen autonomi (AI Ejen)
Pada peringkat awal gelombang kecerdasan buatan, proses operasi biasa melibatkan pengguna yang menghantar permintaan data ke pelayan awan seperti OpenAI, Google atau Microsoft dan menerima respons. Walau bagaimanapun, seni bina ini mendedahkan banyak batasan mengenai kependaman penghantaran, kos lebar jalur dan keselamatan data sumber.

Nvidia DGX Spark ialah rangkaian komputer peribadi yang direka khusus untuk AI dan akan diedarkan di Vietnam.
Foto: Anh Quân
Pembangunan Agentic AI—generasi ejen perisian autonomi yang mampu merancang, menaakul dan berinteraksi secara langsung dengan sistem fail tempatan—memberikan tuntutan baharu pada infrastruktur perkakasan. Daripada bertindak balas secara pasif, ejen ini bertindak sebagai sumber manusia digital, memproses aliran maklumat berterusan dalam masa nyata. Bagi memastikan integriti dan keselamatan data, membawa model AI untuk beroperasi di luar talian pada peranti pengguna telah menjadi penyelesaian teknikal yang penting.
Satu contoh utama trend ini ialah komputer peribadi DGX Spark AI, yang diperkenalkan di Computex 2026. Peranti ini mempunyai reka bentuk desktop yang padat tetapi memberikan prestasi sistem superkomputer mini hasil daripada cip Super Nvidia GB10 Grace Blackwell tunggalnya.
Operasi bebas peranti ini bergantung pada sistem Memori Bersepadu LPDDR5X 128GB dengan lebar jalur berkelajuan tinggi. Dalam seni bina AI, kapasiti dan kelajuan memori menentukan keupayaan untuk memproses model bahasa besar (LLM). Ini membolehkan jurutera data menjalankan model secara langsung dengan sehingga 200 bilion parameter pada peranti itu sendiri, dan bukannya menggunakannya pada pelayan awan.
Dari segi spesifikasi, GPU seni bina Blackwell mengintegrasikan teras Tensor generasi ke-5 (format ketepatan FP4) yang menyediakan 1 petaFLOP kuasa pengkomputeran. CPU ARM 20-teras bertanggungjawab untuk menyelaraskan data antara sistem fail tempatan dan model AI.

Stesen kerja yang memenuhi keperluan AI di pinggir perusahaan kini didatangkan dalam saiz yang padat, menjadikannya mudah digunakan pada pelbagai skala.
Foto: Anh Quân
Di gerai pameran, penyelesaian infrastruktur untuk trend ini dibezakan dengan jelas melalui sistem yang disegerakkan daripada pengeluar asal dan penyedia penyelesaian integrasi perkakasan khusus. Contoh utama ialah Leadtek, yang mempamerkan pelbagai stesen kerja dan pelayan daripada Sistem Bertauliah Nvidia. Menyasarkan keperluan operasi di premis (dalaman) perusahaan kecil dan sederhana, stesen kerja WinFast WS950 AI menyokong konfigurasi berbilang GPU dengan dua kad grafik Nvidia RTX PRO 6000 Blackwell Workstation Edition profesional, menyediakan sejumlah memori GPU GDDR7 sehingga 192 GB. Pada skala yang lebih besar, sistem pelayan WinFast GS5855T mereka membolehkan integrasi sehingga lapan GPU seni bina RTX PRO Blackwell untuk memenuhi permintaan tugas inferens dan latihan AI yang intensif.
Mengoptimumkan keselamatan dan kos operasi.
Mengendalikan AI di pinggir melalui sistem perkakasan tempatan menangani tiga cabaran teras infrastruktur teknologi masa kini. Pertama ialah keselamatan data. Semua maklumat perniagaan, kod sumber dalaman dan data peribadi disimpan dan diproses dalam persekitaran kotak pasir yang diasingkan daripada internet, sekali gus mengehadkan risiko kebocoran data kepada pihak ketiga.
Penyelesaian Edge AI baharu dipamerkan di Computex 2026
Seterusnya ialah isu kos pengkomputeran tetap. Penyewaan infrastruktur awan, yang dikenakan berdasarkan jumlah token, menanggung kos berubah yang ketara apabila ia diskalakan. Beroperasi pada perkakasan luar talian mengubah kos ini menjadi pelaburan aset tetap, mengoptimumkan operasi jangka panjang. Akhir sekali, terdapat isu kebolehskalaan tempatan: Melalui protokol sambungan berkelajuan tinggi, pengguna boleh menghubungkan sistem pengkomputeran pinggir untuk berkongsi sumber, menskalakan keupayaan pemprosesan pemodelan pinggir kepada saiz yang besar.
Sumber: https://thanhnien.vn/ai-roi-dam-may-ve-ban-lam-viec-185260605224532968.htm








