
GPU adalah otak komputer AI.
Secara ringkasnya, unit pemprosesan grafik (GPU) bertindak sebagai otak komputer AI.
Seperti yang anda mungkin sudah tahu, unit pemprosesan pusat (CPU) ialah otak komputer. Kelebihan GPU terletak pada hakikat bahawa ia merupakan CPU khusus untuk melakukan pengiraan yang kompleks. Cara terpantas untuk melakukan pengiraan ini adalah dengan meminta sekumpulan GPU menyelesaikan masalah bersama-sama. Walaupun begitu, latihan model AI masih boleh mengambil masa berminggu-minggu atau bahkan berbulan-bulan. Setelah dibina, ia diletakkan di dalam sistem komputer bahagian hadapan, dan pengguna boleh bertanya soalan kepada model AI; proses ini dipanggil inferens.
Komputer AI mengandungi berbilang GPU.
Seni bina terbaik untuk menyelesaikan masalah AI adalah dengan menggunakan sekumpulan GPU dalam rak, yang disambungkan ke suis di atas rak. Pelbagai rak GPU boleh disambungkan secara tambahan dalam sistem sambungan rangkaian hierarki. Apabila masalah yang perlu diselesaikan menjadi lebih kompleks, keperluan GPU juga meningkat, dengan sesetengah projek berpotensi perlu menggunakan kelompok beribu-ribu GPU.
Setiap kluster AI ialah rangkaian kecil.
Apabila membina kluster AI, perlu menyediakan rangkaian komputer kecil untuk bersambung dan membolehkan GPU berfungsi bersama dan berkongsi data dengan cekap.

Gambar rajah di atas menggambarkan Kluster AI di mana bulatan di bahagian bawah mewakili aliran kerja yang berjalan pada GPU. GPU bersambung ke suis pada rak atas (ToR). Suis ToR ini juga bersambung ke suis tulang belakang rangkaian yang ditunjukkan di atas dalam gambar rajah, menunjukkan hierarki rangkaian yang jelas yang diperlukan apabila berbilang GPU terlibat.
Rangkaian merupakan satu halangan dalam penggunaan AI.
Musim luruh yang lalu, di sidang kemuncak global Projek Komputer Terbuka (OCP), di mana para perwakilan sedang membina infrastruktur AI generasi akan datang, perwakilan Loi Nguyen dari Marvell Technology menegaskan isu utama: "rangkaian merupakan penghalang baharu."
Secara teknikalnya, latensi paket yang tinggi atau kehilangan paket akibat kesesakan rangkaian boleh menyebabkan paket dihantar semula, sekali gus meningkatkan masa penyiapan kerja (JCT) dengan ketara. Akibatnya, GPU bernilai berjuta-juta atau berpuluh-puluh juta dolar milik perniagaan dibazirkan disebabkan oleh sistem AI yang tidak cekap, sekali gus menjejaskan perniagaan dari segi pendapatan dan masa ke pasaran.
Pengujian dan pengukuran merupakan syarat penting untuk kejayaan operasi rangkaian AI.
Untuk mengendalikan kluster AI dengan cekap, GPU perlu berupaya menggunakan kapasiti penuh mereka untuk memendekkan masa latihan dan melaksanakan model pembelajaran bagi memaksimumkan pulangan pelaburan. Oleh itu, pengujian dan penilaian prestasi kluster AI adalah perlu (Rajah 2). Walau bagaimanapun, tugas ini bukanlah mudah, kerana seni bina sistem melibatkan banyak tetapan dan hubungan antara GPU dan struktur rangkaian yang perlu saling melengkapi untuk menyelesaikan masalah.

Ini mewujudkan banyak kesukaran dan cabaran dalam mengukur rangkaian AI:
- Cabaran dalam mereplikasi keseluruhan rangkaian pengeluaran di makmal adalah disebabkan oleh batasan kos, peralatan, kekurangan jurutera rangkaian AI yang berkemahiran tinggi, ruang, bekalan kuasa dan suhu.
- Pengujian pada sistem pengeluaran mengurangkan kapasiti pemprosesan yang tersedia bagi sistem pengeluaran itu sendiri.
- Kesukaran untuk menghasilkan semula masalah dengan tepat disebabkan oleh perbezaan dalam skala dan skop masalah.
- Kerumitan cara GPU berhubung secara kolektif.
Bagi menangani cabaran ini, perniagaan boleh menjalankan penanda aras bagi subset persediaan yang dicadangkan dalam persekitaran makmal untuk menanda aras parameter utama seperti JCT (masa penyiapan kerja), lebar jalur yang boleh dicapai oleh pasukan AI, dan membandingkannya dengan penggunaan platform pensuisan dan penggunaan caching. Penanda aras ini membantu mencari keseimbangan yang tepat antara beban kerja GPU/pemprosesan dan reka bentuk/pemasangan rangkaian. Setelah berpuas hati dengan hasilnya, arkitek komputer dan jurutera rangkaian boleh menggunakan persediaan ini untuk pengeluaran dan mengukur hasil baharu.
Makmal penyelidikan perusahaan, institut penyelidikan dan universiti sedang berusaha untuk menganalisis setiap aspek pembinaan dan pengendalian rangkaian AI yang berkesan bagi menangani cabaran bekerja pada rangkaian besar, terutamanya apabila amalan terbaik sentiasa berubah. Pendekatan kolaboratif yang boleh diulang ini adalah satu-satunya cara untuk perniagaan melakukan pengukuran yang boleh diulang dan ujian senario "jika-maka" yang pantas—asas untuk mengoptimumkan rangkaian berkuasa AI.
(Sumber: Keysight Technologies)
[iklan_2]
Sumber: https://vietnamnet.vn/ket-noi-mang-ai-5-dieu-can-biet-2321288.html










