
GPU'lar yapay zekâ bilgisayarlarının beynidir.
Basitçe ifade etmek gerekirse, grafik işlem birimi (GPU), yapay zekâ bilgisayarının beyni gibi davranır.
Bildiğiniz gibi, merkezi işlem birimi (CPU) bilgisayarın beynidir. GPU'nun avantajı, karmaşık hesaplamalar yapmak için özel olarak tasarlanmış bir CPU olmasıdır. Bu hesaplamaları gerçekleştirmenin en hızlı yolu, GPU gruplarının bir problemi birlikte çözmesidir. Buna rağmen, bir yapay zeka modelinin eğitilmesi haftalar hatta aylar sürebilir. Oluşturulduktan sonra, ön uç bilgisayar sistemine yerleştirilir ve kullanıcılar yapay zeka modeline sorular sorabilir; bu sürece çıkarım denir.
Bir yapay zeka bilgisayarı birden fazla GPU içerir.
Yapay zekâ problemlerini çözmek için en iyi mimari, bir rafa yerleştirilmiş ve rafın üstündeki bir anahtara bağlı bir grup GPU kullanmaktır. Birden fazla GPU rafı, hiyerarşik bir ağ bağlantı sisteminde ayrıca bağlanabilir. Çözülmesi gereken problemler daha karmaşık hale geldikçe, GPU gereksinimleri de artar ve bazı projelerde binlerce GPU'dan oluşan kümelerin konuşlandırılması gerekebilir.
Her yapay zeka kümesi küçük bir ağdır.
Bir yapay zeka kümesi oluştururken, GPU'ların birlikte çalışmasını ve verileri verimli bir şekilde paylaşmasını sağlamak için küçük bir bilgisayar ağı kurmak gereklidir.

Yukarıdaki diyagram, alttaki dairelerin GPU'larda çalışan iş akışlarını temsil ettiği bir yapay zeka kümesini göstermektedir. GPU'lar, üst raftaki (ToR) anahtarlara bağlanır. Bu ToR anahtarları ayrıca, diyagramda yukarıda gösterilen ağ omurga anahtarlarına da bağlanarak, birden fazla GPU'nun söz konusu olduğu durumlarda gerekli olan net ağ hiyerarşisini göstermektedir.
Yapay zekâ uygulamalarının yaygınlaştırılmasında ağlar bir darboğaz oluşturuyor.
Geçtiğimiz sonbaharda, delegelerin yeni nesil yapay zeka altyapısını geliştirdiği Açık Bilgisayar Projesi (OCP) küresel zirvesinde, Marvell Technology'den delege Loi Nguyen önemli bir soruna dikkat çekti: "Ağlar yeni darboğaz."
Teknik olarak, ağ tıkanıklığı nedeniyle yüksek paket gecikmesi veya paket kaybı, paketlerin yeniden gönderilmesine neden olarak iş tamamlama süresini (JCT) önemli ölçüde artırabilir. Sonuç olarak, işletmelere ait milyonlarca veya on milyonlarca dolarlık GPU, verimsiz yapay zeka sistemleri nedeniyle boşa harcanmakta ve bu durum işletmelere hem gelir hem de pazara sunma süresi açısından zarar vermektedir.
Yapay zekâ ağlarının başarılı bir şekilde çalışması için test ve ölçümleme hayati öneme sahip koşullardır.
Bir yapay zeka kümesini verimli bir şekilde çalıştırmak için, GPU'ların eğitim süresini kısaltmak ve yatırım getirisini en üst düzeye çıkarmak için öğrenme modellerini uygulamak üzere tam kapasitelerini kullanabilmeleri gerekir. Bu nedenle, yapay zeka kümesinin performansının test edilmesi ve değerlendirilmesi gereklidir (Şekil 2). Ancak bu görev kolay değildir, çünkü sistem mimarisi, sorunu çözmek için birbirini tamamlaması gereken GPU ve ağ yapısı arasındaki birçok ayar ve ilişkiyi içerir.

Bu durum, yapay zeka ağlarının ölçülmesinde birçok zorluk ve soruna yol açmaktadır:
- Üretim ağının tamamını laboratuvarda kopyalamanın zorluğu, maliyet, ekipman, yüksek vasıflı yapay zeka ağ mühendislerinin yetersizliği, alan, güç kaynağı ve sıcaklık gibi sınırlamalardan kaynaklanmaktadır.
- Üretim sisteminde yapılan testler, üretim sisteminin kendi işlem kapasitesini azaltır.
- Sorunların ölçeği ve kapsamındaki farklılıklar nedeniyle sorunların doğru bir şekilde yeniden üretilmesinde zorluk yaşanması.
- GPU'ların birbirine bağlanma biçimindeki karmaşıklık.
Bu zorlukların üstesinden gelmek için işletmeler, önerilen kurulumların bir alt kümesinin laboratuvar ortamında kıyaslama testlerini yaparak JCT (iş tamamlama süresi), yapay zeka ekibinin ulaşabileceği bant genişliği gibi temel parametreleri ölçebilir ve bunları anahtarlama platformu kullanımı ve önbellekleme kullanımıyla karşılaştırabilirler. Bu kıyaslama testi, GPU/işlem yükü ile ağ tasarımı/kurulumu arasında doğru dengeyi bulmaya yardımcı olur. Sonuçlardan memnun kalındığında, bilgisayar mimarları ve ağ mühendisleri bu kurulumları üretime uygulayabilir ve yeni sonuçları ölçebilirler.
Kurumsal araştırma laboratuvarları, araştırma enstitüleri ve üniversiteler, özellikle en iyi uygulamalar sürekli değiştiği için, büyük ağlarda çalışmanın zorluklarını ele almak amacıyla etkili yapay zeka ağlarının oluşturulması ve işletilmesinin her yönünü analiz etmek için çalışıyor. Bu tekrarlanabilir işbirlikçi yaklaşım, işletmelerin tekrarlanabilir ölçümler ve hızlı "eğer-o zaman" senaryo testleri gerçekleştirmesinin tek yoludur; bu da yapay zeka destekli ağların optimizasyonu için temeldir.
(Kaynak: Keysight Technologies)
[reklam_2]
Kaynak: https://vietnamnet.vn/ket-noi-mang-ai-5-dieu-can-biet-2321288.html







