
Οι GPU είναι ο εγκέφαλος των υπολογιστών τεχνητής νοημοσύνης.
Με απλά λόγια, η μονάδα επεξεργασίας γραφικών (GPU) λειτουργεί ως ο εγκέφαλος ενός υπολογιστή τεχνητής νοημοσύνης.
Όπως ίσως ήδη γνωρίζετε, η κεντρική μονάδα επεξεργασίας (CPU) είναι ο εγκέφαλος ενός υπολογιστή. Το πλεονέκτημα μιας GPU έγκειται στο γεγονός ότι είναι μια εξειδικευμένη CPU για την εκτέλεση σύνθετων υπολογισμών. Ο ταχύτερος τρόπος για να εκτελέσετε αυτούς τους υπολογισμούς είναι να έχετε ομάδες GPU που λύνουν ένα πρόβλημα μαζί. Ακόμα κι έτσι, η εκπαίδευση ενός μοντέλου AI μπορεί να διαρκέσει εβδομάδες ή και μήνες. Μόλις κατασκευαστεί, τοποθετείται στο σύστημα του front-end του υπολογιστή και οι χρήστες μπορούν να υποβάλουν ερωτήσεις στο μοντέλο AI. Αυτή η διαδικασία ονομάζεται συμπερασματολογία.
Ένας υπολογιστής τεχνητής νοημοσύνης περιέχει πολλαπλές GPU.
Η καλύτερη αρχιτεκτονική για την επίλυση προβλημάτων Τεχνητής Νοημοσύνης είναι η χρήση μιας ομάδας GPU σε ένα rack, συνδεδεμένων με έναν διακόπτη στην κορυφή του rack. Πολλαπλά rack GPU μπορούν να συνδεθούν επιπρόσθετα σε ένα ιεραρχικό σύστημα συνδεσιμότητας δικτύου. Καθώς τα προβλήματα που πρέπει να επιλυθούν γίνονται πιο περίπλοκα, οι απαιτήσεις GPU αυξάνονται επίσης, με ορισμένα έργα να ενδέχεται να χρειαστεί να αναπτύξουν συστάδες χιλιάδων GPU.
Κάθε σύμπλεγμα τεχνητής νοημοσύνης είναι ένα μικρό δίκτυο.
Κατά τη δημιουργία ενός συμπλέγματος τεχνητής νοημοσύνης, είναι απαραίτητο να δημιουργηθεί ένα μικρό δίκτυο υπολογιστών για να συνδεθούν και να επιτραπεί στις GPU να συνεργάζονται και να μοιράζονται δεδομένα αποτελεσματικά.

Το παραπάνω διάγραμμα απεικονίζει ένα σύμπλεγμα τεχνητής νοημοσύνης (AI Cluster) όπου οι κύκλοι στο κάτω μέρος αντιπροσωπεύουν ροές εργασίας που εκτελούνται σε GPU. Οι GPU συνδέονται με διακόπτες στο επάνω rack (ToR). Αυτοί οι διακόπτες ToR συνδέονται επίσης με τους διακόπτες του δικτύου κορμού που φαίνονται παραπάνω στο διάγραμμα, καταδεικνύοντας τη σαφή ιεραρχία δικτύου που είναι απαραίτητη όταν εμπλέκονται πολλαπλές GPU.
Τα δίκτυα αποτελούν εμπόδιο στην ανάπτυξη της Τεχνητής Νοημοσύνης.
Το περασμένο φθινόπωρο, στην παγκόσμια σύνοδο κορυφής του Open Computer Project (OCP), όπου οι σύνεδροι κατασκεύαζαν την επόμενη γενιά υποδομών τεχνητής νοημοσύνης, ο σύνεδρος Loi Nguyen από την Marvell Technology επεσήμανε ένα βασικό ζήτημα: «τα δίκτυα αποτελούν το νέο σημείο συμφόρησης».
Τεχνικά, η υψηλή καθυστέρηση ή η απώλεια πακέτων λόγω συμφόρησης δικτύου μπορεί να προκαλέσει την επαναποστολή πακέτων, αυξάνοντας σημαντικά τον χρόνο ολοκλήρωσης εργασίας (JCT). Ως αποτέλεσμα, εκατομμύρια ή δεκάδες εκατομμύρια δολάρια σε GPU που ανήκουν σε επιχειρήσεις σπαταλώνται λόγω αναποτελεσματικών συστημάτων τεχνητής νοημοσύνης, βλάπτοντας τις επιχειρήσεις τόσο από άποψη εσόδων όσο και από άποψη χρόνου κυκλοφορίας στην αγορά.
Οι δοκιμές και οι μετρήσεις αποτελούν κρίσιμες προϋποθέσεις για την επιτυχή λειτουργία των δικτύων Τεχνητής Νοημοσύνης.
Για την αποτελεσματική λειτουργία ενός συμπλέγματος τεχνητής νοημοσύνης, οι GPU πρέπει να είναι σε θέση να αξιοποιήσουν πλήρως τις δυνατότητές τους για να μειώσουν τον χρόνο εκπαίδευσης και να εφαρμόσουν μοντέλα μάθησης για να μεγιστοποιήσουν την απόδοση της επένδυσης. Επομένως, η δοκιμή και η αξιολόγηση της απόδοσης του συμπλέγματος τεχνητής νοημοσύνης είναι απαραίτητη (Σχήμα 2). Ωστόσο, αυτό το έργο δεν είναι εύκολο, καθώς η αρχιτεκτονική του συστήματος περιλαμβάνει πολλές ρυθμίσεις και σχέσεις μεταξύ της GPU και της δομής δικτύου που πρέπει να αλληλοσυμπληρώνονται για να λύσουν το πρόβλημα.

Αυτό δημιουργεί πολλές δυσκολίες και προκλήσεις στη μέτρηση δικτύων τεχνητής νοημοσύνης:
- Η πρόκληση στην αναπαραγωγή ολόκληρου του δικτύου παραγωγής στο εργαστήριο οφείλεται σε περιορισμούς στο κόστος, τον εξοπλισμό, την έλλειψη εξειδικευμένων μηχανικών δικτύων τεχνητής νοημοσύνης, τον χώρο, την παροχή ρεύματος και τη θερμοκρασία.
- Οι επιτόπιες δοκιμές σε ένα σύστημα παραγωγής μειώνουν τη διαθέσιμη ικανότητα επεξεργασίας του ίδιου του συστήματος παραγωγής.
- Δυσκολία στην ακριβή αναπαραγωγή προβλημάτων λόγω διαφορών στην κλίμακα και το εύρος των προβλημάτων.
- Η πολυπλοκότητα του τρόπου με τον οποίο οι GPU συνδέονται συλλογικά.
Για την αντιμετώπιση αυτών των προκλήσεων, οι επιχειρήσεις μπορούν να διεξάγουν συγκριτική αξιολόγηση ενός υποσυνόλου προτεινόμενων ρυθμίσεων σε εργαστηριακό περιβάλλον, για να συγκρίνουν βασικές παραμέτρους όπως ο χρόνος ολοκλήρωσης εργασίας (JCT), το εύρος ζώνης που μπορεί να επιτύχει η ομάδα τεχνητής νοημοσύνης και να τις συγκρίνουν με τη χρήση της πλατφόρμας μεταγωγής και τη χρήση της προσωρινής αποθήκευσης. Αυτή η συγκριτική αξιολόγηση βοηθά στην εύρεση της σωστής ισορροπίας μεταξύ του φόρτου εργασίας GPU/επεξεργασίας και του σχεδιασμού/εγκατάστασης δικτύου. Μόλις ικανοποιηθούν με τα αποτελέσματα, οι αρχιτέκτονες υπολογιστών και οι μηχανικοί δικτύου μπορούν να εφαρμόσουν αυτές τις ρυθμίσεις στην παραγωγή και να μετρήσουν τα νέα αποτελέσματα.
Ερευνητικά εργαστήρια επιχειρήσεων, ερευνητικά ινστιτούτα και πανεπιστήμια εργάζονται για να αναλύσουν κάθε πτυχή της δημιουργίας και λειτουργίας αποτελεσματικών δικτύων Τεχνητής Νοημοσύνης, ώστε να αντιμετωπίσουν τις προκλήσεις της εργασίας σε μεγάλα δίκτυα, ειδικά καθώς οι βέλτιστες πρακτικές αλλάζουν συνεχώς. Αυτή η επαναλήψιμη συνεργατική προσέγγιση είναι ο μόνος τρόπος για τις επιχειρήσεις να εκτελούν επαναλήψιμες μετρήσεις και γρήγορες δοκιμές σεναρίων τύπου «αν-τότε» — θεμελιώδεις για τη βελτιστοποίηση δικτύων που υποστηρίζονται από την Τεχνητή Νοημοσύνη.
(Πηγή: Keysight Technologies)
[διαφήμιση_2]
Πηγή: https://vietnamnet.vn/ket-noi-mang-ai-5-dieu-can-biet-2321288.html









