Conectarse a redes de IA: 5 cosas que necesitas saber

VietNamNet•12/09/2024

Las GPU son el cerebro de las computadoras de IA.

En pocas palabras, la unidad de procesamiento gráfico (GPU) actúa como el cerebro de una computadora de IA.

Como ya sabrás, la unidad central de procesamiento (CPU) es el cerebro de un ordenador. La ventaja de una GPU reside en que es una CPU especializada en realizar cálculos complejos. La forma más rápida de realizar estos cálculos es que grupos de GPU resuelvan un problema conjuntamente. Aun así, entrenar un modelo de IA puede llevar semanas o incluso meses. Una vez creado, se integra en el sistema informático de la interfaz y los usuarios pueden hacerle preguntas; este proceso se denomina inferencia.

Un ordenador de IA contiene múltiples GPU.

La mejor arquitectura para resolver problemas de IA consiste en utilizar un grupo de GPU en un rack, conectadas a un conmutador en la parte superior del mismo. Se pueden conectar varios racks de GPU adicionales en un sistema de conectividad de red jerárquico. A medida que los problemas a resolver se vuelven más complejos, los requisitos de GPU también aumentan, y algunos proyectos podrían necesitar implementar clústeres de miles de GPU.

Cada clúster de IA es una pequeña red.

Al construir un clúster de IA, es necesario configurar una pequeña red informática para conectar y permitir que las GPU trabajen juntas y compartan datos de manera eficiente.

El diagrama anterior ilustra un clúster de IA donde los círculos en la parte inferior representan flujos de trabajo que se ejecutan en GPU. Las GPU se conectan a conmutadores en el rack superior (ToR). Estos conmutadores ToR también se conectan a los conmutadores troncales de red que se muestran en el diagrama, lo que demuestra la jerarquía de red clara necesaria cuando intervienen varias GPU.

También te puede interesar

El tifón número 1 se dirige hacia las zonas marítimas de Quang Ninh, Hai Phong y Hung Yen.(Diario Dan Tri) - Los pronósticos indican que, debido a la influencia del tifón Maysak (número 1), desde la noche del 3 al 5 de julio, la región noreste y la provincia de Thanh Hoa experimentarán lluvias intensas a muy intensas, con algunas zonas registrando más de 500 mm de precipitación. Las lluvias se concentrarán en las provincias de Lang Son, Quang Ninh, Hai Phong y Bac Ninh.

El tifón número 1 se aproxima a la zona costera; la Autoridad de Aviación Civil ha emitido directivas urgentes.(PLVN) - La Autoridad de Aviación Civil de Vietnam ha solicitado a los aeropuertos, aerolíneas y unidades relacionadas que organicen turnos de servicio las 24 horas del día, los 7 días de la semana, e implementen de manera proactiva planes de respuesta ante el tifón n.° 1 (Maysak), garantizando la seguridad absoluta de las operaciones de vuelo.

Hanói: Los residentes apoyan el programa piloto de Zonas de Bajas Emisiones.VTV.vn - Tras los primeros días de la puesta en marcha de la Zona de Bajas Emisiones, los residentes están de acuerdo con la política y esperan que la ciudad continúe mejorando la infraestructura y apoyando la transición a vehículos ecológicos.

Las redes representan un cuello de botella en el despliegue de la IA.
El otoño pasado, en la cumbre mundial del Open Computer Project (OCP), donde los delegados estaban construyendo la próxima generación de infraestructura de IA, el delegado Loi Nguyen, de Marvell Technology, señaló un problema clave: "las redes son el nuevo cuello de botella".

Técnicamente, la alta latencia o la pérdida de paquetes debido a la congestión de la red puede provocar que los paquetes se reenvíen, lo que aumenta significativamente el tiempo de finalización de las tareas (JCT). Como resultado, millones o decenas de millones de dólares en GPU pertenecientes a empresas se desperdician debido a sistemas de IA ineficientes, lo que perjudica a las empresas tanto en términos de ingresos como de tiempo de comercialización.

Las pruebas y las mediciones son condiciones cruciales para el funcionamiento exitoso de las redes de IA.

Para operar un clúster de IA de manera eficiente, las GPU deben aprovechar al máximo su capacidad para reducir el tiempo de entrenamiento e implementar modelos de aprendizaje que maximicen el retorno de la inversión. Por lo tanto, es necesario probar y evaluar el rendimiento del clúster de IA (Figura 2). Sin embargo, esta tarea no es sencilla, ya que la arquitectura del sistema implica numerosas configuraciones y relaciones entre la GPU y la estructura de red que deben complementarse para resolver el problema.

La plataforma de evaluación comparativa de centros de datos de IA y cómo evalúa los clústeres de centros de datos de IA.

Esto genera muchas dificultades y desafíos a la hora de medir las redes de IA:

- El reto de replicar toda la red de producción en el laboratorio se debe a las limitaciones de coste, equipamiento, escasez de ingenieros de redes de IA altamente cualificados, espacio, suministro eléctrico y temperatura.

- Las pruebas in situ en un sistema de producción reducen la capacidad de procesamiento disponible del propio sistema de producción.

- Dificultad para reproducir con precisión los problemas debido a las diferencias en la escala y el alcance de los mismos.

Estados Unidos - Vietnam: No te lo pierdas

Fortalecer la amistad entre Vietnam y Estados Unidos.El 3 de julio, en el marco del programa Pacific Partnership - Friends of the Pacific 2026, la delegación del Ejército de los Estados Unidos en el Pacífico, encabezada por el teniente general Joel Vowell, subcomandante del Ejército de los Estados Unidos en el Pacífico, realizó una visita de cortesía al Comando Militar Provincial de Quang Tri.

La delegación del Ejército de Estados Unidos en el Pacífico visita el Comando Militar Provincial de Quang Tri.En 2026, por primera vez, el programa Pacific Partnership-Friends of the Pacific se organizará conjuntamente en Quang Tri, creando un marco de cooperación a gran escala con 25 actividades.

El Ministerio de Asuntos Exteriores recibió una copia de las Cartas Credenciales del Embajador de Estados Unidos en Vietnam.En la tarde del 2 de julio, en la sede del Ministerio de Asuntos Exteriores, el Sr. Le Cong Dung, Director del Departamento de Protocolo de Estado e Interpretación Extranjera, recibió una copia de las Cartas Credenciales de la Sra. Jennifer Wicks, Embajadora de los Estados Unidos de América en Vietnam.

- La complejidad de cómo se conectan colectivamente las GPU.

Para abordar estos desafíos, las empresas pueden realizar pruebas comparativas de un subconjunto de configuraciones propuestas en un entorno de laboratorio para evaluar parámetros clave como el tiempo de finalización de tareas (JCT), el ancho de banda que puede alcanzar el equipo de IA y compararlos con el uso de la plataforma de conmutación y el almacenamiento en caché. Estas pruebas ayudan a encontrar el equilibrio adecuado entre la carga de trabajo de la GPU/procesamiento y el diseño/instalación de la red. Una vez satisfechos con los resultados, los arquitectos informáticos y los ingenieros de redes pueden aplicar estas configuraciones a producción y medir los nuevos resultados.

Los laboratorios de investigación empresariales, los institutos de investigación y las universidades están trabajando para analizar cada aspecto de la creación y el funcionamiento de redes de IA eficaces, con el fin de abordar los desafíos que implica trabajar con grandes redes, especialmente dado que las mejores prácticas están en constante evolución. Este enfoque colaborativo y repetible es la única manera para que las empresas realicen mediciones repetibles y pruebas rápidas de escenarios "si-entonces", fundamentales para optimizar las redes basadas en IA.

(Fuente: Keysight Technologies)

Fuente: https://vietnamnet.vn/ket-noi-mang-ai-5-dieu-can-biet-2321288.html