Las últimas tendencias de NVIDIA en arquitectura Hopper

29/08/2023

Las últimas tendencias de NVIDIA en arquitectura Hopper

Ya ha transcurrido más de un año desde que en marzo de 2022, NVIDIA, conocida previamente sobre todo por sus tarjetas gráficas enfocadas al mundo del gaming, presentó su microprocesador H100 de última generación basada en la nueva arquitectura de GPU NVIDIA Hopper.

Una innovación que supuso un importante salto de rendimiento con respecto a su predecesora, NVIDIA Ampere, un nuevo estándar con el objetivo de acelerar la IA y la computación de alto rendimiento.

Desde entonces, la compañía propietaria del motor más potente para la infraestructura de IA del mundo no ha dejado de cotizar al alza, y las tecnológicas más poderosas continúan pujando por este desarrollo de NVIDIA en la gran carrera tecnológica del momento: el desarrollo y alimentación de la IA en los centros de datos

Pero, ¿qué es la arquitectura Hopper? ¿Cuáles son las novedades que ha presentado NVIDIA en 2023? ¿Qué nos espera en 2024? 

Una mirada a la arquitectura Hopper

La arquitectura Hopper, sin la que no podría haberse lanzado la plataforma de computación acelerada de última generación que ha desestabilizado el mercado, adquiere su nombre gracias a Grace Hopper, una científica y militar estadounidense hoy en día recordada como pionera de la computación.

No son pocas las innovaciones que presenta la GPU NVIDIA H100 basada en la nueva arquitectura GPU NVIDIA Hopper, entre ellas:

  • Tecnología Tensor Core de cuarta generación (permiten la computación de precisión mixta, con adaptación dinámica de los cálculos que preservan la precisión y aceleran el rendimiento) que ofrece nuevas capacidades para todas las cargas de trabajo.
  • Un nuevo motor transformador que, gracias a las precisiones combinadas de FP8 y FP16 de los Tensor Cores, permiten una aceleración drástica de los cálculos de IA de los transformadores. Con ello, solo para hacernos una idea, H100 ofrece una IA hasta 30 veces más rápida y un entrenamiento 9 veces más veloz en comparación al modelo anterior A100.
  • La nueva interconexión de red NVLink a escala vertical que, combinada con el conmutador NVLink externo, permite la comunicación bidireccional entre GPU’s en varios servidores a 900 gigabytes/segundo, un ancho de banda 9 veces mayor al de InfiniBand HDR de A100.

Del H100 al Superchip GH200, una combinación ganadora

En mayo de 2023, la compañía presentó la supercomputadora de IA DGX GH 200, una solución que combina la CPU de 72 núcleos y hasta 480 GB de memoria LPDDR5X, con las, de momento, inigualables GPU H100, de 528 núcleos Tensor y 80 GB de memoria HBM3, todo ello interconectado mediante su propio sistema NVLink-C2C

Este desarrollo permite alcanzar 1 ExaFLOP de potencia (1.000.000 TFLOPS), con 144 TB de memoria RAM y 36 NVSwitches para la intercomunicación.

Y ha sido ahora cuando NVIDIA ha presentado una mejora de su DGX GH 200, en la que no ha habido cambios en la CPU, pero sí en la GPU, que cuenta ahora con memoria HBM3e en lugar de HBM3, pasando de un ancho de banda de 4 TB/s a 5 TB/s, con una ampliación de la memoria GPU de los 96 a los 144 GB, permitiendo una configuración dual que supone disponer de 282 GB de memoria HBM3e y un diseño de servidor de fácil escalabilidad.

Sin embargo, no se podrá acceder a probar esta tecnología hasta el próximo año, 2024, en el que la compañía ya ha anunciado que Hopper tendrá un sucesor, al que han llamado, de momento Hopper Next, una arquitectura central que se bifurcará según el segmento del mercado al que llegue.

La tecnología desarrollada por NVIDIA para los centros de datos de IA es sin duda una revolución en el mercado, y desde Powernet, estamos expectantes por ver cómo evolucionan los próximos desarrollos.