El cofundador y director ejecutivo de Nvidia, Jensen Huang, presentó el superchip de IA Vera Rubin en la Conferencia de Tecnología GPU en Washington, marcando el cambio de la compañía hacia el hardware de IA en medio del auge de la IA, aumentando su valor de mercado a casi 5 billones de dólares. La plataforma Vera Rubin apunta a cargas de trabajo de IA generativa de alta intensidad. Integra una única CPU Vera equipada con 88 núcleos ARM personalizados que admiten 176 subprocesos. Esta CPU se combina con dos GPU Rubin para lograr hasta 100 petaFLOPS de rendimiento informático FP4. Como computadora a escala de rack NVLink 72 de tercera generación de Nvidia, Vera Rubin sucede a los modelos GB200 y GB300. El sistema emplea refrigeración líquida e incorpora seis billones de transistores. También incluye 2 TB de memoria SOCAMM2 de baja latencia para manejar tareas exigentes de procesamiento de IA de manera eficiente. En su configuración básica, Vera Rubin proporciona aproximadamente 100 veces el rendimiento informático bruto en comparación con el DGX-1 basado en Volta. Esa plataforma anterior, el sistema de aprendizaje profundo inicial de Nvidia, entregó 170 teraflops de rendimiento máximo FP16. Este aumento sustancial subraya la evolución de la capacidad computacional para las aplicaciones de IA a lo largo de los años. Nvidia planea lanzar Vera Rubin en varias configuraciones para satisfacer diversas necesidades. La configuración NVL144 incluye dos GPU del tamaño de una retícula, que permiten hasta 3,6 exaflops de inferencia FP4 y 1,2 exaflops de rendimiento de entrenamiento FP8. Para capacidades mejoradas, la configuración NVL144 CPX alcanza 8 exaflops, lo que representa 7,5 veces la potencia de los sistemas GB300 NVL72 de generación actual. Para abordar los requisitos en los centros de datos de hiperescala para procesar cargas de trabajo de contexto de modelo más grandes, Nvidia presenta el sistema Rubin Ultra NVL576. Esta variante utiliza cuatro GPU del tamaño de una retícula junto con hasta 365 TB de memoria de alta velocidad. Ofrece hasta 15 exaflops de inferencia del FP4 y 5 exaflops de rendimiento de entrenamiento del FP8, lo que equivale a un aumento de 8 veces con respecto al GB300. Cada GPU Rubin consta de dos chips de cómputo y ocho pilas de memoria HBM4, lo que optimiza el rendimiento de los datos y el cómputo. La placa GPU cuenta con cinco conectores de plano posterior NVLink. Dos conectores en la parte superior conectan las GPU al conmutador NVLink para una interconectividad de alta velocidad. Los tres conectores inferiores gestionan la entrega de energía, la interfaz PCIe y la conectividad CXL para admitir la integración dentro de sistemas más amplios. Huang anticipa que las GPU Rubin entrarán en producción en masa durante la segunda mitad de 2026. El lanzamiento de los sistemas NVL144 está programado para finales de 2026 o principios de 2027. Mientras tanto, se espera que los sistemas NVL576 estén disponibles en la segunda mitad de 2027, alineándose con la hoja de ruta de Nvidia para avanzar en la infraestructura de IA. https://www.youtube.com/watch?v=lQHK61IDFH4





