NVIDIA volvió a sacudir el panorama tecnológico al presentar sus nuevas GPUs Rubin CPX, una línea distinta de chips creados específicamente para cargas de inferencia a gran escala.
El anuncio se realizó durante el AI Infra Summit y dejó claro que la compañía está cambiando el enfoque: ya no se trata solo de entrenar modelos, sino de ejecutar con mayor eficiencia aplicaciones de IA que requieren contextos largos y complejos.
La Rubin CPX ofrece 30 petaFLOPs en NVFP4 y viene equipada con 128 GB de memoria GDDR7. Aunque muchos esperaban que NVIDIA utilizara HBM, la decisión de apostar por GDDR7 busca equilibrar costos y rendimiento, haciéndola más viable para implementaciones masivas. Además, no actúa sola: se integra junto a GPUs Rubin tradicionales y CPUs Vera en el rack Vera Rubin NVL144 CPX, que combina 144 Rubin CPX, 144 Rubin y 36 CPUs Vera. En conjunto, la plataforma alcanza 8 exaFLOPs de potencia NVFP4, lo que, según la compañía, supone un rendimiento 7,5 veces superior al de la generación Blackwell Ultra.
El verdadero valor de Rubin CPX no se limita a la potencia bruta. NVIDIA la presenta como la respuesta a la era de las ventanas de contexto de millones de tokens, fundamentales para el futuro de la IA generativa. Con la ayuda de Spectrum-X Ethernet, el sistema promete escalar sin cuellos de botella y al mismo tiempo ofrecer un retorno de inversión entre 30 y 50 veces, una cifra tan ambiciosa como provocadora.
Sin embargo, este ritmo vertiginoso trae consigo cuestionamientos. Los ciclos de producto casi anuales ponen en entredicho la vida útil del hardware previo. Analistas advierten sobre una inminente ola de residuos electrónicos, ya que las empresas se verán presionadas a actualizar constantemente para no quedarse atrás.
Aun con las dudas, Rubin CPX es un movimiento estratégico contundente. Al priorizar la inferencia – una etapa que suele recibir menos atención frente al entrenamiento – NVIDIA refuerza su dominio en el mercado. Es un paso que podría marcar el inicio de una nueva era para la infraestructura de hardware de inteligencia artificial.