Lo que no pudo pasar por el autobús abrió otra ruta.
En el contexto de la desaceleración de la ley de Moore y el aumento del consumo energético de los centros de datos, AMD se ha propuesto un objetivo ambicioso: mejorar la eficiencia energética de sus chips en 20 veces para 2030. Un paso clave hacia esto será la transición a la arquitectura rack-scale, es decir, el diseño de sistemas computacionales a escala de rack de servidor, en lugar de centrarse en chips individuales.
El vicepresidente senior de AMD, Sam Naffziger, señala que cuanto mayor es el dispositivo, mayor es su eficiencia. Esta lógica ya se ha implementado en la arquitectura de chiplets, que permitió a AMD superar las limitaciones de los fotomáscaras y lograr un alto rendimiento por vatio de energía. El punto culminante de esta evolución es la serie MI300, ensamblajes 3D densos que integran computación, entrada/salida e interconexiones en un solo paquete.
El siguiente paso será MI400, la primera plataforma completa de AMD en formato rack-scale. Utilizará su propia interfaz aceleradora UALink y competirá con las soluciones de Nvidia, que escalan GPUs hasta cientos de unidades por rack. En el futuro, AMD podría pasar de las conexiones de cobre a las fotónicas, que prometen mayor ancho de banda, aunque actualmente están limitadas por dificultades técnicas y el consumo energético de los láseres.
Sin embargo, la eficiencia energética no depende solo del hardware. AMD apuesta por una estrecha integración entre los niveles de hardware y software. La empresa está desarrollando activamente su plataforma ROCm, optimizándola para los marcos más populares — desde PyTorch hasta vLLM. Las adquisiciones de Nod.ai, Mipsology y Brium han fortalecido el desarrollo de software, y recientemente se unió al equipo Sharon Zhou, del startup Lamini.
AMD también está implementando soporte para formatos de datos pequeños como FP8 y FP4, que permiten reducir el consumo de energía sin perder calidad en la salida. Pero esto requiere tiempo: el soporte para FP8 en vLLM se logró casi un año después del lanzamiento del MI300X.
Para monitorear el progreso de su iniciativa «20x30», AMD utilizará un índice especial que tendrá en cuenta el rendimiento del GPU, el ancho de banda de la memoria HBM y de las redes — con diferentes ponderaciones para las tareas de entrenamiento e inferencia.
El enfoque en nuevas tecnologías de empaquetado, arquitecturas rack-scale y el desarrollo de software reflejan la estrategia de AMD para reducir el consumo energético en un contexto de rápido crecimiento de las cargas de trabajo de IA.