OpenAI lanza su primer chip Jalapeño y advierte a Nvidia: la competencia se va a poner picante

OpenAI lanza su primer chip Jalapeño y advierte a Nvidia: la competencia se va a poner picante

OpenAI lanza su primer chip "Jalapeño" e insinúa a Nvidia que la competencia se va a poner picante

image

OpenAI decidió entrar más a fondo en el hardware y, junto con Broadcom, presentó su propio chip Jalapeño para el funcionamiento de grandes modelos de lenguaje en centros de datos. El circuito integrado no está destinado al entrenamiento de modelos, sino a la inferencia: la ejecución de una red neuronal ya entrenada, cuando ChatGPT, Codex o la API procesan la solicitud del usuario y generan una respuesta.

Jalapeño se convirtió en el primer procesador especializado de OpenAI para esa carga. La empresa ha dependido durante mucho tiempo de proveedores externos de aceleradores, principalmente de Nvidia, y la demanda de cálculo crece más rápido de lo que la industria puede construir nuevos centros de datos. El chip propio debería ayudar a OpenAI a obtener mayor control sobre la infraestructura: desde la arquitectura de los modelos y los núcleos de software hasta los bastidores de servidores, las redes y los productos finales.

Broadcom describe a Jalapeño como un circuito integrado especializado, un ASIC. A diferencia de los aceleradores generales, este tipo de microchip se diseña para un tipo de tareas concreto. En este caso, el chip se construyó desde cero pensando en la inferencia de grandes modelos de lenguaje: el procesamiento de tokens, la gestión de memoria, la transferencia de datos entre nodos y la lógica de servidor que requieren los servicios de IA interactivos con un gran flujo de solicitudes.

La inferencia se ha convertido en un punto crítico separado de la industria de IA. El entrenamiento de un modelo requiere enormes cálculos una o varias veces, mientras que la inferencia se activa cada vez que un usuario hace una pregunta, pide que se escriba código, lanza un agente o accede al modelo mediante la API. Cuanta más gente usa la IA, más importantes son no solo la potencia pico, sino también la latencia de respuesta, el consumo energético, el coste por solicitud y la estabilidad bajo carga.

OpenAI afirma que diseñó Jalapeño teniendo en cuenta su propia hoja de ruta de modelos y productos. No se consideró una carga neuronal abstracta, sino sistemas reales que la empresa despliega cada día: ChatGPT, Codex, la API y futuros productos con agentes, donde el modelo debe realizar varios pasos consecutivos, invocar herramientas y mantener el contexto de la tarea durante más tiempo.

El desarrollo duró nueve meses desde el diseño inicial hasta la entrega del diseño final a producción. Para microchips modernos de alto rendimiento, ese plazo parece muy corto. Broadcom atribuye la rapidez a la estrecha colaboración entre los equipos de hardware y software, a la experiencia de la empresa en proyectos de semiconductores y al uso de modelos de OpenAI en parte de las tareas de ingeniería relacionadas con el diseño y la optimización.

Jalapeño ya funciona en los laboratorios de aprendizaje automático a las frecuencias y consumos energéticos previstos. OpenAI indica que las muestras de ingeniería se ejecutaron también en cargas de GPT-5.3-Codex-Spark. Por ahora las compañías no revelan las especificaciones completas: no hay número de unidades de cómputo, volumen de memoria, ancho de banda, proceso tecnológico, coste, resultados exactos de las pruebas ni comparaciones con aceleradores concretos.

La principal promesa ahora está relacionada con el rendimiento por vatio. OpenAI declara que las primeras pruebas muestran una ventaja notable de Jalapeño frente al nivel avanzado actual, pero las mediciones finales aún continúan. Han prometido presentar un informe técnico detallado en los próximos meses. Hasta la publicación del documento, solo se puede evaluar el chip por el objetivo declarado: reducir los movimientos de datos innecesarios, equilibrar cómputo, memoria y red, y acercar la carga real del equipo a su máximo teórico.

Para los modelos de lenguaje, el movimiento de datos a menudo es tan importante como los propios cálculos. Al generar una respuesta, el sistema consulta continuamente la memoria, transmite resultados intermedios, distribuye el trabajo entre aceleradores y devuelve los datos. Si la arquitectura dedica demasiado tiempo y energía al transporte, parte de la potencia de cálculo queda sin uso. Jalapeño busca precisamente adaptarse a este cuello de botella: no solo añadir más operaciones por segundo, sino reducir las pérdidas entre cómputo, memoria y red.

En el proyecto Broadcom no solo se encarga de la implementación del silicio. La empresa aporta tecnologías de red y comunicación, incluidas soluciones de la familia Tomahawk, que son necesarias para escalar clústeres de servidores. En esos sistemas, un chip rara vez trabaja de forma aislada: miles de aceleradores deben intercambiar datos rápidamente, sincronizar la carga y evitar que la red se convierta en el principal freno de la plataforma.

En el proyecto también participa Celestica. Esta empresa ayuda con las placas, los bastidores, la integración del sistema y la preparación del equipo para el despliegue masivo. Para OpenAI no es importante un microchip aislado en la mesa del ingeniero, sino una plataforma de centro de datos lista: aceleradores, memoria, red, placas de servidor, bastidores, refrigeración, planificadores de tareas y la capa de software deben funcionar en conjunto.

OpenAI llama a Jalapeño el primer paso en una línea plurianual de aceleradores propios. La empresa no se limita a una sola versión del chip y espera ir cambiando gradualmente la arquitectura para adaptarla a nuevos modelos, productos y modos de trabajo. Ese enfoque debería reducir la brecha entre cómo están diseñados los futuros sistemas de IA y las cargas para las que se diseña el hardware.

La estrategia es clara: OpenAI quiere poseer una mayor parte de la pila tecnológica. Mientras la empresa sigue siendo un gran comprador de aceleradores de Nvidia, la potencia disponible depende de los suministros de Nvidia, AMD, socios en la nube, fabricantes de memoria y operadores de centros de datos. Un chip propio no elimina por completo esa dependencia, pero proporciona a OpenAI una palanca adicional en un entorno donde cada gran empresa de IA compite por recursos de cómputo limitados.

En el mercado, los principales actores tecnológicos ya aplican una lógica similar. Google desarrolla TPU, Amazon promueve sus aceleradores Trainium e Inferentia, Meta y Microsoft también invierten en hardware especializado para cargas de IA. La razón es una: las unidades de procesamiento gráfico generales siguen siendo potentes, pero son caras, se agotan rápidamente en contratos y no siempre ofrecen el mejor resultado en tareas concretas.

Para Broadcom, el proyecto con OpenAI continúa un cambio importante en su negocio. La empresa lleva tiempo suministrando chips y soluciones de infraestructura a grandes clientes, y el auge de la IA ha intensificado la demanda de microchips a medida para gigantes de la nube y equipos que construyen modelos avanzados. Cuanto más la industria pasa de experimentos a la explotación continua de servicios de IA, mayor es el valor del hardware diseñado para la economía específica de las solicitudes.

Los chips propios muestran que la lucha por la IA ya no se libra solo a nivel de modelos e interfaces. La velocidad de respuesta de ChatGPT, el coste de ejecutar Codex, la disponibilidad de la API y la resistencia de los servicios ante picos de demanda dependen cada vez más de cómo esté diseñado el centro de datos por dentro. Si a OpenAI le resulta posible reducir el coste y el consumo energético de la inferencia, el beneficio lo sentirán no solo los ingenieros de infraestructura, sino también los usuarios que esperan respuestas rápidas sin colas ni fallos.

Se planea desplegar los primeros chips Jalapeño en centros de datos antes de finales de 2026. Por ahora la principal pregunta del mercado es si pruebas independientes y detalladas confirmarán la ventaja declarada en rendimiento por vatio. Sin esas cifras, Jalapeño sigue siendo una señal importante de la estrategia de OpenAI, pero no una respuesta probada al dominio de Nvidia en la infraestructura de IA.