El sistema de diagnóstico trabajó con tanta intensidad que rápidamente se salió de control.

Incluso los archivos de servicio a veces pueden convertirse en una carga notable para el hardware si un programa los escribe sin medida, y precisamente con ese problema se encontraron los usuarios de OpenAI Codex. En el agente para programación se detectó un error en los registros de diagnóstico locales: Codex escribe datos en el SSD con demasiada frecuencia y así acelera el desgaste de las unidades de almacenamiento.
El problema fue descrito por el desarrollador Rui Fan, miembro del comité de Apache Flink. Según él, en 21 días de funcionamiento el SSD principal escribió alrededor de 37 TB de datos, y la comprobación mostró que la principal fuente constante de escritura eran los registros SQLite de Codex. A esa velocidad, el volumen anual podría alcanzar aproximadamente 640 TB.
Para los discos de estado sólido ese volumen es importante, porque la vida útil de los SSD a menudo se mide en TBW, es decir, en la cantidad de terabytes que se pueden escribir antes de agotar el recurso declarado. En algunos modelos para consumidores ese indicador ronda los 600 TBW para la versión de 1 TB, por lo que incluso un año con esa carga puede acercar al disco al límite de la garantía.
Los usuarios también empezaron a evaluar el daño financiero por las escrituras innecesarias. Uno de los desarrolladores presentó un cálculo según el cual su Samsung 990 2 TB NVMe perdió alrededor de $38,64 en coste estimado del recurso. En la misma discusión apareció la estimación de que de marzo a junio el error podría haber consumido el recurso de los SSD de los usuarios por un monto de varios millones de dólares, pero se trata precisamente de un cálculo basado en el modelo del coste por terabyte escrito, y no de pagos confirmados ni de averías.
OpenAI confirmó que los ingenieros conocen el problema y ya están trabajando en la corrección. Según la compañía, los registros sirven para diagnosticar errores, y los datos permanecen en el dispositivo si el usuario no los envía en un informe. La falla surgió por el volumen demasiado alto de información que Codex guardaba, de modo que la carga sobre el disco resultó mucho mayor de lo esperado.
El problema, según la discusión, está relacionado con los cambios de febrero, cuando los registros SQLite del servidor comenzaron a escribirse en el nivel detallado TRACE. Ese modo registra más eventos que el registro habitual de errores, por lo que, en una implementación defectuosa, se convierte rápidamente en un flujo constante de operaciones de escritura. OpenAI ya está introduciendo correcciones; sin embargo, los usuarios siguen reportando nuevos casos de actividad excesiva de Codex en el disco.