OpenAI lanzó oficialmente ChatGPT 5 — el nuevo modelo predeterminado en el propio ChatGPT y toda una línea de GPT‑5 en la API. Bajo el capó hay un sistema unificado con un enrutador que decide por sí mismo si responder rápido o «pensar» más tiempo, y como resultado hay notablemente menos alucinaciones y más funcionalidades útiles: código, textos, salud, multimodalidad. Más abajo analizamos qué cambió exactamente, cuánto cuesta y para quién sirve todo esto. Noticia oficial, página de presentación, notas de la versión.
Qué es GPT‑5 y en qué se diferencia
GPT‑5 no es una sola modelo, sino un sistema unificado: una pista de modelo «principal» rápida para consultas habituales, la pista «pensante» GPT‑5 Thinking para tareas complejas y un enrutador real que cambia de modo según el contexto y su intención (incluso mediante una instrucción explícita «piensa a fondo» en el prompt). En ChatGPT esto funciona en segundo plano, y en la API elige por separado las variantes necesarias. La idea es simple: menos trabajo manual para elegir modelo y más calidad donde no basta con respuestas inmediatas. La ficha del sistema describe la arquitectura y el comportamiento del enrutador.
En la práctica esto significa un aumento notable de precisión: en métricas recientes como AIME‑2025 (matemáticas), SWE‑bench Verified (tareas reales de desarrollo), MMMU (multimodalidad) y HealthBench (medicina) GPT‑5 muestra resultados de estado del arte, y no solo «ligeramente mejores». Y se nota en el uso cotidiano —desde correos y reportes hasta consultas complejas con cadenas de herramientas. Detalles y cifras.
Mejoras clave (y por qué le importan)
Menos alucinaciones y menos complacencia. GPT‑5 se equivoca en hechos aproximadamente un 45% menos que GPT‑4o, y en el modo «pensante» reconoce las limitaciones con mayor honestidad en lugar de «fingir» que logró una solución. La ficha del sistema dedica un apartado a reducir la «deception» en tareas con archivos/imágenes faltantes, herramientas rotas, etc. —se registra una caída en la proporción de respuestas engañosas de ~4.8% en o3 a ~2.1% en GPT‑5 Thinking.
Redacción y creatividad. El modelo mantiene mejor el estilo y la forma (incluso verso libre y ritmos complejos), capta con más precisión contextos culturales y evita lugares comunes. Sí, es subjetivo, pero las comparaciones de respuestas 4o vs 5 en el blog resultan convincentes.
Código y «agencia». GPT‑5 rinde más en frontend, es más estable en largas cadenas de herramientas y sigue instrucciones con mayor exactitud: menos pérdida de contexto, menos pasos omitidos en tareas largas y mejor manejo de errores de herramientas. Para tareas reales de backend/frontend esto implica menos microgestión del prompt y más resultados «a la primera».
Salud. En HealthBench (incluyendo el conjunto «Hard») GPT‑5 obtiene la puntuación más alta entre los modelos de OpenAI. Importante: el modelo no sustituye a un médico, pero ayuda mejor a formular preguntas, matizar riesgos y comprender resultados de pruebas.
Qué hay de nuevo dentro de ChatGPT
Lo principal: GPT‑5 pasó a ser el modelo predeterminado para todos los usuarios con sesión iniciada; además hay un selector para GPT‑5 Thinking y GPT‑5 Pro en los planes de pago. Aparecieron personalidades (Cynic, Robot, Listener, Nerd), acentos de color en la interfaz, el modo de estudio y actualizaciones notables en Voz. Dicho de forma simple: ChatGPT es más flexible y «humano», pero también más controlable. Consulte las notas de la versión.
- Despliegue y disponibilidad: GPT‑5 se está activando progresivamente en los planes Free/Plus/Pro/Team; Enterprise/Edu están en camino. En Team ya está disponible; para Enterprise/Edu se prometió activación a mediados de agosto.
- Voz: por ahora funciona con GPT‑4o (sí, sigue siendo un montaje mixto).
- Conectores y búsqueda: los conectores de búsqueda en chat y de «deep research» se amplían, pero en algunas integraciones hay restricciones regionales (EEE, Suiza, Reino Unido). Detalles en las notas.
Para desarrolladores: GPT‑5 en la API
En la API puede elegir el tamaño según la tarea: gpt‑5, gpt‑5‑mini y gpt‑5‑nano. Es la versión orientada a desarrolladores con foco en código y escenarios con agentes; difiere de la capa «no resonante» en ChatGPT (para eso existe gpt‑5‑chat‑latest). Aparecieron nuevos controles: reasoning_effort con el modo minimal (responder más rápido, «pensando» menos) y el parámetro verbosity (low/medium/high) para controlar la extensión de la respuesta. Además hay «custom tools» que aceptan plaintext en lugar de JSON si resulta más cómodo para el entorno. Anuncio para desarrolladores.
Contexto y límites
En la API, toda la línea GPT‑5 tiene contexto total de hasta 400K tokens: máximo ~272K en entrada y hasta 128K en salida (incluyendo «reasoning tokens»). Eso ya alcanza para repositorios voluminosos, investigaciones largas o documentos jurídicos grandes dentro de una sola ventana de contexto.
Precios
- GPT‑5: entrada $1.25 por 1M tokens (cached — $0.125), salida $10 por 1M tokens.
- GPT‑5 mini: entrada $0.25 (cached — $0.025), salida $2.
- GPT‑5 nano: entrada $0.05 (cached — $0.005), salida $0.40.
Consulte siempre los precios vigentes en la página de Pricing; allí también hay detalles sobre Batch API (‑50% en coste) y procesamiento prioritario.
Rendimiento y casos de uso
- Código: 74.9% en SWE‑bench Verified y 88% en Aider Polyglot; mejor generación frontend y colaboración con herramientas (Cursor, Windsurf, Copilot, y otras).
- Agencia y llamadas a herramientas: nuevos récords en τ²‑bench telecom, cadenas largas de acciones estables y explicaciones precisas entre invocaciones de herramientas.
- Contexto largo: mejor extracción de hechos y correferencia en benchmarks internos (OpenAI‑MRCR, BrowseComp LC).
Seguridad: de los «rechazos estrictos» a las safe‑completions
En lugar de insistir en «rechazar/ejecutar», OpenAI entrena a GPT‑5 para ofrecer respuestas lo más útiles pero seguras posible dentro de la «zona verde». Esto es especialmente importante en temas duales (biología, ciberseguridad), donde se puede ayudar y al mismo tiempo causar daño. En el blog se muestran casos ilustrativos: o3 a veces «exageraba» y ofrecía instrucciones demasiado concretas, mientras que GPT‑5 limita la detallación de forma adecuada y propone alternativas seguras (normas, manuales, listas de verificación). Investigación sobre safe‑completions.
La ficha del sistema registra otros efectos: descenso de la «sycophancy» (complacencia), mejoras en la honestidad (explicitar «no puedo hacer esto aquí») y un comportamiento más predecible ante dependencias o recursos faltantes. Para producción esto reduce el riesgo de «errores confiados» y facilita la auditoría de decisiones (incluido el monitoreo de cadenas de razonamiento). Ficha del sistema GPT‑5.
Disponibilidad y hoja de ruta
- ChatGPT: GPT‑5 es el nuevo modelo predeterminado para todos los usuarios con sesión iniciada; los selectores para GPT‑5 Thinking/Pro están en los planes de pago. El despliegue comenzó el 7 de agosto de 2025 y continuará por regiones.
- Planes de equipo y corporativos: ChatGPT Team ya usa GPT‑5; Enterprise y Edu recibirán la actualización en los próximos días (el anuncio aparece en la página de presentación).
- Modo de voz: temporalmente sigue en GPT‑4o; la actualización se promete para más adelante.
Quién obtiene más con la actualización
- Ingenieros y creadores de interfaces sin código: generación frontend con mejor gusto, cadenas de herramientas más estables y razonamientos mínimos rápidos cuando hace falta simplicidad y velocidad.
- Analistas y autores: mejora del estilo, la estructura y el trabajo con fuentes largas (investigaciones, reportes).
- Tareas con alto riesgo de errores factuales: búsqueda y síntesis con menos alucinaciones, además de rechazos más honestos cuando el entorno impide completar la tarea.
- Autogestión médica: formula preguntas al médico con más cuidado y aporta marcos, pero recordemos: no es una consulta médica.
Limitaciones y sentido común
Sigue siendo un modelo de lenguaje: puede equivocarse, especialmente sin herramientas ni referencias claras. En algunas categorías de seguridad el modo «principal» aún se ajusta (ver regresiones en las tablas de la ficha del sistema), y Voz funciona por ahora con 4o. Si construye un producto, incluya verificación de hechos y supervisión de cadenas de agentes: en GPT‑5 hay salvaguardias básicas, pero la responsabilidad sigue siendo suya.
Conclusión
GPT‑5 es un paso no tanto «sobre el CI», sino sobre la confiabilidad y la idoneidad para el trabajo: más inteligente según métricas, más honesto en situaciones complejas, más barato y más gestionable en la API. Si ya usaba 4o/o3, la transición resulta natural: menos ajustes manuales, más resultado por el principio «puse la tarea, obtuve el resultado». Y si está mirándolo por primera vez, este es un buen momento: ChatGPT volvió a ser notablemente más útil por defecto.