Conoce ChatGPT Images 2.0: ¿no te gusta la imagen? Dile a la IA qué te fastidia y la corregirá al instante

Conoce ChatGPT Images 2.0: ¿no te gusta la imagen? Dile a la IA qué te fastidia y la corregirá al instante

Edita imágenes con la voz: ya no hace falta regenerarlas desde cero.

image

OpenAI presentó ChatGPT Images 2.0 y dejó claro que la generación de imágenes ya no se reduce al esquema "escribiste la petición, obtuviste el resultado, volviste a empezar". Ahora la imagen se puede editar de manera secuencial en el mismo diálogo: cambiar detalles, reorganizar la escena y perfeccionar el resultado paso a paso sin reiniciar todo el proceso.

Los principales cambios afectan la precisión en la ejecución de instrucciones, el manejo del texto dentro del encuadre, la composición de escenas complejas y la idoneidad general del resultado para tareas aplicadas. En la descripción técnica OpenAI destaca por separado una comprensión más precisa de la petición, un trabajo más seguro con los detalles y un ensamblaje más estable de diseños complejos.

La nueva versión tiene dos modos: Instant y Thinking. El primero sirve para generaciones rápidas, cuando se necesita el resultado de inmediato. El segundo funciona más despacio porque dedica más tiempo a construir la escena y es más adecuado para tareas donde importan la secuencia y la coherencia de los detalles. En la ayuda de OpenAI se indica que el modo Thinking para imágenes está disponible en los planes de pago de ChatGPT al elegir los modelos Thinking y Pro, y que ChatGPT Images 2.0 está disponible en todos los planes.

La diferencia entre los modos no es solo la velocidad. Thinking es mejor para series de imágenes donde hay que mantener personajes, objetos y la lógica interna de la escena de un fotograma a otro. OpenAI muestra que el modelo maneja con más seguridad la narración visual en varios pasos, páginas de manga, guiones gráficos, hojas de personajes y otras series en las que los primeros generadores con frecuencia confundían el rostro del protagonista, la ropa y los detalles de la trama.

El cambio más notable afecta al propio proceso de trabajo. OpenAI ya no presenta la generación como una acción única por cada petición. El usuario puede refinar la imagen directamente en la conversación: acercar el área necesaria, cambiar elementos individuales, reorganizar la composición, conservar el contexto de las ediciones previas y continuar el trabajo sin volver constantemente a la versión inicial.

La empresa hace especial hincapié en los puntos donde los generadores antes fallaban con más frecuencia. Ante todo se trata del texto dentro de la imagen y de las lenguas que no usan la escritura latina. OpenAI afirma que Images 2.0 funciona notablemente mejor con la escritura japonesa, coreana, china, hindi y bengalí. Para carteles, maquetas de interfaz, cómics, materiales de juego y otras tareas similares, este es un cambio importante: el modelo empieza a manejar con más seguridad no solo la imagen, sino también las leyendas.

También hay actualizaciones que influyen directamente en el uso práctico. El modelo admite relaciones de aspecto desde 3:1 hasta 1:3, puede producir imágenes con resolución de hasta 2K y puede generar hasta ocho variantes en una sola ejecución. OpenAI dirige claramente el producto hacia un formato más orientado al trabajo, donde en una pasada se pueden obtener varias versiones para un banner, un póster, una pantalla vertical o una historia.

En el contexto de la competencia entre gigantes tecnológicos, ese paso es comprensible. La confrontación se desplaza cada vez más hacia la multimodalidad. OpenAI, según el lanzamiento de Images 2.0, hace una apuesta seria por las imágenes como el siguiente formato importante de trabajo con IA: el usuario no salta entre la búsqueda, el editor, el generador y la herramienta de diseño, sino que resuelve toda la cadena de tareas en una sola ventana.

La empresa ya lanzó ChatGPT Images 2.0 en la versión web de ChatGPT y, para desarrolladores, añadió en la API un nuevo modelo para la generación de imágenes. Formalmente OpenAI mostró otra actualización del generador, pero en el fondo la empresa impulsa un cambio más amplio: la imagen deja de ser una función secundaria dentro del chat y se convierte en uno de los formatos principales de trabajo con ChatGPT.