De GPT a o3: la inteligencia artificial aprende a pensar de una manera nueva

De GPT a o3: la inteligencia artificial aprende a pensar de una manera nueva

OpenAI ha creado un sistema que resuelve el test ARC-AGI tan bien como un humano.

image

El 20 de diciembre, el nuevo sistema de inteligencia artificial de OpenAI llamado o3 alcanzó un hito importante. Al realizar el test ARC-AGI, que mide el nivel de razonamiento, el modelo obtuvo un 85%, el mismo puntaje promedio que logran los humanos. Además, o3 superó brillantemente complejas tareas matemáticas.

Hasta ahora, el mejor resultado entre desarrollos similares no superaba el 55%. Muchos investigadores consideran que o3 representa un avance significativo hacia la creación de una inteligencia general artificial (AGI), aunque los escépticos siguen cuestionando la relevancia de este logro.

Es importante comprender las particularidades del test ARC-AGI. Su indicador principal es la "eficiencia de muestreo", es decir, la capacidad de adaptarse a nuevas condiciones con un mínimo de ejemplos. En términos simples, el test evalúa cuántos ejemplos de una nueva situación se necesitan para captar el principio de su funcionamiento.

Las modernas modelos de lenguaje como ChatGPT, basadas en GPT-4, no destacan por una alta eficiencia de muestreo. Durante su entrenamiento, procesan millones de fragmentos de textos humanos y, a partir de ellos, generan las combinaciones de palabras más probables. Este método funciona bien en tareas típicas, pero falla en situaciones atípicas debido a la falta de ejemplos similares en la base de datos.

Por ahora, la inteligencia artificial solo puede usarse en tareas repetitivas o donde los errores no tengan consecuencias graves. El principal problema es que los modelos no pueden aprender rápidamente ni adaptarse a nuevas circunstancias.

La capacidad de encontrar soluciones correctas a problemas desconocidos basándose en un conjunto limitado de datos se conoce como generalización. En la comunidad científica, esta habilidad se considera un rasgo necesario y fundamental de la inteligencia. El test ARC-AGI incluye tareas con cuadrículas de cuadrados, similares a pruebas de coeficiente intelectual escolar. En la pantalla aparecen dos imágenes: un patrón inicial y un ejemplo del estado final al que debe llegar después de ciertas manipulaciones. El programa debe comprender la lógica de la transformación.

Cada tarea incluye tres ejemplos de entrenamiento. Tras analizarlos, el algoritmo debe deducir las reglas y aplicarlas en la práctica. Este enfoque permite evaluar qué tan rápido se adapta el modelo.

Al buscar patrones, es crucial evitar suposiciones innecesarias o detalles excesivos. En teoría, si se encuentran las reglas más simples necesarias para resolver el problema, el programa podrá adaptarse mejor a nuevas situaciones.

"Reglas simples" suelen poder describirse con frases cortas. Por ejemplo, en una tarea con una cuadrícula de cuadrados, la regla podría ser: "La figura con una línea saliente se moverá hacia el final de esa línea y cubrirá todas las figuras en su camino".

Aún no se sabe exactamente cómo funciona o3, pero es poco probable que haya sido entrenado específicamente para buscar "reglas simples". OpenAI utilizó como base una versión universal del modelo, capaz de reflexionar más tiempo sobre problemas complejos, y luego lo entrenó adicionalmente para superar el test ARC-AGI.

El investigador francés de IA François Chollet, creador del test, sugiere que o3 evalúa diferentes "cadenas de razonamiento", es decir, secuencias de pasos para alcanzar un objetivo. Luego selecciona la mejor opción basándose en ciertas reglas o pistas.

Sin embargo, aún es temprano para afirmar cuánto nos acerca esto a la creación de AGI. Los mecanismos básicos de procesamiento del lenguaje podrían seguir siendo los mismos, aunque ahora estén más optimizados para resolver un tipo específico de tareas.

OpenAI mantiene casi toda la información sobre su desarrollo en secreto. La empresa se ha limitado a algunas presentaciones para los medios y ha permitido que solo ciertos investigadores, laboratorios y organizaciones dedicadas a la seguridad en IA prueben o3.

¿Estás cansado de que Internet sepa todo sobre ti?

¡Únete a nosotros y hazte invisible!