Conozca a su reemplazo: GEN-1, el robot que pliega cientos de camisetas sin fallos y no se cansa ni un instante

Conozca a su reemplazo: GEN-1, el robot que pliega cientos de camisetas sin fallos y no se cansa ni un instante

Un robot arma una caja en 12 segundos; una persona tarda 34 segundos. Bienvenidos al futuro.

image

Las redes neuronales aprendieron a escribir textos y generar imágenes, pero durante mucho tiempo todo con el mundo físico siguió siendo más difícil. El nuevo proyecto GEN-1 muestra que la situación empieza a cambiar: el modelo por primera vez llevó la ejecución de acciones sencillas a un nivel que se puede usar no en demostraciones, sino en trabajo real.

Los desarrolladores llaman a GEN-1 un sistema universal para el control de robots. El modelo recibe datos visuales y otros datos de entrada y enseguida emite acciones en tiempo real. En su base está la ampliación del enfoque que el equipo verificó anteriormente en la versión GEN-0. Entonces se demostró que el aprendizaje de robots obedece a las mismas leyes de escalado que los modelos de lenguaje: más datos y más cómputo producen un crecimiento predecible de la calidad.

En la nueva versión el efecto se hizo visible en la práctica. En varios problemas el nivel de éxito alcanzó aproximadamente el 99%. Para comparar, los modelos anteriores daban en promedio alrededor del 64%. Además, GEN-1 lo hace más rápido: en algunos escenarios el tiempo de ejecución se redujo casi tres veces. Detalle importante: para ajustar el modelo a una tarea concreta se requieren alrededor de una hora de datos de un robot real.

El modelo se entrenó con un conjunto de más de 500 000 horas de interacción con el mundo físico. Al mismo tiempo, el preentrenamiento básico no usa datos de robots. En su lugar se emplean grabaciones de acciones humanas obtenidas con dispositivos portátiles. Ese enfoque permite reducir drásticamente el coste del entrenamiento y no depender de caros conjuntos de datos telemétricos o de simulación.

GEN-1 no es solo un modelo, sino un sistema completo. Incluye mecanismos de preentrenamiento, ajuste fino, aprendizaje por refuerzo, indicaciones del humano y métodos específicos durante la inferencia. Todo ello junto aporta una mejora de la calidad que no se puede explicar exclusivamente por la arquitectura de la red.

Los desarrolladores introducen para la evaluación un nuevo concepto: «maestría». Se entiende como la combinación de tres parámetros: fiabilidad, velocidad y capacidad de adaptarse a situaciones inesperadas. Los dos primeros criterios son bien conocidos en la robótica industrial, pero allí se alcanzan mediante un control estricto del entorno. El nuevo enfoque apuesta no por limitar las condiciones, sino por el comportamiento del propio sistema.

La fiabilidad se ve de forma ilustrativa. En los experimentos el robot plegó camisetas decenas de veces seguidas sin intervención humana, atendió a un robot aspirador durante más de 200 ciclos y empaquetó objetos cientos o miles de veces. En tareas así, el sistema mantiene un resultado estable durante largos periodos, sin fallos ni correcciones manuales.

La velocidad sigue siendo una barrera aparte para la robótica. Al acelerar el movimiento cambian las fuerzas de fricción, aumenta la influencia de la inercia y los errores son más caros. GEN-1 muestra que esa barrera puede desplazarse. Por ejemplo, el montaje de una caja lleva unos 12 segundos en lugar de aproximadamente 34 segundos con soluciones anteriores. Un incremento similar se observa en otras tareas donde el trabajo preciso con objetos es importante.

El tercer componente es la adaptación. El modelo sabe corregir las acciones en tiempo real si la situación se aparta del escenario habitual. En los ejemplos el robot intercepta piezas desplazadas, cambia la forma de agarre o activa la segunda mano si la primera no puede con la tarea. Esas soluciones no se programaron directamente durante el entrenamiento; surgen en el funcionamiento.

El comportamiento del sistema cambia según las condiciones. En niveles altos de complejidad puede actuar de forma distinta que en escenarios sencillos y buscar rutas alternativas. Para tareas reales esto es crucial: el entorno rara vez coincide con un modelo ideal, y las secuencias rígidamente programadas fallan con rapidez.

A pesar del progreso, persisten limitaciones. No todas las tareas se pueden llevar al nivel del 99% de éxito, y para algunos escenarios se requiere aún mayor precisión y rapidez. Los desarrolladores esperan que un aumento adicional del volumen de datos y del cómputo permita cerrar esas lagunas y ampliar la lista de tareas disponibles.

Una cuestión aparte es el control del comportamiento del sistema. La capacidad de improvisar aporta flexibilidad, pero a la vez incrementa el riesgo de acciones indeseadas. Para la aplicación práctica no basta con enseñar al robot a actuar; también es necesario definir los límites dentro de los cuales no debe salirse de la tarea.

El trabajo con GEN-1 requirió una reestructuración seria de la infraestructura. El equipo adaptó el sistema de entrenamiento para trabajar con petabytes de datos, mejoró la estabilidad del entrenamiento, desarrolló nuevos métodos para acelerar la inferencia y creó hardware propio para la recopilación de datos. Paralelamente desplegaron una red de dispositivos en distintas regiones para obtener un conjunto más diverso de acciones físicas.