¿El siguiente paso? ¿Conspiraciones sin nuestra participación?
La empresa DeepMind, que forma parte de Google, está desarrollando una tecnología que podría simplificar y acelerar notablemente el proceso de aprendizaje de los robots y los sistemas de inteligencia artificial. Se trata del monólogo interior: un mecanismo que permite a los agentes de IA acompañar sus acciones y su percepción del entorno con comentarios textuales en lenguaje natural. Esta técnica ya ha sido patentada y podría cambiar radicalmente el enfoque de la enseñanza de las máquinas.
El nuevo método ha recibido el nombre oficial de “discurso interno del agente para facilitar el aprendizaje de tareas” (intra-agent speech to facilitate task learning). La esencia consiste en que la IA, al observar la ejecución de una tarea —a través de video o imágenes— formula en su interior una descripción verbal de lo que está ocurriendo. Por ejemplo, si el sistema ve a una persona levantar una taza, lo registra como “la persona toma la taza”.
Este enfoque permite vincular de forma eficaz la información visual con las acciones correspondientes. No se trata simplemente de una observación pasiva, sino de la formación activa de relaciones causa-efecto entre los objetos y el comportamiento.
La característica clave del sistema es su capacidad de adaptarse rápidamente a nuevas condiciones sin necesidad de entrenamiento adicional. El robot puede interactuar con objetos desconocidos y afrontar situaciones inusuales de inmediato, lo que ahorra tiempo y recursos, al menos en la fase de desarrollo.
Además, como destacan en DeepMind, esta tecnología reduce la carga de memoria y de procesamiento, lo cual resulta especialmente relevante para dispositivos autónomos o móviles.
Estos avances complementan iniciativas más amplias de la empresa en el ámbito de la robótica. Recientemente, DeepMind presentó Gemini Robotics On-Device, una solución compacta capaz de funcionar directamente en el robot sin necesidad de conexión permanente a servicios en la nube.
Este enfoque resulta especialmente útil en entornos con acceso limitado o no deseado a internet, como en el ámbito médico, donde la protección de datos es crucial. A pesar de su compacidad, Gemini Robotics On-Device demuestra una alta eficiencia. Según los desarrolladores, el modelo puede realizar tareas básicas “de fábrica”, y para aprender nuevas habilidades basta con solo 50 a 100 demostraciones. Esto acelera significativamente la adaptación a una plataforma específica.
Inicialmente, el sistema se entrenó en el robot ALOHA, desarrollado por Google, y posteriormente se adaptó a otras plataformas, incluido el humanoide Apptronik Apollo y el manipulador Franka FR3. La red neuronal ya ejecuta con confianza tareas como doblar ropa cuidadosamente o abrir cremalleras.
Si es necesario, se le puede enseñar nuevas acciones rápidamente mediante teleoperación —control manual del robot—. Además, existe la posibilidad de realizar pruebas preliminares en un simulador digital basado en el motor físico Multi-Joint dynamics with Contact. O bien, se puede ejecutar directamente en dispositivos reales.
Sin embargo, la versión autónoma también presenta vulnerabilidades. A diferencia de las soluciones híbridas o basadas en la nube, Gemini Robotics On-Device aún no cuenta con algoritmos integrados de filtrado semántico. La responsabilidad del comportamiento correcto recae completamente en los desarrolladores. En DeepMind recomiendan implementar previamente medidas de seguridad propias. Actualmente, solo grupos limitados de especialistas tienen acceso al sistema para evaluar su fiabilidad en condiciones reales.
Gracias al discurso interno, la IA recibe un contexto adicional que le ayuda a orientarse más rápidamente en situaciones nuevas y a seleccionar el comportamiento adecuado. Esto es especialmente importante para dispositivos que deben actuar en entornos complejos y dinámicos donde no es posible prever de antemano todas las situaciones posibles.
Aunque la tecnología aún se encuentra en fase de pruebas, el concepto de “monólogo interior” ya se considera un paso prometedor hacia la creación de androides y agentes autónomos más adaptativos e independientes.
Por cierto, paralelamente a esto, DeepMind también presentó otra innovación importante: un modelo de IA capaz de predecir el impacto de las mutaciones del ADN en el funcionamiento de los principales mecanismos de regulación del organismo.