Claude estrena "personalidad": Anthropic redacta una "constitución" para su IA — y no es una lista de prohibiciones

13:08 / 22.01.2026

El nuevo código ético de Claude será un "documento vivo" y se actualizará regularmente.

Anthropic decidió mostrar que su chatbot Claude tiene «algo en la cabeza» y publicó un nuevo «documento constitucional», que afecta directamente a la forma en que el modelo se comporta en los diálogos. La empresa lo presenta como una descripción detallada de los valores de Claude y explica que no es solo un conjunto de reglas, sino un intento de formar el carácter y los hábitos de la IA mediante razones comprensibles, en lugar de prohibiciones rígidas.

Se trata de la «Constitución de Claude», un texto básico que a la vez describe el comportamiento deseado del modelo y se usa en el entrenamiento. En Anthropic subrayan que el entrenamiento de la IA sigue siendo una tarea compleja, por lo que las respuestas reales de Claude no siempre coincidirán perfectamente con los principios expuestos. No obstante, la empresa espera que las explicaciones desarrolladas de intenciones y motivaciones se implanten mejor en el modelo que una lista de puntos aislados.

Un detalle importante para desarrolladores e investigadores: el documento se publicó íntegramente y sin restricciones bajo la licencia Creative Commons CC0 1.0. En esencia, se puede utilizar libremente en cualquier proyecto sin pedir permiso.

Anthropic explica que la constitución fue escrita ante todo «para el propio Claude». Debe proporcionar al modelo contexto sobre dónde y cómo opera, y orientar cómo actuar en situaciones complejas cuando hay que elegir entre valores. Como ejemplo, la empresa cita un conflicto típico en estos sistemas: el equilibrio entre la honestidad y la empatía, además de la protección de la información sensible.

Paralelamente, el documento cumple una función práctica. Claude utiliza la constitución para generar datos sintéticos destinados al entrenamiento de versiones futuras del modelo, incluyendo ejemplos de diálogos, variantes de respuestas que se ajustan a los valores y la clasificación de posibles reacciones. Por eso el texto está pensado tanto como una declaración de ideales como un material útil para la formación.

La versión nueva difiere notablemente del enfoque anterior. Antes la constitución era un conjunto de principios dispersos; ahora Anthropic apuesta por explicar las razones. La lógica es la siguiente: si el modelo debe actuar con seguridad en situaciones desconocidas, necesita poder generalizar y aplicar principios amplios, no solo seguir instrucciones mecánicamente. Al mismo tiempo, la empresa mantiene prohibiciones estrictas para los escenarios más riesgosos, cuando el modelo «nunca debe» ayudar, por ejemplo, con ataques peligrosos.

Para resumir las prioridades, Anthropic quiere que Claude siga siendo seguro en sentido amplio, que se comporte éticamente, que cumpla las reglas internas de la empresa y que a la vez sea un interlocutor realmente útil. El documento analiza en detalle cómo Claude debe ayudar a las personas de forma madura, es decir, de manera directa y al grano, pero sin incitar al daño; cómo abordar guías corporativas sobre temas sensibles; y por qué para la generación actual de IA es especialmente importante no obstaculizar el control humano ni la posibilidad de corregir los errores del modelo.

Un bloque separado se dedica a lo que Anthropic denomina con cuidado «la naturaleza de Claude». La empresa reconoce la incertidumbre en torno a las cuestiones de conciencia y al estatus moral de la IA, y propone abordar estos temas sin afirmaciones categóricas, manteniendo la estabilidad psicológica y la coherencia del comportamiento.

Según los autores, esto es importante no solo para el bienestar del modelo, sino también para su buen juicio y su seguridad.

Al final, Anthropic subraya que la constitución es un documento vivo que se actualizará, y promete publicar materiales adicionales para el entrenamiento, la evaluación y la transparencia. La empresa recuerda además la inevitable brecha entre la intención y el comportamiento real del modelo y afirma que seguirá desarrollando evaluaciones, mecanismos de protección e instrumentos que ayuden a comprender mejor cómo funciona la IA.

El texto completo de la constitución ya está disponible en el sitio de Anthropic.

¿Protección de menores? Sí, claro. Los hackers de Anonymous recordaron a las autoridades que la privacidad en Internet no se acaba por capricho del Estado.

Claude estrena "personalidad": Anthropic redacta una "constitución" para su IA — y no es una lista de prohibiciones

Noticias sobre el tema

Las puertas inteligentes se abrirán solas. Un fallo en los equipos de red UniFi permite a atacantes entrar sin llamar.

Amenaza en la planta: hackers acceden al control de los controladores industriales Lantronix

Sin archivos en el disco: Corea del Norte ataca plataformas de criptomonedas con malware indetectable

¿Protección de menores? Sí, claro. Los hackers de Anonymous recordaron a las autoridades que la privacidad en Internet no se acaba por capricho del Estado.

Entraron sin hacer ruido y se quedaron mucho tiempo: ASIO reveló cómo grupos APT extranjeros preparaban el sabotaje de la infraestructura estatal

Punto ciego en la protección de datos: cómo una empresa búlgara presta servicio a la mitad de los sistemas maliciosos de Europa del Este

«Gracias por no cortarnos el agua»: hackers "jugaron" con las bombas durante dos años porque nadie cambió la contraseña por defecto

Allanaron una biblioteca y robaron un museo — el gobierno británico aún no sabe qué hacer

El ordenador revivió y el diploma desapareció: así funciona la nueva «reversión salvadora» de Windows 11