Tu vergüenza en Slack ya tiene precio: empresas venden conversaciones a desarrolladores de IA para saldar deudas

Tu vergüenza en Slack ya tiene precio: empresas venden conversaciones a desarrolladores de IA para saldar deudas

Empresas reciben hasta 100.000 dólares por ceder tareas de Jira y correos en Google Drive.

image

Los antiguos intercambios laborales, que antes acumulaban polvo en los archivos, se convirtieron inesperadamente en mercancía. Empresas que cierran sin mucho ruido empezaron a ganar dinero con sus chats, correos y tareas, vendiéndolos a desarrolladores de inteligencia artificial.

Cuando Shanna Johnson cerró el servicio de transcripción y subtítulos cielo24, se topó con un activo inesperado. No se trataba de código o clientes, sino de los «rastros digitales» acumulados durante años: conversaciones en Slack, tareas en Jira, correos y documentos en Google Drive. El cierre de la empresa lo facilitó la startup SimpleClosure. Tras liquidar a los empleados y presentar los documentos en la Agencia Tributaria de EE. UU., llegó una etapa inusual: la venta de todos esos datos.

En 13 años de actividad cielo24 acumuló un enorme volumen de materiales internos, y lograron venderlo por «cientos de miles de dólares». Según Johnson, la operación permitió cerrar el negocio sin deudas y concluir los asuntos con tranquilidad. Las emociones por el cierre no desaparecieron, pero la idea de que esos datos pudieran ser útiles para otros alivió un poco la situación.

Esta historia deja de ser una excepción. En 2026 los datos internos de empresas cerradas se convirtieron en un nuevo recurso en la carrera por la tecnología de inteligencia artificial. Si antes los modelos se entrenaban con fuentes abiertas como foros, enciclopedias y libros, hacia finales de 2024 ese caudal se había agotado en gran medida. Así lo señaló el ex investigador jefe de OpenAI Ilya Sutskever. Además, esos datos públicos suelen ser insuficientes para crear sistemas capaces de realizar tareas reales.

En cambio, la «cocina» interna de las empresas —con procesos reales, errores y comunicación informal— resultó mucho más valiosa. Los desarrolladores comprendieron que, para enseñar a los sistemas a trabajar, hacen falta ejemplos del trabajo real, con todo su desorden.

La demanda fue tan alta que rápidamente surgió un mercado. SimpleClosure lanzó la plataforma Asset Hub, donde se pueden vender archivos de código, conversaciones y otros materiales. En el último año la empresa realizó alrededor de cien operaciones y devolvió a los fundadores más de 1 millón de dólares. Normalmente se trata de sumas de entre 10.000 y 100.000 dólares por empresa.

Competidores como Sunset operan con el mismo modelo. El precio depende del tamaño del negocio, su antigüedad y la «densidad» de los datos. Por ejemplo, una tarea en Jira vinculada a un cambio específico en el código vale más que un documento aislado. Especialmente caros son los datos procedentes de la medicina y las finanzas.

Sin embargo, esta práctica plantea serias dudas sobre la privacidad. Mark Rotenberg, fundador del Center for AI and Digital Policy, considera que el hecho de que los empleados hayan cedido derechos sobre materiales de trabajo no significa que hayan consentido la venta de su correspondencia personal a terceros. Es difícil pensar que la gente imaginara que los mensajes de Slack podrían formar parte de conjuntos de datos de entrenamiento. La organización de Rotenberg ya se dirigió al Comité de Comercio del Senado de EE. UU. para instar a la Comisión Federal de Comercio a investigar las nuevas prácticas en el ámbito de la inteligencia artificial y evaluar cómo protegen los datos personales.

Incluso cuando las empresas aseguran que anonimizaron los datos, en la práctica ese proceso está lejos de ser perfecto. Eliminar por completo la información personal de correspondencia acumulada durante años resulta extremadamente difícil. Los errores pueden provocar que información sobre personas o empresas «afloren» en las respuestas del sistema.

El riesgo lo respaldan trabajos científicos. En 2020 investigadores de OpenAI y Google mostraron que los grandes modelos de lenguaje pueden memorizar fragmentos de los datos de entrenamiento de forma literal y reproducirlos ante determinadas consultas.

En medio del auge, crece otra dirección: los llamados entornos de entrenamiento para aprendizaje por refuerzo. En esos «simuladores de oficinas» los sistemas aprenden a realizar tareas imitando el trabajo de empleados. Según The Information, Anthropic contempla invertir hasta 1.000 millones de dólares en esos proyectos. Ya hay decenas de startups en el mercado, y la valoración de algunas alcanza cientos de millones de dólares.

Un ejemplo es la empresa AfterQuery, que vende «mundos» digitales listos para el entrenamiento. En esos escenarios la sistema puede, por ejemplo, planear una fiesta de cumpleaños para un colega, intercambiar mensajes con «compañeros» y resolver tareas típicas de oficina, incluidas incidencias imprevistas.

Al final, los chats laborales habituales, que antes parecían rutina, se convierten en un recurso valioso. La ironía es que esas conversaciones pueden sobrevivir a la propia empresa y acabar formando parte de sistemas futuros. No obstante, queda el riesgo de que, si un modelo memoriza demasiado, llegue a reproducir la historia laboral de otra persona junto con nombres y detalles.