Empresas mediáticas piden mantener el acceso libre a los archivos de noticias.

El Internet está perdiendo gradualmente su memoria, y esto ocurre no por fallos o ataques, sino por la voluntad de los propios medios de comunicación. Cada vez más sitios prohíben ser archivados, por temor a que las publicaciones antiguas sirvan de alimento para los sistemas de inteligencia artificial.
Ya 23 grandes ediciones han prohibido al robot ia_archiver guardar copias de páginas en el servicio Wayback Machine, que mantiene Internet Archive. Entre esos sitios están USA Today y The New York Times. Lo paradójico es que algunas de esas mismas redacciones usan el archivo cuando preparan materiales.
Las redacciones temen que las empresas que trabajan con inteligencia artificial se aprovechen de las normas de uso legítimo y comiencen a entrenar modelos con las copias archivadas de los artículos. Ante el aumento de la información falsa y la tendencia de los modelos lingüísticos a inventar respuestas creíbles, el acceso a un registro verificado se vuelve especialmente importante.
Antes, la memoria la cumplían las bibliotecas y los archivos de las redacciones. Los periódicos conservaban colecciones encuadernadas, y cualquiera podía consultar publicaciones pasadas. Cuando los medios pasaron al entorno digital, esos archivos dejaron de actualizarse, y ahora la principal esperanza son los servicios en línea como Wayback Machine.
Legalmente, archivar páginas se considera permitido. Desde Electronic Frontier Foundation (EFF) recordaron que, sin copiar el contenido, no es posible crear índices de búsqueda. La jurisprudencia confirma que tales copias cumplen una nueva función: ayudan a encontrar información, realizar análisis y sacar conclusiones basadas en materiales ya publicados.
Las redacciones podrían conservar sus propios archivos, pero un archivo independiente cumple otra función. Los materiales en línea se pueden modificar retrospectivamente con facilidad, y un servicio externo permite fijar la versión original. Además, los archivos preservan las publicaciones de medios cerrados, que de otro modo se perderían sin dejar rastro.
Las preocupaciones sobre que la IA sea entrenada con textos ajenos son comprensibles. Pero si se prohibiera por completo archivar páginas, la sociedad resultaría perjudicada más de lo que, potencialmente, ganarían los desarrolladores. El responsable de Wayback Machine, Mark Graham, mantiene negociaciones con las redacciones para intentar restablecer el acceso del robot. Paralelamente, una coalición de periodistas y otros participantes del ecosistema mediático firmó una carta en apoyo de Internet Archive y de la idea del acceso libre al conocimiento.