300 terabytes de música en torrents: Anna’s Archive crea un clon clandestino de Spotify

300 terabytes de música en torrents: Anna’s Archive crea un clon clandestino de Spotify

Anna’s Archive anuncia el lanzamiento de un archivo con decenas de millones de canciones.

image

La biblioteca en la sombra Anna's Archive declaró, que logró masivamente "hacer una copia" del catálogo musical de Spotify y planea repartirlo en forma de torrents con un volumen total de alrededor de 300 TB. En Spotify dicen que ya investigan el incidente y verifican hasta qué punto llegó el acceso no autorizado.

Según Anna's Archive, el proyecto está organizado como un "archivo para preservar la música": el equipo habría reunido 86 millones de las pistas más demandadas, lo que, según se afirma, cubre aproximadamente el 99,6% de todas las reproducciones en Spotify. Al recopilar, priorizaron las composiciones que la plataforma considera populares. En la primera fase el grupo ya publicó un torrent separado con la base de metadatos —se trata de datos sobre aproximadamente 256 millones de pistas y 186 millones de códigos ISRC únicos, que se usan en la industria para identificar grabaciones.

Spotify confirmó el propio hecho de la investigación y describió el esquema que ahora se revisa: según un portavoz de la empresa, una tercera parte recopiló metadatos públicos y luego aplicó métodos ilegales para eludir DRM y acceder a parte de los archivos de audio. Al mismo tiempo la formulación de Spotify es cautelosa: la compañía no confirma la magnitud de la que habla Anna's Archive y subraya que solo se trata de «algunos» archivos de audio.

Un interés particular en esta historia lo despierta la estadística que el grupo pirata publica junto con el anuncio. Spotify tiene la «popularidad» de la pista —un indicador de 0 a 100 que calcula un algoritmo en función del número de reproducciones y su «frescura». Según Anna's Archive, este parámetro ayudó a establecer la cola de descarga y a elegir qué pistas conservar en mejor calidad en primer lugar.

Se afirma que para las pistas con popularidad superior a cero se logró extraer casi todo, conservando la calidad original de Spotify (OGG Vorbis alrededor de 160 kbit/s). En cambio, las grabaciones menos solicitadas, que en conjunto representan aproximadamente la mitad de las reproducciones, supuestamente las recodificaron a OGG Opus a aproximadamente 75 kbit/s para reducir el tamaño total del archivo. El grupo también reconoce que la «larga cola» del catálogo, donde la popularidad es cero, casi no la tocaron: según su estimación, a esas pistas corresponde una proporción mínima de reproducciones, y entre ellas hay mucho contenido dudoso, incluidas generciones de IA difíciles de filtrar.

Incluso si se llama al proyecto «preservación del patrimonio cultural», jurídicamente suena como la historia clásica de extracción masiva de datos y posterior distribución de contenido protegido. Eso casi con toda seguridad viola los términos del servicio y los derechos de autor, por lo que a continuación pueden exigirse eliminar las distribuciones y tomar medidas más duras por parte de los titulares de derechos. Además, un conjunto tan grande de música y metadatos teóricamente podría convertirse en la base para servicios pirata de streaming alternativos o utilizarse para entrenar modelos —exactamente igual que las colecciones «en la sombra» de libros que ya en varias ocasiones estuvieron en el centro de disputas sobre la IA y el consentimiento de los autores.

Tu privacidad está muriendo lentamente, pero nosotros podemos salvarla

¡Únete a nosotros!