Meta ha creado un sistema de protección contra clones de voz.
La compañía Meta* ha desarrollado una nueva tecnología llamada AudioSeal, que permite incrustar señales ocultas, conocidas como marcas de agua, en grabaciones de audio generadas por inteligencia artificial. Este sistema está diseñado para ayudar en la detección de contenido creado por IA en Internet y combatir el creciente problema de la desinformación y el fraude mediante herramientas de clonación de voz.
Hadi Elsahar, investigador de Meta, afirma que AudioSeal es la primera herramienta capaz de identificar con precisión qué partes de una grabación de audio, como un podcast, podrían haber sido creadas por IA.
Sin embargo, hay varias reservas importantes. Meta aún no planea aplicar marcas de agua al audio creado con sus herramientas de IA. Las marcas de agua de audio aún no se han generalizado, y no existe un estándar industrial unificado. Además, las marcas de agua para contenido generado por IA suelen ser fácilmente falsificables o eliminables.
La detección rápida y la capacidad de identificar con precisión qué elementos de un archivo de audio fueron creados por IA son cruciales para la utilidad del sistema, dice Elsahar. Su equipo ha logrado entre un 90% y un 100% de precisión en la detección de marcas de agua, lo que es significativamente mejor que los intentos anteriores.
AudioSeal está disponible gratuitamente en GitHub. Cualquiera puede descargarlo y usarlo para agregar marcas de agua a clips de audio generados por IA. En el futuro, podría integrarse con modelos de generación de voz por IA para aplicarse automáticamente a cualquier voz creada con su ayuda.
AudioSeal fue generado usando dos redes neuronales. La primera genera señales especiales de marca de agua que se pueden incrustar en pistas de audio. Estas señales son completamente indetectables para el oído humano, pero pueden ser rápidamente detectadas por la segunda red neuronal. A diferencia de los métodos existentes, que requieren verificar audio por segmentos de un segundo para detectar marcas de agua, lo que es extremadamente lento y laborioso, AudioSeal funciona de manera diferente. El sistema incrusta la marca de agua a lo largo de toda la pista de audio, distribuyéndola de manera uniforme. Esto hace que la marca de agua sea "localizable" y pueda detectarse incluso si el archivo de audio ha sido recortado, editado o si se han eliminado fragmentos.
Pero hay desventajas adicionales graves que deben superarse antes de que tales marcas de agua de audio puedan ser adoptadas de manera generalizada. Los investigadores de Meta han descubierto que cuanta más información se revela sobre el algoritmo de marca de agua, más vulnerable se vuelve. Además, el sistema requiere que las personas voluntariamente agreguen la marca de agua a sus archivos de audio.
A pesar de la popularidad de las soluciones de marca de agua en el sector tecnológico, algunos expertos son escépticos sobre si realmente aumentarán la confianza pública en la información debido a su vulnerabilidad a la eliminación y falsificación malintencionada.