Un zumbido constante se eleva desde una antigua iglesia en San Francisco. Es el sonido, emitido por cientos de ventiladores que enfrían cientos de servidores informáticos, del pasado digital que se mantiene vivo. Este es Internet Archive, la colección más grande del mundo de páginas web archivadas y un recordatorio constante de la fragilidad de nuestro pasado digital. Es también, gracias a una decisión de marcha devant un tribunal fédéral, qui a conclu que les pratiques de prêt des archives violent les droits des éditeurs, juste un champ de bataille dans une lutte croissante qui définira comment la mémoire numérique collective de l’humanité est détenue, partagée et préservée – ou perdue hasta nunca.

Como científico de datos digitales, sé que no todas las pérdidas de datos (la corrosión y destrucción de nuestro pasado digital) son trágicas. Pero hoy, muchas pérdidas de datos ocurren de manera profundamente injusta y tienen implicaciones monumentales tanto para la cultura como para la política. Pocas organizaciones sin fines de lucro o bibliotecas digitales financiadas con fondos públicos pueden operar a la escala necesaria para democratizar verdaderamente el control del conocimiento digital. Lo que significa que las decisiones importantes sobre cómo se desarrollan estos problemas se dejan en manos de poderosas corporaciones con fines de lucro o líderes políticos con agendas. Comprender estas fuerzas es un paso fundamental para gestionar, mitigar y, en última instancia, controlar la pérdida de datos y, con ella, las condiciones en las que nuestras sociedades recuerdan y olvidan.

Desde las plataformas de transmisión que eliminan las transmisiones solo digitales de sus bibliotecas hasta los gobiernos que desfinancian sus sistemas bibliotecarios nacionales y los efectos de la centralización tecnológica, los datos están desapareciendo a un ritmo alarmante. Brewster Kahle, el fundador de Internet Archive, me dijo que debido a la presión del gobierno o simplemente a un error, los datos a menudo se borran a gran escala. Para las páginas web que se han eliminado, Internet Archive suele ser el único lugar para buscar.

Los editores tradicionales han demandado a los archivos por su práctica de prestar, por períodos breves, escaneos de sus libros (incluidos, para disgusto de los autores, títulos publicados recientemente). El tribunal dictaminó que los archivos deberían dejar de prestar libros con derechos de autor. Hay una apelación pendiente, pero si se confirma la decisión del tribunal, podría comprometer seriamente la capacidad de los archivos y organismos similares para defender el acceso público a la información contra la invasión de plataformas privadas, dijo Kahle.

Toda revolución tecnológica conlleva una pérdida. Sócrates advierte en Platón «Fedroque la invención de la escritura ha destruido la memoria, convirtiendo a las personas en «oidores de muchas cosas» que «no habrán aprendido nada». Más recientemente, la máquina de escribir ha hecho posible producir muchos más documentos, lo que genera serias preocupaciones sobre la cantidad de documentos perdidos, extraviados y extraviados. Las sociedades digitales de hoy se hacen eco de estos patrones históricos de pérdida, abandono y entropía. Pero también han entrado en escena nuevos actores y dinámicas. Las esferas públicas ahora existen precariamente a merced de las empresas de redes sociales. Y todos los días, empresas como Amazon, Alphabet y Meta extraen y capitalizan nuestros datos, los almacenan y monetizarlo bajo dudosas estructuras de consentimiento.

El hecho de que decisiones cruciales sobre la retención o destrucción de datos queden en manos de actores motivados por el lucro, aspiraciones autocráticas u otros fines egoístas tiene una enorme implicación no solo para los individuos sino también para la cultura en su conjunto.

Muchos casos de pérdida de datos tienen ramificaciones para la producción cultural, la escritura de la historia y, en última instancia, la práctica de la democracia. Algunos políticos, incluidos los que supervisan la financiación de los archivos digitales, tienen relaciones cuestionables con las mejores prácticas de mantenimiento de registros. funcionarios británicos han sido acusado en la corte gobierno por WhatsApp, confiando en aplicaciones de mensajería de auto-borrado para evitar la vigilancia y la rendición de cuentas. A escándalo similar envolvió al primer ministro danés en 2021.

Las empresas tecnológicas también tienen un historial de políticas de datos cuestionables, moderación de contenido y censura. Tienen sus propias motivaciones, incluido un modelo de negocio basado en generar diferentes sobres de datos y hardware y software. obsolescencia — y existen dentro de un complejo ecosistema político y regulatorio. Este ecosistema a menudo proporciona incentivos perversos para maximizar las ganancias mediante el almacenamiento selectivo de ciertos datos y para reducir las cargas regulatorias al eliminar el acceso a otros datos. Las comunidades marginadas pueden ser particularmente vulnerables. Durante las protestas de Black Lives Matter de 2020, algunos activistas acusado sitios de redes sociales como facebook censurar sus mensajes. Eliminación desproporcionada de contenido para adultos en la plataforma afecta a las comunidades queer. Y en zonas de conflicto, regímenes y sistemas de moderación de contenidos eliminar con frecuencia material que podría constituir evidencia crucial en las investigaciones de crímenes de guerra.

Muchas formas culturales ahora dependen casi por completo de los formatos digitales. Si bien las películas y la música alguna vez estuvieron disponibles para su compra en forma física, muchas ahora son solo digitales. Incluso los libros a veces solo se publican para lectores electrónicos. Esto otorga un enorme poder a las empresas en su mayoría con fines de lucro, incluidos los servicios de transmisión y las plataformas de música como Spotify, para controlar la difusión del arte. Plataformas como Max (anteriormente HBO Max) han eliminado en masa películas y programas de televisión de sus servicios de transmisión; aunque algunos están disponibles en otros lugares, de repente hubo no hay forma legal de ver muchos otros programas. Incluso los creadores de algunos programas no pudieron ver su propio trabajo.

Por supuesto, no todo vale la pena preservar. Los archivistas y bibliotecarios aprenden a clasificar y evaluar registros para conservar o eliminar. En los espacios de Internet, estas prácticas, que pueden ayudar a crear significado, se conocen como limpieza digital. Y algunas organizaciones no gubernamentales y algunos gobiernos, en particular el de la Unión Europea, promueven políticas de datos basadas en la destrucción, como el “derecho al borrado”.

A medida que la historia de la pérdida de datos abarca milenios, el almacenamiento de datos digitales ha generado crisis y desafíos de conservación fundamentalmente nuevos. La naturaleza descentralizada de Internet genera enlaces rotos y contenido desviado; la naturaleza intrínsecamente dinámica e inestable de la información digital, basada en la constante migración de información, es otro riesgo. Los desastres naturales y los incendios amenazan digital así como archivos físicos.

Estos desafíos requieren soluciones nuevas e innovadoras. Algunas organizaciones han adoptado métodos drásticos para hacerle frente. ahora hay un Bóveda de códigos del Ártico junto al Bóveda Global de Semillas en Svalbard en el Alto Ártico noruego. Pero proteger el código en un pozo de mina congelado y en desuso no aborda la necesidad más amplia de repensar las estructuras de poder que gobiernan la propiedad y el control de los datos.

En aras de la rendición de cuentas democrática, los gobiernos deberían dejar de depender de las plataformas de comunicación privadas para las operaciones diarias de la administración pública y deberían dar mayor prioridad al archivo público.

Junto con la necesidad de mantener la confianza pública en las instituciones democráticas, debemos pensar en cómo debemos preservar nuestra memoria cultural colectiva. Instituciones como museos, bibliotecas y archivos deben desempeñar un papel más proactivo al crear garantías institucionales más sólidas — incluidas las normas que exigen el transporte seguro de datos del sector público y la gestión profesional de registros, además de los requisitos de accesibilidad pública — sobre su propia conducta. Estas organizaciones, ya sea iniciativas de archivo pioneras o instituciones públicas establecidas, requieren apoyo financiero e institucional prosperar.

Más allá de las funciones diarias del gobierno y la preservación de la memoria cultural, las sociedades digitales también deben garantizar que los datos críticos sobre abusos de los derechos humanos estén protegidos contra el borrado, tanto intencional como accidental.

Pero al considerar cambios regulatorios fundamentales, también debemos reconocer que pasar algunos datos podría ser tan ético como preservarlo.

La historia del conocimiento no es la del simple progreso o la acumulación. La producción de conocimiento en la era digital, como la creación y almacenamiento de conocimiento a lo largo de los siglos, se desarrolla como una oscilación continua entre ganancias y pérdidas.

La pérdida de datos a pequeña escala (contactos telefónicos perdidos, archivos digitales perdidos por una falla) es el riesgo laboral de existir en un mundo digitalmente dependiente. Pero el borrado de datos a gran escala siempre es político. Las respuestas al borrado y la pérdida deben ir más allá de los arreglos técnicos y las reacciones instintivas; en cambio, los gobiernos y las organizaciones deben reevaluar constantemente los marcos éticos y normativos que rigen nuestra relación con los datos. La narrativa dominante de que vivimos en una era de acumulación de conocimiento exponencial y casi infinita ya no se ajusta a una sociedad en la que estamos perdiendo nuestro registro colectivo de nosotros mismos día a día.