¿Nunca te has preguntado qué ocurre cuando una web desaparece? Pues tengo una mala noticia: desaparecen para siempre y son totalmente irrecuperables.
La buena noticia es que no todas desaparecen: un grupo de ellas es guardado por los archivos web y quedará para la posteridad.
¿Te preguntarás qué es un archivo web? Definiéndolo de manera sencilla: una recopilación de sitios web conservados dentro de una labor patrimonial, para su visionado y estudio por futuras generaciones.
Y pensarás: ¿quién tuvo esta genial idea? Desde la aparición de Internet en los hogares y su popularización en torno a 1995, un pionero, Brewster Kahle, vio el potencial de la información en la web y creó en 1996 Internet Archive, una organización sin ánimo de lucro considerada como el primer archivo web, nacido para conservar esas primeras representaciones de Internet. Actualmente, es un gigante que da acceso a multitud de contenidos de manera abierta.
El resto del mundo tardó más tiempo en ver el potencial de la red. Aunque muchos países —especialmente sus bibliotecas nacionales— empezaron a guardar la web de manera temprana, fue en 2003 cuando la UNESCO lanzó sus Directrices para la preservación del patrimonio digital, alertando, entre otras cosas, sobre la importancia de guardar los contenidos digitales en Internet como parte del patrimonio, para evitar su pérdida definitiva.
Este impulso fue clave para que muchas bibliotecas nacionales, de manera generalizada, comenzaran con esta labor tan compleja de guardar Internet. En 2009, la Biblioteca Nacional de España creó el Archivo de la Web Española, con la finalidad de guardar contenidos de Internet que tuvieran un interés cultural, histórico, artístico o científico, para su posterior estudio por futuras generaciones.
Guardar Internet es un verdadero desafío en muchos sentidos. La creación diaria de contenidos es increíble, totalmente inabarcable —varios miles de veces más que el material impreso—. Además, los sitios web son muy efímeros: desaparecen con suma facilidad y velocidad. Hay estudios que hablan de una vida media de entre 4 meses y 2 años. Y, por si fuera poco, no permanecen inalterables: renuevan su información continuamente y se encuentran interconectados entre sí.

Por lo tanto, era importante tener un plan: ¿cómo se quería abordar el guardado de Internet en España? Lo primero fue descartar la exhaustividad: guardar todo era imposible. Se estudió lo que se hacía en otros países, especialmente en nuestro vecino Francia, que venía haciéndolo desde 2002.
Se decidió abordar esta tarea por dos vías distintas. Por un lado, los guardados masivos de los dominios nacionales, especialmente el .es, pero también el .gal (Galicia), el .cat (Cataluña) y el .eus (País Vasco), ya que las lenguas cooficiales son uno de los grandes tesoros de nuestro país.
Estos guardados son una fotografía de la web en un momento determinado: se guardan todos los sitios web de un dominio. En el caso del .es, hablamos de más de 2.000.000 de dominios; por ello, se guarda la portada y algunos niveles, de tal forma que los sitios web más grandes sólo se guardan parcialmente.
Por otro lado, como además de estos dominios los sitios web españoles se encuentran en multitud de dominios, se comenzaron a crear colecciones que, a partir de una selección, pudieran guardar de manera más exhaustiva un conjunto de sitios web con valor patrimonial.
Las colecciones creadas son de todo tipo: desde las primeras, sobre Política Nacional, Prensa o Gastronomía, hasta las más recientes, como Feminismo, colectivo LGTBI, Cómic o Videojuegos. Actualmente hay más de 15 colecciones temáticas.
En colecciones como Videojuegos, se busca la variedad y representar a la industria al completo: museos, ferias, blogs, videojuegos en línea, industria, creadores, la moda retro y mucho más. En temas más sociales, como Feminismo, se recoge la lucha del colectivo representado en revistas, prensa, blogs, asociaciones… pero también los discursos contrarios a este movimiento o que lo cuestionan. Estos grandes conjuntos de información ayudarán al ciudadano o al investigador a ver cómo se representaba esta realidad en Internet a lo largo de los años.
De la selección se encargan los conservadores web, personal bibliotecario o documentalista, profesionales de la información que, en algunos casos, buscan el apoyo de especialistas para crear una selección relevante que represente todos los puntos de vista de una temática, evitando sesgos políticos, religiosos o de cualquier otro tipo.
Además, estamos orgullosos de ser un proyecto nacional, ya que colaboramos con los centros de conservación de las CC. AA. Más de 40 personas nos apoyan en la selección y control de calidad de sitios web para las colecciones centradas en sus comunidades autónomas. ¿Quién mejor que los bibliotecarios de estas regiones para proveernos de la selección más relevante posible?
Otro campo importante es el de los eventos: elecciones y acontecimientos destacados en la historia de España, con fuerte repercusión en Internet y que, por su propio carácter temporal, son efímeros. El Archivo de la Web Española ha recogido desde su creación acontecimientos como el desarme de ETA en 2014, los atentados de Cataluña en 2017, la coronación de Felipe VI, o los últimos sobre la DANA de 2024 o el apagón eléctrico que afectó a toda España en abril de 2025. Estas selecciones de sitios web serán claves para entender estos acontecimientos, ya que gran parte de nuestra vida sucede en Internet, y sin esta información serán difíciles de comprender de manera completa en el futuro.
La Biblioteca Nacional lleva más de 15 años guardando la web. Ya supera los 3 PB (3 millones de GB) de datos e información relevante de nuestra sociedad: una verdadera cápsula del tiempo que permitirá a los investigadores del futuro “bucear” en nuestra época y documentar los hechos más importantes de nuestro tiempo.
Espera, antes de acabar: no te he dicho dónde puedes ver estos contenidos. Puedes venir a consultarlos en la BNE y a una red de centros de conservación distribuidos por toda España. Por favor, si usas contenidos del Archivo de la Web Española para tus investigaciones, cítanos.
Agradecemos a José Carlos Cerdán Medina su colaboración para acercarnos el trabajo del Archivo de la Web Española.

José Carlos Cerdán Medina. Apasionado de los libros, la cultura y el mundo digital. Licenciado en Historia del Arte por la Universidad Autónoma de Madrid y con un Máster en Bibliotecas y Servicios Digitales por la Universidad Carlos III, lleva más de 15 años metido de lleno en el universo de las bibliotecas y la documentación.
Desde 2021 dirige el Servicio de Gestión del Depósito de Publicaciones en Línea en la Biblioteca Nacional de España. Allí coordina la llegada de contenidos digitales a través del
depósito legal y lidera el Archivo de la Web Española, un proyecto en equipo con los centros de conservación de las comunidades autónomas que se dedica a guardar un pedacito de Internet para que forme parte del patrimonio digital español y que no se pierda para las generaciones futuras.