Cómo, dónde y qué se guarda del internet en español

Blog

Categorías

El trabajo de documentación ha cobrado un nuevo significado con la necesidad de aplicarlo al entorno de internet. Pese a que la iniciativa archive.org ha sido un éxito absoluto en materia de guardar la información del pasado en la red, ha pasado algún tiempo hasta que algunos países europeos se han motivado lo suficiente como para dedicar recursos a este proyecto.

En el caso de España no ha sido precisamente hasta el año 2015, cuando la Biblioteca Nacional de España (BNE) se ha puesto de forma activa a guardar información nacional publicada en internet. Gracias a un archivo digital de 180 terabytes recibido el pasado mes de diciembre de 2014, desde San Francisco donde está la sede de archive.org, al menos ya se cuenta con material publicado desde 2009 y sirve como punto de partida para que la BNE prosiga por su cuenta el proyecto.

Pero no surgen pocas dudas sobre su procedimiento. La primera de ellas relativa a la metodología. ¿Cómo realizar el rastreo y posterior guardado de todo material digital enmarcado en el registro .es? Según los responsables de este titánico proyecto de documentación bibliotecaria, existe una doble vía. Por un lado está el procedimiento selectivo sobre hechos que se determinan como de alto interés histórico. Aunque este método garantiza una recopilación de datos absoluta y exacta, queda todavía por resolver el eterno debate de quién tiene potestad para decidir qué debe guardarse y qué no.

La otra vía puede resolver esta incógnita, pues se trata del rastreo masivo de todo material susceptible de ser archivado. Obviamente, pese a que la calidad selectiva y la exactitud global de los datos almacenados no será tan precisa como la anterior vía, al menos permite abarcar mucho más contenido.

Claro está que en la actualidad este trabajo se ha hecho más complicado si cabe, pues frente a la información enviada por un sólo emisor al principio de Internet, hoy en día son los usuarios los que crean contenido y lo hacen a un ritmo inabarcable.

¿Es un tweet contenido archivable? ¿O la fotografía de una mujer desayunando que comparte su estado en Facebook? En el más amplio sentido del concepto del trabajo, sí lo es siempre que sea contenido español, pero su interés divulgativo o histórico probablemente no pase de una muestra práctica de la sociedad española del siglo XXI.

Los documentalistas argumentan, sin embargo, que de épocas antiguas se guarda todo tipo de material como recetas médicas o anuncios comerciales. El problema es que los periódicos o papeles de esos lejanos años no pueden competir con la cantidad de información publicada cada segundo en la actualidad.

Y esto conduce al último reto, todavía por resolver. ¿Cómo se guarda la información en internet? Por un lado, la BNE expone que en sus discos duros se está volcando todo este material, pero la preocupación sobre el volumen que puede abarcar es algo que cada vez urge más en solucionarse y no se tiene una clara visión de cómo hacerlo.

Lo que sí está más resuelto es el formato. Ha quedado patente que algunas tecnologías podrían estar obsoletas en un futuro a largo plazo, como los archivos de texto o incluso los pdf. Por tanto, se está trabajando en una tecnología que permita estandarizar dichos formatos, para ser consultados llegado el momento en que los programas originales no sirvan o sean incompatibles. Podría ser una solución, pero todavía quedan muchos obstáculos que superar para preservar nuestra historia digital en el futuro.