miércoles, 6 de junio de 2018

Palabras clave en la legislación sobre Archivos: un pequeño experimento Big Data



El día 9 de junio celebramos el día de los Archivos, #IAD18. Para conmemorar su aniversario, voy a hacerlo al estilo Docufilos, es decir un poco particular, porque el otro día se me ocurrió una idea “curioseando” en lenguajes, metadatos y big data. Y he hecho un pequeño experimento al aplicarlo al Código BOE de Patrimonio Documental y Archivos.


Este Código recoge la legislación vigente en materia de Archivos por lo que es una fuente fundamental para acercarse a este apasionante mundo. Así mismo una de las finalidades del big data es aprender de la repetición humana para sacar patrones de conducta y averiguar lo que contiene el subconsciente colectivo. Pues bien, el experimento consiste en hacer búsquedas de palabras clave que yo sé que son importantes (o al menos eso creía) y buscar cuántas veces se repiten. Eso me recordó las sorpresas que me llevé cuando hice un pequeño análisis de las estadísticas en los Archivos. Desde entonces intento no dar nada por cierto.

He seleccionado 30 términos o palabras clave: Accesibilidad, Acceso, Administrativo, Archivo, Archivos, Autenticidad, Confidencialidad, Conservación, Cultura, Disponibilidad, Destrucción, Documento/s, Eficacia, Fiabilidad, Gestión documental, Historia, Información, Integridad, Legalidad, Metadato/s, Patrimonio documental, Patrimonio histórico, Recuperación, Reutilización, Seguridad, Selección, Tecnología, Transparencia, Trazabilidad y Valoración.

Bien es cierto que, al tratarse de un pequeño estudio para hacer el post voy a ofrecer los resultados sin filtro. Algunas de las palabras que he seleccionado son del lenguaje habitual y no tienen por qué tener el mismo sentido que en su aplicación archivística. Además hay términos que son mucho más modernos y pueden aparecer en menos disposiciones y habría que contrastarlo. Pero es un comienzo…

A priori pensé que la palabra que más se repetiría es la de Documento/s porque siempre que empiezo una ley, normativa, etc. me encuentro la definición del mismo. Pues ni de lejos. También tenía curiosidad por los principios de Fiabilidad, Disponibilidad, Acceso o Integridad entre otros. Y en este punto hay bastantes contrastes. Por ejemplo, mientras la palabra Integridad se repite 228 veces, de Fiabilidad solo la encontramos 25 veces, cuando ambas parecen ir de la mano en la configuración de un documento de Archivo.

Se nota la infancia del término Reutilización, que se recupera 7, frente a Recuperación que aparece 152 veces.

Un resultado que me ha llamado mucho la atención ha sido la dicotomía entre Archivos=Pasado y Archivos=Futuro. Curiosamente no han sido los contrastes entre Tecnología (recuperada 208 veces) e Historia (135 veces) sino con la friolera cifra de 7.605 que podemos encontrar el término Cultura en nuestra búsqueda. Es la palabra que aparece, con mucha diferencia, en la selección.

Si juntamos las veces que se escriben los términos Destrucción (253 veces), Selección (94) o Valoración (243) no llegan a la mitad de las veces que se recupera la palabra Conservación, que son 1.781.

En definitiva hay “sospechas” que se confirman como que a los Archiveros les preocupa mucho la conservación de los documentos en el tiempo o que, aunque las nuevas tecnologías hayan irrumpido en métodos y conceptos los Archivos están muy, pero que muy ligados a la Cultura. También el Acceso, junto con la Conservación se repiten mucho más que Autenticidad, Disponibilidad, Confidencialidad e Integridad (art1. de la derogada Ley 11/2007) siendo los seis términos un “todo” para que tengamos un buen documento, un documento con todas las garantías. Lo que deduzco de esto es que la legislación más “antigua” da por supuestas algunas características documentales que ahora hay que conseguir que lo hagan las máquinas. Esta idea puede ser solo el principio de un estudio muy interesante y útil para los que nos enfrentamos al cambio en los Archivos. ¡Feliz #DIA18 o Happy #IAD18!