Archivística Digital

La evolución de la archivística hacia lo digital es inevitable. Cada vez más se publica todo tipo de contenidos única y exclusivamente en formato digital (artículos, libros, revistas, prensa, documentos sonoros o visuales o audiovisuales, etcétera).

A pesar de que la archivística digital es una ciencia bastante joven, su irrupción ha contribuido a dinamizar aún más el debate en torno a la normalización de la descripción archivística. Por otro lado, la digitalización de documentos nos brinda la posibilidad de alargar la vida de aquellos ejemplares que se encuentran en mal estado (pergaminos, incunables, películas de nitrato o acetato u otros) o bien crear archivos digitales que nos permiten ahorrar espacio físico y agilizar la recuperación de la información.
En esta asignatura más que interesante hemos cursado las siguientes unidades didácticas:

  • Archivos e Internet. Profesora: Betlem Martínez Raduà
  • La normalización de la descripción archivística. Profesora: Glòria Mora
  • Digitalización de documentos. Profesor: Ismael Fuentes
  • El archivo de la Web. Profesores: Ciro Llueca y Mari Carmen Marcos
  • Creación de un repositorio digital con recursos limitados. Profesores: Ciro Llueca y Sandra Reoyo
  • Las instituciones culturales y los nuevos entornos digitales. Profesora: Teresa Roig

A continuación disponéis del resumen de dos artículos y algunos materiales complementarios.

_________________________________________________________

 

Archivos e Internet

  • Evolución histórica: del archivo clásico al archivo virtual
  • El sitio web de archivo: criterios de calidad
  • Tipologías

Palabras clave: archivística digital; archivo online; web 2.0; web semántica; digitalización de documentos; procesos estandarizados de descripción documental

 

Evolución histórica: del archivo clásico al archivo virtual

Este artículo dedica su primera parte a realizar un repaso histórico analizando la relación entre Internet y los archivos como instituciones. Esto nos lleva a la fecha de 1994 y, como casi siempre, al mundo anglosajón, porque es en Estados Unidos donde surgen los primeros sitios web para archivos (NARA – National Archives and Record Administration, por ejemplo). Un año más tarde, el Ministerio de Cultura español publica en Internet los PIC-Puntos de Información Cultural correspondientes al CIDA-Centro de Información Documental de Archivos.
En términos generales, estos primeros sitios web de archivos ofrecían:

  • Recursos básicos como información general sobre archivos y bolsa de trabajo.
  • Herramientas para la descripción y enlaces a otros sitios web relacionados.
  • Bases de datos con descripción de los fondos documentales.
  • Listas de distribución para documentalistas y bibliotecarios.
  • Materiales pedagógicos para profesores y alumnos.
  • Exposiciones virtuales.
  • De forma lenta y progresiva empezó a ofrecerse la consulta de algunos documentos digitalizados.

En cuanto al panorama nacional, en la actualidad se observa lo siguiente:

  • Consolidación, en mayor o menor grado, del sitio web de archivo como herramienta de difusión y de trabajo.
  • ARXIFORUM. Surgimiento de una comunidad de internautas (archinautas, como los llama la autora) vinculados al gremio de documentalistas y archiveros. Arxiforum funciona como foro para el debate sobre la gestión de la información y la discusión sobre teoría y práctica de la archivística.
  • Predominio de portales centrados en comunidades de archiveros concretas. El portal de ACAL-Asociación de archiveros de Castilla y León, por ejemplo, si bien ofrece información abierta al público, no deja de ser un portal que funciona como punto de reunión de sus asociados.
  • Incremento de la inversión pública para el impulso y creación de archivos digitales.
  • Como alternativa a la falta de inversiones en proyectos que no disponen de fondos, la irrupción de la Web 2.0 ha servido como herramienta de trabajo para la creación de nuevos sitios web del ramo.

↑ Subir

El sitio web de archivo: criterios de calidad

A partir de los estudios realizados por Michel Hamel a finales de la década de 1990, podemos establecer unos primeros criterios de calidad para los sitios web de archivos:

  • Reconocimiento/identificación del sitio web. La página inicial y las diversas secciones deben tener títulos que los identifiquen de forma fácil.
  • Información general y relación de los servicios archivísticos. La guía del archivo debería mostrar:
    • Funciones del servicio
    • Descripción del acceso a fondos documentales y soportes o medios
    • Conjunto de fondos conservados
  • Acceso a la información sobre fondos documentales y colecciones. Especialmente sobre los instrumentos de descripción y del contexto de indización. Por otro lado, destaca la estandarización de la descripción como procedimiento que permitirá la interconexión de bases de datos.
  • Inclusión de referencias o enlaces a otros actores del sector. Difusión del trabajo de otras instituciones archivísticas.
  • Imagen del sitio web. Cuidar el diseño gráfico, puesto que el website puede ser la primera toma de contacto de muchos usuarios.

Por otro lado, investigaciones más recientes destacan el valor añadido de las herramientas que aporta la web 2.0. Así, el archivo abre sus puertas a la colaboración con los usuarios, los cuales pueden enriquecer los procesos de documentación aportando su conocimiento. De la misma forma, el uso de la web 2.0 ayuda a fidelizar una comunidad de usuarios.
Según la autora, un sitio web de archivo de calidad tiene que ser una herramienta de prestación de servicios dinámica y actualizada, y ha de servirse de las tecnologías 2.0 para mostrar su carta de presentación en la red. Además, y como paso previo a la publicación del sitio, propone el uso o creación de la intranet de archivo, siempre que sea posible, como forma para crear un embrión del sitio web. Con la intranet podemos testar su uso y contenidos antes de hacer público un website.

↑ Subir

Tipologías

Existen diversas variantes de websites de archivos. La relación de sitios web que se presenta a continuación, se realiza y se caracteriza por la disponibilidad o la falta de recursos que tienen los archivos:

  • Web-folleto. Es una traducción del folleto o tríptico de presentación en papel del archivo pasado al formato digital y del hipertexto. Suele ser el web de instituciones pequeñas o de ámbito local que muestran información general del archivo y realizan una breve descripción documental de sus fondos.
  • Web de primera aproximación. Su contenido permite al usuario valorar si los servicios que ofrece el archivo y el fondo que gestiona, son los idóneos como para desplazarse hasta su lugar de ubicación. En este tipo de web encontraremos descripciones pormenorizadas de los fondos y subfondos, así como una relación de los instrumentos descriptivos o bien un cuadro de clasificación de fondos. Ejemplo: Archivo de la Fundación Hullera Vasco-Leonesa
  • Web-instrumento de descripción. De contenido potente a nivel de descripción documental, el usuario puede iniciar la primera fase de investigación a través del website puesto que tiene acceso a los instrumentos de descripción. Ejemplo: Archivo Edad de Plata
  • Website con servicios extra. Propone servicios diferenciados según el tipo de usuario. Puede ofrecer la consulta de determinados documentos digitalizados, pero su enfoque en la red es más de carácter divulgativo. Ejemplo: Arxiu Municipal de Barcelona
  • Web-Archivo virtual. Consultas online de series documentales a nivel de unidad. Esto suele suceder porque se trata de un fondo ya digitalizado con anterioridad, que suele tener un alto número de consultas, con lo que se evita el deterioro rápido por el uso de la documentación por parte de los usuarios del archivo.  O bien porque este tipo de servicios son un reclamo del archivo para promocionarse. Ejemplo: Servei d'Arxiu i Documentació Municipal de Tarragona
  • Portal archivístico. Funciona como punto central para el acceso a información muy diversa y de calidad para los profesionales de la archivística. Ofrece el acceso directo a recursos de información destacados o a herramientas de búsqueda potentes. Sus contenidos se asemejan a los descritos en el website con servicios extra.   Ejemplo: UNESCO Archives
  • Web 2.0 ó 3.0. Según la autora del artículo, la web 2.0 o Web social se ha consolidado como eje de comunicación bidireccional entre website-usuarios. Con la llegada de la Web 3.0 o Web semántica hay un salto cualitativo en tanto que se trabaja para aumentar la interoperabilidad entre bases de datos y sitios web, o bien se da acceso a nuevas tecnologías como la realidad aumentada y la geolocalización. Por un lado, este tipo de website de archivo ofrece la posibilidad de cocreación de contenidos junto a los usuarios. Y por otro, la tecnología 3.0 está destinada a la mejora de la gestión de contenidos en la red. Ejemplo: Archivo de Arganda del Rey

A modo de conclusión, se valora el nuevo papel del archivero como webmaster, o bien como profesional que ha de colaborar necesariamente en la construcción del sitio web de la institución para la cual trabaja o representa. La situación actual en España, en cualquier caso, está bien encaminada en cuanto a que ha evolucionado hacia un modelo en el cual se comparten recursos, información y, en algunos casos, la cocreación de sitios web.

↑ Subir

Bibliografía seleccionada

 

Debate Debate de la Unidad 6.6. Archivos e Internet.pdf

Ejercicio Ejercicio Art6.6_Archivos e Internet.pdf

Recursos

 

:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::

La normalización de la descripción archivística

Abstract
He aquí uno de los puntos fundamentales de la archivística y de esta asignatura. La archivística se fundamenta en la descripción, clasificación y ordenación de la documentación. En este artículo se trabaja en relación al concepto de descripción, entendida como un ejercicio que actúa como puente entre el documento y el investigador o el ciudadano. Es el instrumento fundamental para facilitar el acceso y la consulta de la documentación. La descripción también permite, a la institución que alberga los documentos, un mayor control y conocimiento del fondo documental y su recuperación según las necesidades de información.
Si bien hay disciplinas que han avanzado mucho más en los procesos de descripción, como es el caso de la biblioteconomía, existe un nuevo escenario en el cual se está avanzando para lograr la normalización de la descripción archivística. La norma ISAD (G), ISAAR (CPF) y la EAD (Descripción Archivística Codificada) son algunos de  los caminos que trazan un recorrido hacia su normalización.

 

:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::

Digitalización de documentos

Abstract
En esta unidad didáctica abordamos las problemáticas y soluciones sobre los procesos de digitalización de documentos. En primer lugar se analiza los parámetros necesarios para comprender qué es y cómo funciona una imagen digital, y qué herramientas podemos utilizar para su creación. Luego se determina qué tipos de compresiones se pueden emplear y los formatos de archivos digitales más extendidos para la conservación de los documentos digitales. Con todo, se pretende dar una idea del funcionamiento de un SGED - Sistema de Gestión Electrónica de Documentos y saber valorar qué implicaciones puede tener un proceso de digitalización en proyectos de gran envergadura.

↑ Subir

:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::

El archivo de la Web

  • Tendencias en la documentación de la web
  • Archivos web: casos concretos
  • Perspectivas técnicas y legales

Palabras clave: archivo web; repositorio digital; preservación digital; preservación de archivos digitales; procesos documentales de la web

 

Tendencias en la documentación de la web

Internet tiene una historia muy reciente. Su generalización en países tecnológicamente desarrollados se da a mediados de los años 90 del siglo pasado. Ahora bien, pese a ser una herramienta y medio de comunicación muy joven, la misma UNESCO ha declarado que es necesario preservar el patrimonio digital ya que muchos de los contenidos que está generando el ser humano se dan exclusivamente en formato digital.
Cómo conservar y preservar lo que se publica en la web es un problema complejo que lleva a grandes debates en la actualidad. Existen vacíos legales sobre los procesos documentales en materia digital, o bien los programas diseñados para capturar y documentar la web no son del todo consistentes. Aún así, han surgido diversas iniciativas con el propósito de crear reposi torios digitales o archivos web.
Los pioneros en esta disciplina fueron Suecia, con el proyecto Kulturarw3–The Swedish Web Archive, Australia con PANDORA, y Estados Unidos y el proyecto Internet Archive. En el caso de España, la Biblioteca de Catalunya fue pionera al lanzar el proyecto PADICAT-Patrimoni Digital de Catalunya en 2005, que detallaremos más adelante.
En la actualidad existen un buen número de proyectos volcados en la recuperación y conservación de la memoria de lo publicado en Internet (Jinfang Niu, 2012). La gran mayoría de estos proyectos se encuentran agrupados en el IIPC-International Internet Preservation Consortium con el objetivo de preservar el patrimonio que se encuentra alojado en la web.
De estas experiencias, se puede observar dos modelos de políticas de conservación:

  • Modelo integral o exhaustivo. Recopilación global de sitios web seleccionados a partir de criterios como el dominio o la ubicación del servidor informático.
  • Modelo selectivo. Trabaja a partir de una política selectiva en base a áreas específicas del conocimiento y espacios geográficos determinados.

La tendencia actual es un híbrido entre estos dos modelos. Ahora bien, es importante destacar que el acceso a las colecciones es limitado debido al vacío legal comentado anteriormente, o bien a problemas tecnológicos que presenta este tipo de trabajos.

↑ Subir

Archivos web: casos concretos

  • Internet Archive Proyecto creado en 1996, orientado a construir una biblioteca de Internet de acceso permanente, “historical collections that exist in digital format”. Su herramienta de consulta se denomina Wayback Machine y a través de ella, introduciendo la URL que deseamos visualizar, podemos viajar en el tiempo para visitar y observar la evolución de determinadas páginas y sitios web.
  • PANDORA - Preserving and Accessing Networked Documentary Resources of Australia Iniciativa de la National Library of Australia, surgida también en 1996, con el propósito de construir una colección digital de las publicaciones online australianas. Actualmente recoge todo documento digital publicado por australianos o bien que esté vinculado o haga referencia a Australia.
  • Netarkivet.dk De origen danés, creado en 2005. Su política de colección se desarrolla a partir de:
    • Cuatro capturas anuales de páginas con dominio .dk
    • Captura mensual de 80 sitios web considerados como espejo de la cultura danesa
    • Capturas monográficas de eventos sociales concretos.
  • PADICAT – Patrimoni Digital de Catalunya Nace en 2005 a partir de la iniciativa de la Biblioteca de Catalunya. La política de su colección está basada en tres líneas:
    • Captura masiva de sitios web con dominio .cat y selección de otros dominios.
    • Capturas selectivas, a partir del acuerdo con unas 500 instituciones consideradas como representativas de la sociedad y cultura catalana.
    • Impulso de investigaciones en la línea del estudio del patrimonio digital relativo a la vida pública catalana.

↑ Subir

Perspectivas técnicas y legales

El proceso típico de los sistemas de archivo web sigue el mismo procedimiento del sistema documental clásico: compilación, proceso y difusión. Para el autor, una página web que se observe como documento apto para su conservación debe cumplir con dos parámetros:

  • URL identificable atribuida a la página.
  • Constituir una unidad documental reconocible.

En cuanto al software empleado para la compilación, el más extendido es el programa Heritrix, el cual se dedica a la captura y, a su vez, está complementado por el programa Nutch-Wax para procesar los recursos recopilados en la gestión e indización. Para garantizar el acceso se emplea el programa Wera –con el que podemos recuperar la información con búsquedas a texto completo- o bien con el programa Waybak –recuperación mediante URL-.
En cuanto a las cuestiones legales, países como España están planteando la necesidad de crear leyes para la creación de un depósito legal digital. Por otro lado, está la Ley de Propiedad Intelectual que afecta de lleno a la labor de este tipo de repositorios. En cualquier caso, el autor aboga por tratar de difundir y concienciar al público en general de que este tipo de proyectos sirven para crear patrimonio y que han de ser observados como un bien común.
Como conclusión, expone algunos objetivos para el futuro:

  • Análisis e implantación de la estructura tecnológica que ha de soportar el ingente aumento de este tipo de archivos. Tanto en cuestiones de espacio como en cuestiones de perdurabilidad de formatos.
  • Acotar las estrategias de preservación digital. No hay que olvidar que se trata de la transferencia de conocimiento.
  • Incentivar acuerdos entre archivos web e instituciones de la memoria.

↑ Subir

Bibliografía seleccionada

 

Ejercicio Ejercicio Articulo 6.8_El archivo de la Web.pdf

Recursos  Preservación del patrimonio digital y Archivos web

 

:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::

Creación de un repositorio digital con recursos limitados

Abstract
Partiendo de la premisa del autor de que todo lo que no esté publicado en Internet no existirá como materia de información o de investigación, este artículo trata de exponer el origen y funcionamiento de los repositorios digitales.
Los repositorios sirven para publicar en una base de datos, generalmente de acceso libre, documentos digitales o digitalizados que constituyen parte o el total de la colección de una institución. Su nacimiento se debe a la evolución y crecimiento de los servicios de información en bibliotecas, archivos y museos: de los procesos de catalogación surgieron los catálogos automatizados, luego se dio el salto a los catálogos en línea y de ahí el origen de los repositorios digitales.
En esta unidad se nos detalla la historia del repositorio digital, así como las herramientas necesarias para la creación, implementación y promoción de los repositorios digitales.

 

:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::

Las instituciones culturales y los nuevos entornos digitales

Abstract
Las ya no tan nuevas tecnologías de la Web 2.0 han posibilitado que museos e instituciones culturales puedan difundir, de forma masiva, contenidos albergados o generados por las mismas instituciones o bien en procesos de cocreación con sus usuarios. El artículo de esta unidad analiza cómo se puede crear e implantar un gestor de contenidos que sirva de plataforma para visibilizar todo este tipo de materiales, así como las herramientas para su difusión y comunicación. También se detalla unos principios básicos de cómo debe ser el website de una institución cultural: estructura, materiales, o bien el equipo humano para su desarrollo y mantenimiento. En definitiva, la propuesta es dinamizar las instituciones culturales y aprovechar sus activos para generar nuevos espacios de conocimiento y colaboración.

 

↑ Subir