0% encontró este documento útil (0 votos)
150 vistas4 páginas

DAITSS: Software para Preservación Digital

DAITSS es una aplicación de software libre desarrollada para construir repositorios de preservación digital a largo plazo. Proporciona automatización para las fases del modelo OAIS como la ingesta, almacenamiento y acceso de contenidos digitales. Implementa estrategias de preservación como la normalización y migración de formatos además de almacenar metadatos. Está formado por servicios web, procesos, línea de comandos, scripts y bases de datos para gestionar flujos de trabajo y contenidos en el repositorio.

Cargado por

Wellington Silva
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
150 vistas4 páginas

DAITSS: Software para Preservación Digital

DAITSS es una aplicación de software libre desarrollada para construir repositorios de preservación digital a largo plazo. Proporciona automatización para las fases del modelo OAIS como la ingesta, almacenamiento y acceso de contenidos digitales. Implementa estrategias de preservación como la normalización y migración de formatos además de almacenar metadatos. Está formado por servicios web, procesos, línea de comandos, scripts y bases de datos para gestionar flujos de trabajo y contenidos en el repositorio.

Cargado por

Wellington Silva
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

DAITSS: una aplicación para construir

repositorios de preservación
9 gener 2013 | Categoritzat sota: Eines and tagged with: DAITSS, Preservació digital, Repositoris
Introducción
En los últimos meses hemos venido destacando diferentes proyectos y aplicaciones orientadas a la gestión de
estrategias de preservación digital en el marco de un depósito digital. En septiembre, Sergi Montes nos
presentó Archivemática y el mes pasado nos habló de RODA (Repository of Authentic Digital Objects), un
proyecto de los Archivos Nacionales de Portugal. Hoy os presentamos DAITSS (Dark Archive in the
Sunshine State).
DAITSS es un software de preservación digital desarrollado por el Florida Center for Library Automation. Se
trata de una aplicación que funciona como “caja negra”, es decir, que no proporciona acceso público a los
objetos digitales que alberga, sino que se centra en la preservación de tales contenidos. DAITSS proporciona
soporte automatizado para las diferentes fases de un flujo de trabajo basado en el modelo de referencia OAIS
(Open Archival Information System): submission, ingest, archival storage, access, withdrawal y
evidentemente la propia gestión del repositorio.
Funciones de DAITSS
Submission
En esta fase un productor autorizado proporciona algún tipo de contenido al repositorio en forma de
Submission Information Package (SIP). Este paquete puede albergar uno o más archivos y un documento
XML en formato METS que proporciona información sobre el SIP. DAITSS se encarga de validar si el
productor que hace la entrada está autorizado para depositar contenido en el sistema y si el contenido le
pertenece realmente. Al mismo tiempo, se encarga de validar el fichero METS. Si el SIP finaliza con éxito el
proceso de validación, el usuario recibe un mensaje con el número de identificación asignado al paquete en el
sistema. En caso de que el paquete sea rechazado el usuario recibe un mensaje en el que se le explican las
causas que han motivado esa decisión.
Ejemplo de un SIP rechazado.

Ingest
El objetivo del proceso de ingesta es transformar el SIP en un Archival Information Package (AIP). En otras
palabras, almacenar el paquete recibido y aplicarle una serie de validaciones y cambios necesarios para que
pueda ser preservado a largo plazo. En primer lugar, DAITSS se encarga de buscar virus en los archivos
recibidos. En el caso de que se encuentre algún tipo de virus el sistema envía el paquete a una zona de
seguridad en la que se almacena hasta que uno de los responsables del repositorio decida rechazarlo o
aceptarlo. Posteriormente, el sistema se encarga de analizar el formato de archivo de cada uno de los ficheros
que forman el paquete de manera que se ajusten a los requerimientos de repositorio. Según el tipo de fichero
recibido el sistema es capaz de generar nuevos formatos derivados mejor preparados para la preservación a
largo plazo. En estos casos, el fichero original queda intacto y se asocia a cada nueva versión a través de los
metadatos. En el caso del fichero METS, el sistema también se asegura de que el esquema incluya todos los
campos necesarios, en caso contrario lo completa si es posible.

Una vez se ha procesado correctamente el SIP, se genera un nuevo documento METS denominado AIP
descriptor que describe el nuevo paquete de información (descripción técnica de todos los ficheros,
información sobre los diferentes eventos, etc.).

Archival storage
Llegados a este punto, cada institución debe decidir que tipo de almacenamiento desea, cuántas copias de cada
paquete quiere guardar y dónde las piensa almacenar.

Diagrama del servicio de almacenamiento en DAITSS.

Access
Como comentábamos al inicio del post, DAITSS no proporciona acceso público a los objetos digitales que
alberga. La única manera posible de acceder al contenido alojado en DAITSS es haciendo una petición de
difusión (dissemination request) para recibir un Dissemination Information Package (DIP). En ningún caso
DAITSS retira el archivo de su repositorio, sino que genera una copia del paquete y la entrega en el lugar
acordado si el solicitante dispone de la autorización necesaria.
Withdrawal
El inicio del proceso de baja de un paquete almacenado se inicia mediante la presentación de una solicitud vía
web. Si el solicitante está autorizado para eliminar ese AIP en concreto, la solicitud es reenviada a uno de los
operadores del repositorio para su confirmación. En el caso de confirmarse la baja, todas las copias del AIP
almacenadas y sus archivos TAR son eliminados. Aún así, el sistema conserva información que permite saber
que ese AIP existió (datos básicos sobre el paquete, la solicitud de retiro, etc.).

Detalle del flujo de trabajo en DAITSS.

Estrategias de preservación
DAITSS implementa diferentes estrategias de preservación basadas en la transformación de los archivos con
el fin de normalizarlos y la migración a nuevos formatos cuando sea necesario. En el primero de los casos, los
archivos propietarios se convierten a formatos abiertos y normalizados (por ejemplo, una hoja de cálculo
propietaria a otro formato abierto basado en XML. En el segundo de los casos se procura migrar los archivos a
formatos más actuales (por ejemplo de una versión 2007 a 2010, o de una 3.0 a 3.1). DAITSS es capaz de
identificar y trabajar (analizar, describir y transformar) con más de 600 tipos de formatos. Las estrategias
basadas en la transformación se aplican básicamente a archivos de imagen, texto, audio y vídeo. El resto de
archivos como pueden ser los ejecutables, programas, videojuegos, etc., son candidatos a otro tipo de
estrategias como las de emulación. DAITSS asegura la preservación de este otro tipo de archivos, pero no
asegura su funcionamiento en futuros entornos sino se emulan.

El sistema procura almacenar y preservar tres versiones de cada uno de los archivos ingestados. Una de ellas
es la versión original tal y como ha sido subida al repositorio, un nuevo formato normalizado y una migración
a las nuevas versiones.

DAITTS soporta el esquema de metadatos PREMIS (todos los campos obligatorios y muchos de los
opcionales), necesario para implementar estrategias de preservación a largo plazo. Además, el sistema
implementa otros estándares de metadatos específicos entre los que encontramos MIX para imágenes
digitales, AES para audio, textMD para texto y docMD para documentos
Componentes de software
DAITSS se encuentra formado por los siguientes componentes de software:

 Diferentes servicios web entre los que se encuentran las interfaces de usuario.
 Diferentes procesos informáticos que se ejecutan en segundo plano (daemons) encargados de controlar y
gestionar las colas de procesamiento y los informes de entrega.
 Línea de comandos que permiten a los operadores del repositorio presentar los SIP.
 Diferentes scripts que permiten verificar la integridad de los AIP.
 Diferentes bases de datos (4 PostreSQL) que almacenan los diferentes registros contenidos en DAITSS y
la actividad producida en el repositorio.

También podría gustarte