::: MANUAL CONCEPTUAL Y OPERATIVO DE DIGITALIZACIÓN :::
Por Maximiliano Tocco
::: Ventajas de la digitalización de patrimonio cultural :::
La digitalización es en la actualidad la herramienta de preservación más
completa y satisfactoria que nos brinda la tecnología, nos permite por un lado
preservar un original en un formato estándar que no nos cautive a una tecnología
o hardware en especial ya que pueden ser migrados de un soporte a otro sin
absolutamente ninguna pérdida de calidad ni envejecimiento de masters como
sucede en las herramientas mas antiguas como la microfilmación. Las técnicas
digitales actuales nos permiten disfrutar de una alta calidad de preservación que
nos asegura que el contenido semántico del original será preservado en el tiempo
casi incorruptible e indefinidamente. Por otra parte el hecho de tener una
representación digital del original, permite a la institución ofrecer al público este
acercamiento a la obra sin exponer el original al irreparable deterioro cotidiano de
la exposición, sumando la posibilidad de archivar los originales de manera
protegida. Muy importante también, es la ilimitada expansión de posibilidades que
brinda la informatización de metadatos, de realizar consultas completando
campos, es decir, que el banco de imágenes pasa a ser una archivo dinámico que
permite cruzar datos, obtener listados de objetos con características similares,
visualizar los objetos a través de la imagen, ampliarla, imprimirla, exportarla, y
cualquiera de todas las crecientes posibilidades que ofrece el universo informático.
::: ELEMENTOS CONCEPTUALES :::
1- ::: FUNDAMENTOS DE LA DIGITALIZACIÓN :::
Digitalizar en el caso de la imagen fija, es convertir una señal lumínica
analógica en información procesable por una computadora. El proceso de
digitalización comienza cuando en un escáner o en cualquier dispositivo de
digitalización, una imagen en papel es iluminada con un foco, y la luz que refleja
es conducida mediante un sistema de espejos hacia un dispositivo denominado
CCD (Charge Coupled Device, dispositivo acoplado por carga eléctrica), que
consiste en una serie de diodos sensibles a la luz, formado por diodos que
registran la luz rojos, verdes y azules, la cantidad de diodos por pulgada determina
la resolución del dispositivo. Por ejemplo un escáner de 300 ppp (puntos por
pulgada), registra por cada pulgada de papel 300 puntos rojos, 300 verdes, y 300
azules, cada uno de ellos en un diodo exclusivo del CCD. Estos diodos convierten
la luz en corriente eléctrica, y dependiendo de la intensidad de luz reflejada la
corriente eléctrica va variando su voltaje obteniendo así el tono de cada color.
Los impulsos eléctricos que entrega el CCD pasan a un dispositivo denominado
DAC (Digital Analogic Converter, Conversor Analógico Digital) que interpreta las
variaciones del voltaje eléctrico y las convierte en píxeles digitales. Según la
resolución del escáner crea los píxeles por pulgada. El caudal de bits obtenido es
transmitido a la computadora por el puerto de conexión del escáner.
2
::: RESOLUCIÓN Y NORMAS ISO:::
La resolución óptica o real de un dispositivo de digitalización depende del número
de diodos por pulgada que registre el CCD del objeto físico original. La resolución
óptica o real, se expresa con dos datos, la resolución vertical por la resolución
horizontal, por ejemplo 300 por 600 ppp. Para superar la limitación de resolución
de un CCD se ha inventado la resolución Interpolada que se utiliza para digitalizar
a una resolución mayor que la que puede obtenerse a través de la óptica, ya que
ésta viene limitada por el número de CCD por pulgada. La resolución interpolada
consiste en un algoritmo matemático que calcula los píxeles que no han podido
leerse a causa de la limitación de la lente. Es decir, que si el muestreo presenta un
píxel negro de un lado y uno blanco al otro lado la resolución interpolada inventará
un píxel intermedio gris. Este tipo de escaneo no es confiable para los trabajos de
preservación digital y para cualquier tipo de digitalización donde se requiera un
alto nivel de fidelidad. Es importante diferenciar entre la resolución óptica real y la
resolución interpolada.
Normas ISO. Durante un trabajo de digitalización se debe diferenciar entre la
resolución inicial de escaneo y la resolución final del documento digitalizado ya
que si se parte de un original pequeño (por Ej. un negativo de 35 mm) que se
quiere ampliar a una medida visible (por ej. a un positivo de 13 x 18 cm), de
3
manera tal que si queremos lograr una resolución final aceptable de por ejemplo
300 ppp, no lo lograremos digitalizando el original a 300 ppp porque se perderá
esta resolución al ampliarlo a la medida deseada . Para lograrlo debemos calcular
la proporción entre el tamaño de ambos lados del original y el tamaño entre ambos
lados del documento final digitalizado, y trasladar esta proporción a la resolución.
El cálculo sería el siguiente:
( Lado mayor final ) x ( Resolución final ) = ( Resolución a utilizar )
( Lado mayor original )
Documento Original ( negativo 35mm )
Lado menor (cm) Lado mayor (cm) Resolución a utilizar (dpi)
2,4 3,6 1500
Documento final digitalizado ( positivo 13 x 18 cm)
Lado menor (cm) Lado mayor (cm) Resolución Final (dpi)
13 18 300
Al cuidar la proporción en función de la resolución estamos cumplimentando los
requerimientos de las normas ISO, que nos indican que la copia digital debe
poder ser reproducida en el mismo tamaño que el original. Para cumplir con esta
ampliación no podemos confiar en la resolución interpolada, sino que necesitamos
un dispositivo de digitalización que brinde esta resolución óptica real.
4
::: DISPOSITIVOS DE DIGITALIZACIÓN :::
Un escáner transforma imágenes reales, físicas y con precisión infinita en
imágenes finitas y con una precisión determinada que pueda ser procesada por
una computadora, es decir en bytes. Este proceso tiene lugar, como ya hemos
explicado, cuando dentro de un escáner una imagen en papel es iluminada con un
foco, y la luz que refleja es conducida mediante un sistema de espejos hacia un
dispositivo denominado CCD (Charge Coupled Device, dispositivo acoplado por
carga eléctrica), que consiste en una serie de diodos sensibles a la luz, formado
por diodos rojo, verde y azul, donde la cantidad de diodos por pulgada determina
la resolución del dispositivo, por ejemplo un escáner de 300 ppp (puntos por
pulgada), por cada pulgada de superficie análoga lleva 300 diodos rojos, 300
verdes y 300 azul. Estos diodos convierten la luz en corriente eléctrica,
dependiendo de la intensidad de luz reflejada, la corriente eléctrica va variando su
voltaje obteniendo un formato analógico. Los impulsos eléctricos que entrega el
CCD pasan a un dispositivo denominado DAC (Digital Analogic Converter,
Conversor Analógico Digital) que interpreta las variaciones del voltaje eléctrico y
las convierte en píxeles digitales, según la resolución del escáner crea los píxeles
por pulgada. Finalmente, el caudal de bits obtenido es transmitido a la
computadora por el puerto de conexión del escáner.
Existen distintos tipos de escáner con diferentes formatos que se adaptan a cada
necesidad de trabajo. La resolución de escaneo dada por el dispositivo CCD varia
de acuerdo al precio y calidad en general del aparato. El rendimiento para la
transmisión de datos a la computadora depende del tipo de conexión entre el
escáner y la PC, desde las que transmiten los datos escaneados más rápidamente
como la conexión SCSI o FireWire hasta las más lentas como el USB o de puerto
paralelo.
5
::: Tipos de Escáner existentes en el área de digitalización T.I.A.C.:::
Escáner plano con alimentador automático de originales y adaptador de
diapositivas. Este dispositivo es utilizado para
digitalizar fotos y libros y documentos por el equipo de
digitalización. Debido al daño posible a los originales la
función de alimentador automático de documentos, no se
utiliza en documentos patrimoniales. A su vez el
adaptador de diapositivas, no cumple con los requisitos
para ser utilizado en preservación de objetos
patrimoniales.
Escáner de planos. Este escáner diseñado para digitalizar grandes pliegos de
papel, de hasta 106cm de lado menor, es utilizado en el
área de digitalización T.I.A.C. para digitalizar todas las
hojas de papel que superen el tamaño máximo permitido
por los escáneres de cama plana. Asegurando la óptima
calidad de las digitalizaciones obtenidas. Cabe aclarar
que no todos los documentos son susceptibles de ser
digitalizados en este escáner, ya que los originales en
alto estado de deterioro pueden sufrir deterioros, ya que el sistema de tracción de
papel utiliza una serie de rodillos de goma porosa. De acuerdo al tipo de original,
es posible que este sea colocado entre dos planchas de acetato al momento de su
digitalización, a fin de evitar el contacto de los rodillos con el original, previniendo
su deterioro.
Escáner de transparencias. Específicamente diseñado para digitalizar negativos,
transparencias de 35mm y placas medio formato, es
utilizado para la preservación de documentos en este
soporte. Asegurando la obtención de digitalizaciones de la
más alta calidad, gracias a su gran resolución óptica.
6
::: Otros tipos de Escáner :::
Escáner plano o (Flat bed). Este es el tipo mas conocido de escáner, el original
se coloca sobre el vidrio, donde queda fijo
y luego se cubre con la tapa, el dispositivo
de digitalización (CCD) se mueve por
debajo del vidrio iluminando el original
para digitalizar. Es importante que la tapa
este bien cerrada para que no se filtre luz
por los costados, que alteraría la calidad
de la digitalización.
Escáner plano con alimentador automático de originales. Este tipo de
dispositivo es como un escáner plano con el agregado
de un alimentador automático de papel como el de una
impresora o una fotocopiadora, este sistema funciona
por un rodillo de goma porosa que arrastra el original
hasta el vidrio. Su principal ventaja es que no hace falta
abrir y cerrar la tapa para poner cada original, sino que
se los carga todos juntos en la bandeja y el alimentador
los transporta uno por uno sobre la superficie del
escáner. El inconveniente de esta tecnología es que para hacer llegar el original a
la superficie de escaneo, el rodillo hace girar el papel por un rodillo y este proceso
puede dañar el original, es por esto que antes de utilizar este tipo de escáner se
debe controlar que los originales estén en buenas condiciones; si el papel del
documento que deseamos digitalizar presenta roturas, arrugas, humedad o se
encuentra en un estado de vejez avanzado, puede suceder que se trabe y arrugue
dentro del alimentador dañándose gravemente. Por lo tanto no son útiles para el
procesamiento de objetos patrimoniales.
7
Escáner plano para transparencias y negativos. Este tipo de escáner es como
un escáner plano normal, con la
particularidad de poseer iluminación
desde el vidrio y desde un dispositivo
especial en la tapa con carro y foco de
luz duplicados, de manera tal que
frente a la necesidad de digitalizar un
negativo, transparencia o diapositiva,
la luz cruzará el documento para captar un muestreo completo. Aquí la iluminación
del documento es doble, de arriba y de abajo. Con estos escáneres se pueden
digitalizar también negativos en placa de vidrio. Para el caso de negativos de
35mm estos modelos suelen traer plantillas donde colocar las tiras de negativo de
manera perfectamente alineada, e incluso algunos modelos avanzados traen una
bandeja removible para cargarlos más rápidamente. Estos escáneres también
pueden digitalizar documentos normales. Algunos modelos de escáneres planos
normales aceptan la posibilidad de agregarle un modulo para transparencias
cambiando la tapa simple por una especial. Aunque este tipo de escáner posee la
capacidad de escanear tanto negativos 35mm como diapositivas, poseen una
escasa resolución, limitada por el CCD, ya que están diseñados para la
digitalización de originales de gran tamaño.
Escáner de transparencias.
Están diseñados específicamente para negativos y
transparencias por lo general de 35mm y placas medio
formato, cuentan con una plantilla rígida donde se
introduce la transparencia, por lo general son lentos ya que
poseen una muy alta resolución óptica digitalizando sobre
un objeto mucho menor.
8
Escáner de trayectoria
Trabajan con luz ambiente, tienen el
dispositivo CCD montado sobre un brazo
que apunta hacia una mesa con
iluminación propia. Son ideales para
trabajar grandes formatos hasta A1, o
libros que por su delicado estado no
pueden ser desencuadernados. Esta
tecnología de digitalización es la menos
agresiva para trabajar con documentos
antiguos y muy delicados, ya que no lo
somete a un rodillo ni lo presiona con una
tapa. Su productividad es alta debido a los
controles por pedales para dar la orden de
digitalizar después de pasar cada página.
Escáner de Tambor
En lugar de utilizar un dispositivo CCD trabajan con
un sistema PMT (Photo Multiplier Tube) que consiste
en una serie de tubos foto-multiplicadores que toman
el muestreo punto por punto de la imagen para su
digitalización. Son los escáneres que alcanzan la
mayor resolución óptica real (hasta 4000 dpi). Pero
su operación es compleja, su rendimiento es lento y
no son recomendables para documentos delicados
ya que deben ser montados en un rodillo que ejerce
una fuerte presión sobre el original.
9
Escáner de Microfilm
Básicamente su formato consiste en el procesamiento de
rollos de microfilm y microfichas. Fueron creados para
digitalizar colecciones que para su preservación han sido
microfilmadas. Plantean una muy útil herramienta para
migrar de manera rápida y efectiva documentos
microfilmados a formatos digitales. Son equipos caros,
delicados y operarlos requiere una capacitación
específica. La calidad de la imagen digital a obtener
dependerá en gran parte del estado de conservación en
que se encuentre el microfilm.
Las cámaras digitales
Su funcionamiento es similar al de una cámara
fotográfica convencional con la particularidad de que en
lugar de registrar la señal lumínica en una película de
negativos fotosensible, dirige la luz capturada por la lente
hasta un dispositivo CCD similar al de los escáneres.
En el aspecto digital, la calidad de la imagen tomada
depende de la resolución del CCD de la máquina; y en el
aspecto óptico de la calidad en general de la cámara
(Lentes y reguladores). Existe, al igual que en el
mercado de las cámaras fotográficas normales, una
variada gama de modelos, las más comunes son las
compactas con distintas resoluciones, y luego las
profesionales que son las más indicadas para el trabajo de preservación, ya que
alcanzan calidades similares a las de las cámaras puramente ópticas, siempre
teniendo en cuenta que estas últimas gozan de una resolución ilimitada y las
digitales una limitada.
10
::: La interfaz TWAIN :::
La mayoría de los escáneres actuales son compatibles con TWAIN, lo que
significa que podremos acceder al escáner desde cualquier software que tenga un
modulo TWAIN (Technology Without An Interesting Name, Tecnología Sin Un
Nombre Interesante), es decir que el modulo TWAIN funciona como intermediario
entre el escáner y la aplicación compatible que estemos corriendo, como el
photoshop, Corel e inclusive el Word. Pero cada marca y modelo de escáner tiene
un software de control especifico para comunicarse con sus dispositivos internos
por eso aunque utilicemos la interfaz TWAIN desde cualquier aplicación siempre
accederemos a la interfaz de trabajo del software especifico del escáner, donde
por lo general se controlan variables como previsualización, resolución, tamaño y
gama de color. Al acceder al software de escaneo desde una aplicación con
TWAIN, la imagen que digitalicemos se plasmará sobre el documento activo de la
aplicación.
::: El OCR :::
La tecnología OCR (Optical Character Recognition, Reconocimiento Óptico de
Caracteres) permite transformar escritura impresa, en texto de formato reconocible
por una computadora, y por lo tanto editable y susceptible de aceptar búsquedas
textuales. Este proceso se realiza por software sobre el documento ya digitalizado,
generalmente sobre formato Tiff. En el estado actual de esta tecnología solo se
puede reconocer texto proveniente de escritura impresa de formatos básicos,
aunque existen desarrollos de sistemas ICR (Intelligent Character Recognition,
Reconocimiento Inteligente de Caracteres) que pueden llegar a reconocer letra
manuscrita en condiciones óptimas. Para procesar un documento con este
sistema se debe cuidar que el texto este perfectamente alineado con los bordes
del escáner y que no este borroso o humedecido al punto de engrosar y deformar
el trazo del texto impreso. La desventaja de emplear este sistema en preservación
es en la conversión a texto se pierde la riqueza de la tipografía original y los
adornos paratextuales.
A + OCR = A, a, A, a, a, etc. ( se vuelve editable )
11
2- ::: PRESERVACIÓN DIGITAL :::
La preservación es un trabajo que tiene como objetivo hacer perdurar en el tiempo
un objeto que reviste un valor cultural patrimonial. La digitalización es una potente
herramienta de preservación que permite capturar el contenido semántico de un
objeto y preservarlo en el tiempo.
El trabajo de preservación digital debe cumplimentar las siguientes pautas
fundamentales:
• No alterar el contenido semántico del objeto que le ha sido confiado.
Durante el proceso de digitalización no se deben agregar procesos
posteriores de mejoramiento artificial de la imagen, se debe cuidar que los
dispositivos de captura no agreguen estos post-procesos de manera
automática, es decir, que no estén incluidos en el funcionamiento del
software o del hardware, se debe cuidar este aspecto en la búsqueda de la
mayor fidelidad posible. Los procesos de restauración y reconstrucción
deben ser contemplados en otra etapa y con un criterio muy cuidado.
• La preservación digital debe preservar en el tiempo. La tecnología digital
no presenta deterioro en la calidad de los datos confiados. Si un archivo
digital es almacenado en las condiciones adecuadas y con su
correspondiente copia de seguridad no alterara la calidad de la imagen
contenida. La permanencia en el tiempo de un acervo digital dependerá de la
duración de su soporte físico que es perenne, por lo que requerirá que se
realicen copias de seguridad y que con el paso de los años y a medida que la
tecnología y el mercado cambien, se migren los datos a los soportes
vigentes. La información digital no se deteriora ni altera durante la copia o la
migración de soportes sin importar el número de veces que esto suceda.
12
• Los formatos de archivos digitales utilizados no deben comprimir la
información y deben ser estándares de uso libre y gratuito. El formato
de una archivo digital, que se conoce por su extensión (por ejemplo: .Tiff,
.Bmp, .Gif), no debe pertenecer a un desarrollador en particular sino que
debe ser de uso libre por cualquier sistema operativo y aplicación de
visualización, de manera de no atar la recuperación de la imagen
digitalizada a los cambios y estrategias del mercado informático. El formato
elegido tampoco debe comprimir la información ya que esto alteraría el
contenido de la imagen, la tecnología de compresión de datos aplicada
sobre imagen interpola los pixels. Un formato de imagen digital con
compresión degenerativa como el JPEG (Joint Photographic Experts
Group) solo debe ser utilizado para copias de consulta que requieran un
tamaño en bytes reducido para su mejor consulta On-line tanto en una
intranet como en Internet. Los Masters o copias en alta resolución no deben
estar procesados con un formato de compresión con perdida de datos. Un
archivo de extensión Tiff (Tagged Image File Format) por ejemplo, puede
ser recuperado por cualquier sistema operativo con un software de
visualización estándar, no pertenece a ninguna empresa en especial y no
comprime la información.
• El fin último de todo trabajo de preservación digital debe ser la consulta.
El objetivo de preservar un objeto que reviste el carácter de patrimonio
histórico y cultural es el de poder ser consultado y apreciado. A estos fines la
preservación digital aporta la capacidad de visualizar el objeto sin
deteriorarlo, es decir, que el original no será manoseado ni lastimado durante
su consulta. Para poder consultar una imagen digitalizada así como para
recuperar un original almacenado en una fototeca, debe existir un proceso de
catalogación que produzca una ficha sobre ese original con su
correspondiente código de identificación. El hecho de tener la imagen
digitalizada nos permite la visualización inmediata del objeto durante la
consulta de la base de datos. Con el agregado de que una base de
metadatos informatizada permite realizar búsquedas inteligentes cruzando
datos. Es fundamental la selección adecuada del criterio de catalogación de
13
un acervo ya que de las fichas y solo de ellas dependerá la recuperación de
las imágenes y el acierto de las búsquedas futuras.
• La normalización en preservación digital establece la necesidad de poder
reproducir la imagen digitalizada con sus características originales.
Existe una normalización Internacional ISO que pauta la resolución con que
se debe escanear una imagen para obtener una reproducción fiel al original,
las normas ISO establecen, en síntesis, que la imagen digitalizada debe
poder ser reproducida en el mismo tamaño y calidad gráfica que el original.
Para lograr esto se debe diferenciar entre resolución de escaneo, o sea
inicial, y resolución final. Si queremos digitalizar por ejemplo un negativo de
35 mm y obtener un positivo de 13 x 18 cm en 300 dpi (dots per inch ó puntos
por pulgada), la resolución de escaneo o inicial según las normas ISO
deberá ser de 1500 dpi. Este cálculo sale de la simple relación proporcional
del original respecto del tamaño de la imagen digital que se desea obtener.
Teniendo en cuenta estos principios llegaremos a lograr una imagen digital
que permita la reproducción fiel del original.
14
::: BALANCEO Y RESTAURACIÓN DIGITAL :::
Este proceso de mejoramiento debe ser llevado a cabo siempre con el especial
cuidado de no alterar el contenido del documento confiado. El trabajo debe ser
realizado por un especialista con perfil experimentado en fotografía y manejo de
software de edición fotográfica preferentemente Adobe Photoshop.
::: Pautas:::
• El trabajo se deberá limitar al balanceo de las curvas tonales, la eliminación
de accidentes sobre el documento como rayas, puntos de oxidación,
manchas de humedad y roturas leves.
• No se debe abusar de los filtros para agregar nitidez a la imagen.
• Se debe trabajar con el original a la vista para monitorear posibles
borramientos de contenido y alteraciones de color.
• La tarea de restauración digital no debe reemplazar el trabajo de
restauración física del original, que es siempre más fiel al contenido del
original.
Maximiliano Tocco
Jefe Técnico Área de Digitalización TIAC
15