Teclaaaa
Temas abordados
Teclaaaa
Temas abordados
LA DOCUMENTACTON
2
Tema 4. Tipos y formatos de documentos
figura l). Puede que cuando estos aparatos funcionen de forma adecuada y esten
disponibles para el gran publico, la ergonomia de lowwewewewewsccs documentos
digitales iguale a la de los documentos en papel.
3
Universitat Jaume I Herramientas Informaticas para la Documentaci6n
4
Tema 4. Tipos y formatos de documentos
2. Documentos digitales
En este apartado vamos a tratar de clasificar los distintos tipos de documentos digitales
existentes y a revisar sus principales caracteristicas
2.1. Tipos de documentos
En primer lugar, podemos clasificar los documentos electr6nicos en funci6n del tipo de
informaci6n que almacenan. En este sentido podemos diferenciar cuatro grandes tipos
de documentos: textuales, no textuales, multimedia e hipertexto. Revisemos brevemente
en que consiste cada uno de estos tipos de documentos:
• Documentos textuales. Este tipo de documentos contienen solamente texto y
suelen ser bastante habituales. Por ejemplo, la mayoria de los libros pueden
almacenarse en este formato, pero tambien numerosos articulos en prensa o en
revistas, legislaci6n, etc. Dos de las principales ventajas de este formato son la
posibilidad de visualizarlos facilmente sin problemas de formato al cambiar de
ordenador o de programa, y la gran cantidad de informaci6n textual que
podemos almacenar en un espacio muy reducido, p.e. un disquete o un disco
6ptico. Ademas, existen una gran cantidad de programas que nos permiten
visualizar y modificar los documentos de este tipo.
• Documentos no textuales. Son documentos que contienen otro tipo de
informaci6n distinta del texto. Por ejemplo, podemos incluir en este tipo de
documentos aquellos que almacenan imagenes estaticas, sonidos, peliculas o
programas ejecutables.
• Documentos multimedia. Son documentos electr6nicos que combinan textos,
graficos, sonidos, imagenes y programas ejecutables. Estos documentos
permiten la interacci6n del usuario, y se componen de muchos elementos de
informaci6n diferentes cuyo contenido puede variar en algunos casos como
resultado de la interacci6n con el usuario. Como ejemplos destacables de este
tipo de documentos, podemos citar las paginas web o las enciclopedias
interactivas en CD.
• Hipertextos. Son documentos que permiten definir una estructura compleja
compuesta de elementos con diferentes tipos de informaci6n multimedia unidos
mediante enlaces l6gicos. Se trata de documentos que pueden ser hojeados
rapidamente y cuya visualizaci6n no tiene que ser secuencial. La manera de
interaccionar con estos documentos consiste en ir recorriendo los elementos de
informaci6n (textos, imagenes, animaciones, ...) en el orden preferido
utilizando para ello los enlaces disponibles. De esta manera se puede ir
descartando c6modamente aquella informaci6n que se considere irrelevante, al
tiempo que se profundiza en los aspectos que se consideren oportunos. El
ejemplo mas conocido de este tipo de documentos son las paginas web.
5
Universitat Jaume I Herramientas Informaticas para la Documentaci6n
6
Tema 4. Tipos y formatos de documentos
7
Universitat Jaume I Herramientas Informaticas para la Documentaci6n
Por ahora, los libros digitales son un instrumento muy util para realizar consultas de
forma rapida y sencilla, como las que se pueden realizar a un diccionario. Ahora bien,
los libros dirigidos al gran publico, con tiradas elevadas, siguen editandose mediante el
sistema tradicional y en papel. No obstante, ya existen experiencias en la distribuci6n de
algunos superventas, a traves de la web. Baste citar el ejemplo del libro de Arturo Perez
Reverte El oro del rey, que pudo accederse durante un mes por Internet en formato
PDF, antes de editarse a un precio muy superior en su versi6n tradicional. Tambien cabe
citar el libro Riding the bullet, de Stephen King, que se distribuy6 de forma exclusiva
por Internet y que se vendi6 a mas de 500.000 lectores durante las dos primeras
semanas, antes de tener problemas con las copias piratas del mismo.
En un futuro no muy lejano, cuando mejore notablemente la calidad de los dispositivos
portatiles de lectura o cuando se llegue a un minimo acuerdo sobre el formato de
almacenamiento y distribuci6n, muchos libros se editaran en formato digital y podran
8
Tema 4. Tipos y formatos de documentos
ser vendidos a traves de Internet, con todas las ventajas que ello comporta. En l999 se
fund6 el Open eBook Forum (www.openebook.org) que reune a compafiias de hardware
y software, editores, autores y usuarios de libros electr6nicos y cuyo objetivo es
establecer las especificaciones y estandares para la publicaci6n digital (ver figura 4).
9
Universitat Jaume I Herramientas Informaticas para la Documentaci6n
l0
Tema 4. Tipos y formatos de documentos
Quedan algunos problemas por resolver en relaci6n a las revistas electr6nicas. Por
ejemplo, el prestigio de las publicaciones en papel suele ser muy superior que el de las
versiones electr6nicas sin este respaldo, aunque como hemos comentado anteriormente,
las grandes editoriales comienzan a editar versiones electr6nicas de las revistas mas
prestigiosas.
2.4. Prensa
La prensa es uno de los sectores que esta utilizando con mayor profusi6n y exito la
distribuci6n digital de sus contenidos. La tendencia actual se orienta a la distribuci6n a
traves de la web de los peri6dicos, tomando como base las mismas noticias que los
periodistas han elaborado y que se han publicado en la edici6n impresa, a las cuales se
suelen afiadir diversas singularidades que comentaremos a continuaci6n.
Casi todos los grandes peri6dicos del mundo disponen de versiones en linea a traves de
Internet. En Espafia, y segun datos de la cuarta encuesta a usuarios de Internet (abril-
junio de 200l) realizada por la Asociaci6n de Investigaci6n de los Medios de
Comunicaci6n (www.aimc.es), de las primeras l5 webs que habian visitado
recientemente los usuarios, tres corresponden a prensa escrita, concretamente: El Pais,
El Grupo Recoletos (peri6dicos econ6micos como Expansion y deportivos como
Marca) y El Mundo.
Las caracteristicas comunes a las ediciones digitales de los peri6dicos son las siguientes:
ll
Universitat Jaume I Herramientas Informaticas para la Documentaci6n
l2
Tema 4. Tipos y formatos de documentos
Por ultimo, y tambien en relaci6n con la prensa en Internet, hemos de destacar que
practicamente todos los portales de Internet incluyen un sistema de noticias que permite
acceder a las ultimas noticias publicadas en prensa o distribuidas por las agencias.
l3
Universitat Jaume I Herramientas Informaticas para la Documentaci6n
Las obras de referencia primarias incluyen la informaci6n que se quiere consultar, por
ejemplo, la definici6n de un termino, el contenido de una determinada ley o el mapa de
un pais dado.
Las obras de referencia secundarias remiten a otros libros o documentos para poder
encontrar la informaci6n buscada. Un ejemplo de este tipo de obra de referencia seria un
catalogo de biblioteca.
En el caso de las obras de referencia las principales ventajas de las versiones digitales
con respecto a las versiones en papel son, la facilidad y rapidez en la busqueda, la
capacidad de navegar en su contenido conectando temas afines y la velocidad con la que
pueden actualizarse sus contenidos.
Revisaremos a continuaci6n los principales tipos de obras de referencia existentes,
dando algunos ejemplos accesibles a traves de Internet.
2.5.1. Diccionarios
Los diccionarios, presentan la informaci6n por orden alfabetico y explican el significado
de terminos o conceptos, o nos muestran su traducci6n a otro idioma.
Existen una gran cantidad de tipos de diccionarios, incluyendo los generales, los
normativos, los de uso, los especializados. Algunos de ellos se distribuyen en CD, y
tambien podemos encontrarlos en Internet. Un ejemplo reciente de incorporaci6n de este
tipo de diccionarios a Internet es el caso del Diccionario de la Real Academia de la
Lengua (www.rae.es), cuya pagina principal puede verse en la figura l0. Hasta la fecha
venia publicandose tan s6lo su versi6n en papel cada l0 afios, con lo cual el avance
continuo de la lengua lo superaba en poco tiempo. El objetivo de la Real Academia es
actualizar la versi6n por Internet de modo continuo, interaccionar con los usuarios y
editar una versi6n en papel cada dos o tres afios.
l4
Tema 4. Tipos y formatos de documentos
Figura l0. Resultado de una busqueda en la pagina del Diccionario de la Real Academia Espafiola.
No obstante, el tipo de diccionarios mas comunes en Internet son los bilingiies, que nos
permiten traducir palabras de un idioma a otro. A traves de paginas como Your
Dictionary (www.yourdictionary.com) es posible acceder a diccionarios bilingiies en
varios cientos de idiomas, incluyendo desde el ingles y el aleman, hasta el chino o el
esperanto. Esta misma pagina tambien permite el acceso a decenas de diccionarios
especializados en temas tales como los negocios, la informatica, el derecho, la medicina
o los deportes.
2.5.2. Enciclopedias
Las enciclopedias son obras de referencia que reunen el conocimiento y la experiencia
de una determinada sociedad, y que la presentan en un orden preestablecido.
l5
Universitat Jaume I Herramientas Informaticas para la Documentaci6n
linea de las enciclopedias tradicionales son mas bien escasas. Existen algunas
enciclopedias como la Enciclopedia Britanica (www.eb.com) que, ademas de editar una
versi6n en CD y DVD, permiten el acceso gratuito durante unos dias a su versi6n en
linea y el acceso continuado previa suscripci6n. En la figura ll podemos ver la pagina
principal de esta enciclopedia.
2.5.3. Directorios
El directorio es una obra de referencia que contiene informaci6n presentada en orden
alfabetico o cronol6gico que permite la identificaci6n o localizaci6n de personas,
organismos o empresas. Si se trata de directorios de personas, pueden incluir su nombre,
actividad, funci6n, direcci6n, telefono o correo electr6nico.
Internet incorpora un servicio de directorio denominado X.500, o el mas reciente LDAP
(Lightweight Directory Access Protocol), que en principio deberia permitir encontrar las
direcciones postales, numeros de telefono y direcciones de correo electr6nico de
personas que forman parte de organizaciones que estan conectadas a Internet. No
obstante este sistema funciona muy mal y tan s6lo permite acceder en ocasiones a datos
sobre personas que trabajan en la misma empresa u organizaci6n. Por ejemplo, la UJI
dispone de un sistema de directorio basado en el servicio X.500, ademas de estar
incorporando otro basado en el LDAP (ver figura l2).
l6
Tema 4. Tipos y formatos de documentos
Figura l4. Ejemplo de mapa interactivo de Espafia que podemos encontrar en Internet.
l7
Universitat Jaume I Herramientas Informaticas para la Documentaci6n
Como ejemplo de callejero que nos puede permitir ver planos de zonas de distintas
ciudades de Espafia, podemos acceder al incluido en el peri6dico El Mundo
(www.elmundo.es/callejero).
2.5.5. Publicaciones oficiales
Uno de los tipos de publicaci6n que se ha venido difundiendo en versi6n electr6nica
desde hace mas tiempo son los repertorios de legislaci6n y las publicaciones oficiales.
Desde hace muchos afios, editoriales especializadas como Aranzadi vienen
distribuyendo en CD las disposiciones legales incluidas en el BOE o dictadas por los
gobiernos de las comunidades aut6nomas o de la Uni6n Europea.
Asimismo, y desde hace menos tiempo, podemos acceder a traves de Internet a los
contenidos de los ultimos numeros de los boletines oficiales, tanto a nivel provincial y
auton6mico (DOGV - www.pre.gva.es/dogvweb/cindex.htm), como nacionales (BOE -
www.boe.es) o de la Uni6n Europea (DOCE - europa.eu.int/eur-lex/es/o).
l8
Tema 4. Tipos y formatos de documentos
l9
Universitat Jaume I Herramientas Informaticas para la Documentaci6n
3. Tipos de software
En este apartado vamos a revisar brevemente los principales tipos de programas que es
posible encontrar en Internet.
En primera instancia podemos diferenciar los programas comerciales, desarrollados
por fabricantes de software y de pago, de los programas de libre distribucion,
pensados para su difusi6n por Internet, en muchos casos de forma totalmente gratuita.
Los formatos mas comunes de software de libre distribuci6n son los siguientes:
Shareware. Como su propio nombre indica, estan pensados para ser compartidos y
distribuidos. La idea de este tipo de software es que el usuario pruebe su funcionamiento
durante un tiempo, y si le resulta de utilidad y va a seguir usandolo, pague una pequefia
cantidad a su autor.
Freeware. Su finalidad es similar a la del tipo anterior, pero en este caso se trata de
software totalmente gratuito que puede usarse y copiarse sin ninguna restricci6n.
Ademas de los dos formatos anteriores, en Internet podemos encontrar otros tipos de
programas:
Addware. Se trata de versiones de programas que podemos descargar de Internet y
utilizar de modo totalmente gratuito. Sin embargo, estos programas insertan en alguna
de sus ventanas publicidad.
Versiones de demostracion. Muchos fabricantes de software distribuyen versiones de
demostraci6n de sus programas. Estas versiones suelen tener una funcionalidad limitada
respecto a la versi6n de pago y pueden dejar de funcionar al cabo de unos dias.
Actualizaciones. Se trata de pequefios programas que actualizan las versiones de otros
que tenemos instalados a unas mas nuevas. En muchas ocasiones la compra de un
programa nos da derecho a recibir actualizaciones peri6dicas del mismo de modo
gratuito o a un precio mas reducido.
20
Tema 4. Tipos y formatos de documentos
4. Formatos de documento
En el ambito de la informatica, todos los documentos, y en general toda la informaci6n
que es manejada mediante ordenadores se almacena en forma de
fiedededeededeededcheros. Los ficheros son el elemento basico mediante el cual los
sistemas operativos almacenan la informaci6n. Sistemas Operativos como las distintas
versiones de Windows o de UNIX almacenan toda la informaci6n en ficheros y la
organizan en los dispositivos de almacenamiento (discos duros, disquetes, discos
6pticos, etc.) mediante un sistema jerarquico de ficheros y directorios. Windows
representa graficamente estos elementos mediante iconos correspondientes a ficheros y
carpetas donde se almacenan, tanto los ficheros como otras carpetas.
Los ficheros guardan la informaci6n en un determinado formato que, en sistemas
operativos de tipo Windows, se identifica mediansssassssssssssssste una extensi6n de 2
a 4 letras afiadidas a su nombre y mediante un tipo particular de icono con el que se
representa en pantalla.
Cuando hablamos de formato de un fichero informatico nos referimos a la forma en que
se ha codificado la informaci6n en el mismo, esto es, en ultimo termino el formato de
un fichero es el modo en que se ha traducido a ceros y unos la informaci6n que
almacena. Este formato debe ser reconocido e interpretado de forma adecuada por los
programas que lo manejan para poder visualizar y manipular la informaci6n que
contienen.
Existen formatos propios de determinadas aplicaciones que corresponden a la forma en
que las mismas almacenan la informaci6n por defecto. Por ejemplo, los documentos
almacenados mediante Microsoft Word suelen tener la extensi6n .doc, mientras los
almacenados con WordPerfect usan la extensi6n .wpf. Por otro lado, existen formatos de
fichero mas genericos que corresponden a un tipo particular de informaci6n y que
pueden venir o no dados por un estandar. Por ejemplo, la mayoria de las imagenes que
se manejan en Internet se almacenan en formato GIF o JPEG. En el caso de los formatos
genericos, existen distintos programas que pueden leerlos y visualizarlos y que nos
pueden permitir modificar el contenido de los ficheros. Asi, numerosas aplicaciones
graficas nos permiten acceder a los formatos GIF y JPEG o guardar los graficos que
hemos generado o modificado con ellas en estos formatos. Lo anterior no significa que
no podamos intentar abrir cualquier tipo de fichero con la mayoria de las aplicaciones.
Lo que ocurre simplemente es que cuando las aplicaciones no reconocen un
determinado formato, pueden producir un error o bien mostrarnos la informaci6n mas
extrafia imaginable en pantalla, tal y como puede constatarse en la figura l8.
2l
Universitat Jaume I Herramientas Informaticas para la Documentaci6n
Figura l8. Ejemplo de resultado en pantalla al abrir un fichero no reconocido por el procesador Word.
22
Tema 4. Tipos y formatos de documentos
23
Universitat Jaume I Herramientas Informaticas para la Documentaci6n
00l00000 00l0000l 00l000l0 00l000ll 00l000ll 00l00l0l 00l00ll0 00l00lll 00l0l000 00l0l00l 00l0l0l0 00l0l0ll
32 33 34 35 36 37 38 39 40 4l 42 43
" # $ % & ( ) * +
00l0ll00 00l0ll0l 00l0lll0 00l0llll 00ll0000 00ll000l 00ll00l0 00ll00ll 00ll0l00 00ll0l0l 00ll0ll0 00ll0lll
44 45 46 47 48 49 50 5l 52 53 54 55
, - . I 0 l 2 3 4 5 6 7
00lll000 00lll00l 00lll0l0 00lll0ll 00llll00 00llll0l 00lllll0 00llllll 00l00000 0l00000l 0l0000l0 0l0000ll
56 57 58 59 60 6l 62 63 64 65 66 67
8 9 : < > ? @ A B C
0l000l00 0l000l0l 0l000ll0 0l000lll 0l00l000 0l00l00l 0l00l0l0 0l00l0ll 0l00ll00 0l00ll0l 0l00lll0 0l00llll
68 69 70 7l 72 73 74 75 76 77 78 79
D E F G H I J K L M N O
0l0l0000 0l0l000l 0l0l00l0 0l0l00ll 0l0l0l00 0l0l0l0l 0l0l0ll0 0l0l0lll 0l0ll000 0l0ll00l 0l0ll0l0 0l0ll0ll
80 8l 82 83 84 85 86 87 88 89 90 9l
P Q R S T U V W X y z [
0l0lll00 0l0lll00 0l0llll0 0l0lllll 0ll00000 0ll0000l 0ll000l0 0ll000ll 0ll00l00 0ll00l0l 0ll00ll0 0ll00lll
92 93 94 95 96 97 98 99 l00 l0l l02 l03
\ ] I\ a b c d e f g
0ll0l000 0ll0l00l 0ll0l0l0 0ll0l0ll 0ll0ll00 0ll0ll0l 0ll0lll0 0ll0llll 0lll0000 0lll000l 0lll00l0 0lll00ll
l04 l05 l06 l07 l08 l09 ll0 lll ll2 ll3 ll4 ll5
h i j k l m n o p q r s
0lll0l00 0lll0l0l 0lll0ll0 0lll0lll 0llll000 0llll00l 0llll0l0 0llll0ll 0lllll00 0lllll0l 0llllll0 0lllllll
ll6 ll7 ll8 ll9 l20 l2l l22 l23 l24 l25 l26 l27
t u v w x y z { } DEL
l0000000 l000000l l00000l0 l00000ll l0000l00 l0000l0l l0000ll0 l0000lll l000l000 l000l00l l000l0l0 l000l0ll
l28 l29 l30 l3l l32 l33 l34 l35 l36 l37 l38 l39
ii e a a a a e e e y
l000ll00 l000ll0l l000lll0 l000llll l00l0000 l00l000l l00l00l0 l00l00ll l00l0l00 l00l0l0l l00l0ll0 l00l0lll
l40 l4l l42 l43 l44 l45 l46 l47 l48 l49 l50 l5l
1 A A E IE 6 6 0 G u
l00ll000 l00ll00l l00ll0l0 l00ll0ll l00lll00 l00lll0l l00llll0 l00lllll l0l00000 l0l0000l l0l000l0 l0l000ll
l52 l53 l54 l55 l56 l57 l58 l59 l60 l6l l62 l63
y 6 D 0 £ 0 x f a i 6 u
l0l00l00 l0l00l0l l0l00ll0 l0l00lll l0l0l000 l0l0l00l l0l0l0l0 l0l0l0ll l0l0ll00 l0l0ll0l l0l0lll0 l0l0llll
l64 l65 l66 l67 l68 l69 l70 l7l l72 l73 l74 l75
fi N a 0 l ® i « »
l0ll0000 l0ll000l l0ll00l0 l0ll00ll l0ll0l00 l0ll0l0l l0ll0ll0 l0ll0lll l0lll000 l0lll00l l0lll0l0 l0lll0ll
l76 l77 l78 l79 l80 l8l l82 l83 l84 l85 l86 l87
A A A © +
l0llll00 l0llll0l l0lllll0 l0llllll ll000000 ll00000l ll0000l0 ll0000ll ll000l00 ll000l0l ll000ll0 ll000lll
l88 l89 l90 l9l l92 l93 l94 l95 l96 l97 l98 l99
+ ¢ ¥ + + - - + - + a A
ll00l000 ll00l00l ll00l0l0 ll00l0ll ll00ll00 ll00ll0l ll00lll0 ll00llll ll0l0000 ll0l000l ll0l00l0 ll0l00ll
200 20l 202 203 204 205 206 207 208 209 2l0 2ll
+ + - - - + E E
ll0l0l00 ll0l0ll0 ll0l0lll ll0ll000 ll0ll00l ll0ll0l0 ll0ll0ll ll0lll00 ll0lll00 ll0lll0l ll0llll0 ll0lllll
2l2 2l3 2l4 2l5 2l6 2l7 2l8 2l9 220 22l 222 223
E f f r + + t
lll00000 lll0000l lll000l0 lll000ll lll00l00 lll00l0l lll00ll0 lll00lll lll0l000 lll0l00l lll0l0l0 lll0l0ll
224 225 226 227 228 229 230 23l 232 233 234 235
6 B 6 6 0 6 µ (J (J (J
lll0ll00 lll0ll0l lll0lll0 lll0llll llll0000 llll000l llll00l0 llll00ll llll0l00 llll0l0l llll0ll0 llll0lll
236 237 238 239 240 24l 242 243 244 245 246 247
y y - ± § ,
lllll000 lllll00l lllll0l0 lllll0ll llllll00 llllll0l lllllll0 llllllll
248 249 250 25l 252 253 254 255
. l 3 2
Tabla l. C6digo ASCII extendido. En cada celda: c6digo binario, decimal y caracter correspondiente.
24
Tema 4. Tipos y formatos de documentos
La principal ventaja del texto puro es que utiliza una codificaci6n estandar de cada
simbolo. De este modo, numerosas aplicaciones pueden leer el contenido de este tipo de
documentos y nos permiten su modificaci6n. Asi, todos los procesadores y editores de
texto pueden leer documentos en este formato y la mayoria de ellos ofrecen la
posibilidad de guardar los documentos utilizandolo. Esto hace que con el fin de facilitar
la maxima difusi6n de la informaci6n y simplificar su acceso, muchos de los
documentos que podemos encontrar en Internet se encuentren en formato de texto puro.
Asi, muchos de los libros electr6nicos que podemos encontrar en los principales
repositorios de la red, estan almacenados en este formato.
Por su propia definici6n los documentos en texto puro no conservan color, formatos o
fuentes porque no permiten incorporarlos, y tampoco permiten incluir imagenes.
Al tratarse de un formato tan simple, la impresi6n del texto puro conserva una alta
fidelidad con el original.
En cuanto a la seguridad, no es posible afiadir condiciones para evitar la alteraci6n de
los documentos en texto puro.
Finalmente, y como otra ventaja de este tipo de formato, los documentos guardados en
el mismo ocupan un espacio muy reducido, dado que s6lo guardan los caracteres que
contienen y ninguna informaci6n adicional sobre su formato.
4.1.2. Generado con procesadores de texto
Una parte importante de los documentos de texto que solemos manejar con los
ordenadores han sido generados utilizando algun procesador de textos. El objetivo de
este tipo de aplicaciones es precisamente la creaci6n o modificaci6n de texto con
formato. Alguno de los procesadores de textos mas conocidos son Microsoft Word y
WordPerfect.
Los procesadores de textos mas extendidos son comerciales y guardan por defecto la
informaci6n en un formato que les es propio. Esto significa que tan s6lo ese mismo
procesador es capaz de leer estos documentos. No obstante, dada la importancia del
facil intercambio de informaci6n, todos los procesadores permiten almacenar los
documentos en otros formatos que no poseen la restricci6n anterior. Por ejemplo,
podemos almacenar la informaci6n como texto puro o en formato RTF (Rich Text
Format). El problema de guardar los documentos con un procesador en un formato
distinto del que le es propio, es que en muchos casos se pierden parte de sus
caracteristicas. Por ejemplo, si guardamos un documento Word como texto puro,
perdemos todo el formato que contiene, incluyendo obviamente cualquier imagen o
grafico.
Otro problema que tienen los formatos propios de los procesadores de texto es la poca
consistencia de los mismos entre distintas versiones del programa. Asi, distintas
25
Universitat Jaume I Herramientas Informaticas para la Documentaci6n
Al igual que ocurre con la visualizaci6n, no siempre es posible imprimir este tipo de
documentos con fidelidad. El resultado depende en gran medida de la versi6n del
procesador que usemos para imprimirlo, de los tipos de caracteres disponibles en el
sistema operativo y de la impresora que utilicemos.
Los principales procesadores de textos suelen incorporar algun mecanismo para
proteger los documentos contra su posterior alteraci6n. Principalmente el uso de
contrasefias.
Otro de los inconvenientes de este tipo de formato es que los ficheros que lo utilizan
suelen ocupar mucho espacio. De hecho, bastante mas del que parece l6gico para incluir
informaci6n sobre su contenido y formato.
4.1.3. Formatos de visualizacion e impresion
Existen formatos especialmente creados para la visualizaci6n e impresi6n de calidad de
textos con formato. Entre ellos podemos destacar dos muy extendidos: El formato PDF
y el formato PostScript.
El formato PDF (Portable Document Format) [.pdf] es un formato muy difundido
creado por Adobe y pensado especialmente para la distribuci6n de textos electr6nicos
con formato. Incorpora todas las caracteristicas deseables para este tipo de formatos:
• Existe un visor universal de libre distribuci6n (gratuito) que permite
visualizar este tipo de documentos en los sistemas operativos mas
extendidos: el Acrobat Reader.
• El formato esta pensado para conservar las fuentes, formatos y colores de los
documentos.
• Permite la ubicaci6n precisa de imagenes y los mantiene ante un cambio de
sistema operativo.
• Aunque no es estrictamente un formato de impresi6n, mantiene un alto grado
de fidelidad al original en las versiones impresas.
26
Tema 4. Tipos y formatos de documentos
27
Universitat Jaume I Herramientas Informaticas para la Documentaci6n
Al igual que ocurre con el formato PDF, los ficheros en PostScript no pueden
modificarse, ni pueden extraerse o copiarse parte de los mismos, tan s6lo pueden
visualizarse y, fundamentalmente, imprimirse.
Los ficheros PostScript suelen generarse a partir de cualquier aplicaci6n que genere un
documento susceptible de ser impreso. Si disponemos de una impresora PostScript y del
software adecuado para imprimir en la misma, las propias aplicaciones permitiran
imprimir sobre un fichero PostScript en lugar de sobre papel.
4.1.4. Lenguajes de formato
Los lenguajes de formato estan pensados para describir el contenido y formato de
documentos. Mediante una sintaxis preestablecida nos permiten describir todas las
caracteristicas relativas al formato del documento y del texto que contienen, pudiendo
incluir aspectos tales como los margenes, las cabeceras, las caracteristicas asociadas a
los caracteres, a los parrafos, etc. Ademas, nos permiten describir tablas y ubicar
imagenes. La idea es poder describir textos electr6nicos con formato totalmente
independiente del entorno en el que estemos visualizandolos, de modo que su apariencia
no varie aunque cambiemos de ordenador o de sistema operativo.
El mas difundido de estos lenguajes de formato en la actualidad es el HTML (HyperText
Mark-Up Language), debido a que se usa para la creaci6n de paginas web. Este lenguaje
de formato tiene su origen en el SGML (Standard Generalized Mark-Up Language) que
constituye un estandar internacional para definir lenguajes de formato basados en
etiquetas. El lenguaje HTML se basa en las normas establecidas por el SGML para dar
formato a textos e incorporar enlaces, es decir, para crear documentos hipertexto con
formato.
28
Tema 4. Tipos y formatos de documentos
El que el lenguaje este basado en el uso de etiquetas significa que existen unos textos
especiales (etiquetas, o tags en ingles) que se incorporan al documento y que permiten
definir las partes de que consta y todo lo relativo al formato de las mismas.
Dado que las paginas web han ido aumentando su complejidad para responder a las
demandas de los usuarios de la web, el lenguaje utilizado para poder describirlas ha ido
evolucionando. De este modo se han definido varias versiones del lenguaje HTML. En
la actualidad la versi6n mas reciente es el HTML 4.0l. No obstante, este lenguaje sigue
teniendo serias limitaciones para adaptarse a las nuevas tecnologias y medios, tales
como la telefonia m6vil. Lo que se ha hecho es definir una nueva versi6n de las normas
dadas por el SGML denominada XML (eXtensible Mark-up Language), a partir de la
cual sera posible definir nuevas versiones del HTML, denominadas XHTML.
Ademas de los lenguajes de formato relacionados con
elwwwwwwwwwwwwwxxxxdededed HTML y con las paginas web, existe otro
lenguaje de formato muy extendido entre los cientificos e investigadores, ya que esta
especialmente pensado para la descripci6n de articulos cientifico-tecnicos con un
formato sofisticado, incluyendo graficos y f6rmulas matematicas complejas. Este
lenguaje se denomina LaTex (ver figura 2l) y existen programas que permiten la
traducci6n de los documentos escritos en el mismo a formatos visualizables o
imprimibles, tales como el PostScript.
Figura 20. Ejemplo de documento en LaTex (detras) y de su resultado una vez interpretado (delante).
29
Universitat Jaume I Herramientas Informaticas para la Documentaci6n
30
Tema 4. Tipos y formatos de documentos
utiliza en Internet. La mayor parte de las imagenes incluidas en paginas web siguen uno
de estos dos formatos y cualquier navegador web puede visualizarlos sin problemas.
El formato JPEG (Join Photographers Expert Group), permite guardar las imagenes en
un formato comprimido. De esta forma, una misma imagen suele ocupar menos espacio
en este formato que en formato GIF. No obstante, la precisi6n con que se guarda la
imagen en formato JPEG es inferior.
En general, para acceder a las imagenes y poder visualizarlas, crearlas o modificarlas
son necesarios programas especiales denominados editores de imagenes. Existen toda
una serie de formatos de amplia difusi6n que permiten el intercambio de imagenes entre
distintos editores, mientras otros son propios de algun editor en concreto y no pueden
ser visualizados por otros. Entre los formatos transferibles cabe destacar el TIFF
(Tagged Image File Format), o el EPS (Encapsulated PostScript) pensado para la
inserci6n de imagenes en documentos PostScript.
4.3. Audio
Menos extendidos que los ficheros de texto o imagenes podemos encontrar los ficheros
de audio. El formato para el almacenamiento de audio mas extendido en el mundo de la
informatica es WAVE File Format [.wav], dado que es el formato por defecto de
Windows.
No obstante, la aparici6n de Internet y la posibilidad de intercambiar canciones por este
medio ha dado lugar a un nuevo formato ampliamente extendido. Se trata del formato
MP3. Este formato mantiene la calidad digital del sonido de los CDs originales pero
permite su almacenamiento en un espacio mucho mas reducido. Asi, mientras una
canci6n en formato WAV puede ocupar unos 40 Mbytes, la misma canci6n almacenada
en formato MP3 suele ocupar entre 3 y 4 Mbytes. Esto permite almacenar mas de l30
canciones en un unico CD. El reducido tamafio de los ficheros de audio en este nuevo
formato, hace que sea el formato imperante para el rapido intercambio de canciones a
traves de Internet y para el almacenamiento de canciones en pequefios reproductores
portatiles que pueden almacenar varias horas de musica. En Internet es posible
encontrar multitud de paginas y repositorios donde es posible obtener, de una forma mas
o menos legal, una gran cantidad de canciones en formato mp3. Asimismo, existen
programas especializados en la creaci6n de grandes repositorios para el intercambio de
este tipo de ficheros. El mas conocido de este tipo de programas es Napster
(www.napster.com).
Existen muchos programas de ordenador que permiten escuchar musica en formato
mp3. El mas conocido de ellos quizas sea Winamp. Ademas, tambien existen programas
que permiten la traducci6n de las canciones incluidas en CDs de musica (CD-A) a este
formato.
3l
Universitat Jaume I Herramientas Informaticas para la Documentaci6n
4.4. Video
En informatica se manejan un numero relativamente reducido de formatos de video. Los
formatos mas comunes son los siguientes:
MPEG (Moving Pictures Experts Groups) - [.mpg]. Es el formato mas difundido para
las pequefias peliculas en Internet, lo cual significa que existen una gran cantidad de
programas para reproducir este formato en los tres sistemas operativos mas extendidos
(Windows, MacOS y UNIX). Usa un esquema de compresi6n para reducir el tamafio de
los ficheros.
AVI (Audio Video Interleave) - [.avi]. Es un formato de video definido por Microsoft y
es el mas comun en el mundo del PC y de Windows. Pueden reproducirse por ejemplo
con el programa Windows Media Player.
QuickTime [.mov]. Es un formato de video digital desarrollado por Apple y puede
considerarse el equivalente del formato AVI en el mundo de los Macintosh, aunque
existen reproductores de este tipo de ficheros para distintos sistemas operativos. Pueden
reproducirse con el programa QuickTime Player.
Real media [.rm]. Se trata de un formato de video especialmente util para Internet, ya
que permite iniciar la reproducci6n del mismo antes de estar completamente
descargado. Para reproducir este tipo de videos debe usarse el programa RealPlayer.
4.5. Ficheros ejecutables
Los ficheros ejecutables son aquellos cuyo contenido indica al ordenador que debe
realizar una serie de acciones mas o menos complejas. Un fichero ejecutable puede
simplemente sumar dos numeros introducidos por teclado y mostrar el resultado por
pantalla, puede tratarse de un complejo programa de edici6n de video 3D para realizar
animaciones, o de un procesador de textos. Las extensiones mas comunes de los
ficheros ejecutables en Windows son .exe y .com.
El formato de los ficheros ejecutables depende totalmente del sistema operativo. De este
modo, un fichero ejecutable en Windows, no lo sera en otros sistemas como UNIX o
MacOS X y viceversa. Incluso suele ocurrir que un fichero ejecutable en una versi6n de
un sistema operativo (p.e. Windows XP) no funcione en otra (p.e. Windows 95).
4.6. Ficheros comprimidos
Una de las caracteristicas deseables en los ficheros es un tamafio reducido, ya que esto
permite el almacenamiento de mucha informaci6n en los distintos soportes
informaticos, y reduce el tiempo de transferencia de los mismos a traves de Internet.
Algunos de los formatos de fichero que hemos revisado incorporan su propio sistema de
compresi6n de la informaci6n para lograr ficheros reducidos. Por ejemplo: las imagenes
JPEG, los ficheros de audio MP3 y practicamente todos los formatos de video. No
32
Tema 4. Tipos y formatos de documentos
obstante existen numerosos programas que nos permiten comprimir cualquier tipo de
fichero y se han definido diversos formatos de compresi6n de informaci6n.
Ademas, en muchas ocasiones interesa agrupar varios ficheros en uno s6lo para facilitar
su almacenamiento o transmisi6n. Muchos de los programas de compresi6n permiten
agrupar varios ficheros como uno s6lo y comprimir el resultado. De este modo, cuando
se descomprime el fichero resultante, se vuelven a obtener los ficheros originales.
Los formatos mas comunes son los siguientes:
zip [.zip]. Se trata del formato de compresi6n mas comun en el mundo del Windows.
Puede ser descomprimido con programas como PKZip o WinZip, aunque existen
muchos mas de libre distribuci6n.
Gzip [.gz]. Se trata de un formato de compresi6n muy comun en UNIX, aunque tambien
puede ser manejando con programas de compresi6n de Windows como WinZip.
Sit [.sit]. Es un formato de compresi6n muy utilizado en los ordenadores Macintosh. Se
maneja fundamentalmente con el programa Stuffit.
En ocasiones podemos traernos un fichero comprimido y no disponer del programa de
descompresi6n adecuado. Por ello, existen ficheros comprimidos capaces de
autodescomprimirse. Este tipo de ficheros son ficheros con la extensi6n .exe, que al ser
ejecutados se descomprimen.
33
Both PDF and PostScript are designed to maintain document formatting across different systems. PDF is favored for online document sharing, allowing for high fidelity in viewing and printing, with universal accessibility through Acrobat Reader and security settings to prevent alterations. PostScript is specifically print-oriented, supporting accurate high-quality printing, and requires compatible printers. It lacks widespread viewer quality for screen use .
Word processors often face compatibility issues across different versions or operating systems, resulting in potential changes in document appearance or functionality. Older versions may struggle to open files from newer editions, and documents may render differently on varied systems, such as between Windows and MacOS .
Digital reference works offer significant advantages over paper versions by providing ease and speed of search, the ability to navigate content and connect related topics, and rapid content updates. These features enhance user accessibility and interaction, allowing for quick and precise information retrieval without the need for sequential reading .
Online bilingual dictionaries have greatly expanded their language offerings, covering hundreds of languages, from widely spoken ones like English and German to less common ones like Esperanto. They also cater to specialized topics, providing access to dictionaries on business, law, and more, connecting global users with diverse linguistic and topical needs .
Online dictionaries have evolved from being published solely in print, updating every ten years, to being continuously updated on the internet. For example, the Real Academia's dictionary is now updated continuously online, interacting with users, and publishing print versions every two to three years .
Electronic encyclopedias, such as Encarta, offer interactive features like clickable maps providing detailed information about regions. These interactive elements allow users to engage directly with content, enhancing the learning experience with up-to-date and interactive data visualizations .
Text-based documents in formats like plain text lack formatting and security features, such as maintaining fonts, colors, or the inclusion of images. They also cannot be altered securely as there are no built-in provisions to prevent modifications .
Library catalogs, as secondary reference works, direct users to other documents needed for the desired information. By offering searchable databases of book metadata like authorship and publishing details, they play a crucial role in information retrieval, connecting researchers to relevant resources efficiently .
Digital newspapers differ from traditional print versions by offering partially free access, where only headlines and some content are available without a subscription. Over time, most content has shifted to a subscription model. Digital versions also include features like forums, multimedia, and navigable hypertext to enhance user experience .
The main benefits of plain text format include simplicity and small file size, ensuring easy distribution and broad accessibility. However, it cannot retain formatting, colors, or images, limiting its usefulness for rich document presentation .