0% encontró este documento útil (0 votos)
34 vistas33 páginas

Teclaaaa

El documento aborda la información digital, destacando sus características como almacenamiento en formato binario, procesabilidad, interactividad y actualizabilidad. Se comparan los documentos digitales con los de papel en términos de ergonomía, durabilidad, autenticidad y visualización, señalando las ventajas y desventajas de cada formato. Además, se clasifican los documentos digitales en textuales, no textuales, multimedia e hipertexto, y se distingue entre documentos primarios y secundarios.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

Temas abordados

  • documentos digitales,
  • PDF,
  • formatos de archivo,
  • interactividad,
  • recuperabilidad,
  • documentos secundarios,
  • diccionarios,
  • información digital,
  • libros electrónicos,
  • HTML
0% encontró este documento útil (0 votos)
34 vistas33 páginas

Teclaaaa

El documento aborda la información digital, destacando sus características como almacenamiento en formato binario, procesabilidad, interactividad y actualizabilidad. Se comparan los documentos digitales con los de papel en términos de ergonomía, durabilidad, autenticidad y visualización, señalando las ventajas y desventajas de cada formato. Además, se clasifican los documentos digitales en textuales, no textuales, multimedia e hipertexto, y se distingue entre documentos primarios y secundarios.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

Temas abordados

  • documentos digitales,
  • PDF,
  • formatos de archivo,
  • interactividad,
  • recuperabilidad,
  • documentos secundarios,
  • diccionarios,
  • información digital,
  • libros electrónicos,
  • HTML

dwdwdwdwdwdwdwqwqwqwwqwHERRAMTENTAS TNFORMATTCAS PARA

LA DOCUMENTACTON

Tema 4. Tipos y formatos de documentos


1. Tnformacion digital
Se denomina informaci6n digital o electr6nica a aquella que se almacena en formato
binario, en un soporte magnetico u 6ptico y que puede consultarse utilizando un
ordenador. Este termino es muy amplio e incluye documentos de muchos tipos y
formatos, tales como libros electr6nicos, bases de datos, paginas web, enciclopedias
electr6nicas, etc. Pudiendo estar todos ellos almacenados por ejemplo en un CD-ROM o
accesibles a traves Internet.
wqqwqwqwq
1.1. Caracteristicas de la informacion digital
Las principales caracteristicas de todo documento digital son las siguientes:

• Se almacena en formato binario. La informaci6n digital se almacena en un


soporte magnetico u 6ptico en forma de ceros y unos.
• Es procesable por ordenador. Dado el tipo de soporte en que se almacena,
esta informaci6n puede ser accedida mediante programas de ordenador y
puede ser por tanto procesada informaticamente. Este tipo de procesamiento
facilita llevar a cabo de forma rapida y segura operaciones repetitivas sobre
la informaci6n que antes era necesario llevar a cabo manualmente. Ademas,
este tipo de formato ha aumentado enormemente la capacidad que tenemos
de acceder, manipular y visualizar la informaci6n.
Como resultado de esta capacidad de procesamiento de la informaci6n:

a) Es posible obtener nueva informaci6n con valor afiadido, por ejemplo


mediante la extracci6n de graficas o estadisticas de una serie de datos
numericos o mediante la obtenci6n de resumenes y el contraste de
distintas informaciones sobre un mismo tema.
b) Es posible acceder a la informaci6n a distancia. A traves de las redes de
ordenadores podemos acceder de forma casi instantanea a informaci6n
situada en cualquier parte del mundo.
c) Es posible crear documentos que integren todo tipo de informaci6n
textual, visual y sonora: documentos multimedia.
Universitat Jaume I Herramientas Informaticas para la Documentaci6n

• La informaci6n es reutilizable. Es facil duplicar la informaci6n y transferirla


de un tipo de soporte a otro manteniendo un alto grado de fiabilidad en la
copia. Ademas, varios usuarios pueden acceder a la misma copia al mismo
tiempo.
• Es interactiva. Algunos documentos digitales pueden ser interactivos,
modificandose en funci6n del comportamiento del lectosdsdsdsdsr. Una
forma basica de interactividad puede ser por ejemplo, la proporcionada a
traves de formularios de busqueda y recuperaci6n de almacenes de
informaci6n, o bien la utilizada por las enciclopedias infantiles en CD para
enasaaaaaaaaaaaaaadsdsssdsefiar a los nifios conceptos basicos mediante su
interacci6n con una serie de graficos y animaciones.
• Es actualizable. La informaci6n digital puede ser actualizada por sus autores
de forma sencilla y econ6mica, pudiendose generar versiones actualizadas de
la misma con mucha rapidez. Ademas, su facilidad de distribuci6n en forma
de discos 6pticos, y sobre todo a traves de Internet, permite que las nuevas
versiones de los documentos lleguen a sus destinatarios de forma muy
rapida.
• Es navegable. El uso de enlaces en documentos hipertexto permite que el
usuario defina la forma en la que quiere acceder a los documentos, tanto en
cuanto a la parte del documento a la que quiere acceder, como al orden en
que quiere consultarlo.
• Es recuperable. Es facil generar almacenes de documentos digitales y
utilizar mecanismos de busqueda y recuperaci6n de los mismos. Los
modernos buscadores permiten buscar de forma rapida y relativamente eficaz
documentos que cumplan una gran variedad de condiciones en repositorios
que pueden contener miles de ellos.
1.2. Documento digital frente a documento en papel
Para comparar los documentos digitales con los documentos en papel vamos a utilizar
unos parametros similares a los propuestos por diversos autores: ergonomia,
actualizaci6n, densidad, interactividad, durabilidad, autenticidad y visualizaci6n.
Veremos las ventajas e inconvenientes de cada uno de los dos tipos de documento en
relaci6n a estos parametros.dsdsdsdsdsd
Con respecto a la ergonomia, una vez disponemos del documento en cualquiera de los
dos formatos, la versi6n en papel es mucho mas facil de manipular (coger, mover, ...).
Para acceder a los documentos digitales es necesario utilizar un ordenador, con un
aparato de lectura y unos programas adecuados. Obviamente no siempre disponemos de
estos elementos, y es mucho mas facil coger un libro, o articulo en papel y leerlo en
cualquier parte. En la actualidad se esta investigando en el desarrollo de nuevos soportes
de lectura de documentos digitales de pequefio tamafio y faciles de transportar (ver

2
Tema 4. Tipos y formatos de documentos

figura l). Puede que cuando estos aparatos funcionen de forma adecuada y esten
disponibles para el gran publico, la ergonomia de lowwewewewewsccs documentos
digitales iguale a la de los documentos en papel.

Figura l. Dispositivo para la lectura de documentos digitales.

La durabilidad es una propiedad critica para garantizar la transmisi6n de la ciencia y la


cultura a largo plazo. Aunque parezca mentira, los modernos sistemas de
almacenamiento magnetico y 6ptico son menos durables que los documentos en papel.
Se sabe que un documento editado en un buen papel tiene una duraci6n minima de unos
quinientos afios, mientras un disco 6ptico puede durar en condiciones 6ptimas unos
cien. Mas aun, se ha comprobado que un uso normal de un disco 6ptico le garantiza una
vida media de entre dos y diez afios.
Por otro lado, los documentos digitales estan sujetos, no s6lo al desgaste fisico del
soporte, sino a la obsolescencia tecnol6gica. La evoluci6n de los tipos de soporte y de la
tecnologia y los programas de acceso a los documentos digitales hace que en pocos
afios, un soporte que parecia legible a largo plazo deje de ser accesible. Pensemos en lo
que ha ocurrido con los disquetes de 5,25 pulgadas y lo que pronto ocurrira con los de
3,5. En pocos afios sera dificil encontrar un ordenador que disponga de un lector de
disquetes, con lo cual sera complicado acceder a toda la informaci6n que hayamos
guardado en este tipo de soporte. Esta misma duda podia establecerse respecto a la
sustituci6n de los "modernos" CDs, por los "mas modernos" DVDs, pero los distintos
fabricantes de aparatos lectores, garantizan que los lectores de DVD, tambien sean
capaces de leer CDs.
El tercer parametro en el que el papel supera al documento digital es la autenticidad,
referida a su resistencia a la falsificaci6n. Es relativamente complicado falsificar un
documento en papel, en cambio, no existen muchos impedimentos para duplicar o
modificar un documento digital, en ocasiones, de modo indetectable. Esta circunstancia
hace que los documentos digitales no tengan validez juridica. Tambien en este ambito la

3
Universitat Jaume I Herramientas Informaticas para la Documentaci6n

tecnologia y las leyes estan evolucionando, y se estan estableciendo sistemas de


autentificaci6n que permiten identificar de modo inequivoco la
originwdedededededalidad de un documento digital.
En relaci6n a la visualizacion de los documentos, la calidad de la misma es superior en
el caso del papel, que en el de los documentos digitales. Las pantallas de ordenador
tradicionales suelen funcionar en base a un rayo de l223ejh3ug33uz que actualiza el
contenido de la misma varias veces por segundo y proyecta su contenido hacia los ojos
del usuario. Este modo de funcionamiento produce un parpadeo, apenas perceptible,
pero que fatiga la vista y resta calidad a la visualizaci6n. Se sabe que una frecuencia
superior a l20 actualizaciones por segundo (l20Hz) elimina el parpadeo e iguala la
calidad de visualizaci6n con el papel en este sentido. En la actualidad la mayoria de las
pantallas ofrecen unas frecuencias de refresco entre 60 y 90Hz.
Ademas de las dificultades relacionadas con el parpadeo de las pantallas, es necesario
tener en cuenta la definici6n con que se visualizan los documentos. Por definici6n nos
referimos a la cantidad de puntos por unidad de superficie con que se presenta el
documento en la pantalla. En ultimo termino, tanto las imagenes como el texto que
vemos en la pantalla esta formada por una cantidad dada de puntos de distintos colores.
Cuanta mas definici6n tenga el documento en pantalla, mejor se vera. Las actuales
pantallas de ordenador todavia tienen una definici6n bastante inferior que la obtenida a
partir de la impresi6n en papel. Mientras las pantallas habituales ofrecen una definici6n
de entre 75 y 90 puntos por pulgada, el papel puede ofrecer entre 300 y 3000 puntos por
pulgada.
Por otro lado, los documentos digitales son superiores al papel en los parametros de
actualizaci6n, densidad e interactividad, ademas de en otras caracteristicas comentadas
en el apartado anterior que les son propias: procesabilidad, navegabilidad y
recuperabilidad. En el apartado anterior hemos comentado ya las ventajas de la
informaci6n digital en cuanto a la actualizaci6n y la interactividad. En cuanto a la
densidad, nos referimos con este concepto a la cantidad de informaci6n que podemos
almacenar por unidad de volumen. Tal y como comentamos en el tema anterior, los
soportes informaticos, tales como los discos 6pticos o magneticos permiten almacenar
una enorme cantidad de informaci6n en un espacio muy reducido. Por ejemplo, en un
disco 6ptico es posible guardar mas de 200.000 paginas de texto. Imaginemos la
cantidad de espacio que ocuparian l.000 libros de 200 paginas cada uno y
comparemoslo con lo que ocupa un CD.

4
Tema 4. Tipos y formatos de documentos

2. Documentos digitales
En este apartado vamos a tratar de clasificar los distintos tipos de documentos digitales
existentes y a revisar sus principales caracteristicas
2.1. Tipos de documentos
En primer lugar, podemos clasificar los documentos electr6nicos en funci6n del tipo de
informaci6n que almacenan. En este sentido podemos diferenciar cuatro grandes tipos
de documentos: textuales, no textuales, multimedia e hipertexto. Revisemos brevemente
en que consiste cada uno de estos tipos de documentos:
• Documentos textuales. Este tipo de documentos contienen solamente texto y
suelen ser bastante habituales. Por ejemplo, la mayoria de los libros pueden
almacenarse en este formato, pero tambien numerosos articulos en prensa o en
revistas, legislaci6n, etc. Dos de las principales ventajas de este formato son la
posibilidad de visualizarlos facilmente sin problemas de formato al cambiar de
ordenador o de programa, y la gran cantidad de informaci6n textual que
podemos almacenar en un espacio muy reducido, p.e. un disquete o un disco
6ptico. Ademas, existen una gran cantidad de programas que nos permiten
visualizar y modificar los documentos de este tipo.
• Documentos no textuales. Son documentos que contienen otro tipo de
informaci6n distinta del texto. Por ejemplo, podemos incluir en este tipo de
documentos aquellos que almacenan imagenes estaticas, sonidos, peliculas o
programas ejecutables.
• Documentos multimedia. Son documentos electr6nicos que combinan textos,
graficos, sonidos, imagenes y programas ejecutables. Estos documentos
permiten la interacci6n del usuario, y se componen de muchos elementos de
informaci6n diferentes cuyo contenido puede variar en algunos casos como
resultado de la interacci6n con el usuario. Como ejemplos destacables de este
tipo de documentos, podemos citar las paginas web o las enciclopedias
interactivas en CD.
• Hipertextos. Son documentos que permiten definir una estructura compleja
compuesta de elementos con diferentes tipos de informaci6n multimedia unidos
mediante enlaces l6gicos. Se trata de documentos que pueden ser hojeados
rapidamente y cuya visualizaci6n no tiene que ser secuencial. La manera de
interaccionar con estos documentos consiste en ir recorriendo los elementos de
informaci6n (textos, imagenes, animaciones, ...) en el orden preferido
utilizando para ello los enlaces disponibles. De esta manera se puede ir
descartando c6modamente aquella informaci6n que se considere irrelevante, al
tiempo que se profundiza en los aspectos que se consideren oportunos. El
ejemplo mas conocido de este tipo de documentos son las paginas web.

5
Universitat Jaume I Herramientas Informaticas para la Documentaci6n

En segundo lugar, podemos clasificar los documentos en funci6n de su contenido y de


su finalidad. En este sentido, podemos diferenciar entre los documentos secundarios y
los primarios.
Los documentos secundarios son aquellos que contienen referencias a otros
documentos, remitiendonos a ellos si queremos obtener la informaci6n deseada. Este
tipo de documentos incluyen por ejemplo, las bibliografias, los catalogos de tiendas o
bibliotecas, los directorios de recursos en Internet, etc.
Los documentos primarios son aquellos que no son secundarios, es decir, aquellos que
nos dan la informaci6n de primera mano sin remitirnos a otros para conseguirla.
Podemos incluir en este tipo de documentos:
• Las obras de creaci6n, desde una obra literaria hasta una fotografia artistica.

• Las obras cientifico-tecnicas, incluyendo tesis doctorales, articulos en


revistas cientificas o manuales de usuario de un electrodomestico o de un
programa de ordenador.
• Los documentos administrativos o legales, incluyendo normativas y
legislaci6n, documentaci6n de gesti6n, como facturas, n6minas, etc.
En los siguientes apartados vamos a revisar las caracteristicas basicas de algunos de los
principales tipos de documentos, tanto primarios como secundarios, que podemos
encontrar en formato digital.
2.2. Libros
El libro es considerado el medio por excelencia para la difusi6n de la cultura. Su
implantaci6n y arraigo es muy grande y van muy unidos al papel, el soporte material
mas utilizado hasta el momento. No obstante, cada vez mas, podemos encontrar los
libros en formato digital: son los denominados libros electronicos o e-books. Existen
diversas formas de distribuci6n de los libros electr6nicos:
• En disco 6ptico. En la actualidad se estan distribuyendo en este soporte
fundamentalmente obras de referencia, incluyendo diccionarios y
enciclopedias, aunque tambien es posible encontrar por ejemplo libros
infantiles interactivos.
• Consulta en linea. En este caso se accede al libro por Internet y suele poder
leerse de forma gratuita o previo pago de una cantidad determinada. Cada dia
aumentan los repositorios en Internet en los cuales es posible acceder a una
gran cantidad de libros, incluyendo fundamentalmente literatura clasica en
diversos idiomas que no posee restricciones en cuanto a derechos de copia o
distribuci6n.

6
Tema 4. Tipos y formatos de documentos

Por ejemplo, la biblioteca Cervantes Virtual (www.cervantesvirtual.com),


nos permite acceder en formato de texto a una enorme cantidad de libros de
autores clasicos en espafiol, incluyendo por ejemplo a Cervantes, G6ngora,
Garcilaso, etc. Otros repositorios de este mismo tipo como The on-line books
page (onlinebooks.library.upenn.edu) dan acceso a mas de l0.000 libros en
ingles de autores como Julio Verne, Charles Dickens, Edgar Allan Poe, entre
otros muchos, ademas de incluir una gran cantidad de enlaces a otros
repositorios de libros electr6nicos. La figura 2 muestra la pagina principal de
este ultimo repositorio.

Figura 2. Repositorio de libros electr6nicos en Internet.

• Descarga a un ordenador personal. En ocasiones, podemos encontrar en


Internet, libros almacenados en ficheros que estan pensados para ser
descargados en un ordenador personal y ser leidos o impresos posteriormente
en el mismo. Existen editoriales como Edicions Virtuals UPC que ofrecen
libros mediante este sistema (ver figura 3). Tambien es posible acceder a
netLibrary (www.netlibrary.com), donde se ofrecen mas de 20.000 libros
digitales a particulares y organizaciones, unos 4.000 de los cuales son
gratuitos.
• Descarga a un lector de libros digitales. Tal y como hemos indicado en un
apartado anterior, existen ya en el mercado dispositivos de lectura de libros
digitales de tamafio reducido. Es posible conectar estos dispositivos a un
ordenador y copiar los libros a los mismos para poder leerlos posteriormente.
Los principales problemas de estos dispositivos siguen siendo la baja calidad

7
Universitat Jaume I Herramientas Informaticas para la Documentaci6n

de visualizaci6n en relaci6n al papel y la inexistencia de un formato estandar


de almacenamiento de libros digitales.
La mayoria de los libros que podemos encontrar en Internet, se encuentran almacenados
como texto puro, esto es, no incluyen ningun tipo de formato, tal como letras en negrita
o cursiva o con distintos tamafios y fuentes, sangrado y justificaci6n de parrafos, etc.
No obstante, existen otros formatos de almacenamiento que permiten incorporar estas
caracteristicas, junto con la posibilidad de incluir imagenes y graficos. Entre ellos
podemos destacar el formato PDF (Portable Document Format) o el mas reciente
formato LIT de Microsoft. En un apartado posterior revisaremos los principales
formatos de ficheros que nos permiten almacenar textos electr6nicos.

Figura 3. Pagina de descarga de un libro electr6nico en Edicions Virtuals UPC.

Por ahora, los libros digitales son un instrumento muy util para realizar consultas de
forma rapida y sencilla, como las que se pueden realizar a un diccionario. Ahora bien,
los libros dirigidos al gran publico, con tiradas elevadas, siguen editandose mediante el
sistema tradicional y en papel. No obstante, ya existen experiencias en la distribuci6n de
algunos superventas, a traves de la web. Baste citar el ejemplo del libro de Arturo Perez
Reverte El oro del rey, que pudo accederse durante un mes por Internet en formato
PDF, antes de editarse a un precio muy superior en su versi6n tradicional. Tambien cabe
citar el libro Riding the bullet, de Stephen King, que se distribuy6 de forma exclusiva
por Internet y que se vendi6 a mas de 500.000 lectores durante las dos primeras
semanas, antes de tener problemas con las copias piratas del mismo.
En un futuro no muy lejano, cuando mejore notablemente la calidad de los dispositivos
portatiles de lectura o cuando se llegue a un minimo acuerdo sobre el formato de
almacenamiento y distribuci6n, muchos libros se editaran en formato digital y podran

8
Tema 4. Tipos y formatos de documentos

ser vendidos a traves de Internet, con todas las ventajas que ello comporta. En l999 se
fund6 el Open eBook Forum (www.openebook.org) que reune a compafiias de hardware
y software, editores, autores y usuarios de libros electr6nicos y cuyo objetivo es
establecer las especificaciones y estandares para la publicaci6n digital (ver figura 4).

Figura 4. Pagina del Open eBook Forum.


2.3. Revistas especializadas
Uno de los tipos de publicaci6n que mas se ha beneficiado de la extensi6n de Internet y
de los discos 6pticos son las revistas especializadas. Existen una gran cantidad de
revistas cientifico-tecnicas que cada vez mas se distribuyen en disco 6ptico o a traves de
Internet. Dos de los principales problemas de las versiones en papel de las revistas
especializadas son la pirateria de los derechos de autor (las fotocopias) y el excesivo
tiempo transcurrido entre el envio de los articulos originales y su publicaci6n.
Para solucionar este segundo problema, numerosas editoriales especializadas en este
tipo de revistas, tales como Academic Press, Elsevier o Springer-Verlag, ofrecen a sus
suscriptores la posibilidad de acceder a las versiones electr6nicas en PDF de sus titulos
a traves de Internet (ver figura 5). Ademas, muchos de los congresos cientificos que
publican las comunicaciones de sus participantes en papel, tambien estan afiadiendo
ultimamente versiones de los mismos en disco 6ptico.

9
Universitat Jaume I Herramientas Informaticas para la Documentaci6n

Figura 5. Acceso a la versi6n electr6nica en PDF de un articulo en una revista especializada.

Ademas, tambien es posible encontrar en Internet un numero cada vez mayor de


boletines y revistas electr6nicas sin su equivalente publicaci6n en papel, que tratan los
temas mas diversos: astronomia, turismo, quimica, arte, medicina, filosofia, etc. (ver
figura 6).
Algunos de los motivos que explican el auge de las versiones electr6nicas de las revistas
especializadas son los siguientes:
• Se dirigen a un tipo de publico especialmente preparado. Las caracteristicas
de sus lectores suelen incluir un nivel de formaci6n alto, conocimientos de
idiomas y acceso y entrenamiento en el uso de las nuevas tecnologias.
• Los costes de producci6n son pequefios. Las publicaciones academicas se
dirigen a un publico especializado y, por lo tanto, sus tiradas son
notablemente reducidas. Al no utilizar los procesos habituales de impresi6n y
distribuci6n, tienen unos costes materiales menores.
• La distribuci6n es mas rapida y barata. El acceso a la publicaci6n en formato
electr6nico es practicamente inmediato y reduce enormemente los costes de
distribuci6n (envios por correo, gesti6n de devoluciones, ...).
• Es posible incluir documentos complementarios. La publicaci6n electr6nica
de los articulos permite adjuntar a los mismos material complementario,
incluyendo imagenes en movimiento, sonido o programas informaticos, entre
otros.

l0
Tema 4. Tipos y formatos de documentos

Figura 6. Revista electr6nica publicada tan s6lo en Internet.

Quedan algunos problemas por resolver en relaci6n a las revistas electr6nicas. Por
ejemplo, el prestigio de las publicaciones en papel suele ser muy superior que el de las
versiones electr6nicas sin este respaldo, aunque como hemos comentado anteriormente,
las grandes editoriales comienzan a editar versiones electr6nicas de las revistas mas
prestigiosas.
2.4. Prensa
La prensa es uno de los sectores que esta utilizando con mayor profusi6n y exito la
distribuci6n digital de sus contenidos. La tendencia actual se orienta a la distribuci6n a
traves de la web de los peri6dicos, tomando como base las mismas noticias que los
periodistas han elaborado y que se han publicado en la edici6n impresa, a las cuales se
suelen afiadir diversas singularidades que comentaremos a continuaci6n.
Casi todos los grandes peri6dicos del mundo disponen de versiones en linea a traves de
Internet. En Espafia, y segun datos de la cuarta encuesta a usuarios de Internet (abril-
junio de 200l) realizada por la Asociaci6n de Investigaci6n de los Medios de
Comunicaci6n (www.aimc.es), de las primeras l5 webs que habian visitado
recientemente los usuarios, tres corresponden a prensa escrita, concretamente: El Pais,
El Grupo Recoletos (peri6dicos econ6micos como Expansion y deportivos como
Marca) y El Mundo.
Las caracteristicas comunes a las ediciones digitales de los peri6dicos son las siguientes:

• Proporcionan acceso al texto integro y a informaciones complementarias,


ampliando las noticias o afiadiendo sonidos, imagenes o pequefias peliculas.

ll
Universitat Jaume I Herramientas Informaticas para la Documentaci6n

• Se actualizan diversas veces al dia. Pueden consultarse las ultimas noticias


casi en el instante en que se producen, lo que constituye una de las
principales ventajas de las versiones digitales de los peri6dicos con respecto
a las versiones impresas.
• Disponen de servicios complementarios. Tal y como puede verse en la
figura 7, las paginas web de los peri6dicos, no s6lo incluyen la versi6n
electr6nica de las noticias, sino que se acerca al concepto de portal descrito
en el tema 2. En este sentido, los principales peri6dicos en Internet suelen
incluir foros de debate, diccionarios, envio de noticias por correo, tiendas.

Figura 7. Versi6n electr6nica del peri6dico El Pais incluyendo servicios complementarios.

• Permiten la consultar y recuperar ediciones anteriores. Los peri6dicos suelen


incluir buscadores que permiten acceder a ejemplares anteriores o buscar en
su contenido en base al texto completo de las noticias, (ver figura 8).
• El acceso es parcialmente gratuito. En su origen, todo el contenido de la
mayoria de los peri6dicos en la web podia consultarse de forma gratuita. Sin
embargo, la tendencia actual es a que sea necesario suscribirse y pagar una
cuota para poder acceder a la mayor parte del contenido. Como mucho,
algunos peri6dicos permiten acceder a sus titulares y a parte de la
informaci6n que contienen de modo gratuito.
• La consulta se realiza mediante un sistema de navegaci6n. Las noticias de los
peri6dicos se presentan como paginas web, con las ventajas que ello implica
en cuanto a la inclusi6n de informaci6n multimedia y a la navegaci6n no
secuencial por su contenido basada en el uso de enlaces.

l2
Tema 4. Tipos y formatos de documentos

Figura 8. Buscador de ediciones anteriores del peri6dico El Mundo.

En cuanto a la distribuci6n de peri6dicos en soporte 6ptico, se utiliza exclusivamente


para ediciones retrospectivas. Peri6dicos como El Pais o El Mundo, editan discos
6pticos que contienen los ejemplares del ultimo afio y facilitan la consulta de su
contenido.
Por otro lado, cabe citar que, aunque menos numerosos, tambien existen peri6dicos
accesibles tan s6lo por Internet y sin una versi6n impresa. Estos son los verdaderos
peri6dicos digitales e incluyen cabeceras como La Estrella Digital
(www.estrelladigital.es) o Vilaweb (www.vilaweb.com).

Figura 9. Buscador de noticias en prensa.

Por ultimo, y tambien en relaci6n con la prensa en Internet, hemos de destacar que
practicamente todos los portales de Internet incluyen un sistema de noticias que permite
acceder a las ultimas noticias publicadas en prensa o distribuidas por las agencias.

l3
Universitat Jaume I Herramientas Informaticas para la Documentaci6n

Ademas, estas paginas incluyen sus propios buscadores de noticias en prensa.


Adicionalmente es posible encontrar buscadores especializados en encontrar este tipo de
informaci6n, tales como Prensa Digital (www.prensadigital.com), cuya pagina principal
podemos ver en la figura 9.

2.5. Obras de referencia


Otro de los tipos de documentos que suelen publicarse en versi6n electr6nica en disco
6ptico o a traves de Internet son las obras de referencia. Este tipo de documentos
condensan y facilitan un acceso rapido a la informaci6n. Debido a su estructura facilitan
la localizaci6n de informaci6n de forma rapida y precisa y estan pensados para su
consulta y no para su lectura completa y ordenada. Incluyen documentos tales como los
diccionarios, las enciclopedias o las publicaciones oficiales.
Podemos distinguir las obras de referencia primarias y las secundarias:

Las obras de referencia primarias incluyen la informaci6n que se quiere consultar, por
ejemplo, la definici6n de un termino, el contenido de una determinada ley o el mapa de
un pais dado.
Las obras de referencia secundarias remiten a otros libros o documentos para poder
encontrar la informaci6n buscada. Un ejemplo de este tipo de obra de referencia seria un
catalogo de biblioteca.
En el caso de las obras de referencia las principales ventajas de las versiones digitales
con respecto a las versiones en papel son, la facilidad y rapidez en la busqueda, la
capacidad de navegar en su contenido conectando temas afines y la velocidad con la que
pueden actualizarse sus contenidos.
Revisaremos a continuaci6n los principales tipos de obras de referencia existentes,
dando algunos ejemplos accesibles a traves de Internet.
2.5.1. Diccionarios
Los diccionarios, presentan la informaci6n por orden alfabetico y explican el significado
de terminos o conceptos, o nos muestran su traducci6n a otro idioma.
Existen una gran cantidad de tipos de diccionarios, incluyendo los generales, los
normativos, los de uso, los especializados. Algunos de ellos se distribuyen en CD, y
tambien podemos encontrarlos en Internet. Un ejemplo reciente de incorporaci6n de este
tipo de diccionarios a Internet es el caso del Diccionario de la Real Academia de la
Lengua (www.rae.es), cuya pagina principal puede verse en la figura l0. Hasta la fecha
venia publicandose tan s6lo su versi6n en papel cada l0 afios, con lo cual el avance
continuo de la lengua lo superaba en poco tiempo. El objetivo de la Real Academia es
actualizar la versi6n por Internet de modo continuo, interaccionar con los usuarios y
editar una versi6n en papel cada dos o tres afios.

l4
Tema 4. Tipos y formatos de documentos

Figura l0. Resultado de una busqueda en la pagina del Diccionario de la Real Academia Espafiola.

No obstante, el tipo de diccionarios mas comunes en Internet son los bilingiies, que nos
permiten traducir palabras de un idioma a otro. A traves de paginas como Your
Dictionary (www.yourdictionary.com) es posible acceder a diccionarios bilingiies en
varios cientos de idiomas, incluyendo desde el ingles y el aleman, hasta el chino o el
esperanto. Esta misma pagina tambien permite el acceso a decenas de diccionarios
especializados en temas tales como los negocios, la informatica, el derecho, la medicina
o los deportes.
2.5.2. Enciclopedias
Las enciclopedias son obras de referencia que reunen el conocimiento y la experiencia
de una determinada sociedad, y que la presentan en un orden preestablecido.

Figura ll. Pagina principal de la versi6n en linea de la Enciclopedia Britanica.

Aunque Internet en si misma constituye la mayor enciclopedia del mundo, al


permitirnos acceder a informaci6n sobre todos los temas imaginables, las versiones en

l5
Universitat Jaume I Herramientas Informaticas para la Documentaci6n

linea de las enciclopedias tradicionales son mas bien escasas. Existen algunas
enciclopedias como la Enciclopedia Britanica (www.eb.com) que, ademas de editar una
versi6n en CD y DVD, permiten el acceso gratuito durante unos dias a su versi6n en
linea y el acceso continuado previa suscripci6n. En la figura ll podemos ver la pagina
principal de esta enciclopedia.
2.5.3. Directorios
El directorio es una obra de referencia que contiene informaci6n presentada en orden
alfabetico o cronol6gico que permite la identificaci6n o localizaci6n de personas,
organismos o empresas. Si se trata de directorios de personas, pueden incluir su nombre,
actividad, funci6n, direcci6n, telefono o correo electr6nico.
Internet incorpora un servicio de directorio denominado X.500, o el mas reciente LDAP
(Lightweight Directory Access Protocol), que en principio deberia permitir encontrar las
direcciones postales, numeros de telefono y direcciones de correo electr6nico de
personas que forman parte de organizaciones que estan conectadas a Internet. No
obstante este sistema funciona muy mal y tan s6lo permite acceder en ocasiones a datos
sobre personas que trabajan en la misma empresa u organizaci6n. Por ejemplo, la UJI
dispone de un sistema de directorio basado en el servicio X.500, ademas de estar
incorporando otro basado en el LDAP (ver figura l2).

Figura l2. Buscador de personas en el servicio de directorio (LDAP) de la UJI.

Ademas, existen en Internet buscadores especializados en encontrar informaci6n sobre


personas, que suelen agruparse bajo la categoria de paginas blancas. Entre ellos
podemos citar por ejemplo Yahoo! People Search (people.yahoo.com), cuyo formulario
de busqueda avanzada podemos ver en la figura l3, o Infospace (www.infospace.com).
No obstante, por diversas razones, los servicios centrados en la busqueda de personas en
Internet son bastante limitados, ya que permiten encontrar a un porcentaje bastante
reducido de personas que disponen de una cuenta en algun proveedor de Internet o de
direcci6n de correo. Entre las razones que justifican esta limitaci6n se encuentra el que
los proveedores no suelen proporcionar los datos de sus usuarios.
Entre los directorios de empresas podemos destacar por ejemplo las paginas amarillas
(www.paginasamarillas.es) que funcionan de modo similar a la versi6n en papel, pero
abarcan un mayor ambito geografico que las que recibimos en nuestra casa.

l6
Tema 4. Tipos y formatos de documentos

Figura l3. Formulario de busqueda avanzada de Yahoo People Search.


2.5.4. Fuentes geograficas
Las fuentes geograficas nos permiten encontrar lugares mediante mapas o planos e
incluyen atlas generales, o especializados (como los atlas hist6ricos o econ6micos), y
guias y callejeros de ciudades.

Figura l4. Ejemplo de mapa interactivo de Espafia que podemos encontrar en Internet.

Por ejemplo, en encarta.msn.com podemos acceder a la versi6n de demostraci6n en


linea interactiva del Atlas incluido en la Enciclopedia Encarta. En ella podemos acceder
a una mapa sensible (mapa que responde a las pulsaciones del usuario) que nos permite
ver mapas de distintas regiones o paises, e incluso acceder a informaci6n sobre ciudades
concretas sin mas que pulsar con el rat6n en la zona deseada (ver figura l3). Otro
ejemplo de atlas electr6nico puede ser Atlapedia (www.atlapedia.com) nos permite
acceder a mapas fisicos y politicos de distintos paises, asi como a informaci6n sobre su
clima, lengua, historia, etc.

l7
Universitat Jaume I Herramientas Informaticas para la Documentaci6n

Como ejemplo de callejero que nos puede permitir ver planos de zonas de distintas
ciudades de Espafia, podemos acceder al incluido en el peri6dico El Mundo
(www.elmundo.es/callejero).
2.5.5. Publicaciones oficiales
Uno de los tipos de publicaci6n que se ha venido difundiendo en versi6n electr6nica
desde hace mas tiempo son los repertorios de legislaci6n y las publicaciones oficiales.
Desde hace muchos afios, editoriales especializadas como Aranzadi vienen
distribuyendo en CD las disposiciones legales incluidas en el BOE o dictadas por los
gobiernos de las comunidades aut6nomas o de la Uni6n Europea.
Asimismo, y desde hace menos tiempo, podemos acceder a traves de Internet a los
contenidos de los ultimos numeros de los boletines oficiales, tanto a nivel provincial y
auton6mico (DOGV - www.pre.gva.es/dogvweb/cindex.htm), como nacionales (BOE -
www.boe.es) o de la Uni6n Europea (DOCE - europa.eu.int/eur-lex/es/o).

Figura l5. Pagina del Diario Oficial de la Generalitat Valenciana.

Tambien es posible acceder en Internet buscadores especializados en encontrar


legislaci6n publicada en diversos boletines como Toda la ley (www.todalaley.com).
2.5.6. Obras de referencia secundaria
Entre las obras de referencia cuyos resultados nos remiten a otros documentos para
encontrar la informaci6n final, podemos destacar los catalogos de bibliotecas y las
bibliografias.
Como ya comentamos en el tema 3, la mayoria de las grandes bibliotecas ofrecen sus
servicios a traves de paginas web. Uno de los servicios fundamentales a los que puede
accederse es la busqueda de libros en los catalogos de la biblioteca. Este tipo de
catalogos accesibles en linea se denominan OPAC (On-line Public Acces Catalogue).

l8
Tema 4. Tipos y formatos de documentos

Figura l6. Catalogo en Internet de la Biblioteca Nacional de Espafia.

Los catalogos de biblioteca son un inventario de los documentos localizados en ella.


Cada documento viene descrito siguiendo unas directrices internacionales por
parametros tales como el autor, titulo, lugar y afio de edici6n, etc. Ademas, en los
catalogos consta la informaci6n sobre los ejemplares concretos que posee la biblioteca,
su disponibilidad y su localizaci6n. En la figura l6 podemos ver el buscador del
catalogo de la Biblioteca Nacional Espafiola (www.bne.es).
Por otro lado, en Internet podemos encontrar diversas recopilaciones de bibliografia
sobre todo tipo de temas, asi como buscadores especializados en encontrar referencias
bibliograficas. Este tipo de buscadores van dirigidos a profesionales e investigadores
especializados y permiten el acceso a referencias sobre su ambito de trabajo. Funcionan
de modo similar a un catalogo de biblioteca, pero ofrecen como resultado referencias a
articulos cientifico-tecnicos aparecidos en revistas, actas de conferencias o informes
tecnicos. La informaci6n relacionada con cada articulo suele incluir los autores, titulo,
revista o conferencia en que se public6, lugar y fecha de publicaci6n, etc. En algunas
bibliografias se incluye tambien un resumen del contenido del articulo. Mas aun,
algunos buscadores bibliograficos ofrecen enlaces que permiten acceder a las fuentes
primarias de algunos de los articulos que contienen. Asi, podriamos acceder a una
versi6n electr6nica de las referencias obtenidas, bien en la pagina relacionada con
alguna conferencia, en algun repositorio FTP e incluso en la pagina personal de alguno
de los autores.
Entre los buscadores de bibliografia podemos citar ResearchIndex
(citeseer.nj.nec.com/cs), especializado en literatura cientifica (ver figura l7), o The
collection of computer science bibliographies (liinwww.ira.uka.de/bibliography)
especializado en informatica.

l9
Universitat Jaume I Herramientas Informaticas para la Documentaci6n

Figura l7. Resultado obtenido en el buscador de bibliografia ResearchIndex.

3. Tipos de software
En este apartado vamos a revisar brevemente los principales tipos de programas que es
posible encontrar en Internet.
En primera instancia podemos diferenciar los programas comerciales, desarrollados
por fabricantes de software y de pago, de los programas de libre distribucion,
pensados para su difusi6n por Internet, en muchos casos de forma totalmente gratuita.
Los formatos mas comunes de software de libre distribuci6n son los siguientes:

Shareware. Como su propio nombre indica, estan pensados para ser compartidos y
distribuidos. La idea de este tipo de software es que el usuario pruebe su funcionamiento
durante un tiempo, y si le resulta de utilidad y va a seguir usandolo, pague una pequefia
cantidad a su autor.
Freeware. Su finalidad es similar a la del tipo anterior, pero en este caso se trata de
software totalmente gratuito que puede usarse y copiarse sin ninguna restricci6n.
Ademas de los dos formatos anteriores, en Internet podemos encontrar otros tipos de
programas:
Addware. Se trata de versiones de programas que podemos descargar de Internet y
utilizar de modo totalmente gratuito. Sin embargo, estos programas insertan en alguna
de sus ventanas publicidad.
Versiones de demostracion. Muchos fabricantes de software distribuyen versiones de
demostraci6n de sus programas. Estas versiones suelen tener una funcionalidad limitada
respecto a la versi6n de pago y pueden dejar de funcionar al cabo de unos dias.
Actualizaciones. Se trata de pequefios programas que actualizan las versiones de otros
que tenemos instalados a unas mas nuevas. En muchas ocasiones la compra de un
programa nos da derecho a recibir actualizaciones peri6dicas del mismo de modo
gratuito o a un precio mas reducido.

20
Tema 4. Tipos y formatos de documentos

4. Formatos de documento
En el ambito de la informatica, todos los documentos, y en general toda la informaci6n
que es manejada mediante ordenadores se almacena en forma de
fiedededeededeededcheros. Los ficheros son el elemento basico mediante el cual los
sistemas operativos almacenan la informaci6n. Sistemas Operativos como las distintas
versiones de Windows o de UNIX almacenan toda la informaci6n en ficheros y la
organizan en los dispositivos de almacenamiento (discos duros, disquetes, discos
6pticos, etc.) mediante un sistema jerarquico de ficheros y directorios. Windows
representa graficamente estos elementos mediante iconos correspondientes a ficheros y
carpetas donde se almacenan, tanto los ficheros como otras carpetas.
Los ficheros guardan la informaci6n en un determinado formato que, en sistemas
operativos de tipo Windows, se identifica mediansssassssssssssssste una extensi6n de 2
a 4 letras afiadidas a su nombre y mediante un tipo particular de icono con el que se
representa en pantalla.
Cuando hablamos de formato de un fichero informatico nos referimos a la forma en que
se ha codificado la informaci6n en el mismo, esto es, en ultimo termino el formato de
un fichero es el modo en que se ha traducido a ceros y unos la informaci6n que
almacena. Este formato debe ser reconocido e interpretado de forma adecuada por los
programas que lo manejan para poder visualizar y manipular la informaci6n que
contienen.
Existen formatos propios de determinadas aplicaciones que corresponden a la forma en
que las mismas almacenan la informaci6n por defecto. Por ejemplo, los documentos
almacenados mediante Microsoft Word suelen tener la extensi6n .doc, mientras los
almacenados con WordPerfect usan la extensi6n .wpf. Por otro lado, existen formatos de
fichero mas genericos que corresponden a un tipo particular de informaci6n y que
pueden venir o no dados por un estandar. Por ejemplo, la mayoria de las imagenes que
se manejan en Internet se almacenan en formato GIF o JPEG. En el caso de los formatos
genericos, existen distintos programas que pueden leerlos y visualizarlos y que nos
pueden permitir modificar el contenido de los ficheros. Asi, numerosas aplicaciones
graficas nos permiten acceder a los formatos GIF y JPEG o guardar los graficos que
hemos generado o modificado con ellas en estos formatos. Lo anterior no significa que
no podamos intentar abrir cualquier tipo de fichero con la mayoria de las aplicaciones.
Lo que ocurre simplemente es que cuando las aplicaciones no reconocen un
determinado formato, pueden producir un error o bien mostrarnos la informaci6n mas
extrafia imaginable en pantalla, tal y como puede constatarse en la figura l8.

2l
Universitat Jaume I Herramientas Informaticas para la Documentaci6n

Figura l8. Ejemplo de resultado en pantalla al abrir un fichero no reconocido por el procesador Word.

En este apartado vamos a revisar algunos de los principales formatos informaticos en


los que pueden guardarse distintos tipos de informaci6n. Intentaremos centrarnos en los
formatos genericos de mayor difusi6n y citaremos algunas aplicaciones que nos pueden
permitir visualizar y, en algunos casos, modificar su contenido.
4.1. Textos electronicos
Uno de los tipos de informaci6n mas difundida son los textos electr6nicos. En un primer
nivel podemos clasificar estos en dos tipos basicos:
El texto puro o texto sin formato corresponde a ficheros que s6lo almacenan
informaci6n textual, incluyendo letras, numeros, signos de puntuaci6n y otros simbolos
como parentesis, interrogantes, etc. Algunos de estos ficheros restringen tanto los
caracteres que pueden almacenar que no permiten por ejemplo guardar texto con
acentos o la letra fi.
El texto con formato es aquel que no s6lo contienen la informaci6n textual, sino que
ademas dota al texto de determinadas caracteristicas que mejoran la presentaci6n global
del documento. En este tipo de documentos puede por ejemplo incluirse texto utilizando
distintas fuentes (tipo de letra), podemos utilizar texto en negrita o en cursiva, o afiadir
caracteristicas tales como el sangrado o la justificaci6n a los parrafos. Mas aun, aunque
estrictamente hablando no se trata de texto, podemos incluir en la categoria de textos
electr6nicos con formato aquellos que incorporan imagenes, graficos o tablas y que
pueden ubicarlos en determinadas posiciones del documento.
Algunas de las condiciones deseables en los ficheros que guardan texto con formato son
las siguientes:
• Que puedan ser visualizables con un visor universal, facil de conseguir para
distintos sistemas operativos y a ser posible gratuito.
• Que conserven el color, formatos y fuentes con los que fueron generados.

• Que puedan incluir imagenes.

22
Tema 4. Tipos y formatos de documentos

• Que se impriman con fidelidad al original.

• Que permitan afiadir condiciones de seguridad para impedir su alteraci6n, e


incluso su impresi6n.
• Que ocupen poco espacio en disco.

En los siguientes apartados vamos a revisar la codificaci6n utilizada en los ficheros de


texto puro, los principales tipos de textos con formato que podemos encontrar y sus
ventajas e inconvenientes con respecto a las caracteristicas anteriores. Entre los textos
con formato vamos a diferenciar tres tipos basicos:
• El generado mediante procesadores de texto.

• Los formatos de visualizaci6n e impresi6n.

• Los lenguajes de formato


4.1.1. Texto puro (ASCTT)
Para guardar informaci6n textual es necesario acordar una codificaci6n que haga
corresponder cada caracter almacenado con una combinaci6n de ceros y unos. Existen
diversos estandares internacionales que establecen esta correspondencia, el mas
extendido de los cuales es el c6digo ASCII (American Standard Code for Information
Interchange).
La versi6n basica de este c6digo incluye un maximo de l28 caracteres, de los cuales los
3l primeros no corresponden a caracteres representables en pantalla, sino que se utilizan
para almacenar informaci6n de control, por ejemplo, para indicar cuando se
producen los cambios de parrafo. En este c6digo los numeros del 0 al 9 se
corresponden con los c6digos del 48 al 57 y las letras minusculas quedan codificadas
con los valores entre el 97 y el l22. En la versi6n basica del c6digo no estan
representadas por ejemplo las letras con acento, la letra fi, o los simbolos de
apertura de interrogaci6n y exclamaci6n (i, l), ni diversos caracteres especiales
utilizados por idiomas distintos del ingles. Debido a que esto representa un claro
problema fuera de los paises del ambito anglosaj6n, existe la versi6n extendida del
c6digo ASCII, que permite almacenar hasta
256 caracteres distintos y que incluye todos los de la versi6n basica en la misma
posici6n y afiade los que hemos comentado (p.e. la fi corresponde al c6digo l64). En la
tabla l podemos ver los caracteres del c6digo ASCII extendido representables.

23
Universitat Jaume I Herramientas Informaticas para la Documentaci6n

00l00000 00l0000l 00l000l0 00l000ll 00l000ll 00l00l0l 00l00ll0 00l00lll 00l0l000 00l0l00l 00l0l0l0 00l0l0ll
32 33 34 35 36 37 38 39 40 4l 42 43
" # $ % & ( ) * +
00l0ll00 00l0ll0l 00l0lll0 00l0llll 00ll0000 00ll000l 00ll00l0 00ll00ll 00ll0l00 00ll0l0l 00ll0ll0 00ll0lll
44 45 46 47 48 49 50 5l 52 53 54 55
, - . I 0 l 2 3 4 5 6 7
00lll000 00lll00l 00lll0l0 00lll0ll 00llll00 00llll0l 00lllll0 00llllll 00l00000 0l00000l 0l0000l0 0l0000ll
56 57 58 59 60 6l 62 63 64 65 66 67
8 9 : < > ? @ A B C
0l000l00 0l000l0l 0l000ll0 0l000lll 0l00l000 0l00l00l 0l00l0l0 0l00l0ll 0l00ll00 0l00ll0l 0l00lll0 0l00llll
68 69 70 7l 72 73 74 75 76 77 78 79
D E F G H I J K L M N O
0l0l0000 0l0l000l 0l0l00l0 0l0l00ll 0l0l0l00 0l0l0l0l 0l0l0ll0 0l0l0lll 0l0ll000 0l0ll00l 0l0ll0l0 0l0ll0ll
80 8l 82 83 84 85 86 87 88 89 90 9l
P Q R S T U V W X y z [
0l0lll00 0l0lll00 0l0llll0 0l0lllll 0ll00000 0ll0000l 0ll000l0 0ll000ll 0ll00l00 0ll00l0l 0ll00ll0 0ll00lll
92 93 94 95 96 97 98 99 l00 l0l l02 l03
\ ] I\ a b c d e f g
0ll0l000 0ll0l00l 0ll0l0l0 0ll0l0ll 0ll0ll00 0ll0ll0l 0ll0lll0 0ll0llll 0lll0000 0lll000l 0lll00l0 0lll00ll
l04 l05 l06 l07 l08 l09 ll0 lll ll2 ll3 ll4 ll5
h i j k l m n o p q r s
0lll0l00 0lll0l0l 0lll0ll0 0lll0lll 0llll000 0llll00l 0llll0l0 0llll0ll 0lllll00 0lllll0l 0llllll0 0lllllll
ll6 ll7 ll8 ll9 l20 l2l l22 l23 l24 l25 l26 l27
t u v w x y z { } DEL
l0000000 l000000l l00000l0 l00000ll l0000l00 l0000l0l l0000ll0 l0000lll l000l000 l000l00l l000l0l0 l000l0ll
l28 l29 l30 l3l l32 l33 l34 l35 l36 l37 l38 l39
ii e a a a a e e e y
l000ll00 l000ll0l l000lll0 l000llll l00l0000 l00l000l l00l00l0 l00l00ll l00l0l00 l00l0l0l l00l0ll0 l00l0lll
l40 l4l l42 l43 l44 l45 l46 l47 l48 l49 l50 l5l
1 A A E IE 6 6 0 G u
l00ll000 l00ll00l l00ll0l0 l00ll0ll l00lll00 l00lll0l l00llll0 l00lllll l0l00000 l0l0000l l0l000l0 l0l000ll
l52 l53 l54 l55 l56 l57 l58 l59 l60 l6l l62 l63
y 6 D 0 £ 0 x f a i 6 u
l0l00l00 l0l00l0l l0l00ll0 l0l00lll l0l0l000 l0l0l00l l0l0l0l0 l0l0l0ll l0l0ll00 l0l0ll0l l0l0lll0 l0l0llll
l64 l65 l66 l67 l68 l69 l70 l7l l72 l73 l74 l75
fi N a 0 l ® i « »
l0ll0000 l0ll000l l0ll00l0 l0ll00ll l0ll0l00 l0ll0l0l l0ll0ll0 l0ll0lll l0lll000 l0lll00l l0lll0l0 l0lll0ll
l76 l77 l78 l79 l80 l8l l82 l83 l84 l85 l86 l87
A A A © +
l0llll00 l0llll0l l0lllll0 l0llllll ll000000 ll00000l ll0000l0 ll0000ll ll000l00 ll000l0l ll000ll0 ll000lll
l88 l89 l90 l9l l92 l93 l94 l95 l96 l97 l98 l99
+ ¢ ¥ + + - - + - + a A
ll00l000 ll00l00l ll00l0l0 ll00l0ll ll00ll00 ll00ll0l ll00lll0 ll00llll ll0l0000 ll0l000l ll0l00l0 ll0l00ll
200 20l 202 203 204 205 206 207 208 209 2l0 2ll
+ + - - - + E E
ll0l0l00 ll0l0ll0 ll0l0lll ll0ll000 ll0ll00l ll0ll0l0 ll0ll0ll ll0lll00 ll0lll00 ll0lll0l ll0llll0 ll0lllll
2l2 2l3 2l4 2l5 2l6 2l7 2l8 2l9 220 22l 222 223
E f f r + + t
lll00000 lll0000l lll000l0 lll000ll lll00l00 lll00l0l lll00ll0 lll00lll lll0l000 lll0l00l lll0l0l0 lll0l0ll
224 225 226 227 228 229 230 23l 232 233 234 235
6 B 6 6 0 6 µ (J (J (J
lll0ll00 lll0ll0l lll0lll0 lll0llll llll0000 llll000l llll00l0 llll00ll llll0l00 llll0l0l llll0ll0 llll0lll
236 237 238 239 240 24l 242 243 244 245 246 247
y y - ± § ,
lllll000 lllll00l lllll0l0 lllll0ll llllll00 llllll0l lllllll0 llllllll
248 249 250 25l 252 253 254 255
. l 3 2

Tabla l. C6digo ASCII extendido. En cada celda: c6digo binario, decimal y caracter correspondiente.

24
Tema 4. Tipos y formatos de documentos

Con respecto a las ventajas e inconvenientes de los documentos de texto puro:

La principal ventaja del texto puro es que utiliza una codificaci6n estandar de cada
simbolo. De este modo, numerosas aplicaciones pueden leer el contenido de este tipo de
documentos y nos permiten su modificaci6n. Asi, todos los procesadores y editores de
texto pueden leer documentos en este formato y la mayoria de ellos ofrecen la
posibilidad de guardar los documentos utilizandolo. Esto hace que con el fin de facilitar
la maxima difusi6n de la informaci6n y simplificar su acceso, muchos de los
documentos que podemos encontrar en Internet se encuentren en formato de texto puro.
Asi, muchos de los libros electr6nicos que podemos encontrar en los principales
repositorios de la red, estan almacenados en este formato.
Por su propia definici6n los documentos en texto puro no conservan color, formatos o
fuentes porque no permiten incorporarlos, y tampoco permiten incluir imagenes.
Al tratarse de un formato tan simple, la impresi6n del texto puro conserva una alta
fidelidad con el original.
En cuanto a la seguridad, no es posible afiadir condiciones para evitar la alteraci6n de
los documentos en texto puro.
Finalmente, y como otra ventaja de este tipo de formato, los documentos guardados en
el mismo ocupan un espacio muy reducido, dado que s6lo guardan los caracteres que
contienen y ninguna informaci6n adicional sobre su formato.
4.1.2. Generado con procesadores de texto
Una parte importante de los documentos de texto que solemos manejar con los
ordenadores han sido generados utilizando algun procesador de textos. El objetivo de
este tipo de aplicaciones es precisamente la creaci6n o modificaci6n de texto con
formato. Alguno de los procesadores de textos mas conocidos son Microsoft Word y
WordPerfect.
Los procesadores de textos mas extendidos son comerciales y guardan por defecto la
informaci6n en un formato que les es propio. Esto significa que tan s6lo ese mismo
procesador es capaz de leer estos documentos. No obstante, dada la importancia del
facil intercambio de informaci6n, todos los procesadores permiten almacenar los
documentos en otros formatos que no poseen la restricci6n anterior. Por ejemplo,
podemos almacenar la informaci6n como texto puro o en formato RTF (Rich Text
Format). El problema de guardar los documentos con un procesador en un formato
distinto del que le es propio, es que en muchos casos se pierden parte de sus
caracteristicas. Por ejemplo, si guardamos un documento Word como texto puro,
perdemos todo el formato que contiene, incluyendo obviamente cualquier imagen o
grafico.
Otro problema que tienen los formatos propios de los procesadores de texto es la poca
consistencia de los mismos entre distintas versiones del programa. Asi, distintas

25
Universitat Jaume I Herramientas Informaticas para la Documentaci6n

versiones de un mismo procesador pueden no reconocer un documento generado por


otras o cambiar notablemente su apariencia. Es muy normal que versiones antiguas de
un mismo procesador no sean capaces de abrir documentos generados con versiones
mas recientes. Por ejemplo, Word 6 puede tener bastantes dificultades en abrir y
visualizar correctamente un documento creado y guardado con Word 2000. No s6lo eso,
una misma versi6n de un procesador, pero utilizada sobre dos sistemas operativos
distintos (p.e. Windows XP y MacOS X) puede dar lugar a visualizaciones bastante
diferentes del mismo documento.
En definitiva, este tipo de documentos no disponen de un visor universal y conservan,
aunque no totalmente el color, formato y fuentes del original.
Este tipo de documentos permiten incluir imagenes.

Al igual que ocurre con la visualizaci6n, no siempre es posible imprimir este tipo de
documentos con fidelidad. El resultado depende en gran medida de la versi6n del
procesador que usemos para imprimirlo, de los tipos de caracteres disponibles en el
sistema operativo y de la impresora que utilicemos.
Los principales procesadores de textos suelen incorporar algun mecanismo para
proteger los documentos contra su posterior alteraci6n. Principalmente el uso de
contrasefias.
Otro de los inconvenientes de este tipo de formato es que los ficheros que lo utilizan
suelen ocupar mucho espacio. De hecho, bastante mas del que parece l6gico para incluir
informaci6n sobre su contenido y formato.
4.1.3. Formatos de visualizacion e impresion
Existen formatos especialmente creados para la visualizaci6n e impresi6n de calidad de
textos con formato. Entre ellos podemos destacar dos muy extendidos: El formato PDF
y el formato PostScript.
El formato PDF (Portable Document Format) [.pdf] es un formato muy difundido
creado por Adobe y pensado especialmente para la distribuci6n de textos electr6nicos
con formato. Incorpora todas las caracteristicas deseables para este tipo de formatos:
• Existe un visor universal de libre distribuci6n (gratuito) que permite
visualizar este tipo de documentos en los sistemas operativos mas
extendidos: el Acrobat Reader.
• El formato esta pensado para conservar las fuentes, formatos y colores de los
documentos.
• Permite la ubicaci6n precisa de imagenes y los mantiene ante un cambio de
sistema operativo.
• Aunque no es estrictamente un formato de impresi6n, mantiene un alto grado
de fidelidad al original en las versiones impresas.

26
Tema 4. Tipos y formatos de documentos

• Las aplicaciones para la generaci6n de documentos en PDF permiten


incorporar condiciones de seguridad a los documentos que impiden su
posterior alteraci6n o impresi6n.
• Los documentos en PDF suelen ocupar bastante menos espacio que los
equivalentes generados con los procesadores de textos mas extendidos.
El principal inconveniente de los documentos en formato PDF es que no pueden
editarse y modificarse, y resulta complicado extraer o copiar parte del texto o de las
imagenes que contienen. Dado que se trata de un formato pensado para el intercambio y
la visualizaci6n de documentos, no existen programas pensados para su modificaci6n.
Podemos crear ficheros con este formato a partir de procesadores de texto y otras
aplicaciones como editores de graficos u hojas de calculo. Para ello es necesario
disponer de la aplicaci6n comercial (de pago) Adobe Acrobat. Esta aplicaci6n permite
imprimir los documentos sobre una impresora especial que no genera una copia en
papel, sino un fichero en formato PDF. Ademas, permite incorporar a aplicaciones
como Word la posibilidad de guardar directamente en este formato mediante una de sus
opciones de menu.
El formato PostScript [.ps] fue creado especificamente para permitir la impresi6n de
documentos con alta calidad y fidelidad al original. Este tipo de ficheros poseen unas
caracteristicas muy similares al formato PDF.
• Existen visores bastante difundidos que permiten visualizar los documentos
PostScript. Sin embargo, no se trata de un formato pensado para una
visualizaci6n de calidad, sino para su impresi6n, con lo que no siempre
podemos esperar buenos resultados en pantalla. El visor mas difundido de
este tipo de formato es GhostView.
• Permite conservar las fuentes, formatos y colores de los documentos en su
versi6n impresa.
• Permite la ubicaci6n precisa de imagenes.

• Conserva con total precisi6n el formato al imprimir el documento, ya que es


su principal finalidad. No obstante para poder imprimir documentos de este
tipo es necesario utilizar impresoras que reconozcan este formato. Este tipo
de impresoras se denominan impresoras PostScript y no suelen ser las mas
vendidas entre usuarios particulares.
• El formato PostScript no incorpora mecanismos para impedir su
modificaci6n, aunque, tal y como puede verse en la figura 20, resulta cuanto
menos dificil lograrlo accediendo directamente a la informaci6n textual
almacenada.

27
Universitat Jaume I Herramientas Informaticas para la Documentaci6n

• Los documentos en PostScript suelen ser de pequefio tamafio salvo cuando


incluyen imagenes o graficos que ocupan mucha memoria.

Figura l9. Contenido de un fichero en formato PostScript.

Al igual que ocurre con el formato PDF, los ficheros en PostScript no pueden
modificarse, ni pueden extraerse o copiarse parte de los mismos, tan s6lo pueden
visualizarse y, fundamentalmente, imprimirse.
Los ficheros PostScript suelen generarse a partir de cualquier aplicaci6n que genere un
documento susceptible de ser impreso. Si disponemos de una impresora PostScript y del
software adecuado para imprimir en la misma, las propias aplicaciones permitiran
imprimir sobre un fichero PostScript en lugar de sobre papel.
4.1.4. Lenguajes de formato
Los lenguajes de formato estan pensados para describir el contenido y formato de
documentos. Mediante una sintaxis preestablecida nos permiten describir todas las
caracteristicas relativas al formato del documento y del texto que contienen, pudiendo
incluir aspectos tales como los margenes, las cabeceras, las caracteristicas asociadas a
los caracteres, a los parrafos, etc. Ademas, nos permiten describir tablas y ubicar
imagenes. La idea es poder describir textos electr6nicos con formato totalmente
independiente del entorno en el que estemos visualizandolos, de modo que su apariencia
no varie aunque cambiemos de ordenador o de sistema operativo.
El mas difundido de estos lenguajes de formato en la actualidad es el HTML (HyperText
Mark-Up Language), debido a que se usa para la creaci6n de paginas web. Este lenguaje
de formato tiene su origen en el SGML (Standard Generalized Mark-Up Language) que
constituye un estandar internacional para definir lenguajes de formato basados en
etiquetas. El lenguaje HTML se basa en las normas establecidas por el SGML para dar
formato a textos e incorporar enlaces, es decir, para crear documentos hipertexto con
formato.

28
Tema 4. Tipos y formatos de documentos

El que el lenguaje este basado en el uso de etiquetas significa que existen unos textos
especiales (etiquetas, o tags en ingles) que se incorporan al documento y que permiten
definir las partes de que consta y todo lo relativo al formato de las mismas.
Dado que las paginas web han ido aumentando su complejidad para responder a las
demandas de los usuarios de la web, el lenguaje utilizado para poder describirlas ha ido
evolucionando. De este modo se han definido varias versiones del lenguaje HTML. En
la actualidad la versi6n mas reciente es el HTML 4.0l. No obstante, este lenguaje sigue
teniendo serias limitaciones para adaptarse a las nuevas tecnologias y medios, tales
como la telefonia m6vil. Lo que se ha hecho es definir una nueva versi6n de las normas
dadas por el SGML denominada XML (eXtensible Mark-up Language), a partir de la
cual sera posible definir nuevas versiones del HTML, denominadas XHTML.
Ademas de los lenguajes de formato relacionados con
elwwwwwwwwwwwwwxxxxdededed HTML y con las paginas web, existe otro
lenguaje de formato muy extendido entre los cientificos e investigadores, ya que esta
especialmente pensado para la descripci6n de articulos cientifico-tecnicos con un
formato sofisticado, incluyendo graficos y f6rmulas matematicas complejas. Este
lenguaje se denomina LaTex (ver figura 2l) y existen programas que permiten la
traducci6n de los documentos escritos en el mismo a formatos visualizables o
imprimibles, tales como el PostScript.

Figura 20. Ejemplo de documento en LaTex (detras) y de su resultado una vez interpretado (delante).

Las caracteristicas generales de los documentos definidos mediante lenguajes de


formato son las siguientes:
• Al estar pensados para ser visualizados en cualquier entorno, existen
programas para distintos sistemas operativos que son capaces de traducir el
lenguaje a un documento con formato. Por ejemplo, los navegadores web

29
Universitat Jaume I Herramientas Informaticas para la Documentaci6n

estan pensados para visualizar documentos escritos en HTML, y las


versiones mas recientes de los principales procesadores de textos tambien
permiten su visualizaci6n.
• Permiten la inclusi6n de fuentes, formatos y colores en el documento, aunque
la variedad de los mismos depende del lenguaje en concreto. Asi, el lenguaje
HTML es bastante limitado en este sentido, mientras el LaTex es mucho mas
completo.
• Los lenguajes de formato suelen permitir la ubicaci6n de imagenes en el
texto, pero la precisi6n del resultado obtenido depende de cada lenguaje
concreto.
• La calidad de la impresi6n obtenida depende mucho del lenguaje utilizado.
Mientras HTML no garantiza una impresi6n fidedigna y depende mucho del
programa visor utilizado para imprimir, el lenguaje LaTex esta pensado para
generar versiones imprimibles que no varien al cambiar el entorno de trabajo.
• Los lenguajes de formato no estan pensados para incorporar mecanismos de
protecci6n de los documentos obtenidos.
• Los ficheros con lenguaje de formato suelen ser de tamafio reducido, ya que
contienen tan s6lo texto puro. No obstante hay que tener en cuenta que no
incorporan las imagenes o graficos y que estas deben ser tratadas como
ficheros adicionales cuyo tamafio deberia sumarse al del fichero con el
lenguaje de formato.
4.2. Tmagenes
Otro de los tipos de informaci6n mas extendidos en el ambito de la informatica y de las
comunicaciones son las imagenes. Existen muchos formatos para almacenar imagenes
con distintas caracteristicas en cuanto a la precisi6n de las mismas y el tamafio de los
ficheros resultantes.
Cuando se guarda un documento de texto puro, los caracteres que lo componen son
codificados mediante un estandar como ASCII, y sus c6digos numericos son
almacenados en forma de ceros y unos en el fichero. En el caso de las imagenes sus
componentes basicas no son los caracteres, sino los puntos de distintos colores o con
distintos tonos de gris que la conforman. Estos puntos se denominan pixels. Una forma
simple de almacenar una imagen es codificar cada uno de los colores distintos de que
puede constar la misma como un c6digo numerico unico. Cada imagen se guardara
como una sucesi6n de numeros (traducidos a ceros y unos) correspondientes a cada uno
de sus puntos (pixels). Este es el mecanismo utilizado por el formato GIF (Graphics
Interchange Format), que codifica un total de 256 colores distintos. Este es, junto con el
formato JPEG uno de los dos sistemas de almacenamiento de imagenes que mas se

30
Tema 4. Tipos y formatos de documentos

utiliza en Internet. La mayor parte de las imagenes incluidas en paginas web siguen uno
de estos dos formatos y cualquier navegador web puede visualizarlos sin problemas.
El formato JPEG (Join Photographers Expert Group), permite guardar las imagenes en
un formato comprimido. De esta forma, una misma imagen suele ocupar menos espacio
en este formato que en formato GIF. No obstante, la precisi6n con que se guarda la
imagen en formato JPEG es inferior.
En general, para acceder a las imagenes y poder visualizarlas, crearlas o modificarlas
son necesarios programas especiales denominados editores de imagenes. Existen toda
una serie de formatos de amplia difusi6n que permiten el intercambio de imagenes entre
distintos editores, mientras otros son propios de algun editor en concreto y no pueden
ser visualizados por otros. Entre los formatos transferibles cabe destacar el TIFF
(Tagged Image File Format), o el EPS (Encapsulated PostScript) pensado para la
inserci6n de imagenes en documentos PostScript.
4.3. Audio
Menos extendidos que los ficheros de texto o imagenes podemos encontrar los ficheros
de audio. El formato para el almacenamiento de audio mas extendido en el mundo de la
informatica es WAVE File Format [.wav], dado que es el formato por defecto de
Windows.
No obstante, la aparici6n de Internet y la posibilidad de intercambiar canciones por este
medio ha dado lugar a un nuevo formato ampliamente extendido. Se trata del formato
MP3. Este formato mantiene la calidad digital del sonido de los CDs originales pero
permite su almacenamiento en un espacio mucho mas reducido. Asi, mientras una
canci6n en formato WAV puede ocupar unos 40 Mbytes, la misma canci6n almacenada
en formato MP3 suele ocupar entre 3 y 4 Mbytes. Esto permite almacenar mas de l30
canciones en un unico CD. El reducido tamafio de los ficheros de audio en este nuevo
formato, hace que sea el formato imperante para el rapido intercambio de canciones a
traves de Internet y para el almacenamiento de canciones en pequefios reproductores
portatiles que pueden almacenar varias horas de musica. En Internet es posible
encontrar multitud de paginas y repositorios donde es posible obtener, de una forma mas
o menos legal, una gran cantidad de canciones en formato mp3. Asimismo, existen
programas especializados en la creaci6n de grandes repositorios para el intercambio de
este tipo de ficheros. El mas conocido de este tipo de programas es Napster
(www.napster.com).
Existen muchos programas de ordenador que permiten escuchar musica en formato
mp3. El mas conocido de ellos quizas sea Winamp. Ademas, tambien existen programas
que permiten la traducci6n de las canciones incluidas en CDs de musica (CD-A) a este
formato.

3l
Universitat Jaume I Herramientas Informaticas para la Documentaci6n

4.4. Video
En informatica se manejan un numero relativamente reducido de formatos de video. Los
formatos mas comunes son los siguientes:
MPEG (Moving Pictures Experts Groups) - [.mpg]. Es el formato mas difundido para
las pequefias peliculas en Internet, lo cual significa que existen una gran cantidad de
programas para reproducir este formato en los tres sistemas operativos mas extendidos
(Windows, MacOS y UNIX). Usa un esquema de compresi6n para reducir el tamafio de
los ficheros.
AVI (Audio Video Interleave) - [.avi]. Es un formato de video definido por Microsoft y
es el mas comun en el mundo del PC y de Windows. Pueden reproducirse por ejemplo
con el programa Windows Media Player.
QuickTime [.mov]. Es un formato de video digital desarrollado por Apple y puede
considerarse el equivalente del formato AVI en el mundo de los Macintosh, aunque
existen reproductores de este tipo de ficheros para distintos sistemas operativos. Pueden
reproducirse con el programa QuickTime Player.
Real media [.rm]. Se trata de un formato de video especialmente util para Internet, ya
que permite iniciar la reproducci6n del mismo antes de estar completamente
descargado. Para reproducir este tipo de videos debe usarse el programa RealPlayer.
4.5. Ficheros ejecutables
Los ficheros ejecutables son aquellos cuyo contenido indica al ordenador que debe
realizar una serie de acciones mas o menos complejas. Un fichero ejecutable puede
simplemente sumar dos numeros introducidos por teclado y mostrar el resultado por
pantalla, puede tratarse de un complejo programa de edici6n de video 3D para realizar
animaciones, o de un procesador de textos. Las extensiones mas comunes de los
ficheros ejecutables en Windows son .exe y .com.
El formato de los ficheros ejecutables depende totalmente del sistema operativo. De este
modo, un fichero ejecutable en Windows, no lo sera en otros sistemas como UNIX o
MacOS X y viceversa. Incluso suele ocurrir que un fichero ejecutable en una versi6n de
un sistema operativo (p.e. Windows XP) no funcione en otra (p.e. Windows 95).
4.6. Ficheros comprimidos
Una de las caracteristicas deseables en los ficheros es un tamafio reducido, ya que esto
permite el almacenamiento de mucha informaci6n en los distintos soportes
informaticos, y reduce el tiempo de transferencia de los mismos a traves de Internet.
Algunos de los formatos de fichero que hemos revisado incorporan su propio sistema de
compresi6n de la informaci6n para lograr ficheros reducidos. Por ejemplo: las imagenes
JPEG, los ficheros de audio MP3 y practicamente todos los formatos de video. No

32
Tema 4. Tipos y formatos de documentos

obstante existen numerosos programas que nos permiten comprimir cualquier tipo de
fichero y se han definido diversos formatos de compresi6n de informaci6n.
Ademas, en muchas ocasiones interesa agrupar varios ficheros en uno s6lo para facilitar
su almacenamiento o transmisi6n. Muchos de los programas de compresi6n permiten
agrupar varios ficheros como uno s6lo y comprimir el resultado. De este modo, cuando
se descomprime el fichero resultante, se vuelven a obtener los ficheros originales.
Los formatos mas comunes son los siguientes:

zip [.zip]. Se trata del formato de compresi6n mas comun en el mundo del Windows.
Puede ser descomprimido con programas como PKZip o WinZip, aunque existen
muchos mas de libre distribuci6n.
Gzip [.gz]. Se trata de un formato de compresi6n muy comun en UNIX, aunque tambien
puede ser manejando con programas de compresi6n de Windows como WinZip.
Sit [.sit]. Es un formato de compresi6n muy utilizado en los ordenadores Macintosh. Se
maneja fundamentalmente con el programa Stuffit.
En ocasiones podemos traernos un fichero comprimido y no disponer del programa de
descompresi6n adecuado. Por ello, existen ficheros comprimidos capaces de
autodescomprimirse. Este tipo de ficheros son ficheros con la extensi6n .exe, que al ser
ejecutados se descomprimen.

33

Common questions

Con tecnología de IA

Both PDF and PostScript are designed to maintain document formatting across different systems. PDF is favored for online document sharing, allowing for high fidelity in viewing and printing, with universal accessibility through Acrobat Reader and security settings to prevent alterations. PostScript is specifically print-oriented, supporting accurate high-quality printing, and requires compatible printers. It lacks widespread viewer quality for screen use .

Word processors often face compatibility issues across different versions or operating systems, resulting in potential changes in document appearance or functionality. Older versions may struggle to open files from newer editions, and documents may render differently on varied systems, such as between Windows and MacOS .

Digital reference works offer significant advantages over paper versions by providing ease and speed of search, the ability to navigate content and connect related topics, and rapid content updates. These features enhance user accessibility and interaction, allowing for quick and precise information retrieval without the need for sequential reading .

Online bilingual dictionaries have greatly expanded their language offerings, covering hundreds of languages, from widely spoken ones like English and German to less common ones like Esperanto. They also cater to specialized topics, providing access to dictionaries on business, law, and more, connecting global users with diverse linguistic and topical needs .

Online dictionaries have evolved from being published solely in print, updating every ten years, to being continuously updated on the internet. For example, the Real Academia's dictionary is now updated continuously online, interacting with users, and publishing print versions every two to three years .

Electronic encyclopedias, such as Encarta, offer interactive features like clickable maps providing detailed information about regions. These interactive elements allow users to engage directly with content, enhancing the learning experience with up-to-date and interactive data visualizations .

Text-based documents in formats like plain text lack formatting and security features, such as maintaining fonts, colors, or the inclusion of images. They also cannot be altered securely as there are no built-in provisions to prevent modifications .

Library catalogs, as secondary reference works, direct users to other documents needed for the desired information. By offering searchable databases of book metadata like authorship and publishing details, they play a crucial role in information retrieval, connecting researchers to relevant resources efficiently .

Digital newspapers differ from traditional print versions by offering partially free access, where only headlines and some content are available without a subscription. Over time, most content has shifted to a subscription model. Digital versions also include features like forums, multimedia, and navigable hypertext to enhance user experience .

The main benefits of plain text format include simplicity and small file size, ensuring easy distribution and broad accessibility. However, it cannot retain formatting, colors, or images, limiting its usefulness for rich document presentation .

También podría gustarte