ELABORACIÓN DE DOCUMENTO
Análisis documental
Es una de las operaciones fundamentales de la cadena documental. Se trata de una
operación de tratamiento.
El análisis documental es un conjunto de operaciones
encaminadas a representar un documento y su contenido bajo una forma
diferente de su forma original, con la finalidad posibilitar su recuperación
posterior e identificarlo.
El análisis documental es una operación que da lugar a un subproducto o documento
secundario que actúa como intermediario o instrumento de búsqueda obligado entre el
documento original y el usuario que solicita información.
En el análisis documental se produce un triple proceso:
El análisis documental surge con fines de orientación científica e informativa y sus
productos, los documentos secundarios:
✔ Representan sintéticamente a los originales
✔ Contienen una información concentrada del documento original
✔ Pueden ser consultados con facilidad ofreciendo las primeras noticias de
la existencia de aquellos.
La finalidad última del análisis documental es la
transformación de los documentos originales en otros
secundarios, instrumentos de trabajo, identificativos de los
primeros y gracias a los cuales se hace posible tanto la
recuperación de éstos como su difusión.
Toda la información registrada, en el soporte que sea, puede ser objeto del análisis
documental: un artículo original de una revista científica, una noticia de prensa, un
reportaje de revista, una obra musical, un registro sonoro, una imagen de vídeo, una
película, una fotografía, una página web.
El producto secundario por excelencia al que da lugar el análisis documental son las
bases de datos documentales. A partir de las bases de datos se pueden generar muchos
productos impresos o electrónicos.
Un proceso de transformación, en el Un proceso analítico-sintético,
que un documento primario porque la información es estudiada,
Un proceso de comunicación, ya que
sometido a las operaciones de interpretada y sintetizada
posibilita y permite la recuperación
análisis se convierte en otro minuciosamente para dar lugar a un
de información para transmitirla
documento secundario de más fácil nuevo documento que lo representa
acceso y difusión de modo abreviado pero preciso
Artículo original de una revista impresa Registro resultante tras el análisis
documental
Núm.Registro:255203 Autores:KEEFER, ALICE
Título:FIRSTSEARCH: SERVICIO EN LINEA PARA EL USUARIO
FINAL
Título otros idiomas: FIRSTSEARCH: SERVEI EN LINIA PER A
L'USUARI FINAL
ISSN:0214-0349
Revista: Item. Revista de Biblioteconomía i Documentación
Datosfuente:1994, (16):34-42 Tipo documento: Artículo de revista
Lengua: Catalán Localización: ISOC
Resumen: FirstSearch es el nuevo servicio de tele documentación de OCLC,
que cubre tanto el acceso y la consulta de bases de datos como la obtención
del documento original. 5.753 instituciones lo utilizan actualmente. En Europa
hay 152 bibliotecas usuarias: 68 universitarias, 6 bibliotecas públicas y 78 de
empresas.
De las 50 bases de datos que el servicio ofrece, 5 se distribuyen
exclusivamente a través del mismo. Se describen ArticleFirst, ContentsFirst,
FastDoc, NetFirst y PapersFirst.
Se describen las modalidades de consulta y los resultados de una encuesta que
revelan una gran aceptación por parte de los usuarios y se ilustran los costes
de obtención de documentos a partir de diversos proveedores y medios de
envío
Descriptores: Catálogos de acceso público en línea ;Bases de datos
; Acceso a la información ; Acceso al documento Identificadores:OCLC ;
FIRSTSEARCH Clasificación:
200501 Catálogos convencionales y automatizados (OPACS) 200402
Catalogación.
Gráfico
publicado
en un diario
Registro
resultante
tras el
análisis
documental
El análisis documental está constituido por varias operaciones fundamentales y
diferentes. Gráficamente puede expresarse del siguiente modo
A
N Descripción física (bibliográfica/documental; análisis formal/externo)
L
I
S
I
S
Palabras Clave
D
Descriptores
O
U
M Análisis
de
contenidos E
N
L
Indización
Resumen Clasificación
● La descripción física o análisis formal:
Se trata de la descripción bibliográfica del documento.
Es el proceso de descripción física o externa de un documento, permite la
identificación inequívoca del documento.
Actúa sobre el soporte e identifica los datos externos de un documento que lo
distinguen de otro, proporcionando una identificación individual.
Permiten localizar la fuente donde está publicado el documento.
✔ Datos a consignar: Dependerá del tipo de documento, de lo que se
considere unidad documental y del soporte.
Ejemplo para la descripción física de un artículo de revista.
Título del artículo
Autor/es
Título de la publicación
Número de la publicación
Fecha publicación
Mes (o periodo) Año
de publicación
Página inicial Página
final
● Análisis de contenidos o análisis interno:
Opera sobre el contenido temático del documento y logra una representación de la
información tratada.
El análisis de contenido se divide a su vez en:
a. Indización o descripción característica (con palabras clave y con descriptores)
SIGNIFICA CONSTRUIR INDICES Y SIGNIFICA
SELECCIONAR EXPRESIONES O TERMINOS PARA
REPRESENTAR EL CONTENIDO O LOS TEMAS DE LOS
QUE TRATA UN DOCUMENTO
Existen dos modalidades distintas pero complementarios en la indización:
1. Palabras clave
Términos elegidos por el indizador para designar los diferentes aspectos temáticos. No
suele existir control estricto del vocabulario empleado. Los sinónimos y variaciones
ortográficas suelen ser palabras clave.
Son, por tanto, una importante fuente, en la operación de mantenimiento de los lenguajes
controlados (por ejemplo: elaboración de tesauros).
Las palabras clave puede obtenerse de dos maneras:
Por extracción o derivación: Proceso por el
cual los términos de indización se toman del
texto que se indiza.
Por asignación: Elección y atribución de
términos de indización, que no figuran en el
texto, pero lo representan. Para ello se pueden
consultar fuentes externas como diccionarios
de sinónimos, diccionarios especializados, etc.
Indización orientada por los documentos: construyendo una lista de temas a partir de
documentos indizados previamente y comparar los nuevos textos con esa lista.
2. Descriptor: Términos normalizados, formalizados y homologados en un lenguaje
documental (tesauro) y empleados para representar sin ambigüedad los
conceptos tratados en los documentos.
Representan un único significado. Normalmente son palabras simples,
pero pueden ser también términos compuestos.
b. Resumen o descripción sustancial
Se refiere al análisis de los contenidos de los documentos. Es la representación abreviada
del contenido de un documento sin interpretación ni crítica.
Existen distintos tipos de resúmenes. Los más conocidos son:
Indicativo o descriptivo: Resumen que indica el tipo de documento, los principales temas
tratados y cómo se tratan. Se utilizan para resumir estudios generales.
Informativo o analítico: Resumen que facilita la máxima información posible cuantitativa
o cualitativa, o ambas, contenida en un documento. Se utilizan para describir trabajos
experimentales y originales dedicados a un solo tema.
Selectivo: Resumen que refleja sólo aquellas partes del texto que parecen esenciales para
una categoría de usuarios determinada.
Resúmenes de conclusiones: Segunda exposición breve de los principales resultados y
conclusiones de un documento. Completa la orientación del lector que ha estudiado el
texto precedente. Se coloca generalmente al final de los artículos.
Los objetivos del resumen son:
-Informar al usuario sobre el contenido preciso de los
documentos.
-Es utilizable para la recuperación automatizada.
-Para los documentos escritos en lenguas de difícil
acceso, resulta fundamental para conocer la existencia y
tema de una investigación, y decidir la conveniencia o
no de su traducción.
-Para las personas con un interés por el tema les es
suficiente con leer el resumen
-En los documentos no escritos el resumen se presenta como la única posibilidad de
describir su contenido.
c. Clasificación
Clasificar es “ordenar o disponer por
clases”.
Se entiende por clasificación
documental el proceso de análisis por el
cual un documento es identificado y
ordenado por clases, definidas éstas
según el contenido del propio
documento.
Su principal objetivo es permitir el agrupamiento de materias específicas en clases
mayores o más genéricas para facilitar la organización,
almacenamiento y recuperación de la información a partir de un
tema amplio.
En las bases de datos multidisciplinares la clasificación es
fundamental para poder, en un momento determinado, hacer subdivisiones de la base por
grandes temas
d. Otros datos de interés
✔ Idioma original del documento
✔ Filiación del autor (Institución de trabajo del autor) Dirección
del autor para correspondencia
✔ Dirección url de acceso al documento completo si está disponible online
✔ Número de referencias que aporta el documento (esto se hace en los centros de
documentación científica)
✔ Tipo documental (reseña, original, revisión, norma, descripción, patente, crónica,
ley, decreto, noticia, artículo, opinión, biografía, entrevista, reportaje, etc.)
Depende del centro de documentación y del tipo de documentos que se analicen.
Análisis documental de recursos en Internet
La recuperación rápida y pertinente de documentos web mediante un sistema
automático de búsqueda, como pueden ser los buscadores, o mediante los directorios
clasificatorios, se hace cada vez más complicada, debido al gran número de páginas
existentes y de la poca fiabilidad que están mostrando los métodos basados en
indización y recuperación automática.
Se han llevado a cabo, en este sentido (metadatos), diversas iniciativas para intentar
facilitar una fiable recuperación de la información y para normalizar la información que
se puede incluir en una página web para describirla.
A. El Dublín Core Metadata.
¿Qué son los metadatos?
Se podrían definir como el conjunto de etiquetas y datos que se incluyen
dentro del documento web para informar sobre éste. (Definición propia)
El término metadato aplicado a la información distribuida en Internet se
define como “datos acerca de datos”.
El término hace referencia a cualquier dato usado para ayudar a identificar,
describir y localizar los recursos electrónicos en un entorno de red.
❖ Documentación (autor, fecha de creación, título; fecha de
actualización...); Información sobre los contenidos (palabras clave,
resumen...)
❖ Información que ayude a la aplicación cliente a tomar una decisión
sobre el formato o sobre la localización
❖ Información o valoración sobre los contenidos (si incluye materiales
no adecuados para menores)
¿Quién asigna los metadatos?
La idea que hay detrás de los estándares de metadatos es crear una estructura simple que
permita al propio creador del documento asignar sus metadatos.
Los metadatos acompañan al documento web por eso solo los puede asignar el creador.
Existen programas informáticos que ayudan a crear los metadatos.
A. Dublín Core Metadata
De todos los modelos de metadatos existentes el Dublín Core Metadata es
el de más amplia aceptación, el más extendido en la actualidad.
Además, es un modelo de propósito general, es decir, está destinado a la
representación y descripción de documentos electrónicos que,
independientemente de su temática o de su finalidad informativa,
proporciona datos de diverso tipo sobre los recursos.
Está formado por quince elementos o campos. Los quince elementos sobre
los que se asienta el Dublín Core suponen un autoanálisis documental,
puesto que el propio autor del documento establece los aspectos formales e
intelectuales que definirán a la página creada.
<META NAME=”DC.Título” CONTENT=”
· Título: Nombre o título asignado al documento o a la fuente.
<META NAME=” DC.Autor” CONTENT=”
· Autor o creador: Creador intelectual del contenido del documento o de la fuente.
<
El formato Dublin Core permite, además, que todos los campos sean
repetibles, opcionales y puedan tener asociados cuantos enlaces se
consideren necesarios
Conceptos
Análisis documental: Operación que consiste en examinar un documento para
encontrar sus elementos esenciales y las relaciones entre ellos.
Análisis de contenido: Análisis que tiene por objeto facilitar los datos que
caracterizan el contenido del documento de una forma clara y concisa.
Indización: Operación destinada a representar los resultados del análisis del contenido
de un documento o de una parte del mismo, mediante elementos de un lenguaje
documental o natural, generalmente para facilitar la recuperación.
Resumen: Representación breve del contenido del documento, sin interpretación ni
crítica.
Resumen indicativo: Resumen que indica el tipo de documento, los principales
temas tratados y cómo se tratan. (También se llama descriptivo)
Resumen informativo: Resumen que facilita la máxima información posible
cuantitativa o cualitativa, o ambas, contenida en un documento. (También se llama
analítico)
Resumen selectivo: Resumen que refleja sólo aquellas partes del texto que parecen
esenciales para una categoría de usuarios determinada.
Resumen de conclusiones: Segunda exposición resumida, en un documento, de sus
principales resultados y conclusiones, que tiene por finalidad completar la orientación
del lector.
Extracto: texto constituido por frases seleccionadas de un documento.
Asignación de términos de indización: Elección y atribución de términos de
indización, aparezcan o no en el texto, para representar documentos o datos, de acuerdo
con ciertas reglas.
Extracción de términos: Proceso por el cual los términos de indización se toman del
texto que se indiza. (También se llama derivación de términos)
Indización precoordinada: Indización de documentos en los que la relación entre
los términos y su orden se establece a priori según un lenguaje documental o un sistema
de indización.
Indización poscoordinada: Indización sin relación ni orden preestablecido entre los
términos.
Profundidad de indización: Grado de detalle con el que se representa un tema en un
proceso de indización.
Indización automática: Representación del contenido de un documento por
selección automática de palabras o términos extraídos del texto, o por asignación
automática de términos extraídos de un lenguaje documental.
Preparación automática de resúmenes: Elaboración de un resumen por medios
automáticos.