Tema 5.
- Análisis documental
1.- El análisis documental
1.1.- La descripción física o análisis formal
1.2.-Análisis de contenidos o análisis interno
1.2.1.- Indización o descripción característica
1.2.2.- Resumen o descripción sustancial
1.2.3.- Clasificación
1.3.- Otros datos de interés
2.- Análisis documental de recursos en Internet
2.1.- Dublin Core Metadata
3.- Conceptos
1.- El análisis documental
Es una de las operaciones fundamentales de la cadena documental. Se trata
de una operación de tratamiento.
El análisis documental es un conjunto de operaciones encaminadas a
representar un documento y su contenido bajo una forma diferente de su forma
original, con la finalidad posibilitar su recuperación posterior e identificarlo.
El análisis documental es una operación intelectual que da lugar a un
subproducto o documento secundario que actúa como intermediario o
instrumento de búsqueda obligado entre el documento original y el usuario que
solicita información. El calificativo de intelectual se debe a que el
documentalista debe realizar un proceso de interpretación y análisis de la
información de los documentos y luego sintetizarlo.
En el análisis documental se produce un triple proceso:
Un proceso de comunicación, ya que posibilita y permite la recuperación
de información para transmitirla
Un proceso de transformación, en el que un documento primario
sometido a las operaciones de análisis se convierte en otro documento
secundario de más fácil acceso y difusión
Un proceso analítico-sintético, porque la información es estudiada,
interpretada y sintetizada minuciosamente para dar lugar a un nuevo
documento que lo representa de modo abreviado pero preciso
El análisis documental surge con fines de orientación científica e informativa y
sus productos, los documentos secundarios:
Biblioteconomía. Segundo cuatrimestre. Curso 2004-2005. Tema 5. Análisis documental 1
Profesora asociada: Lourdes Castillo
Representan sintéticamente a los originales
Contienen una información concentrada del documento original
Pueden ser consultados con facilidad ofreciendo las primeras noticias de
la existencia de aquellos.
La finalidad última del análisis documental es la transformación de los
documentos originales en otros secundarios, instrumentos de trabajo,
identificativos de los primeros y gracias a los cuales se hace posible tanto la
recuperación de éstos como su difusión.
Toda la información registrada, en el soporte que sea, puede ser objeto del
análisis documental: un artículo original de una revista científica, una noticia de
prensa, un reportaje de revista, una obra musical, un registro sonoro, una
imagen de vídeo, una película, una fotografía, una página web.
El análisis documental representa la información de un documento en un
registro estructurado, reduce todos los datos descriptivos físicos y de contenido
en un esquema inequívoco.
El producto secundario por excelencia a que da lugar el análisis documental
son las bases de datos documentales. A partir de las bases de datos se pueden
generar muchos productos impresos o electrónicos (boletines de sumarios,
boletines de resúmenes, índices de...
Artículo original de una revista impresa Registro resultante tras el análisis
documental
Nú[Link] Autores:KEEFER, ALICE
Título:FIRSTSEARCH: SERVICIO EN LINEA PARA EL USUARIO FINAL
Título otros idiomas: FIRSTSEARCH: SERVEI EN LINIA PER A L'USUARI FINAL
ISSN:0214-0349
Revista:Item. Revista de Biblioteconomía i Documentació
Datosfuente:1994,(16):34-42 Tipodocumento:Artículo de revista Lengua:Catalán Localización:ISOC
Resumen: FirstSearch es el nuevo servicio de teledocumentación de OCLC, que cubre tanto el acceso y la consulta de bases de datos como la obtención del d
De las 50 bases de datos que el servicio ofrece, 5 se distribuyen exclusivamente a través del mismo. Se describen ArticleFirst, ContentsFirst, FastDoc, NetFirs
Se describen las modalidades de consulta y los resultados de una encuesta que revelan una gran aceptación por parte de los usuarios y se ilustran los costes
Descriptores: Catálogos de acceso público en línea ;Bases de datos
; Acceso a la información ; Acceso al documento Identificadores:OCLC ; FIRSTSEARCH Clasificación:
200501 Catálogos convencionales y automatizados(OPACS) 200402 Catalogación.
Gráfico publicado en un diario Registro resultante tras el análisis
documental
PUBLICACIO: EL PAIS
DATA DE PUBLICACIO: 24-06-2001 MES DE PUBLICACIO: JUNIO
ANY DE PUBLICACIO: 2001 PAGINA INICIAL:30 PAGINA FINAL:30
RESUMEN: Evolución de los incendios forestales en España de 1994 a 2000
AMBIT: ESPANYA CLASSIFICACIO: MEDI AMBIENT
DESCRIPTORS: INCENDIS FORESTALS PARAULES CLAU: SUPERFICIE FORESTAL C
DATA DE CARREGA: 26-06-2001
TIPUS DE DOCUMENT:DADES ESTADISTIQUES NOTES:
ANALISTA:tmdo10
Página web
Metadatos, dentro del código fuente,
que describen la página web
<HTML>
<HEAD>
<META HTTP-EQUIV="Content-Type"
CONTENT="text/html; charset=iso-8859-1">
<META NAME="keywords" CONTENT="MALVINE,
Manuscripts and letters, ONE, Metadata, EAD, Encoded
Archival Description, library, museum, ANSI Z39.50,
Z3950, Distributed Search, Retrieval, query
broadcasting">
<META NAME="description"
CONTENT="MALVINE opens new and enhanced
access to disparate holdings of modern manuscripts
and letters, kept and catalogued in European libraries,
archives, documentation centres and museums.">
<META NAME="LANGUAGE" CONTENT="de-at">
<META NAME="security" CONTENT="public">
<META NAME="AUTHOR" CONTENT="JOANNEUM
RESEARCH, MALVINE CONSORTIUM">
<TITLE>MALVINE - Manuscripts and Letters via
Integrated Networks in Europe</TITLE>
<LINK HREF="[Link]" REL="STYLESHEET">
</HEAD>
…
…
…
</HTML>
Importante: En éste último ejemplo, los datos y sus etiquetas identificativas, que
describen las páginas web, están en el propio documento original, no son un
registro independiente del documento. Para visualizarlos hay que ver el código
fuente.
El análisis documental está constituido por varias operaciones fundamentales y
diferentes. Gráficamente puede expresarse del siguiente modo
A
N Descripción física (bibliográfica/documental; análisis formal/externo)
L
I
S
I
S
Palabras Clave
D Indización
O Descriptores
C
U
M Análisis de contenidos Resumen
E
N
T Clasificación
A
L
No hay total acuerdo sobre la dicotomía análisis formal (descripción física) /
análisis de contenido. Básicamente existen dos corrientes. Una corriente –
llamada integradora- concibe el análisis documental como un conjunto de
operaciones que actúan tanto en el contenido como en la forma documental. A
ella pertenecen María Pinto Molina, Vickery, Guinchat, López Yepes y otros.
La segunda corriente - corriente restringida – entiende por análisis documental
sólo el que comprende el análisis de contenidos. Autores como Chaumier,
García Gutiérrez y otros pertenecen a esta segunda corriente.
1.1.- La descripción física o análisis formal:
Se trata de la descripción bibliográfica del documento.
Es el proceso de descripción física o externa de un documento,
permite la identificación inequívoca del documento.
Actúa sobre el soporte e identifica los datos externos de un
documento que lo distinguen de otro, proporcionando una
identificación individual.
Permiten localizar la fuente donde está publicado el documento.
Datos a consignar: Dependerá del tipo de documento, de lo que
se considere unidad documental y del soporte.
Ejemplo para la descripción física de un artículo de revista.
Título del artículo
Autor/es
Título de la publicación
Número de la publicación
Fecha publicación
Mes ( o periodo)
Año de publicación
Página inicial
Página final
La necesidad del control bibliográfico internacional obligó a la IFLA a redactar
unas normas específicas internacionales: las ISBD.
1.2.-Análisis de contenidos o análisis interno:
Opera sobre el contenido temático del documento y logra una
representación de la información tratada.
El análisis de contenido se divide a su vez en:
1.2.1.- Indización o descripción característica (con palabras clave
y con descriptores)
Indizar significa construir índices y significa seleccionar
expresiones o términos para representar el contenido o los temas
de que trata un documento y también las solicitudes de
información.
La indización supone caracterizar y representar el contenido de
documentos y preguntas mediante términos apropiados, con el fin
de permitir el almacenamiento (generación de índices) y posterior
recuperación de la información.
Existen dos modalidades distintas pero complementarios en la
indización: las palabras clave y los descriptores. Se consignarán
en campos diferentes.
Palabras clave: términos elegidos por el indizador para designar
los diferentes aspectos temáticos. No suele existir control estricto
del vocabulario empleado. Los sinónimos, cuasisinónimos y
variaciones ortográficas suelen ser palabras clave. Se emplea con
frecuencia, de forma incorrecta, como sinónimo de descriptor.
Las palabras clave con una frecuencia alta terminan siendo
candidatas a descriptor y finalmente pasan a ser descriptores.
Son, por tanto, una importante fuente, en la operación de
mantenimiento de los lenguajes controlados (por ejemplo:
elaboración de tesauros).
Las palabras clave puede obtenerse de dos maneras:
Por extracción o derivación: Proceso por el cual los
términos de indización se toman del texto que se indiza.
Por asignación: Elección y atribución de términos de
indización, que no figuran en el texto, pero lo representan.
Para ello se pueden consultar fuentes externas como
diccionarios de sinónimos, diccionarios especializados, etc.
Pero fundamentalmente y lo más sencillo es ir
construyendo una lista de temas a partir de documentos
indizados previamente y comparar los nuevos textos con
esa lista. A esto se le denomina indización orientada por los
documentos. De forma alternativa o complementaria, otra
lista de control de términos procederá del registro de
peticiones acumuladas y organizadas. A esto se le
denomina indización orientada por peticiones.
Descriptor: Términos normalizados, formalizados y homologados
en un lenguaje documental (tesauro) y empleados para
representar sin ambigüedad los conceptos tratados en los
documentos. Representan un único semantema (unidad de
significado). Normalmente son palabras simples pero pueden ser
también términos compuestos. Los descriptores son los términos
preferentes de un lenguaje controlado. Pretenden resolver
problemas de naturaleza lingüística como sinonimias, polisemias,
formas reflexionadas, etc.
La norma UNE 50-121-91 “Métodos para el análisis de
documentos, determinación de su contenido y selección de los
términos de indización”, recomienda los procedimientos a seguir
en la indización de documentos.
1.2.2.- Resumen o descripción sustancial
Se refiere al análisis de los contenidos de los documentos. Es la
representación abreviada del contenido de un documento sin
interpretación ni crítica. Existen distintos tipos de resúmenes. Los
más conocidos son:
Indicativo o descriptivo: Resumen que indica el tipo de
documento, los principales temas tratados y cómo se
tratan. Se utilizan para resumir estudios generales,
revisiones y monografías completas.
Informativo o analítico: Resumen que facilita la máxima
información posible cuantitativa o cualitativa, o ambas,
contenida en un documento. Se utilizan para describir
trabajos experimentales y originales dedicados a un solo
tema.
Selectivo: Resumen que refleja sólo aquellas partes del
texto que parecen esenciales para una categoría de
usuarios determinada.
Se pueden realizar también resúmenes de tipo mixto con
partes indicativas y partes informativas.
Existen también los llamados resúmenes estructurados:
Fue una propuesta que se ha ido consolidando para los
resúmenes de los artículos que se publican en revistas
clínicas. El objetivo de la propuesta era que los autores de
artículos de interés clínico estructuraran sus resúmenes
para que aspectos tales como el propósito, los métodos y
los resultados aparecieran con un vocabulario parcialmente
controlado y en un formato normalizado.
Resúmenes de conclusiones: Segunda exposición breve de
los principales resultados y conclusiones de un documento.
Completa la orientación del lector que ha estudiado el texto
precedente. Se coloca generalmente al final de los
artículos.
Los objetivos del resumen son:
-Informar al usuario sobre el contenido preciso de los documentos.
Proporciona al usuario los elementos decisorios sobre la
conveniencia de consultar el original íntegro o de desechar su
selección por no ser de interés. Determina la pertinencia del
documento.
-Es utilizable para la recuperación automatizada.
-Para los documentos escritos en lenguas de difícil acceso, resulta
fundamental para conocer la existencia y tema de una
investigación, y decidir la conveniencia o no de su traducción.
-Para las personas con un interés marginal por el tema les es
suficiente con leer el resumen.
-En los documentos no escritos el resumen se presenta como la
única posibilidad de describir su contenido.
La norma UNE 50-103-90 “Preparación de resúmenes” establece
las directrices que han de seguirse para la preparación y
presentación de los resúmenes de los documentos.
La norma pone énfasis especial en los resúmenes preparados por
los autores de los documentos primarios y en su publicación, ya
que estos resúmenes pueden ser útiles a los lectores de estos
documentos y también permiten su reproducción íntegra o con
pequeñas modificaciones, en las publicaciones o servicios
secundarios (p.e.: bases de datos documentales). Las directrices
básicas sirven para la preparación de resúmenes por personas
distintas de los autores. Por ello, la norma, incluye también reglas
específicas para la preparación de resúmenes en publicaciones y
servicios secundarios.
1.2.3.- Clasificación
Clasificar es “ordenar o disponer por clases”. Se entiende por
clasificación documental el proceso de análisis por el cual un
documento es identificado y ordenado por clases, definidas éstas
según el contenido del propio documento.
La clasificación exige un esfuerzo de síntesis, encaminado a
detectar y aislar el tema principal (el más amplio y genérico) en
que se puede encuadrar el documento y no los conceptos clave
del documento.
Su principal objetivo es permitir el agrupamiento de materias
específicas en clases mayores o más genéricas para facilitar la
organización, almacenamiento y recuperación de la información a
partir de un tema amplio.
En las bases de datos multidisciplinares la clasificación es
fundamental para poder, en un momento determinado, hacer
subdivisiones de la base por grandes temas. También es
importante para la búsqueda documental ya que permite delimitar
el punto de vista de un tema, que puede ser distinto al habitual.
Los sistemas de clasificación documental se caracterizan, por sus
estructuras jerárquicas, de los conceptos más amplios a los más
específicos.
Ejemplo: Clasificación del CINDOC
1.3.- Otros datos de interés
Idioma original del documento
Filiación del autor (Institución de trabajo del autor)
Dirección del autor para correspondencia
Dirección url de acceso al documento completo si está disponible
online
Número de referencias que aporta el documento (esto se hace en
los centros de documentación científica)
Tipo documental (reseña, original, revisión, norma, descripción,
patente, crónica, ley, decreto, noticia, artículo, opinión, biografía,
entrevista, reportaje, etc.) Depende del centro de documentación
y del tipo de documentos que se analicen.
Nivel del artículo (Básico, intermedio, avanzado)
2.- Análisis documental de recursos en Internet
La recuperación rápida y pertinente de documentos web mediante un sistema
automático de búsqueda, como pueden ser los buscadores, o mediante los
directorios clasificatorios, se hace cada vez más complicada, debido al gran
número de páginas existentes y de la poca fiabilidad que están mostrando los
métodos basados en indización y recuperación automática.
Los lenguajes de marcas (HTML Hypertext Markup Language, XML eXtesible
Markup Language, que a su vez derivan del metalenguaje de marcas SGML
Standard Generalized Markup Language) sobre los que se asienta el diseño de
páginas web permiten la incorporación de etiquetas en las que el propio autor
del documento puede asignar las materias que considere más apropiadas para
representar el contenido de la página que está creando, incorporar un resumen
o una descripción del documento web y aportar otros datos informativos sobre
la página en cuestión. Se trata de los metadatos.
Se han llevado a cabo, en este sentido (metadatos), diversas iniciativas para
intentar facilitar una fiable recuperación de la información y para normalizar la
información que se puede incluir en una página web para describirla.
Destacaremos después la iniciativa que ha tenido más repercusión: El Dublín
Core Metadata.
¿Qué son los metadatos?
Se podrían definir como el conjunto de etiquetas y datos que se incluyen dentro
del documento web para informar sobre éste. (Definición propia)
El término metadato aplicado a la información distribuída en Internet se define
como “datos acerca de datos”.
El término hace referencia a cualquier dato usado para ayudar a identificar,
describir y localizar los recursos electrónicos en un entorno de red.
Son propiedades identificativas o descriptivas que se pueden asociar a un
recurso de información electrónico. Se expresan mediante pares atributo –
valor.
Son utilizados para suministrar información sobre datos producidos. Intentan
responder a las preguntas quién, que, cuando, dónde, por qué y como, sobre
cada una de las facetas relativas a los datos que se documentan.
Tim Berners-Lee, el creador de la www, da la definición más exacta de
metadatos: “Información legible por ordenador sobre recursos web”.
Los metadatos han evolucionado desde formatos de estructura muy simple a
formatos más complejos. Y se han movido desde estándares emergentes
propietarios a estándares internacionales. Los metadatos siempre han podido
y se pueden compartir con otros.
La información que contienen los metadados es variada: información
descriptiva similar a la que realizamos en Documentación (autor, fecha de
creación, título; fecha de actualización...); información sobre los contenidos
(palabras clave, resumen...); información que ayude a la aplicación cliente a
tomar una decisión sobre el formato o sobre la localización; información o
valoración sobre los contenidos (si incluye materiales no adecuados para
menores)...
¿Quién asigna los metadatos?
La idea que hay detrás de los estándares de metadatos es crear una estructura
simple que permita al propio creador del documento asignar sus metadatos.
Los metadatos acompañan al documento web por eso solo los puede asignar el
creador. Existen programas informáticos que ayudan a crear los metadatos.
Las diferentes comunidades de usuarios y las distintas áreas de aplicación
(bibliotecas digitales; información iconográfica; recursos geográficos o
geoespaciales; recursos electrónicos gubernamentales;...) requieren diferentes
elementos y niveles de complejidad, por tanto serán necesarios modelos de
metadatos complementarios que requieren una arquitectura que acomode la
variedad de los modelos de metadatos.
Los proyectos de diseño de metadatos más importantes, en función de su uso y
de la organización que los ha creado son:
-DC: Dublin Core Metadata
-TEI:Text Encoding Initiative
-URC:Uniform Resource Characteristic/Citations
-MARC DTD: Machine Readable Cataloging Document Type Definition
-GILS: Government Information Locator Service (Usado por los
gobiernos de EEUU y Canadá)
-EAD: Encode Archive Description (Usado en el ámbito de archivos en
EEUU)
-WHO IS++Templates: uno de los primeros formatos de metadatos
creados para describir los recursos en las redes, se utilizó originalmente
para las listas de discusión y más tarde se extendió a otros tipos de
recursos.
Los metadatos se incluyen todos juntos al principio del documento web, a
diferencia de las marcas que los lenguajes de marcados y los lenguajes de
marcas específicos (DTD Document Tipe Definition sobre la base de XML)
reparten por todo el documento web.
2.1.- Dublin Core Metadata
De todos los modelos de metadatos existentes el Dublin Core Metadata es el
de más amplia aceptación, el más extendido en la actualidad. Además es un
modelo de propósito general, es decir, está destinado a la representación y
descripción de documentos electrónicos que, independientemente de su
temática o de su finalidad informativa, proporciona datos de diverso tipo sobre
los recursos.
A diferencia de otros formatos de metadatos más complejos y menos flexibles
(por ejemplo el TEI Text Encoding Initiative), el Dublin Core Metadata pone más
énfasis en facilitar al máximo el acceso al recurso y menos en proporcionar una
descripción exhaustiva.
Está formado por quince elementos o campos. Los quince elementos sobre los
que se asienta la metainformación del Dublin Core suponen un autoanálisis
documental, puesto que el propio autor del documento establece los aspectos
formales e intelectuales que definirán a la página creada.
La sintáxis HTML para los quince elementos del Dublin Core se representa del
modo siguiente y se sitúa entre las marcas <head> </head> del documento.
<META NAME=”DC.Título” CONTENT=”
· Título: Nombre o título asignado al documento o a la fuente.
<META NAME=”[Link]” CONTENT=”
· Autor o creador: Creador intelectual del contenido del documento o de la fuente.
<META NAME=”[Link]” CONTENT=”
· Materia: Palabras claves o frases que resumen el contenido de un documento o de la
fuente, el empleo de vocabularios controlados y esquemas de clasificación formales es
aconsejable.
<META NAME=”[Link]” CONTENT=”
· Resumen: Se trata de un resumen o descripción textual del documento en caso de
documentos como objetos y se hará descripción del contenido para fuentes visuales.
<META NAME=”[Link]” CONTENT=”
· Editor: Editor o entidad responsable de la publicación del documento.
<META NAME=”[Link] contribuciones” CONTENT=”
· Otras contribuciones: Otros colaboradores u otras menciones de responsabilidad, que
hayan contribuído al contenido intelectual del documento pero cuyas aportaciones sean
secundarias respecto al elemento autor o creador
<META NAME=”[Link]” CONTENT=”
· Fecha de publicación: Fecha de creación de la fuente.
<META NAME=”[Link] de recurso” CONTENT=”
· Tipo de recurso: Categoría del recurso, tales como revista, diccionario, poema,
informe técnico, directorio. Se espera que el elemento Tipo de recurso pueda
escogerse de una relación de tipos predefinida.
<META NAME=”[Link]” CONTENT=”
· Formato: Sirve para identificar el programa informático y el equipo material, como
texto/html; ASCII; fichero postscript; imagen JPEG, etc. El elemento Formato se
asignará desde una lista predefinida, como la de Internet Media Types (MIME types).
Actualmente la única opción disponible es texto/html.
<META NAME=”[Link]” CONTENT=”
· Identificador del recurso: Código o número único, individualizado e internacional que
identifica la fuente. Por ejemplo el URL (Uniform Resource Locator)
<META NAME=”[Link]” CONTENT=”
· Fuente actual: Para versiones, adaptaciones, revisiones de documentos originales.
Trabajo, impreso o electrónico, del que proviene el recurso, si esto ocurre.
<META NAME=”[Link]” CONTENT=”
· Lengua: Lengua o lenguas en la que está el contenido intelectual de la obra,
Ejemplos: en, de, es, fi, fr, ja, th, zh.
<META NAME=”DC. Relación CONTENT=”
· Relación : Relaciones con otros recursos.
<META NAME=”[Link]” CONTENT=”
· Cobertura: Cobertura espacio temporal. Se refiere a una región física, uso de
coordenadas (longitud y latitud) o nombres de lugares. La temporal se refiere a la
temporalidad del contenido del recurso, no a la fecha de creación.
<META NAME=”[Link]” CONTENT=”
· Derechos: Copyright u otros.
El formato Dublin Core permite, además, que todos los campos sean repetibles,
opcionales y puedan tener asociados cuantos enlaces se consideren
necesarios.
3.- Conceptos
La norma UNE 50-113 Información y Documentación – Vocabulario – Parte 3ª :
adquisición, identificación y análisis de documentos y datos, en el punto 3.3
incluye conceptos referidos al Análisis Documental. Entre todos destacamos
los más empleados y cuyo conocimiento es importante.
Análisis documental / Analysis / analyse : Operación que consiste en
examinar un documento para encontrar sus elementos esenciales y las
relaciones entre ellos.
Análisis de contenido / content analsys / analyse du contenu : Análisis que
tiene por objeto facilitar los datos que caracterizan el contenido del documento
de una forma clara y concisa.
Indización / indexing / indexation : Operación destinada a representar los
resultados del análisis del contenido de un documento o de una parte del
mismo, mediante elementos de un lenguaje documental o natural,
generalmente para facilitar la recuperación.
Resumen / abstract / résumé : Representación breve del contenido del
documento, sin interpretación ni crítica.
Resumen indicativo / indicative abstract / résumé indicatif : Resumen que
indica el tipo de documento, los principales temas tratados y cómo se tratan.
(También se llama descriptivo)
Resumen informativo / informative abstract / résumé informatif : Resumen que
facilita la máxima información posible cuantitativa o cualitativa, o ambas,
contenida en un documento. (También se llama analítico)
Resumen selectivo / selective abstract / résumé selectif : Resumen que refleja
sólo aquellas partes del texto que parecen esenciales para una categoría de
usuarios determinada.
Resumen de conclusiones / summary / résumé : Segunda exposición
resumida, en un documento, de sus principales resultados y conclusiones, que
tiene por finalidad completar la orientación del lector.
Extracto / extract / extrait : texto constituido por frases seleccionadas de un
documento.
Asignación de términos de indización / allocation of indexing terms /
allocation de termes : Elección y atribución de términos de indización,
aparezcan o no en el texto, para representar documentos o datos, de acuerdo
con ciertas reglas.
Extracción de términos / extraction of terms / extraction des termes : Proceso
por el cual los términos de indización se toman del texto que se indiza.
(También se llama derivación de términos)
Indización precoordinada / pre-coordinated indexing / indexation précoordinée
: Indización de documentos en los que la relación entre los términos y su orden
se establece a priori según un lenguaje documental o un sistema de indización.
Indización poscoordinada / postcoordinated indexing / indexation
postcoordinée : Indización sin relación ni orden preestablecido entre los
términos.
Profundidad de indización / depth of indexing / profondeur d’indexation :
Grado de detalle con el que se representa un tema en un proceso de
indización.
Indización automática / automatic indexing / indexation automatique :
Representación del contenido de un documento por selección automática de
palabras o términos extraídos del texto, o por asignación automática de
términos extraídos de un lenguaje documental.
Preparación automática de resúmenes / automatic abstracting / analyse
automatique : Elaboración de un resumen por medios automáticos.
Agradecimientos a Carlos Benito Amat por las dudas resueltas y las
traducciones proporcionadas.
BIBLIOGRAFÍA general
AENOR. Norma UNE 50-103-90 Documentación. Preparación de resúmenes.
En: Documentación. Recopilación de normas UNE. Madrid : AENOR, 1994.
AENOR. Norma UNE 50-121-91 Documentación. Métodos para el análisis de
documentos, determinación de su contenido y selección de los términos de
indización. En: Documentación. Recopilación de normas UNE. Madrid :
AENOR, 1994.
Amat Noguera, Nuria. Documentación científica y nuevas tecnologías de la
información. Madrid : Pirámide, 1987
Benito Amat, Carlos. Indización. Aspectos generales. Especificidad
y exhaustividad. Esquema (Tema inédito)
Currás, Emilia. Thesauros. Lenguajes terminológicos. Madrid : Paraninfo, 1991
Chaumier, Jacques. Le traitement linguistique de l’information. Paris : Entrepise
Moderne d’ Edition, 1988
Chaumier, Jacques. Técnicas de documentación y archivo. Barcelona : Oikos-
tau, 1993
García Gutiérrez, Antonio Luis. Lingüística documental. Barcelona : Mitre, 1984
Garrido Arilla, María Rosa. Fundamentos del análisis documental. En: Manual
de Ciencias de la Documentación. Madrid : Pirámide, 2002
Haynes, RB ; Mulrow, CD ; Huth, EJ ; Altman, DG ; Gardner, MJ. More
informative abstracts revisited. Annals of Internal Medicine nº 1, 1990, p. 69-76.
Primer artículo que propuso los llamados resúmenes estructurados
Lancaster, F W. El control del vocabulario en la recuperación de información.
Valencia : Universitat de Valencia, 1995
Lancaster, F W. Indexing and abstracting in theory and practice. Londres :
Library Association, 1998
López Espinosa, José Antonio ; Pamias González, Edicta ; Cáceres Manso,
Elsy ; Ramos Sánchez, Elizabeth ; Díaz del Campo, Soledad ; Abascal Rivero,
María Elena. Propuesta de una guía para la elaboración de resúmenes más
informativos. ACIMED Nº3, 1995, p. 5-23. Disponible en:
[Link]
López Yepes, J (coord). Manual de ciencias de la Documentación. Madrid :
Pirámide, 2002
Méndez Rodríguez, Eva. RDF: un modelo de metadatos flexible para las
bibliotecas digitales del próximo milenio. En: 7 Jornades Catalanes de
Documentació 1999. Disponible en:
[Link]
Méndez Rodríguez, Eva. Metadatos y recuperación de información.
Estándares, problemas y aplicabilidad en bibliotecas digitales. Gijón : Trea,
2002
Merlo Vega, José Antonio ; Sorli Rojo, Ángela. El uso de metainformación en
los webs de las bibliotecas españolas. En: 7 Jornadas Españolas de
Documentación. Bilbao : FESABID, 2000
Moreiro, José Antonio. Criterios e indicadores para evaluar la calidad del
análisis documental de contenido. Ciencias de la Información, Brasilia, nº 1,
2002, p.53-60
Ortiz-Repiso Jiménez, Virginia. Nuevas perspectivas para la catalogación:
metadatos versus MARC. Revista Española de Documentación Científica, nº 2,
1999, p. 198-219
Pinto Molina, M. Análisis documental: fundamentos y procedimientos. Madrid :
Eudema, 1991
Pinto Molina, M. El resumen documental: principios y métodos. Madrid :
Fundación Germán Sánchez Ruipérez, 1992
Pinto Molina, M ; Galvez, Carmen. Análisis documental de contenido:
procesamiento de información. Madrid : Síntesis, 1996
Pinto Molina, M. Tratamiento de los contenidos en la sociedad de la
información. En: La sociedad de la información: Política, tecnología e industria
de los contenidos. Madrid : Centro de Estudios Ramón Areces, 1999
Pinto Molina, M. El resumen documental: paradigmas, modelos y métodos.
Madrid : Fundación Germán Sánchez Ruipérez, 2001
Incluye explicación sobre los resúmenes estructurados
Peis, Eduardo. Tablas de contenido de monografías con carácter colectivo y
enriquecimiento de registros bibliográficos. Asociación Andaluza de
Bibliotecarios, nº 59, 2000
Slype, G Van. Los lenguajes de indización. Concepción, construcción y
utilización en los sistemas documentales. Madrid : Fundación Germán Sánchez
Ruipérez, 1991
BIBLIOGRAFÍA específica
Amat, Carlos B. Narración e indización en la representación de los documentos
audiovisuales de actualidad. La documentació als mitjans de comunicació.
L’experiencia multimedia. Valencia : Generalitat Valenciana, 1994 pp. 253-263
Bailac i Puigdellívol, Montserrat ; Català i Freixa, Montserrat. La fototeca. En:
Fuentes i Pujol, M Eulalia (edtr). Manual de Documentación Periodística.
Madrid : Síntesis, 1995
Caldera Serrano, Jorge. Análisis de las recomendaciones de la FIAT / IFTA
sobre los datos mínimos a señalar en las bases de datos de los archivos de
televisión. Cuadernos de Documentación Multimedia, nº 8, 1999. Disponible
en: [Link]
Hernández Pérez, Antonio ; Caridad Sebastián, Mercedes. Documentación
escrita en los centros de documentación de los medios de comunicación. En:
Moreiro, J. A. (coor.) Manual de Documentación Informativa. Madrid : Cátedra,
1999 pp. 37-82
Jiménez Pelayo, Jesus J. La descripción documental del fondo cartográfico
antiguo. Análisis de los aspectos conflictivos. Revista Española de
Documentación Científica, nº 2, 1996, pp. 131-149
López de Quintana, Eugenio. La información multimedia en el entorno de la
imagen. El centro de documentación de Antena 3 Televisión. Cuadernos de
Documentación Multimedia, nº 4,1995, pp. 69-90
López de Quintana, Eugenio. Documentación en televisión. En: En: Moreiro, J.
A. (coor.) Manual de Documentación Informativa. Madrid : Cátedra, 1999 pp.
125-141
López Thomé, Emilio. Documentación sonora. En: Moreiro, J. A. (coor.) Manual
de Documentación Informativa. Madrid : Cátedra, 1999, pp. 291-344
Moreiro González, José Antonio. Análisis de imágenes, un enfoque
complementario. En: Pinto Molina, María (edtr) Catalogación de documentos:
teoría y práctica. Madrid : Síntesis, 1994 pp.305-330
Muñoz Castaño, Jesús E. Bancos de imágenes. Evaluación y análisis de los
mecanismos de recuperación de imágenes. Information World en Español,
nº,3, 2001, pp. 4-18
Pinto Molina, M ; García Marco, F J ; Agustín Lacruz, C. Indización y resumen
de documentos digitales y multimedia : técnicas y procedimientos. Gijón : Trea,
2002
Pérez Puente, Fernando. La documentación audiovisual en RTVE. Archivos de
la Filmoteca, nº23-24, 1996, pp. 123-132
Robledano Arillo, Jesús. Documentación fotográfica en medios de
comunicación social. En: Moreiro, J. A. (coor.) Manual de Documentación
Informativa. Madrid : Cátedra, 1999 pp. 183-289
Valle Gastaminza, Félix del. El análisis documental de la fotografía. Cuadernos
de Documentación Multimedia, nº 2, 1993, pp. 43-56. Disponible en:
[Link] y en:
[Link]
Valle Gastaminza, Félix del. Manual de documentación fotográfica. Madrid:
Síntesis, 1999