0% encontró este documento útil (0 votos)
60 vistas429 páginas

Eficacia de tesauros en recuperación de información

Este documento presenta el trabajo de investigación de Blanca Gil Urdiciain para optar al grado de doctora en Ciencias de la Información bajo la dirección del Profesor José López Yepes. El trabajo analiza la evolución histórica de los tesauros españoles y evalúa su rendimiento en la recuperación de información. El documento está dividido en seis capítulos que cubren los objetivos e hipótesis de investigación, la evolución de los tesauros y su uso en España, el análisis semántico y estructural

Cargado por

AL ALARCON
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
60 vistas429 páginas

Eficacia de tesauros en recuperación de información

Este documento presenta el trabajo de investigación de Blanca Gil Urdiciain para optar al grado de doctora en Ciencias de la Información bajo la dirección del Profesor José López Yepes. El trabajo analiza la evolución histórica de los tesauros españoles y evalúa su rendimiento en la recuperación de información. El documento está dividido en seis capítulos que cubren los objetivos e hipótesis de investigación, la evolución de los tesauros y su uso en España, el análisis semántico y estructural

Cargado por

AL ALARCON
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Universidad Complutense de Madrid

FACULTAD DE CIENCIAS DE LA INFORMACIÓN


DEPARTAMENTO DE BIBLIOTECONOMÍA Y DOCUMENTACIÓN

Evolución histórica de los tesauros españoles


y análisis de su rendimiento en el groceso
de recuperación de informacion

Trabajo de investigación que presenta Blanca


Gil Urdiciain para la obtención del grado
de doctora en Ciencias de la Información
bajo la dfrección del Prof. Dr.
José López Yepes

Se recuerda al lector no hacer más d3


usa de esta abra que el que en ¡a
permiten las disposiciones Vigentes EIbflotec
sobre los Derechos de propiedad
~ntelectuaIdel autor. La Biblioteca
queda exenta de toda responsabilidad.

UNIVERSIDAD COMPLUTENSE
Madrid, 1997 DE MADRID
FACULTAD DE CIENCIAS
DE LA INEORMACION
REGISTROS_DE LIBROS
BIBLIOTECA GENERAL
N~ Registro ~
Sic vos non vobis
Agradecimientos

Deseo expresar mi reconocimiento a todas las personas que de un modo u otro


han contribuido a la realización de esta tesis doctoral. Así, quiero agradecer a Angel
Villagrá su apoyo, consejo y comprensión en los decisivos momentos del comienzo de
este trabajo y en sus fases posteriores; a Amelia de Irazazábal y a José María Sánchez
Nistal su paciencia para reconstruir datos relativos a los orígenes del tesauro. A mis
compañeros Fernando Ramos y Juan Gracia, por sus ánimos en los momentos más bajos.
A Sara Angulo, Paquita Pulido y David Aceituno, que me ayudaron a comprobar la
relevancia de los documentos recuperados y a mi familia, mi mejor y más paciente aliada
a la hora de llevar a cabo la tediosa y mecánica tarea de confrontar los datos resultantes
de cada consulta.

Mi agradecimiento igualmente a las personas que atendieron las complejas


demandas en las bases de datos sometidas a análisis. Asimismo, deseo agradecer a Clara
Giner, Laura Barrios y, de forma especial, a José Rojo, del Centro de Cálculo del CSIC,
su ayuda en la preparación de la muestra aleatoria que resultó imprescindible para
concluir este trabajo.

Quiero, por último, resaltar el apoyo prestado por el profesor López Yepes, mí
director de tesis, sin cuyo estimulo y confianza, este trabajo no se hubiera llevado a cabo.

3
Índices
Indice general

Capítulo 1. Objetivos, método, fuentes y bibliografla 10


1.1. Objetivos y alcance de la investigación II
1.1.1. Estructura y organización de la investigación 13
1.2. Método ¡5
1.3. Fuentesybibliografia 17
1.4. Hipótesis generales 23

Capítulo 2. El tesauro en el marca de los lenguajes documentales 25


2.1. Introducción 26
2.2. Concepto de lenguaje documental 27
2.3. Características del lenguaje documental 29
2.3.1. Funciones del lenguaje documental 30
2.4. Tipología de los lenguajes documentales 32
2.5. Concepto de tesauro documental 35
2.5.1. Funciones del tesauro 37
2.5.2. Composición del tesauro 40
2.5.3. Morfología de los descriptores 49
2.5.4. Relaciones entre los términos del tesauro 52
2.5.4.1. Relaciones jerárquicas o paradigmáticas 53
2.5.4.2. Relaciones asociativas o síntagmaticas 56
2.5.4.3. Relaciones de equivalencia 59
2.5.5. Formas de presentación de los descriptores 59
2,5.5.1. Presentaciónaltbbética 61
2.5.5.2. Presentación sistemática 63
2.5.5.3. Presentación gráfica 65
2.5.5.3.1. Diagramas arborescentes 68
2.5.5.3.2. Diagramas de flechas 68
2.5.5.3.3. Termmogramas 71
2554. Indicesauxiliares 72
2 6 Mantenimiento y actualización de tesauros 75

Capitulo 3. Orígenes y evolución de los tesauros en España 84


3. 1. Antecedentes bistóricos del tesauro 85
3.2. Tesauros documentales 99
3.2.1. Formas alternativas de organización dolos tesauros 104
3.3. Desarrollo de tesauros documentales en España 106
3.3.1. Introduccion 106
3.3.2. Los tesauros en el ámbito formativo 107
3.3.3. Los primeros tesauros españoles 119
3.3.3.1. Otras referencias y proyectos de tesauros 124

5
3.4. Tesauros elaborados en España 147
3.4.1. Tesauros en fbse de elaboración 163
3.4.2. Tesauros internacionales con versión o traducción en español, catalán o
valenciano 166

Capítulo 4. La recuperación de informacion 176


4.1. Introducción 177
4.2. Sistemas de Información 178
4.3. Bases de datos 184
4.3.1. Registros deuna base de datos 186
4.4. Búsqueda documental 199
4.4.1. Análisis de los conceptos de la consulta 199
4.4.2. Elección del tipo de lenguaje a utilizar 200
4.4.3. Definición de la estrategia de búsqueda 201
4.4.4. Establecimiento de enlaces sintácticos entre los témiinos de búsqueda 203
4.4.4.1. Algebra de Boole 203
4.4.4.2. Truncamiento 206
4.4.4.3. Enlaces de proximidad 208
4.4.4.4. Método de ponderación o recuperación por pesos 209
4.4.4.5. Método estadisú 212
4.4.4.6. Recuperación mediante tesauro 213
4.4.5. Visualización y evaluación de los resultados 215
4.4.6. Exportación de los registros 216

Capítulo 5. Análisis semántico y estructural de diferentes tesauros y características de


las bases de datos en las que se utilizan — 218
5.1. Introducción 219
5.2. Criterios de evaluación 220
5.3. Características de los tesauros analizados 224
5.3.1. Tesauro ICYT de Biología animal 224
5.3.2. Tesauro Electrotécnico 227
5.3.3. Tesauro de Medio ambiente 233
5.3.4. Tesauro ‘Mujer’ 237
5.3.5. Tesauro ISOC de Psicología 241
5.3.6. Tesauro de Asuntos sociales 246
5.4. Características de las bases de datos consultadas 249
5.4.1. Base de datos ICYT de Biología animal 249
5.4.2. Base de datos PIE (Programa de Investigación y Desarrollo Electrotécnico) 251
5.4.3. Base de datos Biblioma del Centro de Documentación del Ministerio de Medio 257
Ambiente
5.4.4. Base de datos del Centro de Documentación de la Mujer 259
5.4.5. Base de datos PSEDISOC del CSIC 263
5.4.6. Base de datos de la Biblioteca del Instituto de Migraciones y Servicios sociales
.... 265

6
Capítulo 6. Evaluación del rendimiento de tesauros españoles en sistemas de 270
recuperación de información
6.1. Introducción 271
6.2. Antecedentes 273
6.3. Metodología 280
6.4. Desarrollo de las búsquedas 285
6.4.1. Aspectos y consideracionespara la preparación de las estrategias de búsqueda 287
6.5. Criterios de evaluación 290
6.6. Desarrollo de las estrategias 295
6.6.1. Base de datos ICYT de Biología animal 295
6.6.2. Base de datos PIE (Programa de Investigación y Desarrollo Electrotécnico) 309
6.6.3. Base de datos Biblioma, del Ministerio de Medio Ambiente 323
6.6.4. Base de datos del Centro de Documentación de la Mujer 338
6.6.5. Base de datos PSEDISOC, del CSIC 353
6.6.6. Base de datos de la Biblioteca del Instituto de Migracionesy Servicios sociales
.... 367

Capítulo 7. Conclusiones 387

Bibliografía 394

7
Indice de figuras

Figura 1: Tipología de los lenguajes documentales en función del control ejercido sobre
su vocabulario.

Figura 2: Tipología de los lenguajes documentales según el criterio de coordinacion.

Figura 3: Tipología de los lenguajes documentales en función de su estructura.

Figura 4: El papel del tesauro en un sistema de documentación (Tesauro Spines).

Figura 5: Composición del tesauro

Figura 6: Tipología del descriptor.

Figura ‘7: Extracto del índice alfabético estructurado del Tesauro ISOC de Psicología.

Figura 8: Extracto del índice sistemático del Tesauro ISOC de Psicología.

Figura 9: Díagrama arborescente. Tesauro (JRBAMET.

Figura 10: Diagrama flechado de descriptores. Thesaurus International Road Research


Documentation (IRRO>.

Figura 11: Terminograma de descriptores. Tesauro de Servicios sociales del Inserso.

Figura 12: Extracto del índice permutado del Tesauro ISOC de Psicología.

Figura 13: Modelo para el registro de descriptores

Figuras 14 y 15: Thesaurus Linguae Latinae

Figura 16: English Synonymes Explained in Alphabetical Order with copious ilustrations
and examples.

Figuras 17 y 18: Rogeffs Thesaurus.

8
Figura 19: LEDA Thesaurus.

Figuras 20, 21 y 22: Planes de estudios (publicación BOE> de las Escuelas de


Biblioteconomia y Documentación de las Universidades de Granada, Barcelona y
Salamanca.

Figuras 23 y 24: Programa del Seminario sobre La Documentación al servicio de la


industria química, farmacéutica e investigación científica

Figuras 25 y 26: Programa de Seminario sobre Documentación científica.

Figura 27 y 28: Programa de Cursillo de Documentación química.

Figuras 29, 30 y 31: Thesaurus Textil Internacional.

Figura 32: Tesauro de Materias grasas y derivados.

Figuras 33 y 34: Extracto de una publicación del Instituto Nacional de Seguridad e


Higiene en el Trabajo.

Figuras 35 y 36: Nomenclatura codificada de diagnósticos.

Figuras 37 y 38: Tesauro ISO. IRANOR.

Figuras 39, 40 y 41: Primeras pantallas del menú de las bases de datos del CSIC.

Figuras 42, 43 y 44: Primeras pantallas del menú de la base de datos PIE.

Figuras 45, 46 y 47: Primeras pantallas del menú de la base de datos del Centro de
Documentación de la Mujer.

Figuras 48 y 49: Primeras pantallas del menú de la base de datos de la Biblioteca del
Instituto de Migraciones y Servicios sociales.

9
Capítulo 1

Objetivos, método, fuentes y


bibliografía
1.1. Objetivos y alcance de la investigación

El propósito general de esta tesis doctoral es ofrecer una panorámica del


desarrollo y evolución histórica de los tesauros en España y evaluar su eficacia en el

proceso de recuperación de información.

En relación con el primer objetivo, se perfilan los antecedentes, orígenes e


historia del tesauro. Por lo que se refiere a la evaluación del rendimiento, la tesis
presenta un trabajo experimental realizado en bases de datos reales, cuyos resultados

servirán de fundamento para poner de manifiesto las ventajas e inconvenientes del empleo

de tesauros en centros de documentación yio bibliotecas contemporáneas, así como sus


posibilidades como útil al servicio de la recuperación de información en un futuro
próximo. Así pues, el objeto de análisis, el tesauro, se sitúa en el contexto del proceso

documental en torno a las operaciones de representación y búsqueda documentales.

El tipo de investigación empírica que proponemos ha sido desarrollada en otros


países con diversas aproximaciones al tema. Sin embargo, en España no se han publicado
valoraciones de las prestaciones de los distintos lenguajes en el momento de la búsqueda

informativa, y menos aún, en lo que se refiere al lenguaje documental aquí tratado.

Elegimos como tema de estudio el tesauro y sus características de empleo porque,

desde nuestro punto de vista de profesionales de la Documentación, teníamos una vaga

idea de la situación existente en relación con el tema y nos pareció importante conocer
la situación actual en lo que a utilización y prestaciones de este lenguaje documental se
Capitulo 1

refiere. De los resultados de un trabajo anterior’ deducíamos que, en la categoría de


tesauro, se englobaban realidades que no ofrecían las peculiaridades de este lenguaje de
recuperación de información. Por otra parte, nos animó el hecho de que, aunque existe
abundante literatura acerca de las ventajas y desventajas del uso del lenguaje libre frente
al controlado y viceversa, esta información no se había contrastado en nuestro país. El
interés mostrado por especialistas del CSIC en materia de análisis y lenguajes
documentales fue otro aliciente que nos decidió firmemente a seguir esta línea de
investigación.

A pesar de que, en respuesta al desarrollo exponencial de la producción


bibliográfica de la últimas décadas, han surgido una proliferación de medios informáticos
para canalizaría, el tesauro parece ser la solución propuesta por los documentalistas a los
problemas de recuperación del conocimiento.

Las dificultades de localización de datos se han visto multiplicadas con el


desarrollo de redes como, por ejemplo, Internet, potencialmente fuente inagotable de
datos, por el hecho de que la información que fluye por la red no está sometida a ningún
tipo de control terminológico, viéndose menguadas sus posibilidades de explotación. El
gasto de tiempo, entre otros inconvenientes, es consecuencia de esa falta de control del
vocabulario empleado, tanto para alimentar el sistema como para buscar información de
interés. Si los procesos de recuperación de información son complejos incluso para
especialistas en e! manejo de técnicas de tratamiento documental, la dificultad se acentúa
cuando se trata de personas que desconocen dichas técnicas y que se enfrentan además
a sistemas que no ofrecen ningún género de normalización en la información que gestio-
nan. Los documentalistas diseñan los sistemas dando por supuesto que los usuarios van

‘GIL URDICIAIN, B. Tesauros, en: Manual de lenguajes documentales. Madrid: Noesis, 1996.

12
Capítulo 1

a saber utilizarlos y esto no es siempre así.

Las técnicas documentales se han empleado tradicionalmente como recurso


adecuado para poder seleccionar la información y poner a disposición del usuario los
datos por él solicitados. Todas estas técnicas tienen el común denominador de la
normalización, que hace viable la recuperación a nivel individual y en red. Nosotros
apostamos por su empleo sistemático, especialmente por el uso de un lenguaje controlado
que, combinado con las crecientes posibilidades de las aplicaciones informáticas,
consideramos capaz de manejar la multiplicidad de datos que se van generando, incluso
en el entorno de los más ambiciosos programas de la industria de la información,

En síntesis, el objetivo general de la investigación comporta el estudio de las


siguientes cuestiones:

- Presentar al tesauro como útil al servicio de la recuperación de información.


- Averiguar los orígenes de los tesauros en España.
- Realizar un análisis semántico y estructural de diferentes tesauros.
- Evaluar la eficacia de los tesauros en el proceso de recuperación documental.

1.1.1. Estructura y organización de la investigación

Se trata de una investigación organizada en dos planos, un primer plano de


investigación histórica, y el segundo, de carácter experimental. El trabajo se divide en
siete capítulos, seis de ellos monográficos, destinados a profundizar desde diferentes
enfoques en los aspectos más significativos de los temas de estudio.

13
Capítulo 1

En este primer capítulo Objetivos, método, fuentes y bibliografía, se presentan


los elementos generales componentes de la tesis. Se plantea el terna central del trabajo
con sus objetivos y alcance, el método general y la organización de sus partes
componentes, las hipótesis generales, las fuentes y la bibliografía consultadas.

El capitulo segundo, El tesauro en el marco de los lenguajes documentales está


dedicado íntegramente a presentar al tesauro como lenguaje documental, es decir, como
elemento normalizador en los procesos de indización y recuperación documentales,
operación, esta última, en la que nos basamos para realizar el trabajo experimental que
presentamos en e! penúltimo apartado de esta tesis doctoral.

El tercer capítulo, Orígenes y evolución de los tesauros en España ofrece un


análisis global de la evolución del término thesaurus y de los orígenes de su empleo
como útil al servicio de la recuperación de información. La segunda parte del capítulo
describe el panorama general de la producción de tesauros en España e incluye un
epígrafe con el censo de los elaborados y en circulación en la actualidad en nuestro país.

En el capítulo cuarto, La recuperación de información, se describe esta fase


clave en el tratamiento documental y la que justifica todas las demás. Se presentan en
este apartado los componentes de un sistema de recuperación de información, así como
métodos alternativos de búsqueda, muchos de los cuales fueron puestos en práctica para
el desarrollo del test, objeto de esta investigación.

El quinto capítulo, Análisis semántico y estructural de diferentes tesauros y


características de las bases de datos en las que se utilizan, se destina al análisis de los
componentes de cada una de las bases de datos consultadas para llevar a cabo el trabajo

14
Capimlo 1

experimental, y la evaluación de las unidades léxicas y las características estructurales


de seis tesauros utilizados en dichas bases de datos.

El sexto capítulo, Evaluación del rendimiento de tesauros españoles en sistemas


de recuperación de información, constituye uno de los núcleos de esta tesis doctoral.
Se realiza en esta parte un exhaustivo análisis del rendimiento de los tesauros empleados
por seis bases de datos en el momento de recuperar la información. Para valorar los
resultados se tienen en cuenta la precisión y exhaustividad, parámetros validados por la
comunidad científica.

El trabajo se cierra, como es preceptivo, con un capítulo de Conclusiones, que


constituye una síntesis de los elementos concluyentes derivados de los resultados
obtenidos en la investigación.

1.2. Método

Para realizar esta investig~ción se han empleado dos métodos completamente


distintos, en virtud de los dos aspectos estudiados. La perspectiva histórica, que conforma
el primer frente de investigación, se encuadra, panorámicamente, en el marco
metodológico del análisis histórico. Se procedió fundamentalmente a realizar una
aproximación descriptiva de las fuentes documentales halladas.

Por lo que se refiere al trabajo experimental, se realizó en seis bases de datos


distribuidas, a partes iguales, en las áreas de ciencias sociales y tecnología, siguiendo el
objetivo final de que los resultados de la investigación fueran extrapolables a otras bases
de datos, independientemente de su composición. Se procedió mediante la combinación

15
CapíwIo 1

de los métodos analítico y el de muestreo y validación de datos. En la fase de muestreo


se tendió a maximizar la amplitud y calidad de la información recogida a fin de medir
los valores cuantitativos precisión y exhaustividad, que habían de tenerse en cuenta para
establecer el análisis comparativo.

La fase de recopilación de datos se desarrolló durante un período de diez meses.


Los datos se imprimieron en algunos centros de documentación y bases de datos, en
otros, se recogieron mediante grabación en disquete. En ambos casos, en una fase
posterior, se contrastó la información resultante con las estrategias de búsqueda
propuestas.

En el proceso de validación, adoptamos la metodología propuesta por Cleverdon2


en un estudio pionero de las características del que aquí llevamos a cabo, y que ha venido
siendo utilizado por otros investigadores del área con excelentes resultados. Dicho
proceso fue laborioso y se centró en el comportamiento de los tesauros y el lenguaje libre
en base a cada una de las alternativas de búsqueda que se hicieron con cada consulta.

Hallar los indices de precisión no fue tarea complicada dado que su cálculo
requiere el conocimiento de datos fácilmente contrastables. Valorar la exhaustividad, en
cambio, supuso un gran esfuerzo ya que, hallar este parámetro, supone el conocimiento
previo de todos los documentos relevantes de un fondo documental que respondan a
determinado tema de búsqueda. A excepción de una base de datos, que cuenta con un
volumen restringido de documentos, este fue un valor materialmente imposible de
conocer, por lo que se hizo necesario proceder mediante métodos alternativos, entre

2cLEvERDON, C.W. ASLIB Cranl’ieId researcb project: report on Ibe testing ami analysis of an
investigation into tbe comparative etTiciency of ¡nde~dng systems. Cranfleid: College of Acronauties, 1962.

16
Capítulo 1

otros, técnicas de muestreo que se pusieron en práctica previa generación de números


aleatorios, y manejando el factor varianza.

Queremos advertir que, en todo momento, partimos de] conocimiento de que todo
trabajo de investigación se halla mediatizado por elementos propios del contexto que, al
ser sumamente específicos, inciden de forma concreta en los resultados obtenidos. En
nuestro caso, el contexto desempeñé un papel activo sobre la información recuperada.
Hubiera sido ideal poder aislar todas las posibles variables: características de la
indización, normalización de los medios de alimentación y recuperación de las bases de
datos consultadas, etc., pero el control de dichas variables contextuales hubiera supuesto
un cambio total en los planteamientos de esta tesis, algo que queríamos evitar. No
deseábamos realizar un estudio de laboratorio, por lo que desde un principio nos pareció
oportuno obtener resultados de búsquedas reales, no sometidas a previo control.

La utilización de una misma metodología en todos los casos analizados, requirió


el trabajo previo de resolver problemas derivados de la escasez de centros de documenta-
ción o bibliotecas provistas de tesauro propio, así como de la delimitación de potenciales
temas de consulta que permitieran preparar estrategias de búsqueda con un cierto común
denominador en todas las bases.

1.3. Fuentes y bibliografía

La documentación consultada tuvo dos características bien diferenciadas, de


acuerdo con los dos aspectos fundamentales que componen esta investigación: por una
parte, el estudio de los orígenes de los tesauros en España, por otra parte, la evaluación
de su rendimiento en sistemas de recuperación de información.

‘7
Capítulo 1

En relación con los antecedentes históricos del tesauro en España, podemos


señalar la inexistencia de datos anteriores a 1969, lo cual hizo necesaria la incidencia en
fuentes informales, en el más estricto sentido, siendo las bibliográficas válidas sólo a
partir de la fecha señalada. Quiero señalar aquí la dificultad de acceso a las fuentes
documentales por su escasez, la ambigúedad y la calidad de inéditas de las mismas. La
localización de literatura gris, determinados informes en concreto, fue definitiva para
poder materializar información significativa en relación con la producción de lenguajes
documentales en nuestro país, habiendo tenido que reconstruir datos acudiendo al
testimonio directo de los creadores de algunos tesauros.

Para la recopilación de antecedentes históricos se procedió al vaciado de


bibliografías internacionales, publicadas entre los años 1975 y 1988, en las cuales no
apareció referencia alguna a tesauros preparados en España.

La consulta de los planes de estudios de las primeras diplomaturas en


Biblioteconomía y Documentación fue de utilidad, al igual que el análisis de los
programas de los primeros cursos impartidos sobre Documentación en diferentes
instituciones, tales como La Asociación Nacional de Químicos. También fue de interés
la consulta del Proyecto de Plan de estudios sobre Documentación científica para
postgraduados universitarios, preparado por la doctora Emilia Currás en 1977.

Por lo que se refiere a los restantes temas de estudio en este trabajo, se procedió
al análisis y revisión bibliográficas de monografías nacionales e internacionales, cuyo
contenido trataba parcialmente dichos temas. Este tipo de obras fue útil, particularmente,
para los capítulos referidos a los fundamentos teóricos del tesauro, la recuperación de
información, la evaluación semántica de los tesauros y la evaluación de la eficacia de los
lenguajes documentales en la recuperación de información. En función de los datos que

18
Capítulo 1

nos aportaron sobre las mencionadas materias, los títulos más representativos fueron
respectivamente: Van Slype: Los lenguajes de indización: Concepción, construcción y
utilización en los sistemas documentales (1991); la monografía de Miguel Castaño y
Piattini Velthuis: Concepción y diseño de bases de datos: Del modelo E/R al modelo
relacional (1993), que nos sirvió de fundamento para el capítulo referido a la recupera-
ción documental al ofrecer amplia información acerca de los servicios de información.
Lancaster, en su obra: El control del vocabulario en la recuperación de información
(1995> propone, en el capítulo 16, una metodología para la evaluación semántica y
estructural de los tesauros, en la que nos basamos para realizar el análisis de dichos
lenguajes documentales en esta investigación. Es importante citar la obra más completa,
a nuestro juicio, sobre búsqueda de información en bases de datos: La búsqueda
documental en el contexto telemático: Modalidades de automatización y utilización de
bases de datos, preparada por Bares y traducida al español en 1988. El libro escrito en
colaboración por Salton y McGill: introduction to modern information retrieval (1983)
contribuye en gran medida a comprender la importancia del tesauro en los procesos de
recuperación de información. La consulta de esta fuente también fue de utilidad en el
momento de plantear el procedimiento más adecuado de evaluación del rendimiento de
los tesauros.

Debemos hacer mención especial a la obra de Cleverdon: ASLIR Cranfleid re-


seat-ch project: repon on tite testing and analysis of an investigation into tite comparative
efflciency of indexing systems, publicada en 1962. El autor propone una metodología de
evaluación de lenguajes documentales, que sirvió de modelo a la que proponemos en el
sexto capítulo de esta tesis doctoral. Dicha metodología nos fue de utilidad para hallar
los índices de precisión y exhaustividad de los documentos recuperados y comparar, de
este modo, la eficacia de los tesauros. Tenemos que decir, sin embargo, que la citada
obra describe un test realizado en condiciones de laboratorio, con control previo de todas

19
Capítulo 1

las variables que intervienen en los procesos de tratamiento y recuperación documentales.


En nuestro caso, la experimentación se llevó a cabo en bases de datos reales, sin previo
control de dichas variables, de modo que las orientaciones metodológicas del ASLIB
Cranfleid research project sólo nos sirvieron parcialmente.

En cuanto a las fuentes bemerográficas, se procedió al análisis y vaciado de


revistas españolas y extranjeras sobre Biblioteconomia y Documentación, que no siempre
fueron de utilidad. Si nos remitimos al primer aspecto tratado en esta investigación, es
decir, el aspecto histórico, podemos confirmar la inexistencia de datos al respecto en
publicaciones periódicas, independientemente de su procedencia. Citaremos a continua-
ción algunos artículos que tratan de los orígenes de los lenguajes documentales y de los
tesauros, pero que, en ningún caso, hacen mención a su desarrollo en España: el trabajo
de Sparck Jones: Some thesauric history, Aslib Proceedings, 7 (1972); la recopilación
preparada por Roberts: Tite pre-histoy oftite information retrieval titesaurus, Journal of
Documentation, 4 (1984); Los tesauros de términos cient(ficos y técnicos en general, y
especialmente los relativos a la química (revisión bibliográfica), trabajo publicado por
Sancho Lozano en la Revista Española de Documentación Científica (1985); por último,
el artículo preparado por López Huertas Pérez: Lenguajes documentales: aproximación
a la evolución histórica de un concepto, publicado en el Boletín de ANABAD, 1(1991).

En lo que al segundo frente de investigación se refiere, se tuvieron en cuenta


todos aquellos artículos que se centraban en el análisis y evaluación de lenguajes
documentales. Fueron numerosas las publicaciones que hacían referencia a tests compara-
tivos de la eficacia del lenguaje libre y el controlado, pero no describían experimentacio-
nes desarrolladas en bases de datos reales, o bien se planteaban a niveles de complejidad
que no nos era posible abarcar en un trabajo de carácter individual como el que aquí
proponemos. De las fuentes consultadas podríamos destacar las siguientes: Information

20
Capítulo 1

retrieval experimentation, artículo de gran interés preparado por Tague-Sutcliffe e


incluido en la Encyclopedia ofLibrary atad Information Science. En él se señalan los tests
más importantes realizados para evaluar lenguajes y sistemas de recuperación de
información, así como las medidas empleadas para efectuar dicha valoración. El Journal
of Documentation publicó, en marzo de 1969, el trabajo firmado por Robertson: Pie
parametric description of retrieval tests, cuya importancia reside en la minuciosa
explicación que ofrece de los parámetros y técnicas empleadas para describir los
resultados de evaluaciones de lenguajes documentales y servicios de recuperación de
información. En marzo de 1973, el Journal de Documentation publicó el artículo que bajo
el título: The Aberystwyth index languages test, describía el test realizado por M. Keen,
en el Coilege of Librarianship Wales. En el citado test se compara la efectividad de cinco
lenguajes de indización. La metodología propuesta nos fue de utilidad, con limitaciones,
dado que, al igual que en la experimentación realizada por Cleverdon, se planteaba un
estudio de laboratorio.

También se realizaron consultas en Bases de datos nacionales e internacionales.


131 tipo de consulta realizada en las mismas fue de características bien distintas, las cuales
detallamos a continuación:

Base de datos Thesauri, del distribuidor ECHO, perteneciente a las Comunidades


Europeas. En esta base se solicitaron datos sobre los tesauros espanoles existentes.
Lamentablemente, la respuesta fue nula, puesto que no tenían registrado ni un sólo
tesauro elaborado en nuestro país.

Base de datos LISA (1991-1997). Su consulta proporcionó datos bibliográficos de


interés, básicamente, para investigar en los orígenes de los tesauros, en general, pero no
aportó información de utilidad en relación con los construidos en España.

21
Capítulo 1

Base de datos ICYT de Biología animal


Base de datos PIE
Base de datos Biblioma
Base de datos del Centro de Documentación de la Mujer
Base de datos PSEDISOC del CSIC
Base de datos de la Biblioteca del Instituto de Migraciones y Servicios sociales

La consulta de estas seis bases no tuvo su origen en la búsqueda de información


relevante sobre los distintos temas tratados en esta tesis doctoral, sino en la realización
del test de carácter experimental que proponemos en el sexto capítulo. Las búsquedas se
hicieron, pues, de forma exhaustiva y las materias de consulta nos sirvieron, en tanto que
instrumento para la comparación de los lenguajes libre y controlado que realizamos en
virtud de los resultados obtenidos.

En cuanto a las principales bibliotecas consultadas fueron: la Biblioteca Nacional,


la Biblioteca del Bibliotecario, las Bibliotecas del ISOC y del ICYF, el Centro de
documentación de Fundesco, la Biblioteca de la Escuela Universitaria de Biblioteconomía
y Documentación, de la Universidad Complutense y, por supuesto, los centros de
documentación y bibliotecas en las que se encontraban las bases de datos que acabamos
de mencionar, en las que se desarrolló la experimentación.

Por lo que se refiere a la información bibliográfica que aportamos al final de este


trabajo, hemos tratado de ser exhaustivos, limitándonos, no obstante, a aquellas obras
que, de forma más o menos directa, han servido para la realización de esta tesis docto?al.

Para facilitar su consulta, dicho repertorio bibliográfico se ha estructurado


sistemáticamente de acuerdo con los aspectos que conforman la investigación y, con ese

22
Capítulo 1

mismo objetivo, se ha organizado siguiendo las normas internacionales de descripción


bibliográfica ISBD para el tipo de material referenciado: monografías y publicaciones
seriadas.

1.4. Hipótesis generales

Como fase previa a la realización del trabajo hemos fijado -tratando de


documentarías a posteriori- las siguientes hipótesis:

- El índice de utilización de tesauros en bases de datos españolas es bajo debido,


bien a la falta de adecuación de dichos lenguajes documentales a necesidades específicas,
o simplemente a su inexistencia en áreas temáticas especializadas.

- El experimento tiene considerables limitaciones, especialmente debidas a la


imposibilidad de controlar todas las variables del proceso documental, pero presuponemos
que el control del vocabulario es factor determinante en la última fase de dicho proceso,
para conseguir altos niveles de precisión informativa, independientemente del método de
búsqueda que se practique.

- El uso de un lenguaje controlado facilita la búsqueda documental, tanto en bases


de datos técnicas como en aquellas que desarrollan su actividad en el campo de las
ciencias sociales y humanidades.

- La recuperación mediante lenguaje libre genera un elevado número de


documentos irrelevantes.

23
Capítulo 1

- La consulta de un tesauro, en el momento de preparar las estrategias de


búsqueda, supone menor esfuerzo para el usuario porque le evita el esfuerzo de pensar
en todas las posibles acepciones y relaciones semánticas que pueda tener un término
tomado del lenguaje natural. En este segundo caso, es el propio consultante quien ha de
realizar un control previo del vocabulario para proceder a la recuperación.

24
Capítulo 2

El tesauro en el mareo de los


lenguajes documentales
2.1. Introducción

En este capítulo presentamos las características, funciones y tipología del lenguaje


documental, en general, y del tesauro en particular, como elemento normalizador en los
procesos de tratamiento y recuperación documentales.

Los documentos que componen una unidad de información o biblioteca son


analizados por los profesionales del documento para hacer posible su consulta por el
usuario. Este proceso, denominado Análisis documental, tiene por objeto dotar a cada
libro de una serie de puntos de acceso, para permitir su posterior recuperación por
cualquiera de ellos. Estos puntos de acceso pueden consistir en el nombre del autor de
la obra, de su título o del tema que trate. Del análisis de los aspectos externos de un
documento se pueden tomar los datos relativos a su título y autor, lo que constituye la
descripción bibliográfica. El tema, los conceptos que implícita o explícitamente están
recogidos en una obra se extraen mediante el Análisis de Contenido, cuyas operaciones:
indización y resumen, dan al lector un conocimiento más o menos profundo de la
información que contiene. La operación de indizar consiste, en efecto en el análisis e
identificación de los conceptos del documento y la selección de aquellas nociones que
representen con mayor fidelidad la información que contiene. Para normalizar la
denominación de dichos conceptos se procede a su traducción a un lenguaje documental,
lo cual facilita la recuperación, independientemente del analista que trate el documento.
Capítulo 2

2.2. Concepto de lenguaje documental

La principal característica de los lenguajes documentales es su capacidad de


control terminológico, que permite la expresión de los conceptos derivados de la
indización sin ambigúedades, garantizando el empleo de los mismos términos para
representar los mismos conceptos. La definición de Van Slype refleja el componente
pragmático del lenguaje documental: todo sistema de signos que permita representar el
contenido de los documentos con el fin de recuperar los documentos pertinentes en
respuesta a consultas que tratan sobre ese contenido’.

García Gutiérrez concibe el lenguaje documental desde la perspectiva de la teoría


de la comunicación, destacando su aspecto normativo: conjunto normalizadoy normativo
de términos relacionados por principios comunes, declarados portavoces preferenciales
de los mensajes encerrados en un colectivo documental con el fin de provocar una
recuperación pertinente de información por aproximación temática2.

Nosotros entendemos por lenguaje documental todo sistema artificial de signos


normalizados, que facilitan la representación formalizada del contenido de los
documentos para permitir la recuperación, manual o automática, de información
solicitada por los usuarios.

Las primeras manifestaciones del lenguaje documental datan de finales del siglo
XIX, cuando aparecen las clasificaciones bibliográficas. Estas clasificaciones, inspiradas

1SLYPE, G.v. Los lenguajes de indización~ Concepción, construcción y utilización en los sistemas
documentales. Madrid: Fundación Germán Sánchez Ruipérez, 1991, p. 21.

2GARCIA GUTIERREZ, A. Lingilística documental: aplicación a la documentación de la


comunicación social. Barcelona: Mitre, 1984, p. 157.

27
Capítulo 2

en la lógica y en los sistemas filosóficos del conocimiento, se fundan en el principio de


precoordinación y son de carácter enciclopédico.

El concepto moderno se consolidó en el siglo XX cuando Cutter introdujo el


lenguaje de encabezamientos de materia, basado en los principios de especificidad y de
entrada directa, que señala el comienzo del desarrollo de lenguajes documentales
especializados, entre los que se encuentra el tesauro, objeto de estudio en esta tesis
doctoral.

Los lenguajes especializados, pues, nacieron como respuesta a una creciente


especialización de los conocimientos (derecho, economía, sociología, etc...> que no
podían ser representados mediante las materias contenidas en los lenguajes multidiscipli-
nares existentes hasta entonces. Como consecuencia, se crearon numerosas clasificaciones
especializadas, por ejemploExcerptaMedica, así como múltiples tesauros sectoriales, con
los que se podían organizar las colecciones a escala institucional, pero, al propio tiempo,
provocaron una confusión babélica a escala mundial.3 Parece, sin embargo, que existe
actualmente una nueva tendencia hacia el enciclopedismo temático.

Pasamos a analizar en los siguientes epígrafes las partes componentes del lenguaje
documental, así como sus principios y funciones en el proceso de tratamiento de la
documentación.

3RODRIGUEZ DELGADO, R. La integración de los lenguajes documentarios, fin de Babel. Revista


Española de Documentación Científica, y. 4, n. 3 (1980).

28
Capítulo 2

2.3. Características del lenguaje documental

El lenguaje documental es un lenguaje no natural, aunque utiliza los signos de


éste. Esos signos adquieren valor semántico por medio de su normalización y de las
reglas morfosintácticas que lo articulan. Son precisamente esas reglas las que le dan
categoría de lenguaje.

Los signos del lenguaje natura] son las palabras, que representan nuestro
conocimiento de la realidad; el lenguaje documental se sirve de ellas y, en ocasiones, las
reemplaza por sfmbolos cargados de significado preciso de forma que lleva a cabo la
representación del documento en virtud de una correspondencia analógica. Esta
representación convencional tiene lugar cuando simboliza los elementos constitutivos del
lenguaje de descripción (metalenguaje) por medio de instrumentos visuales de representa-
ción -la notación simbólica-; este es el caso de los sistemas de clasificación, que por el
procedimiento de notación representan ideas de manera unívoca a través de números
ordinales.

En comparación con el crecimiento de las ideas, el desarrollo del lenguaje natural


es lento y, como consecuencia, es necesario utilizar la misma palabra para expresar dos
o mas ideas. Ello da lugar a la homonimia: el mismo término se utiliza en diferentes
sentidos en diferentes disciplinas, lo que produce distorsiones en la comunicación. La
sinonimia es otro accidente lingtiístico habitual en el lenguaje documental, que debe ser
reconocido y, o bien eliminado o, preferentemente, controlado.

Derivados de esos accidentes surge la ambiguedad, que crea dificultades


estrechamente relacionadas con la aplicación de un lenguaje artificial a la recuperación
de documentos. Se trata del ruido y silencio documentales, que se oponen a la relevancia

29
Capítulo 2

de la indización. Cuando se prepara una frase documental con objeto de recuperar un


conjunto de documentos que contienen la información expresada en la frase, aquellos que
no se recuperan, aunque existan en el archivo, son los productores del silencio documen-
tal, mientras que los que se recuperan sin haber sido solicitados -porque responden sólo
parcialmente al perfil de búsqueda- constituyen el ruido documental. Sólo el logro de la
deseable entropía puede evitar estos inconvenientes y facilitar una recuperación eficaz de
la información.

2.3.1. Funciones del lenguaje documental

El lenguaje documental interviene en dos fases del proceso documental: en el


momento de la descripción y en el de la recuperación de la información. El objetivo de
dichas operaciones es el de facilitar la recuperación de la documentación reduciendo el
esfuerzo y gasto de tiempo del usuario. El lenguaje documental tiene capacidad para
representar los mensajes contenidos en los documentos, lo que Le permite cumplir dos
objetivos fundamentales en el proceso, el de normalización y el de inducción, estando
encaminadas a este último todas las demás funciones que desempeña a lo largo del
proceso documental.

El lenguaje documental reduce considerablemente el volumen de términos del


lenguaje natural no tomando en consideración más que los sustantivos o los sintagmas
nominales, seleccionando además, de entre ellos, un sólo término entre dos o más
nociones consideradas sinónimas. En virtud de estas características, se le reconoce un
carácter mediador en los procesos de resumen e indización al controlar la posible
ambiguedad entre términos.

30
Capitulo 2

En la fase de descripción, tras la lectura e identificación de los conceptos


contenidos en los documentos, estos se representan mediante un lenguaje documental, que
proporciona un vocabulario unívoco que favorece la coherencia del análisis y permite
traducir los conceptos en términos normalizados.

Su objetivo primordial se cumple, sin embargo, en la segunda fase del proceso,


suministrando el vocabulario de los conceptos de la demanda. El lenguaje documental
proporciona una base para efectuar búsquedas al nivel de generalidad o especificidad
deseados. En este sentido, se le puede considerar un lenguaje intermediario o metalen-
guaje en la medida en que sirve de puente entre las informaciones contenidas en los
documentos y las informaciones solicitadas por los usuarios. Van Slype4 considera que
los lenguajes de indización pueden intervenir en seis momentos diferentes del proceso de
búsqueda:

- Selección de los sistemas documentales que se van a interrogar


- Enunciado de los conceptos de la pregunta, en lenguaje natural
- Traducción a un lenguaje de indización
- Formulación de la ecuación
- Extensión asistida por el ordenador
- Apreciación final de la pertinencia

Además de las mencionadas funciones, el lenguaje documental es de gran utilidad


para la ordenación o archivo de documentos. Resuelve igualmente problemas planteados
por el multilingaismo, como en el caso de los tesauros multilingUes, que sirven de puente
a diferentes lenguas, o en el caso de los lenguajes de clasificación, fundados en la

4SLYPE, O. van. Op. ch., p. 161.

31
Capítulo 2

simbolización numérica, que los hace independientes de toda lengua y constituyen una
escritura comprensible en todos los idiomas, de ahí su fácil empleo internacional.

2.4. Tipología de los lenguajes documentales

La variada tipología del lenguaje documental le convierte en elemento de apoyo


a disciplinas como la Biblioteconomía, Documentación, Bibliografía y Archivística, para
cuyas necesidades de descripción ofrece posibilidades concretas. En relación con el
Análisis formal, el lenguaje documental completa el proceso técnico de catalogación
dotando al soporte de la descripción de puntos de acceso temáticos.

Existen diversos criterios de tipificación de los lenguajes documentales. Los más


generalizados son los de control, el grado de coordinación de los términos y el
estructural.

Dependiendo del control ejercido sobre el vocabulario, los lenguajes pueden


organizarse en dos categorías: libres y controlados <Figura 1).

Libres Listas de descriptores libres

Control Controlados Clasificaciones, tesauros 1

Figura 2

32
Capítulo 2

Existe abundante literaturaacerca de las ventajas y desventajas que conlíeva el uso


del lenguaje libre en las fases de tratamiento de la documentación. En esta tesis doctoral
vamos a tratar de analizar comparativamente sus prestaciones frente a las que ofrece el
tesauro. Nosotros, como ya explicabamos en la introducción del trabajo, apostamos por
la normalización del vocabulario y esperamos poder aportar datos que permitan
fundamentar esta opinión.

Los lenguajes libres, fundados en el principio de postcoordinación, se componen


de un vocabulario no predefinido que se va generando a partir de la realización de
procesos de indización. A excepción de las listas de descriptores libres y las de palabras
clave, los demás lenguajes entran dentro de la categoría de controlados, que presentan
un vocabulario previamente elaborado y que admite un limitado número de modifica-
ciones en el momento de su utilización.

La sistematización de los lenguajes documentales según el criterio de coordina-


ción (figura 2) se realiza en función del momento en que se combinan los elementos que
los componen. Si los términos se combinan en el momento de la descripción, el lenguaje
será precoordinado, y si lo hace en el momento de la recuperación, se tratará de un
lenguaje postcoordinado. Van Slype, con un planteamiento pragmático. denomina
lenguajes de clasificación a los precoardinados y lenguajes de indización a los postcoordi-
nados; ambos tipos representan el contenido del documento de forma sintética y analítica,
respectivamente.

33
Capítulo 2

Clasificaciones
Precoordinados
Listas de encabezamientos de materia

Coordinación Listas de descriptores libres

Postcoordinados Listas de palabras clave

Tesauros

Figura 2

En los sistemas precoordinados los términos están unidos de acuerdo con unas
reglas sintácticas establecidas por el propio lenguaje. El prototipo de lenguaje
preccordinado son las clasificaciones, nacidas de la necesidad de organizar los
conocimientos según un orden establecido.

Los postcoordinados carecen de sintaxis; salvo excepciones, su vocabulario


consiste en términos simples o unitérminos que se pueden conectar en el momento de la
recuperación por medio de una sintaxis booleana. Atendiendo a los procedimientos
seguidos para relacionar los conceptos al recuperar la información, podemos concluir que
en los lenguajes precoordinados la relación entre los términos es gramatical, mientras que
en un lenguaje postcoordinado la relación es lógica.

Los lenguajes precoordinados contribuyen mejor que los postcoordinados a


conseguir precisión en la búsqueda, es decir, tienen mayor capacidad para rechazar los
documentos irrelevantes en el momento de la recuperación porque las relaciones que se
crean mediante el álgebra de Boole son genéricas y no impiden las falsas combinaciones.
Como contrapartida, los postcoordinados tienen la ventaja de dar respuesta a necesidades
de indización reales.

34
Capítulo 2

En cuanto a la estructura, se reconoce la existencia de dos tipos: jerárquica y


combinatoria. A la estructura jerárquica responden determinadas clasificaciones, a la
combinatoria, los léxicos documentales y los tesauros, si bien es cierto que en la
organización multidimensional de estos últimos participa también la estructura jerárquica
-representada por los índices sistematicos-. Presentados de forma esquemática, los
lenguajes documentales, en función de su estructura, pueden ser:

Jerárquica Clasificaciones jerárquicas

Estructura Léxicos documentales


Combinatoria
Tesauros.

Figura 3

2.5. Concepto de tesauro documental

Atendiendo a la tipificación realizada en el anterior epígrafe, y más concretamente


al criterio estructural, se puede considerar al tesauro como un lenguaje combinatorio,
dado que consta cJe listas de términos que representan el ámbito científico o técnico a que
se indica y posee además una serie de relaciones semánticas entre los términos que dan
al lenguaje gran capacidad para la recuperación documental. Pero el tesauro participa
también de la estructura jerárquica, en tanto en cuanto incluye en su composición un
índice sistemático, que agrupa por áreas temáticas la información que contiene.

En virtud de la primera de las características estructurales que hemos citado, el


tesauro tiene una serie de ventajas, entre las que podríamos destacar, la flexibilidad, la

35
Capítulo 2

capacidad de especialización, la multiplicidad de combinaciones que permite establecer


entre los términos de su vocabulario, el alto nivel de control terminológico y la facilidad
de revisión y puesta al día.

A nuestro juicio, podemos definir al tesauro como aquel lenguaje documental de


estructurajerárquico-combinatoria, de carácter especializado, que se basa en expresiones
conceptuales llamadas descriptores, provistas de sus relaciones semánticas. Se trata,
pues, de un vocabulario controlado y estructurado al que se llega mediante la selección
de términos del lenguaje natural. Está formado por listas de palabras -descriptores-
estructuradas de forma que unas se relacionan con otras que también están en el tesauro.
De forma precisa, Emilia Currás lo define en los siguientes términos: lenguaje
especializado, normalizado, post-coordinado, usado con fines documentarios, donde los
elementos fingiffsticos que lo componen se hallan relacionados entre s( sintácticamente
y semánticamente?

La norma internacional 150 2788-1986 Directrices para el establecimiento y


desarrollo de tesauros monolingaes. lo conceptualiza desde los puntos de vista de su
función y de su estructura. Según su función, la norma entiende por tesauro un
instrumento de control terminológico que traduce a un lenguaje sistémico o documental
el lenguaje natural empleado en los documentos y por los usuarios. En razón de su
estructura, el tesauro consiste en un vocabulario controlado y dinámico de términos
relacionados semántica y jerárquicamente, que se aplica a un campo especifico del
conocimiento.

5CURRÁ5, E. Thesauros: lenguajes terminológicos. Madrid: Paraninfo, 1991, p. 93.

36
Capítulo 2

A diferencia de un diccionario, un tesauro no define los términos que lo


componen salvo en casos excepcionales para aclarar ambigOedades. El diccionario tiene
por objeto definir los términos de la lengua, el tesauro, servir de puente entre el
vocabulario utilizado por el indizador de los documentos y el usuario de los mismos.

Los tesauros documentales no son diccionarios exhaustivos. No aportan todos los


términos relativos a un dominio, sino aquellos que podrían figurar en las consultas de los
usuarios. El tesauro documental es por tanto un lenguaje documental, de indización y de
búsqueda, concebido en función de las necesidades de información de los usuarios.

2.5.1. Funciones del tesauro

El tesauro realiza tres funciones básicas a lo largo de las operaciones de


tratamiento de la documentación: la función de normalización del vocabulario, la de
inducción y la de representación.

La primera función tiene como fin unificar todo el vocabulario del tesauro para
controlar todas las posibles entradas. Se puede conseguir mediante el control de formas,
es decir, controlando los accidentes que puede generar el vocabulario y que son sinonimia
y polisemia. Hay que controlar igualmente género y número de las expresiones. La
inducción sirve para que el tesauro indique constantemente todas las alternativas posibles
para entrar a recuperar: genéricas, específicas y asociadas. El tesauro induce, en efecto,
al usuario hacia la consulta de temas en los que previamente no había pensado, gracias
al establecimiento de una serie de referencias cruzadas que indican las relaciones
asociativas, jerárquicas y preferenciales que se puedan dar entre la terminología que lo
compone.

37
Capítulo 2

A propósito de esta función escriben Salton y MeGilí que un tizesaurus puede


ampliar el vocabulario aumentando el nivel de exhaustividad en la recuperación. Con las
relaciones jerárquicas proporcionadas por un tesauro en forma de términos másgenéricos
o más espec(ficos, el vocabulario de indización y, por tanto, el de recuperación, pueden
expandirse en varias direcciones añadiendo esos términos más amplios o más especificos
6

o términos relacionados, en ocasiones

Para que sugiera conceptos dentro del sistema, el vocabulario se estructura


semánticamente, lo que se consigue mediante el establecimiento de relaciones paradigmá-
ticas (verticales) y sintagmáticas (horizontales). Las paradigmáticas son relaciones
invisibles que establece quien construye el tesauro, entre los distintos conceptos; son hilo
conductor de la relación entre un término y otro. Las relaciones paradigmáticas deben
existir entre todos los términos.

La función de representación, por último, la realiza al igual que los demás


lenguajes documentales en virtud de la correspondencia que establece entre los términos
que componen sus índices y los conceptos presentes en los documentos.

La figura 4 ilustra la labor que desempeña este lenguaje documental en las fases
de indización y recuperación de la información en un sistema documental.

6SALTON, 0. 6 McGILL, M.J. Introduction to modern information retrieval. New York, etc.:
McGraw Hill, 1983, p. 81.

38
EL PAPEL DEL TESAURO EN UN SISTEMA DE DOCUMENTACION

F DOCUMENTO A REGiSTRAR
DEMANDA DEL USUARIO

4’
INDIZACION DEL DOCUMENTO CODiFICACION DE LA PREGUNTA

FORMULACION DE LA
PREGUNTA

definición de las informaciones


concretas buscadas

TRADUCCION EN TRAnUCCION EN
EL LENGUÁJE DEL SISTEMA EL LENGUAJE DEL SISTEMA

representación de las informaciones mediante


reprcscnración de las informaciones por descriptores del tesauro ligados por operadores
una lista de descriptores del tesauro lógicos

ALMACENAMIENTO DE LOS BUSQUEDA DE LOS


DOCUMENTOS EN EL SISTEMA DOCUMENTOS EN El. SISTEMA
DOCUMENTARlO DOCUMENTARlO

BASE DE
DATOS ¡
~2
BIBLia- y los descriptores
GRAPJCA ¡

RESPUESTA
lista de referencias
Bitliográficas
pertinentes

Figura 4. E). papel del tesauro en un 39


sistema de documentación
(Tesauro Spines)
Capítulo 2

2.5.2. Composición del tesauro

Un tesauro se compone de una base léxica estructurada en relaciones jerárquicas,


asociativas y de equivalencia, que observamos en el siguiente cuadro (figura 6) y que
examinaremos detenidamente.

descriptores

Unidades léxicas términos equivalentes

Composición palabras herramienta

del
relaciones de equivalencia
tesauro
Relaciones
rejaciones jerárquicas
semánticas
relaciones asociativas

Figura 5

Analizamos a continuación las unidades léxicas del tesauro, las relaciones


semánticas se estudiarán en el epígrafe destinado a la metodológía de elaboración de este
lenguaje.

Un tesauro contiene, por lo general, algunos miles de descriptores y de varios


cientos a varios miles de no descriptores. En total puede tener hasta 20.000 expresiones.
El término medio es de unas 3.000.

La Asociación Francesa para la Normalización (4FNOR) <Nonna NZ 47-100


diciembre 1981) define al descriptor como Palabra o grupo de palabras incluidas en un

40
Capítulo 2

tesauro y escogidas de entre un conjunto de términos equivalentes para representar sin


ambigaedad una noción contenida en un documento o en una petición de búsqueda
documental. Ej.: AGU AS SUBTERRÁNEAS

El no descriptor es llamado también término equivalente y término no preferente.


Es sinónimo o cuasisinónimo del descriptor. No puede ser utilizado para indizar
documentos ni para formular consultas, pero cada no descriptor reenvía a uno o a dos
descriptores, por lo que aumentan la tasa de precisión, es decir, la pertinencia de los
documentos que responden a una consulta.

Los no descriptores no constituyen en el tesauro sino puntos de acceso que


facilitan el paso del lenguaje natural al lenguaje del sistema, permitiendo la elección de
los descriptores pertinentes. Ej.:

Aguas freáticas
USE AGUAS SUBTERRANEAS

Palabras herramienta: Son términos que no tienen significado preciso si los


empleamos solos, por lo que han de ser empleados con un descriptor, al menos. Ej.:
PR! VATIZACIÓN

41
Capítulo 2

Tipología del descriptor

primarios
Por su
secundarios
carga informativa
infraconceptos

Tipología onomásticos
Por su
del geográficos
cobertura
descriptor materias
o contenido
cronológicos

Por su simples

composición compuestos

Figura 6

1. Por la carga informativa:

• Primarios: Términos o conjunto de términos que representan un concepto de manera


unívoca (no hay duda de lo que queremos decir al emplearlo). Son significativos,
relevantes, no hay posibilidad de ambigúedad, pudiendo aparecer aislados sin necesidad
de aclaración. Ej.: ÁRBOL, CLIMA

• Secundarios: Van acompañando a otros descriptores. Parecen menos importantes que


los primarios, pero son fundamentales en la estructura del lenguaje porque sirven para
restringir la demanda. Ej.: PRIVATIZACIÓN DE LA INFORMACIÓN

42
Capitulo 2

• Infraconceptos: Son elementos exentos de significación pero, acompañados de uíi


descriptor primario o secundario, pueden modificar a éste parcial o completamente. Son
infraconceptos, por ejemplo, los prefijos o los sufijos. Ej.: HIPER, MEGA

2. Por la cobertura temática:

• Onomásticos: Representan un nombre de persona, de institución (corporativos), etc.


Son fáciles de detectar y de recuperar en un texto determinado. Ej.: CRUZ ROJA

El uso de nombres propios permite una rápida y específica selección de los


documentos, pero en muchos casos, un documento indizado por un nombre propio puede
representarse o recuperarse por medio de descriptores más amplios, siempre que
estuvieran incluidos en el lenguaje documental y establecidas las relaciones ~de
generalidad y especifidad teniendo en cuenta dichos términos en relación con los demás
contenidos en dicho lenguaje. Ej.: CERVANTES, podría representarse por LITERATU-
RA ESPAÑOLA o por ESCRITORES.

• Geográficos o territoriales: abarcan todo tipo de conceptos vinculados con lugares y


sitios (países, mares, montañas...). Al leer un texto saltan a la vista, pero hay que
seleccionar entre los coyunturales y los no relevantes, al igual que en el caso de los
onomásticos. Ej.: MAR ROJO

• Temáticos o de materias: Son los más difíciles de controlar y valorar y, a la vez, los
más importantes. Representan cualquier contenido disciplinar. Ej.: FÍSICA

• Cronológicos o temporales: Representan fechas, períodos, etc. Ej.: SIGLO DE LAS


LUCES

43
Capítulo 2

3. Por su composición:

• Unitérminos o simples: Representan conceptos mediante una sola palabra. Por su


carácter unívoco, son idóneos para los lenguajes postcoordinados. Ej.: PLANTAS

• Sintagmáticos o compuestos: Representan un concepto utilizando un sintagma nominal


o preposicional (conjunción de términos unidos por nexos). Se utilizan para eliminar la
ambigúedad característica de los descriptores unitérminos. Ej.: PLANTAS MEDICINA-
LES

Cada vez es más común el uso de descriptores sintagmáticos, es decir, términos


precoordinados, ya que para la expresión de un concepto o la representación de una
noción puede ser necesario combinar varias palabras o términos. Estos pueden ser
combinados en el propio lenguaje del sistema y se hallarán, por canto, precoordinados en
el tesauro. O pueden ser combinados o postcoordinados durante la indización o la
búsqueda documental.

Si cada una de las palabras que forman un descriptor compuesto están en el


tesauro como descriptor simple, se le llama descriptor precoordinado. Si no existe un
descriptor precoordinado que represente la noción deseada, el indizador tendrá que
combinar varios descriptores para caracterizar el documento. Ahqra bien, antes de combi-
nar descriptores unitérminos para expresar un concepto, consultará sistemáticamente el
tesauro para comprobar si ya existe un descriptor precoordinado que lo represente.

El grado de precoordinación influye decisivamente en la naturaleza de las


jerarquías que se establezcan en el tesauro. Su campo de aplicación es decisivo: en
tesauros especializados la ambigúedad terminológica es menor, se necesita menor nivel

44
Capítulo 2

de precoordinación dado que, en un contexto limitado, es más fácil el manejo de los


términos que cuando se trata de temática diversa.

En relación con la utilización de términos simples o compuestos, la norma ISO


determina en su epígrafe 7 que, por regla general, los descriptores deben representar en
la medida de lo posible términos simples. Las nociones complejas pueden ser descom-
puestas en términos simples si alguno de los elementos de un término compuesto puede
ser aceptado como descriptor. Ej.: ANALISIS DE DATOS (análisis + datos)

La misma norma señala que deben mantenerse los términos compuestos como
descriptores:

a) Si la descomposición del término compuesto puede generar problemas de comprensión,


por ser conocido en su forma compuesta. Ej.: CAJA NEGRA

b) Si la descomposición puede generar confusión o ambigúedad, y para evitar la amplitud


semántica. Ej.: TRIÁNGULO DE LAS BERMUDAS

Sobre este asunto Unesco aconseja la utilización de la forma sustantiva si se trata


de unicérminos y, en el caso de cratarse de descriptores sintagmáticos, al menos la base
será un sustantivo. Añade que se han de evitar en lo posible los lazos gramaticales,
artículos y preposiciones entre los descriptores compuestos; en español, para este
objetivo, se puede recurrir a la adjetivación. Ej.:

MINAS DE CARBÓN > MINAS CARBONÍFERAS

45
Capitulo 2

Los descriptores sintagmáticos pueden formarse por unión morfológica o


semántica:

1. Unión morfológica:

Se fusionan dos o más términos mediante preposiciones, artículos, sustantivos o


adjetivación de uno de ellos, de manera que la estructura significante no varía
sustancialmente. El resultado debe ser identificable con respecto a los descriptores de los
que partimos, es decir, varía el contenido pero permanece la forma. Ej.:

ENERGÍA + VIENTO> ENERGÍA EÓLICA

2. Unión lexicológica o semántica:

Se unen los términos por absorción de contenidos. Con este procedimiento la


forma cambia parcial o totalmente. El resultado de la unión lexicológica será siempre un
descriptor simple o unitérmíno parcial o totalmente irreconocible en relación con los
términos de los que se parte. Ej.:

PSICOLOGÍA + ESCRITURA > GRAFOLOGÍA

Accidentes lingúisticos: polisemia y sinonimia:

Al construir un tesauro es preciso fijar una terminología inequívoca, que supere


sinonimias y polisemias, eligiendo, en la medida de lo posible, la transcripción más
comúnmente utilizada.

46
Capítulo 2

La polisemia: Multiplicidad de acepciones de una palabra. La existencia de


significantes con varios significados es perjudicial en el tesauro y debe ser controlada.
1-lay cuatro recursos para controlar o explicar la polisemía:

1. Introducción de un calificador, que concrete su significado, al lado del


descriptor, entre paréntesis. Ej.: ROSA (color)

2. Asociación del término polisémico a otro descriptor del tesauro que ayude a
precisar su significado, es decir, a contextualizarlo. La relación entre ambos términos se
expresa mediante el símbolo TR (término relacionado). Ej.: ROSA IR BOTÁNICA

3. Sintagmatización o transformación del término descriptor en sintagma nominal.


Ej.: ROSA SILVESTRE

4. A través de la utilización de un sinónimo que sustituya al término polisémico.


Ej.: Megalópolis Use ÁREAS METROPOLITANAS

La sinonimia se produce cuando un solo concepto está representado por varios


significantes. En un lenguaje documental la sinonimia es beneficiosa siempre que esté
controlada, pues ofrece todas las entradas posibles al sistema documental. Lo más
habitual es elegir una expresión como descriptor y mantener los sinónimos como no
descriptores.

47
Capítulo 2

Según Chaumier7, en un tesauro pueden producirse dos tipos de sinonimia:


lingúistica y documental.

a) La sinonimia lingúistica puede presentarse en estos casos:

1. Por variante ortográfica. Ej.: MÉXICO 1 MÉJICO

2. Por transliteración (distintos sistemas de conectar los diferentes alfabetos>. Ej.:


TCHEKOV, CEKOV, TCHEKOF

3. Sinonimia semántica. Ej.: WOLFRAMIO 1 TUNGSTENO

4. Equivalencia entre forma de expresión antiguay moderna. Ej.: ALMOFALLA


1 ALFOMBRA

5. Traducciones y préstamos. Ej.: SOFTWARE 1 PROGRAMA

6. Equivalencia entre el lenguaje popular y el científico. Ej.: OCULISTA 1


OFTALMOLOGO

7. Variante de escritura. Ej.: C.E.E. 1 CEE

b) Sinónimos documentales: Designan términos de significado próximo, no


considerados como equivalentes en el lenguaje corriente.

7CHAUMIER, J. Análisis y lenguajes documentales: El tratamiento IingIifstico de la información


documental. Barcelona: Mitre, 1986., Pp. 82-84.

48
Capítulo 2

Denominados también cuasisinónimos, reagrupan bajo un descriptor varios


términos por vecindad o inclusión pero no por auténtica sinonimia. Se aplica este
procedimiento en los siguientes casos:

1. Si un término se considera demasiado especifico para el tesauro, se sustituye


por uno más general. Ej.: MARGARITAS ¡ TULIPANES ¡ ROSAS, sc sustituyen por
FLORES.

2. Términos variantes de un mismo concepto, se sustituyen por su sema principal.


Ej.: PERIÓDICO ¡ PERIODISTA por PERIODISMO

3. Términos antónimos: los transformamos en sinónimos uno del otro. Ej.:


PACIENCIA por IMPACIENCIA

Siempre que se proceda de este modo, hay que hacer una nota aclaratoria del
porqué.

2.5.3. Morfología de los descriptores

Hacemos referencia a continuación a algunos de los epígrafes de la norma [SO


2788-1986, que consideramos esenciales en lo que a morfología de los descriptores se
refiere.

Epígrafe 4.4.: Los descriptores deben expresarse en mayúsculas y los no descriptores


en minúsculas.

49
Capitulo 2

Epígrafe 6.2.1.: Sustantivos y frases sustantivadas

Bajo locuciones nominales la norma entiende los términos compuestos: locuciones


adjetivas (plantas silvestres) o locuciones preposicionales (cuentos de hadas).

Los nombres o adjetivos modificadores pueden ser fuente de otros descriptores.


Los tesauros deben en este caso mostrar las relaciones recíprocas entre el descriptor
derivado y el término compuesto. Ej.:

FLORA ALPINA IR ALPES


ALPES TR FLORA ALPINA

Epígrafe 6.2.2.: Adjetivos

El empleo de adjetivos aislados debe ser evitado. Los adjetivos de locuciones


adjetivas pueden dar lugar a reenvíos. Ej.:

CRIPTÓGAMAS (véanse las diferentes plantas criptógamas)

Epígrafe 6.2.3.: Adverbios

Adverbios tales como muy o grandemente no son admitidos, salvo si forman parte
de expresiones técnicas. Ej.: GRAN PRIMER PLANO

50
Capítulo 2

Epígrafe 6.2.4.: Verbos

El infinitivo de los verbos no debe ser empleado solo como término de indización.
Las actividades deben ser sustantivadas. Ej.: DESTILACIÓN (no destilar).

Epígrafe 6.2.5.: Abreviaturas y acrónimos

Es preferible utilizar la forma desarrollada. Las siglas y acrónimos deben evitarse,


salvo si se han sustantivado (LASER, RADAR) o si se conocen en cualquier idioma
(ONU).

Epígrafe 6.3.: Singular y plural

Por regla general, los términos expresivos de entidades que pueden ser contadas
pueden ir en plural. Ej.: BOSQUES

Los términos que representan entidades no contables deben ser expresados en


singular. Ej.: AZUCAR

También se expresan en singular los nombres de nociones abstractas. Ej.:


IDEALISMO

Cuando un término designa una operación y el producto de la misma, se utiliza


el singular para la operación y el plural para el producto, calificando además el primero
con una expresión entre paréntesis. Ej.:

51
Capitulo 2

ALEACIÓN (proceso) ¡ ALEACIONES


plantas o árboles en singular, su fruto en plural
MADROÑO (árbol) ¡ MADROÑOS (frutos)

Epígrafe ‘7.4: Orden natural de las palabras

Las locuciones nominales, adjetivas y preposicionales deben ser presentadas en


el orden de la lengua natura) y no en la forma invertida: Ej.: Ley del Talión y no,
Talión, ley del. La forma invertida puede dar lugar a un reenvío hacia la forma directa.
Ej.:

TALIÓN, LEY DEL


Use LEY DEL TALIÓN

2.5.4. Relaciones entre los términos del tesauro

Una vez analizados los aspectos morfológicos que afectan a los descriptores,
vamos a tratar en este epígrafe de las posibles relaciones que se pueden establecer entre
los mismos, en el corpus del tesauro.

En un lenguaje documental los conceptos nunca se usan de forma aislada y su


terminología se organiza en sistemas de conceptos pertenecientes a campos conceptuales.
Dichos sistemas de conceptos facilitan la estructuración de la terminología propia de un
campo del conocimiento e, incluso, facilitan la creación de equivalencias interlingúisticas.

52
Capítulo 2

El establecimiento de relaciones semánticas entre conceptos es el paso previo a


la creación de sistemas de conceptos para la confección de cualquier lenguaje documen-
tal.

En un lenguaje documental y, por tanto, en un tesauro, las rejaciones entre


conceptos se dividen en dos grandes grupos, las relaciones concepto-concepto y las
relaciones concepto-término dando origen, a su vez, a tres tipos de relaciones semánticas:
relaciones jerárquicas y asociativas, que responden a la categoría relacional concepto-
concepto; y relaciones de equivalencia, establecidas entre concepto-término.

Las relaciones basadas en la secuencia de conceptos subordinados, es decir, las


relaciones jerárquicas, se desarrollan en el eje vertical, o paradigmático, mientras que las
asociativas se fundamentan en la secuencia de conceptos coordinados, ésto es, en el eje
horizontal, porque se establecen entre conceptos del mismo nivel jerárquico.

2.5.4.1. Relaciones jerárquicas o paradigmáticas

Las relaciones jerárquicas sirven para expresar las relaciones de superioridad e


inferioridad entre los conceptos. En un tesauro estas relaciones permiten reunir aquellos
conceptos -descriptores- que unos con respecto de otros son más generales o más
específicos, colocándolos en niveles superiores o inferiores y formando así un conjunto
jerárquico preciso. Pueden ser de amplitud y especificidad y partitivas. En el primer
caso, la relación se establece entre un concepto que se considera genérico y aquellos que,
siendo coordinados entre si, son subordinados del genérico. Ej.:

53
Capítulo 2

ENERGíAS
Energías convencionales
Energías alternativas

Por tratarse de una relación transitiva, no simétrica, se puede incorporar


fácilmente en los sistemas de recuperación de información. El establecimiento de
jerarquías facilita, en efecto, en el momento de la indización, la elección de los términos
más específicos que definan un concepto, eliminando la posibilidad de ruidos en la
búsqueda.

Una relación genérica propiamente dicha es la monojerárquica, en la cual un


concepto se encadena jerárquicamente sólo a otro. Ej.: Si todas las energías alternativas
son ENERGÍAS y si algunas ENERGÍAS son energías alternativas, el concepto energías
alternativas es específico del concepto ENERGÍAS.

Pueden darse casos de polijerarquía o multijerarquía cuando un mismo concepto


pertenece a más de una jerarquía. Por ejemplo: El nervio óptico puede incluirse en la
categoría semántica relativa al SISTEMA NERVIOSO, y puede pertenecer jerárquica-
mente al campo destinado a la ÓPTICA.

No todos los especialistas coinciden en la necesidad y conveniencia de incluir


relaciones polijerárquicas en la estructura de un tesauro. Lancaster, por ejemplo
desaconseja su empleo8, mientras que Soergel9 considera la polijerarquia un medio de

8LANCASTER, F.W. Tbesaurus construction and use: a condensed course. Paris: Unesco, 1985, p.
41.

9SOERGHL, D. Indexing languages and tbesauri: Construction aud niaintenance. Los Angeles:
Melville, 1974, p. 254.

54
Capítulo 2

representación adecuado de los conceptos, capaz de eliminar problemas terminológicos.

Por lo que se refiere a las relaciones jerárquicas partitivas, el descriptor inferior


es una parte particular del descriptor superior. Ej.:

EUROPA y ESPAÑA
FLOR y PÉTALOS

En un tesauro puede llegar a haber hasta 15 niveles jerárquicos. El orden en el


que se colocan los descriptores del mismo nivel jerárquico dependientes de un mismo
término, es el siguiente: Orden alfabético, el que utilizan la mayoría de los tesauros. Ej.:

METALES PRECIOSOS
TE ORO
PLATA
PLATINO

Van Slype’0 considera aplicable el orden alfabético cuando no se pueda utilizar


ningún otro modo de ordenación, y propone los siguientes criterios alternativos:
- orden cronológico, aplicable

• en materia histórica y estilística


• en procesos que se desencadenan secuencialmente (ej.: producción, distribu-
ción, consumo).

‘0SLYPE, O. y. Op. cit., pp. 53-54.

55
Capítulo 2

- orden de evolución, aplicable especialmente en biología;


- orden de complejidad creciente, aplicable, por ejemplo, en el dominio de las ciencias
(geometría euclídea, geometría no euclldea...);
- orden de dimensión creciente (por ejemplo: composición musical: solo dúo, trío,
cuafleto...) o decreciente (por ejemplo: subdivisión territorial, país, región, provincia,
municipio...);
- ordenación en el espacio (por ejemplo, disposición de los países en orden de
contigáidad);
- orden de preferencia o defrecuencia de uso en los documentos tratados por el servicio
(por ejemplo: religión: catolicismo, protestantismo, judaísmo, islamismo, budismo...);
- orden tradicional (por ejemplo, ordenación de las ciencias:física, química, biología...);
- y, por último, el orden alfabético, aplicable cuando no se pueda utilizar ningún otro
modo de ordenación.

2.5.4.2. Relaciones asociativas o sintagnilticas

Las relaciones asociativas o a posteriori, también se denominan horizontales


porque se establecen entre conceptos del mismo nivel jerárquico. Relacionan descriptores
que no suponen sinonimia ni jerarquía y se trata, pues, de una relación de afinidad
semántica. Ambos no se incluyen ni son sinónimos, pero por asociación de ideas envían
a otros conceptos.

Es el tipo de relación más difícil de definir porque, al no existir una norma


precisa para su establecimiento, el criterio para su selección es fundamentalmente
pragmático.

56
Capítulo 2

Un descriptor puede tener una, ninguna, dos o más relaciones asociativas.

RECURSOS HÍDRICOS
TR AFOROS
TR AGUA
IR HIDROLOGÍA

Las relaciones de equivalencia y las relaciones jerárquicas sólo se establecen entre


términos del mismo tipo. No es posible asociar, por ejemplo, un término genérico y un
término especifico, es decir, no se crearán relaciones asociativas entre desériptores de la
misma cadena jerárquica. Las relaciones asociativas, de reciprocidad directa, no pueden
conectar descriptores y no descriptores, en cambio, pueden enlazar determinado
descriptor con otro cualquiera.

Si un término se asocia con otro de nivel jerárquico superior, se supone que está
relacionado también con todos los que están subordinados a él.

Aitchison y Gilchrist”, proponen casos orientativos en los que se pueden


establecer relaciones de asociación:

1. Entre conceptos que representan disciplinas y los objetos estudiados por esa
disciplina. Ej.: SISMOLOGÍA-TERREMOTO

2. Entre operaciones y procesos y sus agentes o instrumentos. Ej.: VELOCIDAD-


VELOCÍMETRO

“MTCHISON & GIILCHRIST. Thesaurus construction, a practical manual. London: ASLIB, 1987,
pp. 44-49.

57
Capítulo 2

3. Ocupaciones y personas. Ej.: DEPORTE-DEPORTISTA

4. Acciones y productos o efectos de las acciones. Ej.:


INVESTIGACIÓN-DESCUBRIMIENTOS

5. Una acción y su objeto paciente. Ej.:


ANÁLISIS DOCUMENTAL-DOCUMENTO

6. Partes del todo con partes de otro todo. Ej.: VOLANTE-MANOS

7. Objetos relacionados con sus propiedades. Ej.: HIELO-FRIALDAD

8. Objetos relacionados con sus orígenes. Ej.: AGUA-MANANTIAL

9. Efectos y causas. Ej.: EROSIÓN-VIENTO

10. Cosas y/o acciones y sus antiagentes. Ej.: LLUVIA-PARAGUAS

11. Materias primas y sus productos. Ej.: MADERA-MUEBLE

12. Acciones y propiedades asociadas a esas acciones. Ej.:


INFORMACIÓN-RECUPERACIÓN DE LA INFORMACIÓN

13. Conceptos antónimos. Ej.: ESTABILIDAD-INESTABILIDAD

58
Capítulo 2

Las recomendaciones de Unesco admiten también [a relación entre conceptos que,


perteneciendo a una misma cadena jerárquica, tienen una significación poco clara cuando
se consideran aisladamente.

2.5.4.3. Relaciones de equivalencia

Agrupan términos preferenciales a través de la localización de sinónimos en la


terminología/vocabulario, que no deben aparecer simultáneamente en el tesauro como
descriptores autorizados.

Detectadas las equivalencias semánticas se elige uno de los términos como


representativo del concepto, dándole la categoria de término preferente o descriptor. Los
términos equivalentes se remiten al principal.

Capa de ozono
Use OZONOSFERA

OZONOS FERA
UF capa de ozono

2.5.5. Formas de presentación de los descriptores

Los términos que componen el tesauro y sus relaciones se pueden representar de


varias formas, siendo las más comunes las siguientes:

59
Capítulo 2

1. Presentación alfabética
2. Presentación sistemática
3. Presentación gráfica

Describimos seguidamente los tres sistemas, si bien consideramos que, para que
un tesauro constituya una precisa herramienta de recuperación de información, es
menester que en su estructura estén presentes, al menos, dos de las citadas formas de
presentación: alfabética y sistemática o alfabética y gráfica; de tal manera que, cuando
la presentación de los términos se lleve a cabo sistemática o gráficamente, el tesauro ha
de estar provisto de un índice alfabético que permita una primera toma de contacto con
la información presente en el tesauro y remita, mediante un código, a la parte sistemática
o gráfica.

La mayor ventaja que ofrece el orden sistemático es la ayuda que aporta a la


búsqueda de información y a la investigación, pero requiere apoyarse en el orden
alfabético que tiene la ventaja de resultarnos familiar.

Como complemento a estas formas de presentación es aconsejable elaborar un


indice permutado general en donde estarán todos los descriptores alfabetizados tantas
veces como términos los compongan. Es igualmente importante incluir, al comienzo de
este lenguaje documental, una introducción en la que se explique cual es su intencionali-
dad, área temática cubierta y grado de especificidad de los conceptos incluidos, exten-
sión, número de descriptores y no descriptores, los recursos para establecer las
relaciones, método, estructura, fuentes utilizadas para construir el tesauro, indicando para
cada fuente si todos o sólo parte de los términos contenidos en ella fueron incluidos en
el tesauro, bibliografía utilizada, los códigos y su explicación, explicación igualmente de
todas las normas de uso, nivel de compatibilidad con otros tesauros del área y con

60
Capítulo 2

macrotesauros. La introducción incluirá también su justificación e información sobre los


procedimientos de actualización.

2.5.5.1. Presentación alfabética

El índice alfabético estructurado (figura 7) contiene descriptores y no descriptores


ordenados de forma alfabética. Permite al indizador verificar la existencia de aquellos
posibles descriptores que se le ocurran mientras que la temática le permitirá descubrir los
descriptores pertinentes que no es capaz de memorizar. Con cada descriptor aparece el
conjunto completo de sus relaciones semánticas incluida toda su jerarquía, es decir, todos
los niveles de términos más genéricos y más específicos, numerados, para indicar su
grado jerárquico con relación al descriptor de que se trate. Por lo tanto, cada entrada
lleva:

- Indicación del campo semántico al que pertenece un descriptor


- Notas aclaratorias o de aplicación
- Equivalencias semánticas (relación de no descriptores o términos no preferentes)
- Los descriptores genéricos según uno, varios o todos los niveles de jerarquía
ascendente
- Los descriptores específicos según uno, varios o todos los niveles de jerarquía
descendente
- Los descriptores asociados

La indicación detallada de estas relaciones semánticas entre los términos


caracteriza al tesauro y le diferencia de un léxico documental o de un simple glosario.

61
Capítulo 2

La incorporación de los términos sinónimos y cuasisinónimos de los descriptores


hace que el índice alfabético sea un eficaz útil para la indización y recuperación, ya que,
al incorporar dichas entradas, la probabilidad de encontrar el término adecuado es mucho
mayor.

Las relaciones pueden ser representadas por los signos alfabéticos USE, UP, TG,
TE y IR o igualmente por medio de símbolos, que permiten su identificación indepen-
dientemente del idioma:

Relación de equivalencia USE (Use)


UF (Usado por)
Relación jerárquica TG (Término genérico)
TE (Término especifico)
- Relación asociativa TI? <Ténnino relacionado)

En el indice alfabético estructurado los descriptores asociados y los no


descriptores van precedidos por el operador o símbolo de relación correspondiente y
dispuestos por orden alfabético, generalmente. Ej.:

MÉTODOS EDUCATIVOS

UP Métodos pedagógicos
TG PLANIFICACIÓN EDUCATIVA
TE JUEGOS EDUCATiVOS
TI? ENSENANZA

Los descriptores genéricos y específicos van precedidos por la sigla de relación


correspondiente y dispuestos, dentro de cada nivel jerárquico, por orden alfabético; cada
nivel jerárquico adicional está marcado por un sangrado hacia la derecha o por una

62
Capítulo 2

codificación numérica. Ej.:

ECOSISTEMAS ACUÁTICOS
TEL HUMEDALES
TE2 ESTEROS
TE2 MARISMAS
TE2 PANTANOS

2.5.5.2. Presentación sistemática

El índice sistemático contiene los descriptores estructurados en función de


categorías o jerarquías. La parte sistemática da una visión de conjunto de la información
contenida en el tesauro y permite conocer en qué medida se ha detallado un tema. Un
Éhesaurus -escriben Salton y McGill’2- provee una agrupación o clas<ficación de los
términos utilizados en una área temática en categorías conocidas como temas, campos
o clases.

Con esta agrupación jerárquica de los descriptores se puede efectuar un control


general rápido de los campos temáticos tratados y escoger el apropiado nivel de
generalidad en el momento de indizar o al formular una ecuación de búsqueda.

Los descriptores se sitúan en sus áreas contextuales donde son jerarquizados por
categoría semántica y dotados de distintos tipos de relaciones y reenvíos. Así es como
después los encontraremos rodeados de sus conceptos más próximos. Para llevar a cabo
esta parte, hay que ver posibles relaciones término a término y campo a campo.

‘2SALTON, G. & McGILL, M.J. Op. cit., p. 76.

63
Capítulo 2

El establecimiento de categorías se puede realizar en base a facetas o a campos


temáticos. Esta agrupación de los descriptores en facetas o temas es fundamental para
poder manejar este lenguaje, que puede contar con varios miles de términos.

La presentación mediante campos temáticos organiza los conceptos según las


relaciones género a especie, al igual que lo hacen los sistemas de clasificación
jerárquicos. Los descriptores se presentan en esquemas arborescentes con ramificaciones
sucesivas sin que, en ocasiones, exista un rigor lógico en su estructura, lo que sejustifica
en el seno de este lenguaje documental por razones pragmáticas.

Cuando la distribución de los términos del tesauro se realiza en base a facetas, se


procede a la reagrupación en base a categorías artificiales que no se adaptan a la realidad
cultural. La clasificación por facetas considera cada sujeto clasificable desde determina-
dos puntos de vista, lo que posibilita la agrupación de temas por afinidades, formando
conjuntos que tengan una característica común.

Ranganathan, creador del sistema de clasificación por facetas, identificó las


siguientes: Personalidad, Materia, Energía, Espacio y Tiempo, capaces de realizar
agrupaciones en campos semánticos. Las facetas utilizadas más comúnmente en la
elaboración del área cacegorial de los tesauros son: fenómeno, proceso, materiales,
organización, ser vivo, equipamiento, propiedad y disciplina. Dice Lancaster que el
tesauro por facetas presenta una ventaja sobre cualquier otro tipo de tesauro: puede
utilizarse para la ordenación de libros en las estanterias de una biblioteca especializada,
‘3

además de para la indización de documentos en una base de datos

‘3LANCASTER, F. El control del vocabulario en la recuperación de información. valencia:


Universitat, 1995, p. 109.

64
Capítulo 2

Ya sea en base a temas o en base a facetas, la representación del área jerárquica


del tesauro se puede hacer en la misma forma que el índice alfabético estructurado, salvo
que el orden de los descriptores estará dispuesto de forma jerárquica y no alfabética
(figura 8), o bien se representará gráficamente, tal y como aparece en las figuras 9, 10
y II, correspondientes a los modelos de representación gráfica de uso más común y que
estudiamos a continuación.

2.5.5.3. Presentación gráfica

las presentaciones en listas sólo permiten examinar la estructura del campo


semántico de forma lineal, por el contrario, las representaciones gráficas exponen la
estructura semántica de cada campo semántico dentro de una hoja de papel y se sirven
de las dos dimensiones de esta superficie. Las tres formas más usuales de representación
gráfica son:

a) estructura arborescente
b) diagramas de flechas
c) terminogramas

Los tesauros de representación gráfica se complementan con un índice alfabético


que contiene notas aclaratorias, reenvíos entre términos preferentes y no preferentes y
referencias a términos genéricos, específicos y relacionados; por ello, en este tipo de
representación no es necesario asignar símbolos a cada término en particular. Así pues,
los sistemas gráficos muestran sobre todo las relaciones jerárquicas existentes entre
descriptores y por lo general, los reenvíos hacia términos asociados se indican en los
márgenes del esquema gráfico.

65
TESAURO WC BE 5ICOtflC¿A

AMINOACIDOS PADRES
DOPAN¡HA
NORADR ENALINA ACTITUD DE RESPUESTA 020101
NA Tendencia o estIlo deliberado o inadvertido a
ACIDO RIGONUCLEICO 060101 responder a los Iten,s de un test de lorma
‘IP ARN caracleristíca IP. ej. con respuestas SOCiaJn,ente
RNA aceptadas) que restan validez a los resultados
fo ACIDOS NUCLEICOS TO APLICACION DE TESiS
IX AMINOACIDOS TR ELECCION
ESTILO COGNITIVO
ACIDOS 0601 RESPUESTAS
TC ACIDOS NIJCLEICOS
AM INOAC ID OS ACTITUD DEL CLIENTE
IX ANALGESICOS USE ACTITUD DEL PACIENTE
LSD
ACTITUD DEL ESTUDIANTE 150402
ACIDOS NUCLEICOS 060101 EX ABANDONO DE ESTUDIOS
TO ACIDOS ADAPTACION ESCOLAR
TE ACIDO DESOXIRRIBONUCLEICO ALUMNOS
ACIDO RIBONUCLEICO ASISTENCIA A LA ESCUELA
ADENOS¡HA CARACTERISTiCAS DE LOS ESTUDIANTES
CONDUCTA DEL ESTUDIANTE
ACNE 120510 ESTIJOLAIJTES
TO TRASTORNOS DERMATOLOCICOS RELACION PROFESORALUMNO
IX ALERGIA
ACTITUD DEL PACIENTE 130502
ACOMODACION 080201 UP ACErTiJO DEL CLIENTE
HA ProceSO n,edlarlte el cual el sujeto ajusta sus TO PROCESO TERAPEUTICO
esouemas y patrones de conducta a las condíciones IX ABANDONO DEL TRATAMIENTO
externas, (PlageEl. ACTiTUD ANTE LA ENFERMEDAD
TO DESARROLLO COGNITIVO ACTITUD ANTE LA MUERTE
IX ASIMILACION CARACTERIST1CAS DE LOS PACIENTES
DESARROLLO OPERATORIO CDNTRATRANSFERENCLA
DESARROLLO PERCEPTIVO TRANSFERENCIA PSICOTERAPEUTICA
ECUILIBRACION
ACTITUD DEL PROFESOR
ACONTECIMIENTOS VITALES USE CONDUCTA DEL PROFESOR
USE SUCESOS VITALES
ACTITUD DEL PSICOTERAPELITA
ACOSO SEXUAL USE ACTITUD DEL TERAPEUTA
USE HOSTIGAMIENTO SEXUAL
ACTITUD DEL TERAPEUTA 130502
ACROFOBIA 120103 ‘IP ACTITUD DEL PSICDTERAPEUTA
HA MIedo Intenso a las alturas, TU CARACIFRISTICAS DE LOS TERAPEUTAS
‘IP MIEDO A LAS AL11JRAS IX COflATO TERAPEUTICO
TO FOBIAS COISTRATRANSFERENCIA
IR TRASTORNOS MENTALES PROCES&PSICOTERAPELITICO
RELACIONES PAOENIETERAPELJTA
AcROMATiSMO RELACIONES IERAPEUTAFAMIUA
USE CEGUERA PARA EL COLOR TERAPEUTAS

ACTITUD PARENTAL
ACTAS 170101
TO DOCUMENTOS PRIMARIOS USE ACTITUD DE LOS PADRES

ACuNO OIJT ACTITUD SEXUAL ooosoi


USE ACTUACION NA OpInIones y creencIas acerca de la conducta y
dessTolIo sexual.
TO CONDUCTA SEXUAL
ACTITUD ANTE LA ENFERMEDAD 100201
IX ABSTiNENCLA SEXUAL
TG ACTiTUDES
ATRACCION SEXUAL
IR ACTITUD DEL PACIENTE
DESARROLLO PSICOSEXUAL
CONDUCTA EN LA ENFERMEDAD
DIFERENCIAS ENTRE LOS SEXOS
ENFERMEDAD
OISCRIMINACION SEXUAL
ESTEREOTIPOS SEXUALES
ACTITUD ANTE LA MUERTE 100201
IDENTIDAD SEXUAL
TO ACTITUDES MAcHISMO
TR ACTITUD DEL PACIENTE
CONDUCTA EN LA ENFERMEDAD
ACTITUDES 100201
EUTANASIA
UP CREENCIAS
TE ACTITUD Mfl LA ENFERMEDAD
ACTITUD DE LOS PADRES 090301
ACTITUD ANTE LA MUERTE
UP ACTiTUD PARENTAL
ACTITUDES SOCIALES
TO RELACIONES FAMILIARES CAMBIO DE ACTITUD
TE SOBREPROTECCION IX ACTITUDES POLITiCAS
IX CRIANZA
ALTRUISMO
MADRES ASPI RACION

Extracto del indice alfabético estructurado


del Tesauro ISOC de Psicología
Figura 7

66
TESAURO WC DE ~$ICQLOCIA 217

- - . .RETROALIMEIJTACION
BIORRETROALIMENEACION
CONOCIMIENIO DEL RESULTADO
- . . SENSIBILIDAD
UMSRALES
UMBRAL AUDITIVO
UMBRAL DE DOLOR
UMBRAL VISUAL

06 FARMACOLOCIA Y PSICOFARMACOLOCIA

0601 . ACEDOS
060101 . . .ACIDOS NUCI.EICDS
ACIDO DESOXIRRIBONUCLEICD
- . ACIDO RIBONUCLEICO
.ADEHOSENA
060102 . . .AMINOACIDOS

• . TIROSINA

0602 - .ALCOHOLES
060201 . . ETANOL

0603 . . AMINAS
060301 . . ANITRIPTILINA
060302 .. HISTAMINA
060303 . . . SEROTONINA

• . . .SULFO-ADENDSILLI!ETIONINA

0604 . . DROGAS
060401 . . ALUCINOGENOS
CANNABIS
HACHíS
MARIHUANA
• . .LSD

060402 . . BEBIDAS ALCOHOLICAS


060403 . . .BEBIDAS NO ALCOHOLICAS

060404 CAFEíNA
060405 . . COCAíNA
060406 . . . INHALANTES

060407 . . .NARCOTICOS

OP IACEOS
CODEíNA
HEROíNA
060408 . . . tABACO

0605 . ELEMENTOS QUíMICOS


060501 . . IONES
060502 . . .LITIO

060503 . . .CALCIO

0606 . .ENZIMAS

0607 . . HORMONAS
060701 .. . HORMONAS SEXUALES

060702 .. HORMONAS TIROIDEAS

0608 INHIBIDORES ENZIMATICOS


060801 . . MAO

0609 . .MEOICANENTOS
060901 . . ANALGESICOS
.ME TADONA
- MORFINA
060902 . . .ANESTESECOS

060903 . . ANOREXICOS

060904 . . ANTIBIOTICOS
060905 . . .AMTICONVULSIVOS

060906 .. .ANTIESPASMOOICOS

06090? . . .OEURETICOS

060908 . . .PSICOFARMACOS

• . .DEPRESORES DEL SNC

Extracto del índice sistemático del.


Tesauro ISOC de Psicología 67
Figura 8
4
Capítulo 2

2.5.5.3.1. Diagramas arborescentes

Es la forma de presentación gráfica más simple. Suelen construirse pocos


diagramas por tesauro, como en el caso del Urbamet14 (figura 9). En estos tesauros la
estructura jerárquica sólo aparece en los diagramas, el listado alfabético se limita a
darnos el término más amplio en el que se incluye el descriptor buscado para, en pasos
sucesivos, acabar en los descriptores más genéricos que dan nombre a los distintos
diagramas.

2.5.5.3.2. Diagramas de flechas (Figura 10>

Se usa una hoja por campo semántico. En el interior del rectángulo figuran los
descriptores que pertenecen a ese campo, así como sus relaciones jerárquicas y
asociativas con descriptores situados dentro del mismo grupo.

Fuera del rectángulo se sitúan los descriptores que pertenecen a otros campos,
pero que están ligados a los que figuran dentro del rectángulo por una relación jerárquica
(en el caso de polijerarqula) o por una relación asociativa.

Se enlazan con los descriptores interiores por medio de flechas unidireccionales,


en el caso de relaciones jerárquicas, o líneas rectas, cuando exista entre los términos una
relación asociativa. Cada uno de estos descriptores lleva el código del campo semántico
al que pertenece.

14THESAURUS URBAY%ffT. 6~ ed. Paris: Minist&e de l’Equipement des Transports et du Tourisme;


Council Régional d’ile-de-France, 1993.

68
o.)
w <o
utr
23
—t
E,
LI
A
u’ Ci
2
ss *
o a
a
E

‘35

ji ti
III II


t.2
e

a
-

4
O.
4 E-
o
L
—2

La
o ¡ a a
a “A’
2 1
-tal
o u..: — e
.1TI a
‘e —
- a-o
z E
‘al aix
TI
e
u o.
MI II
o
u
<4 E
E II
e E
—ial dd<’hiI
1.4.,
¡~ En
1% H
2
• 4.*
— 1 1111
E
: In
e 1

o
£4
o LO
O,
‘a
z
‘al
= II,
4-)
e,
u t
a)
tu ¡ a cl
rs,
e
O.
‘al III 1

a)
£4
o
.0
O. g.. £4
<4 .9
— 11111
E
£4
a bo
o
— a
eH e,
t
ti
ti
u 5-4
111
La rl
rs4
K _
.411
1-
z 3
tu 4?
u
MI
zu
>1

!¡UI ~
- •‘
1 ltitltt
-tal u II
-.
1o
E ¡3
•1 •1”
ib It
o
-e(3
£4
En
6)
CO
ci
En
o
-I
eEn
o
-rl
4.>
eEn
£4
4,
4-,
e
1-1
LO
O
o. £4
CO
CO
o a)
o. ~ -e
00
o. o)
O e->
o o 6)
N o
4)
1.. 0.0
rl -rl
£44.>
iro, tEn
LO4
a)C
E
o
‘e00
‘eciEn
4,
4-
En
E
En
£4
En
orl
o
ci
£4
-rl
rs4
Capítulo 2

2.5.5.3.3. Terminogramas (Figura 11)

Reúnen los descriptores en grupos, cada uno de los cuales se corresponde con una
disciplina o microdisciplina específicas: física, literatura, gramática.. -

En el caso de los terminogramas, en el interior del rectángulo hay un pequeño


rectángulo canucho por cada descriptor cabeza de jerarquía. Dentro se encuentran los
- -

descriptores en orden descendente de jerarqufa: un sangrado a la derecha para cada nivel


jerárquico y ordenación alfabética de los descriptores dentro de su propio nivel
jerárquico.

Las relaciones asociativas, que sólo existen entre descriptores de cadenas


jerárquicas distintas, se representan por líneas rectas entre descriptores asociados.

En el exterior del rectángulo están los descriptores de otros campos semánticos,


con el número de código de su propio campo, enlazados con los descriptores del interior
del rectángulo mediante líneas rectas o flechas.

En un terminograma se pueden incluir más o menos 80 descriptores y en un


diagrama de flechas, unos 40. Es más práctico el primer procedimiento porque permite
descomponer el tesauro en menos campos semánticos, lo que facilita la consulta.

71
Capítulo 2

2.5.5.4. Índices auxiliares

Además de las formas de presentación mencionadas anteriormente, existe la


posibilidad de incluir índices auxiliares en el tesauro, que facilitan el acceso a la
información contenida en los índices alfabético y sistemático. En un tesauro es obligatorio
al menos uno de estos índices, el permutado general, que contiene todas las entradas
existentes en dicho lenguaje documental. El tesauro puede contener, igualmente, otros
índices auxiliares: onomásticos, cronológicos o geográficos, compuestos por descriptores
de esta tipología, que no tienen cabida en los diferentes campos temáticos que integran
su estructura.

El índice rotativo o permutado (Figura 12) tiene como objetivo concentrar las
palabras. Consiste en una simple relación alfabética de los descriptores para facilitar su
búsqueda inicial y remitir al usuario, por medio de un código, a la parte sistemática.

Recibe la denominación de permutado porque los descriptores sintagmáticos se


encuentran en este índice ordenados alfabéticamente tantas veces como términos los
componen, de esta forma podemos encontrar los términos compuestos con la ayuda de
los demás elementos que forman el sintagma, lo que el orden natural de las palabras que
figuran en una simple lista alfabética no permite descubrir. Por ej.: cuencas fluviales se
puede localizar por la [cl de cuencas y por la fil de fluviales. La estructura de este cipo
de índices es la que diferencia a los tesauros de los léxicos.

72
1
2
SE CE)
CC
‘o _ CCC =
o cn~se,
-J 82<
U,
U)
1-
0-4
‘-3 CO
4,
En
rl
Ci
o
CO
CO
o
(3
-H
£4
4,
t/)
a)
‘e
o
z
En
O)
a)
E’
LO
a)
o54
4-,
0.
e1
54
Ci
LO
a)
‘e
a)
‘e
En
E
En
£4
o
rl
E
54
a)
E’
-.4
-.4
En
54
bfl
rl
90131] sg ~gifl
Cm

~oog __
~
~

¾
XC
.4
gÉ~ ~$
2
cDC -4
~‘-‘ t
E
2
OC Ot PSICOkQGLA 249

1 CURSO DE ECS 150216


2 CURSO DE ECE 150216
T~tSaMIA =1
3 CURSO DE ECB 150=16
4 CURSO DE 609 150216
5 CURSO DE EOS 150216
6 CURSO OB ECS 150216
? CURSO DE ECB 150216
8 CURSO DE ECS 150216
NINOS ABANDONADOS 090301
ABANDONO DE ESTUDIOS 150401
ASANOOND DE 14H05
ABANDONO 061. HOCAR 090301
ABANDONO DEL TRATAMIENTO 130505
ASDOHEN 050101
ABEJAS 040304
ABERRAC ION CROMOSOt4I CA
ABERRACIONES SEXUALES
CONDUCTA VE CAMPO ABIERtO ANIMAL 040402
ABOGADOS 140801
ABORTO ESPONTANEO 050105
ABORTO INDUCIDO 130307
flORTO PROVOCADO
ABORTO TERAPEUTICO
ASSEUTISMO 160502
ABSENTISMO ESCOLAR
ABSENTISMO LABORAL
ABST ESENCIA ALCOHOL! CA
ABSTINENCIA DE DROGAS 090601
ABSTINENCIA DE TABACO
ASSTII4ENCIA SEXUAL. 090501
DELIRiO POR ABSTíNENCIA ALCOROLICA 120112
SíNDROME fiE ABSTINENCIA 120208
ABSTRACCION 010404
PENSAJ4IE?~TO ABSTRACTO
RAZOHAJ4IEUTC ABSTRACTO
ABULIA 010402
ASUSO DE ALCOHOL 090602
ASUSO DE DROGAS 090602
ASUSO DE MEDICAMENTOS
ABUSO OB N1~0S 120108
ABUSO SEXUAL 090802
APTITUD ACAMMICA
!SPÉCIAUZACIOU ACADEMICA
EVALUACWN ACAflEMICA 150303
UACASO ACAOEI4ICO
RENDIMIENTO ACADEMICO 150306
ACALCULIA 120209
ACCESO A LA INFORMACIOH 070103
ACCESOS REPETITI VOS DEL suct
ACCIDENTES CEREBROVASCULARES 120112
ACCIOENTBS OB TRABAJO 160502
ACCIDENTES CE TRAflCO 091002
ACCIDENTES INDUSTR [ALES
ACCIDENTES LABORALES
ACCION AUTUIATICA
ACELERACION DEL DESARROLLO
ACEPTACION DE LA TERAPIA
ACEPTACION DEL PACIENTE
ACEPTACION DEI. ROl.
ACEPTAdOS SOCIAl. 090902
ACET¡LcOtl»A 061001
ACIDO OESOXIRRISONUCLEICO 06010!
ACIDO GM4MA M¡NOBUT¡RICO 06106=
ACIDO RIBONUCLEICO OWIOI
DIETILAMIDA DEL ACíDO LISEROICO
ACWOS 0601
ACIDOS NUCLEICOS 060101
ACNE 120510
ACU4CtACICN 080201
ACONTEC!MIENTOS VITALES
ACOSO SEXUAL

Extracto dei. índice permutado del.


Tesauro 1300 de Psicología 74
Figura 12
Capítulo 2

2.6. Mantenimiento y actualización de tesauros

Dado el tiempo que requiere su elaboración, un lenguaje documental puede quedar


anticuado incluso antes de que llegue a ser publicado, de forma que debe ser actualizado
periódicamente.

El lenguaje del tesauro tiene, entre otras características, la de la flexibilidad, que


permite ampliar regularmente su vocabulario.

Periódicamente, cada seis meses para un tesauro de nueva creación, y entre dos
y tres años para aquellos que se han utilizado durante determinado período de tiempo,
se procede a su revisión. Cuando ese lenguaje es especializado, la necesidad de revisión
se acentúa, ya que cuanto más especializada es una materia, que requiere profundidad de
indización, más rápidamente se vuelve obsoleta y se hace necesaria su puesta al día.

La actualización de un tesauro ha de hacerse tanto para incorporar la terminología


derivada del desarrollo de la ciencia o materia a la que se dedica, como para cubrir
lagunas y fallos detectados en la práctica de su aplicación a ese campo concreto del
conocimiento.

Es necesario, pues, hacer un seguimiento del uso de los términos que componen
el lenguaje documental para poder valorar cada una de sus entradas. Al indizar pueden
aparecer conceptos en la documentación que no tienen cobertura en el vocabulario del
tesauro. Cuando el indizador echa de menos un concepto, toma nota de la necesidad de
un nuevo descriptor, que registra o incluye en una lista de espera o en un fichero de
términos candidatos a descriptor (véase figura 13) que revisará y analizará en el momento
de la actualización. Si varias instituciones comparten el uso del tesauro, cada una

75
Capítulo 2

aportará fichas o listas de términos candidatos, que en el momento de la puesta al día


deberán ser analizadas con detenimiento para que los términos incluidos, excluidos o
simplemente modificados, resulten operativos para la mayoría de los centros implicados,
evitando en la medida de lo posible la permanencia en el tesauro de conceptos o incluso
campos de uso exclusivo en una sola institución.

La inclusión de los nuevos descriptores no puede realizarse día a día porque


crearía confusión y rompería la estructura característica del tesauro. Hay que tener en

ANVERSO

DESCRIPTOR: FACETA O CAMPO:

NOTA ACLARATORIA:

USADO POR:

TÉRMINO GENI~RICO TÉRMINO ESPECIFICO TÉR. RELACIONADO

76
CapítuLo 2

REVERSO

OBSERVACIONES:

TERMINO PROVISIONAL:

FECHA DE INCLUSIÓN:

FECHA DE REVISIÓN:

FECHA DEL DESCARTE DEL TERMINO:

Modelo para el registro de descriptores


Figura 13

cuenta que, cuando cambiamos un término, debemos cambiar a su vez todas las relacio-
nes de ese término dentro del tesauro.

La revisión es, por lo tanto, un proceso continuo, que permite conocer el uso que
se hace de la terminología tanto en la operación de indización como en la de recuperación
de información, porque al igual que en las operaciones de entrada, las consultas
realizadas en lenguaje natural por los usuarios aportan la terminología real del centro de
documentación o sistema documental. Las ecuaciones de búsqueda nos dan el porcentaje
de precisión y respuesta que conseguimos con los descriptores.

77
Capítulo 2

La presencia de sinónimos y cuasisinónimos en las consultas debe tenerse en


cuenta, haciéndose necesaria su incorporación porque favorece el acceso del usuario a
la información bajo diferentes denominaciones de un mismo concepto.

Van Slype15 reconoce la importancia de conocer la distribución estadística de los


descriptores para fundamentar el mantenimiento del tesauro. Considera que, según
muestra la experiencia, la frecuencia de utilización de los términos es muy diversa: gran
cantidad de descriptores no se usan o se usan muy poco; una pequefla cantidad de
descriptores se utilizan con gran frecuencia, en general el 20 por ciento de los
descriptores más usados representan el 80 por ciento de las indizaciones. Chaumier16
también hace referencia a la discordancia existente entre el empleo de términos en el
momento de la entrada de documentos al sistema como su empleo en las ecuaciones de
búsqueda; es por ello importante analizar la terminología utilizada por el usuario, que se
reduce por lo general a un restringido vocabulario.

Al igual que en el proceso de elaboración, en la actualización se tendrán en


cuenta:

a) El grado de evolución del lenguaje


b) La opinión de los especialistas en la materia
c) Las consultas de los usuarios
d) La utilización de los descriptores en el proceso de indización.

‘5SLYPE, G.van. Op. cit, p. 109.

16CHAUMIER J. Op. cit, p. 128.

78
Capítulo 2

Pueden darse cambios de las siguientes características:

1. Inclusión de términos nuevos. En el momento de la revisión se comprueba la


frecuencia de uso de estos términos, que previamente se registraron en la lista de espera
mencionada anteriormente, y la posibilidad de su inclusión en el tesauro como descriptor
definitivo.

2. Eliminación de un descriptor. Aquellos términos incorrectos, poco o nada


usados, se pasan a la categoría de no descriptores, pero no se eliminan, porque pueden
ser fuentes de acceso al tesauro para los usuarios. Se les añade la sigla USE y se
mantienen en el índice, previa anulación de todas sus relaciones. Ej.:

Zonas costeras
USE ZONAS LITORALES

3. Subdivisión de un descriptor presente en el tesauro en una serie de descriptores


de menor nivel jerárquico. Es decir, se sustituye un descriptor que figura en el tesauro
como término genérico por varios términos más específicos, incluyendo un nivel de
especificidad mayor en el tesauro. Por ejemplo, reemplazamos MINERALES por
CROMO, ESTANO, HIERRO, LITIO, porque se ha detectado la necesidad de utilizar
conceptos más específicos al aplicar el tesauro a un fondo documental determinado. En
este caso puede eliminarse el término más general del que derivan lo otros, o puede
mantenerse como término genérico incluyendo a todos los demás. Ej.:

79
Capítulo 2

TG MINERALES
TE CROMO
ESTAÑO
HIERRO
LITIO

Esta opción resulta adecuada cuando se trata de descriptores de uso muy


frecuente. Como alternativa a la subdivisión del término podría añadirse una palabra que
especifique más su sentido. Ej.:

DISTRIBUCIÓN DE ENERGÍA
DISTRIBUCIÓN DE ENERGÍA ELÉCTRICA
DISTRIBUCIÓN DE ENERGÍA HIDRÁULICA

4. Inclusión de descriptores de un grupo jerárquico en otro. Por ejemplo, el


descriptor MANO DE OBRA podría figurar en un tesauro en el campo semántico
RECURSOS HUMANOS y pasar, tras la actualización, a formar parte del grupo
jerárquico POBLACIÓN ACTIVA, si se considera conveniente.

5. Cambio de términos sinónimos. Un término considerado no preferente o no


descriptor en el tesauro, pasa a ser preferente. Puede haber descriptores cuyo significado
es demásiado próximo, creando duda al indizador en el momento de su elección para
describir un concepto, o que deben ser incluidos simultáneamente en el momento de la
formulación de las consultas. En ambos casos se analizará la conveniencia de mantenerlos
o de modificarlos. Ej.:

80
Capítulo 2

MANDIOCA
UP Yuca

6. Si se detecta la existencia de términos homónimos, se procede a su desambi-


guación. Ej.:

RAÍZ
TR MATEMÁTICAS

7. Incorporación o eliminación de relaciones semánticas. La inclusión o exclusión


de alguna relación implica igualmente la modificación de su correspondieíite referencia
cruzada: TG-TE, TR-TR.

En la nueva edición revisada deben aparecer los cambios realizados en el tesauro


en relación con la edición anterior. Para facilitar el acceso a la información, independien-
temente de los cambios de denominación sufridos por algunos términos, conviene
especificar mediante notas históricas la fecha en la que determinado descriptor ha sufrido
modificaciones.

Con la actualización surge el problema de la correspondencia entre los términos


incluidos, excluidos o modificados en la nueva edición, y la notación de los documentos
existentes con anterioridad a la puesta al dfa del tesauro. Existen posibles soluciones para
resolver la falta de correspondencia entre las entradas del tesauro y los documentos
indizados:

81
Capítulo 2

1. Acordar la utilización de los nuevos descriptores únicamente para recuperar los


documentos tratados después de la introducción de los mismos en el tesauro, lo que
figurará en nota histórica (NA) junto a cada uno de los términos afectados. En la misma
nota se informará al usuario de los descriptores que existían con anterioridad bajo ese
tópico, con objeto de posibilitar su búsqueda. Este procedimiento facilita la labor de
indización pero dificulta la búsqueda que, a pesar de las notas aclaratorias, resulta más
complicada. Ej¿

MINERALES (CROMO 10/10/97; antes úsese MINERALES)

2. Volver a indizar los documentos almacenados. Esta posibilidad se puede poner


en práctica paulatinamente: a medida que se va indizando con los nuevos descriptores,
se recuperan y actualizan los documentos existentes bajo su anterior denominación.
Aunque esta opción es la menos popular, por el esfuerzo que implica, es quizá la más
correcta. Van Slype” cree necesario evitas, en la medida de lo posible, suprimir
descriptores que hayan sido ya utilizados para indizar los documentos; si esta supresión
es absolutamente necesaria (como en el caso de un descriptor demasiado frecuente) será
necesario reindizar todos los documentos en los que esos descriptores intervienen, para
mantener la coherencia entre el fichero de búsqueda y el tesauro.

Como conclusión de este capítulo podríamos decir que el tesauro es un lenguaje


documental que, por las características señaladas, parece idóneo para la recuperación de
información en bases de datos bibliográficas. En el siguiente apartado vamos a analizar
los primeros pasos de su desarrollo y empleo en España, teniendo siempre presentes las

L7SLYPE O. van. Op. cit., p. 109.

82
Capítulo 2

bases conceptuales señaladas, dado que ha existido y existe la tendencia a aplicar la


denominación de tesauro a otros tipos de lenguajes que no responden al perfil aquí
descrito.

83
Capítulo 3

Orígenes y evolución de los


tesauros en España
3.1. Antecedentes históricos del tesauro

La organización de vocabularios fundada en bases conceptuales es una idea que,


de una u otra forma, ha estado presente en la mente de todos aquellos que se interesaron
en organizar las distintas ramas del saber a lo largo de la historia. Esta idea ha aparecido
en diferentes contextos, para diferentes propósitos, y los argumentos empleados con este
fin, coinciden a grandes rasgos con los planteados en relación con la naturaleza y
construcción de tesauros documentales.

La literatura existente acerca del origen de los tesauros no coincide en la


apreciación de determinados factores como determinantes del uso y aparición de los
mismos con fines documentales. Nosotros nos hacemos aqul eco de algunas de las
principales tendencias en este sentido.

El origen primero del término tesauro proviene de la palabra griega e~a«upo~


con el significado de colección. El latín adoptó el vocablo con el sentido de tesoro y,
posteriormente lo utilizaron las lenguas modernas para referirse, en términos generales,
a repertorio o recopilación de palabras o colecciones de una o varias áreas del conoci-
miento.

La primera persona que utilizó la expresión Ihesaurus fue e] florentino Bruneto


Latini (1220-1294) en su enciclopedia Livre dou Tresór, escrita en francés entre 1262 y
Capítulo 3

1268. En el siglo XV se tiene constancia de su uso por Cirilo de Alejandría en su


Thesaurus adversus haereticus1

Tanto en la Edad Media como durante el Renacimiento la denominación de


thesaurus se restringía a los diccionarios monolingúes, como, por ejemplo, el Thesaurus
Linguae Latinae (1532) (figuras 14 y 15), y el Thesaurus graecae 1¡nguc¿e, de Henri
Estienne (1572).

En España. la primera vez que aparece escrita la palabra thesaurus fue en la obra
Compilado Malor o In excelsis Dei Thesaurus, compilación del derecho aragonés que
realizara el jurista catalán Vidal de Cañellas (m. en 1252).

El Diccionario de au¡orido4es de la Real Academia Española lo define como:


Índice, ó compendio de voces, y términos reducidos de una Lengua á otra2. El Diccio-
nario de Covarrubias3 lo interpreta como tesoro en su más estricto sentido material, es
decir, como conjunto escondido de monedas o bienes materiales.

~LAFUENTECASTAÑEIRA, 1. El concepto de tesauro en España ayer y hoy: 1970-94. Proyecto de


investigación dirigido por la Dra. Emilia CurrAs. Curso de Especialista Universitario en Documentación Pedagógica
1994/95. Facultad de Ciencias de la Educación. Universidad Complutense de Madrid.

2DICCIONARIO de la lengua castellana, en que se explica el verdadero sentido de las voces, su naturaleza
y calidad, con las phrases o modos de hablar, los proverbios o refranes, y otras cosas convenientes al uso de
la lengua. Madrid: En Ja Imprenta de Francisco deJ Hierro, Impresor de Ja Real Academia EspafioJa, 1739.

3COVARRUBIAS OROZCO, Sebastián de. Tesoro de la lengua castellana o española. Madrid: Por Luis
Sánchez, 1611: TESORO. Latine THESAURUS, a graecoonaaupóq4 un escondidijo y lugar oculto, do se encerró
alguna cantidad de dinero, oro o plata, perlas y joyas y cosas semejantes de tanto tiempo atrás que dello no había
memoria ni rastro alguno, ni de quién friese; de donde se sigue tener justo derecho a ello el que se lo halla, como
cosa que no es de otro ni puede decir ninguno que es suyo. Cerca desta materia disponen las del reino lo que se deba
hacer, estando obligado el que halla el tesoro a manifestarlo, y dar al rey la parte le cabe. 2. También llamamos
tesoro el dinero o joyas de un príncipe o de una república que está en custodia, a verbo --código. recondo, repono.
Es hebreo, que tesurah,nn,tt, vale tesoro. Algunas veces significa tesoro el lugar abditísimo [sic: abditissimusl y
profundo, como se enriende de aquel verso del Salino 134: ~Quiproduil ventas de Ihesauris suis, Id es!, de
abditissinús el abstonsis cavemis zerrae Tesoro de duende, suelen decir que los duendes tienen escondidos tesoros,
‘.

y, cuando alguno los halla, volvérsele en carbones, de do nació el proverbio: llzesaurus carbones facti sun!.

86
THESAVRVS
LI VAlE N G
LATINAE
5 E U
CpRQVIPTVARIVlÍ DJCTIONVM El
loqurndifarrnu/arun¡ ornnizsrn att La:ini fcrmonísprrfcclam noririam ;r4?-
quendain pert¡nentrnm :cx ojnirnts auítoritaf co7¡cinnaturn.

1’~

SI
‘e

1
cVM EP.RJ VILE CÍO CJESÁRE2E
TIS ST CHRJSTIAWISS. GAL-
,t Li 42(VM k.EGJS. -

LVGDVNL
Figura it. Thesauru~’ Linguae Latinae ‘- 87
‘E
a A.. a pHntb~ bchinen p.tqn ele-

tu -01
tve-, a. tOfllti.ftiIiti te ÁIpii¿td
f.ó<.
rio.
qn fonoint,azo.ffi01 efl,fl 1.
eterna ja fine. Cieev.jn Oca..
(ptcnJ~J.. ints Colchoritm—
A uf.»..,nontímbu, uflum.nar.. eA
reafus (eJ ptOSLU. •ttquioitut la.
baeis:¿eutdcstnptar reprabibuneis, cfl ;u..n.
qn; prohib.eut v,í.ur.cbs reinr)u.ie. ineer¿a&á tul coetpeer-
re ncta as,nuat. Paulo p¿ft:SI qucí ab ami,... ‘seo wj,aue cUm.ict.
Idas..
<oíd (sil

a.
(aas.fEn,a litera Al. ifni flsrrdé ni roh.i.~.a
A me itaHas a Pedíen («ibisisínd.ttem cus-
it ¿ifni & fr.tila Jitas unes.
suc precariA ab
4 pottdct
eA:quiai en, videmryiía— elmm,vel peerauió :51 4i*at<lht,
ycS&tr.
es ulias hito. la esiusLinee Landieaen..elei.—
q.iah

1 tIcerca
reí .inlát«nfuiE~o,anng..
Cac.,.JcDiuiaSu. .oú,oC.h..
A lItrTafli iiinjtrrlltnt, elisa p.o.
Celjncan¡ouris Asdron..dt¡
neborc meo viejo
píion¿,abdre ji.. jure r.ia
1S4J<.. tire dtddíien. A uit iii ni <A.
(¿mego iloenínías ticen fmaetai,sihi <cistctili .te vii 5*150
e¿e eceení. Ab aseSor. ato ni, celen seichon n.eaíquajutiMÉha¿unnÉ—
A,It:cra noca trae .n fuEeagí¡í 3. co.a.nn lrgum,qiii It riursrfl.u¿iaee ¿í¿íqeihi raen sIam coesicitas.
,erat,nfltd’ ;~~,E~b~ Ab alecro úua..Ylpún.in¡ji. piinc.flflc (espesficiebea.. Alen ah alte-
0r.Nan. iJar .Ini TIbIAS folebanr.quaeum h~ ro Fionia,.. leí tA~aleeio alecel (ruáis,’. eoe.ee¿cncc. -

alicia V. It. íd ti • “e. ros a .,Ienprun crí tasi JI’ Crí A..J cII.Anr.quo, Ab at.quo aqenm desee-re, íd cfi. pee alaisimíLadó it taus Jt.4eidaa
,ntquAftqUOi,ttOUJ no~ Na6cre.vp.an.ie.tj. 1.Deieidc ajepera.fl. .An aqes. q.o,mJ.ana ~
rl’ flh.ui. ve, pr.oeu.ilaeenquaa.q.a de a¡cwur.ncc vj,osc cU.e.,see
cuí ‘era, A • secta 1.6ta,,, a C,erroat jaoraejoar ;‘iO Mitqe.¿J ir
7 úíte Ac~unw.J vdcbaeur íud,c,bus bona cautla.sbIolscbanr red, peecaecó a~.ehIo Juailh.quo menisacea Jeaca. ti— fice, eno,,Jeil • eei
notamquc abiolsríon,t A. tít <can, entibe”., quía rereon atct. alIstas <tandeas ‘o ruta
--3 CuoCeeneba «esatesar fcqeseeiiia Ab aliqeo (obten, Jite, acanale.

t:
-:1 cotwrI,tr,Ikem Ia,cram ea¿rhvi C.c.Aíe.líh.i. Non majá no. ,cne(a.r,fe¿ niel bac jiten •
c.c Colsnc.tJj~¿J «ti.. Pínon¿acecesuifl.c<e.e,quo.usi no mali
mnLlí nota dice. Crr.pro Míl.Qj~¿d osfi vi4.&t.polI’r íblotuj titee
qui (nrenae cún visiere, no.facer. ,otqut qi..W.s.quam is«.Lfe,. meepeíam,fc a a. quaJianasodo las Mac eI.paí ¿e nr.., velda

1
ute’ .obj.raen úluuu¡ca liar un iJieaa¿o berras ja ni tilas ce,- OMS pcoeoo.Cer.Artk7.ep¿Ls4efreimei liban..,.. e,hi pci Jebes,
fiem dcd.fl’ct. .6 l&gnauo Coteac.lJ nlI.fumptaaá Ego... debá.er Ema peesnal
tibe puaren. liJes, peo iliccoiSa PinceJejie ~ n.A (cnp.meá .A 1-
A ,p.n¿tO rol3~oleo,rr:nomen lgn~fitit. A.Crdnna U rfi.Aulut
A (lcue evIiqía herr: )ro firmar inícrílsa’ Cola pr. Cola ¿,a.one culis gauiíaue ea cobiaratA
~ Q~:doet.Aiaqheuquafi
neineawú:OrAo. A Q~.8aee
eeieiiú pubLea: ntnvi~ SUC areepc•s.
ea ved ?. ~--4
nt jmtásm,’t A.A.A..j <A ¿Er:.Aq<ttO, Acta: qeso dc sc~n ter. aneeliige pttuneítet.
pta (.ini gíaffuf.aticis iníqel I.bri. Perl’oleiere ab aLqmn. Cic.Sinieetse.qoJ vobhí (tena,Diese (sp.peo-
a,f.M A tobasciperColucie. - -
A.perpoAíofledt Las,et.»et¿edud ptuíant A Creea r~ro~iane i.¿,¿e.
iranívitima f’yIliba n. R
A b,re.am ende Judas, cízJune.Siquidcts . lien: ‘Ida. elj¿¡rt.r .6 ~, 7r.(n.e.aeevctisetea abaflsqí.a.C¡c. Arte., Rebqes. pnusi ve’
pesfrís ja jo coIIíC.oc.bus vocal,uai:uA cllSeqseeo« ¿itt...,. ivoca. SiLo penicausealea) Iabctia.vclab aLquo,sq,at FaLcee. ¿e.
l,.ncqct¿íc,& remanes... Q~ó¿ 1. itestuCin truene iii 4 (sant nie- br. ,rqra<eocabíentt Oe~s54 .Speeo(oee. ve A bbcno caiga-
d,anthabcbus Abprz.obrioa<fli Licinaen.
A & Ab,pírpoletoieei v,d~eur fact: ca Abs pn¶’o&ioae. Cie,ia Orn.
ralas.
SiLo folsatee ante dicen
e. peaje—es y enmAuin nprrfenscníua.
Vna prrpole.o cli ah,,ciqeac n.a’ ranr.i.n .naccrpíiíaboláamanr,, Su~.dicne ab aI4aoSsr.<aoitaRiallues. S.ampeum% Laazkn reas,..
sic b~s qumdceei on,i,jían.:it rcliq..o feiniosir seeseatí eA. Ni.. Ami.. ÑppeJleas A La,. - -

~oe¿ac,enui.& Abqit. a Ahftglstnaeae&tn,AL’stnttee En~. A caudal. — eairc.PhíIiL4ttipJí. ¡<ph. (raíl. moduasa • babo- -
Abs.Q.~.d C c.i.a Abfuigi íeií7c ‘¿ea rA.& Abite nol.n.oe,A.fer meen. piceaaeborrscausan.. er.r..n..,conu¿c.. A cauda de —
• -. se.atucrut5~Sj: puffo&ic,prnlfl bcduaverba,nsLuleo laverto uoesnquoeiit pondereca~uaé pa.ce~oua ,poGeeionnm pa-
reptd.sri1adcfl.CflfetihdeatflAbtPfl~ttttia~a Ah. sea carpen tcunudia nn inbceot laficuilabes tsn. loe.-
•5i córfIelone Juonua eina vahad. AMarla Abkr. íe,.iea.ti. esonibus jiteadeiuí tiriwínt pnpeteL.. te apuad guajeS 1.64.
~1sagn;e’a¡ sueca pr:pole.onea Abs. Ab,A.cic e effldrotem:idc&p cap3.Nrtonc p..Lbaigtmtm parca asas (ttibitAgeiflI.RA-
-, ~rwune.erh.spatT.nfetn&*tOdiSW aSaeto.. - tu naso.: capar Losesesgs<..tat efl,pedab.n rían. -
• fibs,rdeeur tÉ ea Uwo¿4,astn Yak & ra..2i...~. s, ¡cnt eaetmee* a ~7&iOiina tu alaqe.a.sia.flaJLio.etp.tsa Qr-
gniticae.Ter. A¿$. -ah: qesie.ú boa~e. 1k. Pto.. Vaabs e.ab.> ,.m esyssa 1ipuat.aecmiá (eh col~
Q~.besí autemn Leen. ptp@fli<Uf. c.cesp’o&ao 4n,nAbáoc4ji ¡ea fínua,aLAs ma vra, poned.. --
Abfiaaeo.&C. A saete peildd eBAr.e,senA.tio Sears. CoJuahiWBeeage.f, A si-
Ab & A tr.q.acneiouisAaraevfen. pt.U. te creus puih titean.
Ab conipito’ , A peoJesactir. Ab pfqoflflt ~ .A (oh. Elcpbaneiauper& lylea-lIcr.bb.s.ca,.t, tlepbandhcfloiiitteu.lna &
-con(ut,,s. q~u..e.LI.b.u.cap... Fabe.riu.re5lec i Cjise (e Cpol.ars omaperi (yL..,eaoftetaati (ubico clangorc,&c.
tsíallc.qeiM.i ib bolle itaere. H.cas.s.Sanu .a.Lmuta,u, ah bIs, A hito.. saita alteren. Pisas. Per&. . Cnscie,s& — lilia A It....
.5 culpatair ab JI.,. Van patefi Lic ahlaujns ¡a in~,Grae. .,v mAño ietasj..5aa0 d <oOci&i.pe copad d,&lcaeiapo&C.
-ve scresaoplacue. Vi¡jL&aej¿.í.N9oe ea.itsr,v&ld etab ib. g... n¡i..—.. -. —
A mcii eie.buii ea res u.Júf.a.thanpé,a¿eLOb ciaren h....bt. Ñata. pso$ el.. Tadc bkn,LM¿usM.ds..a,*&e4dicSiua-
aff.-Úus (simiA ceuib,us .ini.. Oca pro hiLo.. Insta. cITequibc. ea ~~~afia,retpeasCbS.fraeuaJu it &cmuaALes-
re,bonoe. Éí.cr,e A (sea eiwbeas Idem pta Libano Podlbs.q....s. —‘ir..
=fl jn,a,nieas fuji non eeM¿ kiuMc.o.fc¿cdi A Itr.flO.,l. Idea Lb.
7.aJ Au.Seaati mm. flaveicfl í..paraeicje A s,jl.nbss..uaea Ap.-
cuita. 1.1cm Iíh..sle Oracaliar cii.. Crasis: iizIfli., p.arsaáper&i. a.gis jeAn glonaÑfs.. -- :. - n -a t -. -

.r con6k,in.& icneeia iilenuinfiúe. Ai4taa.no caLces pepa.. ~Aha.to<efcúbne.5albuiCLúk~Jfrt ~~.dennbI Gribma.


Ljo.ca no. babear. Ptaue. Er¿.;. A morbo nlsi • ah animo estiria tInA diesi cenE no, se ah —«
Li. Idea Curc...Tanii tite píadíca eA.ju.afl ltnoro..a ti. Teten -qvzesoqc. («iba eibjfcíihcre.GaU.e¿ ditiSui.D.rtaíui.eti
-. }iccyra...a, NarrArqise it tirgo i~ ,fen~aceaameiam<¡ci. Oc. Aa. ALafpeAo dcecs’.s:peo cejes.t Cali. ducen..,, ¡esas nn toIum.Lb.
1< Cus Ron: A judicíja Lotus rehi.eric. 84
-tap... Apennisiu• botan le prqtacrn dañEmos, oa¿u.r. ¿.11.
prrcliruíMst -Vidctalske¡s.
• A Piaron. & Ariflotele bomiaca. ~dca, ACádcuki & huiparcdc¡Aoe AbÉbquode(euibCflíCitiib.t
«Acateseoltrlíes,e.ec ab dc¿oroae.
Anle. ¡cci Cícera
Ge ¡albas iii lp.
mé.fc&ee
Ptatonici & Aejflortl.tj • Masones & AoAoeth. dodristj (equcarea.
Ciepro Mur.NoRrI injuanIIU A Piseone & Anfiocele odcrariSo
mistes a ecapcnei.uieane apia ~p.co.ca valer. aliquasdoganan.
Ab uIiqoo lrgarc.Clcpro Cluenno . ltajeac ci ctftaínea.o Irp4graad¿
pt(iftiifli iSuso,Sqid statu. cfictab rícundo bacdcníhil u. IdE -- fi’- -
ad Aedcom libr.e3.cp.js,Cs~eioui Chanuísa . T.Hordnoniolcpr. dic Oceroabid cONet$is ~neis.(cii comité sito. dejA -.
44 &Tcreníir:i.e,,~.&cpukro,iiíuId4uetehei,nihiI a.. - $íticJib.6, Valebsí .gíeur>&.alcre Piláis &CacjhisenoAri*usbc’..
-bislitecis.& úluehea ~ Occeosis.
ntiflnmcrarss,& ad (epe&iUeXt rd.&aa¿oss.m.hAfljn.a. Ame
aiGci,ss. . -- ‘ - -
condidone
lii, Sin ~ua
re, (tampeos ni Houdeoníeuí
fsa1pcdiearn: ‘esbares
r~o vera nibila.eut 1111 <aun e. tea
darcn’tíiiavemeljon A tolecalor.CI..dc Na.dcodih..,Caflina peallo. cien etcedcelu.r; ki -
paine dnráhendum eO. quod Terénúr folias.quo4 ~pJcto mita. -cucr.iurí,e&petuii.4sca*~t,li!AftIgZ¿e1irlmflt<¡d<dOeA
. .irquercbui.h.Uú~orLín;hiL - - kd<;Rdp~onaat >3 -..s,. r ..í± t
adoribu.SafluA4oIogunLJurUtk bc~oaaaiueiV
AhaIiquopoLflJcte.YIr.ietLi.IAD.Vd poffe.¿ceis.Q~odaisPrnoria
ineeídidu.,Ncc vi, nec el.—, ncc percín& aMe. Ib altero pollUndui • qeosirses fsufluaecskelerseiLflisl. eonecmjro ia.peuionfirosíMaG-
-. ~.oceA pertanet,tt fi qc¡~ pollidesvi..... elam,aut prccaíi&6quiJos .~<acanrú~áin.AAi
ah .b.roSe ci po«cúie.J¡verá ah aje.crtar,oÑa, no. debas cta 7
tis~iuin aeqise.mkumpopta&Rr
tmáptlit; Gsllie&D.,sr.v;,
$ A ¡jrpe,proftirpflat&áqUdte~pí.I.at*I>d.)i$t&Éqía¡¿cluiÑbOíu’»4 - - -- — - - - -- .-
s.orl’um lo ineeidillo:fi verá non Am~.ñesecr noftnaw v’íaec,.r. eaiisaiííioneenclirbñ&flurPctubiieocfft 4-; iav- -n¿’’.:. e. - - ,. - .-¿
& fidís reto Ajaba. t&,vfrortfrt~ant ¡ca i alsqu. loiti!
míe, a rupoltedee, A ego. Abaljopoffidcrcvi.áoeclmm,aur pece.- Ah searofuIgore~ reejercrtL.aertt.Iib.kiíí ‘~ - - --
• siA,eA potleflionem vtsrpa«een altee’j ame vi,mue cflm.aue precaria. - - Aiaaa¿sqfl iftnruer,ren niqoepoecsitS -e:. Y

IdeA .cja. ah.. p-oLflJcrcegea iIIw’.pofleffione ¿eictjft¡ auevi.aac Vcr&ottr.ttemttfta<OtFZAflmUCt Abane, - --
elL.i,aw peccarió. - -

Dictiorwrium seu Linguae Lat%nae Thesaurus

-u - . - -- - 4- - ~.~tti
- Figura 15
Cap!tulo 3

El Shorter Oxford English Dicrionary ofrece en 1736 [a siguiente definición del


término: un tesoro o depósito de conocimiento, como un diccionario, una enciclopedia
o similar. El diccionario de la Real Academia Española lo delimita en términos
parecidos: tesoro, nombre dado a algunos diccionarios, catálogos, antologías, etc.

Aunque el uso de la palabra thesaurus tuvo diversas interpretaciones, -casi todas


coincidentes con su consideración como repertorio, diccionario, compendio de términos
o vocabulario- durante los siglos XVII y XVIII muchas obras litúrgicas llevaban esta
denominación. El diccionario enciclopédico Espasa4, se hace eco de dicha utilización con
la siguiente definición: Muchas obras de erudición profana y eclesiástica llevan este
título, unas son diccionarios, otras colecciones de disertaciones o escritos de autores
diversos. Se relacionan con la liturgia:

10. Bartolomé Gavanti, Thesaurus Sacrorum Rituum, cuya primera edición fué publicada
en 1628.

20. Suicer, Thesaurus eccíesiasticus

30 Mart6ne y Durand, Thesaurus novus anecdotorum (Paris, 1717). Se trata de una

especie de complemento a la Patrología. Contiene importantes textos de escritores de la


Edad Media relativos especialmente al monacato.

40 Antonio Zaccaria, Thesaurus theologicarum disertationum (Venecia 1762).

4ENCICLOPEDIA universal ilustrada europeo americana. Madrid: Espasa Calpe, 1928.

89
Capítulo 3

5<) A. Daniel, Thesaurus hymnologicus sive hymnorum, canticorum, sequentiarum circa

anuum MD usitatorum cohecho amplissima. Carmina coItegil, apparatu critico ornavit,


veterum interpretum notas selectas, suasque adiecit. (Halis, 1841-56).

6<). Voldebing, Thesaurus commentationum (Leipzig, 1884).

Pero el uso de la palabra thesaurus para referirse a diccionarios de sinónimos


parece ser, en definitiva, el que establece mayores conexiones con su futuro uso en
sistemas documentales, por lo que, para analizar la evolución histórica de este lenguaje
documental, será conveniente proceder al examen de tales diccionarios. De hecho el
control de la sinomimia, así como la agrupación de palabras relacionadas, ha estado
siempre presente en la mente de los compiladores de vocabularios generales o
especializados y, por supuesto, es una de las características a destacar de las primeras
clasificaciones bibliográficas y de las listas de encabezamientos de materias elaboradas
a finales del siglo pasado.

iones5 considera relevante el tratamiento de la sinonimia lingúistica en la historia


de los tesauros, así como en vocabularios organizados en base a la agrupación de
palabras relacionadas. La más antigua ypersistenteforma de cías(ficación del vocabulario
-dice esta autora- es el thesaurus cuya finalidad es contribuir a la descripción del
lenguaje y a servir de ayuda en su uso. Añade que la clasificación por materias de
vocabularios, la agrupación de palabras relacionadas, se remonta al Sanscrit ,lrnera
Cosha, al clásico Onomastikon de Pohlux, y al Aelfric ‘s Anglo-Saxon Latín Glossary. En
el Onomastikon, las palabras, incluidos los sinónimos, se agrupan bajo diez encabeza-
mientos como Dios, el Hombre (panes del cuerpo), Ciencia y Arte, Caza y Comidas. En

5JONES, K.S. Sorne thesauric history. Aslib Proceedings, y. 24, n0 7 (1972) p. 400.

90
Capítulo 3

Aelfric las palabras están organizadas bajo encabezamientos tales como Herramientas
para la Agricultura, Ocupaciones, Insectos, Ropas y Bebidas. Existe, en esta forma de
presentación, un notable paralelismo con los tesauros documentales, que agrupan
semánticamente la terminología que los compone.

En 1816 Crabb editó su English Synonymes Explained in Alphabetical Order with


copious ilustrations and examples (figura 16), que fue el primero en expresar la
información no sólo en forma alfabética sino adoptando un orden conceptual. Esta forma
de presentación le convierte en precursor del Roget ‘s Thesaurus of English words and
pirrases, que, tradicionalmente, se considera precursor de los tesauros destinados al
tratamiento de la información en sistemas documentales.

Peter Mark Roget nació en 1779, y en 1848, ya retirado de su vida profesional,


se dedicó por entero a la tarea de preparar, para su publicación, la obra que perpetuaría
su memoria. Se trataba de un catálogo de palabras organizadas según sus significados.
en cuya compilación había estado trabajando desde 1805. La primera edición apareció
en 1852 con el título Tiresaurus of English words and Pirrases Class¡fled and Arranged
so as to Facilitate tire Expression of Ideas ami Assist in Litera¡y Composition.

El Tiresaurus de Roget no es, por tanto, un simple diccionario de sinónimos, sino


una clasificación ideológica del vocabulario. Se caracteriza, fundamentalmente, por la
forma de presentación de sus entradas. Hasta su aparición, los diccionarios organizaban
las palabras en orden alfabético, a excepción, como hemos mencionado, del Englisir
Synonymes Explained in Alpirabetical Order, de Crabb. El Roget’s Tiresaurus crea una

cadena de sinónimos que forman categorías conceptuales, presentando las palabras de


acuerdo con las ideas que expresan .~.. la palabras y frases del lenguaje están aquí

91
ni
-. ~x:s a
e
•Ii
ji
dg [~-e ~
oj
e
o
me —
~ ~ii ji
iii ‘3
a,
3~
~
‘>
U
4>
54
4-)
E-. 4 ‘ea
t 1. o,
t; ~
‘st’>
•<
~4 ~a.a a-
~
£¡~
‘a
—1 a-
.4
tu
5..
b.
£4

.r4
o,
< o
-4 o
-4
4
32a~<. o05
‘e
~-r
k
1
e,
~
~ r !iil d;’j4
go
E-
z
u,
-
~~Ut-~i
-,
~~~? ‘-‘0’ ¡ ~ t o
5”
g:]
u
u
-<

~— —
w
-“>-
~va
— O— —
tfl
el t
o
•;‘ teZ
z
‘4
~II ~
eal
1
~ II L~. ~-.s
- 4-)
2’ a>
U
U
—‘
u
1
-a-.
u

‘it>
~ ~ .0
-e
o.
‘-4
e
r4
1 a’ 1 o
e
ej
E
•-

21
~o
-. tÉ ÍU a2 jfi~
~8

¿jN’5 ¿
£~ ~r i¡ 1 -~
1~ -~0’ — a
to ¡~;
~r.a u
10 es
‘< E,i~
~i.i
~I ‘4
1.~
£~~4>
cli -— i-~’~ e:
u, -.
e~ Co
U-.,
u
u
-1 -E-’
£44>
0<
o
Capítulo 3

clasificadas, no de acuerdo con su sonido u ortografia, sino estrictamente de acuerdo con


su signzficacion6.

El diccionario se compone de un índice alfabético que recoge todas las posibles


acepciones de una misma palabra, y de un índice que agrupa los vocablos por categorías
semánticas, (figuras 17 y 18) organizándolas además en función de su morfología. La
localización de un concepto en el Tiresaurus se realiza en dos etapas. En primer lugar,
se busca en el índice una palabra que describa determinada idea y se elige la entrada cuyo
significado se aproxime más al concepto deseado. Por ejemplo, si se desea información
acerca de la palabra game, en el índice alfabético aparece:

game

n. animal life 414.1


cards 878.35
contest 796.3
fun 878.2 -

influence 172.3
intrigue 654.6
laughingstock 967.7
meat 308.12
objective 653.2
plan 654.1
quarry 655.7
sport 878.9
stratagem 735.3
vocation 656.6
word list 878.34
y. gamble 515.18
adj. bold 893.18
crippled 692.32
plucky 624.14

ÓROGET PM. Roget’s International Thesaurus. 4É cd. revised by Robert L. Chapman. New York [erCí:
Harper Collins Publishers, 1977, p. X.

93
44-7 583.1 — 585.1
eu:etác. dcri~’at iúéi.tl . affex,cl, prc’fixal, en- .12 misnaene, n,isrcomer, miscalí, eccistcreee,
en isdesigna te.
fiNal, ser lux-jI.
.13 be called, be known by or as. go by, go
583. NOMENCLATURE as, go by dxc name of, go nr pass render
.1 NO Li NS el <>encnclj1 cite, 1 CrininoIogy. oris. tIce naene of, bear dic mufle of, rejolce lee
¡cio]e>gy, glosseílogy tarc-li~iicl; OnO,n:etol— tice reame of; go under an assuencd o’
ogy, OIlOIliJStC es; topoiiyeiiy, pla ce-nain es, false narre, have an alias.
placc-cíaeiiiiig; :ieit<>ii<>eecusia; polyonymy; .I4ADJS named, called, yclept larchaicí.
Iaxonorny, classjficatio¡í, systeneatics, bio- styled, titíed, denominated, denomínate
systcena ty, bíosystcíííat¡cs, cytotaxoeíomy, [archale], knowei as, known by [he name
l,icíorni;cl uocnccícl’aturc, bínoníialiseu, of, designated, termed, dubbed, identí-
Lin¡,ac-jn ¡¡¡elliod, triemoenialisen; king— f[cd as; christened, baptized; what one
dom, ph ylueeí, class, order, fa eeci ly. gen us, may well o, fairly or properly or fitly calI.
5 pCC ¡eS. .15 nominal, cognommnal; titular, in name
.2 ‘caen[ng, calI, r~g. denone [ciaIon, ;eppcl -a- only, nommnative, formal; so-called, qecase;
tinte, <Icsíg¡c;etíoee. stvlíeeg, tcrieeíeeg. deben— would.be, soi-disant tEr); selE-called, self-
títece, ítleeettfic:etíí,e¡; clirisleeeiecg, I>apteseee; styled, self-christened; honorifie; cpítlect-
~Iuhh¡eeg; eeickec:eee¡íeeg. c(al>; hypocoristic, dímiucutive; by carne,
.3 ceanie, oen¡eeeato—, —oelyeee, —oeeyeeey: appel— by wlíatever narre, tender aecy othcr
latiorí, c~~pelIatíve, dcecoucin-al ion, dcsig— fla me.
nation, sLylc, ceo creen L~, cogeeomen, cog- .ládenommnative, nominative, appellativc;
ieoeic¡ecicti<>ee; pre~per ec;eleec Gr miGuel; enoní• eponymous, eporíymíc.
ker or lc;eeeclle Ibotie sl-aeíg]; tille, .17 tenninological, nomenclatural, orismo-
hoeeori fíe; ciii~, [y titíú or naene; labe!, tag; logical; onomastie; toponymic, topony-
epilleel, byword; sc,c,ctíf¡c ¡lame, trino- mons; taxonomie, classificatory, bicco-
mece, trmneceeeí-al encece, buecoeeít-n, bínoeníal mial, Linnacan, trinoenial.
nance; i nne eec u uducee, líypon yní; tau t-
onycíc; lypoecyeee; eeeuddlc elaecee; cponym; 584. ANONYMITY
names;eke; sccret ecarece, cryptonym, eno- .1 NOUNS anonymity, anonynlousness,
nyní. cxamelessness; incognito; anonym.
.4 firsí líame, forcee;e1 ne, Clerisí[a¡1 flarne, .2 what’s-its-ícame o, what’s-his-eíaene or
given name, bícptisecc;cl enluce. wlíat’s-his-face o, whats.her-ríame o,
.5 surname, lasí nance, faenily cíarne, cogno- what-you-may.call.ií nr what-you-m-ay-
men, byee;eímec; maiden ecame; married calI-em nr what-d’ye-call-em or what-
¡larDe; pitroiiyieeíc, eicatroeeyecííc. d’ye-eall-it ce- whatzit [ah informal]; ¡e ¡le
.6 (Latín ternes) praenoníecc, ‘lomen, ogno-
sais quoi <Fr], 1 don’t know what; such-
mere, cognomnen. and-such; so-and-so, certain person, Mr.
.7 nicknarue, sobriquel, byreame, cognomen; X; you-know-who.
pet name, diminutive, lcypocoristic, affec- .3 AO¡S anonyníous, arlon.; naiiieless, UU
tionate clame. named, unidentified, undesignated, un-
.8 alias, pseudonym, anonym, assumed specified, innominate, without a narre,
nance, false or fictitious name, nom de unknown; undefined; unacknowledged;
guerre [Frí; pen name, ¡loen de plume; incognito; cryptonymous, cryptonymec.
stage narre, nom de theatre [Fe), 0oe,profes-
Rich-
sional ¡lame; John Doc, Jane 585. PHRASE
ard Roe.
.9 misnomer, wroecg llame. .1 NOUNS phrase, expression, locution, ut-
.lOsignature, sígn manual, autograph, Icaud, terance, usage, term, verbalism, —logy or
John Hancock línformal]; mark, mark of —logia; word-group, construction, ende-
signaturc-, cross, clíristcross, X; initíais; centric construction, headed group, syn-
subscription; countersígnature, counter- tagm; syntactic structure; noun phrase,
sigrí, counterneark, counterstamp; en- verb phrase, verb complex, adverbial
dorsemeect; vísa, visé [Fr]: monogram, ec~ phrase, adjectival phrase, prepositional
pher, devíce; seal, sigil, signet. phrase; clause; sentence, period, periodie
.11 VERBS ¡lame, deeíominate, ¡cominate, des- sentence; paragraph; idiom, idiotism,
ignate, calI, term, style, dub; specify; de- phrasal idiom; turn of phrase ce- expees-
fine, identify; tille, entitle; labe), tag; sion, peculiar expression, manner or way
- nickname; ebristen, baptize. of speaking; set phrase nr teten; conven-

Rogets Thesaurus 94

Figura 17
09$ naln abaut — nonmetal

sound 450.1 nonacconcplishment noncomplianct none of your business


failure 725.1 disobedience 767.1 238.10
television receptiotl nonconformity 83.1 nonesseelteal
noc,achíevement 723
- unie,ttlligibihty 549.7 ci. accessoe-y 6.2
nona dheeec,t nonobseevance 769.1
~,. be eloi7 453.8 adj. accessory 6.4
incoherent 5L4 refusal 776.1
sound 4 14 nonobservant 769.5 reoncoscpliant 769.5 circuenstantial 8.7
»oiseabout 559.10 nonadndmioec 77.1 comri mecltu irrelevant 10.6
noise¡eS 451.10 nona ge needless 669.10
ibisemater 453.5 - immatmity 124.3 nonconducting 342.33 superfluous 663.17
noisc reine 99.5 nonconductoe 342.13 unimportant 673.15
1ProOf 159.18 nonconformiiig nonesuch marvel 920.2
453. 13 flonagenflan
nocsorcee bad 675.9 ninety 99.7 disobedient 767.8 odd thing 85.5
-. harmful 675.12 oíd man 127.2 dissenting 522.6 the best 674.8
cnalodorous 437.5 zconaggeesion 803.4 - nonobseevant 769.5 nonetheles
offensive 864.18 flOnafftesOfl pact ueccompliant 83.5 anyhow 657.12
nonconformist not’withstandielg 33.8
- unhealthful 684.5 -
noreexhtence
nonagrcssivC ci. dissenter 522.3
t unsavory 429.7 -
absence 187.1
colsy blustering 911.4 indolent 708.18 edcentuic 474.3 -

ucibelligerent 803.10 heretic 1025.5 nonsubsistence 2


loud 453.12 nonexestetct
-Vvociferous 459.10 nonalcoholic 997.4 misfit 27.4
nonalcoholic bevecage odd person 85.4 absent 18710
308.48 original 83.3 imaginary 535.19
70 1~yflin& matíer nonsecbsistent 2.7
¡¡ornad - no naligo cd rebel 767.5
independeelt 762.21 adj. individualistic vanished 4-47.4
n.Bedouin 274.4 neutral 806.7 27.9 nonexpectant 540.9
wandecire reonaligned nation- nonuniforin 18.3 nonfactual 535.21
no.cnan’s-land 802.2 counhy 181.1-- opposiclg 178.8 nonfeamecce
no eieattee 673.22 íeidependent 762.12 nonconfonnit1 en ¡3ma ¡lagefilent
no matter what noeuligncneect 806.1 7 34.6
by no mean! 524.9 nonattendance 187.4 difference 16.1 neglect 534.1
whatevee 79.6 ceonattendant 187.10 dísobedience 767.1 nonaccomplishment
cocee de pluene 583.8 ceonbcliever 1031.11 dissent 522.1 723.1
— ¡comen narre 583.3 nonbelievic’g 503.8 eccentricity 474.1 nonobsec-vance 769.1
elonbtlligtftnt 803.5 extraneous¡leSS 78.1 sin 982.2
Roman name 583.6 nonfertile 166.4
É nomenclature 583 nonbecakable 359.5 inconsiste¡lcy 27.2
nOiniccal nonce,the 120.1 indívidualíty 80.1 nonfiction 602.10
nance .t’ord 582.8 noncompliance 83 nonflammability 332.1
re. naun 586.5 nonflarnrccable 332.9
adj. cheap 849.7 norechalance nonobservance 769.1
~pramenatical 586.17 apathy -856-4 nonuniformity 18.1 noccfulfillmecct
inexcitability 858.5 pCrVCflCneSS 178.1 insufficiency 662.1
ccc ¡carne only 58315 nonaccomplish ment
nominal charge 849.2 unconcern 636.2 unorthodoxy 1025.1
1nommnalism 80.1 nonchala,ct noncoectagious 813.10 7 23.1
ccominally apathetic 856.13 ccoeicontiguóeis 49.20 nonobservaelce 769.1
uneoneerned 636.7 noeccoreveegent 218.6 nonfucectional 669.14
cheaply 849.10 noeiCoOpeTatiOfl - - nonhuncaec 85.15
1 (alsel~ 616.35 uecexcited 858.15
¡lame y 80.18 nonchalantíy disaccoed 795.1 clonimulatios 23
- nominate calmly 858.18 disobedience 767.1 cioninfectioces 813.10
uexcorecernedly opposition 790.2 noninteliectual 477.14
636.10 resistance 792.1 no reja tedetence
cconcoherecct 51.4 noncooperative. freedom 762.9
le po¶iúcaíly noncohesion 51 insubordinate 767.9 neglect 534.1
744.41 noncohesivé opposing 790.8 politicalpolity 744.4
¿ nomiceated 637.26 incoherent 51.4 resestant 792.5 noninterruption 135.2
se@añte 49.20 noncecative 166.5 nosiintervention
nocnination avoidanee 631.1-
appointnlent 780.2 noncocce 749.19 nondcnomisatioccal
- choice 637.8 - noncombatant noecsectarian 1020.26 freedom 762.9
eonseCratíon 1037¿10 ci. nonbelligerent universal 79.14 political policy- 744.4
political noeteirlatlon 80 3.5 econdcscript noecintoxicating 997.4
744.11 adj. unbefligerent fonnlns 247.4 noni¡wolvéniecct
ñOmireatiVC - 803. 10 simple 902.6 - - avoidance 631.1 -
ci. case 586.9 noncommissioned ecoredutiable 846.18 inaction 706.1 -- -
adj. naming 583.16 officer norte -. neutrality 806.1
enlisted man 800.8 re. ¡mt a oree 2.3 non.Jew 1025.6 -
nominal 583.15 nonliving 382.5
¡comineé 780.8 sergeant 749.19 adv. not ata!! 2.11
no more dead 408.30 supervisor 748.2. cconelastic 35612 nonliviicg matía 382.1
extínct 2.10 noncomeeiittal 895.8 nonemotional 856.9 nonmalipcant 67410
noncocnmitted 806.7 nonentity - nonmandatocy 622.7
« pafl ¡19.7 ecosimedical therapisí
• - vanished 447.4 noncoeñm enlabie a nobody 67 3.7
non(a)— 99.21 icidescribable 920.13 mediocnty. 680.5 688.12 ‘--- — --
no elaccepta ncc uninipartable 813.10 ecoexexistenct 2.1 nocimedical therapy
refusal 776.1 c,oncocnpetitive 786.5 thing of na~ht-4.2 689.3 -. -

nosccompletiOfl 723.1 weakling 1 .6- nonmetal 383.3: -


V- rejectiore 638.1

Rogets Thesaurus 95

Figura 18
Capítulo 3

Si elegimos la acepción sport, pasamos en una segunda etapa a buscar, mediante


el código que acompaña a dicha entrada en el índice alfabético, 878.9, en el índice
clasificado del thesaurus el mencionado concepto, acompañado de todos sus posibles
sinónimos y asociaciones de ideas. El código 878 corresponde al campo semántico
amusement, que engloba al concepto deseado:

878.9 game, sport 87834; play; contest 796.3;


race 796.12; event; meet; bout; match; go
[informal]; singles, doubles; twosome,
threesome, foursome; double-header;
pentathlon; play-off, runoff; games
of chance 515.8.

El Tiresaurus es fundamentalmente un útil para la transformación de ideas en


palabras, principal objetivo con el que Roget lo concibiera, tal y como el propio título
original de la obra expresa ... para facilitar la expresión de ideas y servir de ayuda en
la composición literaria.

La ventaja de este tipo de diccionario sobre los ya existentes estriba en la


posibilidad que ofrece de expresar diferentes aspectos de un concepto determinado, que,
en definitiva, es el principio que determina el establecimiento de relaciones semánticas
entre los elementos componentes de los tesauros documentales.

Wall considera que las siguientes características del Roget’s Thesaurus:

1. Conecta idea-palabras con palabras del texto;


2, Las idea-palabras están clasificadas;
3. Presenta en un índice alfabético todas las palabras que componen el tiresaurus,

96
Capítulo 3

se mantienen en el concepto de thesaurus para la recuperación de información:

1. El ihesaurus documental une palabras-clave o palabras codificadas con


palabras del tato;
2. Las palabras clave están clasificadas;
3. Tiene un índice alfabético con todas las palabras que lo componen.7

Estas características, a diferencia de los lenguajes documentales convencionales


(listas de encabezamientos de materias, sistemas de clasificación) permiten fácilmente
enviar al indizador y al usuario de las palabras del texto y las empleadas en la pregunta
de recuperación, a las palabras clave.

La organización alfabética del Roget’s, con sus referencias de véase que reenvían
los términos específicos a términos genéricos, la diferenciación de sinónimos y la
organización jerárquica de sus entradas, permiten un control del vocabulario que hace
posible considerarlo no sólo precursor de los tesauros documentales sino que incluso
podría ser utilizado en la actualidad como herramienta de control terminológico en
recuperación de información.

En otros países se publicaron diccionarios inspirados en la filosofía del Roget’s.


Diez años después de la aparición de este thesaurus, en 1862, se publicó en Francia el
Dictionnaire analogique de la langue francaise8, con sus mismas características,
preparado por Boissiére. En España se tardó más en realizar una obra parecida. Julio

VICKERY, B.C. Thesaurus a new word in documentation. Journal of Doenmentation,


- y. 16, n0 4 (1960)
p. 187.

8BOISSIÉRE, P. Dictionnaire analogique de la langue fran~aise, Répertofre complet des MOTS par les
IDÉES et des IIDÉES par ¡es MOTS. Paris: Aug. Boyer et Ce., Libraires-Éditeurs, 1862.

97
Capítulo 3

Casares fue el responsable de la elaboración del Diccionario ideológico que responde a


los principios de organización conceptual del léxico. Dicho diccionario, cuya primera
edición apareció en 1942, tiene como principal finalidad la de poner a disposición del
lector, mediante un inventario metódico, el inmenso caudal de voces castizas que, por
desconocidas u olvidadas, no nosprestan servicio alguno; voces cuya existencia se sabe
o se presupone, pero que, dispersas y como agazapadas en las columnas de los
diccionarios corrientes, nos resultan inasequibles mientras no conozcamos de antemano
su representación escritas.

Para alcanzar dicha finalidad se procede a una sistematización del vocabulario,


reuniendo en grupos conceptualmente homogéneos cuantas palabras guardan relación con
una idea determinada. El lector que examine cualquiera de estos grupos no sólo se dará
cuenta fácilmente del alcance de este trabajo, sino que quedará sorprendido al ver la
enorme riqueza de medios expresivos a cuyo uso nunca pudo tener acceso. (Casares.-
1977, p. XJH)’<).

La parte nuclear del diccionario consiste en la organización del léxico en una serie
de grupos de afinidad semántica, ordenados alfabéticamente por la palabra que les sirve
de enunciado o cabeza. Esta disposición es la que le da la capacidad de inducción,
característica que comparte con los tesauros documentales. A dicha característica se
refiere el autor cuando escribe acerca de la necesidad de crear, junto al actual registro

por abecé, archivo hermético y desarticulado, el diccionario orgánico, viviente, sugeridor


de imágenes y asociaciones, donde, al conjuro de la idea, se ofrezcan en tropel las voces,
seguidas del utilísimo conejo de sinonimias, analogías, ant(tesis y referencias; un

9CASARES, J. Diccionario ideológico de la lengua española: Desde la idea a la palabra; desde la palabra
a la idea. 2É cd. Barcelona: Gustavo Gili, 1977, p. xm.

‘<)CASARFS, J. opus ch., p. XIII.

98
Capítulo 3

diccionario comparable a esos bibliotecarios solícitos que, poniendo a contribución el


índice de materias, abren camino al lector más desorientado, le muestran perspectivas
infinitas y le alumbran fuentes de información inagotables...”

Actualmente se sigue utilizando el vocablo en latín y en castellano para referirse


a diccionarios lingúisticos, así como de sinónimos e ideas afines, tanto en España como
¡2

en el extranjero

3.2. Tesauros documentales

Aunque un tesauro’3 como el de Roget y un tesauro documental no siguen los


mismos propósitos’4, ambos confluyen en un objetivo: evitar al usuario tener que pensar
en todas las palabras que puedan expresar una determinada idea. El Roget enfoca esta
ayuda al campo de la creación literaria, y los tesauros documentales, hacia el ahorro de
tiempo y ayuda en el proceso de recuperación de información, ya que las palabras con

“CASARES, J. Nuevo Concepto de Diccionario de la Lengua, y otros problemas de Lexicografía y Gramática.


En: Obras Completas. Madrid: Espasa Calpe, 1941, tomo y, p. 118.

‘2Por ejemplo, en ediciones recientes de estas obras: Mega tbesaurus: Sinónimos, antónimos, parónimos e
ideas afines. Barcelona: Sopena, 1994.

‘3Aunque el término thesaurus es de uso universal, nosotros optamos aquí por la denominación española
tesauro, que es la que se emplea de forma generalizada para referirse a los tesauros aplicados a la documentación
desde la publicación de la norma española UNE 50-106-1990.

14A. GARCIA GUTIÉRREZ delimita las diferencias entre tesauros lingúísticos y documentales en el trabajo:
Los lenguajes documentales. En: Fundamentos de información y documentación, comp. López Yepes, J. Madrid:
Eudema, 1990, p. 327: l...1 un tesauro no se corresponde con lo que entendemos por diccionario estrictamente, a
pesar de sus semejanzas, por dos motivos: 10 Los diccionarios se elaboran gracias a unos procedimientos
provenientes de la Lexicografía, y no es objetivo de esa disciplina el establecer relaciones de diversa índole entre
los términos que forman parte de su estudio. [...I Un tesauro no define los términos que recoge, excepto en las
ocasiones en que existe ambigliedad y con fines puramente delimitatorios y prácticos. 20 A nivel estructural, un
tesauro tiene múltiples formas de representación por lo que, en una fórmula definitiva general no puede concebirse
como diccionario, lista, etc, Los índices anexos a los tesauros pueden tener mayor relación pero la existencia de
descriptores compuestos elimina toda similitud.

99
Capítulo 3

significados similares son potencialmente sustituibles en la búsqueda.

Históricamente, el concepto de tesauro en relación con el almacenamiento y la


recuperación de información se desarrolló como consecuencia de la última revolución
industrial.., que nos inundó de todo tipo de documentos’5 y con la aplicación de la
automatización a dichos procesos (aunque un centro de documentación puede utilizarlo
sin necesidad de mecanización, permite su integración en un sistema automatizado). El
thesaurus corresponde a la verdadera explosión de información y la revolución de la
informática. Su organización y su estructura reflejan la complejidad de los datos a tratar
y sus interrelaciones’6.

Corrían los años finales de la década de los 40 cuando se empezó a pensar que
las claves para determinar y clasificar [los documentos] debían ser precisamente las
propias palabras con que se expresaban. Surgieron así las palabras clave, piedra angular
de un nuevo sistema de clasificación’7.

En 1947 Mooers, con cieno grado de confidencialidad, hacía referencia al uso


de un thesaurus en asociación con un sistema de recuperación mecanizado’8, y en 195 1
Taube sentó las bases de la postcoordinación en recuperación de información con el
desarrollo del sistema uniterm. Como un primer paso, se adopté como palabra clave una

‘5CURRAS, E. Tratado sobre Ciencia de la Información. Rosario (Argentina): Universidad Nacional, 1996,
p. ¡61.

‘6GUINCHAT & SKOURI. Guide pratique des tecbniques documentafres. 2 y. Paris: EDICEF, 1989, p.
127.

‘7CURRAS, E. Op. cit., p. 162.

‘8ROBERTS, N. The pre-history of the informacion retrieval thesaurus. Journal of Documentation, y. 40, o0
4 (1984) Pp. 271-285.

Loo
Capítulo 3

sola palabra. Esofue el origen del Sistema Uniterm... Casi simultáneamente en el tiempo
se construyó el sistema Zatocoding, en el que las palabras claves designaban conceptos
y éstos se podían expresar por una o más palabras’9. Wall20 atribuye a Luhn el origen
del tesauro utilizado en el campo de la documentación, el cual hizo pública, antes que
nadie, la idea de que un tesauro podría dar la posibilidad a una máquina de pasar las
palabras formuladas en las preguntas a palabras clave.

En relación con los mencionados descubrimientos hechos por Taube, Mooers y


Luhn, en el campo de la recuperación de información, Izquierdo Arroyo y Moreno
Fernández escriben:

Estas tres personalidades, además de revolucionar las técnicas de indización,


pusieron los jalones teóricos y metodológicos que permitirían la creación y uso de los
thesauri en la década de los 60. El nacimiento delfichero invertido -Taube-, gracias al
cual es posible acceder a la información de manera directa y no secuencial, la
combinación de términos en la búsqueda, la indización por conceptos y el empleo de
índices permutados, son otros tantos pilares sobre los que se orientan los modernos
sistemas de documentación y los thesauri •21•

Luhn sugirió la idea de elaborar un diccionario de nociones, ésto es, de agrupar


palabras de parecido significado en familias de conceptos. Aplicó esta idea en 1951
utilizando un ordenador para registar listas de palabras, provistas de referencias cruzadas,

‘9CURRÁS, E. Op. cit., p. 162.

‘o
- WALL, E. tnformation systems. Chemical engineering progress, y. 55 (1959) pp. 55-59, cit. por B. C.
VICKERY: Thesaurus-A new word in documentation. Journal of flocumentation,v. 6, n0 4 (1960) p. 185.

21IZQULERDO ARROYO, i.M. & MORENO FERNÁNDEZ, L.M. Listas de encabezamientos de materia y
Thesauri en perspectiva comparada. Documentación de las Ciencias de la Infomación. n0 17 (1994) p. 292.

lo’
Capitulo 3

que después empleaba para indizar automáticamente por materias. De la fuente de


inspiración de este procedimiento dió idea el propio Luhn cuando escribió en 1957: Ésto
es tan similar al trabajo requerido para la creación de un thesaurus como el Roget ‘s, que
la organización básica de tal obra parece servir como esqueleto para este proceso... El
resultado físico puede ser un diccionario en dos partes. La primera parte sería una lista
presentada en algún orden sistemático de familias de nociones, cada una de ellas
identificada con un símbolo tal como un número o una palabra clave. La segunda parte
sería un indice alfabético de las palabras del texto que aparecen en la primera parte,
dando la palabra clave de una o varias familias de nociones de las cuales la palabra
22

dada [del texto] es miembro -

También en 1957 Bernier y Heumann23 propusieron el uso de un tesauro para


organizar el vocabulario en sistemas de recuperación de información. La propuesta tenía
como principal objetivo ayudar al usuario en el proceso de búsqueda, quien podía,
mediante el tesauro, conocer qué palabras clave utilizadas en un sistema respondían a sus
necesidades particulares. Bernier y Heumann concebían el tesauro como una compleja
red de relaciones entre palabras, con una complicada estructura de referencias cruzadas.
Ellos fueron los primeros en introducir el concepto de término preferente y término no
preferente.

Según Vickery2t la primera vez que se hizo referencia públicamente a la palabra


thesaurus en conexión con la recuperación de información fue el [4 de Mayo de 1957 en

22
LUHN, ¡-IP. Auto-encoding of documents for information rerrieval systems. Modern trends lii
documentation. Cambridge: Pergamon Press, 1959, pp. 45-58.

23BERNIER, CL.; HEUMANN, K.F. Correlative indexes 1111: semantic relations among sermanterms -the
technical rhesaurus. American Documentation, ci o 8 (1957) PP. 211-220.

24VICKERY, B.C. Op. eit., p. 181.

102
Capítulo 3

una comunicación presentada por 1-lelen Brownson en la Dorking conference on


class<fication, en donde sostiene que el problema [de la recuperación de información],
como algunos investigadores han visto por fin, es transformar los conceptos y sus
relaciones, que aparecen expresados en el lenguaje de los documentos, en algún lenguaje
más normalizado, con sinónimos controlados y estructuras sintácticas simpl<ficadas...
Cuanto más avancemos en la mecanización de las técnicas de traducción del lenguaje
normal en un lenguaje manejable mediante ordenador, más probabilidades tendremos de
poder realizar búsquedas automáticas de información a gran escala... [Algunos
investigadores] han ideado que la mejor solución puede ser la aplicación de un tesauro
automatizado basado en redes de términos relacionados de mayor o menor amplitud.25

Las mencionadas innovaciones incorporadas al campo de la recuperación de


información: sistemas uniterm y zatocoding, alternativas propuestas por Luhn26, dieron
como resultado el nacimiento de los primeros lenguajes postcoordinados, que empezaron
a construirse entre finales de los años 50, y primeros de los 60. El primer tesauro
documental del que se tiene constancia data de 1959, y fue elaborado por la organización
Du Pont, aunque tuvo escasa difusión. Las fechas comprendidas entre 1960 y 1967
fueron prolíficas en el desarrollo de estos lenguajes documentales, especialmente en los
Estados Unidos. En 1960 se publicó el Thesaurus of LISTIA Descriptors27, de Armed
Services Technical Information Agency, Arlington Va, USA. Se creó con la idea de
utilizarlo en sistemas de recuperación automatizados y consistía en una simple lista de
términos en orden alfabético, con pocas referencias cruzadas. En 1961 el American

25BROWNSON, Pi. Proceedings of tice international study conference on classification br information


retrieval.
London: Aslib, 1957, pp. 99-100.

26LUHN, H.P. A new method of recording and searching information. American Documentation, y. 4, n0
1(1953) pp. 14-16.

27THESAURUS of ASTIA descriptors. Arlington (Virginia): Armed Services Technical Information Agency
lGovernment Printing Office], 1960.

103
Capítulo 3

Institute of Chemical Engineers auspició el Chemical Engineers Thesaurus28. En el seno


del Engineers .Joint Council se llevó a cabo la preparación, en 1964, del Thesaurus of
Engineers Terms29, cuya segunda edición constituiría uno de los más amplios y comple-

tos tesauros de la historia: el Thesaurus ofEngineers and Scienr¿jfic Terms (TEST), editado
en 1967 por el Departamento de Defensa de los Estados Unidos y la Junta de Ingenieros
de Nueva York, que contiene 23.364 términos en sus 890 páginas.

3.2.1. Formas alternativas de organización de los tesauros

Como ya se ha dicho, es posible organizar un tesauro de diferentes formas. Por


lo común, este lenguaje documental presenta los términos estructurados alfabética y
sistemáticamente, pero, a lo largo de su historia, se han puesto en práctica formas de
organización alternativas. Lancaster30 analiza el primer intento en este sentido, realizado
por Barhydt y Schmidt3’ en 1968, quienes desarrollaron un tesauro de educación, que
se componía de dos partes complementarias y al propio tiempo independientes: un
sistema de clasificación con sus relaciones jerárquicas, y un tesauro alfabético dotado de
relaciones semánticas interjerárquicas, que contribuían a indizar y recuperar la
información con eficacia.

28 CHEMICAL ENGINEERS. Chemical a wordbook


AMERICAN INSTITUTE OF engineering ticesaurus;
for use witb (he concept coordination system of ¡nformation storage and retrieval. New York: American Institute
of Chemical Engineering, 1961.

29THESAURUS of Engineers Tenas. New York: Engineers Joint Council, 1961.

30LANCASTER, F.W. Vocabulary control in information retrieval systems. Advances iii librariansbip, n”
7(1977) p. 13.

31BARHYtJT, G.T. & 5CHMIDT, 0ff. Information Retrieval mesaurus of Education Terms. Cleveland
(Ohio): Case Western Reserve University, 1968.

104
Capítulo 3

Pero la más famosa alternativa de estas características fue el ThesaurofaceA, que


integra también un sistema de clasificación y un tesauro. De igual modo, la English
Electric Company organizaba su información por medio de un sistema de clasificación
por facetas, la EF Classiflcation for Engineering; durante la compilación de su cuarta
edición, a finales de los años 60, se estimó oportuno incorporar al sistema algún
procedimiento que permitiera la indización postcoordinada y el uso de los avances
informáticos. Resultado de las investigaciones realizadas con este objetivo fue la creación
del Thesaurofacet, compuesto por un sistema de clasificación por facetas y por un
tesauro, de manera que los términos aparecen en ambos lenguajes y son complementa-
ríos.

El Thesaurofacet tiene dos características particulares. En primer lugar, la


organización de la información en facetas posibilita su adaptación a distintos tipos de
sistemas de recuperación de información. En segundo lugar, a las ventajas de un tesauro
se suman las de un sistema de clasificación, derivando en una mayor capacidad para
establecer relaciones entre conceptos que las que pueden conseguirse con el uso
independiente de cada uno de los componentes de este peculiar lenguaje documental.

Para utilizar el Thesaurofacet, el usuario busca un término en el tesauro, en donde


encuentra un número de clasificación, que viene identificado por una notación numérica,
al tiempo que le aporta información sobre cualquier posible término relacionado (al igual
que en cualquier tesauro). La clasificación organiza la información en campos temáticos
agrupados según la distribución convencional en ciencia y tecnología. Dentro de cada
campo de materias los términos se disponen de acuerdo con los principios de la clasifí-

3-,

AITCHI5ON, J. The Thesaurofacet: a multipurpose retrieval language tool. Journal of Documentation, y.

26, (3) 1970, p. 187.

los
Capítulo 3

cación por facetas, lo que significa que dentro de cada sección, los conceptos se
distribuyen en grupos homogéneos de acuerdo con características bien definidas.

La disposición gráfica del vocabulario es otra importante variación en cuanto a


forma de presentación. Los primeros ejemplos de tesauros organizados en dos
dimensiones fueron el Circular thesaurus desarrollado por Netherlands Armed Service
Technical Information Agency (TDCK) en 1962 y el Thesaurus EURATOM. Esta forma
de presentación ha facilitado la elaboración de tesauros multilingcíes y resulta muy
cómoda de consultar, porque cada gráfico que lo compone corresponde a un único campo
semántico.

A partir de 1960 se ha producido una enorme cantidad de tesauros para la


recuperación de información. La mayoría en lengua inglesa y destinados a las áreas de
la ciencia y tecnología. En menor cantidad existen tesauros en campos no científicos y
en otras lenguas, habiéndose construido, además, tesauros multilingaes.

3.3. Desarrollo de tesauros documentales en España

3.3.1. Introducción

Hasta la aparición de los primeros tesauros, se manejaban en España vocabularios


desarrollados por instituciones nacionales e internacionales, concienciadas de los inconve-
nientes que genera el uso de clasificaciones de carácter universal para la recuperación de
información especializada. Estos vocabularios, por lo general, carecían de una estructura,
salvo la ordenación alfabética.

106
Capitulo 3

En un principio, el desarrollo de lenguajes postcoordinados estuvo limitado al


Consejo Superior de Investigaciones Científicas (CSIC), en cuyo seno quedaba restringido
su uso. En las bibliotecas se utilizaban lenguajes precoordinados (clasificaciones y listas
de encabezamientos de materias) y se puede decir que la situación en la actualidad no ha
variado en la medida en la que lo ha hecho en otros países. La elaboración de tesauros
en España es escasa, prueba de ello es que el censo de los publicados en este momento,
que incluimos en el epígrafe 3.4. de este mismo capítulo, es de 30. Bien es cierto que
existen numerosos vocabularios controlados en algunos centros de documentación, por
ejemplo listas de descriptores o de palabras clave, que se presentan bajo la denominación
de tesauros, y que no registramos en el censo porque se limitan a listar términos, sin
estructurar y sin establecer ningún tipo de relación semántica entre ellos. Entre otros,
podríamos mencionar el denominado Leda thesaurus33 (figura 19) compuesto por un
total de 3.674 lexemas sobre legislación educativa de carácter general.

3.3.2. Los tesauros en el ámbito formativo

La información precedente es fácilmente contrastable si se consideran los primeros


planes de estudios de la Diplomatura en Biblioteconomía y Documentación (figuras 20,
21 y 22), en los que los tesauros se trataban de forma marginal, a diferencia de la

importancia que se otorgaba a las clasificaciones.

Si nos remontamos a fechas anteriores a la implantación de la mencionada


diplomatura, encontramos un vacío en lo que a lenguajes postcoordinados se refiere, tanto
en la programación de la Escuela de Bibliotecarias de Barcelona, como en los estudios

33ESPAÑA. Ministerio de Educación y Ciencia. LEDA Thesaurus. [inédito), 1982.

107
—I — — __ _ — —

THES — THESAURUS LIST


rl
*DISMI’gUIDD -za
-*01S91VU102 FISICD Ti O~S
*DIS914JU1 0t-PSI-2~JI C~
•OI SMIMUI 00 SENSORIAL Ti DES
*0! SPEN’SA SSCC-LA~1 DAD rl ~
-——*01 $PE’~S&TITtu¿ -T t—t LS
-*DiSPZSICIO%J rl DES
*DISTRI BJCIOÑ ALUMNADO Ti
—~0! STÑIS~JCION—CíNT-P<0~
*DISTRIBUCION TASA JUEGO Ti DES
*DISTRI TO U’~I VESi TAYd O TI DES
DO CIOR DES
*DOCTOR ARQUITECTO TI DES
- - *DOCTOR 3ELLAS ARTES Ti DES

‘j iYES
• *DDCTOR CIENCIAS 3IOLDGICAS Ti DES
*DOCTOR CIENCIAS ECONOflXCAS
44tI-ts—f-I-Sí-cA;
E ‘IP .~ E SARTA-LES TI DES
*DOCTOR--CIt
*DDC TOR. CX ENCíAS SE OLOGICtS
Ti DES
-~ ~DDCTOR CIENCIAS INFORMACTON TI DES
0— *~Q~ CTa R— C 1-EN Cl AS~t-itrR -

-> *DOCTOR C ¡EN CIAS MA TE MA TIC & 5 Ti DES


- rDDCTDR.. C IE~JCIAS POLITICLS SDCIOLOGI& Ti DES
* DOC TV R—C T 1-———-o E 5
*DOCTDR O ERLCHO Ti DES
*DOCTD~ FA RfrIACIA. Ti OES
¡ ----. *~~cl~- FI LOLttSYA—- Ti-—DES
• *DOCTDR FI LOSOF It- CIENCIAS EDUCACION Ti CES
*DOCTOR FI L OS OF ¡A LETRAS Ti DES
•DOC-TO 1 1—-O E-E
¡ NF O R MA TIC ~ Ti DES
*DOCTD~ I’~EE\I!R2 A!RO\AUTICO TI DES
—---tDOC-TOt-1 NGE\X S-RO—-KGRONOMC,-—— —
& DOC TO. fl4&E’~] EtC C;ií’¿z Ti ~!!
INGI’¿I ERO INDUST~ IAL Ti DES
*DOC TOi —----— —-Ti-— DES
• ~DOCTO~ INS!NI!RO MONTES Ti CES
*DOCTO~ INGENIERO NAVAL TI DEZ
*DOCTC,~

*DOC TOR ‘~E DI CI ‘A Ti MS


MEDICINA CIRUGíA Ti DES
-*D-2CTO~ psi CQL~GIA————-—————--———--——-- ---— — -Ti ----—DES
*0 OC VZTE RI\’A;. It Ti DES
o *DCCTOR~DC’ Ti
*DOCuM:41rtC ION . — T1
- tDROGODE’tiJD’NC It Ti DE:
*-EATP 1-1 tE
— DE

&EDaCIAXIMA ~LU’INADO Ti DE
*~ DAD MINI Mt. ALLPINAD’ Ti DE
*‘D4~- 0.EGLA.41E-S-TAR ¡ A-- &LU1NADO —---- —-— DE
*rO!r!CIfl EtC”~ -rl DE
•EDU:ACION ¿ Ti DE
*EDUCACI044-4M~1:NTAL Ti - DE
*EDUCtCION CíVICO Sc-CIAL POLITC DE
*OJCACION C’ENSt,T:RIA Ti DE
- ---- *DUCACICd~.C%j?.zr — -~.-—— — - - TI DE
•EDUCACICN EL £KTRANJS~O !~4 rl 1:
*EDUCACIOÑ ESPECI:.L Ti DE
*~~Uj~ AC IO~— E 151-CA--——- ---————----—- - - -- - —Ti OS
a *EDUCACION INFANTIL Ti ~E
-*EOUCACIO~4 MUSICAL Ti D~
LEDA Thesaurus 108
Figura 19
IIQIII. ..Z’. úín- 299 15 dIciembre iptia

StCtJNVC> C(JICSO
32903 772 dic y ~< oeiub da 1033 ~r Lo Univac-
lo RgcInIo ~ue a
Obleiu,,oa Estudio. leor-la y aptiraclán de la’ tbctui-. iui,ttn-
.gIQIla O. PíI.I.
01ecw.,.,nIo y Documruincita 44 t.cart.a y documentan.,. de la. nort?oaS de catéqlna-,r..n..ís.
jan drt~’I~l4 - c i, de la Unts-e,,tflod 4-. Oro- iliicaClCo y uva 4. la. fuente. de Información hihiiu,vi se ---a
noto
1:—:-. V
Sr i~ P ~ lgjr,,,uiad. oor ci Rectorado da Heras a.m.n.l..
tr:s.-rsMt~-~ -ir(‘‘ría la ‘r. ‘ntrhtud de ar,rut,aclOn dom pian da cias.
-~ —,t,-it,’ de i~ E--ge:. n ,--r%ii,, ría dc Iiib:,ott<orori,a ~ - ijata, te. COrnuto..

:n--.n..tí, 4, (:,.nad, d.~-rídirni. de te UnIversidad TSrlcaa


(ranAs, Fra. nias
ttín.íi..,anifl <tus la dial, peor.uqste ha todo inrormada fa.
voín,te,it~flía por it Junta <le •ot,ltmo de la Unlvenided de Dibiiotcconomia ti Ileoria. bote., la y Iii-
Cra:,a.ja y dc acuerda1eten Edutartón y rlnand.minnLO
lo .-,í.blectdo de la Re.
en la Lay 1411070. dc
<orn,. Educativa. la Onlen míniíícrlal da 24 dc febrero 4. leal bilote-conornia np—e iall,adat 3
dc a¡íaín.
4 .Ii<.t~tín General
Oficial 4<1 Litado- dc le de mano1, por la qo. sc Blbltógrafta II Iatbitozr. (la general y CO-
poclaliradal 3 ——e
.,taiAeclron las directrices para la elaboración 4. te. pianes
<1* cituIho de tas E.. uds, Untve, -di ~riaá de flibllot,ennnmia Documentación it~orla, jílsisita oresní e—
—cE
Do’ unsentntíón. y visto tít í1o—iar,i.-n favorable emitido por la zacido dc Centeo,i
Junta Nacional da Uni,..ralél.d.a. Análisis documental ti lraiat-og.a’ tan o - 3 -t
~Lv
Lila Minutado ha dI,puntoí tancoaala. doe-tuto,aniarioí O prior mi-,. a-.
serajo.. de fa ciasitíraciónl 3 ?rf
e
Prg,nero.—Queda aprnbaflo. con •fecto. dt.d, la fecha 4. su Idioma moderno 2
i,nplfinlación. .0 plan dc «ludio. dc la tecusia Unlyarait.rt.
te 2mi,ilotecnnnmia y Docungenterlón de Crenada. daMndienta ¡
-— - - z— . - —— - —

ríe it UnlvCr,Idnq de Cranada. rlu..dandn injciurado .1 pian lIliCtil C1JKhtJ


ría e,Iudí,,í da la tono,. que se índica en anexo adjunto a asta
O,d.r, non Itt—riel - 0bIeíi~os- inicio de ea~re si cae iii en tau r sri.,. te.
Segíndo—La aprotínctéíro dé, cite pian de ecludio. no ImpliCa cadas y tullí gráticsi sal cogito en ni •ratagoíg,-ííg,. ti-. díi.’s
sígmeno’, del ga’ío público. Nicica. rres.n.nth-, en bgbtinh,ra, y C>ntrna dc el-,- i,n.í.t,ie.
dde rseindeslógica del trabal,, ci.-rgrifér,,
Lo i~tie con,I.nieo 5 Y. 1. Daca su conocimiento y atrios.
Medríd. 77 di. octubre da I~i—.P 0.. el tjireetnr general dci
rnspñé,n,a Unlver.hierl,. EmIlio Laos., da Étpinótt.
de cisíl
timo. Sr Oír.-’ ni general de Fn..-ñr,n,-ó tlnivaríltarla
r.¿,s<a. IV.. uva.

Lenrjalc. document,rldt II (altisínas de


ANEXO QUE .ME Cii A eia.gficari~n y análIsis de cn,,íeniílol 3
tofono,~íl,v docujm,-ntia’ lautons-gí’ adon
FI in dc estudios de la F~’ ucín U r,hírs’i,u [ i$-U de biblioteca. t,lecumíínvnritnl 3
y Por í,mcntatlór, do la U,íiv-,rsidíiít de C rnñ.dí. Ii-., e-di, Teorí, sociología da la comiinlcaclón .. 3
por thai Decreto lClfihitti2. dc IR e jigote -th ‘--ir. flU, - - Archlviatlca 3
Filado. dc 23 tIc Idioma moderno 2
Seminario da s.tudli,t t Iprínoar cuatrí-
FlitiIUS Cuéisí) masita>
Obletivos: Introducción e té eornunlc-o,ción. .tt c-,nn,,’síi-,-i-í
del documento y a te, bases dc las Cte,,rias Itibli -nr; iv
Documentarías. Adquisición dc ls terminofogla tutu-, nui-,tlat. Prédica. alo bibllateca. 3 Centros 4. *cict,nt-,uta<lOir O artizo.
do cszstrims.trel.
Memoria al final de loe estudios Superada la totalidad de
It-,,
las a.feeoa<ur.4 que emnoprende en, plan de estudio.. Ini aleteo,.
de --4pm
no, deberán elaborar una Memoria sobra un t-ma relacionado
con la. miatenas cunada, que será r.-qulatln previo par-a la
Se! erma~-o-, ¡t-n. -
1<~,’
oñfeikldn dci titulo 4. Diplomado en Sí hIiot-.c.,nnn,fa y Docte-
le--- ir,, ,sinutatíóii.

Hlétoria dci docu,í,en o y de tos d.oÓvit.” o


documeníaín 3 0*
RibtIotccononria O <orgcn,rs,iOn .1, nimio
tecesí a —c
Er
Bibilosrafla 1 tlntrodurtióto a las fuente.
4, in(ormact.inl a
Análisis doa-um,ntaI 1 <princIpio. ganara.
te. da c.tatogaclónl ‘a-,
IdIoma moderno
SeminarIo de .,tudtoa 1 truatrto,.-tirail
Materia, optativas de carártar mono- -o
grti’Ico a í$ttermit¶sr a 2

SemInario de catudioh II ‘c-uatríme,trali -


Malcría, n;gaíiva, de ear&rer isonnotrá —t
1-

fico a decé,rnotnar ¿4:

Plan de estudios —publicación BOE— de la Escuela de


Biblicteconomía y Documentación de la Universidad
de Granada 109
Figura 20
EOE.—Nuim. 86 10 abril 11184 10123
Segundo curso
Objetivos: Estudio, teoría y aplicación de las técnicas biblio-
tecarias y documontales. de las normas de calaíogación y de
cíasíficación y dei siso- de las fuentes de información bíblio-
gral ca.
MINISTERIO - tiara,
¿cm Sta leí
DE EDUCACION Y CIENCIA Materias atiusies obligatorias,
Ilibliotaconomia II <teoría, hIstoría y bíbiloicconomia
aspeclat¿zada)
8620 ORDEN de 26 de marzo dc íoa< pr lo 31*4 5. Bibliografía II ibibílografla general y especialízadal -
el plan de estudios de lo eructo <ulver. Dccunsentación 1 <teoría, historia y organIzación de
suaría (no estatal) da Btbtioteconomio y Doct.- centrojí
,neniació,s de Barcelona, depandLente dé la U,uíver. Análisis documental It (catalogación)
sídod de Borceiona. ClasIficación e irdización
ldtomn h,octernos
Ilmo. Sr., Vista la propucita formulada por el Rectorado 4. Libro infantil
la Utuiversídad de Búrcolona en solicitud de aprobación dei plan,
do estudios de la Escuela Univereitarla da Bibliotoconomia y Hora.
Oocumentaclón de Barcelona, dependienta de se tia nalas
Universidad: - la rnsncloneds
Considerando quela citada propuesta Isa sido Informada fa— Materias cuatrimestrales opcionales:
vorablemanta por la Junt. de Gobierno da la Unívenidad da <Dos raterías como mínimo hasta com~
Barcelona. y de acuerdo con lo establecIdo ato la Lay 14/1ro.
de de agosto. General de Educadáis y FInanciamiento de la pletar las 23 horas semanalesí,
Roforma Educativa: la Orden de 24 de febrero de 1951 (.Bolatln- Artes Gráfica, 2
Oficial dol Estado. dei 14 de mano) por la que se establecIe- Historia 2
ron las directrices para la elaboración de los planes de estudio Latía 2
de les Escuelas Llni-versitari.a de Biblioteconomia y Documea. Literatura catalana 2
ladón. y visto él dictamen favorablo emItido no? la Junta Na- Paleografía - 2
cional de Universidades con facha- 10 de febrero de 1984. Patología dei papel 2
-Este Ministerio ha dispuesto: Principios de administración 2
Primero—Se aprueba el plan de estudloa de la Escueta Un!- Psicosociologia del lector 2
vorsitarla tno estatal) de BIbli-~tecononsla y Docunisoisclón de Total - U
Barcelona. adscrita a la Unlv,rctdad de flhi-calo,,a. quedando
estructuradu el -mismo da la for,,~a que se indica en anexo a4 - Terca curso
- ¡unto a esta Orden.
- - Segundo—Las á.iignatuiráé opta1lvas se impartirán cuando Objetivo’- :nlcio de una eapec!allrseión - en las ciencias bí
haya un mínimo de 15 alutnnos matrIculados ea cada asig- bliotacnrias g l,tbliográflcas y en el trataruienio 4. datos. Prác
natura. tiras permanentes en bibildiacas y en centros de docutiontacIóa
Tercero—La aprobación de esta plan de ¿att. Uno de Ica do. cuatrimestres del tercer curso se dedicará
aumonto del gasto público. - dios no in~;lica prácticas en bibliotecas o centros de documentación. Durante
- Lo qn: unicó . V.L~srasu cor.ocimiento y el otro cuatrimestre al alumno deberá cursar las algulenier
•fectOi. materias: - - -

Madrid. 28 de mano da iba.—?. D. el Director general de Herr,


Enseñanza Universitaria (Qrdeii dc E? 4. marzó 4. 19821, EmilIo - asnanaíes
Lamo 4. Espinosa. - .. ~
jimo. Sr, Dirsctot general 4. Enaeftanza UnIvaraliarla. Materias custrimestrales obliratorias.
informática y automatización de bibliotecas
DocumentacIón U
ANUO QUE SE CITA Reetauración y encuadernación - -a4a
Pian de estudio, de la beocia Uoivei~2tatia lea catatan da Archivística
BtbiioteconoLi& y VoconieatscIónd.~CalUlOgit, adavita a la iteras -
• Uaivers&daaLdab&Z.0OlQfl e. - sama caíes
:.Prtmer.auhbo--~ -.: -. --...~-i’-I-~ -
Objetivosí Iotroduecl6n ala coauaictcl6fl. ¿1 áoúoeimlenta.: Materias cuatrimestraleí opcionales (a
del documento y a La. tases da las cIencIas bibliotecnlss y-do.- - ¡ - elegir daslí -..•-v. 1
cumentalea. AdquisiQlóQ.dO.UM.WmiflOlOSlB funftmata4~.í.-: - - Catatogadón (curso puoubgi-áfIco 1) ,,. ».~‘t-.-’ a
Catalogación (curiO lnoIiO<IráficO U> .¿ .. 1
- Mona Lenguajes doctarneutales.- curto manorá~
-- semanales - - S +3
docum.plai.5 (curso monográ. -
5~
Materias anuales oblIgatorias: Bibiiograffa (cura mjncgr4tlco>•..,~ -E a’,-.--
-

Historia del libro y de las bibliotecas 2


Biblioteconornia l torganización da bibliotecas> a
Bibltogrslia 1 -(introducelón a la. fuentes da la ialor-
lbaclóti) - a
Análisis documental 1 (principios generales de esta-
logacióii) - - Horas - Heras -
SeasaOhIsi setusoalsa
Idiomas modernos 2
)í--;-
tiara.
scza a cales - -- Materias cuatzln,e.tnlei optativas fa
elegi< dos entre las sIguIentes olas PO --
cursadas en seguaridolí
Matorlas cuatrimestrales obligatortss. -
Banco de dates - 3
Terminología científica 52 Blblioinetri. - 2
Técnica del trabajo científico Estadística - - - 2 +4
literatura 2
2 Hemerotecas — 2
Historia Material audíovt.ual - 2
Total - 15 20
Total -

Plan de estudios (publicación BOE) de la Escuela de


Biblioteconomia y Documentación de la Universidad
de Barcelona lío
Figura 21
2015 ti <4, IESTAi)O 2 Y 3 SIEFIiIIMIWIE 5%? <NI IMS 210 Y 211)

dr ‘o rsé í ci 4. 3 <uníit it s. br e dr lii: montagnie anual -


vto,,, it piura miii rse res,, 1 ladi, 04 uríes MCi C nt, SeN a irlas
1> tic t rirtencía la res- Istíto s disteilemli u pro
rus tr- meses <leí rá,
Y ni g huluir udo nt ís;usíí tulos quc ir al;>! - siendo rs 1 tísuturta tic las Iímu¡uí,cinncs
d,r,,sretc huías dci día cíí¿do. sc da 04t terminada sri Anticuo R¿eirnrn.
la icunútí. dr la que se carírnár la presinle ala de~ Material Do-
(dtiÑCrVjCIón
qt:c. sn pruclía dr conínrm,-trd. ci suscrita por la cumcntai.
solalidad dc los uí,,ísucnics. Las demás optativas que
oficrea la Universidad cada
2019 Acuerdo 17 junio 1fl7 <Consejo de Universidadesí.
ESCUELA UNIVERSITARIA 1W BiBLIOTE-
ano.
Cada una dc estas asignaturas
CONOMIA Y DOCIJMENTACION. Pian den- optativas tendrá cuatro horas se-
ludias de la de Salanianca. manales, entre teóricas y prácil-
Rcsuclve: cas. ztgiiíi su naiuraicza.
Homologar el rían de estudios de l. Escuela Tercer cuna
Universitaria de Bíblioteconomfa y Documentación
dc Salamanca. que quedatá estructurado conforme Infornuática Aplicad. y Banco dc
figura en el anexo. Datos 3
Idioma Moderno. 3
ANEXO QUE SE CITA Una dc estas opciones. • elegir
~teialut,uruot
Plan de alodios de la Escuela Universitaria de
Bihlioieconomia y Dcumcntaeión del. Uoiveisldad Documentación:
de Salamanca Lenguajes Documentaies de
Bibítotecas 3
1-toras tCitinsfrs Arí:hivlsiica para Biblioteca-
no- 3
Teóricas Prácticas Opción de Archivística:
Lenguajes Documentales de
Primer Curso Archivos 3
Historia del Documento y de los Riblioteconomia para Archive-
3
Depósitos documentaies - 3 í rOs
Bibliografía 3 Dos asignaturascuatrimestrales, a
Análisis Documental 3 elegir entre:
Español 3 Restauración y Encuaderna-
Idioma Modcrno 3 ción.
Dos asignaturas cuairimeseraics. Diplomática.
Ttcnkas de Trabajo Cientí-
a elegir entre: fico.
Latín.
Paleografía Latina. Historia de la Administración
Conlemporinea.
llistoría e ilistoriografia. Las demás optativas que
Critka y Comentario de Fuen- olrezca la Universidad cada
tes- año.
tas demás optativas que Coda una de estas asignaturas
ofrezca la Universidad cada optativas tendrá cuatro horas se-
año. manales, entre teóricas y prácti-
Cada una de estas asignaturas cas, según la naturaleza dc la
optativas constará de cuatro ho- enseñanza.
ras semanales dc ciases (entre Al final del tercer año los
teóricas y prácticas) distribuidas alumnos presentarán una Memo-
st-gún ¡a naturaleza de las asigna- ria para la obtención dcl titulo de
turas.
Diplomado.
Segando <mao
Documentación 3
Lenguajes descumcntoies: Prinel-
rulos generaies de la clasílica-
ción 3
Iniciación a la lnfortnttica 3
Idioma Moderno 3
Una dc estas dos opciones. a
elcg¡r por ci alumno:
Opción dc Biblioteconomía y
Dccetnteneacidn:
Biblioteconomía 3
OÑón de Areluivlstica:
Archivfstica 3
Dos asignaturas cuatrimestrales.
a elegir entre:
Artes Gráficas.
Paleografía Castellana.
3974

Plan de estudios (publicación ROE) de la Escuela de


Biblioteconomía y Documentación de la Universidad
de Salamanca 111
Figura 22
Capítulo ~3

biblioteconómicos que se impartían en la Escuela de Documentalistas, dependiente de la


Biblioteca Nacional. A grandes rasgos se podría decir que, salvo excepciones, no existió
referencia a los tesauros en nuestro país, hasta finales de la década de los 70. Una de
esas excepciones la constituye el seminario que impartió Emilia Currás, en 1969, sobre
La Documentación al servicio de la industria química, farmacéutica e investigación
cien4fica, cuyo programa incluía un epígrafe dedicado a los thesaurus (figuras 23 y 24).
Tenemos constancia, igualmente, de la celebración de otros cursos y seminarios sobre
Documentación científica que, desde el año 1973, y promovidos también por la profesora
Currás, se celebraron en el seno de la Facultad de Ciencias, de la Universidad
Autónoma. Hacemos mención a continuación de algunos de ellos:

- Seminario sobre Documentación científica que, bajo el título Problemas actuales


de la Documentación científica.- Caracterización y clasificación de documentos, se
impartió en mayo de 19>73 (fig. 25 y 26).

- Cursillo sobre Documentación química, celebrado entre los días 10 y 15 de


diciembre de 1975 (ñg. 27 y 28).

También en el marco de la formación no reglada, José María Sánchez Nistal,


vicedirector de! CINDOC en la actualidad, impartió el primer curso monográfico sobre
tesauros de que tenemos constancia. Se celebró en 1984, y estaba organizado por la
Sociedad para el Tratamiento de la Información (SOTRAI), primera empresa privada de
documentación en España, que fue creada en 1981.

112
o
ej O
• ii~ ~
-A- a O ‘fl~
5ts-,a —
L. e— --~ 20 B-~ 60
¿tsotUseDJt ~00w ~.8~
‘itt,
(j/
~ -H --.40
0)0)4-,
.0 í~)(~
0000
CO -H <fl -.4
0 E’e-e
o -H L
-H > W 4-’
S-. L4-eC
<do> 0)
en --.-<
-H <dO
SrH O
0) Cn -rl C
CO EC
r-4 C ~
‘0 H -O
0) -H 0 od
cd cd -H
cd 4-’ -H 4.~
ECLCO
<dm4-’ 0)
L E-O) >-
~ i.
O Ot -H
LOe
O-. O -~ 0)
<ti
o>
cd
bO
-H
r-l
cu.a ¿u.
w r~
=-c
{~g
.n~ -rotu 0<0o
e’
-—
D Ulo ce,
Vi-—
l—4> C
— a ‘~ -v 4> OK
E
•tO1-~ V ct-~
3 5- 0
<04>- 0.
Es ~--oo> k
•0
lo oW w—
.4>
.a >- s zXC-4
o E4> s.-~
E ~
4>
ti ~ .E -z 2 z -~ o _ <00
e te e,uu~~ COu.
•0 tr; CO
<u. 1- 4>—O
-— 5 o ‘-4>
~ -gu.>
— U
S h—
Z 4
Z E O e,t E &
o42
O
4, w ~ — o— - -t E -3~ Uu.
0< 0<
53 u. _
4 ogcct,<0<0 E <0--
a o- tO 4 U 2 3 ~ 2 -u o
z ~a
.0
L- Q. 4 ULfle,e
<0u-L-
0
~ -—
u
it.
oi
-u ~i
t0
u. -.
03 su•p ti, Z ti’ <0 -
O
4 E~
•—e— 4 z
0<
w
1—
w
u,
>
c-—t>4>
-u.-
o it-u
-J -toD — -i o u. u.-
4 e~”O —
~ ~0 4 Mi tuu.Á!~O~ 4>0 34>4>
w u. O
4
w o 1- 4-
— u.
u.
y o %.a.cz~ U
2
i-~e~ u.e,o
w mo
O Eu.cE~> 1- <0-c~ E
cdcd
cd
2 En < 0<
0<
Sro4)D~c ~j
qn
e ~-
e-O
Hr.4
o
5 o 4
en
u.CO
oL.L4u.C.C ovO ~ 0)
%~t 4-’
o> -rl
~
u--cv
~
— u ~ ~..3W ~ CE. .0 ~<d
ow 4- ‘ U -< 4>u.i-e> •—0’ o o ‘o> o
~ 4 O 4>3ro ~ 4>0 O~fe, cd -H
z -n .~ ~ -~ ~-v —
g
CO -rl
O E<e-e
a e’ e> — u.CO. 0 o -H ~-e ‘rl
w en —
0~
4>
0 ‘-o
-~ -c
o
.~ E
4>
0~0 u.4>
4>
e, ~ -
.rl
LS~4-eC
~. cd 4-’
4 4- 5~ O~. u~~e>
e -o E e, o 5-0 cd0) 0)
lo e o 0)
u~UO u oz
0 ~ e,~
-—
E
u. ~ 4>
0—~ .~ g~i ¿ e> 4>- w~ -H
~ CO --rl
<do
0 wa ~<0NO o> ít.t O -~ 3 E—4 O
UD ~3 0) C
n -
—<‘M~2
. -
-c 0< ‘-E
D2.~ 4’e
-&~-~
o t = -c CC .Ceu
e CO
cd -rl
E’0
4 NNfrS -J sil—
00
.—l -o
u- u -J
‘0
e ‘rl -rl
-4
aZ O
ci- &
-~ o- ~ -~-~ o> -rl cd
rs ~ -cocd cd -rlOB
cd -4-’ -H 4-’
Ee%~CO
cd 0) 4-’ 0)
S.. ECO :‘
OB fl
O O ‘d rl
o O-. O -H 4>
(1 esa
cd
-j
OB
•rl
o ‘o ~4(
u N u
4
N 3 o.
<0
-—
u-u
lo 5 e
-o
o4 <u a u
0< u 2 <0
O a e, a o <0.
- N u.
0< D u. e u UE 4-E<o -— 4>
4 Do
-oe -o
4 en 0 Q
.E <0
1-
z -tC go — 2 u
u — e U O
w <o
- 30) e—
}
Mi
u’ .EE u-O -o
g2 5 u-u-,
o’.- D e -— <o
-a <00v ‘e- C u u
t~- o e o <0 tu
oIal
-— t~; — u a
vg (5 e --c 0) e, Ce, e-
roO) o ~— <o -D
7 u e, -f
1<
o e,
u.
e
<ou
ti <0
4
- 0.0 U -a c;: o e W
3
o
O> 0<0v
< ‘~a < 4> 0-
< :2 0 e->
a0< ~0 3 o
1— u u u 1~t
o W
1—
e, )— Z
w ~, a
3oo’ -~ tu
u-
4>
tu
U
-c e> o e, u. u.
<o
4,
.3 ~
0<
o- ~ a— o> u =
tu
1—
u

‘tu.
e>
-tu
o>
u.
~u->
< t5 D o>.- -C ~, J :2 1- tu u. u-
-D u
~‘ eu e, u. e -D r;l
z 5-~ u u. 4>0 --—o -v «U U
0)-o
o0 ee, -v .0
-—
7 e,;:
0-Din u.
e,
0
1—
zE
~ 4
O< e --. u. O
0 0-
CL O
u EE w .2 3 tu w u-
o E~E si) u- -— -E
u ‘. ~ yo0

~ en -3 -u o> D 1-
2 u
4>
o. ‘-> u- o.
o :33 0 e> u- -—
0<
:3 e, e, u-
2Uen 1— en
.~ -—
Uh- U 0< ~—-
4 o-nu
0< 1- w en
o w
z o>
o- —cflQ
en 1 — o> e-,
z

.~M
——
w
u

o> o>
e-,
o> ej - e, CO w
-:
s 4 lo 1— -Oso -o
o> -q ti, ‘o
- ‘~~-.~¿~‘: -‘

UNIVERSIDAD AUTONOMA DE MADRID -

- -- FACULTAD DE CIENCIAS

-- - -- SrmL’JflO SOBflE D~Utfl3flTAOION C-IENTIflCA.

- Dr, Julio Garrido


Dra. flúlia Ctrrdn

- DialO de l!a~jo a las lEla.

~OflWIASAC’1’tL¶LES flfl LA DOC&2ZlTtCImT CIfl¡TflICA


Coraotcriznoidn y Clasificacida do DocumentOs

Dfa 11 dc Layo a l~z 16h.

BVSQUDA DE D0C1RThT03
I4dto-Joj clflzicod y-métodos rncc&dcos.
~ocuncntaei.t5n a intorzétioa.
- -l

Departamento do Geolcota - -

Mddulo VIj Aula 45.

T-~adrid, 11 dc Abril dc 1973.

A -
4.

Figura 25. Programa de Seminariosobre -115


- Documentación científi6a -: t.
IVERSIDAD AUTONOMA DE MADRID
FACULTAD DE CIENCIAS

SE?-aNARIO SOBRE flOCU~-Z~TAOION CIENTIFICA

¡<73

BUSQUIDA flE flOCm-!EÑT~

Métodos utilizados por los investigadores.


Buisqueda en un conjunto registrgdo.

Distribuciones lineales.
Intersección de distribuciones lineales.

An4lisis tem~tioo. Concordancias.


Caracterización de los documentos.
Tipos de seleccidn.

Método de rejas superpuestas.


Métodos semimecánicos.
Uso do los ordenadores.
El problema de ideas afines. -

limitaciones de los ordenadores.

UTILIZACION flE OIWENALORES EN QUIKLCA

1 .— Aplicacidn de los ordenadores en Documentación Qutmica.

2 .— Maneras de llevar las fórmulas químicas al ordenador.


2.1. Métodos directos.
2.1.1. Uso do la Tele~.si6n.
2.1.2. Método topológico.
2.2. Métodos indirectos.
2.2.1. Criterio general.
2.2.2. Método Cremas.
2.2.3. Método Wiswesser.
2.2.4. Otros m¿tQdOS.

3 .— - Aplicación de estos criterios a otras ramas de la Ciencia.

Figura 26. Programa de Seminario sobre 116


Documentación científica
<e- A>.~

‘ERSiDAD AUTONOMA DE MADRID


FACULTAD DE CIENCIAS

PROSRr-¶A DE CURSILLO DE
DOCU:-i~NTAcTOi QUIt-IICA
para los alwinos do Química Analítica
Facultad de Ciencias. Universidad Autónoma de Madrid

IflTRODUCCIO~l
Dado el grnn inter~s que ti docu!rentaclón científica tiene en el campo de le
Química se ha tonsiderado importante que los alumnos próximos a salir de irnos—
tra Facultad y qn cursan la Asioratura de química Analítica tengan unas no——
clones fun¿:n;entales de la documentación existente en este campo y de como ad-
quirir ir~fm-v-~c~cn.
Para ello se ha confecc1cn~do un programa en el que se enseran los tipos de do-
cumentos cxist2ntes, los sistemas de clasificación, la foma de hacer una ref-2—
ronda blbl½rrr5fic a, un resumen, como adquirir lnfotmiación, etc.
Todo ello les ser5 de gran utilidad cuando est&i en sus puestos e-e trabajo en
la Industria, o en la Investigación, para valerse, en parte, por si mismos y —
actualizar, así, más rapidam~nte sus métodos dé trabajo y conocimientos.

CO:401C10ilES GENERALES
Este curzlllo se co~npone de:
4 clase teóricas dc 1 hora de duración
Proyección de películas documentales
Visita a un Centro de Documentación y su terminal de infonnación.
Las clases teóricas lr~n se;uidas de coloquio, y se desarrollarfln segOn el pro-
grama que figura a continuación..

PROSRX-IA DEL CURSILLO SOBRE DOCUMENTACION QUíMICA-’ -

Lección 1. Docunentaci ón e 1 nformaci ¿ti QuVítíl ca. Transferencl a de Infonnaci on.


Lc-s documentos: Sus tipos. Soportos de la flocurnentaci6n Química:
Clasicos y modernos. Métodos clásicos- de cbsificación. Mecaniza—
ción de la documentación. Teoría dc los Thosaurus. Palabras- — cia—
ves. Thusturus químicos ínas importantes.

Figura 27. Programa de Cursillo de Documentación química


117
-1 - 1%’>

—2—

IVERSIDAD AUTONOMA DE MADRID


FACULTAD DE CIENCIAS

Lección 2. Catalo-jación e Ind1zac~cn an Documentación Química. Corno se redac—


ta un trabajoclentífico, una tesina, una tesis. P.eswiones cientí—
fices. Tipos de resumenes. Referencias bibliográficas. Indiza-.
clón por palabras - claves. Indicas en Documentación Química me-
canizada. y e.-- - . - -

Lección 3. Hétodos cJe llevar las fónnulasy las reacciones químicas al orde-
nador: Métodos de fragmentación. ~ldtodos lineales. Mdtodos topo—
lógicos. ¡-Iflodos mixtos. Sistema GREr-IAS. Notación lineal de —

Wiswosser. MitÑ~ bidir-sns,ontl utilizado por el Chemical Abstracts


Service. Otros nótodos menos utilizados. -

Lección 4. Busqueda de tnfc-nteción ~uIm1ca.Formulación de preguntas. Donde


y CV:iD Se crCU2ntr~ 1.: Dcc-¿:t¿ntaci¿n Qui:;ic¿i. Infor;nación hiLl lo—
qi-5ilca r2trospcctiv~. Difusión Selectiva de Infor-nación. Centros
dc Documentación esrecializados. pan¿os-do Datos. Terninales on—
une. -~ --
---it --

u.
- v.g - 0,1
-i - ¶

—d
Madrid JunIo. 1975
Dra. Emilia Curr5s
Opto. de Documentación CientTflca
Facultad de Ciencias

Figura 28- Programa de Cursillo de Documentación química


118
Capítulo 3

3.3.3. Los primeros tesauros españoles

El primer tesauro que apareció en el panorama documental español fue el


Thesaurus Textil Internaciona¿94, publicado en 1971. Se trataba de la traducción del
Thesaurus del Instituto de Tecnología de Massachusetts, que había salido a la luz en
Estados Unidos en 1966. Dicha traducción formaba parte de un programa de desarrollo
y perfeccionamiento de la industria textil, promovido por el Grupo Europeo de
Intercambio de Experiencias sobre la Dirección de la Investigación Textil (G.E.D.R.T.),
del que formaba parte España. El director de la Escuela Técnica Superior de Ingenieros
Industriales de Tarrasa, López Amo, tomó la iniciativa de su adaptación al español, que
se llevó a cabo durante un período de más de dos años, por el enorme interés que el
glosario podría tener para la industria textil en nuestro país.

Dicho tesauro consta de una lista alfabética de términos clave, que van precedidos
del código identificador, y de una lista alfabética compuesta por dichos términos provistos
de sus relaciones semánticas con otros que componen el tesauro (figuras 29, 30 y 31).

Pero la traducción de este tesauro constituye un caso aislado, ya que las primeras
técnicas documentales no se manifestarían hasta casi finales de la década de los 70,
pudiéndose considerar a Lasso de la Vega su precursor, al incorporar en el Centro de
documentación de Fundesco -que él mismo fundó- un sistema de indización que bautizó
como FUNLA (derivado de Fundesco y Lasso), consistente en fichas similares a las
empleadas por el sistema uniterm. Mediante este sistema, se conseguía una recuperación
de la información bastante más ágil que con los sistemas tradicionales hasta entonces,
basados en los puntos de acceso de autor y título exclusivamente. Pedro Arévalo, que es

>‘rRESAURUS Textil Internacional. Tarrasa: Escuela Técnica Superior de Ingenieros Industriales, ¡971.

119
— - t.<.?~ mt. -.>%.~ ~ Sr ¼
- - .t;-ÚÑ;F -- ~~*- -.s ~¿-‘a~-~k- - -
- --.-- ~ -idi - - -
• . --~i.~.-:,.,w74~ie~ -< .‘ M-.p- -- -
- -- --A~ - -- -
o
CM
--4
a—
—a>
.4 -
(6~~ -Co
Lii £24 a>
e
—w
z ccc
o ci,
ce) D
z
sc o
zo
(no
0<
w wZ
1—
z -a
le zo
0<
a ...ncI, -4
u, —de
—‘ 1 ecd
w __
‘~íiíP— o
O
e e
x 0—
_ <~
O O)rl
0)
4,
e
W .2
‘e..
rl
1— - wz
o-w 4-’
-4
E-.
0)
(0< 02
(1) j
cd
m
D
zo~ a)
ow CM
D wO
sc 1- OB
-H
u) -J
w
4<
w
z D
1-
-4
c.d
-rl
.4
4 u.
a o
u u.
z O
o
5
u u r 5-.
ta It,
u- o o o -
5 2
U tJ un
1- — u u-
5 2 ti E
o 5 lii — 5 z 4
tAj ‘a — 4 a
o <a u>, a 5 O
5 ‘o u <-‘- — O Iii
w o o- 4 0.4 z E E 5
O >-5< w4 2 — 0. o 4 - .4 u
5 SZWD -4> -r UO-.
w-t ti -n o z u.> u-tAS 44 uuiW4«
u u s 4
E
o— o— — —w WZN a>- u> 4 ‘.4 zuao
5 U
-
SSO
a 5-00 h-W4WS4Z w u— U>- <UDC U u— IUJV
DC <—Ciz — o O 24-<¿--. ‘A- E ‘02 oZuJcu—.. W O 2 04
u-, Z000 w tir -it Dv 4< zO’—— E ti 14 OOU3«ZZ 4’ 0
u— W ~j u 0.LÓi’ u—ZZ>.4-.zJ-zD (a u o 4 1 .4 4 4 E o- — ti O 4 aa-<~¿0O
143 DUI.> -J r¿, u. x wzO4—w-J400
5 u 4 2 OW«0UN
U0D< u.4<-~ea wu44 au.4a<0 ——o O — J.-(052..4
<4< <«<ej 3 u.4-ZOaa SEO 4 ZZ<WWLA.ZZ « A Ou.’—UO<
—0.0. 2 ti 13 40 tU 5 — u>, CC 4 4 2 . .4 0 42 Ci W — 2< ti y-w-Lah0u.
NS 5 5 -% -c O O CI> W ~ 4 o o uit o OZW.-.DDr-,--.0t-U O <C4 5555505
ecu..>— 5 5 0 1 u. U) U 0 -¿ S E SO u
0000000 0-0000 00 00 00 0 rJ a” ¿4 4 4 4 -< O « ‘4 0 0 00 000 4
o o =o o ea — o o br 2 u u Li Ji al-> 4 a e <e a a o
-< < c —C 4 < < < -c < -‘ -e <4iC<<<u. u. ti, O O — — u- u- > — h Li U U ti W u-- 00<4<444<4<4-4
ti Ji -~ — ~.4.444.40. ““u-u-u-u-u-
4 < < 4 4 -e < 4 ‘C •C 4 -e <<<<<4<I.> u 1.> ‘3 1> LI ti U 14 JI zA U iii ti Cii Atil tul It 14 ji Li tu :t ti ti in ti ji bt -ji >5
u u u u u -J 0 U ~ U 0 U u u u u u> -J U U uuutJ Uuu.4-Juuuuuuuu-0 uuuuuuu-JuuJuU
<<<<<<<4<44< «<444<4< <<<-e <<<44<4444444 <444<44<4<44’C
4
2 04N0 000U)0O e> o o a o o u- u, 0 0 0 0 0 5 Ci t) 0 0 0 3 0 0 0 0 eq u~’ o DC 300 0000 00
N1P)C~ fr0Q4Q~ ~4 ‘1 8 N 5 3 1 U) O C u- <A> N -, 1’) 01 0 ~J ti -t it 4W U) ti ~i O O — )J ‘1 it ~) O ‘2 0> -4
u-, 0,-SN ,o~-oN-o.o 4WSSOOSflfl<fl018uOSO8Siflfl.Nflflfl<0it A un U) Ji-U) un n -n u. 0-O cd
4
O.
CiJ~4*
n
<40444
-o
<4<40>044
N <PI
ti
‘2
C04OOtOC~0.0
.-.itni’inflnn
0> ti
u-
<1>
‘o e
o
O
ecd
o>
4-’
e
rl
H
rl
4-’
2< -cd
0) S-.
OB
o CO rl
tL
t.1 s-u
-4
O)
u)
0)
U
5 5
Iii Sun UN
O tAjo 0W
4 -• o o O
-‘ o x 00
u. .4
00
tA~ 4 > 4
.4 .4 a - - 5 —SS «5
—u 5 u-. 5 tAJ 5 <4< l-< 5
— 4 — 4 tuiNas tAJ 30<4
E 20
u. a 022
14W o
4 1-5 50W U 02
24<5 a --‘0 000 u. <UU
o.0 5
<4-eW o 5 2,-o NSO 0 55 SS “u.
UD u. o. o 54 044<«O WU< O <u’,’
o 0<2 — 4 ti— 000 <44<44<44 —Cta
o LUO - 0 u.u. 1 u-a ~ U E — 0.-— u- DvUueJUuU 040
u-Oh-U — 5 4< No ZW O 4 Cii .4 4 U a a UO 0 <0
050.4 0 .44 u-. U— —— <4—u wOo0-<.--.zz1ru->--u- «u ti>
cx u. z <¿4 <2 04 UD rau-DO. 044 <t.> .J < <4 44 4< 5—u-
o a<4u.z < 4 0>0>0 «u 4K U4 0. 4 20 0’ 0414 ZZZZhu-H 0.2
oo
4 — 0.ZWW <— ‘a E 00— NS < a -< u u ‘u U a>>wW 0-As) 0014
zo <utlatii U « WWW 00£ ——‘‘‘SS SS 50 000 00 0 U 14W <«u.,
E .4 W« 5555 <3 0 ooa 4<4 U ‘4 ti 00.4
40 ‘-u- «0 5 0. u-—u-- 0u-—u-zz 2227-222 zzzzzzzzzzzz——N
o .40<ruIzzzzzowz 4<4— 2-SE 0000000 O 00 0000 00-20 0
— 4 CC -i E O O O O O > O iii « CC CC CC <<4 — —
-‘ >J 4 bt 00
3230 <000000 -4.44 e’ -a o e, u ti u uuuUuCJJrJUtJUUUUUQJU>—OO
0<u-Z)oU)n’0-s)N 00000’.) .4.4—> Ce Li CC a (4 CC CC
1.> ecu—e -c .4 -e -e —t —C 4 -4 tu ODjOZO, O 04>00 CC 00 0 Ci 0 4> 05 500 CI 2 -0
-t w .4 “ a a re e: ci -CC CC CC CC a a a C ti 0 s) O -J’t -Ji en 0) U A ti) A tfl u) u. 1) 4 tI 0 ¿1 >2 Ji O A 0’ Ci) 4 4
5-> O a o o o o a o •.i o —, O 0 -D C) ca tu O O 00:: ti Z1 O O Ci O 4> ~4>-fleJOeJdtfl02>2~O0Ofl0t3UU
<<.4 4< 4< <4 4<C< <4 .4 CC <4-’ <<-C<<<4 <4 <444<C4<4<4<<4 <4<44
Oooooooooooe,oo 04-001100 —000 ti) O O O O lO 0 0 0 0 0 0 0 0 0 0 0 0 0 o o o
O 0’fl04fl51-flO040OSfl< -Cfl-fl@Nii--4 ‘004-e Ot01OS411ti’O0.NtiflDS4tOS
flO3fl <o——eJ CJOfl ‘C’uflSO’O-. — — ci ci tu, a u-
Cfl0’U2 N O> Cje-tu e-Z<lflNt’>fl Ci ti 4<
u- u- PC 4 flhl<Útl ‘O 00 ‘0 .000
e—u
ci
(ti
‘4 3
:4 tun
u -rl
0’
-a 5’
4 .44 4’
—4 ‘4 .4 ‘-‘4 .4
4’ .4 CC 4 tui - 4
4 5 .4 oi 1~~ OZ4
‘4 ‘4 tJ O— -4
4 <CC I.~2 5 O,-’ ti
cx>- 5 >- 0.4 ti >142 5-,
-4 —z ti, 2 —U’. 1- <<tus ¿
Co ‘.1 - ti> E 0’CC>- 4 ti>
5--. ‘1414
.45-> 1
0 5 u-
«:4—
- 41-0.4 u-
E CC 4 qi~ 05 tu> ti ‘-u 19
ti> 5 Iii 1 .4 NS -3 — 030V~ W4
u- 40044 tI> 5 ¿1 <ti, It -t 55555
4<CtCiCilCtCr WWQ 5 u’
y, 4 41-U 5 2 004W tU 5 5 4
<tCJ4U4 Vta ti,
o o cx 4 11>00> 4 ti> O u- <A> U > O It
A>, .4 u.’ -c o—-e -4-ea> O O. L~J .4 4. — 4~ 0 4 5
tui 4 —¿ -% o tu> 2 0 4 ‘ 4 ,— 0 44 wt~
ci 5-> utt>Uucc Vi 4 CtrrlqU LI 4> —‘ u.> 1L tu 3 4 un <U fl<CUOQZ> 5 O
4— — Z — u- u— .4 0 tAJ— u- w1-ta-4 4 4’ C5- U > — ~ > >. tui < -4 4-,
E Ci:ZZ4 — ‘0. 00 3 0i 0> <>40. .4-’”; ‘1> .42 445~jI .4 3
E 4 i—UáQJIA>14 o-u cxci tL4E2 4 ~A —zQá -t O O t> Ci> -‘ tAJ-J4VItultivIu’~ 4
o 2 «SN—’-<CJV a-CC 5 ci % la 5 <.4 4 41 2 5 >-
-cujwo SO0’ZUO:4¿4rii
>44 .4 -a
— ——al .4 Da LI Z tui liS 2 iii 5 u’, Aa >4 .4
tui o ti44<Z- ti.S a4 04—Su-’. 5 5w’ <Ci, <4SSCC 25t’-tN ZNNU - 4
4 W0’NNCJ u” u-oea 2 .4 -:4 — 0 5 <0 ¿2 tui
o. E CC It> O O — .4 <40 0.4< 2 14 5 Ci> 4 U .4 Vi <e • 5-A 2 u O -j U tu> Z<-.—taoíuo 1.> u-
tui O SCJCZCCVN
5 •‘, 5 4 tAl
ÑUN lo- Cii CC
u,
1- 1-41405 Oso-u-,; t-J t4 -e U 5-.> tJ ~.S1- — 02
4 — — < ti U 14 (1 3 U 42 tu VA .4 </t (-3 tu. —- u.cujU 2 > -~ — 4 .4 ~> tj ‘.» 14 :4 .4
1400 —xzo’jDeaO CeED’)> o .4 <e tI) .4 CC LOW< <u- 44<A.MW24<.4U u
o 5-il1- — U ~4 1.>
— Vi tul 4 4 .4
— W44< — U Ca 13 u— — 4 CIA <Utl 4 O Vi u- UI 3 CC o- 0. U> .4 CI, .4-
o> 0. ~ Ul—NitjlCi o, u>-> <4 2 t Ci ~1 « <e ti> VA 4 ¿ 4 444 Ca E > tI 0. u>
.4 Iii .4 3 4 -< 4 5-1 (4 0 tU CC tui ti 4 tAj Cl 5-> u- .4 01U tAJ (ti u.> U EL EL EL tu. tL.4 <-4 o- tI-> -3
tL13UXLL4 .4zao-cctutcta CCttCCh1-..> o. O VI ‘.45-> Vi 01<- -eU Ca O 1.-: ‘A>
0. 2 e
4 U cx SC’—
SCC SCC4W u- 04
Cd Ch-h 20.3
2> 7~0. O :4
O O
1<1 u-
u> e.,> 4 2
4 4 CC Ci
<e CC 0> 5-’
a, .4 —
-.4 .4 4
2 o o
o O 04
tI “2 -4
4 0>
o- e->
3—
o
u--
‘4
--4 5
.4
a4
‘-4 EA>
-4 ti> o 5
CC .4
4 0. 24
0. -4 o
ti> >4tui ‘4
5 5 ‘4 0>- 5 0>
4 0 4 CC 4 - 42 4 0
42 4 4 O .4 o-ti 4S 5 5
~0. ti> u-— 4 2 -e JA
4-4 5 itt -4 < u’) <UNO 4 0
Ci, o cl ‘4 — clIn — 5
-‘e CC o 5 <.4 4<4 14 00 CC 4 It>
‘0 50’C o -4 -4 .4-4 4<2 22 -< O u—
‘a u- -> ti> 4 4 2 cx ‘4 ce WC> ECl e- -e
:4 Ji tI — 3 u 4 4:4 4
‘a
>—‘-u0<-
u> u.) z
u-. ti>
U> U 0 4 u -4 CE a I~4
‘o
— 4 <.4
E
.4
00 CC 04 04 01- —<1414 CC
e OO’- u-— 0>4 o 0>0’ <42414 3 <2 >4
202 x a <44 E o z-~,i~> u- tu.
W4h-’-”J
1-4142 34 34 — 3002 O 0 0—4 «Dcxc u 4,> tAi
5 11>30 a’— Lo. - 3 2W 4 .-U>U Su-u” a <-u O
ti 42 o 4 4-> CC 5-> 4 141134 o Su.’ 5 Ci, 14
:4 -w CC Li> (U zaula (u 455 u o tiC’. AligO 5 tu 5
UOiifl QN tui —u- 5 4 1.> 45 1-00-4 u. :4 CC
~—500. O 4 4142 42 UiZZ 0— 42— -ji 240<0 2 522
oc>
0214 tiz O CC 0=4< «U, u-OC Ou’iuc> -<u-- « LLLN 4—
CCXOOO 00 4 3 OQt4N u-O —<e uN 4 — o e
t/>~-.i u.-’ NUUU~
o u—> o o
O 0-’ 2 1- tu > -c 01 5-1
Ci’.-’ <1- Z<J’C —e C E ¿ <e Auu «2
4 CC aic> Z4 13.44<.4 E ‘4< --u u- u- 43 41<4<3 tu — — u>- ti 5->
CC— <.4.4 ci t <A o ti> « 2 13 U —- 1-— —
<4 2 —, -, ~i -‘CC 1~-ti> ‘<404 —
Dvi viere t<.
~~~<
U AL :t> 14 U tIlo -4 0. 0433 012 1400 ~J-j. <Y ‘4 0 tI Ci U u W322U1<A
o u—- — — u- u-— o 4 0<041/> Dlii (-¶4< 4< CtuUUUUC 00 E.> tAu tI> ti>
O o u—
O o 2 O
-4 <CC <CC e u-te tea .4 <ea
.4 40 —u- oW ti u—Oh- os-
.4 .10. O > 4~ ~: tija 2 3.
4 CC .4 2 O
3 3 :4 3 0
o o .4 u- CC 02 4~
It CC u- cx .4 4 4
-4 4 4 ti .4 cx - CC
tu e, QJ 02 -0 w
4 4 4 4 4 4
o o O o o o O
-o ‘0 tI-> 04 1~> 8~ 0>
ji, pi o ~0 ~O
4 4 4-, ti,
1’- ir> 4
Capítulo 3

documentalista en la actualidad en el Centro de Documentación de Fundesco, y aprendiz


de Lasso de la Vega por aquellos años, según él mismo expresa, nos habla de la creación
de una lista de palabras clave en el año 1974, que podría considerarse como el primer
indicio de elaboración de un tesauro en España35. Los problemas que se tuvieron que
enfrentar para su elaboración, derivan de la dificultad de traducir o adaptar al español
conceptos especializados en el área de las comunicaciones, en aquella época; conceptos
como teleinformatique, por ejemplo, que traducían por teleinformática -ahora telemática-,
o software, que se denominó soporte lógico, etc. Resultado de aquella lista de palabras
clave fue el Tesauro de Fundesco, que no se publicó hasta 1987, dos años después de que
se automatizara la base de datos.

El Tesauro de Ciencias de la Infonnación fue el primero elaborado en nuestro


país; lo realizó Antonio García Gutiérrez y figura en el segundo volumen de su tesis
doctoral: Normalización de la documentación informativa: Propuesta de tesauro español
de las Ciencias de la Información, presentada en 1982, y dirigida por el profesor López
Yepes. Se trata, por tanto, de un tesauro realizado en el marco de una investigación sobre
lenguajes documentales, que tras previa actualización editó, en 1985, en tirada limitada,
IBERCOM (Centro de Documentación del Departamento de Documentación de la
Facultad de Ciencias de la Información de la Universidad Complutense de Madrid). Tuvo
un tiempo de aplicación en la Base de datos de Comunicación social de IBERCOM,
centro adscrito a la Red COMNET de UNESCO, y posteriormente fue uno de los textos
fuente para la construcción del Tesauro de Comunicación e Información, preparado por
Jean Viet, auspiciado por UNESCO y la FID.

35
Aunque ésta fue la primera manifestación práctica de creación de un tesauro, Lasso de la vega ya se había
ocupado de ellos a nivel teórico, con anterioridad. Concretamente en el articulo titulado Organización de la
documentación por palabras y descriptores específicos de materia: los “¿*esaun¿s”. publicado en 1966, en el número
6 de la revista Racionalización. En dicho trabajo, el autor ofrece información sobre la elaboración de tesauros para
la organización de los servicios de información y el empleo de los ordenadores electrónicos.

123
Capítulo 3

3.3.3.1. Otras referencias y proyectos de tesauros

Para conseguir datos concretos sobre la construcción de otros tesauros en España


recurrimos a fuentes impresas que mencionaremos a continuación, así como a fuentes
informales -

De los datos aportados por las fuentes escritas tendríamos que destacar su escasa
fiabilidad, en líneas generales, de acuerdo con la falta de rigor de la información. La
excepción a esta tónica la constituye un artículo que bajo el título Desarrollo de
lenguajes documentales formalizados en lengua española, publicó la Revista Española
de Documentación Científica en 198936. En él se hace referencia a la existencia de 12
tesauros españoles en esa fecha, cuya existencia pudimos comprobar documentalmente.

Analizamos las ediciones de 1987 y 1994 del Catélogo de recursos terminológi-


cos detectados en lengua española, publicado por el CSIC. Este repertorio no nos sin’ió
de gran ayuda, dado que es quizá la fuente con mayores imprecisiones que consultamos;
creemos que los errores que incluye pueden deberse a que su confección se basa en
informaciones recibidas en el CSIC mediante encuestas a bibliotecas y centros de
documentación, cuyos datos no fueron contrastados, y al uso generalizado del término
tesauro para denominar cualquier tipo de vocabulario. Si bien es cierto, peca el
mencionado repertorio de otros fallos tales como la repetición de las mismas obras en
numerosas ocasiones, y no aporta datos a los que, por otra parte remite, especialmente
en lo relativo a los organismos en los que señala la existencia de determinados documen-
tos.

36ALvARo BERMEJO, C.; VWLAGRA RUBIO, A.; SORLI ROJO, A. Desarrollo de lenguajes documentales
formalizados en lengua española. II. Evaluación de los tesauros disponibles en lengua española. Revista Española
de Documentación Científica, y. 12, n0 3 (1989) Pp. 283-301.

124
Capítulo 3

Dadas estas omisiones, no fue tarea fácil dar con las fuentes originales que
aportaran la información exacta y documentada de los supuestos tesauros. Queríamos
comprobar uno a uno todos los datos que nos ofrecía el Catálogo. De [osmencionados
tesauros por dicho repertorio, no todos resultaron serlo. A continuación mostramos
algunos ejemplos de ello:

- En relación con un denominado Tesauro de Ciencias sociales, Silvia Serrano,


documentalista del Centro de Información y Documentación de Barcelona (C1DOB), a
donde remite el Catálogo de Recursos Terminológicos para su localización, nos confirmó
su inexistencia. En dicho Centro indizan únicamente con los siguientes tesauros: el de
Unesco, el de la OIT y los de Urbanismo, Economía y Topónimos del ISOC.

- En cuanto a un Tesauro de Comercio Interior, publicado con fecha 1972,


detectamos la imprecisión en el momento en que vimos dicha fecha de publicación, a
todas luces demasiado temprana en lo que a edición de tesauros en España se refiere.
Consultamos en la biblioteca dependiente de la Dirección General de Comercio Interior,
al haber dejado de existir en los años 80 el Instituto de Reforma de la Estructuras Comer-
ciales (IRESCO) -institución a la que remite el Catálogo de recursos terminológicos-. En
la biblioteca de Comercio Interior nos aseguraron que nunca existió tal tesauro, y que
debía tratarse de un vocabulario que se elaboró en un centro de documentación sobre
comercio interior que se creó en el IRESCO, y que estaba basado en ¡os términos que
recogían de la información que iba llegando al Instituto.

- En el Instituto Eduardo Torroja de la Construcción y el Cemento, nos


confirmaron que nunca ha existido un Thesaurus de la Construcción y Obras Públicas.
Nos inclinó una vez más a efectuar la comprobación la fecha -1972- que recoge el
Catálogo de recursos terminológicos. La única herramienta de indización con que han

125
Capítulo 3

contado en el mencionado Instituto es un Léxico de la construcción37, con depósito legal


fechado en 1968.

- Nos referimos, por último, al Thesaurus español-francés de Ciencias de la


Tierra, del Instituto Geológico y Minero de España, en la actualidad denominado Instituto
Tecnológico Geominero de España. Alonso Sánchez, documentalista del centro, nos
comunicó la existencia de un amplísimo léxico de más de 15.000 términos, de
actualización periódica, cuya última puesta al día se realizó este mismo año.

Otra fuente consultada fue el Centro Argentino de Información Científica y


Tecnológica (CAICYT), organismo que centraliza la información relativa a publicación
de tesauros en lengua española. El Centro tan sólo tiene registradas dos versiones en
castellano de tesauros internacionales, concretamente el Tesauro de carreteras, del
Ministerio de Obras Públicas y el Spines, de la Unesco; y cinco tesauros españoles: el
Tesauro de Servicios sociales, del Ministerio de Trabajo y Seguridad social, en su edición
de 1986, el Tesauro ISOC de Urbanismo, en edición de 1988, Tesauro ISOC de
topónimos (1991), Tesauro ISOC de Psicología (1992) y Tesauro ISOC de Economía
(1992)38. Como puede observarse, los lenguajes que figuran en el CAICYT tienen fecha
reciente, lo cual no aporta información de utilidad sobre el tema de estudio.

La consulta a la Base de datos Thesauri, del distribuidor de la Comunidad


Europea Echo nos dió un resultado negativo, ya que no tienen registrada en dicha base
la existencia de ningún tesauro español.

37INSTITUTO EDUARDO TORROJA DE LA CONSTRUCCIÓN Y EL CEMENTO. Léxico de la


construcción. Madrid: 1. E.TCy C., 1968.

~ referencia bibliográfica completa de estos tesauros se incluye en el epígrafe 14..- comprendido en este
mismo capítulo.

126
Capítulo 3

En cuanto a catálogos de bibliotecas, obtuvimos informaciones repetidas,


confusas y poco fiables, en términos generales. Una vez más tenemos la sospecha de que
la imprecisión terminológica con que se emplea el término tesauro es la causa de dichas
incorrecciones -

Del análisis de los repertorios y directorios a los que tuvimos acceso, apenas se
obtuvieron referencias de tesauros construidos en España. Algunos de estos repertorios
se referían a tesauros de difusión internacional, con edición española, pero no realmente
a tesauros elaborados en nuestro país. Los directorios consultados fueron: Bibíiographie
des thesauri et index par mati&es parus depuis 196O~~; Thesaurus guide: Analytical
directory of selected vocabularies for information retrievaY% publicado por las
Comunidades Europeas, y que revisamos desde la edición de 1985; Bibliografía de
vocabularios, tesauros, encabezamientos de materia y esquemas de clasificación de
ciencias sociales41; Tbesauri used in online databases: An Analytical Guide’t
Bibiiograpby of United Nations Tbesauri, classifications, nonienclatures43 y,
finalmente, Annuatre des tbésaurus suivi d’un index par domaines et sous-domaines

39LAIJREILHE, MT. Bibliograpbie des thesauri et Índex par matiéres parus depuis 1960- Paris:
-Bibliorhéque Nationale, 1975.

40THESAURUS guide: Analytical dfrectory of selected vocabularies for information retrieval/prepared


fiAr Information und Dokumentation for dic Commiss¡on of the European Communities.
by Geselis Cbafl
Amsterdam: North-Hoiland; Luxembourg: Office for Officiaj Publications of rhe European Communities, 1985.
41B1BL1OGI~~ de vocabularios, tesauros, encabezamientos de materia y esquemas de clasificación de
ciencias sociales (mono y plurillnglies). Preparado por la Biblioteca Aslib en colaboración con Jean Aitchison y C.
O. Alíen. Paris: Unesco, 1982.

42CHAN. LM. & POLLAKD, R. Thesauri used in onhine databases: An Analytical Guide. New York, etc.:
Greenwood Press, 1988.

43BIBLIOGRÁPHY ofunitedNations Thesaw-¡, ciassiflcatians, nomenclatures. Geneva: Inter-Organization


Board ter Info¡-mation systems, 1979.

127
Capítulo 3

couverts par les tbésaurus et d’une Liste des Organismes auteurs”, preparado en
Francia por el Bureau National d’Information Scientifique et Technique.

El único repertorio en el que se registra información relativa a España es en la


Bibliografía internazionale di tbesauri45. En ella se hace referencia a un Thesaurus
jurídico inteligente. Proyecto trienal de la Universidad de Zaragoza para la recuperación
automática de las normas de la Región de Aragón y a un Thesaurus del sistema di
documentazione deitraaati internazionalí/International treaties retrievalsystem di esaurus,
denominado IBERTRA T, editado por el Ministerio de Asuntos Exteriores, ambos sin fecha
de publicación. El primero consiste en una lista de términos recopilados con objeto de
crear un sistema experto en materia de Derecho. Al frente del proyecto estaba Emilio
Suñé, quien presentó una ponencia en el “40 Congresso Internazionale sul tema: Informa-
tica e RegoLamentazioni Giuridiche”, celebrado en Roma en 1988. En la ponencia,
titulada Los tesauros en bases de datos de usuario, se da la siguiente definición de
tesauro: --- es un conjunto de descriptores, que tienen la posibilidad de estar aclarados
en su alcance, relacionados de diversas formas entre sí, y aglutinados esencialmente bajo
un criterio alfabético de ordenación. A esta definición le sigue un párrafo, en el que el
autor se expresa en los siguientes términos: Por extensión, emplearemos también el

término tesauro para definir cualquier lista de palabras, incluso cuando sean obtenidas
automáticamente, que nos den acceso al fondo documental de la base de datos.

Este uso de la palabra tesauro es ilustrativo de la confusión que ha existido a lo


largo de los años, y sigue existiendo en la actualidad, a la hora de diferenciar un tesauro

½UREAU NATIONAL D’INFORMATION SCIENTTFIQIJE ET TECHMQUE. Annuaire des tbésaurus


suivi d’un Índex des domahies et sous-domaines couverts par les Ibésaurus et d’une Liste des Organismes
auteurs. 3’ ed. Paris: Comité de Coordination des Thesaurus Sectoricís, 1975.

45¡uzzo, 5, Bibliografía internazionale di thesauri/lnternational Bibliography ofchesaurí. Roma: Camera


dei deputati, 1987.

128
Capítulo 3

documental de una lista de palabras clave o de cualquier otro Lenguaje de recuperación


de información.

En cuanto al denominado Tesauro IBERTR4T, consiste en una lista de palabras


clave que recoge el nombre de ¡os tratados suscritos por el Ministerio de Asuntos
Exteriores con otros países de habla hispana, que en ningún momento se llegó a editar.

Dada la inexistencia de otras fuentes impresas en las que recabar algún punto de
referencia fiable sobre los primeros tesauros españoles, intentamos la conexión con
fuentes informales -

En conversaciones mantenidas con especialistas del área, obtuvimos las


informaciones que se detallan a continuación:

En opinión de Sánchez Nistal, no existieron tesauros de creación española hasta


principios de los años 80. Esta carencia se suplía en el ISOC con el uso de tesauros
multinacionales para recuperar en bases de datos internacionales. Parece, sin embargo,
que la necesidad urgente de manejar útiles propios para la recuperación e intercambio de
información impulsó la creación de tesauros propios en materia de ciencias sociales y
tecnología. El primer tesauro que se elaboró con este objetivo fue el de urbanismo, que
ya ha sido objeto de revisión en fecha posterior. Los primeros lenguajes especializados
eran financiados por proyectos de investigación y nacieron paralelamente al desarrollo
de las bases de datos.

También en los años 80 se empezó a trabajar en programas de gestión de bases


de datos, que incluían, en teoría, gestión de tesauros. Aunque no se trataba de programas
específicos para elaborar estos lenguajes, ayudaba a hacerlos y a explotarlos. Hasta 1989

129
Capítulo 3

no se dispuso, sin embargo, de un programa específico de elaboración automática de


tesauros en España. Antonio Avía fue el primero en hacer una aplicación informática de
este tipo. Lo llevó a cabo en el programa de gestión de bases de datos para microordena-
dores dBASEIlI, que está actualmente en vigor; se trata del programa ANDAMIO, que
consiguió poner en marcha tras varias pruebas realizadas en 1988. Se ceñía estrictamente
a las fases de elaboración que estaban previstas en el ISOC, a esta ventaja se unía la de
estar pensado en exclusiva para la lengua española y la de permitir el trabajo simultáneo
en varios tesauros al mismo tiempo, sin limitación de memoria (para número de
descriptores o número de caracteres por descriptor), a diferencia de otros programas.

Amelia de Irazazábal, componente del grupo de terminología del ICYT, sostiene


que en 1970 se empezaba a hablar y a trabajar con estos lenguajes documentales, cada
uno en su despacho desarrollaba sus propias experiencias en materia de elaboración de
tesauros, lo mejor que sabía, sin ningún género de coordinación o normalización.
Coincidiendo con aquella fecha el Instituto de Racionalización y Normalización
(IRANOR) -que por aquel entonces pertenecía al CSIC-, conjuntamente con el Centro de
Cálculo, de la misma institución, hicieron la versión española del Tesauro de la Unesco.
También por esos años se hizo la adaptación española del Tesauro de política científica
del mencionado organismo, el Tesauro Spines. Esta fue quizá la tarea más comprometida
en aquella época en materia de tesauros, dado que el Spines es un tesauro de grandes
dimensiones, compuesto por un campo terminológico muy amplio. De cada uno de los
33 campos temáticos que lo componen se hizo cargo un especialista, quien tradujo,
adaptó y normalizó su terminología de forma independiente, procediéndose después a La
unificación de todos los campos.

Amelia de Irazazábal nos facilitó, igualmente, un informe inédito, fechado en el


CSIC, en 1982, bajo el titulo Evolución de tesauros en España. Algunos problemas en

130
Capítulo 3

su desarrollo46. Dicho informe hace referencia a la Conferencia Iberoamericana sobre


Información y Documentación Científica y Tecnológica, REUNIBER’78, celebrada en
Madrid, con la colaboración de la Unesco y de la OEA, y organizada por el ICYT. En
la Conferencia se trataron de sentar las bases para la coordinación de esfuerzos en
materia de construcción de tesauros, poniéndose de manifiesto la semejanza de los
problemas existentes en el campo de los lenguajes documentados controlados en lengua
española47. En el marco de REUNIBER’78 se creó un grupo de trabajo sobre Lenguajes
documentarios coordinado por Argentina, y con secretaría en el Centro Argentino de
Información Científica y Tecnológica (CAICYT). Este grupo publicó en 1981 un
inventario de lenguajes documentados no tradicionales en lengua española y/oportugue-
sa,48 entre los que figuraban once tesauros desarrollados en España, que se mencionan
en el informe del CSIC, y cuyas características comentamos a continuación. Antes de
analizar dichos datos queremos, no obstante, advertir de la existencia de imprecisiones
del concepto de tesauro, patentes en el informe, fruto probablemente de la escasa
información y bibliografía en español, en esa fecha, sobre los lenguajes postcoordinados.
Es común, por ejemplo, identificar un tesauro con un léxico, que no es sino una simple
lista que respeta un orden lexical; también se le asocia con un índice, es decir, con listas
organizadas en las que cada concepto envía a las referencias. Por último, se le confunde
con un diccionario, con el que tiene diferencias estructurales, de contenido y de finalidad.

46[RAZAZABAL NERPELL, A. Evolución de tesauros en España. Algunos problemas en su desarrollo,


Linéditol. Madrid, 1982.

47IRAZAZÁBAL NERPELL, A. Op. cit.

48IRAZAZABAL NERPELL, A- Op. cit.

131
Capitulo 3

Las referencias del informe son las siguientes:

1. Tesauro sobre aplicación de telecomunicaciones al desarrollo


(en proyecto) Fundesco, a cargo de Lasso de la Vega.
-

En la fuente documental no existe fecha de referencia de este proyecto. El


documentalista de Fundesco Pedro Arévalo nos facilitó la fecha de 1985 para su
realización y 1987 para su publicación, como mencionamos anteriormente.

2. Tesauro sobre Artes del espectáculo. Español y catalán. Barcelona: Biblioteca y


Museo del Instituto del Teatro. Irene Peypoch i Mani.

El denominado Tesauro sobre artes del espectáculo tuvo su origen en un catálogo


de materias y conceptos que se empezó a elaborar en 1970. En 1988 dicho catálogo se
pasó a formato de papel, presentándose como una lista de descriptores coordinados.
Según nos indicaron en la propia biblioteca, se hizo un intento de construcción de un
tesauro en base a esos descriptores, pero sólo llegó a crearse un borrador de carácter
experimental. Los responsables de la biblioteca desconocen la existencia de algún
ejemplar para poder comprobar con exactitud sus características estructurales. En
cualquier caso, el supuesto tesauro nunca se aplicó al tratamiento de la documentación,
ni se publicó.

132
Capítulo 3

3. Grasas y detergentes. (Lista de términos)49. Instituto de la Grasa. CSIC, Sevilla.

En 1970, en el Instituto de la grasa se empezaron a asignar palabras clave


(descriptores) a cada uno de los documentos -que denominan documentos originales -

publicados en la revista bimestral Grasas y aceites, editada por el mencionado instituto.


Dichos descriptores se tomaban de un Tesauro de Materias grasas y sus derivados,
elaborado por los servicios bibliográficos de la institución. Analizadas las fuentes (figura
32) comprobamos que el denominado Tesauro de Materias grasas y derivados consiste
en una lista de palabras clave sin relaciones semánticas entre ellas y sin organizarse en
ningún tipo de estructura en particular. La ausencia de una estructura tesaurizada y su
disposición en un fichero manual permite la actualización de la lista, de publicación
anual, que se va nutriendo de nuevos términos a medida que van apareciendo en el Índice
de “palabras clave” de los “documentos originales”, pero que, en ningún caso, constituye
un tesauro.

4. Lista de descriptores de qu(mica industrial, electrotecnia y metalurgia. ICYF.

Ninguna persona relacionada con el tema, tanto del ICYT, como de empresas
eléctricas, tiene conocimiento de su existencia.

5. OCDE DIC (1974)


-

Cuando iniciamos la recopilación de datos acerca de este tesauro partíamos de la


sospecha de que la fecha señalada en el informe no podía corresponder a una versión

49
La información relativa a esta referencia la conseguimos directamente de Carlos Gómez Herrera, promotor
de la lista, actualmente jubilado, quien gentilmente nos explicó los pormenores sobre el origen del Tesauro de
materias grasas y sus derivados.

‘33
ó-g~ Palabras—clave Restantes gatabras—clave del mismo “documento original

74 Acelie de hígado de bacalao Acido graso poliinsaturado (obtención) Método de los compuestos —

de inclusión de urea.
08 Aceite de huicungo
(caracterización) Astrocaryum macrncalyx Esterol Glicérido. — —

49 Aceite de oliva Aceite de girasol Aceite de girasol alto oleico Antioxidante


— — —

Enranciamierito.
79 Aceite de oliva Análisis estadístico Estudio colaborativo Parámetro de
— —

pureza.
55 Aceite de olive <extracción) Decantador centrífugo horizontal Transformación (rendimiento) —

99 Aceite de olive virgen


(extracción) Parámetro de calidad Sistema continuo en dos fases Variables
— —

del proceso (influencia de).


30 Aceite de salvado de arroz Arroz precocido Secado al aire (efecto del) Secado en
— —

microondas (efecto del>-


96 Aceite de semilla Acido graso (composición) Brunfelsia uniflora (Solanaceae).

1 Aceite de semilla Desierto de Sonora Estudio físico—químico Leguminosa Méjico


— — —

<3 Aceite de semilla de Calentamiento continuo Calentamiento intermitente


— —

calabaza Propiedades tísico—químicas (cambios).


‘9 Aceite de semilla de uva Acido graso Dióxido de carbono supercrítico Extracción
— —

supercritica.
~5 Aceite de soja Aceite esencial Efecto antioxidante.

i6 Aceite de soja Calidad Información tecnológica Producción.


— —

>7 Aceite de soja Formulación de productos Información tecnológica.—

;5 Aceite esencial Aceite de soja Efecto antioxidante.


‘6 Aceite vegetal Cromatografía gaseosa Escualeno (determinación).


‘8 Aceite vegetal Emulsión Ester de sacarosa Mayonesa Viscoelasticidad


— — — —

Viscosidad.
i4 Aceite vegetal Grasa vegetal Propiedades físicas.

~1 Aceituna verde de mesa AscoJane tenera var. Cromatografía de afinidad sobre cobre

inmovilizado Fenolasa (fraccionamiento>.


.3 Aceituna verde de mesa Color Conservación (efecto de> Chalkidiki (variedad>


— — —

Tratamiento habitual (efecto del>.


4 Acido fenólico Semilla (humedad) Torta de semilla de colza.

5 Acido tos!atídico Actividad tirosina quinasa Diacilglicerol quinasa Fosfolipasa


— —

D Información (artículo) Receptor.


— —

9 Acido graso Aceite de semilla de uva Dióxido de carbono supercrítico


— —

Extracción supercritica.
3 Acido graso (composición) Aceite de semilla Brunfelsia unhtiora (Solanaceae).

2 Acido graso (contenido en) Aceite de aguacate Aguacate Maduración (influencia de>.
— —

1 Acido graso libre Cromatografía en capa fina/detector de ionización de llama —

Destilado de desodorización Esterol Hidrocarburo — — —

Triglicérido.
4 Acido graso poijinsaturado
(obtención) Aceite de hígado de bacalao Método de los compuestos de

inclusión de urea.
1 Acidos grasos esterificados
(composición) Cuajo animal Cuajo vegetal Queso de Los Pedroches.
— —

O Actividad antimicrobiana Agente tensioactivo anfotérico Estructura química — —

Propiedades tensioactivas.
5 Actividad tirosina quinasa Acido fosfatídico Diacilglicerol quinasa Fosfolipasa O
— — —

Información (artículo) Receptor. —

O Agente tensioactivo Actividad antimicrobiana Estructura química Propiedades


— —

antotérico tensioactivas.

Figura 32. Tesauro de Materias grasas y derivados :1.34


Capítulo 3

española, por parecernos prematura. La versión más antigua del Tesauro DIC en lengua
española parece ser la editada en 1982, que se corresponde con la edición internacional
de 1979 más las puestas al día de 1981 y 1982.

El Tesauro DIC tiene su origen en la base de datos DIC (Documentación


Internacional de Carreteras) y su principal característica externa es la forma de
presentación gráfica flechada. La versión de 1982 corrió a cargo de FUINCA (Fundación
de la Red de Información Científica Automatizada> y fue realizada por el grupo de
expertos formado por Juan Ignacio Sacristán de Lama, M~ Teresa Iglesias del Pozo y
Juan Ignacio Cuesta Benito.

6. Tesauro sobre medicina del trabajo, seguridad e higiene <en elaboración) Servicio
-

social de higiene y seguridad en el trabajo. Instituto Territorial de Barcelona.

Consultadas las fuentes oportunas, averiguamos que no existe ningún tesauro sobre
la materia. La información responde al error tipográfico de una revista que editó el
Instituto Territorial de Barcelona, en la que se anunciaba un curso sobre elaboración de
tesauros. Se trataba, en realidad, del Tesauro de la Organización Internacional del
Trabajo (OIT). En las figuras 33 y 34 se pueden observar la errata y su enmienda en
edición posterior.

7. Nomenclatura codificada de diagnósticos (base para un tesauro de terminología


clínica). Facultad de Medicina CSIC, Centro de Documentación de Informática Médica.
Valencia (1972).

Se trata de un amplio listado de términos sin ningún tipo de relación semántica


entre ellos, organizados por número currens, con cinco dígitos, que hacen posible la

135
Capítulo 3

ampliación de la terminología. La obra presenta dos partes: la primera, numérica,


mantiene las grandes categorías de la Clasificación Internacional de Enfermedades de la
Organización Mundial de la Salud, y reúne más de 14.000 formas diagnósticas. La
segunda consiste en un índice alfabético (figuras 35 y 36).

Su autor, Eduardo Agustí, tenía la intención -según informaciones de Julia Osca,


responsable de la biblioteca de la Facultad de Medicina del CSIC- de elaborar un tesauro
que no llegó a realizar, y nadie retomé su iniciativa.

El compendio constituye una riquísimabase terminológica que, por sí sola, facilita


el almacenamiento y recuperación de información, pero que podría transformarse en una
herramienta más eficaz, previo establecimiento de relaciones semánticas entre los
términos que recoge en sus 697 páginas.

8. Versión española del Thesaurus de ¡‘A ssociation Franpaise pour ¡‘étude des eaux.
(en elaboración) Tarrasa. Asociación nacional de ingenieros industriales. Departamento
-

de Documentación.

El único lugar en el que conocen algún dato sobre la existencia del thesaurus es
en el Colegio de Ingenieros de Cataluña, en donde tenían una vaga idea de que una
persona, jubilada en la actualidad, se encargó de realizarlo, pero no supieron darnos más
información al respecto, ni localizaron ningún ejemplar.

Los datos obtenidos de personas relacionadas con el tema permiten confirmar que
la versión española del tesauro no llegó a realizarse, quedando en simple proyecto.

136
cn
rl
KJL!2L ‘O
-H
1U f.
~-•- U)
a)
II
‘- ‘-5 a)
‘o
¡ ~ a
C •, HE
m
I~3 -- -~
~, e
‘oa)
— ~
a’ e • 4>
— .0 Z ~,
ea —— c~ u —
. U ~ -~ 0 0 , — 4<0 Z ‘
— CO C~ aÓÉ4u>.a>W
4> - O o.
:ti,
~ ‘E~ ~ -~ < t
k -
~1 .i~:k~ZV-~Á~¿
o ~‘ ~ tw’~
~u,
o.” o 4,
¡ — 0>
C0t .44>
v.r,.w 4>—C¡ , - -
‘o
~ ,.0>5¿ ..t — -~ L40 .,~ ~ -p
(4 ~O OC -rq~ ~ ..,~ -
o ~ :iJ~ ‘.;~gz¶~o .E ~ ~-4~ ~
‘O ~-a
~ 4• u~ ‘- ~ u ~o a, -v E
u u~ o.
E -~
~ ~‘• F-
— 1~>
~ t~, nf
~ .3 ~ 8 Z ~ ~ OX o ~ • •
eDFs~t~UO~0YvnOUU&O~> Co

o a a 1
‘4 . - . . z
—. —
0 - < —1
“ - ~-
afl -H
‘o <0 <0
<1
‘o
~1 ¡
1..
..tttt*tSflÉI~4St,.~Ñ,k.~ 1> I~~~.>•tT~’•I — ..u4,nflthá. ‘2 5W. -fI ¡14 1. ,
N
‘2
a) (t,.
-H
cs~i
~o
-H bO
CC,
dujo
•c lun
11-1 0
-H a) W
-n
E
.0 (fl
a
• z
e ael O. dE—’
OZG)
- - ‘O
o ¡
!.1 oc
•1 -4-’:Ca)a)
o::
ti -4-a -H
CC -rl OC
ji tZ
Co
.!‘
~ 1 x o ca 00
o
~4
i-..< -~
420 oi-ba ~5
2
—w
La
4 o
E.
oE.
m
E.
~ .± .4
“ e- c
so a
a — - ‘o
z4• -
~> e- o
• ..M ¿
E.’
O
¿ E o
01 o --
o
0,
E.
e o u ae
c e • a EJ •
a. u
O
e. u—w o
aE
-0 4-4 E. O
u E, - 4-- - E. EJ
-a o o
O 4- o
£ E. o 1 4
e e- 4I - 1~ u
o o a
.-;~
O¡ 1.
0 a,
4 -~
a J
e u1
0
o4 o • ir 1. <- 1’
¿3 o
E -~ E E --4! u 4-. 1>
u 4-
E.
o c
-...
-wo ¿ o
e-
a
c
-—
o -— Ctflc -
Ixce
4.
E.
e

- ae. 4
-4, u-- El O4--
e u 4-
e.
0q
r. ---ID o — c-
LO~
la— o ID e
o 3
t~ -> u -0
04 ~ -¿ -w z
e,
o
o
-~
-x - O ID o e.
E.
<
-
e
-~
c
: ~1’ tn 3
o e ; >. — 1 a,
r
u .1•‘! ~ u c
ID

u
5
a>
1-
5
-j 2
j~ ~
u ‘J 1- ti
r
1—
5 g~ .4’
-J —c
ow
Co’
2 w
-
!
EDUARDO AGUSTI
P;~,fe~or .1 gresaí)o ini e,ino de flnc’¡ ncgí acitn Módico y Su. ini i mcbr le)
Ceutí-o de Docu,nentocidn e ¡nfunndtUa Médica.
Faculbod de Meciucuuua de Valencia

NOMENCLATURA CODIFICADA
DE DIAGNÓSTICOS (N. C. D.)
BASES PARA
UN THESAURUS DE TERMINOLOGIA CLINICA

CENTRO DE DOCUMENTACIÓN E INFORMÁTICA MEDICA


FACULTAD DE MEDICINA
PATROCINADO POR LA CAJA DE AHORROS Y M. DE P. DE VALENCIA
VALENCIA, 1972

‘39
Figura 35. Nomenclatura codificada de diagnósticos
245

57700 ENFERMEDADES DEL PANCREAS


MALAOIES DU PANCREAS
DISMSES OF PANCREAS
KRANKHEITEN DER BAUCH5PEICHELDROSE

57711 NECROSIS INFECCIOSA DEL PÁNCREAS


57721 HEMORRAGIA PANCREÁTICA
51131 PANCREATITIS
57732 PANCREATITIS AGUDA
57733 PANCREATITIS CRONICA
51734 PANCREATITIS PURULENTA
51735 ABSCESO DEL PÁNCREAS
57136 PANCREATITIS HEMORRÁGICA
57737 PANCREATITIS CRONICA
— PANCREATITIS INTERSTICIAL
57739 PANCREATITIS CRONICA RECIDIVÁNTE
57741 QUISTE PANCREÁTICO
57t~ 1 HIPEREMIA PANCREÁTICA
57761 CÁLCULO PANCREÁTICO
57763 CONCREMENTO PANCREÁTICO
57171 ATROFIA PANCREÁTICA
57773. DEPOSITO PIGMENTARIO PANCREÁTICO
57775 FIBROSIS PANCREÁTICA
51777 CIRROSIS PANCREÁTICA
57781 N~CROSIS PANCREÁTICA
57782 NECROSIS AGUDA PANCREÁTICA
— NECROSIS PANCREÁTICA HENORRAGICA
— AUTODIGESTION PANCREÁTICA
— PANCREDPATIA AGUDA OEGEHERATIVA
— PANCREATITIS AGUDA ASEPTICA
— PANCREOPATIA ENZIMATICA AGUDA
— PANCREATITIS HEMORRÁGICA AGUDA
— APOPLEJZA PANCREATZCA
— PANCREATOSIS AGUDA
57783 • NEGROS 15 PANCREÁTICA GRASA
57784 NECROSIS PANCREÁTICA SEPTICÁ
57791 A~JILIA PANCREAT¡CÁ
57795 INSUFICIENCIA PANCREÁTICA

58000 - NEFRITIS AGUDA


NEPIIRITE AIGUE
ACUTE NEPNRITIS
ARUTE NEPHRiTIS

58011 ENFERMEDAD DE BRIGHT AGUDA

55013 NEFRITIS AGUDA


GLOMERULITIS
— AGUDA
58015 GLOMERULONEFRITIS AGUDA
53021 NEFRITIS CATARRAL AGUDA
58022 NEFRITIS EXuDÁTIVÁ AGUDA
53023 GLOMERULONEFRITIS HEMORRÁGICA AGUDA
— NEFRITIS HEMORRÁGICA AGUDA

Figura 36. Nomenclatura codificada de diagnósticos


140
Capítulo 3

9. Tesauro ISO. IRANOR.

En el Instituto de Racionalización y Normalización (IRANOR> se empezó a


utilizar en 1983 el Thesaurus International Technique (TI!), especialmente diseñado para
bases de datos normativas y reglamentarias, editado por la Association Fran~aise pour
la Normalization (AFNOR). Dicho tesauro, compuesto por un índice alfabético
estructurado provisto de relaciones semánticas entre sus términos, se corresponde con una
Y’ edición del publicado por AFNOR en 1980, del que no se recibiría copia en España
hasta ese año, y que incluía las modificaciones surgidas entre 1980 y 1983.

Se comenzó a traducir en dicha fecha en IRANOR y en el Consejo Superior de


Investigaciones Científicas, con la colaboración de AFNOR, y se procedió a su
impresión, para uso interno, en el ICYT. Antonio Valle, especialista en el campo de la
informática del mencionado Instituto, refiere los años 1977-1978 como la fecha
aproximada en la que se comenzó a realizar la versión española informatizada del
Tesauro ¡SO. En esos años prepararon y planificaron la mencionada versión con los

medios informáticos con que contaban: un ordenador IBM 360/44, siendo la entrada por
cinta magnética. Por esa época, únicamente se disponía de una impresora que sólo tenía
el tren de mayúsculas. El recurso utilizado para hacer distinción tipográfica era hacer
varios golpes de impresión repetidos sobre el carácter o caracteres a destacar, ya que no
existía fórmula de impresión en negrita. Como no había letra grande, configuraban un
alfabeto en una matriz de 7 por 7 y, por este sistema, dibujaban dicho alfabeto que
mediante una rutina, expandía la letra y se imprimía sobre la página. Ese fue el
procedimiento empleado para realizar la portada de la versión informatizada del tesauro
de referencia (figuras 37 y 38).

141
oJ
u, U>u, A
u, ti~ u,
u, — u,
u, u, u,
4•~ U U> u’
-J
-a
-J
-J
2222 -J -¡ -J -J -J
& ~& o 000 o
&.e r.n 2-,-.
2222 22*2
2 3 Z
2 U 2
2 mr
2222 2222
4444 4444 • * *
4 4 4 4 *0*
4 4 4 -4 •* *0*
4 4 -4 4 *4*
4444 4444 * * *
Ob
oa:
z
U~
u, u, u, a.
a.
o.
a.
u, u, u,
u, u, a. o. ¡rl
lnu,uI A a. a. a. a. a.
o
-U)
tu tAJ u, tn.Au,
tu tu tu u¶ u, A
tAJ w tu u, A o
tu tu tu u> u, u,
tu tu tu la tu u,u,q~, u~
cn
u,
strrt a)
u> ‘u
z tu tu tu
tu Ji Ji
z tu
u’
tu ia
la tu u’ tu Co
rtttt
U- -
z
OC
————— -H
4-
o
H
o
U)
o
2$
CC
a>
E’
Co
CC
2$
00
O -‘-4
a
o.
e
o
o2 2 2
o o 0
u ‘.3
4 ~ ‘-3 u
-j

Lii
ti 3 —
u
o tu o tu
u
ua
4
E-
2 4 a 4 u 2— $1 u
tu — —ur 4 u a 2
~ -4 —4— 2 2~ E-
a —
tu
00 —
4
y 9—
3 2 ‘4
o
• ~
tu ~
— 40444
u¡0
u.

J4 0~
En
t4 40
no —. 1 4
— fl «44.3 ,—« — « <Ja0
e
—u RoNce-
u.—
W4
e,
¡ —


~ 2~4
“4 0 E”’2



En — U> E- — —Ob
EJE
L.J
:5 4~-J
-it «
tu Ji tu o‘U o—«-i 0= uit
otu tu
o —tua.
‘u s
o’” EM
o
o.«~
•‘uco
‘Q
u :5 o ‘1
-xxan•o= oc-ii a ‘-a’ Aa — o
4.. — 4”’ ‘04440. e. O U 4 a. O 44 4~040 44 <“404’> etfl 04 4EAE~
«~, u «a u <o.
Sr 0 “~
u
=3
«a,
=0 A =0
«0
=0
— E.u IfffI <‘‘it E — a 4 4 4 4 4 —4 — * 4< —4 SA — u
eu Uu U
u
MMu
u
U
e

u
U
u
U
u
4 4 4 4 4 .4 -4 4 4
4
— u,
‘.4 , u,
4 0 -4
2
2
a
2
14
2 O
a-J 02
-. o o 4
Etfl4
‘4
E’ -4 tJ U ca
tu
<.4ta
4
5->
UE3
-4(3
tu —
0-4 4
1u Z Q EJ 4
z
2
tu
~ OtuUJ’
—coz 44 4
‘u —
0wtu
—00
— tu
4 ti tu tutu u 4 -a
N r --3—
~0 r e 2z2rtuoc 4 ~3 242
— D 24 -t 000-E -J Oua
U 4
o ~ ‘22 2 EM .JZZ tu 4 tu •. -
• -‘-E -J
EJ. 0~ o O O 2 O
tAJ Lii u tu -j 4 —
o 4
u
‘~‘00 40
u
o E
——
o

UNb....~W0uu
r20&cu — o
— Uro-.e
•~—
54
.1 rE.
O 4 ~ O
UJ~ flfl — D . —— —

O
-eh-
•t.J
2
4
“42 -J
4
‘Mo
—~
I •24’44ta0 2
tu
a
•44
E “
— -04 -O U U 4 t 2—E-
eLiA
« 4.-tu 4W tAJ
flE O E~ u. u. E.
0~4=~
O — U 04 U 044 UdC. 5. • tu
o — —
5.
-O—4U%
:~s;
— e o —4
v~ O W A
OE
4 m E E
si’ — SE tE ‘III te
ml — ‘El’ 5
st
st
u
4

• V E E 4
1
u
a
4
33
4 4
¡
4
¡
4 2
4
4
Capítulo 3

A las dificultades técnicas apuntadas se sumaron las derivadas de la traducción de

los términos del tesauro; si bien es cierto que hablar de traducción de un tesauro no es
hablar en términos precisos, en ningún caso es posible traducir los descriptores o palabras
clave que componen un repertorio terminológico, se trata más bien de realizar una
equivalencia idiomática que engendra serias dificultades. En el caso del tesauro que nos
ocupa, el establecimiento de dicha equivalencia siguió, en líneas generales, los siguientes
pasos:

1. Se extrajeron los términos diferentes, solos o con adendas o datos adicionales


tales como la temática, por ejemplo, ya que en el idioma original uit mismo término
formaba parte de diferentes campos semánticos, pudiendo ser en español traducible en
forma diferente en cada tema. Por ejemplo, el término inglés trainer puede tener como
equivalentes en español aprendiz en un oficio, estudiante, etc. Se dió en ocasiones el caso
contrario: que diferentes términos en otro idioma tenían equivalencia en una sola palabra
española, por ejemplo, tacto, que en nuestro idioma puede entenderse como tino, acierto
o sentido del cacto.

2. Se distribuyeron los términos diferentes entre expertos para que los circunscri-
bieran y transcribieran a la equivalencia temática de su especialización, expresándolos de
forma unívoca.

3. Se reordenaron alfabéticamente los términos, ya que su posición en la versión


original no necesariamente era coincidente con la traducida.

4. Se revisaron los casos de sinonimia y homonimia, porque podía darse el caso


de que diferentes términos en otro idioma se tradujeran por el mismo en español, o que

144
Capítulo 3

hubiera más sinónimos en español de los que expresaba el idioma extranjero, sin que
existiera coincidencia con los posibles sinónimos en ese idioma.

En la actualidad se está utilizando en AENOR -el organismo que anteriormente


se denominaba IRANOR- la versión del TJT de 1993 que, actualizada a 1996, recibieron
en dicho organismo en julio de ese mismo año. El tesauro, recogido en formato de cinta
magnética, se traduce simultáneamente con el uso de los descriptores necesarios para la
indización.

El Tesauro ISO no es, en definitiva, un tesauro español, ni tan siquiera una


edición en lengua española, ya que se emplean para el tratamiento de los documentos los
mismos descriptores del tesauro original, el editado por AFNOR, aunque se esté
procediendo a traducir los términos a medida que se van empleando en la descripción de
documentos. El tiempo y dedicación que precisa la preparación de la traducción de un
lenguaje documental son los motivos principales por los que, según los responsables del
Servicio de documentación de AENOR, no se ha realizado hasta la fecha una versión
española del citado tesauro.

10. Tesauro de Ciencias Farmacéuticas <en elaboración). «cm -

Aunque se proyectó la elaboración de este tesauro en la temprana fecha de la que


data el informe del ICYT, no se empezó a elaborar hasta 1995. En la actualidad no se
está trabajando en el tesauro, de modo que no resulta posible calcular una posible fecha
de finalización del mismo, según nos lo confirma Consuelo Ruíz, quien se responsabilizó
del proyecto.

‘45
Capítulo 3

11. Tesauro de alimentación Versión española del tesauro de la CEE. <ICYT)


- -

El proyecto se redujo a la confección de un diccionario sobre la materia, de cuya


preparación se hizo cargo el Grupo Termesp del ICYT, y que bajo la denominación

A1/meatos: diccionario cient(fico y tecnológico español-inglés-alemán-francés, no se

publicaría hasta 1994.

En resumen, de los once tesauros a los que hace referencia el informe del ICYT,
sólo se puede confirmar la existencia de uno de creación española, el de Fundesco, y una
versión española de un tesauro internacional, el DIC.

Con objeto de recopilar otros datos que aportaran alguna luz sobre el tema
acudimos a fuentes, más o menos autorizadas. Confrontados y analizados, dichos datos
no siempre dieron resultados positivos, en muchos casos la esperanza de encontrar algún
indicio de tesauro nos llevó a encontrar léxicos, listas de encabezamientos de materias,
etc., por ejemplo, investigamos la posible existencia de un proyecto de tesauro de
acuicultura que dió como resultado la existencia de un Glosado de acuicultura, que
comenzó Manuela Vázquez en el seno del ICYT, en el que actualmente está trabajando
Concha Ronda, y cuya edición verá la luz en fecha próxima.

De la información aportada en este capitulo se puede concluir que la creación de


tesauros en España no ha sido prolífica históricamente. Concretamente, y en virtud de
los datos contrastados, se puede afirmar la inexistencia de estos útiles hasta 1982, fecha
en que empezaron a realizarse los primeros lenguajes documentales de términos

146
Capítulo 3

científicos y técnicos50. A partir de esa fecha el CSIC tomó la iniciativa de crear un


programa de elaboración de tesauros especializados en distintas ramas del conocimiento.
En 1986 el Instituto de Información y Documentación en Ciencias sociales y Humanida-
des (ISOC) programó la realización de tesauros sectoriales para indizar la documentación
de las bases de datos creadas por dicha institución. También en el ICYT la Unidad de
Investigación inició un proyecto de creación de tesauros especializados en los distintos
campos científicos,

3.4. Tesauros elaborados en España

En este apartado se ofrece información detallada de los tesauros construidos en


nuestro país entre los años 1982 y 1997. Los datos relativos a cada uno de ellos se
presentan organizados sistemáticamente por los siguientes campos: autor, edición, fecha,
editor, lugar de edición, formato, número de ISBN, cobertura temática, formas de
presentación y número de términos que los componen.

Como se podrá comprobar, en algunos casos se ha omitido la información de


algunos campos porque no figuraba en los propios tesauros y. consultadas las fuentes
relacionadas con los mismos, desconocían los datos. En este sentido, el campo más
común sin cumplimentar es el de autor, debido a que se trata de trabajos realizados en
colaboración.

50Las razones que argumentan Carmen Ortíz y Justo Fernández -especialistas en el área de traducción del ICYT-
para explicar esta situación, es que es posible organizar la información con la Clasificación Taxonómica de Linneo
en las áreas de botánica y zoología. Este sistema de clasificación, de posible uso internacional, que ha perdurado
en el tiempo y que, al dividir y organizar la información en clase, subclase, orden, suborden, familia, subfamilia,
género y especie, hace innecesaria la elaboración de tesauros en determinadas áreas de conocimiento.

147
Capítulo 3

1. Thesaurus: anális¡ metodológica ¡ proposta de síntes¡ ¡ per a l’Ajuntament de


Barcelona.

Autor: C. Udina
Edición: Primera
Fecha: 1987
Editor: Ajuntament de Barcelona
Lugar de edición: Barcelona
Formato: Impreso (copia de ordenador sin paginar)
ISBN: 84-505-6425-5
Cobertura temática: multidisciplinar

2. Tesauro Archivo

Autor: Elisa Carolina de Santos Canalejo, con la colaboración del grupo de trabajo del
Archivo General del Ministerio de Asuntos Exteriores.
Edición: Primera
Fecha: 1994
Editor: Ministerio de Asuntos Exteriores. Archivo general.

Lugar de edición: Madrid


Formato: Impreso (474 páginas) y en disquete
ISBN: 84-87661-43-2
Cobertura temática: Relaciones internacionales, política exterior, asuntos consulares,
derechos humanos, economía, comercio, industria y energía, comunicaciones y obras
públicas, etc.
Formas de presentación: sistemática, alfabética y permutada.

148
Capítulo 3

3. Thesaurus de Asuntos Sociales

Edición: Segunda
Fecha: 1994
Editor: Ministerio de Asuntos Sociales, Centro de Publicaciones
Lugar de edición: Madrid
Formato: Impreso (297 páginas>. Es posible su consulta en línea.
ISBN: 84-7850-050-2
Cobertura temática: Servicios sociales y protección social
Formas de presentación: Alfabética, sistemática y permutada
Número de términos: 1.710 descriptores y 429 no descriptores.

4. Tesauro de la base de datos de Fundesco

Autor: Francisco Ortiz Chaparro


Edición: Primera
Fecha: 1987
Editor: Centro de Documentación de Fundesco
Lugar de edición: Madrid
Formato: Impreso (64 páginas)
ISBN: 84-84094-20-2
Cobertura temaitica: Tecnología de la información, electrónica, informática y
telecomunicaciones.
Formas de presentación: Alfabética
Nota.- El tesauro no ha sido actualizado ni revisado desde su primera edición, lo cual lo hace inservible en la
actualidad, algo que pasaría con cualquier otro lenguaje documental y que muy especialmente ocurre en una
materia como las telecomunicaciones, que ha sufrido profundas modificaciones desde los años 80-

‘49
Capítulo 3

5. Thesaurus catalá d’éducació

Autor: Montserrat Gabarró i Parera [etal].


Edición: Primera
Fecha: 1992
Editor: Departament l’Enseynament, Servei de Difusió i Edicions
Lugar de edición: [Barcelona]
Formato: Impreso (352 páginas), 2 disquetes y un cuadernillo.
ISBN: 84-393-2075-2.
Cobertura temática: Educación: recursos, equipamiento, aprendizaje, etc. - -

Formas de presentación: Índice alfabético, sin relaciones semánticas entre los términos,
índice alfabético estructurado, permutado y parte sistemática representada gráficamente
mediante terminogramas.
Número de términos: 3.462 descriptores y 1.000 no descriptores.

6. Ihesaurus Ciénces empresarjais. Correspondencies en catalá, castellá i anglés.

Autor: Francisca Buxó, Montsertat Catalan, Pepa Martínez, (coordinadoras)


Edición: Primera
Fecha: 1991
Editor: Fundació Empresarial Catalana y EscoJa Superior d Administració y Direcció
-

d Empreses (ESADE)
- -

Lugar de edición: Barcelona


Formato: Impreso (413 páginas)
D.L.: B-5143-1991
Cobertura temática: Temas relacionados con el campo empresarial.
Formas de presentación: jerárquica, permutada e índice alfabético, trilingúe

150
Capítulo 3

7. Tesauro de Ciencias de la información

Autor: Antonio García Gutiérrez


Edición: Primera
Fecha: 1982

Editor: Centro de Documentación del Departamento de Documentación de la Facultad


de Ciencias de la Información (IBERCOM)
Lugar de edición: Madrid
Formato: Impreso
ISBN:
Cobertura temática: Ciencias de la información
Formas de presentación: Alfabética, sistemática y permutada
Número de términos:

8. Tesauro de Defensa.

Autor:
Edición: Segunda
Fecha: 1996

Editor: Ministerio de Defensa


Lugar de edición: Madrid
Formato: Impreso (283 páginas)
ISBN: 84-7823-453-5
Cobertura temática: Seguridad, Defensa y Fuerzas armadas
Formas de presentación: Alfabética, sistemática, índice auxiliar de nombres propios e
índice auxiliar de topónimos.
Número de términos: unos 2000

151
Capítulo 3

9. Tesauro de Derecho

Autor: Jorge Páez Maña y Pilar del Pozo Benéitez (coordinadores)


Edición: Primera
Fecha: 1997
Editor: CINDOC

Lugar de edición: Madrid


Formato: Impreso (2.241 páginas) [CD-Romen preparaciónl
ISBN: 84-00-07682-6
Cobertura temática: Derecho, Documentación jurídica y terminología jurídica.
Formas de presentación: sistemática, alfabética y permutada
Número de términos: 19.494: 14.179 descriptores y 5.315 no descriptores.

10. Tesauro de drogodependencias

Autor: Ricardo Mosquera Martínez, Francisco Rodríguez Martín, Inés Molowny Gómez.
Edición: Primera
Fecha: 1990

Editor: Ministerio de Sanidad y Consumo, Delegación del Gobierno para el Plan


Nacional sobre Drogas.
Lugar de edición: Madrid
Formato: Impreso
ISBN: 84-7670-226-4
Cobertura temática: Drogodependencias
Formas de presentación: Alfabética y sistemática. Anexo con siglas, cuestionarios y
tests utilizados en materia de drogodependencias.

152
Capítulo 3

IlE Tesauro electrotécnico

Autor: Antonio García Gutiérrez (director), Elena Sigúenza Carbonelí (coordinadora).


Edición: Primera
Fecha: 1993
Editor: Asociación de Investigación Industrial Eléctrica (ASINEL)
Lugar de edición: Móstoles (Madrid)
Formato: Impreso (4 volúmenes. V. 1: 379 pp., y. II: 182 pp., V. 111: 271 pp, V. IV:
151 Pp.)
ISBN: 84-604-6878-X
Cobertura temática: El tesauro cubre el área electrotécnica con especial incidencia en
los sectores que interesan a las empresas eléctricas españolas: fuentes de energía, equipos
y materiales eléctricos, gestión de la explotación, etc...
Formas de presentación: Índice alfabético, índice jerárquico, índice permutado y anexo:
diccionario inglés/español.
Número de términos: 7.764: 6.869 descriptores y 895 no descriptores

12. Tesauro Geográfico administrativo EVETU

Autor:
Edición: Segunda
Fecha: 1993
Editor: Instituto Vasco de Administración Pública
Lugar de edición: [Oñate (Guipúzcoa)]
Formato: Impreso
ISBN: 84-7777-105-7
Cobertura temática: Denominaciones oficiales de las unidades administrativas de la

153
Capítulo 3

Comunidad Autónoma del País Vasco (territorios históricos, municipios, mancomunida-


des, parzonerías, comarcas y cuadrillas) y denominaciones oficiales de las Comunidades
Autónomas del Estado y sus provincias así como de los Estados europeos.
Formas de presentación: Índice alfabético e índice jerárquico.

13, Tesauro de historia argentina

Autor: Graciela G. Barcala de Moyano, Cristina Voena


Edición: Primera
Fecha: 1991
Editor: Anuario de Estudios Americanos
Lugar de edición: [Sevilla]
Formato: Impreso (40 páginas)
ISBN: Suplemento de Anuario de Estudios Americanos. Sección Historiografía y
Bibliografía (1991> tomo XLVIII, n0 1, Pp. 73-1 13.
Cobertura temática: Historia argentina
Formas de presentación: Alfabética, cronológica, sistemática y permutada.
Número de términos: 800

14. Tesaurus d’bistária contemporánia de Catalunya

Autor: Maribel Cuadrado Benítez [et al]


Edición: Primera
Fecha: 1996
Editor: Serx’ei de Documentació d’História Local de Catalunya. Departament d’I-Iistoria
Moderna i Contemporánia. Universitat Autónoma de Barcelona.
Lugar de edición: Barcelona

‘54
Capítulo 3

Formato: Impreso

ISBN: 84-7794-443-1
Cobertura temática: Historia contemporánea de Cataluña
Formas de presentación: alfabética y sistemática
Número de términos: 2.308 descriptores y 452 no descriptores

15. Thesaurus d’historia social de la dona

Autor: Montserrat Sebastiá 1 Salat


Edición: Primera
Fecha: 1988
Editor: Comissió Interdepartamental de Promoció de la Dona, Generalitat de Catalunya.
Lugar de edición: Barcelona
Formato: Impreso < 269 páginas)
ISBN: 84-393-0931-7
Cobertura temática: Ciencias sociales. Temática sobre mujer.
Formas de presentación: alfabética

16. Tesauro ICYT de biología animal

Autor: Jesús Rey Rocha


Edición: Primera
Fecha: 1995
Editor: CINDOC
Lugar de edición: Madrid
Formato: Impreso (399 páginas), dísquete y CD-Rom (es posible también su consulta en
línea).

155
Capímlo 3

ISBN: 84-00-07510-2
Cobertura temática: Biología animal, Ciencias veterinarias, producción anima!, etc...
Formas de presentación: alfabética, sistemática y permutada.
Número de términos: 3.781: 2.782 descriptores y 999 no descriptores.

17. Thesauro de investigación educativa.

Autor: Luis Lizasoain Hernández


Edición: Primera

Fecha: 1988
Editor: Editorial de la Universidad Complutense
Lugar de edición: Madrid
Formato: Impreso
ISBN: D.L. M 2161-1988
Cobertura temática: Materias relacionadas con los métodos y técnicas de la investiga-
ción educativa: evaluación, medición y técnicas de obtención de información o datos,
etc...
Formas de presentación: Alfabética, sistemática y permutada. Incluye una lista inglés-
castellano.
Número de términos: 1.423: 782 descriptores y 641 no descriptores.

18. Tesauro ISOC de economía

Autor:
Edición: Segunda/multilingile
Fecha: 1995
Editor: Centro de información y Documentación Científica

156
Capítulo 3

Lugar de edición: Madrid


Formato: Impreso (592 páginas)

ISBN: 84-00-07495-5
Cobertura temática: Economfa
Formas de presentación: Alfabética, sistemática y permutada. Anexo: Identificadores
y unidades monetarias.
Número de términos: unos 6.000

19. Tesauro ISOC de psicología

Autor:

Edición: Segunda
Fecha: 1995
Editor: CINDOC
Lugar de edición: Madrid
Formato: Impreso <433 páginas>. Es posible su consulta en línea.
ISBN: 84-00-07511-0
Cobertura temática: Psicología

Formas de presentación: Alfabética, sistemática y permutada más anexos con los


nombres de Éests, escalas y cuestionarios. El tesauro se completa con una lista onomástica
de autores.
Número de términos: 2.788 descriptores, ¡.612 no descriptores y 732 notas de alcance.
El anexo contiene 690 términos: 359 descriptores, 423 no descriptores y 331 notas de
alcance.

157
Capítulo 3

20. Tesauro ISOC de topónimos

Autor: José María Sánchez Nistal


Edición: Segunda
Fecha: 1996
Editor: ClNDOC-CSIC
Lugar de edición: Madrid
Formato: Impreso (542 páginas) y versión informatizada
ISBN: 84-00-07576-5
Cobertura temática: Ciencias sociales. Topónimos político-administrativos.
Formas de presentación: Alfabética y sistemática
Número de términos: 26.000

21. Tesauro ISOC de urbanismo

Autor:
Edición: Segunda
Fecha: 1992
Editor: Instituto Vasco de Administración Pública y CINDOC
Lugar de edición: Madrid
Formato: Impreso (470 páginas)
ISBN: 84-00-07260-X.
Cobertura temática: Ciencias sociales. Urbanismo y ordenación del territorio.
Formas de presentación: Alfabética, sistemática y permutada

Número de términos: 4.422: 3.652 descriptores y 770 no descriptores

158
Capítulo 3

22. Tesauro de materias de la Base de datos IiNFOLUR

Autor: Maite Tolosa (coordinadora)


Edición: Segunda
Fecha: 1994
Editor: Instituto Vasco de Administración Pública
Lugar de edición: Oñate (Guipúzcoa)
Fonnato: Impreso
ISBN: 84-7777-105-7
Cobertura temática: Urbanismo, ordenación territorial y medio ambiente.
Formas de presentación: alfabética y jerárquica.

Número de términos:
Nora.- El tesauro está editado conjuntamente con el Geográfico administrativo EVETU, y se incluyen en el
Manual de la base de datos Infolur.

23. Tesauro de Medio Ambiente

Autor:
Edición: Segunda
Fecha: 1990
Editor: Ministerio de Obras Públicas y Urbanismo
Lugar de edición: [Madrid]
Formato: Impreso (319 páginas) y soporte informático
ISBN: 84-7433-668-6
Cobertura temática: Medio ambiente, urbanismo, ordenación del territorio, temas
ambientales -
Formas de presentación: Sistemática, alfabética y permutada

159
Capítulo 3

Número de términos: 2.320 descriptores y 608 no descriptores.

Nota.- Existen dos versiones posteriores editadas sólo en CD-Rom. La más reciente, correspondiente al año
1995. se compone de cerca de 3.000 descriptores y más de 700 no descriptores. En esta última versión existen
numerosas modificaciones con respecto a la de 1990 (la última en papel) que afectan al contenido de los campos
temáticos.

24. Tesauro “Mujer”

Autor:
Edición: Primera
Fecha: 1993
Editor: Instituto de la Mujer, Centro de Documentación
Lugar de edición: Madrid
Formato: Impreso (154 páginas)
ISBN: 84.7799-065-4.
Cobertura temática: Ciencias sociales. Temas relacionados con la mujer.
Formas de presentación: Alfabética, sistemática y permutada
Número de términos: 1.118: 714 descriptores y 404 no descriptores.

25. Tesauro (Ministerio de relaciones con las Cortes y de la Secretaría del Gobierno).

Autor:
Edición: [no está editado]
Fecha: 1989
Editor:
Lugar de edición:

160
Capítulo 3

Formato: Impreso

ISBN:
Cobertura temática: Ciencias sociales (temas jurídicos, constitucionales y políticos).
Recoge también nombres geográficos y de organismos.
Formas de presentación: alfabética y sistemática

26. Tesauro de patrimonio

Autor: Antonio García Gutiérrez (coordinador)


Edición: Primera
Fecha: 1997
Editor: Consejería de Cultura del Instituto Andaluz del Patrimonio Histórico.
Lugar de edición: Sevilla
Formato: papel y CD-Rom.
ISBN: [En imprenta]
Cobertura temática: Abarca todos los temas relacionados con el Patrimonio histórico
andaluz.
Formas de presentación: Alfabética, sistemática-alfabética y permutada.
Número de términos: 12.000 (aprox.)

Nora- Se trata de un tesauro basado totalmente en la postcoordinación, para cuya elaboración se ha aplicado,
como metodología básica, la gramática de casos.

161
Capítulo 3

27. Tesauro de puertos y costas

Autor:
Edición: Primera (provisional>
Fecha: [1996]
Editor: Centro de Estudios y Experimentación de Obras Públicas, Centro de Información
y Documentación Científica.
Lugar de edición: [Madrid]
Formato: Impreso (229 páginas)

ISBN:
Cobertura temática: Ingeniería de puertos, economía, comercio, transporte intermodal,
etc.

Formas de presentación: alfabética, sistemática y permutada.

Nota.- Es un tesauro de uso interno para el Centro de Estudios y Experimentación de Obras Públicas (CEDEX),
sólo puede utilizarse en otras instituciones previa autorización del Ente Público de Puertos del Estado.

28. Thesaurus de termes estadístics: correspondéncies en catalá, castellá i anglés.

Versión en español: Thesaurus de términos estadísticos.

Autor:
Edición: Segunda
Fecha: 1993
Editor: Institut d’Estadística de Catalunya
Lugar de edición: Barcelona
Formato: Impreso (3 volúmenes)
ISBN: 84-393-2706-4

162
Capítulo 3

Cobertura temática: Estadística


Formas de presentación: alfabética, jerárquica y permutada.
Número de términos: 2.501 descriptores y 991 no descriptores.

29. Thesaurus de términos relativos a relaciones raciales: with English equivalence:


avec equivalence fran~aise: amb equivaléncia catalana.

Autor: Ramón Soler y Fabregat


Edición: Primera
Fecha: 1996

Editor: CINDOC
Lugar de edición: Madrid
Formato: Impreso (X, 135 páginas)
ISBN: 84-00-07610-9
Cobertura temática: Ciencias sociales. Relaciones raciales.
Formas de presentación: Índice sistemático, índice alfabético estructurado e índice
alfabético permutado-
Número de términos: 1.434: L023 descriptores y 402 no descriptores.

30. Thesaurus de la IJniversitat de Barcelona: BUB, 1992.

Autor: Carme Cambrodí amb la col. de M~ Teresa Tarrida


Edición: Primera

Fecha: 1992
Editor: Area de Procés Tecnic de la Biblioteca de la Universitat de Barcelona
Lugar de edición: Barcelona
Formato: Impreso (459 páginas> y soporte informático (Consultable en línea)

163
Capítulo 3

ISBN: 84-7875-864-X
Cobertura temática: Multidisciplinar
Formas de presentación: Alfabética y permutada

Términos: 8.500

En el catálogo de la Biblioteca de la Universitat de Barcelona figuraban las


siguientes referencias: Thesaurus: AnMisi metodológica i proposta de sintesi per a
I’Ajuntament de Barcelona y Thesaurus semántic interdimensional: selecció deIs
classificadors més habituals en la dinámica municipal, éste último editado por el
Ajuntament de Barcelona. No nos fue posible analizar ninguno de ellos debido a que el
único centro en el que parecen existir ejemplares es el Instituto Municipal de Animación
y Esplai (IMAE), que ha pasado a denominarse Agencia Municipal de Servicios para las
Asociaciones, y que se encuentra actualmente en proceso de traslado, no pudiéndose
consultar sus fondos.

3.4.1. Tesauros en fase de elaboración

A continuación se señalan los tesauros que se encuentran en fase de elaboración,


de los que hemos tenido conocimiento. Estos lenguajes abarcan áreas de conocimiento
diversas, tales como artes escénicas, derecho, obras públicas, ciencia de los materiales
y sociología.

164
Capítulo 3

- Tesauro sobre artes escénicas. Constituye un lenguaje ambivalente que cubre


la terminología de las artes escénicas en general, cuya publicación, a cargo del Instituto
del teatro de Barcelona, está prevista para finales del presente año. Trata de cubrir la
documentación existente en la biblioteca de dicho teatro y de su archivo, que asciende
a un total aproximado de 120.000 volúmenes.

- Tesauro jurídico (Facultad de Derecho de Sevilla). Se trata del expurgo de la


cuarta edición (2995) del denominado Thesauras de la Biblioteca de la Universidad de
Derecho con notaciones de la CDU, que consiste en una lista de encabezamientos de
materias compilada por Arcadio Castillejo Benavente y Carmen Jiménez-Castellanos
Ballesteros, que pasará a estructurase como tesauro.

- Tesauro de Obras hidráulicas. Se está elaborando en el Centro de Estudios y


Experimentación de Obras Públicas (CEDEX). La fecha aproximada de publicación es
septiembre del presente año.

- Tesauro de Ciencia de los materiales. Constituirá la versión española del


tesauro de términos metalúrgicos Thesaurus of tire American Society of materlais. Se
encuentra en fase de revisión previa a la publicación, y lo han llevado a cabo Amelia de
Irazazábal y Sofía Alvarez.

- Tesauro cJe Sociología. Realizado por Angel Villagrá Rubio, se encuentra en

la fase final de su construcción, a falta de la inclusión de algunas relaciones asociativas.


La fecha estimada para su finalización es el primer trimestre de 1998. El ISOC se hará
cargo de su publicación. El tesauro, que se realiza simultáneamente en las versiones
española, inglesa y francesa, constará de un total aproximado de 4.000 términos, organi-

165
Capítulo 3

zados en tres formas de presentación: alfabética, sistemática y permutada, y estara


disponible en papel y en disquete.

- Tesauro del CIS <Centro de Investigaciones Sociológicas). Basado en material


recogido en las encuestas sobre opinión pública, realizadas durante los últimos veinticinco
años. Constará de 3.000 términos aproximadamente y se organizará en las tres formas
de presentación tradicionales: alfabética, sistemática y permutada.

3.4.2. Tesauros internacionales con versión o traducción en español, catalán


o valenciano:

Se trata de tesauros adaptados o traducidos al español, catalán o valenciano, de


uso regular para el almacenamiento y recuperación de información en bases de datos de
diferentes centros de documentación o bibliotecas especializadas.

Al igual que en el epígrafe 3.4., la información de este apartado se organiza en


base a los datos de autor, edición, fecha, etc...

Tesauro AGROVOC: Tesauro agrícola muítilingíie

Autor:
Edición: Segunda, multilingile
Fecha: 1992
Editor: Apimondia, por acuerdo con la Organización de las Naciones Unidas para la
Agricultura y la Alimentación.
Lugar de edición: Roma

166
Capitulo 3

Formato: Impreso (2 tomos: 1” t.: 855 págs., 20 t.: 305 págs.)


ISBN: 88-7643-009-1
Cobertura temática: Agricultura en general, geografía e historia, economía, desarrollo
agrícola y sociología rural, recursos naturales y medio ambiente, etc.
Formas de presentación: Índice alfabético que comprende tres categorías de entradas:
los descriptores, los no descriptores y las formas permutadas correspondientes a
descriptores y no descriptores representados por expresiones compuestas. Se completa
con un índice alfabético de cada una de las términos del tesauro en español, inglés y
francés.

Número de ténninos: 14.714 descriptores, 8.495, 11.048 y 7.602 no descriptores en las


versiones inglesa, española y francesa, respectivamente.

Tesauro de la Biblioteca de la CCE (basado en el microtesauro de la OCDE)

Autor:
Edición:
Fecha: 1988
Editor: ICYT
Lugar de edición: Madrid
Formato; Impreso (260 páginas)
ISBN:
Cobertura temática: Disciplinas científicas múltiples
Formas de presentación:
Número de términos:

Nota.- En 1996 los alumnos de la Universidad Pontificia de Comillas, de la asignatura Terminología, de la


Facultad de Traducción e Interpretación, hicieron la versión española actualizada de este tesauro, bajo la
dirección de la profesora Amelia de Irazazábal, estando en fase de revisión previa a su publicación-

167
Capítulo 3

Tesauro de carreteras

Autor: Concepción Lallana del Valle (comp.)


Edición: Primera

Fecha: 1993
Editor: Centro de Estudios y Experimentación de Obras Públicas, Gabinete de
Formación y Documentación.

Lugar de edición: Madrid


Formato: Impreso (454 páginas) y disquete
ISBN: 84-7790-165-1
Cobertura temática: Carretera y transporte por carretera
Formas de presentación: Índice numérico (en este índice se encuentran todos los
términos incluidos en el tesauro -descriptores y no descriptores-, agrupados en las 50
áreas temáticas de que consta), índice alfabético, indice de sinónimos e índice permutado.
Número de términos: 4453

Nota.- Se trata de la versión española del Tesauro DIC, pero, a diferencia de éste, la parte sistemática no se
representa mediante diagramas de flechas.

Tesauro EUDISED: Thesaurus multilingíle para el tratamiento de la información


relativa a la educación.

Autor: preparado por Jean Viet


Edición: Primera española

Fecha: 1975

Editor: Mouton & Consejo de Europa

168
Capítulo 3

Lugar de edición: La Haya


Formato: Impreso (un volumen por versión lingúistica)
ISBN:
Cobertura temática: Ciencias de la educación. Incluye nombres de países, regiones y
de organizaciones internacionales.
Formas de presentación: sistemática y alfabética

Tesauro EURO VOC


Versión valenciana del tesauro de las Comunidades europeas, editado en Bruselas y
Luxemburgo.

Edición: Segunda
Fecha: 1993
Editor: Conselleria d’Administració Pública
Lugar de edición: Valencia
Formato: Impreso (3 tomos. 1: 268 páginas; II: 146 páginas; III: 153 páginas).
ISBN: 84-482-0344-5
Coberturatemática: Vida polftica, relaciones internacionales, asuntos sociales, derecho,
educación, comunicación, industria y energía, sector agroalimentario, etc.
Formas de presentación: alfabética, sistemática y permutada.
Número de términos: descriptores: 5.359, no descriptores: 5.170.

Tbesaurus de la Formación Profesional. CEDEFOP

Edición: Primera española


Fecha: 1990
Editor: Ministerio de Trabajo y Seguridad Social

169
Capítulo 3

Lugar de edición: Madrid

Formato: Impreso (222 páginas)


NIPO: 210-90-Oll-X
Cobertura temática: Formación profesional
Fonnas de presentación: Alfabética, permutada y lista de ‘top terms’.

Thesaurus lconográfic: Sistema descriptiu de les representacions.

51, cuyos datos


Nota- Se trata de la adaptación al catalán del Thesaurus iconographique realizado por Garnier
no podemos incluir en este anexo por no habernos sido posible conseguir un ejemplar del mismo.

Tesauro OIT: Terminología de trabajo, empleo y formación

Autor:
Edición: Cuarta, multilingúe
Fecha: 1992
Editor: Oficina Internacional del Trabajo
Lugar de edición: Ginebra
Formato: Impreso (557 páginas)
ISBN: 92-2-006429-4
Cobertura temática: Desarrollo económico y social, derecho, ciencias sociales,
educación, actividades económicas, trabajo y empleo, población, relaciones raciales y
migración, etc.

Formas de presentación: Indices alfabéticos en inglés, francés y español, que remiten

51GARNIER, F. Tbesaurus iconograpbique: systéme descriptif des représentations. Paris: Le Léopard d’or,
1981.

170
Capítulo 3

al usuario a la presentación sistemática, en la que se presentan los descriptores provistos


de sus relaciones semánticas.
Número de términos: Descriptores: 4.039, no descriptores: 1.019 en inglés, 696 en
francés y 603 en español.

Tesauro de Popin: Tesauro multiinglie sobre población

Autor: Preparado por Jean Viet


Edición: Segunda
Fecha: [1984]
Editor: Fondo de las Naciones Unidas para las actividades en materia de población
(FNUAP)
Lugar de edición: Nueva York
Formato: Impreso
ISBN:
Cobertura temática: materias relacionadas con la población (demografía, migración,
mortalidad, sanidad, etc...)
Fonnas de presentación: alfabética, sistemática y permutada
Número de términos:

Tesauro SPINES

Autor:
Edición: Primera española

Fecha: 1988
Editor: UNESCO/ICYT
Lugar de edición: Madrid

171
Capitulo 3

Formato: Impreso (2 y., U’ y.: V+ 358 páginas; 20 y.: LI + 716 páginas).


ISBN: 84-00-06802-5
Cobertura temática: Disciplinas científicas múltiples
Formas de presentación: Lista alfabética estructurada, índice temático de descriptores,
índice de palabras significativas contenidas en los descriptores, vocabulario inglés-
español, vocabulario francés-español, índice de organizaciones y programas internaciona-
les -

Número de términos: 10.832: 7993 descriptores y 2.839 no descriptores.

Tesauro de términos para ciencias acuáticas y pesqueras (traducción del Thesaurus


of terms for acuatic sciences and fisheries).

Autor: <Traducido por Alicia Teresa Mileo)


Edición: Primera
Fecha: 1985
Editor: Organización de las Naciones Unidas para la Agricultura y la Alimentación
(FAO) y [aPontificia Universidad Católica de Chile.
Lugar de edición: Roma
Formato: Impreso
ISBN: 92-5-302233-7
Cobertura temática: Ciencias acuáticas y pesqueras
Formas de presentación: Alfabética y lista de términos categorizados por facetas.
Número de términos: 1900 descriptores y 950 no descriptores

172
Capítulo 3

Tesauro de términos de comercio internacional

Autor:
Edición: Segunda
Fecha: 1985
Editor: Centro de Comercio Internacional UNCTAD/GATT

Lugar de edición: Ginebra


Formato: Impreso (146 páginas)
ISBN: 53-109568-0
Cobertura temática: Comercio internacional y promoción comercial, tomando en
consideración particularmente a los países en desarrollo.
Formas de presentación: Lista alfabética, lista numérica.
Número de términos:

Thesaurus Textil Internacional

Autor:
Edición: Primera
Fecha: 1971
Editor: Departamento de Documentación de la Escuela Técnica Superior de Ingenieros
Industriales -

Lugar de edición: Tarrasa


Formato: Impreso
Cobertura temática: Industria textil
Formas de presentación: alfabética
Nora.- Constituye la edición española de Thesaurw del Instituto de Tecnología de Massachusetts.

173
Capitulo 3

Macrothesaurus para el tratamiento de la información relativa al desarrollo


económico y social.

Autor: Edición preparada por Jean Viet


Edición: Cuarta
Fecha: 1991
Editor: Organización de Cooperación y Desarrollo Económico (OCDE)
Lugar de edición: Paris
Formato: Impreso (428 páginas)
ISBN: 92-64-31882-8
Cobertura temática: Economía, sociología
Formas de presentación: Alfabética, jerárquica y permutada

Tesauro de la UNESCO

Autor: Jean Aitchison


Edición: Primera
Fecha: 1984
Editor: UNESCO
Lugar de edición: Paris
Formato: Impreso (2 y., 1” y: 419 páginas; 20 y.: 615 páginas).
ISBN: 92-3-301469-6
Cobertura temática: Educación y ciencia, ciencias sociales, cultura, comunicación y
documentación.

174
Capítulo 3

Formas de presentación: Sistemática, alfabética y permutada. Tiene además una lista

de identificadores, aunque no se publica.


Número de términos: Unos 8.500.

Nota.- No se trata de una versión española, sino de su simple traducción al castellano, realizada por Jean Viet.

175
Capítulo 4

La recuperación de información
4.1. Introducción

Como ya hemos dicho anteriormente, para buscar información en un fondo


documental es posible utilizar el propio lenguaje de los documentos almacenados o
emplear un lenguaje controlado que evite la ambigiledad característica del natural. En
ambos casos se puede recurrir a técnicas que agilizan el proceso y que exponemos en el
presente capítulo.

La recuperación de información es la última fase del tratamiento documental, y


aquella en la que se da respuesta a las solicitudes de información de los usuarios.

La recuperación puede ser manual o automática. Van Slype denomina a esta


última recuperación asistida por el ordenado?, que a nosotros nos parece más adecuada,
porque entendemos que, ya sea llevada a cabo la operación por un documentalista o por
el propio usuario (como viene siendo habitual con el desarrollo de sistemas informáticos
de fácil acceso), la recuperación no es completamente automática.

El desarrollo que han experimentado los sistemas de recuperación automatizados


en los últimos treinta años, ha acelerado el reemplazo de métodos manuales de
recuperación por distintos medios de búsqueda automatizados.

‘SLYPE, G.v. Los lenguajes de indización: concepción, construcción y utilización en los sistemas
documentales. Madrid: Fundación Germán Sánchez Ruipérez, 1991, p. 174.
Capítulo 4

La recuperación de información manual o asistida por ordenador es tarea que


concierne a la representación, almacenamiento, organización y acceso a los documen-

tos2, y por tanto, la calidad de la misma depende de la calidad de la indización y de la


fase de recuperación. A este respecto escribe García Marco que la búsqueda depende de
las habilidades y estrategias del usuario, el entornofísico y tecnológico, la estructura de
los datos, el sistema de representación de los conceptos (lenguajes de indización y

clasificación) y el lenguaje de recuperación3.

Tanto la evaluación de la recuperación como la del lenguaje de recuperación


implican la valoración de la calidad del propio Sistema de Información, cuyas
características describimos en el siguiente epígrafe.

4.2. Sistemas de Información

Un Sistema de Información es, según Miguel Castaño y Piattini Velthuis un


conjunto de elementos ordenadamente relacionados entre sí de acuerdo con unas ciertas
reglas que aporte el sistema objeto (es decir, la organización a la cual sirve y que le
marca las directrices de funcionamientó) la información necesaria para el cumplimiento
de sus fines, para lo cual tendrá que recoger, procesar y almacenar datos, procedentes
tanto de la misma organización como de fuentes externas, facilitando la recuperación,
elaboración y presentación de los mismos.4

2SALTON, G. & McGILL, M.J. Introduction to ‘nodern information retrieval. New York, etc.: McGraw
Hill Publishing Company, 1983, p. 1.

3GARCÍA MARCO, EJ. De la consulta de catálogos a la gestión de información: Tensiones hacia el cambio
en el diseño de OPACs. Boletín de ¡a ANABAD, y. 41, n0 3-4 (1991) Pp. 325-334.

4MIGUEL CASTANO, A. de & PIATTINI VELTHUIS, MG. Concepción y diseño de bases de datos: Del
modelo EIR al modelo relacional. Madrid: RA-MA, 1993, p. 17.

178
Capíulo 4

Los Sistemas de Información (SI) pueden ser manuales o pueden estar mecaniza-
dos, aunque en la actualidad, prácticamente todo SI se apoya en técnicas informáticas,
realizándose el tratamiento y recuperación de la información, por regla general, mediante
sistemas de gestión de bases de datos.

Un sistema de información se compone de: los datos; el equipo informático, tanto


el equipamiento físico (los ficheros donde se almacenan los datos) como los programas
(que gestionan toda la aplicación); un gestor de los datos y los usuarios. No obstante,
contando con los mismos componentes, cada sistema ofrece características propias.

Miguel Castaño y Piattini Velthuis consideran que los datos pueden ser
formateados o no formateados, los textuales, propios de los sistemas documentales, son
no formateados. Atendiendo a estos aspectos, se suele distinguir entre dos tipos de
sistemas de tratamiento:

- Sistemas de Recuperación de información (SRI): se dedican al tratamiento de datos no


formateados (documentos) - Estos sistemas proporcionan facilidades de thesaurus,
búsqueda en texto libre, etc.

- Sistemas de Gestión de Bases de Datos (SGBD): se dedican al tratamiento de datos


formateados ~

Las bibliotecas constituyen los primeros SRI que, con sus catálogos, sumarios,
boletines de resúmenes, etc., realizaban y aún siguen realizando, las tareas de
recuperación de información mediante un sistema de búsqueda lineal y acumulativa. En

MIGUEL CASTAÑO, A. de & PIATTINI VELTHLJIS, M.G. op. cit., p. 19.

179
Capítulo 4

los modernos SRI es posible establecer relaciones semánticas previamente al proceso de


búsqueda, combinando e) número de conceptos necesarios para seleccionar la información
relevante.

Un SRI se compone de los elementos propios de todo SI, mencionados más arriba,
y de elementos externos. Los elementos externos son los lenguajes documentales, que
facilitan la normalización del proceso de recuperación; los recursos sintácticos, que se
pueden emplear para formular las estrategias de búsqueda; el interfaz, que permite la
comunicación hombre-máquina; y los registros resultantes del proceso de búsqueda.

De los lenguajes documentales hemos tratado en el capítulo segundo de esta tesis


doctoral, y más concretamente del tesauro, de uso generalizado en SRI por sus
prestaciones en áreas temáticas especializadas. Los registros son unidades que recogen
la descripción de cada documento. Están compuestos por subunidades denominadas
campos, que contienen un único dato descriptivo del documento. De los campos que
componen cada registro hablaremos detalladamente en el apartado dedicado a las bases
de datos.

En cuanto a los recursos sintácticos que ofrecen los SRI, nos limitamos en este
epígrafe a citar algunos de los más empleados, ya que, necesariamente hablaremos de sus
características al tratar de los procedimientos de búsqueda documental, tema que se
desarrolla en el epígrafe 4.4.4. de este capítulo. Los recursos sintácticos más comúnmen-
te utilizados en la recuperación de información son: el truncamiento, que permite
aumentar la exhaustividad de la búsqueda; los operadores booleanos, los enlaces de
proximidad y la búsqueda mediante ponderación de los descriptores.

180
Capítulo 4

El cuarto elemento externo que compone un SRI es el interfaz, que es la parte del
sistema de recuperación que posibilita la interacción con el usuario. García Marco escribe
que en una biblioteca el interfaz de usuario lo compone la parte pública del OPA C, pero

también el tiempo y cualidades dedicadas en los usuarios por parte del personal
‘6

bibliotecario

Para hacer una búsqueda hay que utilizar comandos y operadores con los términos
adecuados para construir una estrategia que produzca resultados acordes con la pregunta
formulada. Los comandos que empleaban las primeras bases de datos exigían, por su
complejidad, su aprendizaje previo para poder manejar la base. Si se tiene en cuenta que
cada servicio utiliza comandos o lenguajes de recuperación diferentes, se puede
comprender el esfuerzo del usuario a la hora de consultar los SRI. Existe abundante
literatura sobre las ventajas que aportaría el empleo de un lenguaje de interrogación
común, pero, hasta la fecha, no se ha logrado este objetivo.

Una alternativa a los comandos es el uso de menús, de fácil manejo e innecesario


aprendizaje. El usuario tiene únicamente que ir seleccionando los pasos, las opciones que
le sugiere la pantalla en forma de menú. El programa se encarga de convertir las
cuestiones formuladas por el usuario a los comandos y conecta los términos de la
búsqueda con los operadores adecuados.

García Marco7, en el trabajo que citamos anteriormente, realiza una introducción


histórica del interfaz hombre-máquina, en la que hace referencia a la evolución desde la

6GARCIA MARCO, EJ. Inrenfaces amigables para la recuperación de la información bibliográfica. Scire, y. 1,
no 1(1995) p. 129.

7GARCIA MARCO, F.J. Op. cir. PP. 132-135.

181
Capítulo 4

comunicación mediante las referidas complejas instrucciones hasta el desarrollo de


menús, fácilmente manejables para navegar por la base de datos.

A este respecto, Foskett hace referencia al significativo desarrollo en “microcom-


puter’ que constituyó la introducción de Apple Macintosh en 1984. Con anterioridad -

escribe- era necesario teclear y conocer los comandos de memoria o consultando un


manual. Apple Macintosh fue el primer microordenador en usar un interfaz de usuario
grafico (GUI) en el que los comandos estaban representados en la pantalla por iconos,
que se seleccionaban por medio de un “pointing” recurso, como un ratón. El ratón se
utiliza para mover el cursor hacia la posición deseada en la pantalla. Alternativamente,
menús -listas de comandos- se podían seleccionar de la misma forma. La necesidad de
teclear los comandos se redujo al mínimo, simp«ficando las tareas. Un GUi de
equivalente calidad para IBM, compatible con PCs tuvo que esperar hasta Windows 3.1
en /99J8•

Pero la alternativa de los menús no está exenta de desventajas. El empleo de estos


recursos resulta más lento que el de comandos directos, especialmente en el supuesto de
que el usuario necesite consultar pantallas de ayuda, que suelen complicar la tarea, en
particular cuando el consultante no está acostumbrado a trabajar solo con el sistema. Por
otra parte, la independencia que se otorga al usuario para manejar la base conlíeva la
desventaja de su aislamiento y la ausencia de ayuda, por parte del personal especializado,
para seleccionar los términos adecuados de la búsqueda, así como la preparación o
modificación de las estrategIas.

8FOSKETT, A.C. Tbe subject approach to information. 53 cd. London: Clive Bingley, ¡996, p. 45.

182
Capítulo 4

Tanto si se utilizan comandos o menús es determinante para el éxito de la


comunicación hombre-máquina la implantación, en los distintos SRI, de interfaces que,
con determinadas características faciliten el manejo del sistema. Un interfaz que reúna
las cualidades de amigabilidad, economía, ergonomía e interactividad, ampliará la
capacidad de comunicación y permitirá realizar las tareas de búsqueda documental en las
mejores condiciones de seguridad, comodidad y economía para el usuario. El factor
interactividad posibilita el diálogo hombre-máquina a lo largo de todo el proceso de
búsqueda y da la oportunidad al usuario de ir modificándola a medida que progresa. de
tal manera que cada documento o cada dato encontrado influya en la búsqueda siguiente.
Tales búsquedas, -dice Foskett- en las que el curso de los acontecimientos se modifica
continuamente a la luz de la información que se va obteniendo, pueden ser descritas
como heurísticas9.

La posibilidad que ofrecen las búsquedas heurísticas de modificar continuamente


las estrategias, no existen cuando al frente del proceso está un bibliotecario/documentalis-
ta; sí que es posible, sin embargo, que dicho especialista muestre al usuario los
resultados de una primera búsqueda, pudiendo éste modificar la estrategia teniendo en
cuenta los documentos relevantes obtenidos. Puede realizar entonces un segundo intento
y repetir el proceso hasta que el usuario quede satisfecho con lo resultados. A este tipo
de búsqueda que no se modifica de forma continua sino a intervalos Foskett la denomina
búsqueda interactiva10 -

En cualquier caso, para que el usuario pueda elegir entre cualquiera de las
opciones de búsqueda, la pantalla debe ofrecer en todo momento alternativas para realizar

9FOSKETT, A.C. Op. ch. p. 26.

‘0FOSKETT, A.C. Op. cit., p. 26.

183
Capítulo 4

la consulta sin necesidad de ayuda experta. Se trata de dar autonomía a usuarios más o
menos experimentados en el manejo de sistemas de información. El interfaz debe ir
indicando todos los pasos a seguir para evitar que el consultante tenga que memorizar los
símbolos o elementos que lo componen (como ocurre, en algunos casos, con los
comandos). La agrupación de dichos elementos en recuadros facilita el acceso a la base
y le da al usuario la seguridad de que sabe controlar el sistema sin estar pendiente de la

ayuda externa.

Antes de terminar este apartado queremos señalar que, además de las facilidades
suministradas por los Lenguajes y los recursos señalados, los distintos SRI proporcionan
otros medios suplementarios para ayudar a los usuarios a obtener el máximo provecho
de los datos contenidos en la misma. Se trata de un conjunto de programas o procedi-
mientos para la carga de ficheros, generadores de listados o tablas, etc.

4.3. Bases de datos

Las bases de datos son los instrumentos que emplean los Servicios de Recupera-
ción de Información para cumplir las funciones de preparación y recuperación de los
datos.

Una base de datos es una colección o depósito de datos integrados, con


redundancia controlada y con una estructura que refleje las interrelaciones y restricciones
existentes en el mundo real; los datos, que han de ser compartidospor dÉferentes usuarios
y aplicaciones, deben mantenerse independientes de éstas, y su definición y descripción,
únicas para cada tipo de datos, han de estar almacenadas junto con los mismos. Los
procedimientos de actualización y recuperación> comunes y bien determinados, habrán

1 84
Capítulo 4

de ser capaces de conservar la integridad, seguridad y confidencialidad del conjunto de


los datos. ~‘

En función del tipo de información que sirve, una base de datos puede ser factual,
si recoge datos numéricos; bibliográfica, si fundamenta su actividad en la oferta de citas

tanto de libros como de publicaciones periódicas; o puede tratarse de bases que limitan
su campo a informar al usuario acerca de patentes, direcciones, etc. Además de este tipo
de información, las bases de datos pueden tratar temas multidisciplinares o especializarse
en un área de conocimiento en particular.

Vamos a referirnos aquí a las bases de datos bibliográficas -el tipo de base que
consultamos para realizar la parte nuclear de esta investigación-, que recogen la
producción editorial sobre cualquier rama del saber o sobre un área temática en

particular.

Bares denomina a éstas, bases documentales”, las cuales define como conjunto
de ficheros que se refieren al mismo campo de interés, y que forman un todo organizado
con respecto al logical documental que les soporta.

En este tipo de bases es necesario recurrir a la técnica del fichero inverso, cuya
organización particular hace posible la selección de un fondo documental, a partir de
descriptores o de palabras clave. En estos ficheros, los descriptores van seguidos de las
referencias en la que aparecen. En el momento de la búsqueda se introducen dichos
descriptores o palabras clave en la memoria; las listas correspondientes a cada uno de

“MIGUEL CASTANO, A. & PIATTINI VELTHUIS, M.G. Op. ch., p. 46.


1~’
-BARES, M. La búsqueda documental en el contexto telemático: Modalidades de automatización y
utilización de bases de datos. Madrid: Díaz de Santos, 1988, p. 104.

185
Capítulo 4

ellos se localizan en el fichero inverso. El ordenador puede realizar rápidamente la


intersección lógica de diferentes listas para encontrar las referencias comunes. En
comparación con una búsqueda secuencial (se barre todo) que se refiere al conjunto, esta
técnica restringe considerablemente el campo a explorary trae consigo una ganancia de
tiempo considerable’3.

Una base de datos bibliográfica puede ser referencial o textual. Las referenciales
son aquellas que ofrecen la información necesaria para acceder a determinado documento,
pero no el documento en si. Algunas bases de este tipo contienen un adelanto del
contenido de los documentos porque incluyen en sus registros un resumen de aquellos,
pero, en cualquier caso, el lector no tiene acceso al documento fuente. Las bases de datos
textuales proporcionan el texto completo, no sólo la referencia del original, de tal manera
que el usuario no precisa localizar otras fuentes para satisfacer sus necesidades de
información -

4.3.1. Registros de una base de datos

Las bases de datos bibliográficas se componen de registros que describen las


caracterfsticas físicas y de contenido del documento. Cada uno de estos registros está
constituido por una serie de campos, cuyo número y tipología puede variar de una base
a otra pero que, en general, ofrecen la información básica o complementaria que permite
la recuperación de determinada obra mediante la consulta de todos o solamente de alguna
de las unidades componentes de dicho registro. Los campos que comprende un registro
son los siguientes:

‘3BARES, M. Op. cit. p. 115.

186
CapítuLo 4

a) Código de acceso a la base de datos

Se trata de un código numérico o alfanumérico que se asigna al registro en el


momento de su incorporación a la base.

i» Autor

Campo que refleja la mención de responsabilidad de la obra, ya se trate de autor


personal, corporativo, etc.

e) Título

Transcripción literal del título del documento. Algunas bases incorporan un campo
para título original, teniendo en cuenta que existe la tendencia a traducir al inglés el título
de obras escritas en cualquier idioma, como medio de normalización.

d) Fecha de publicación

Campo que delimita el año de publicación de los documentos.

e) Forma de publicación

Se refiere al tipo de documento de que se trate: folletos, libros, revistas, actas de


congresos, etc.

187
Capítulo 4

t’) ISBN o ISSN

Siglas correspondientes al Número Internacional Normalizado de registro de


Libros o de Publicaciones seriadas, respectivamente.

g) Fuente

Este campo facilita la información relativa al origen editorial del documento. En


función del tipo de obra indica el título de la revista, título de la obra completa, en el
caso de tratarse del capítulo de una obra referenciado independientemente, nombre
genérico del congreso, en el caso de ponencias, o nombre de la editorial, cuando la obra
es una monografía.

Cualquiera de estas referencias permite localizar el documento fuente, en el


supuesto de que fuera necesaria su consulta.

h) Lengua original del documento

Expresa el idioma en el que están escritas y publicadas las obras.

i) Clasificación

Incluye la notación numérica o alfanumérica correspondiente al documento


clasificado. Esta codificación puede o no ser coincidente con la localización de la obra
en el fondo documental.

188
Capítulo 4

El sistema de clasificación más generalizado en nuestro país, y el que adoptan la


mayoría de las bases de datos es la Clasificación Decimal Universal (CDU>, que permite
acoplar la organización del fondo y el catálogo de la biblioteca.

El campo de clasificación facilita la búsqueda en bases de datos con amplio


volumen de documentos, así como en aquellas de carácter interdisciplinar, porque
permite restringir la búsqueda a un área temática en particular.

j) Descriptores

Se recogen en este campo los puntos de acceso temáticos. Puede tratarse de


descriptores extraídos de un tesauro, o de palabras clave tomadas del propio texto. En
ambos casos la selección la realiza el analista en el momento de la indización, con el
propósito de representar el contenido conceptual del documento.

El número de términos que incluyen las diferentes bases en este campo fluctúa
considerablemente, según la política de indización seguida en cada centro.

k) Resumen

Incluye resumen indicativo o informativo del documento. Constituye un campo


de gran ayuda para el consultante ya que en él se ofrece información sobre objetivos,
metodología, resultados, conclusiones y recomendaciones del documento de referencia.
Estos datos permiten mejorar la búsqueda cuando se trabaja en modo interactivo, y son
insustituibles cuando la ecuación de búsqueda se prepara en lenguaje natural.

189
Capítulo 4

La consulta de este campo suele resultar suficiente para conocer las características

esenciales de una obra, ahorrando tiempo y dinero al usuario, que no necesita acudir al
documento original para satisfacer sus necesidades de información, especialmente si el
tipo de resumen que incluye la base es informativo.

La importancia de la incorporación del resumen para poder valorar la relevancia


de los documentos recuperados ha sido muy grande en este trabajo de investigación,
porque tuvimos que analizar un total de 25.399 referencias, para conocer sus índices de
relevancia. La labor, que si fue muy laboriosa, se multiplicó en aquellas bases en las que
no existía resumen de los documentos, dado que, en muchos casos, fue necesaria la
consulta de los obras originales para poder realizar una valoración objetiva de sus
contenidos.

Como dice Moya Anegón, en la mayoría de los sistemas de i-ecuperación de


información existen cieno tzpo de campos que aunque no se pueden utilizar como
términos de búsqueda en las operaciones de recuperación, se pueden utilizar como
limnitadores de conjuntos de documentos seleccionados previamente. Estos campos se
llaman de esta forma porque su función es la de reducir el tamaño de los conjuntos de
documentos obtenidos mediante la utilización de los términos indexados y los operadores
que los pueden relacionar. Este tipo de operación de búsqueda en los sistemas de gestión
de catálogos son especialmente útiles para los usuarios porque les permite acceder a
información bibliografica por códigos y números no indexo4os, lo que reduce el número
de índices y amplía las posibilidades de recuperacion Las informaciones que deforma
más usual han sido objeto de este tipo de tratamiento son: el código de tipo de material,
los códigos de país y lengua de la publicación, y las fechas, estas últimas sujetas a un
tratamiento especial, pues la limitación aquí consiste normalmente en uno de entre cuatro

190
Capítulo 4

tipos de operaciones aritméticas, igual que (=), mayor que (>), menor que (<)y entre

Ejemplos de registros

Todas las bases de datos consultadas para nuestro trabajo experimental son
bibliográficas, pero la estructura de sus registros no es idéntica. A continuación
mostramos un ejemplo de registro de cada una ellas.

Base de datos de Biología animal del CSIC

Documento: 83575
Título:Estructura trófica de la macrofauna intermareal: Evolución en un área afectada por
vertidos orgánicos.
Otro-Idioma-Títu¡o:Trophic structure of intertidal macrofauna: Evolution in an area
affected by organic dumping.
Autores:Palacio, J. ; Mora, J. ; Lastra, M. ; Planas, M.
Lugar-Trabajo:Fac. Biol. Univ. Santiago de Compostela Dep. Biol. Anim., Santiago de
Compostela (La Coruña), España ; lnst. Invest. Mar. [CSIC], Vigo
(Pontevedra), España
Revista-Título:Publicaciones especiales. Instituto Español de Oceanografía
Datos-Fuente:1993, (11): 415-422, 18 Ref
ISSN:02 14-7378
Idioma: ES
Tipo-Documento:AR
Modo-Documento: PO
Clasificación:251005 ; 330811
Descriptores:Contaminación de aguas marinas ; Contaminación industrial ; Fauna marina
Indicadores biológicos ; Zona intermareal ; Ecología trófica Topónimos:Galicia
España

4MOYA ANEGON, E de. Los sistemas integrados degesti6nbibliotecaria. Madrid: Anabad, 1995, p. 151.

191
Capítulo 4

Base de datos de Electrotecnia, de ASINEL:

CONTADOR 359
ACCN 359
NUMPIE 131054
NUMPIU 87/30
TÍTULO APLICACIÓN DE UN SISTEMA EXPERTO A LA QUÍMICA DE LOS
SISTEMAS AGUA-VAPOR Y TRATAMIENTO DE AGUA DE UNA
CENTRAL TÉRMICA
TITABR SIS. EXPERTO QUÍMICA AGUA
TIPODO PROYECTO PIE
EMPRES UEF/RES
ENTCOL I.I.T./COL
FEINIC 080587
FEFiNA 070388
DURACJ 10
AUTORE ZAPATA, JOSÉ LUIS/RES
SIGNA BA/197
FEENT 100788
ESTADO TERMINADO
PRESUP 14200
CL4TEM 2.3 EXPLOTACIÓN
DESTEM SISTEMA EXPERTO> CENTRAL TÉRMICA> INVESTIGACIÓN
> CONTROL QUÍMICO> FALLO
RESOBJ EL OBJETIVO DE ESTE PROYECTO ES LA INVESTIGACIÓN,
DESARROLLO, IMPLANTACIÓN Y PUESTA A PUNTO DE UN
SISTEMA EXPERTO CAPAZ DE REALIZAR UN DIAGNÓSTICO Y
PREDICCIÓN DEL COMPORTAMIENTO DE LOS PARÁMETROS
QUE GOBIERNAN LA QUÍMICA DE LA CENTRAL DE MANERA
QUE PUEDA PREDECIR ANOMALÍAS INCIPIENTES QU PUDIE-
RAN DAR LUGAR A FALLO Y AL MISMO TIEMPO ASESORAR
SOBRE LAS MEDIDAS A TOMAR PARA EVITARLO, O BIEN, Sí
HUBIESE OCURRIDO EL FALLO, IGULAMENTE ASISTIR AL
PERSONAL ENCARGADO CORRESPONDIENTE SOBRE LAS
ACCIONES A LLEVAR A CABO. 3. CONTENIDO Y MEDIOS DEL
PROYECTO 3.1 DESCRIPCIÓN COMO SE HA DICHO ANTES, EL
OBJETIVO DE ESTE PROYECTO SERÍA LA INVESTIGACIÓN,
DESARROLLO, IMPLANTACIÓN Y PUESTA A PUNTO POR UNIÓN
ELÉCTRICA FENOSA DE UN SISTEMA EXPERTO CAPAZ DE

192
Capítulo 4

REALIZAR UN DIAGNÓSTICO Y PREDICCIÓN DE COMPORTA-


MIENTO DE LOS PARÁMETROS QUE GOBIERNAN LA QUÍMICA
DE LA CENTRAL DE MANERA QUE PUEDA PREDECIR ANOM
ALÍAS INCIPIENTES QUE PUEDIERAN DAR LUGAR A FALLO Y
AL MISMO TIEMPO ASESORAR SOBRE LAS MEDIDAS A TOMA
R PARA EVITARLO, O BIEN, SI HUBIESE OCURRIDO EL FALL
O, IGUALMENTE ASISTIR AL PERSONAL ENCARGADO CORRE
SPONDIENTE SOBRE LAS ACCIONES A LLEVAR A CABO. PAR
A LA CONSECUCIÓN DE ESTE OBJETIVO, EL PROYECTO
CONSISTIRÍA EN UN DESARROLLO POR PASOS QUE ABARCAR
ÍA, DESDE LA ADQUISICIÓN DE DATOS HASTA LA IMPLANTA
CIÓN FINAL DEL SISTEMA EXPERTO. ESTOS PASOS COMPON
ENTES DEL DESARROLLO DEL PROYECTO SERÍAN A GRAND
ES RASGOS LOS SIGUIENTES: a) RECOGIDA DE INFORMACIÓN
EN UN MEDiO ADECUADO. ESTA TAREA CONSISTIRÍA EN
RECOGER EN UN ORDENADOR LOS DATOS DE LOS PARÁMET
ROS QUÍMICOS QUE SE MONITORIZAN. ACTUALMENTE SE
REGISTRAN EN PAPEL CONTINUO. EL TIPO DE ORDENADOR
NECESARIO PARA ELLO DEPENDE, EVIDENTEMENTE DE LA
CANTIDAD DE PARÁMETROS A REGISTRAR. NOSOTROS ESTI
MAMOS QUE PARA LA CAPTURA DE INFORMACIÓN NECESA
RIA AL SISTEMA EXPERTO APLICADO A LA QUIMICA DE LOS
SISTEMAS AGUA-VAPOR Y TRATAMIENTO DE AGUA, BASTAR
ÍAN ORDENADORES PERSONALES NIVEL IBM-AT. b) ESTUDIO
DE LAS CARACTERÍSTICAS DE LOS PARÁMETROS. ANTES DE
EMPEZAR CON CUALQUIER TIPO DE ESTUDIO ES CONVENIE
NTE FAMILIARIZARSE CON LOS DATOS, ESTO ES, VER SUS
INCIDENCIAS, VALORES MÁXIMOS Y MÍNIMOS, MEDIAS,
VARIANZAS, RECONOCIMIENTO DE VALORES CARACTERÍSTI
COS Y COMO SON INFLUENCIADOS POR OTROS PARÁMETRO
5 PARA ESTABLECER POSIBLES ESTADOS Y DEPENDENCIAS.
ESTO ES UN ESTUDIO NADA SENCILLO QUE HAY QUE TENER
MUY CLARO PARA LAS ETAPAS SUBSIGUIENTES DE DESARR
OLLO Y PARA SU REALIZACIÓN HAY QUE ECHAR MANO DE
ESTUDIOS ESTADíSTICOS, POSIBLE ANÁLISIS DE SERIES
TEMPORALES,..., TODO ELLO EN BASE A DATOS DE COMPOR
TAMIENTO YA RECOGIDOS Y QUE EN LAS CENTRALES TÉRM
INCAS DE ANLLARES NO SERÍAN DIFÍCILES DE CONSEGUIR,
PUES EXISTE UN ARCHIVO HISTÓRICO DE REGISTRADORES
QUE FACILiTARÍAN LA LABOR. c) DISPONER DE UN DISPOSIT

193
Capitulo 4

IVO INFORMÁTICO ADECUADO PARA REALIZAR EL ESTUDIO


ANTERIOR. AQUÍ SÓLO SE PUEDE INDICAR QUE SE PODRÍA
PENSAR EN UTILIZAR LOS MISMOS MEDIOS EMPLEADOS PAR
A LA TAREA 1. d) ESTUDIO Y DETERMINACIÓN DE LA ESTRU
CTURA DE LA BASE DE CONOCIMIENTOS Y MOTOR DE INFE
RENCIAS DEL SISTEMA EXPERTO. CONSISTIRÍA ESTA TAREA
UNA VEZ CONOCIDO EL COMPORTAMIENTO DE LOS DATOS
EN REALIZAR UNA RECOPILACIÓN DEL CONOCIMIENTO QUE
SE TIENE EN EL ÁREA, TANTO DEPENDENCIAS DETERMINIS
TAS COMO DE LÓGICA DIFUSA ENTRE LOS DIVERSOS PARÁ
METROS Y CARACTERÍSTICAS DE LOS SISTEMAS FÍSICOS, AS
1 COMO UNA ESTRUCTURACIÓN DE DICHO CONOCIMIENTO
DE TAL MANERA QUE UNA PERSONA QUE NO LO TUVIESE,
PUDIESE ACTUAR COMO SI LO TUVIERA DE VERDAD. ÉSTO
SERÍA, EN REALIDAD, EL NÚCLEO FUNDAMENTAL DEL
DESARROLLO DEL SISTEMA EXPERTO Y SERÍA UNA ETAPA D
E MUY ESTRECHA COLABORACIÓN CON EL PERSONAL TÉCN
ICO DE LA CENTRAL EN EL ÁREA CONCRETA. QUE ES QUIE
N DE VERDAD TIENE LA EXPERIENCIA. e) DISPONER DE UN
DISPOSITIVO INFORMÁTICO ADECUADO PARA LA IMPLAN-
TACIÓN DE LA BASE DE CONOCIMIENTOS Y MOTOR DE
INFERENCIAS DEL SISTEMA EXPERTO. ESTA TAREA CONSIS-
TIRÍA EN IMPLANTAR INFORMÁTICAMENTE EL ESTUDIO
REALIZADO EN LA TAREA ANTERIOR. APARTE DEL TRABAJ
O DE IMPLANTACIÓN, AQUÍ HABRÍA QUE DISPONER DE UN
DISPOSITIVO INFORMÁTICO ADECUADO. ASÍ NOSOTROS
ESTIMAMOS QUE HARÍA FALTA UN ORDENADOR PC NIVEL A
T AL CUAL SE LE PODRÍA APLICAR ALGUNA HERRAMIENTA
TAL COMO (PERSONAL CONSULTANT) PARA INSTALAR ESTE
SISTEMA EXPERTO.

194
Capítulo 4

Base de datos de Medio ambiente del MOPU

Autor: International Clean Air Conference 1978 Brisbane, Australia


Título: Proceedings of the International Clean Air Conference : clean air, the continuing
challenge : Brisbane, Australia, May 15-19, 1978 sponsored by the Clean Air Society of
Australia and New Zealand ; edited by E. T. White, P. Hetherington, B. R. Thie!e
Publicación: Ann Arbor, Michigan : Ann Arbor Science
Fecha: cop. 1978
Descripción-Física: XII, 780 p
ISBN: 0-250-40254-8
Otros-Autores-Editores: White, E. T. ed. ¡ Hetherington, P. cd. 1 Thiele, B. R. ed. ¡
Clean Air Society of Australia and New Zeland
Descriptores: Contaminación atmosférica ¡ Control ambiental ¡ Precipitadores
electrostáticos 1 Tecnología 1 Contaminantes atmosféricos
Clasificación: B66 Control de la contaminación atmosférica
Signatura: D-2795

195
Capítulo 4

Base de de datos de Mujer, del Instituto de la Mujer:

SIG .0L1001790
AUT .BASUALDO, ANA
TíT .LA MUJER EN LA IMAGEN PUBLICITARIA
FUE .CUENTA Y RAZÓN; 50
AÑO .1989
COL .PP. 21-24
DES .IMAGEN DE LA MUJER/TELEVISIÓN/PUBLICIDAD
RES .ESTE ESTUDIO INTENTA ANALIZAR EL MODO EN QUE APARECE LA
.MUJER ACTUAL EN LOS ANUNCIOS TELEVISIVOS. UNA PRIMERA
•APROXIMACIÓN NOS DESCUBRE QUE NO HAY NINGÚN ANUNCIO EN
.QUE LA VOZ QUE RELATA “EN 0FF” NO SEA MASCULINA. ESTO
.SUPONE YA UNA PRIMERA E IMPORTANTE DIFERENCIACIÓN DE
.ROLES SEXUALES, DONDE LA VOZ QUE PRESENTA EL PRODUCTO Y
-LO VENDE ES MASCULINA, MIENTRAS QUE LAS MUJERES SE
.MANTIENEN EN UN SEGUNDO PLANO “PEGADAS” A LOS OBJETOS
.QUE YA HAN SIDO CREADOS SI PROFUNDIZAMOS MÁS EN EL
.ANÁLISIS DE LAS DISTINTAS IMÁGENES DE LA MUJER EN LOS
.ANUNCIOS VEMOS QUE AÚN ES MAYORITARIA LA IMAGEN TRADI-
.CIONAL DE LA MUJER COMO AMA DE CASA QUE TIENE POR MISIÓN
.TENER TODO DISPUESTO EN EL HOGAR Y CUIDAR DE LOS HIJOS,
.EXISTE OTRA IMAGEN (YA CLÁSICA) QUE PODRÍAMOS DENOMINAR
.COMO DE “OBJETO DECORATIVO” QUE ACOMPAÑA AL PRODUCTO
.A VENDER. SIN EMBARGO, ÚLTIMAMENTE SE ESTÁ DESARRO-
.LLANDO UN NUEVO TIPO DE “MUJER PUBLICITARIA” QUE, FRE-
.CUENTEMENTE APARECE LIGADA A LOS MUNDOS DE LA TECNO-
.LOGÍA Y DE LA ECONOMÍA, Y QUE ES AQUELLA QUE NO SE
.DISTINGUE NI POR EL PAPEL QUE JUEGA NI POR SU CAPACIDAD DE
.LOS HOMBRES QUE TAMBIÉN APARECEN EN ESOS ANUNCIOS, NO
.OBSTANTE, INCLUSO EN ESTOS CASOS LA VOZ QUE VENDE (LA VOZ
.EN 0FF) SIGUE SIENDO MASCULINA
LUG .GENÉRICO

196
Capítulo 4

Base de datos de Psicología, del CSIC

Núm. registro 232102


-

Autores - BARRIGA, SILVERIO


Título del artículo.: ROL DEL PSICOLOGO EN LOS SERVICIOS SOCIALES
Lugar de trabajo UNIV. SEVILLA, DEP. PSICOLOGíA SOCIAL, ESPAÑA
-

ISSN de la revista..: 1131-6225


Título Revista - REVISTA DE PSICOLOGíA SOCIAL APLICADA
Datos fuente 1991, 1(2-3): 101-112, 42 REF
Tipo documento AR
Modo del documento..: PO
Lengua - ES
Clasificación - 651306
Localización - ISOC

Congreso JORNADAS DE ALMUÑECAR. 1991


-

Notas RESUMEN (ES, EN)


Descriptores - ROLES;PSICOLOGOS;SERVICIOS SOCIALES;BIENESTAR
SOCIAL;ENSEÑANZA PROFESIONAL
Resumen EL PRESENTE ARTICULO EL AUTOR REFLEXIONA SOBRE
-

EL ROL DEL PSICOLOGO EN LOS SERVICIOS SOCIALES TANTO EN LOS ESPE-


CIALIZADOS COMO EN LOS COMUNITARIOS, PARA PERFILAR LOS PRINCIPA-
LES ASPECTOS DEL MENCIONADO ROL PARTE DE LA CONSIDERACION DE
LOS SERVICIOS SOCIALES EN EL MARCO DEL BIENESTAR SOCIAL.-- LA
CONSIDERACION DE LOS COMPONENTES DEL ROL DEL PSICOLOGO EN
ESTOS AMBITOS ES LA BASE PARA SEÑALAR LOS ASPECTOS BASICOS QUE
DEBE CONTEMPLAR LA FORMACION DE LOS PSICOLOGOS QUE VAYAN A
EJERCER SU PRACTICA PROFESIONAL EN ESTE CAMPO. (A.)

197
Capítulo 4

Base de datos de Servicios sociales

REFI :014048
FECHENT :930922
TIPODOC :AR
AUTORPER:HORWATH, Caroline C.
TíT :NUTRlTION GOALS FOR OLDER ADULTS : A REVIEW
TITULO :Nutrition goals for older adults : a review ¡ Caroline C. Horwath
LUGAR :Washington, D.C.
EDITOR :Gerontological Society of America
FECHA :1991
AÑO :1991
COLACION:<11> p. ;28cm
NOTBIB :Bibliografía: p. 819-821
FUENTE :THE GERONTOLOGIST, VOL 31 N 6, DEC 1991. PP. 811-82 1
--

LENGUA :eng
PAíS :USA
ISSN :0016-9013
DESMAT :TERCERA EDAD/NUTRICION/DIETETICA/ENFERMEDADES DEL
APARATO CIRCULATORIO/ENFERMEDADES ENDOCRINAS/CANCER/PREVEN-
CION/EDUCACION SANITARIA
ENT-SEC :GERONTOLOGICAL SOCIETY OF AMERICA, ed.
CLASIF :R/Z

198
Capítulo 4

4.4. Búsqueda documental

El proceso de búsqueda o recuperación de información conlíeva una serie de


etapas iníerrelacionadas entre sí y que siguen este orden:

1. Análisis de los conceptos de la consulta


2. Elección del tipo de lenguaje a utilizar
3. Definición de la estrategia de búsqueda
4. Establecimiento de enlaces sintácticos entre los términos de búsqueda
5. Visualización y evaluación de los resultados
6. Exportación de los registros

4.4.1. Análisis de los conceptos de la consulta

Fase en la que se establece la comparación entre la información almacenada y las

demandas de información. Su nivel de coincidencia permitirá la recuperación de una


información más o menos precisa, en función de la correspondencia entre la pregunta
formulada y los términos utilizados para indizar y almacenar el documento.

Se seleccionan los términos presentes en la pregunta del usuario y se establece una


lista de posibles términos que pueden usarse para describir la materia, comprobando en
índices actualizados si son o no apropiados, o bien realizando la comprobación con un
tesauro si hay alguno disponible sobre el tema’5. En una fase posterior, los conceptos
de la lista se reunirán en una ecuación de búsqueda. El procedimiento para realizar esta

‘5E1 documentalista profi.indizará en el tema de la pregunta consultando repertorios, diccionarios, revistas


especializadas, etc. o bien un tesauro, si la base dispone de uno especializado. La capacidad de inducción de este
lenguaje documental facilita dicha proffindización.

199
Capítulo 4

tarea es similar al que realiza el documentalista en el momento de indizar los documentos


para alimentar la base de datos, pero existen matices diferenciadores, como aclara Van
Slype’6, ... la enumeración de los conceptos que componen una pregunta exige una
-

aproximación muy diferente de la que se lleva a cabo cuando se hace la lista de los
conceptos que caracterizan el contenido de un documento. La indización de un documento
es una operación reductora: el contenido de un documento de cinco a diez páginas queda
considerablemente condensado cuando se representa por un número de ocho a doce
descriptores, conforme a una taso del 1/100 al 1/1000. Por el contrario, lo másfrecuente
es que la formulación de una pregunta produzca una extensión del enunciado final: una
petición expresadapor el enunciado de un número de dos a cinco conceptos, se enriquece
de forma que se obtienen, como media, de cinco a doce palabras clave y/o descriptores,
de acuerdo con una taso de expansión del 100 al 300%.

El incremento en el número de conceptos posibles a considerar en el proceso de


recuperación tiene su razón de ser en el hecho de que un documento puede responder a
una consulta considerando el tema de diversas formas. Por ejemplo, el concepto azúcar,

puede ser abordado desde los puntos de vista de la dietética, la producción de caña de
azúcar, su industrialización, etc.

4.4.2. Elección del tipo de lenguaje a utilizar

Es posible elegir entre el empleo de lenguaje controlado o de lenguaje libre. En


el primer caso se traducen los conceptos de la pregunta a descriptores o encabezamientos
de materia, si elegimos como tal lenguaje un tesauro o una lista de encabezamientos. En

‘6SLYPE, Gv. Op. cit. p. 162.

200
Capítulo 4

el segundo caso se mantienen los términos de la pregunta, sin normalizar. Si se trata de


documentos extensos o si las consultas son algo complejas, la recuperación en lenguaje
libre puede resultar muy costosa en cuanto a tiempo de respuesta.

4.4.3. Definición de la estrategia de búsqueda

Definición de la ecuación de búsqueda de acuerdo con la filosofía de la base de


datos objeto de la consulta y atendiendo a la sintaxis propia del Servicio de Recuperación
de Información de dicha base.

Hartley define la estrategia como conjunto de decisiones y acciones tomadas para


realizar una búsqueda’7, y sostiene que dichas decisiones afectan el resultado conseguI-
do.

Lo habitual es plantear una estrategia inicial que constituya un primer intento de


diálogo con el sistema y, en función de los resultados obtenidos, replantear la ecuación
para localizar otros términos más genéricos, más específicos o relacionados, que puedan
sugerir otros conceptos útiles para la interrogación.

Ajeno o no a la experiencia del usuario o del documentalista en la elaboración de


estrategias de búsqueda, es conveniente comenzar la consulta con un planteamiento de
la cuestión sencillo y, una vez visualizados los resultados de la ecuación inicial, se puede
ir complicando hasta obtener la información pertinente.

17
I-{ARTLEY, RA. OMine searcbing: principIes & practice. London [etc.j: Bowker-Saur, 1990, p. 153.

201
Capítulo 4

En la preparación de la estrategia de búsqueda se sigue el siguiente proceso:

• Recopilación o listado de los términos facilitados por el usuario.


• Búsqueda de sinónimos o cuasisinónimos en diccionarios especializados, revistas
especializadas, etc. Si en la etapa anterior se decidió seguir el procedimiento en lenguaje
controlado, se pueden ampliar los conceptos dados por el usuario y comprobar si los
términos seleccionados están en el tesauro.Si se elige la búsqueda en lenguaje libre, el
proceso se reduce a la localización de sinónimos mencionada, para tratar de tener en
cuenta cualquier término relacionado con el tema de la consulta.

Dependiendo de su complejidad, la formulación de la estrategia de búsqueda lleva


sólo unos minutos, media hora e incluso más tiempo si la pregunta es compleja y requiere
muchas sentencias. Algunas consultas son para una información precisa, otras son mas
generales, e incluso puede ser necesario hacer un barrido o ramoneo, browsing en inglés,
a través de la información aJmacenada en Ja base, para cubrir determinadas necesidades
insuficientemente perfiladas en la consulta. Foskett sostiene que este tipo de consulta se
lleva a cabo también cuando el lector no tiene una necesidad particular en mente y trata
de encontrar documentos por azar y considera de gran utilidad esta posibilidad que
ofrecen algunos sistemas de recuperación de información, dado que muchos de los más
significativos descubrimientos científicos se han realizado como resultado de lo que
denomina serendipity, que define como la facultad de hacer felices e inesperados
IR
descubrimientos por accidente

La práctica del browsing se viene realizando en los procesos de recuperación de


información desde que se generalizó el uso del CD-ROM como soporte de almacenamien-


8FO5KETT, A.C. Op. cit. p. 26.

202
Capítulo 4

to de [ainformación, que abarató el uso de los sistemas de recuperación y que permite


utilizar las bases de datos sin presiones del factor tiempo características de la consulta
en bases de datos en línea.

4.4.4. Establecimiento de enlaces sintácticos entre los términos de búsqueda.

En el proceso de recuperación de información no es habitual realizar una


búsqueda en la que se utilice un concepto simple, ya que este tipo de cuestiones se
resuelven sin necesidad de preparar estrategia alguna, simplemente consultando el índice
o el resumen de un documento. Sin embargo, por lo general, para una búsqueda se
requieren entre dos y tres conceptos, que será necesario combinar mediante algún
procedimiento sintáctico.

4.4.4.1. Algebra de Boole

Entre los métodos de búsqueda, figura el álgebra de Boole, que es el elegido por
la mayoría de las bases de datos cuando se quieren realizar búsquedas a partir de varias
palabras. Se trata de un método de lógica simbólica basado en el empleo de conectores
u operadores lógicos, ideados por Boole.

Boole, matemático británico del siglo XIX, (1818-1864), empleó símbolos


matemáticos para expresar procesos lógicos. Los operadores de unión [o], intersección
[y] negación [no], proveen una flexible forma de combinar dos o más términos o
conceptos para conseguir en base a ellos el concepto más representativo de determinadas
consultas. Su obra fue desarrollada por Venn (1834-1923) quien representó las relaciones

203
Capítulo 4

lógicas del álgebra booleana mediante diagramas adoptando los círculos de Euler (1707-
1783), matemático suizo que introdujo la técnica de expresar relaciones lógicas
gráficamente un siglo antes de que Boole inventase sus operadores lógicos.

La conexión de los términos presentes en una pregunta se realiza de la siguiente


forma con los operadores lógicos:

Operador de intersección

Permite la intersección entre dos o más conceptos para poder recuperar aquellos
documentos en los que estén presentes todos ellos simultáneamente. Sirve, por tanto, para
reducir el número de items resultantes de una búsqueda. Ej.:

costas rocosas y costas arenosas

INTERSECCIÓN AyE

El sistema recuperará en este caso sólo los documentos en los que aparezcan los
términos costas rocosas y costas arenosas.

204
Capítulo 4

Operador de unión

Agrupa palabras clave que, o bien son sinónimas, o describen un mismo concepto.
Ej.:

costas rocosas o costas arenosas

UPJIÓN O INCLUSIÓN A oE

El operador de unión sirve para ampliar la búsqueda, de tal manera que, en el


ejemplo, el sistema recuperará los documentos referidos tanto a costas rocosas como a
costas arenosas.

Operador de exclusión

El operador no se usa para excluir un concepto en particular, o un subconjunto


dentro de un conjunto más amplio. Ej.:

costas arenosas no costas rocosas

205
Capítulo 4

INTERSECC~ÓN AyE

En este caso, se trata de una la búsqueda sobre costas arenosas, y se excluyen las
costas que no sean playas. Este operador debe utilizarse con precaución porque se puede
perder información relevante. En el ejemplo, al excluir documentos en donde aparezcan
costas rocosas, pueden excluirse igualmente documentos que traten otro tipo de costas,
incluidas las arenosas, que podrían ser de interés para el usuario.

4.4.4.2. Truncamiento

El método de búsqueda por truncamiento consiste en la formulación de la


estrategia empleando fragmentos de palabras precedidos o sucedidos de un signo que
permite al sistema reconocer y tomar como pertinente cualquier término que contenga
letras situadas antes o después de dicho signo. El truncamiento -escribe Van Slype- evita
al usuario tener que introducir manualmente dentro de la ecuación todas tas flexiones
gramaticales, y a veces todas las formas derivadas de una misma raíz’9

Los símbolos más utilizados para este recurso son el asterisco [*], la interrogación
[7] y el signo de interjección [!] que el ordenador toma como sustitutos de cualquier
carácter -

19SLYPE, G.v. Op. cit., p. 171.

206
Capítulo 4

Existen tres tipos de truncamiento: de sufijo, de prefijo y de infijo. El truncamien-


to de sufijo permite recuperar bloques que contienen palabras que empiezan o presentan
coincidencia con la petición. Por ejemplo, graft, abarcaría ¡os términos:

graf-ía
gráf-ico
graf-ología

El truncamiento de prefijo, *graffra, localizaría:

grafía
eco-grafía
homo-grafía

El de infijo *graf*, considerarfa cualquiera de las


posibilidades señaladas -

El truncamiento es un método de búsqueda utilizado en bases de datos con


indización en lenguaje libre con objeto de aumentar la exhaustividad, aunque con este
recurso se corre el riesgo de recuperar documentos irrelevantes. Por ejemplo, en la
búsqueda que realizamos para esta tesis en la base de datos del Centro de Documentación
de la Mujer, solicitamos al sistema documentos relativos a depone, truncando la raíz
deport*, y entre las referencias analizadas encontramos una que se refería a mujeres
deportadas, palabra morfológicamente próxima, pero sin ninguna relación semántica con
el tema de consulta.

207
Capítulo 4

4.4.4.3. Enlaces de proximidad

El método de búsqueda por enlaces de proximidad permite localizar los términos


de la consulta dentro del texto siempre que aparezcan en un lugar predeterminado del
mismo. Se caracteriza por limitar el número máximo de palabras que pueden existir entre
las especificadas en una determinada petición.

Existe gran variedad de posibilidades de establecer enlaces de proximidad. Entre


los más comunes:

• Recuperación tan sólo de aquellos documentos en los que los términos de la


pregunta aparezcan juntos, uno al lado de otro, sin ninguna palabra entre ellos.

• Introducción de un operador que considere la posibilidad de recuperar términos


separados por un número determinado de palabras.

• Recuperación solamente de aquellos documentos en los que los términos que


componen la pregunta aparezcan dentro de una misma frase.

• Operador para seleccionar términos separados entre sí por un número


determinado de términos en un orden preestablecido.

• Operador para seleccionar términos separados entre sí por un número


determinado de términos en cualquier orden.

208
Capítulo 4

4.4.4.4. Método de ponderación o recuperación por pesos

La indización implica habitualmente una decisión dicotómica. Un término es


asignado a un documento o no. En vez de tomar tal decisión es posible introducir
valoraciones cuantitativas, es decir, darle un valor a los términos de indización para
indicar su importancia relativa para representar la materia del documento20. Este
recurso, conocido como indización por pesos y también como método de ponderación,
neutraliza los efectos de la combinación binaria de términos que realiza el álgebra de
Boole, con cuyo procedimiento un documento dado o es pertinente o no es pertinente, sin
posibles matices2t.

Es lógico suponer que entre los términos elegidos para indizar un documento
dado, así como los que lo representan en el momento de la recuperación, unos son mas
importantes que otros. Durante años los investigadores han tratado de conseguir métodos
para asignar un valor a estos descriptores con objeto de mejorar los resultados al
recuperar la información. Luhn fue pionero -como en tantos otros avances tecnológicos-
en el desarrollo de algoritmos que permitían la asignación de un valor a los términos de
indización. Moya Anegón escribe: Como conclusión a las aportaciones de Luhn se puede
decir que existe una gradación posiblemente cuant<ficable de la importancia que cada
término de indízación tiene en la representación del contenido de los documentos22.

20LANCASTER, F.W. Vocabulary control for infonnation retrieval. Washington, D.C.: Information
Resources Press, 1972, p. 132.

21SLYPE, Gv. Op. oit., pp. 174.

22MOYA ANEGóN, E de. Op. oit., p. 168.

209
Capítulo 4

Salton y McGill23 formularon tres algoritmos que el programa calcula en el


momento de la recuperación. En todos ellos el sistema extrae un conjunto de referencias
ordenadas en función de la carga semántica que el propio sistema atribuye a cada una de
dichas referencias, a partir de la pregunta del usuario. También fue Salton quien, con sus
colegas de la Universidad de Cornelí, llevó a cabo el proyecto SMART, la primera
investigación realizada sobre el método de ponderación.

Si se procede a recuperar mediante pesos, pueden darse dos posibilidades: que los
documentos se hayan indizado también por pesos o que no se haya realizado su
ponderación en esta fase del tratamiento documental. En el primer caso, se establece la
coincidencia entre el valor de indización con el deseado para la recuperación. Si se
solicitan documentos en los cuales un término tenga el peso 3, el sistema responderá,
exclusivamente, con aquellos documentos cuyos descriptores respondan a dicho valor. En
el caso de que no se haya realizado la ponderación en la fase de indización, se puede
aplicar en el momento de la recuperación, en función directa de la frecuencia de
aparición de [ostérminos solicitados, en cada documento o en la colección.

La búsqueda por pesos aporta flexibilidad a la operación porque ofrece la


posibilidad de variar las estrategias de acuerdo con las necesidades de precisión o de
exhaustividad. Cuando deseamos un alto índice de precisión lo único que tenemos que
hacer es pedir al sistema que se limite a darnos sólo las referencias de aquellos
documentos cuyos descriptores tengan un alto nivel de ponderación. Cuando lo que
necesitamos es un nivel de exhaustividad alto, se ignoran los ~‘aloresdados a los
descriptores en la fase de indízación, de tal forma que recuperamos la información de
cualquier peso sobre la materia deseada. En opinión de Lancaster, con este recurso se

23SALTON, G. & McGILL, M.J. Op. oit., pp. 350-355.

210
Capítulo 4

evita la recuperación de documentos que sólo hacen mención de la materia requerida de


forma margina?.

Maron, M.G y KUHNS, J.LY proponen la siguiente valoración de los


descriptores:

Peso Descripción Utilización

8/8 Materia principal El término es muy específico y cubre por


completo la materia principal del documento

7/8 Materia principal El término es especifico y cubre casi por


completo la materia principal del documento

6/8 Materia más El término es demasiado amplio y


genérica cubre una materia principal

5/8 Otros términos Términos que podrían utilizarse


importantes en indización binaria pero que no
representan a la materia principal

4/8 Materia menos El término se refiere al tema tratado


genérica en el documento pero es demasiado específico
para representar una materia principal
Materia
3/8 Incluye información sobre resultados de
secundaria experimentos, métodos, usos, etc.

2/8 Otras materias Otros identificadores

1/8 Apenas relevante Materias que el indizador no considera


relevantes pero que extrae porque cree que
algún usuario puede considerarlas pertinentes

24LANCASTER, RW. Op. ch., p. 132.

25MARON, M.E. & KUHNS, Ji. On relevance, probabilisde indexing and information retrieval. Journal of
tbe ACM, y. 7, n0 3 (1960) Pp. 216-244.

211
Capítulo 4

Si la búsqueda por pesos es ya de por si considerada subjetiva, la valoración


semántica que proponen Maron y Kuhns puede resultar demasiado minuciosa para su

aplicación práctica. Establecer la distinción entre valores tan aproximados como 7 y 8,


por ejemplo, resultaría tarea difícilmente realizable en un caso concreto.

Se podría considerar una alternativa en la que se atribuyeran a los descriptores


pesos entre 3 y 1, con los cuales los documentos recibirían una valoración de acuerdo
con [aprofundidad con que tratan una materia en particular y darían opción al usuario
de limitar la búsqueda a los documentos pertinentes. El peso 3 podría utilizarse cuando
un descriptor representa con exactitud el contenido del documento; el valor 2 cuando el

concepto es importante, pero no representa exactamente la información esencial del


documento; el valor 1, por último, se utilizaría para medir un concepto que se acepta
como término de indización o de recuperación, aunque no representa el tema central del
documento.

4.4.4.5. Método estadístico

Consiste en la asignación de términos a un documento en base a la frecuencia de


aparición de dichos términos en el documento y en la colección documental a la que
pertenece.

En los programas de recuperación automática por métodos estadísticos, todas las


palabras que componen el texto son objeto de análisis, a excepción de las palabras vacías,
que se recogen en una lista (“stop word list” o lista de palabras vacías), y que el

ordenador va rechazando a medida que lee secuencialmente. La lista de palabras vacias

212
Capítulo 4

se compone de conjunciones, adverbios, artículos, adjetivos, pronombres personales,


relativos, posesivos, demostrativos e indefinidos. Las preposiciones, además de su papel
conectivo o relacionante, pueden tener valor sustantivo, por lo que no deben considerarse

palabras vacías sin previo análisis del contexto.

El método estadístico tiene su fundamento en la teoría de la probabilidad, y parre


de dos hipótesis: a) que los términos que aparecen con mucha frecuencia en un
documento son representativos de su contenido; b) que aquellos términos que tienen un
bajo nivel de frecuencia en un conjunto documental no son útiles para la recuperación.

Salton y McGill26 atribuyen a Lulin el origen de este procedimiento de


recuperación, y añaden al análisis estadístico lo que denominan valor de discriminación

que, relativiza la valoración de los términos en función de su frecuencia de aparición en


los documentos o en las bases de datos. Salton y McGill sostienen que las palabras que
aparecen pocas veces en una base de datos tienen un valor discriminativo más alto que
aquellas que son compartidas por muchos registros. En la base de datos del Centro de
documentación de la Mujer, por ejemplo, la palabra mujer es tan frecuente en los
documentos que, aunque tiene un gran valor semántico en dicho centro, carece de valor
discriminativo por su altísimo nivel de frecuencia.

4.4.4.6. Método de recuperación mediante tesauro

Como explicamos en el capítulo segundo de esta tesis doctoral, un tesauro es una


lista de términos controlada que se utiliza para indizar los documentos, así como para su

26SALTON, G. & McGilI, M.J. Op. cit., p. 66.

213
Capítulo 4

recuperación. La estructura jerárquica en la que organiza los descriptores favorece un


despliegue de relaciones semánticas -no sólo morfológicas, como ocurre con la
recuperación por términos- que le otorgan su capacidad de inducción.

Algunas bases de datos permiten el acceso al tesauro a través del interfaz; en


aquellas en las que no existe este recurso se hace necesaria su consulta en papel. De las

seis bases en las que hemos realizado el test, objeto de esta investigación, solamente una,
la de Asuntos sociales, carece de tal recurso.

En los centros que tienen incorporado el tesauro existe un comando que da acceso
al mismo; el siguiente paso consiste en visualizar los descriptores como si se tratara de
un índice, o teclear el descriptor que se estime adecuado para recuperar determinada
información, el cual aparece en pantalla rodeado de sus términos más genéricos y más

específicos, así como de aquellos que, por asociación o sinonimia, estén relacionados con
él. Entre todos ellos se elige la opción más adecuada al perfil de búsqueda. Si buscamos,

por ejemplo, por comunicación, podemos encontrar el término especifico comunicación


no verbal, e incluso el más específico aún expresión corporal; al propio tiempo el tesauro
induce a búsquedas asociadas al presentar junto a tales descriptores otros términos
relacionados con ellos por asociación de ideas, como, por ejemplo, mensaje.

Cuando no es posible el acceso al tesauro mediante el interfaz, se seleccionan


manualmente el o los términos susceptibles de recuperar información pertinente, y se
teclean en la pantalla en la que se esté preparando la ecuación de búsqueda.

Tanto si se puede consultar el tesauro en línea como si ha de hacerse manualmen-

te, es posible reducir o ampliar la búsqueda mediante el uso de descriptores más o menos

214
Capítulo 4

específicos así como combinando el empleo de los operadores booleanos y otros recursos
mencionados en este capítulo.

4.4.5. Visualización y evaluación de los resultados

En los SRI en línea, esto es, aquellos que permiten hacer consultas y obtener
respuestas en tiempo real, la visualización de los resultados puede hacerse al concluir el
proceso de búsqueda o cuando se consiguen los primeros registros. Es habitual la
visualización en esta segunda fase porque permite mejorar la formulación de la ecuación

y optimizar los resultados definitivos.

La evaluación de los resultados se puede hacer en función de la precisión y de la


exhaustividad, parámetros que analizaremos en el capítulo sexto de este trabajo. Nos
limitamos aquí a citar los cuatro casos que se pueden dar al evaluar las respuestas:

1. Que las referencias sean pertinentes y su número adecuado al perfil de


búsqueda.
2. Que las referencias sean pertinentes, pero demasiadas para determinado perfil.
3. Que, junto con las referencias pertinentes, se recupere información no
pertinente.
4. Que se recuperen referencias pertinentes pero insuficientes para satisfacer una
consulta concreta.

Salvo en el primer caso, en todos los demás sería necesario utilizar algún recurso

que mejorara la pertinencia. En el segundo, se puede limitar el número de referencias


restringiendo la búsqueda a aquellos documentos que se limiten a un período de tiempo

215
Capítulo 4

determinado, a un tipo de documento en particular o a un idioma. Cuando se formula una


ecuación que genera ruido, como ocurre en el tercer caso, se puede restringir el área de
búsqueda usando descriptores más específicos que los que se seleccionaron en la
estrategia original. Por último, en el cuarto supuesto, se da el caso contrario. El silencio
documental se puede neutralizar incluyendo en la estrategia términos genéricos y

asociados a los formulados en la primera ecuaclon.

En SRI que practiquen la recuperación por pesos se pueden controlar los


resultados de las dos últimas posibilidades expuestas. Cuando el número de documentos
es demasiado alto, se procede a la ponderación de los descriptores; por el contrario,
cuando su número es insuficiente, se omite tal recurso, consiguiendo así un generoso

aumento de referencias.

4.4.6. Exportación de los registros

La exportación consiste en el envío de los resultados obtenidos de la búsqueda


desde la base de datos a un soporte, para su posterior utilización. Dicha exportación

puede hacerse mediante la impresión de las referencias en papel o grabándolas en un


fichero. No todas las bases de datos ofrecen ambas opciones al usuario; en algunas cabe
sólo la posibilidad de grabar los registros a un fichero. Si se da el caso de que la masa

de documentos recuperados es densa y que, además, se ha solicitado la exportación de


los registros con todos sus campos (incluido el de resumen), la labor de analizar su

pertinencia resulta sensiblemente más incómoda que si se trabaja con los registros

impresos -

216
Capítulo 4

Aunque en la fase de visualización y evaluación de los resultados se valora la


información obtenida, sólo cuando se exportan los resultados se puede proceder a un
análisis detenido de las referencias y estimar en qué medida se han cumplido la

predicciones del consultante sobre la base de datos, con el contenido de la misma. En


base a esas expectativas el usuario considerará o no pertinente la documentación

recuperada.

217
Capítulo 5

Análisis semántico y estructural de


diferentes tesauros y características de
las bases de datos en las que se utilizan
5.1. Introducción

El planteamiento teórico de las distintas técnicas de recuperación de información


que hemos realizado en el capítulo anterior, abre un abanico de posibilidades de elección
para proceder a las búsquedas que habremos de desarrollar en el test, objeto de esta tesis
doctoral, y que presentamos en el sexto capítulo. Igualmente, para poder llevar a cabo
dicha experimentación, procedemos en el presente apartado a hacer un análisis semántico
y estructural de los seis tesauros utilizados para dicho test, y a examinar las característi-
cas de las seis bases de datos consultadas.

Los tesauros y las bases de datos que componen la muestra son:

- Tesauro JCY~ de Biología animal’, de uso en la base de datos sobre la materia


del CS¡C.

-Tesauro Electrotécnico2, útil al servicio de la base de datos PIE (Programa de


Investigación y Desarrollo Electrotécnico).

- Tesauro de Medio ambientet lenguaje de indización y recuperación de la Base


de datos Biblioma, del Centro de documentación del Ministerio de Medio ambiente.

‘REY ROCHA, 11. Tesauro ICYT de Biología animal. Madrid: CINDOC, 1995.

2TESAURO Electrotécnico. Madrid: Asociación de Investigación Industrial Eléctrica (ASINEL), 1993.

3TESAURO de Medio Ambiente. 2’ ed. Madrid: Ministerio de Obras Públicas y Urbanismo, 1990.
Capitulo 5

-Tesauro “Mujer”4, de empleo en el Centro de documentación de la Mujer,


dependiente del Ministerio de Asuntos sociales.

- Tesauro ISOC de Psicología5, construido para tratar la información que sobre


la materia tiene la base de datos del CSIC.

- Tesauro de Asuntos sociales6, utilizado en la Biblioteca del Instituto de


Migraciones y Servicios sociales.

5.2. Criterios de evaluación

Para Jievar a cabo Ja vaioración de los tesauros seguimos los criterios de Ja Norma
UNE 50-106-90, equivalente a ISO-2 788-1986 Directrices para el establecimiento y
desarrollo de tesauros nwnolingiaes7, así como los indicados por algunos autores, entre
los que destacamos a Lancaster8. Los parámetros que se van a medir son los siguientes:

e Composición: Se refiere a los índices que forman el tesauro y a la existencia o no de


una introducción con información sobre sus características y ámbito de aplicación.

4TESAURO “Mujer. Madrid: Instituto de la Mujer, 1993.

5TESAURO ISOC de Psicología. Madrid: CLNDOC, 1995.

6TESAURO de Servicios sociales. 2~ ed. Madrid: Ministerio de Asuntos sociales, 1994.

7UNE-50-1O6-90. Directrices para el establecimiento y desarroflo de tesauros monolinglies. AENOR, 1990.

8LANCASTER, F.W. Evaluación de tesauros. En: El control del vocabulario en la recuperación de


información. Valencia: Universiw, 1995, Pp. 173-174.

220
Capítulo 5

• Tamaño: Número de descriptores y de no descriptores que componen la terminología.


Los no descriptores no se asignan a los documentos en el momento de indizar ni se
pueden, por lo tanto, utilizar para recuperar información, pero sirven de referencia para
el usuario y van precedidos de la sigla USE, que remite al término descriptor.

• Relaciones de equivalencia. El valor deseable fluctúa según las fuentes, algunas la


sitúan entre un O’Sy 2, mientras que otras señalan simplemente que el valor mínimo debe
ser mayor a j9•

• Relaciones jerárquicas y asociativas, o razón de enriquecimiento que denominan


algunos autores. Mide cuantitativamente la proporción existente entre el número de
relaciones jerárquicas y/o asociativas y el número total de descriptores. La media
aconsejada oscila entre 2 y 5 relaciones por descriptor.

• Reciprocidad de las relaciones semánticas. Se valora en este punto si se ha tenido


en cuenta la necesaria reciprocidad de las relaciones de equivalencia, jerárquicas y
asociativas en el momento de la construcción del tesauro.

• Notas aclaratorias, definitorias o de aplicación, también denominadas notas de


alcance. Se utilizan para aclarar términos que tienen varios significados en lenguaje
natural o cuando un descriptor se utiliza con un sentido especial en el tesauro. Las notas
que presentan una definición completa del descriptor se aplican a términos técnicos o
especializados, característicos de una jerga o de un contexto social o institucional.

9ALVARO BERMEJO, C.; VIILLAGRA RUBIO, A.; SORLI ROJO, A. Desarrollo de lenguajes formalizados
en lengua española: II. Evaluación de los tesauros disponibles en lengua española. Revista Española de
Documentación CienUflea, y. 12, n0 3, p. 293.

221
Capítulo 5

Las citadas notas constituyen un valor cuantificable numéricamente; cuantas menos


notas incluya un tesauro, mayor será el número de descriptores que puedan generar
ambigúedad. Si en el lenguaje incluyen notas menos del 10% de los descriptores, se
puede pensar que hay ambigoedad notable.

• Número de niveles jerárquicos. Permiten conocer el nivel de especificidad de los


términos que componen el tesauro. Se trata de un valor relativo en función de la
especificidad de la materia.

• Morfología de las palabras. Se refiere al uso que se hace en el tesauro de las formas
de las palabras; del empleo del singular y el plural y de si los descriptores se expresan
por medio de entradas directas, sin inversión de términos, respetando el orden natural de
las palabras.

• Aspectos estéticos de composición y tipografía. Se tendrán en cuenta en este punto


las cualidades formales del tesauro, tales como tipo de letra utilizado para representar los
términos, sangrados, etc. La norma UNE-5O-106-90’0, hace mención expresa de la
forma en la que deben destacarse los descriptores de los no descriptores:

a) Los términos preferentes se imprimen en letras may4sculas, por ejemplo:

COCHES
ANiMALES

‘01)NE 50-106-90. Directrices para el establecimiento y desarrolJo de tesauros monolinglies. Madrid:


AENOR, 1990, Pp. 467-468.

222
Capítulo 5

b) Los términos no preferentes se imprimen en minúsculas, salvo en los casos de nombres


propios que requieran una inicial en mayúscula o las abreviaturas o acrónimos, que
siempre deben escribirse en mayúsculas, por ejemplo:

COCHES
UP automóviles
ANiMALES
UPfauna
ORGANIZACIÓN MUNDIAL DE A SALUD
UR OMS

• Nivel de precoordinación o número medio de términos significativos por descriptor.


Esta tasa (t), cuyos valores aconsejados oscilan entre 1’5 y 2, se obtiene a través del
recuento de la frecuencia de los descriptores unitérminos (a), bitérminos (b), tritérminos
(c), cuadritérminos, etc. y la aplicación de la siguiente fórmula:

a+2b-~-3c-4-4d..

Las introducciones a los tesauros evaluados no aportaban determinados datos


necesarios para poder calcular algunos de los parámetros aquí mencionados, lo cual nos
obligó a examinar minuciosamente cada uno de ellos para hacer la estimación de dichas
variables. A excepción de la reciprocidad de las relaciones, cuya valoración se hizo
mediante muestra aleatoria, los demás datos se consideraron en base a los lenguajes
documentales completos para evitar cualquier margen de error a pesar del volumen de
términos que los componen. Para hallar las tasas de enriquecimiento y precoordinación,
por ejemplo, fue necesario el recuento de todos los descriptores y de todas las relaciones
semánticas que comprenden los seis tesauros.

223

.
Capitulo 5

5.3. Características de los tesauros analizados

Pasamos a analizar las particularidades de los tesauros consultados en el trabajo


experimental, todos ellos monolingoes, tres de los cuaJes pertenecen al campo de la
ciencia y la técnica, y tres a las ciencias sociales y humanidades.

5.3.1. Tesauro ICYT de Biología animal

• Composición

Contiene una introducción explicativa de las razones que justifican la creación del
tesauro, su cobertura temática y la forma en la que se seleccionó y normalizó la
terminología. Explica también los símbolos empleados para Za representación de las
relaciones semánticas entre los términos, así como las formas de presentación, su
actualización y cuestiones relacionadas con su tratamiento automático.

Las formas de presentación de los términos son alfabética, sistemática y


permutada.

• Tamaño

El tesauro se compone de 3.781 términos, de los cuales 2.782 son descriptores


y 999 no descriptores.

224
Capítulo 5

• Relaciones de equivalencia

Las denominaciones científicas se consideran preferentes, teniendo los términos


comunes o vulgares categoría de no descriptores.

La tasa de relaciones de equivalencia es de O’3, por lo que no alcanza el mínimo


estipulado en los criterios de referencia, que señalan como valor más bajo aceptable O’5,
considerando los especialistas más exigentes en este sentido, que el valor deseable debe
ser mayor de 1.

• Relaciones jerárquicas y asociativas

8. 150+971 —0’3
2.782

• Reciprocidad de las relaciones semánticas

En las 27 páginas analizadas, escogidas de forma aleatoria, observamos la


existencia de reciprocidad entre todas las relaciones establecidas entre los términos, tanto
jerárquicas como asociativas y de equivalencia.

• Notas aclaratorias, definitorias o de aplicación

El tesauro tiene un total de 84 notas, lo que supone un 3% del total de


descriptores.

225
Capítulo 5

• Niveles jerárquicos

Se compone de 15 campos temáticos en los que existe un predominio de los


niveles jerárquicos 3 y 4, a excepción del campo número 13, destinado a Taxonomía y
sistemática, en donde abundan los niveles 7 y 8, llegando a alcanzar en algunos casos
hasta LI niveles de jerarquía descendente.

• Morfología de las palabras

Tanto en lo que a forma de las palabras se refiere, como al uso del singular y
plural, se atiene a lo establecido en las normas.

• Aspectos estéticos de composición y tipografía

Presenta los descriptores en mayúsculas y los no descriptores en minúsculas. De


los seis tesauros analizados, éste es el único que representa las relaciones entre términos
mediante los símbolos internacionales propuestos por la norma ISO, los demás lo hacen
por medio de signos alfabéticos. Ej.:

Aguila perdicera

=> HIERAETUS FASCIATUS

HIERAETUS FASCIATUS

TM 130401113
Águila perdicera
ÁGUILAS
< ACCIPITRIDAE
< FALCONIFORMES

226
Capítulo 5

• Nivel de precoordinación

1.817
914
32
2

1. 817-4-2<914)+3<32)+4<2) —1,36
1.817+914+32+2

5.3.2. Tesauro Electrotécnico

• Composición

Se componen de índices alfabético, sistemático y permutado, e incluye un anexo


con un diccionario inglés/español.

Es el único lenguaje documental de los analizados que explica en su introducción


las posibilidades de compatibilidad con otros tesauros del área o con macrotesauros. Lo
hace en un epígrafe en el que señala también la periodicidad aconsejada para su
actualización, tanto de la edición experimental como de ediciones posteriores.

• Tamaño

Comprende un total 7.764 términos: 6.869 descriptores y 895 no descriptores. El


tesauro tiene gran amplitud semántica, incluyendo conceptos muy específicos; ese nivel
de concreción nos fue de mucha utilidad al preparar las estrategias de búsqueda, pero

227
Capítulo 5

dificultó la localización de información en aquellas ocasiones en las que se necesitaba


recurrir a descriptores genéricos, inexistentes en el vocabulario.

• Relaciones de equivalencia

La tasa de estas relaciones es de 0’1, cifra muy baja si tenemos en cuenta los
valores medios aconsejados.

• Relaciones jerárquicas y asociativas

7.796+1.459 =1’35
6 . 869

• Reciprocidad de las relaciones semánticas

Se procedió al análisis por muestra aleatoria cada once páginas, dada la extensión
del tesauro. Se encontraron numerosas irregularidades que mencionamos a continuación.
Consideramos que dichas imprecisiones se deben al extenso volumen de términos que
recoge y, sobre todo, a que el tesauro constituye una edición provisional, que no ha sido
aún revisada.

En el establecimiento de relaciones jerárquicas observamos los siguientes fallos:

El descriptor anclaje tiene como término genérico elementos auxiliares, que no


contiene a su vez anclaje como término específico. El mismo caso de falta de
reciprocidad se da entre los siguientes descriptores: andamio y material de obra; central
de gas y central térmica de gas; confonnidad a norma y normalización y certificación;

228
Capítulo 5

convertidor electrónico y dispositivo electrónico, bajo este descriptor aparece además el


término específico convertidor de fase en el que no figura como término genérico. En
este mismo término aparece la relación con máquinas, el cual, realizada la comprobación,
se detectó que no lo tiene a él como asociado. Tampoco existe reciprocidad entre equipos
de espuma y su específico taza de espuma, que no existe como descriptor. Fraguado tiene
como término genérico material de obra, pero éste no lo tiene a él como específico. El
término genérico vehículos de tracción eléctricos incluye como específico grupo auxiliar,
pero bajo esta entrada no figura ninguna relación de generalidad con aquél; lo mismo
ocurre con el descriptor grupo compresor. Guiaondas cita como genéricos canal de
transmisión y circuito de comunicación, sin embargo, en el primero no está como
específico y el segundo no aparece como descriptor. Normativa de control remite al
término específico medición, que no está aceptado como término preferente. Ruido
eléctrico envía hacia el genérico transmisión de energía eléctrica, que no existe como

descriptor. Transpone de energía eléctrica figura en descendente jerarquía bajo línea de


transpone de energía, no existiendo reciprocidad en la relación; bajo ese mismo
descriptor figuran varios términos específicos que, no lo incluye a él como genérico:
alimentación eléctrica, alta tensión, corriente de línea eléctrica, corriente vagabunda,
defecto de línea eléctrica, derivación a tierra, descarga atmosférica, impedancia
característica, media tensión, muy alta tensión, poder de cierre en cortocircuito,
propagación de la corriente eléctrica, ruido eléctrico, sobre tensión de maniobra, tensión
eléctrica, y ultra alta tensión. Ventana tiene como genérico material de obra, pero éste
no lo tiene a él como específico. Ventilación doble remite con un TG a elementos
auxiliares, pero en esta entrada no figura la existencia de términos específicos; en
ventilación radial ocurre lo mismo. Por último, zona neutra tiene como término genérico
servicio, pero servicio no lo tiene a él como específico.

229
Capítulo 5

Se dan algunos casos en los que un descriptor remite a otro más genérico que no
aparece en el tesauro como término preferente. Esto ocurre, por ejemplo entre botón
pulsador y accionamiento, entre magnitudes características y tracción eléctrica y entre
2iimbabwe y comunidades españolas, cuyo error, en este caso resulta evidente.

En cuanto a las relaciones asociativas, se detectaron las siguientes irregularidades:

Metales está asociado con máquinas especiales, pero éste no está relacionado con
metales. Normalización de control está relacionado con instrumento-patrón, relación que
no se recoge de forma recíproca, si bien es cierto que la asociación se establece con
normativa de control, lo cual parece deberse a un error de carácter tipográfico o de
cambio de denominación del descriptor a la hora de su inclusión en el tesauro.
Parámetros físico mecánicos se asocia a magnitudes de los cables y a propiedades de los
materiales, no existiendo reciprocidad entre ellos. Ambos se relacionan, no obstante, con
medida de parámetrosfísico mecánicos, lo cual, como en el caso anterior, hace pensar
en un posible cambio de denominación del término preferente. Política de empleo está
relacionado con seguridad e higiene, pero en éste no aparece como término relacionado.
Protección auditiva se asocia a amortiguador de ruidos y a tapones antiruidos, pero en
estas dos entradas no hay reciprocidad con protección auditiva. Sistema eléctrico está
asociado con rele, que no aparece en el tesauro; también lo está a los términos
automatización de sistemas y calidad de servicio, pero en estos descriptores no hay
relación con sistema eléctrico. El término preferente transpone de energía eléctrica
figura relacionado a consumo de energía eléctrica, sin que exista reciprocidad en dicha
relación.

230
Capítulo 5

• Notas aclaratorias, definitorias o de aplicación

El tesauro tiene un total de 256 notas, lo que supone un 3’7% del total de
descriptores.

• Niveles jerárquicos

Predominan los niveles tres y cuatro, habiendo, en proporción, pocos casos en los
que la jerarquía desciende a un quinto nivel.

• Morfología de las palabras

- Utiliza sustantivos para representar los descriptores simples y, en el caso de los


sincagmáticos, la base es un sustantivo.

- No hemos detectado el uso de la forma invertida de las


expresiones.

- Representa los conceptos en singular, excepto cuando el término es más popular


o existen diferencias semánticas al usar ambas formas.

- Emplea siglas, que desarrolla mediante notas aclaratorias. Ej.:

CEDEFOP
NA: CENTRO EUROPEO PARA EL DESARROLLO
DE LA FORMACIÓN PROFESIONAL

231
Capítulo 5

• Aspectos estéticos de composición y tipografía

En la presentación alfabética, tanto los descriptores como los no descriptores


figuran en mayúsculas y negrita. Al tener el mismo tratamiento tipográfico los término
preferentes y no preferentes, el tesauro no sigue las directrices señaladas al respecto por
la norma ISO.

En la parte permutada, consistente en un índice KWIC, se destaca en negrita la


palabra que alfabetiza, lo cual supone una ventaja para la visualización de las entradas
que lo componen.

Basa el vocabulario en propiedades específicas, procedimientos particulares y


materias específicas, razón por la cual hace uso del singular con preferencia al plural,
a diferencia de otros tesauros.

• Nivel de precoardinación

a= 1.814
b= 4.314
c= 954
d= 61
e=6

1.814+2(4.314>+3(954)+4(61)+s(6>i/s
1.814+4.314+954+61+6

232
Capítulo 5

5.3.3. Tesauro de Medio ambiente

• Composición

Tiene tres formas de presentación: sistemática, alfabética y permutada. Precede


al tesauro una introducción explicativa de sus antecedentes, contenido, estructura,
criterios de establecimiento de relaciones semánticas, formas de presentación, gestión y
utilización.

• Tamaño

Se compone de 2.320 descriptores y 608 términos equivalentes.

• Relaciones de equivalencia

608 —o’26
2.320

• Relaciones jerárquicas y asociativas

La tasa de enriquecimiento de este tesauro es del 2’5 %, entrando dentro de los


límites aconsejados.

• Reciprocidad de las relaciones semánticas

En el análisis que realizamos por muestreo aleatorio no observamos la existencia


de irregularidades en lo que a reciprocidad entre las relaciones se refiere, salvo en la

233
Capítulo 5

página 67, en donde aparece el término benzopirenos en relación con otros descriptores
más específicos:

Benzopirenos
MT 2030 Contaminantes
BT1 Contaminantes orgánicos
BT2 Contaminantes químicos

Bajo la entrada contaminantes químicos se observa, sin embargo, que no existe


ninguna relación recíproca con contaminantes orgánicos ni con benzopirenos.

• Notas aclaratorias, definitorias o de aplicación

Hay un total de 66 notas en el tesauro, lo que supone que tan sólo un 2’8% de
los descriptores las incluyen. Se podría justificar un valor tan bajo si se tiene en cuenta
que se trata de un tesauro especializado en un área técnica, menos susceptible a la
ambigúedad semántica que los destinados a las ciencias sociales. En cualquier caso el
índice está muy por debajo del 10% que recomiendan las distintas fuentes.

Las notas responden a la siguiente tipología de uso: definición de conceptos; notas


de aplicación, es decir, indicaciones de la forma más adecuada de utilizar un descriptor
para indizar o para recuperar información; se emplean, por último, para desarrollar
siglas. Ej.:

PLATAFORMA CONTINENTAL
SN Lecho y subsuelo de las aguas submarinas ads’acentes a
las costas donde los estados ribereños ejercen derecho
de soberanía para la explotación de los recursos.

234
Capículo .5

EQUIPO DE TRATAMIENTO DE AGUA


SN Se recomienda el uso de descriptores más específicos.

ONUDI
SN Organización de las Naciones Unidas para el Desarrollo
Industrial.

• Niveles jerárquicos

La media de niveles oscila entre 5 y 6.

• Morfología de las palabras

No hemos detectado la existencia de ningún caso de inversión de términos,


respetándose en todas las entradas el orden del lenguaje natural.

Según se indica en la introducción al propio tesauro, se siguen las normas de


Unesco en lo que a forma de las palabras se refiere. Utiliza el singular para representar
propiedades específicas, procedimientos particulares, materias especificas, nombres
propios, disciplinas, y, en general, conceptos que no pueden ser numerados. Se usa el
plural en los descrz~tores indicativos de las propiedades genéricas, los materiales
genéricos, los objetos, y, en general, conceptos que pueden ser numerados’1. Se respeta
igualmente la forma sustantiva de las palabras. Ej.:

‘1UNESCO; ISO. Príncipes directeurs pour I’élablissement et le d¿veloppement de tbesaurus


mnnolingues.Paris: UNESCO; Genéve: 150, 1981. (Norma ISO 2788-1981).

235
Capitulo 5

factor climático invernaderos


ingeniería montes
productividad productos agrícolas

El tratamiento de las siglas es diverso, del análisis del índice alfabético del tesauro
deducimos su empleo de la siguiente forma: a> se desarrolla en nota su significado; b)
se toman las siglas de la institución como término descriptor y se considera la forma
desarrollada como no descriptor. Por último, se trata como término preferente la forma
desarrollada, en cuyo caso las siglas pasarán a la categorfa de no descriptores, con el
consiguiente reenvío hacia la forma aceptada. Ej.:

UNICEF
SN Fondo de las Naciones Unidas para la Infancia.

OMS
UF Organización Mundial de la Salud

EURATOM
USE Comunidad europea de la energía atómica

• Aspectos estéticos de composición y tipografía

Utiliza signos alfabéticos normalizados, en inglés, para indicar el tipo de relación


establecida entre los términos.

Cada una de las listas que componen el tesauro está impresa en papel de diferente
color, lo cual es una ayuda para localizar la información. No existe, sin embargo,
diferenciación tipográfica entre descriptores y no descriptores, ambos se expresan en
minúscula y en negrita.

236
Capítulo 5

• Nivel de precoordinación

a= 870
b= 1.400
c= 94
d=9

87 0+2 (1 400)
. (94) <9~ _
870+1.400+94+9

5.3.4. Tesauro “Mujer”

• Composición

Lo componen cuatro partes: a) un índice alfabético que se timita a listar


descriptores y no descriptores sin indicación detallada de las relaciones semánticas entre
los términos; b) un esquema jerárquico que comprende todos lo campos del tesauro; c)
un índice sistemático que incluye atípicamente no descriptores y notas aclaratorias y d)
un indice permutado Kwic. En contra de lo que aconsejan las normas, sitúa las relaciones
de equivalencia de cada descriptor después de las jerárquicas y asociativas, por ejemplo:

AUDIOVISUALES
TE VIDEO
FOTOGRAFÍA
TR CINE
UP MEDIO AUTIOVISUAL

237
Capítulo 5

• Introducción

Aunque no especifica periodicidad, prevé actualizaciones periódicas que incluyan


posibles candidatos a descriptor.

• Tamaño

El tesauro está compuesto por 1.118 términos, de los cuales 714 son descriptores
y 404 son términos equivalentes.

• Relaciones de equivalencia

40
~ _0’56
14

• Relaciones jerárquicas y asociativas

282+664 =2132
714

Dado que la tasa aconsejada es de 2 a 5, el índice de relaciones en este tesauro


resulta muy baja.

238
Capítulo 5

• Reciprocidad de las relaciones semánticas

En el análisis de la muestra preparada para comprobar la reciprocidad, se obervó


que en las relaciones de equivalencia existe una falta de correspondencia en los siguientes
casos:

Los términos no descriptores Prestaciones por incapacidad laboral transitoria,


distribución de responsabilidadesfamiliares, pobres, conflictos armados, programas de
salud y trabajadoras madres de familia, que figuran precedidos del signo UP en el índice
sistemático, han sido omitidos en los índices permutado y alfabético.

Directoras cinematográficas e informáticas no figuran ordenados alfabéticamente.

Al realizar la comparación entre los términos específicos (TE) y los genéricos


(TG), observamos la existencia de algunas incorrecciones al desarrollar los específicos,
así como ciertos fallos en la organización alfabética de los mismos:

El TE exiliadas, dependiente de migración, no figura en orden coherente. Los


términos específicos que derivan del genérico protección social no siguen un orden
alfabético, estando además sin establecer las relaciones del descriptor servicios sociales.
En el TG iniciativas locales de empleo falta por desarrollar el TE autoempleo. En el TG
cargos públicos existe el TE asociacionismo, que tampoco está desarrollado; por último,
el descriptor genérico voto femenino, perteneciente al campo temático anterior incluye
electorado femenino, pero omite la explicación de sus relaciones.

239
Capítulo 5

En la página 98 se repite el término Enfermedades mentales.

Bajo el descriptor genérico Profesionales de las artes no se incluye el descriptor


especifico Trabajadoras de artes gráficas, que se considera parte de este campo
jerárquico, y sin embargo se desarrolla el término Músicas, que no se incluía en dicha
cadena jerárquica.

Por lo que a relaciones asociativas se refiere, no se han detectado irregularidades,


salvo alguna de carácter tipográfico.

En el TG Bodas aparec&el término relacionado Nupcialidad, pero en el término


genérico Nupcialidad no existe la relación recíproca. No hay reciprocidad tampoco entre
los descriptores Centros de enseñanza y Educación.

• Notas aclaratorias, definitorias o de aplicación

El tesauro tiene un total de 123 notas, lo que supone un 17% del total de
descriptores.

• Niveles jerárquicos

El máximo de niveles jerárquicos es de seis, siendo la media de tres, la más


utilizada en el conjunto del tesauro. Por ejemplo, en el descriptor trabajadoras, que
aparece en las páginas 61 y 62.

240
Capítulo 5

• Morfología de las palabras

Se utiliza el género femenino plural y no el masculino, de acuerdo con las


características del Centro de documentación y el tipo de documentación que recoge,
centrada en la problemática de la mujer.

• Aspectos estéticos de composición y tipografía

Descriptores y no descriptores se escriben en mayúsculas, destacándose los


términos aceptados en negrita. En el índice permutado -Kwic-, se resaltan en negrita las
entradas que alfabetizan.

• Nivel de precoordinación

a= 362
b= 324
c= 32

361+2 <321) +3<32


36 1+321+32

5.3.5. Tesauro ISOC de Psicología

El tesauro, editado en 1995, constituye la versión actualizada del publicado en


1992 por iniciativa del ISOC, con la intención de servir de instrumento de indización a
los Centros de Documentación y Bibliotecas especializadas en Psicología y Ciencias
afines.

24 1

)
Capítulo 5

• Composición

Se compone de cuatro partes: un índice alfabético con todas las relaciones de


equivalencia, jerárquicas y asociativas de cada descriptor; un índice sistemático que
agrupa los descriptores en campos temáticos; un índice permutado y un anexo. Incluye
además un apéndice que comprende la clasificación para el área de psicología en la base
de datos PSEDISOC, que está basada en la utilizada por el Psychological Abstracts y
PsycINFO (American Psychological Association) en su versión de 1988.

El índice permutado comprende no descriptores, pero no remiten al descriptor


aceptado, por lo que el usuario no puede conocer el campo al que pertenece, a menos que
consulte, además, la parte alfabética del tesauro.

Contiene una introducción en la que se informa al usuario de su ámbito de


aplicación y de sus características.

La codificación es numérica. El código se sitúa detrás del descriptor en los índices


alfabético estructurado y permutado, y va precediéndolo en el índice sistemático.

El tesauro es de carácter monodisciplinar, incluyendo vocabulario de campos


auxiliares para cubrir aspectos económicos, jurídicos, culturales, artísticos, psicológicos
y sociales.

Para su elaboración se combinaron los métodos inductivo y deductivo, utilizando


como base terminológica las palabras clave que sirvieron para la indización de los
artículos de revistas que venía realizando el ISOC desde el año 1975 en que se creó la
Base de Datos de Psicología, denominada en la actualidad PSEDJSOC. A estas palabras

242
Capítulo 5

clave se sumaron los términos utilizados por los usuarios para solicitar documentación
del Centro, respondiendo de este modo el vocabulario a necesidades de información
reales. La terminología se completó con el vaciado de diccionarios, léxicos, planes de
estudio y tesauros especializados o afines a la materia, existentes en España.

• Tamaño

El tamaño del tesauro es de 4.400 términos de los cuales 2.788 son descriptores
y 1.612 no descriptores. La parte del anexo contiene 690 términos, de los cuales 423 son
no descriptores y 359 descriptores, que se agrupan en 17 campos temáticos.

• Relaciones de equivalencia

1.612
2.788

• Relaciones jerárquicas y asociativas

No incluye relaciones polijerárquicas, siendo la tasa de enriquecimiento del 2’9%:

5.249+2.868=2/9
2.788

• Reciprocidad de las relaciones semánticas

Todas las relaciones que se establecen son reciprocas.

243
Capítulo 5

• Notas aclaratorias, definitorias o de aplicación

Del total de 2.788 descriptores, 732 tienen notas aclaratorias, siendo el porcentaje
del 26%.

Las notas se utilizan básicamente para definir conceptos especializados. Ej.:

MEDITACIÓN
NA Reflexión sostenida en estado de relajación, en el cual una persona intenta
lograr la integración de sus sentimientos, emociones, actitudes e ideas.

• Niveles jerárquicos

El máximo de niveles jerárquicos del tesauro es de ocho.

• Morfología de las palabras

Su uso se adecúa a lo que dictan las normas. La forma plural se destina a temas
concretos: psicoterapeutas, y el singular a temas abstractos: valoración.

La base del descriptor es sustantiva. Utiliza el sustantivo o formas sustantivadas,


sustantivos más adjetivos y sustantivos unidos por preposición.

En ningún caso hemos observado el empleo de inversión de términos, se respeta


el orden natural de las expresiones.

244
Capítulo 5

• Aspectos estéticos de composición y tipografía

En la parte alfabética, tanto descriptores como no descriptores se escriben en


mayúsculas, pero éstos últimos están destacados tipográficamente en negrita. En el índice
permutado, sin embargo, no existe diferenciación tipográfica entre términos preferentes
y no preferentes, lo que, unido a la ausencia de reenvío de términos no aceptados a los
que silo están, resta utilidad a dicho índice. En la presentación sistemática los distintos
niveles jerárquicos se representan mediante sangrado a la derecha, haciendo preceder,
además, a cada descriptor de puntos suspensivos que facilitan la visualización de dichos
niveles.

• Nivel de precoordinación

a~ 1.231
b= 1.358
c= 186
d= 12
e=1

1.231+1.358+186+12+1

Nota.- Para hacer las valoraciones cuantitativas de este tesauro no se han contabilizado
los términos componentes del anexo, porque consideramos que en su composición se ha
seguido el mismo criterio que en el resto del tesauro, y por la amplitud que ya de por sí
tiene la parte nuclear del mismo, cuyas entradas por sí solas permiten realizar una
evaluación exhaustiva.

245
Capitulo 5

5.3.6. Tesauro de Asuntos sociales

• Composición

Se compone de listas alfabética, sistemática y permutada, y se completa con una


introducción explicativa de la intencionalidad del tesauro y de las razones que motivaron
su creación. Se informa en ella al usuario sobre las siguientes cuestiones: ámbito de
aplicación, metodología, estructura y presentacíon.

De la necesidad de actualización dan fe algunas entradas del tesauro tales como:


Alemania R.D., Alemania R.F. La razón por la que las revisiones y puestas al día de éste

y otros tesauros no se hacen con la periodicidad deseable es que no todas las instituciones
cuentan con recursos materiales y humanos para dicha actualización, debido, en buena
parte, a la escasez de medios con que se dota, en ocasiones, al quehacer bibliotecario.
• Tamaño

El tesauro se compone de 1.710 descriptores y 429 términos no descriptores.

• Relaciones de equivalencia

429 —O’25
1.710

246
Capítulo 5

• Relaciones jerárquicas y asociativas

1860 +511 _

1.710

• Reciprocidad de las relaciones semánticas

Aunque en el tesauro no existen muchas irregularidades en este sentido,


detectamos la existencia de falta de correspondencia entre algunos términos en lo que a
relaciones asociativas y de equivalencia se refiere. Por ejemplo: el término genérico
centros de documentación tiene relaciones asociadas con difusión de la información y con
documentación, sin embargo, en la entrada correspondiente a difusión de la información
no aparece la relación recíproca con centros de documentación. Se da el mismo caso
entre centros de rehabilitación, conectado a minusválidos, no existiendo reciprocidad a
la inversa. Otros descriptores como centros especiales de empleo o centros ocupacionales
tienen asociado el descriptor minusválidos, pero éste último no cuenta entre sus relaciones
con estos dos descriptores que deberían estar asociados a él. El término preferente
información está relacionado con tiencias de la información, en cuya entrada no figura
el término relacionado información.

En cuanto a las relaciones de equivalencia se dan los siguientes casos:

Deficiencia desfiguradora aparece como equivalente de deformidad, pero no existe


ninguna entrada en la que figure dicho término como no descriptor. En la entrada
genérica deficiencia mental grave se incluye la relación equivalente con retraso mental
grave, sin que exista entrada recíproca en el tesauro. Por último, las siglas OCDE se
aceptan como descriptor, relacionando con un UP el término no aceptado Organización

247
capítulo s

de Cooperación y Desarrollo Económicos, sin embargo este último término no preferente


aparece como reenvío.

• Notas aclaratorias, definitorias o de aplicación

Se limitan en este tesauro a definir el ámbito de aplicación del vocabulario.


Existen un total de 24, es decir, el 1’4%, el porcentaje más bajo de los tesauros
analizados.

• Niveles jerárquicos

La tasa máxima es de cinco niveles jerárquicos, aunque predominan los campos


con tres y cuatro niveles.

• Morfología de las palabras

Como se señala en la propia introducción, el tesauro se ciñe a las reglas


establecidas internacionalmente, en lo que a morfología del descriptor se refiere.

En cuanto a las siglas, se utiliza en unos casos la forma desarrollada y en otros


la abreviada. Cuando se adopta ésta última como descriptor, se hace un reenvío hacia la
forma completa, que considera como término no descriptor.

• Aspectos estéticos de composición y tipografía

Los descriptores están escritos en negrita, lo cual facilita su distinción de los no


descriptores, que no aparecen destacados, sin embargo, tanto los términos preferentes

248
Capítulo 5

como los no preferentes figuran en minúscula, lo cual no beneficia la localización de los


descriptores.

Los términos no aceptados van acompaiiados de las siglas ND (No Descriptor),


innecesaria a nuestro juicio, puesto que, como en todos los tesauros, dichos términos
llevan la indicación USE, que remite al término aceptado. La inclusión de la sigla
mencionada supone además un código añadido que ha de interpretar el usuario.

• Nivel de precoordinación

a= 857
b= 780
c= 67
d=6

t=ss?+2<760)+3<67>+4<G)
857+780+67+6
—1’54

5.4. Características de las bases de datos consultadas

5.4.1. Base de datos ICYT de Biología animal

La información relativa a Biología animal se encuentra recogida en la base de


datos de Ciencia y Tecnología del ICYT, que distribuye el CINDOC. Cubre un amplio
campo de materias y tiene además conexión con otras ramas de la ciencia tales como
veterinaria y producción animal.

249
Capítulo 5

La base se nutre básicamente de publicaciones seriadas de carácter científico no


de divulgación, y. en menor proporción, de monografías, boletines e informes. Esta
información cubre todo lo publicado en España en el período de 1979 a 1997.

Se puede consultar en línea o en CD-Rom. Los discos se actualizan cada dos


años, mientras que la puesta al día en línea es diaria. El CD-Rom lo comercializa
Micronet, la documentación en línea, como decíamos anteriormente la distribuye el
CINDOC.

Es posible recuperar por todos los campos, tanto en línea como en CD-Rom.
Dichos campos son: número de registro, autor, título, título original, lugar de trabajo,
nombre de la revista, publicación, ISSN, tipo de documento, idioma, clasificación,
descriptores, descriptores secundarios, topónimos, identificadores y período histórico.

Al tratarse de un área del conocimiento que abarca varias disciplinas, el nivel de


indización no puede ser muy especializado, no obstante, se tiende a profundizar lo más
posible en el momento de caracterizar los documentos. El lenguaje controlado empleado
para este proceso es el Tesauro JCYT de Biología animal, que analizamos en este mismo
capítulo.

El horario de acceso a la base es de 8 de la mañana a 8 de la tarde. Se puede


obtener ayuda para su consulta, aunque tenemos que decir a este respecto que este
servicio, al menos en lo que respecta a nuestra experiencia, es muy precario debido a la
escasez de terminales disponibles para el usuario, así como las dificultades técnicas
encontradas en su utilización. Para realizar las consultas que desarrollamos en el capitulo
sexto de este trabajo, no tuvimos otra alternativa que usar el CD-Rom, porque el acceso

250
Capítulo 5

en línea no nos era posible. El interfaz es en esta modalidad sencillo de utilizar, y ofrece
la posibilidad de utilizar recursos como el álgebra de Boole y otro tipo de enlaces
sintácticos para conformar las estrategias. Las primeras pantallas que encontramos al
realizar la conexión se representan en las figuras 39, 40 y 41.

5.4.2. Base de datos PIE (Programa de Investigación y Desarrollo


Electrotécnico>.

La base depende de la Asociación de Investigación Industrial Eléctrica (Asinel)


y BASIS es el distribuidor que la soporta. Se puede consultar en línea durante las veinti-
cuatro horas del día, vía modem.

Se compone de 1.360 documentos, todos ellos contienen proyectos de investiga-


ción eléctrica. La base se creó en 1988, no existiendo antecedentes de una similar hasta
esa fecha.

La actualización de los datos se realiza mensualmente. Dichos datos se distribuyen


en soporte magnético (pack) dos veces al año a las empresas eléctricas, por lo que las
consultas directas a la base de Asinel son en muchos casos innecesarias y, en cualquier
caso, difícilmente controlables.

El nivel de indización de los documentos es muy específico, de acuerdo con la


naturaleza de la materia que tratan. Se utiliza para la normalización el Tesauro
Electrotécnico, cuyas características se analizan en este mismo capítulo.

25 1
LI,
c’J
o
u,
o
-4
4>
‘u
o
4.>
cd
‘u
4>
‘u
‘A
cl>
e-, Lo
o cd
.0
(/2
ca
o cd
-4
ca 4>
‘u
5 ti
e
a>
E
u.’
z
o
H
a)
‘rs
u ca
i cd
-4
<-1
cd
4.>
e
cd
0.
Lo
cd
4>
E
—4
s.j
a,
‘rl
rs
4
o
bO
—4
rs4
II ¡
1 t
1—
4
o
o
y-
Co
5
-J 1~
LLJ
2
o
-4
cd
‘rl
rs.
« ~ ‘7 r
Capítulo 5

Al establecer la conexión, aparecen en pantalla los siguientes datos:

Primera pantalla:

ASINEL

1 - Acceso B. Datos PIE.


2 - Acceso al 5. Operativo.
3 - Finalizar la sesión.

Figura 42

Segunda pantalla:

<FECHA> BASE DE DATOS DEL PIE <HORA>


MENU PRINCIPAL

C Consulta de la información.

BASIS Acceso Sistema Central Basis.

FIN Fin de la sesión.

Elija una opción y pulse ENTER.-->

Figura 43

255
Capítulo 5

Tercera pantalla:

<FECHA> BASE DE DATOS DEL PIE <HORA>


N. DOCUMENTOS SELECCIONADOS.--
CONSULTA B. DATOS

NP.. Num. PIE SI Signatura. -

NR Num. Registro
- EP Estado del proyecto
-

TI Título
- EV Evaluación -

EM Empresas
- PR Presupuesto -

EC Entidades Colab.
- DG Descriptores Geog. -

FI Fecha de Inicio. DT Descriptores Temát.


- -

FF Fecha Final.
- RO Resumen de objetivos.
-

AU Autores.
- RE Resumen. -

LIST Subconjunto búsqueda


- NEW Inicializat Conj. -

MENU Acceso a Menú Principal FIN Fin sesión


- -

VIS Visualización Document. OUTP Impresión Subc.


- -

REDU Visualización Reducida BASIS Acceso a Basis.


- -

Elija opción y pulse INTRO

Figura 44

Al consultar se deben escribir en la pantalla los términos de búsqueda puesto que,


por el momento, el tesauro no está automatizado. Es posible utilizar los operadores
booleanos y la búsqueda por truncado, siendo el tiempo de respuesta inmediato. El
sistema detecta los errores sintácticos cometidos en la formulación de las estrategias.

No hay limitación de sentencias a unir, ni tampoco a exportar, lo cual constituye


una gran ventaja con respecto a otros sistemas. Esta base ofrece la posibilidad de
visualizar todos los campos o sólo algunos de ellos.

256
Capítulo 5

Cuando la exportación de los registros se hace en papel, los descriptores, o Las


palabras clave situadas en los campos recuperados aparecen destacados en cursiva, lo cual
supone una gran ayuda para el análisis de los resultados.

En el capítulo cuarto de esta tesis incluimos un modelo de registro de PIE en el


que pueden observarse los puntos de acceso al documento, siendo todos ellos recupera-
bles.

Es destacable la facilidad de acceso a esta base de datos, así como el apoyo


recibido para su consulta.

5.4.3. Base de datos Biblioma, del Centro de Documentación del Ministerio


de Medio Ambiente

El centro de documentación de Medio Ambiente consta de seis bases de datos:


Biblioma, compuesta fundamentalmente por monografías; Lema que abarca todo lo
relativo a legislación en materia de medio ambiente; Audima que recoge información
audiovisual; Pima dedicada a proyectos de investigación; Remo, que se nutre de revistas
sobre la materia del centro; y Ema, que recopila estudios y literatura gris en general,
consultable en sala o en microficha.

De todas estas bases tomamos para nuestra experimentación Biblioma, que no


pudimos consultar en línea por encontrarse el centro de documentación en período de
waslado, por lo que decidimos trabajar con el CD-Rom que distribuye el Centro de
publicaciones del Ministerio de Medio ambiente. El disco contiene un total de 26.362
registros que cubren el período de 1976 a 1994. Recoge las siguientes materias: Medio

257
Capítulo 5

natural, asentamientos, impacto ambiental, política ambiental, derecho y legislación,


gestión ambiental, medio social, actividad económica y Ciencia y tecnología.

La actualización de los datos se realiza habitualmente a diario, y el CD-Rom se


edita anualmente.

En el CD-Rom todos los campos son recuperables y, por tanto, exportables a


papel o a disquete. Existe, no obstante, limitación de sentencias a unir o exportar, siendo
el máximo de 9.

Para la normalización de los documentos se utiliza el Tesauro de Medio ambiente,


cuyas características han sido descritas en este capitulo. Se puede acceder al tesauro de
forma automática, lo cual resulta beneficioso para la consulta. Detectamos la falta de
correspondencia entre algunos descriptores del tesauro manual y el introducido en la
base, viéndonos obligados, en algunas consultas, a modificar las estrategias preparadas
originalmente.

No podemos representar aquí el menú de apertura de la base, ya que, desde el


CD-Rom, el software de la base -Micronet- no permite su impresión en papel ni su
exportación a disquete.

258
Capítulo 5

5.4.4. Base de datos del Centro de Documentación de la Mujer

La base depende del Instituto de la Mujer, en conexión con el servidor de la red


del mencionado Instituto.

Contiene 12.700 documentos, todos ellos referidos a la mujer, desde el punto de


vista sociológico. El centro recoge libros, informes, actas, literatura gris, vaciado de
artículos de revistas, analíticas de capítulos de libros, estadísticas, investigaciones, etc.

La actualización de los datos se realiza cada dos o tres días, volcándose los datos
del fichero temporal de carga a la central.

La base cubre el período de 1980 a la actualidad, si bien se realizó un expurgo


de información relacionada con cocina, folklore, etc., procedente de los fondos de la
Sección Femenina que se habían incorporado a dicho Centro.

El nivel de indización de los documentos es medio, dado el carácter interdiscipli-


nar de las materias relacionadas con el tema central de la base, Para el proceso de
normalización se utiliza el Tesauro “Mujer”.

Al consultar se deben escribir en la pantalla los términos de búsqueda puesto que,


por el momento, el tesauro no está incluido en el programa.

Se pueden unir y exportar sentencias sin limitación, lo cual supone una gran
ventaja para el usuario. Esta base ofrece, además, la posibilidad de recuperar por todos
los campos, unos tienen ficheros inversos, no secuenciales, por lo que permiten una ágil

259
Capítulo 5

recuperación. Incluso el campo resumen, aunque no tiene asociado índice de interroga-


ción, tarda menos de un minuto en encontrar una cadena de caracteres solicitada.

El horario de acceso a la base es de 9 a 2 horas, por las mañanas y de 4 a 6 horas


de la tarde. Al establecer la conexión, aparecen en pantalla los siguientes datos:

Primera pantalla:

APLICACIÓN DOCUMENTAL CHEMDATA INFOTEX


-

CONSULTA - MENU PRINCIPAL

Bases de datos disponibles

1 ARTÍCULOS DE REVISTA
-

2 MONOGRAFÍAS
-

3 ARCHIVO CENTRAL
-

Elija la opción deseada:

FIN = Salir de CONSULTA

Figura 45

260

:
Capítulo 5

Segunda pantalla:

APLICACIÓN DOCUMENTAL * CHEMDATA INFOTEX-

BASE DE DATOS: ARTÍCULOS DE REVISTA - CONSULTA SENCILLA

Campos de consulta:

1 - Autor Personal 7 Descriptores


-

2 - Autor Secundario 8 Lengua


-

3 - Autor Corporativo 9 País


-

4 - Congreso
5 - Título
6 - Tipo de Documento

CAMPO: $0
CONSULTA:

CM= Cons. Múltiple LA= Listar F. Aut. T= Listar Tesauro


V Volver M.

Figura 46

261
Capítulo 5

Tercera pantalla:

APLICACIÓN DOCUMENTAL * CHEMDATA - INFOTEX

BASE DE DATOS: ARTÍCULOS DE REVISTA - CONSULTA COMPUESTA

$1 9 respuesta(s) para: AUTORPER = RUÍZ*


$2 50 respuesta(s) para: DES=ENSEÑANZA PRIMARIA
Y EDUCACIÓN ESPECIAL
$3 300 respuesta(s) para: LENGUA=SPA

Elija la opción deseada:

CS= Cons. Simple CM= Consulta múltiple CH= Consulta Histórico H=Histórico
m=Inic. Histórico L= Listar LC= Listar Campos Sec.

Figura 47

Se pueden emplear los siguientes recursos: truncamientos a izquierda y derecha,


operadores booleanos, y lo que denominan en el propio centro máscaras, que consisten
en un punto o más que se pueden escribir en sustitución de un carácter.

Cuando se realiza la exportación de los registros, tanto en papel como en


disquete, los descriptores, o las palabras clave situadas en los campos recuperados no
aparecen destacados tipográficamente, lo cual dificulta el análisis de los resultados.

262
Capítulo 5

La consulta en esta base es necesariamente en línea, siendo destacable la facilidad


de acceso a la misma, así como el apoyo recibido durante e] desarrollo de las búsquedas.

5.4.5. Base de datos PSEDISOC del CSIC

La denominación propiamente dicha de la base es ISOC, fichero PSEDISOC.


Depende, como se deduce de su nombre, del ISOC. La base forma una unidad con todas
las demás que componen el CSIC, de tal manera que para consultar exclusivamente los
documentos relacionados con psicología, nos ceñimos a realizar las búsqueda en la
clasificación número 65, que realizaron en la mencionada base de datos adoptando la
utilizada por el Psycological Abstracts en versión de 1988.

El distribuidor de la base es, como es natural, el CSIC. Se puede consultar en


línea de 9 de la mañana a 8 de la tarde.

Utiliza el lenguaje de interrogación BASIS. Las primeras pantallas que aparecen


al realizar las consultas son las mismas que las relativas a la base de datos de Biología
animal comprendida, al igual que ésta, entre las del CSIC (figuras 39 40 y 41).

Contiene 18.089 registros sobre psicología y ciencias afines; la tipología


documental se ciñe a artículos de revistas especializadas editadas en España, y en algunos
casos, a actas de congresos.

La base cubre el periodo de 1975 a la actualidad, con una laguna que se sitúa
entre los años 1979 y 1980. La información generada a lo largo de esos dos años no se

263
Capítulo 5

incluyó porque la falta de tiempo impedía tener actualizada la base con documentos fe-
chados con posterioridad que iban entrando en la base, tomándose la decisión de
introducir los nuevos e ir incorporando los de dichos años poco a poco. La actualización
se realiza diariamente.

Los campos recuperables son: número de registro, autor, título, título original,
lugar de trabajo, nombre de la revista, publicación, congreso (nombre del), ISSN, tipo
de documento, idioma, clasificación, descriptores, descriptores secundarios, topónimos,
identificadores, período histórico y palabras del resumen’2.

Se utiliza el Tesauro ISOC de Psicología para la indización de documentos, que


se realiza a un nivel de especificidad alto. Aunque el limite preestablecido es de 8 a 10
descriptores por documento, en ocasiones se trabaja sin limitación en este sentido.

El sistema ofrece la posibilidad de truncar por prefijo y sufijo, el uso de


adyacencias, de operadores booleanos, y la utilización de enlaces de proximidad, que los
propios especialistas consideran de complicado empleo. No hay limitación de sentencias
a unir, ni tampoco a exportar y el tiempo de respuesta en teoría es inmediato, aunque
depende de la complejidad de la pregunta.

Cuando se exportan los registros, ni los descriptores, ni las palabras clave situadas
en los campos recuperados aparecen destacados, lo cual hace más dificil su localización
en las referencias.

¡2
La base tiene campo de resumen, en el que se incluyen los del propio autor del documento.

264
Capítulo 5

No es posible el acceso en línea a la base sin ayuda de personal especializado,


porque requiere el aprendizaje previo del lenguaje de recuperación, pero existe la
posibilidad de realizar la consulta en CD-Rom.

5.4.6. Base de datos de la Biblioteca del Instituto de Migraciones y Servicios


sociales.

La base depende del Instituto de Migraciones y Servicios Sociales, del Ministerio


de Asuntos sociales. La Biblioteca cubre un período de 25 años, comenzó a funcionar
como Biblioteca de Servicios sociales en 1972, y el tratamiento informático se comenzó
arealizaren 1991.

El proveedor de la base de datos es la empresa Chem-data. Se puede consultar en


línea durante las veinticuatro horas del día, vía modem.

Contiene 21.582 registros, procedentes de todo tipo de documentos: revistas,


monografías, informes técnicos, actas de congresos y conferencias, estadísticas, proyectos
de investigación, etc. Las materias de este fondo documental se agrupan en 25 campos
temáticos.

El centro atiende un promedio de 9.000 consultas por año, siendo el horario de


acceso al público de 9:00 a 14:00 horas.

El nivel de indización es medio, de acuerdo con las características de heterogenei-


dad y, en muchos casos, de generalidad de la información que se recibe en la biblioteca.

265
Capítulo 5

El único útil que se emplea para la normalización del tratamiento documental es el


Tesauro de Asuntos sociales.

La actualización de los datos se realiza dos o tres veces al mes.

Al consultar se pueden escribir en la pantalla los términos de los que se compone


la estrategia, o bien, se toman del campo de descriptores, dado que el tesauro empleado
para el tratamiento documental está introducido en el programa automático, por lo que
aparece en el menú de consulta. Permite utilizar los operadores booleanos y la búsqueda
por truncamiento, siendo el tiempo de respuesta inmediato. El sistema detecta, además,
los errores sintácticos cometidos en la formulación de las estrategias, e incluye otro
recurso que permite arrastrar todos los términos específicos dependientes jerárquicamente
de cualquier término genérico que figure en el tesauro; el símbolo utilizado para este
procedimiento es [#], que se sitúa precediendo al término genérico en el momento de
realizar la estrategia de búsqueda. Ej.:

4’ JÓVENES, abarca a JÓVENES INADAPTADOS y


JÓVENES MARGINADOS

Los campos recuperables de esta base de datos son: número de referencia,


encabezamiento principal, encabezamiento secundario, título, autor, descriptores,
identificadores, descriptores geográficos, lengua, año de publicación, tipo de documento,
clasificación, rúbrica (número de catálogo de novedades bibliográficas en el que está
incluido), palabras del titulo, palabras de todo el documento, título de la revista (si se
tratara de este tipo de documento) y fecha de entrada en la base de datos.

266
Capítulo 5

Es necesario recibir apoyo especializado para acceder a la base, así como para
realizar las consultas ya que se requiere el conocimiento previo del programa informáti-
co.

Al establecer la conexión, aparecen en pantalla los datos del menú de apertura


representados en las figuras 48 y 49:

267
E SERVICIOS SOCIALES

CONSULTA - MENU PRINCIPA

BASES DE DATOS DISPONIBLES

2. - CATALOGACION
2 — ADQUISICIONES
3 - HIST. ADQUISICIONES
4 - PUBLICACIONES PERIODICAS

Elija la opción deseada

. . . ,

CONEXION.SCR ECHO ROLL 1 NUML 13:48:51•20

.4

.....~ .‘ .

INSTITUTO E SERVICIO -

BASE DE DATOS 9ATALOGACpN CONSULTA SENCILLA

ampos de Consulta

1 —Referencia 7 —Desc. Geográficos 13 —Fuente


2 -Encabezamiento 8 —Lengua,Año,Tipodoc 14 —Fecha de Entrada
3 —Titulo 9 —Clasificación
4 —Autores . 10 —Rúbrica
5 —Descriptores 11 —Titulo (Palabras)
6 —Identificadore —Palabras Doc.

No. CAMPO: so

ons. Múlti le LA = Listar F. Aut. T = Listar Tesauro y = Volver M

CONEXION.SCR ECHO ROLL 1. NUML 13:49:23•16

Figura 48. Primeras pantallas del mcmi de la base de datos de la Biblioteca


de]. Instituto de Migraciones y Servicios sociales
INSTITUTO NACIONAL DE SERVICIOS SOCIALES

BASE DE DATOS : CATALOGACION CONSULTA COMPUESTA

176 respuesta(s) para: TIT=AS*


389 respuesta(s) para: TIT=TR*

Elija la Opción deseada

CS = Cons. Simpe CH = ~ ~ti~Í~ CH~ Consult Histórico


tórico IH Inic. Histórico L = Li ~ LC Listar Canpos ,~ec

CONEXION. SCR EC CA 13:50: 27•19

~W:2S:.i3ACIONAL DE SERVICIOS SOCIALES ..~

BASE DE DATOS : CATALOGACION CONSULTA 9PkWPESTA

176 respuesta(s) para: TITAS*


$2 389 respuesta(s) para: TIT=TR*
$3 565 respuesta(s) para: $1 O $2

$ OPERADOR (Y-EXCP-O) $

CS = Consul. Simp ‘1 = Volver Menu Frinc.

CONEXION.SCR ECHO ROLL 1 CAPS NUML l3:5l:O6~l9

Figura 49, Primeras pantallas del rnenú de la base de datos de la Biblioteca


del Instituto de t.qigraciones y Servicios sociales
Capítulo 6
Evaluación del rendimiento de tesauros
españoles en sistemas de recuperación
de información
6.1. Introducción

En teoría, si buscaramos exhaustivamente en toda la colección de documentos que


compone una base de datos, llegaríamos a encontrar determinada información solicitada,
pero con un desmesurado gasto de tiempo y esfuerzo. Para que la inversión de tiempo
en dicha tarea se minimice, la información se indiza con objeto de señalar la existencia
o no de documentos relevantes acerca de distintas materias, y se almacena siguiendo unos
criterios de clasificación. Durante el proceso de indización se seleccionan los términos
apropiados de un lenguaje documental para la representación del contenido del documento
y se le asignan de acuerdo con las reglas establecidas. En el momento de la recuperación
se siguen esos mismos criterios y, si las materias utilizadas para indizar y alimentar el
sistema son coincidentes con las empleadas en el proceso de búsqueda, los documentos
recuperados serán relevantes. De lo dicho se deduce la importancia que tienen en todo
el proceso la calidad del lenguaje de clasificación o indización empleado, la calidad de
la indización y, por último, la capacidad de seleccionar las materias adecuadas para
formular una ecuación de búsqueda. Lógicamente, la persona que va a interrogar al
sistema necesita conocer lo mejor posible la naturaleza del lenguaje documental utilizado
para el proceso de normalización de la información, así como el grado de detalle con que
se analizaron los documentos. En base a su conocimiento podrá formular preguntas con
un nivel de profundidad o generalidad adecuados, aumentando la probabilidad de
recuperar información relevante. Aún conociendo estas variables, raramente coinciden
los descriptores, palabras clave, etc., utilizados en la indización de un documento y en
una pregunta de recuperación, dándose una mayor tasa de coincidencia, como es natural,
cuando se trata de cuestiones genéricas.
Capítulo 6

Como alternativa al lenguaje documental se puede recurrir al vocabulario


empleado en el propio documento para realizar dicha representación; en tal caso, se
hablará de indización y recuperación en lenguaje libre. Entre las ventajas que, a priori,
se pueden reconocer al uso de un lenguaje controlado, está su capacidad para adaptarse
con facilidad a necesidades de información más o menos específicas del usuario potencial.
Con el test que describimos en este capítulo tratamos de contrastar sus ventajas y
desventajas, por otra parte bien conocidas, en comparación con el uso del lenguaje no
controlado, en SRI españoles, tratando con necesidades de información reales.

Como decíamos anteriormente, existen muchos elementos que influyen en la


efectividad del proceso de recuperación de información, pero compartimos con Blair la
idea de que el más importante aspecto 1...] concierne a cómo están representados los
documentos en un sistema. El más rápido ordenador o las más sofisticadas técnicas de
búsqueda no pueden superar los problemas derivados de una pobre representación [de
naturaleza lEngaistica] de los documentos’.

En los epígrafes que componen este capítulo tratamos los aspectos relativos a
antecedentes, metodología, desarrollo de las búsquedas, criterios de evaluación,
planteamiento de las estrategias y resultados obtenidos. El desarrollo del penúltimo
apartado es de considerable extensión porque comprende las 120 ecuaciones de búsqueda
realizadas tanto en lenguaje libre como con tesauro. Al final de la presentación de las
ecuaciones de cada base de datos se comentan las incidencias que se produjeron en su
planteamiento o desarrollo y se presenta un cuadro comparativo de los resultados
obtenidos a partir de las estrategias. En el cuadro se registran el número de documentos
relevantes recuperados con cada ecuación, así como las tasas de precisión y exhaustividad

BLAIR, D.C. Language ami representation iii information retrieval. Amsterdam, etc.: Elsevier, 1990, p.
155.

272
Capítulo 6

conseguidas en lenguaje libre y con ayuda del tesauro. Finalmente se incluyen diagramas
de barras que permiten comparar las tasas de precisión y exhaustividad en ambos tipos
de lenguajes.

6.2. Antecedentes

Desde los años cincuenta se han venido realizando evaluaciones de los lenguajes
utilizados en los Sistemas de Recuperación de Información (SRI) para la indización y la
recuperación de documentos. Las características de las mismas, su nivel de profundidad
y aspectos analizados, varían de unas a otras, pero todas, en una u otra forma, han
alimentado el continuo debate entre los profesionales de la documentación acerca de la
conveniencia y eficacia de los lenguajes controlados e incontrolados para realizar dichas
operaciones.

Existe abundante literatura sobre la evaluación de estos sistemas. El primer test


conocido fue el ASTIA-Uniterm test, realizado en 1953. La investigación se centraba
básicamente en el análisis de los resultados, aunque no se tiene constancia del desarrollo
del proyecto, a excepción de un breve trabajo publicado por GULL2. Para dicho trabajo
se indizaron 15.000 documentos por dos grupos diferentes de especialistas en la materia,
que provenían de la Armed Services Technical Information Agency (ASTIA) y de
Documentation, Inc. El primer grupo utilizó la Lista de encabezamientos de materia
creada por ASTIA, el segundo, el sistema uniterm. Se seleccionaron 98 demandas de
entre las que había recibido ASTIA en el curso de sus actividades. Del análisis de los

2GULL, 12. Seven years of work on Ihe organisation of maÉeriaJs in Ihe special lihrary. American
Documentation, V. 7 (1956) pp. 320-329.

273
Capítulo 6

resultados derivó una mayor capacidad y calidad de recuperación con el procedimiento


de unitérminos que con el de encabezamientos de materia.

En 1954, Cleverdon y Thorne3 realizaron un test sobre el sistema uniterm, cuyos


resultados fueron inconclusos, pero permitieron sentar las bases metodológicas de futuras
investigaciones.

Algunos estudios realizados sobre evaluación de SRl a lo largo de los últimos años
evaluaron solamente los lenguajes utilizados para indizar y recuperar los documentos;
otros se centraron en el proceso mismo de indización, etc. La gran mayoría se trataba
de estudios de laboratorio, minuciosamente preparados con objeto de controlar cualquier
posible variable, pero a partir de los años 80 se manifestó un creciente interés por
analizar necesidades de usuarios reales. Los experimentos de Blair y Maron4 (1984), así
como los de Saracevic, Kantor, Chamis y Trivison5 (1988) son indicativos de esa
tendencia. No es posible mencionar aquí todos los tests llevados a cabo hasta la fecha,
pero nos parecen de obligada referencia los proyectos Cranfield ¡ y Cranfield II, cuya
metodología y resultados han servido de guía a investigaciones posteriores, incluida la
que realizamos en esta tesis doctoral.

3
CLEvERDON, C.W. & THORNE, LO. A Brief Experiment with tite Uoitem System of Coordinate
Indexing for Une Cataloging of Structural Data. RAE Library Memorandum N0 7, Al) 35004. Farnborough,
Eng]and: Royal Aircraft Estahlishment, 1954.

4BLAIR, D & MAiRON, M.E. An evaluation of retrieval effectiveness for a ft¡1l-text docuxnent retrieval system.
Commun. ACM, 28, 3 (1984) Pp. 281-299.
5
SARACEVIC, T. [etal). A study of informarion seelcing and retrieving. 1. Background and methodology; U.
Users, questions and effectiveness; III. Searchers, searches and overlap. Journal of the American Society for
Information Selence, 39, 3 (1988> Pp. 161-216.

274
Capítulo 6

El desarrollo del proyecto Cranfleld 1, a cargo de Cleverdon6, tuvo lugar en


Gran Bretaña entre los años 1957 y 1962, auspiciado por la Association of Special
Libraries and Information Bureaux <ASLIB), con la colaboración de la National Science
Fundation (USA).

Se comparó el rendimiento que ofrecían cuatro sistemas de indización: se


comprobaron la Clasificación Decimal Universal, un índice alfabético de materias, un
sistema de clasificación facetado y el sistema uniterm. Se indizaron 18.000 documentos
sobre ingeniería aeronáutica, utilizando los cuatro lenguajes de indización mencionados.
Los documentos se trataron en grupos de 100 contabilizándose el tiempo de indización
(entre 2 y 16 minutos). Se formularon 1.200 cuestiones en base a documentos fuente7,
con las que se realizaron las búsquedas. Si el documento fuente era identificado, la
búsqueda se juzgaba un éxito. El proceso se repitió tres veces para asegurar un mayor
índice de imparcialidad en la operación.

En la segunda vuelta intervinieron las mismas personas que en la primera, con la


incorporación de un ayudante de la College of Aeronautics Library y cinco estudiantes
postgraduados. El tipo de preguntas formuladas fueron las mismas realizadas en la
primera vuelta. El propósito de hacer intervenir a estas personas en el proceso de
recuperación fue el de descubrir si algún sistema en particular resultaba más o menos
satisfactorio cuando era empleado por usuarios que conocían el área temática pero que

6cLEvERDoN, C.W. Aslib Cranfleid Research Project: repofl oit tbe testing and analysis of an
investígation bito tite coniparative efficiency of indexing systems. Craníjeld: College of Aeronautics, 1962.

7En respuesta a cada cuestión había un único documento relevante (documento fuente), que era el utilizado para
formular la pregunta. El uso del documento fuente para la preparación de las búsquedas ha sido, precisamente, el
principal motivo de crítica del proyecto, porque este hecho podría haber influido en la probabilidad de recuperación
de esos documentos. Swanson, D.R., por ejemplo, encabezó las críticas al procedimiento en el artículo: Evidence
underlying rhe Cranfleld results, publicado en Library quarterly, n0 35 (1965) Pp. 1-20.

275
Capitulo 6

tenían poca experiencia en materia de recuperación de información8. A los estudiantes


se les dió una mínima guía, consistente en la mera explicación de las normas de la
operación. Al concluir la vuelta se analizaron los casos en los que se habían producido
fallos para cambiar el procedimiento a seguir en la tercera vuelta de la investigación. Los
resultados que habían sido positivos en la segunda vuelta se consideraron adecuados y no
pasaron a analizarse en la tercera. Se trató de averiguar si la causa de los errores se
debió a las dificultades de la pregunta formulada, a una indización inadecuada, a la
búsqueda o al lenguaje documental utilizado.

El análisis de los fallos mostró que hubo muchos casos en los que la búsqueda
había tenido éxito al utilizar un determinado lenguaje documental, pero había fallado en
otros. En tales casos la razón del fracaso no tuvo nada que ver con el lenguaje empleado
ni con la indización, sino que se debió por entero a que la persona que realizó la
búsqueda a través de dicho lenguaje de indización no había conseguido construir una
estrategia adecuada.

Los resultados se midieron sobre la base de dos parámetros: exhausrividad y


precisión, que habían sido expresados algunos años antes por Fairthorne en las frases:
ABNO: AII-But-not-Onty (alta exhaustividad) y OBNA: Only-But-Not-AW (alta precisión)
que, a su vez, habían sido sugeridos por Perry, Kent y Berry’0 dos años antes. Fue
Cleverdon, sin embargo, el primero en poner en práctica la evaluación de los lenguajes

8E1 proyecto Cranficíd 1 demostró el hecho de que para un bibliotecario experimentado ni la falta de
fainijiaridad con eJ sistema de indización y recuperación, ni e] relativo desconocimiento de una determinada materia,
presentan serios problemas. Este descubrimiento rebatía la creencia de que recuperar información con un lenguaje
documental poco conocido y en un área temática desconocida para el usuario es una tarea diticil de realizar.

9FAIRTHORNE, R. Automatie recrieval of recorded information. Computerjournal (1958) PP. 36-41.

‘0PERRY, 1.; KENT, A.; BERRY, M. Machine literature searcbing. New York, etc.: Interscience
Publishers, 1956.

276
Capítulo 6

documentales utilizados para el tratamiento y recuperación en SRI, basándose fundamen-


talmente en estos valores.

La exhaustividad mide la capacidad del sistema para recuperar documentos útiles,


mientras que la precisión mide la habilidad de rechazar material no relevante”.
Teniendo en cuenta estos índices, la flexibilidad de un sistema se podrá valorar en
función de su capacidad para adaptarse a las necesidades de exhaustividad y precisión de
los usuarios.

La precisión se halla dividiendo el número de documentos relevantes recuperados


entre el número de documentos recuperados. La exhaustividad se calcula dividiendo el
número de documentos relevantes recuperados entre el número de documentos relevantes
existentes en la colección.

Los resultados demostraron que los cuatro lenguajes conseguían prácticamente los
mismos niveles de rendimiento a la hora de recuperar los documentos fuente. El
porcentaje de recuperación fue el siguiente:

‘‘Un documento se juzga relevante cuando responde a una solicitud de información. Relevancia se emplea, a
menudo, como término sinónimo de pertinencia, y como tal es considerado por algunos autores. Sin embargo, son
mayoría los especialistas que establecen diferencias entre ellos. Lancaster, Foslcett y Kemp, por ejemplo, hablan de
relevancia cuando se refieren a la valoración que realizan una o varias personas en relación con una determinada
solicitud de información, encontrando coincidencia entre pregunta y respuesta. Pertinencia sería la valoración que
hace el usuario de una respuesta dada por un SRI a una necesidad concreta de información formulada por él mismo.
Puede, como es natural, existir coincidencia en cuanto a las estimaciones de los dos índices, pero existe un sutil
matiz diferenciador entre ambos: un documento considerado pertinente, no necesariamente puede ser valorado como
útil o relevante por una persona ajena a la formulación de la cuestión.

277
Capítulo 6

Unitérminos 82%
Encabezamientos de materia 81,5%
Clasificación Decimal Universal 75’6%
Clasificación facetada 73’8%

La diferencia es poca, como muestran las cifras, con excepción del sistema
facetado, que dió más baja tasa de exhaustividad que los otros tres. El bajo rendimiento
de este lenguaje se atribuyó a la rigidez del orden fijo de combinación de términos que
le caracteriza. En otras palabras, Cranfield no descubrió diferencias significativas en la
eficacia de los lenguajes de indización estudiados, un resultado que ha sido reiteradamen-
te contrastado en estudios comparativos posteríores.

En cualquier caso, la importancia del primer proyecto Cranfield no estriba, en los


resultados obtenidos, tanto como en el método utilizado, el primero en su género, que
sirvió de modelo a los test realizados posteriormente.

El segundo proyecto Cranfleld (1963-1966), tenía como principal objetivo


investigar los componentes de los lenguajes de indización y los efectos que esos diversos
componentes tenían sobre el rendimiento de los SRI.

El experimento se desarrolló de muy distinta forma al primero. Para llevarlo a


cabo se construyeron 33 tipos diferentes de lenguajes de indización variando terminolo-
gias y estructuras. Cada lenguaje variaba igualmente tanto en el uso de términos simples
y compuestos como en la incorporación de jerarquías. En todos ellos se controlaron
sinónimos y homógrafos.

278
Capitulo 6

El corpus lo formaban 1.400 documentos que trataban de aeronáutica. Se


obtuvieron un total de 221 formulaciones de búsqueda preguntando a autores de una serie
de documentos seleccionados para reconstruir las cuestiones que originalmente dieron
lugar a la redacción o preparación de dichos trabajos. La búsqueda se hizo preparando
estrategias basadas en diferentes niveles de coordinación de términos, y el rendimiento
se midió por la recuperación de documentos previamente identificados como relevantes
a la pregunta. En este test, por lo tanto, como señala Foskett’2, la valoración de la
relevancia se realizó a priori, examinando todos los documentos de la colección que se
iban a analizar en relación con todas las cuestiones formuladas.

Asimismo, se tuvieron en cuenta los índices de exhaustividad y precisión, tratando


de averiguar qué lenguaje de indización aumentaba o disminuía esos parámetros. Los
resultados del proyecto se pueden resumir en un mejor rendimiento de los lenguajes
formados por términos simples, de los que se habían eliminado los casos de sinonimia
y todos aquellos términos que generaban ambigúedad. Otra conclusión que pudo extraerse
del test fue que la simple coordinación de términos resultó ser el recurso más efectivo
para aumentar la precisión, independientemente de que dichos términos formaran parte
o no de un lenguaje controlado. Esie resultado, que parecía echar por tierra la necesidad
de utilizar los lenguajes documentales, fue ampliamente rebatido por el hecho de haberse
dado en una experimentación artificial, en la que se mantenían bajo control variables que,
en necesidades de información reales, son difícilmente controlables.

A la vista de los resultados se pudo mantener la hipótesis de que existía una


relación inversa entre exhaustividad (número de documentos que encontramos cuando
realizamos una búsqueda) y precisión (probabilidad de que correspondan a una necesidad

‘2FOSKETT, A.C. The subject approach to information. 52 cd. London: Clive Hingley, 1996, p. 16.

279
Capítulo 6

de información). Dicha hipótesis explica que, a medida que se amplia el campo de


búsqueda, se encuentra más cantidad de información.

La confirmación de esa proporción inversa implicaría que es inútil cualquier


intento de maximizar ambos índices en un mismo sistema de información. Foskett
sostiene, sin embargo, que se pueden dar casos en los que, al examinar los resultados

de búsquedas individuales, encontremos que se ha conseguido un ¡00% de exhaustividad


con un 100% de precisión o, por el contrario, puede haber casos en los que ambos dan
como resultado cerot3. Van Slype también considera posible, que ambos criterios
mejoren simultáneamente en una misma consulta, siempre se pongan en funcionamiento
nuevos medios (cualificación de los documentalistas, calidad del lenguaje documental y
sofisticación del programa informático de búsqueda)’4.

6.3. Metodología

En nuestro trabajo experimental, a diferencia de los mencionados proyectos, no


analizaremos los resultados de la indización para introducir datos en el sistema con uno
u otro lenguaje, sino que vamos a establecer la comparación entre la capacidad de
recuperación de dos diferentes lenguajes: libre, basado fundamentalmente en términos
simples o unitérminos, y los tesauros utilizados en los seis SRI consultados.

Teníamos que elegir entre realizar un experimento de evaluación artificial,


controlando a priori todas las posibles variables: niveles de indización, tipología de los

‘3FOSKETT, A.C. Opus oit., p. 85.

‘4SLYPE, o. v~. Los lenguajes de indización: Concepción, construcción y utilización en los sistemas
documentales. Madrid: Fundación Germán Sánchez Ruipérez, 1991, p. 194.

280
Capítulo 6

documentos, cantidad y calidad de los documentos, recursos automáticos de búsqueda y


lenguajes documentales, o bien, basar nuestra evaluación en necesidades de información
reales, para lo cual contábamos con serias limitaciones, La primera, y fundamental, la
constituía el hecho de no contar con un equipo de personas para realizar el análisis de un
número representativo de documentos, dado que se trataba de un trabajo individual.
Optamos por analizar el comportamiento de seis tesauros frente al lenguaje libre, en la
recuperación de información en bases de datos reales. Las bases elegidas para este
propósito también fueron seis, de las cuales tres son del área de las ciencias sociales y
otras tres de ciencia y tecnología, Así pues, el objetivo de la investigación se cóncreta
en el examen del rendimiento de tales tesauros, desde la perspectiva del usuario, en el
contexto de las bases de datos en las que se utilizan para el tratamiento documental.

El escaso número de bases de datos con tesauro propio, unido a dificultades


derivadas de la ausencia de automatización y a traslados de sede de algunos centros, en
el momento de realizar este trabajo, hicieron difícil la elección de las bases que
precisábamos para hacer el test. Tras comprobar las prestaciones de unas y otras,
optamos por las seis, analizadas en el anterior capítulo, que, si bien no son totalmente
homogéneas, reúnen las condiciones necesarias, es decir, todas ellas son bases de datos
bibliográficas que cuentan con tesauro propio y son de acceso directo. El volumen de
documentos con que cuentan difiere sustancialmente:

Biología animal 11.820


Electrotecnica 1.360
Medio ambiente 26.362
Centro Doc. Mujer 12.600
Psicología 18.089
Migraciones y S. sociales 21.392

281
Capítulo 6

pero consideramos que esta particularidad, en vez de ser un inconveniente, constituye un


valor añadido para la experimentación, ya que permite valorar el rendimiento de tesauros
destinados a tratar fondos documentales de diverso tamaño.

Para realizar el análisis comparativo preparamos, en principio, un cuestionario de


posibles preguntas a formular en cada base de datos, para lo cual fue imprescindible la
lectura de obras y revistas especializadas en las materias a consultar, dada su heterogenei-
dad y grado de especialización.

Teniendo en cuenta que el trabajo lo iba a realizar una sola persona, las preguntas
se plantearon desde un primer momento a un nivel de amplitud suficiente como para
poder conseguir resultados válidos para la investigación y, al propio tiempo, lo más
específicos que fuera posible, teniendo en cuenta que para poder validar los resultados,
iba a ser necesario leer cada una de las referencias derivadas de las búsquedas. En
algunos casos, incluso, se hizo necesario consultar los documentos completos al no ser
posible hacer una valoración de su relevancia con el simple análisis de título y
descriptores (en aquellas bases en las que el registro no contiene campo de resumen). El
conocimiento previo del nivel de indización media que realizan las distintas bases también
nos sirvió para plantear estrategias adecuadas a nuestros fines.

Se procedió, en primer lugar, a formular una ecuación de búsqueda en lenguaje


natural, realizándose una segunda estrategia en lenguaje controlado. Inmediatamente
después, se evaluó la relevancia de cada documento recuperado con uno y otro tipo de
lenguaje.

Cuando se recuperó en lenguaje libre, el sistema trató de localizar la información


en íodos los campos del registro (salvo los que se componen de palabras vacías o forman

282
Capítulo 6

parte de claves), por lo que tomó también los unitérminos que componen los descriptores.
La búsqueda en esta modalidad se realizó, pues, consultando los campos de título, título
original, descriptores principales y secundarios, topónimos e identificadores, resumen e
índices, comunes todos ellos a la gran mayoría de las bases de datos. Las palabras clave
compuestas se hallaron con un operador de adyacencia (para lo cual tenían que estar
unidas en el texto). No todos los centros admitían el uso de palabras clave compuestas
para la preparación de las ecuaciones, de modo que se hizo necesario recurrir a la postc-
oordinación en algunas de ellas. Lógicamente las palabras clave utilizadas para recuperar
con lenguaje natural no siempre fueron coincidentes con los descriptores componentes de
los tesauros y, en ocasiones, lo fueron sólo parcialmente. En cuanto al campo de título,
las palabras clave que conformaban las ecuaciones de búsqueda aparecían a veces en el
mismo, si bien, la búsqueda en este campo presenta el problema de que se pierde la
información existente en títulos de idioma extranjero, por lo que su eficacia es relativa
y está condicionada a la lengua en la que está escrito el documento. El campo de resumen

permite una mayor efectividad en la búsqueda en lenguaje libre, lo que, a su vez,


produce, como indicabamos anteriormente, un detrimento en lo que a precisión
informativa se refiere. Solamente consultamos el campo de índices de materia en la base
de datos de Servicios sociales. Este recurso fue utilizado para tratar de suplir la ausencia
del campo de resumen en dicha base. Si bien es cierto que el control ejercido sobre el
vocabulario en los índices de las materias contenidas en los documentos es mucho mayor
que el posible control existente en un resumen, consideramos que su consulta potenciaba
los resultados conseguidos con los otros campos de búsqueda y, por tanto, permitía la
homogeneidad con las demás bases.

La recuperación en lenguaje controlado se realizó consultando los campos de


descriptores. Los tesauros que cubren las bases sugieren términos relevantes para la
búsqueda, de modo que la preparación de las ecuaciones con este procedimiento resultó

283
Capítulo 6

más sencillo; no hacia necesario pensar en posibles términos sinónimos o polisémicos


para delimitar los conceptos. La última fase del proceso consistió en imprimir o en
exportar a disquete cada una de las referencias resultantes para proceder a su posterior
análisis.

El procedimiento seguido para la valoración de los resultados fue el propuesto por


Cleverdon, teniendo en cuenta los índices de precisión y exhaustividad. En respuesta a
cada cuestión se recuperaron documentos con un índice de relevancia diverso; algunos
fueron totalmente relevantes, otros respondían de forma dudosa a la pregunta formulada,
y otros tenían una correspondencia marginal con dicha pregunta. Para el análisis se
tomaron sólo en cuenta aquellos totalmente relevantes. Como nuestro grado de
conocimiento de las diferentes materias no era homogéneo, solicitamos el consejo de
especialistas en el contenido temático de las distintas bases de datos cuando nos surgieron
dudas al establecer los criterios de relevancia, de tal manera que al nuestro se sumara el
del potencial usuario conocedor de la materia. En cualquier caso, tratamos de valorar los
documentos con la mayor objetividad posible, conocedores de que la medida de la
relevancia es una estimación subjetiva que depende del nivel de conocimientos de cada
individuo. El problema -escribe Foskett al respecto -reside en el hecho de que los lectores

buscan información partiendo de su nivel de conocimiento -su marco de referencia- con


el m(nimo esfuerzo, mientras que los autores presentan la información bajo su propio
marco de referencia; cada uno de nosotros tiene su marco propio, por lo que la
coincidencia nuncapuede serexacta. Podemos diseñar nuestros sistemas de recuperación
de información para optimizarla probabilidadde coincidencia entre las preguntas de los
usuarios con las respuestas que consiguen, pero aceptando de hecho que nunca será
perfecta’5.

‘5FOSKETT, A.C. Op. cit., p. 15.

284
Capitulo 6

6.4. Desarroilo de las búsquedas

Antes de comenzar cada consulta fue necesario aprender el lenguaje especifico de


cada sistema. Si bien es cierto que a pesar de las diferencias entre unos y otros, tienen
todos rasgos comunes que permiten adaptarse fácilmente a su manejo, ello implica un
esfuerzo más a realizar en el proceso. A este respecto escribe Amat: Un inconveniente
en relación con la figura del distribuidor de bases de datos radica en el hecho de que
cada uno tiene que desarrollar su propio programa de recuperación de información o
lenguaje de interrogación. Este hecho provoca que no se pueda trabajar con un único
lenguaje de interrogación, sino que se han de conocer los deferentes lenguajes de los
distribuidores con los que se trabaja’6.

El manejo de las bases en CD-Rom fue muy sencillo, dándonos la posibilidad de


trabajar con autonomía. En los SRI en los que la consulta se hizo en línea, fue necesaria
la ayuda del documentalista o especialista en materia de recuperación; no obstante,
estuvimos presentes durante el desarrollo de todas las búsquedas, en una u otra
modalidad, puesto que se hacía necesaria la modificación de las estrategias con fre-
cuencia. A veces, la combinación de conceptos daba como resultado una ausencia total
de referencias, obligándonos a renunciar a los aspectos menos importantes de la cuestión,
o a ampliar el alcance de algún concepto.

Para la preparación de las ecuaciones se analizó el área temática de las preguntas


en detalle, de forma que para construir cada ecuación se tuvieran en cuenta los conceptos
y relaciones que pudieran sugerir alternativas flexibles para preparar la búsqueda
utilizando la capacidad de interacción de los SRI. No sólo se desarrollaron las estrategias

‘6AMAT, N. La documentación y sus tecnologías. Madrid: Pirámide, 1994, p.139

285
Capítulo 6

iniciales sino que se fueron evaluando las referencias encontradas. Seguimos con este
procedimiento la técnica sugerida por Van Rijsbergen’7 y Croft’8 consistente en partir
de un documento considerado a priori relevante en relación con la pregunta formulada
y tratar de localizar otros similares basándonos en él.

Nuestro desconocimiento de las materias tratadas en algunas bases de datos


también nos hizo recurrir a la alternativa denominada pearl grovving para preparar
estrategias, que consisteen analizar un documento (completo o título y resumen) conocido

como representativo o de importancia <relevancia) en el área de conocimiento deseada


y, en base al vocabulario que emplea, preparar la estrategia’9. Estas alternativas fueron
posibles gracias a la naturaleza heurística de la recuperación en línea, que nos permitió
ir modificando las estrategias a la vista de los resultados que ibamos obteniendo. En
muchos casos, el examen de las referencias recuperadas nos mostró nuevos términos que
pudimos incluir en nuevas ecuaciones.

A pesar de que utilizamos estos recursos, que nos fueron de gran utilidad, al tratar
con algunos temas era difícil darnos cuenta de cualquier variación posible en la
denominación de los conceptos presentes en las preguntas, de modo que para resolver
este inconveniente solicitamos la ayuda de expertos en las materias. En el campo de las
ciencias sociales fueron más frecuentes las dudas que en el área de ciencia y tecnología.
En aquel campo se dieron en ocasiones falsas interpretaciones de las preguntas y
surgieron dificultades para combinar términos; este Ultimo inconveniente se resolvió, a

‘7van RJJSRERGEN, C.J. Information retrieval. 2 ed. London: Butterword & Co., 1979.

‘8CROFT, W.B. A model of clusrer searching based on classitlcation. Information systems, n0 5 (1980) Pp.
189-195.

‘9HARTLEY, R.J. Online searcbing: principies & practice. London, [etcl: Bowker-Saur, 1990, p. 171.

286
Capítulo 6

menudo, con el uso de palabras clave o descriptores precoordinados. En algunos


supuestos, la inclusión de los conceptos de la pregunta conectados con el operador [Y]
dió un resultado preciso de la información requerida. En ciertas consultas se amplió la
búsqueda simplemente omitiendo uno de los conceptos de partida.

Nos queda, por último señalar que, en ningún caso se limitaron los registros a
determinado tipo de documentos, sino que se tuvieron en consideración las referencias
derivadas de monografías, artículos, actas de congresos, etc... Tampoco se tuvo en
cuenta la fecha de publicación (antigUedad) de los documentos, dada la heterogeneidad
de las bases. Se trató de encontrar, en todo momento, toda la información disponible
sobre la materia, no sólo las referencias más pertinentes, para ello se formularon las
cuestiones, por lo común, partiendo de lo general a lo particular, hasta llegar al más
reducido o especifico nivel posible sin correr riesgos de perder información relevante.

6.4.1. Aspectos y consideraciones para la preparación de las estrategias de


búsqueda

A continuación describiremos aquellos aspectos que tuvimos que considerar en la


preparación de las estrategias de búsqueda. Estos elementos hacen referencia al tipo de
términos utilizados, niveles de concreción, problemas de sinonimia y polisemia,
operadores utilizados, problemática en el uso del lenguaje libre y otras variables que
hubimos de tener en cuenta a fin de diseñar una óptima estrategia de búsqueda. Dichos
aspectos pueden ser señalados en los siguientes puntos:

~)Se analizaron los temas generales concernientes a cada pregunta en sus facetas
constituyentes, así como los términos sinónimos y cuasisinónimos de cada materia. Se
ordenaron y agruparon en conjuntos y mediante el álgebra de Boole - utilizada en ¡odas

287
Capítulo 6

las bases -, se precisaron los temas hasta conseguir las referencias que respondían al
perfil de búsqueda solicitado. Se visualizaron en pantalla las muestras obtenidas a fin de
comprobar que los documentos se centraban en la materia deseada. Según la respuesta
obtenida, se ampliaba o reducía la búsqueda mediante diversos recursos.

2) Con objeto de conseguir en la búsqueda inicial un alto nivel de exhaustividad,


se incluyó más de una palabra para describir cada concepto. Si el número de registros
resultante indicaba que alguno de los términos empleados resultaba demasiado general,
se procedía a realizar una nueva combinación de términos, omitiendo alguno de los más
generales, obteniendo así un nivel adecuado de referencias.

3) Algunas bases de datos ofrecían la posibilidad de utilizar términos genéricos


incluidos en los tesauros que facilitaban la amplitud de las búsquedas. Su empleo supuso
un significativo ahorro de tiempo y esfuerzo, puesto que hizo innecesaria la localización
de terminología precisa, al tiempo que simplificó la construcción de la estrategia. Al
elegir estos descriptores genéricos se evitó el uso de palabras que describían conceptos
demasiado imprecisos que podían generar un alto grado de ambigúedad, tales como
sistema, medida, problema, etc.,

4) A fin de alcanzar un alto nivel de precisión, se recurrió al uso de términos


específicos y, en su caso, a la combinación de los mismos. Como es lógico, los términos
específicos tienen la particularidad de concentrarse en unos pocos documentos de la
colección, lo que facilita su identificación. Así, por ejemplo, en la base de datos de
Electrotecnia, el alto nivel de precisión concretó los términos utilizados en las estrategias
en unos pocos documentos de la colección. Si tenemos en cuenta el limitado número de
documentos que la componen, es razonable que en algunos casos las tasas de precisión
y exhaustividad resultantes se aproximasen y que incluso fueran coincidentes.

288
Capitulo 6

5) En algunas consultas ocurrió que las preguntas incluían una gran variedad de
conceptos diferentes, por lo que se trató de representarlos por medio de términos unidos
por el operador [Y]. En tales casos se conseguía un alto nivel <Le precisión y, en
ocasiones, dio como resultado el silencio. Este fue el caso de la tercera consulta de la
base de datos de Servicios Sociales, realizada en lenguaje controlado.

6) El operador de negación [NO],que permite combinar expresiones alternativas


y agrupar términos representativos de un mismo concepto, restringiendo así el volumen
de información recuperada, fue un recurso empleado en contadas ocasiones, ya que,
aunque facilita las búsquedas en algunos casos, su uso implica el riesgo de perder
información relevante. En su lugar, optamos por recurrir a los términos genéricos y rela-
cionados de tos tesauros o por utilizar expresiones alternativas en lenguaje libre.

7) Como consecuencia del uso de términos ambiguos, imprecisos o inapropiados,


en ocasiones se dieron falsas combinaciones, dando como resultado la recuperación de
referencias que no eran lo bastante precisas. Para eliminar estos inconvenientes se
consultaron los términos de indización de alguna referencia relevante recuperada con
anterioridad, lo que nos permitió contextualizar los términos de la pregunta y replantear
la estrategia.

8) En algún caso se dió la circunstancia de que el lenguaje controlado no disponía


de términos adecuados para describir los conceptos requeridos. Dado que nuestro estudio
consistía en establecer una comparación entre el lenguaje libre y el controlado, optamos
por incorporar términos más genéricos para que el tesauro pudiera dar una respuesta
satisfactoria. Sin embargo, y como cabía esperar, el resultado fue impreciso, ya que se
alejaba de las necesidades de información que se precisaban en la pregunta.

289
Capítulo 6

9) Por último, cabe decir que cuando se utilizó el lenguaje libre se tuvieron en
cuenta todas las posibles variaciones de un mismo concepto, así como el truncado de
prefijo y sufijo. Asimismo, en su caso se incluyeron las variaciones en singular y plural
de cada palabra.

6.5. Criterios de evaluación

La evaluación de la cantidad y calidad de la información recuperada, se hizo


teniendo en cuenta las tasas de efectividad, es decir, precisión y exhaustividad. Los
resultados se presentan como porcentajes de dichos valores. Se consideraron relevantes
las respuestas que correspondían adecuadamente al objetivo de la búsqueda.

En la práctica es difícil medir estos parámetros, debido a que la estimación de la


relevancia es subjetiva. Hallar el índice de precisión genera pocos problemas, excepto
cuando en una determinada búsqueda no se recupera ningún documento. La exhaustividad
presenta muchas complicaciones, incluso cuando se trata de pequeñas colecciones ya que
hallar este índice, que es inevitablemente un valor relativo, requiere que cada documento
de la colección sea contrastado en relación con cada consulta sobre un tema determinado,
ésto es, exige el conocimiento del número total de documentos relevantes de la colección
con respecto a la pregunta. Ante la imposibilidad de determinar el volumen de
documentos que tiene una base de datos sobre un tema en particular, diferentes
especialistas han propuesto métodos alternativos que tratan de salvar la dificultad para
calcular este valor.

290
Capítulo 6

Lancaster20 utiliza en dos ocasiones un método de muestreo para estimar el


índice de exhaustividad de una gran base de datos, es decir, midiendo la relevancia de
un conjunto de documentos de la colección. Salton propone el mismo procedimiento y
sostiene que la exhaustividad no es un valor exacto, sino una estimación del número total
de documentos relevantes de la colección: La valoración de la relevancia se hace en base
a un subconjunto de documentos de la colección. Alternativamente, una consulta dada
puede serprocesada por una variedad de diferentes métodos de búsqueda y recuperación,
dando por supuesto que todos los documentos relevantes van a ser recuperados por medio
de dichas búsquedas. Los resultados se combinan entonces en una única lista de
resultados. La lista de documentos relevantes se obtiene mediante la valoración de la
relevancia de esa lista de resultados21. Van Slype considera dos posibilidades para
determinar la exhaustividad: ya sea sistemáticamente, examinando las referencias una a
una (lo que tiene el riesgo de durar mucho); o bien interrogando de nuevo el fondo con
una serie de ecuaciones muy amplias (con pocos o ningún Y, con muchos O), incluso
basándose en la clasificación 22•

En el test que realizamos, hallamos las tasas de exhaustividad combinando las


técnicas de muestreo, las de clasificación y la interrogación al sistema por los términos
más genéricos de cada pregunta. Entre los documentos recuperados por medio de esta
última alternativa, se encontraron muchos no relevantes, lógicamente, es decir, se dió un
altísimo índice de ruido documental. Se imprimieron, por ejemplo, todos los documentos

20LANCASTER, F.W. Evaluation of the Median demand searcb service. Bethesda, Md.: National Library
of Medicine, 1968; e Information retrieval systems: cbaracteristics, testing and evaluation. 2~ cd. New York:
WiIley, 1979.

21SALTON, G. & McGLLL, M.J. Introduction to ¡nodern information retrieval. New York, [etcl: McGraw-
Hill Publishing Company, 1983, pp.166-167.

22SLYPE, G.v. Op. cit., p. 193.

291
Capítulo 6

en los que figurara el descriptor o palabra clave insectos, en la base de datos de Biología
animal. En la estrategia realizada para hallar la tasa de precisión, el número de
documentos que respondían a la cuestión: Fisiología de la reproducción en los insectos,
fue de tan sólo 4. pero, al buscar por el término general insectos, tuvimos que analizar
un total de 1.558 documentos. La proporción en este caso es exagerada, pero da una idea
del propósito que perseguíamos y que se ha conseguido: no excluir del análisis ninguna
información existente en la colección sobre cada tema.

El volumen de documentos extraídos mediante el último método mencionado nos


hizo desistir, en un principio, de la tarea -en total se recuperaron 11.906 referencias-.
Decidimos, finalmente, seguir adelante convencidos de que, aunque minucioso, era el
único procedimiento que garantizaba resultados fiables. Tras el largisimo proceso de
análisis teníamos la certeza de haber dado con toda la información relevante de las bases
en relación con los temas propuestos.

Para hallar la exhaustividad mediante técnicas de muestreo, se procedió de la


siguiente forma: se seleccionó en primer lugar la muestra generando un listado de
números aleatorios por medio del generador de números aleatorios del compilador Pascal,
cambiando la semilla para cada base de datos. Se hizo, a continuación, una estimación
del tamaño de la muestra:

Para estimar el porcentaje de documentos relevantes definimos Ai, variable


dicotómica, de forma que:

O si el registro i no es relevante
Ai<
1 si el registro i es relevante

292
Capitulo 6

Por lo que el estimador del porcentaje será:

-~ SAI

E =sunia
= porcentaje estimado de registros relevantes
n = número de registros de la muestra

Como se iba a realizar un muestreo aleatorio simple, sin reposición, la varianza


del estimador de [p] sería:

- N-n ~p9

N= tamaño de la población
n = tamaño de la muestra
p = probabilidad de que Ai valga 1
q= probabilidad de que Ai valga O

Por lo tanto el error estimado será:

E=k2 1’Y.npq

IV. ln

Según Kish, la definición básica del error estándar de la media es igual para

cualquier diseño de muestra: es el error estándar de la distribución de muestreo para ese


determinado diseño de muestra23.

23KISH, L. Selección de la muestra. En: Los métodos de investigación en las Ciencias sociales. Barcelona:
Paidós, 1953, reimp. 1987, p. 177.

293
Capitulo 6

Para obtener un tamaño de muestra significativa al 95 % y con un error no


superior al 0.02 (diferencia entre el valor estimado y el valor real), despejamos [nj:

K2Npg
£2 (N-1> ~K
2pg

Como desconocemos la varianza la sustituimos por 0.5 (1-0.5) = 0.25, que es el


valor máximo que podría tomar.

El tamaño de la muestra de las cinco bases sometidas a este procedimiento fue el


siguiente:

Biología animal 1.995+100=2.095


Medio ambiente 2.200+100=2.300
Centro Doc. Mujer 2.016+100 = 2.116
Psicología 2.119+100=2.219
Servicios sociales 2.158+100=2.258

La base de datos de Electrotecnia se analizó en su totalidad, dado el reducido


volumen de sus fondos, por lo que no fue necesario proceder mediante este método para
conocer la colección.

En todas las bases, como puede observarse, se incluyeron 100 documentos de


reserva, en previsión de posibles bajas que hubieran sufrido las colecciones, o a cualquier
otra circunstancia que alterara el volumen de la muestra.

294
Capítulo 6

6.6. Desarrollo de las estrategias

6.6.1. Base de datos del CSIC de Biología animal

ConBulta 1. Migracidn de aves n España

Búsaueda en lenoua-ie libre

O [migración1 157
1 [aves) 890
2 [España) 79262
.3 [emigración) 2
4 [inmigración) 6
5 (.LO .0 .L3 .0 .L4 159
6 [.LI .Y .L2 .Y .LSI 26

precísíón= 26
26

exhaustividad===O’63
41

Búscueda en lenaua le controlado

O [migración1 135
1 [aves migratorias) 46
2 (aves) 821
3 (.L1 .0 .L2) 821
4 [España) 79262
5 [.LO .Y .L3 .Y .L41 25

295
Capítulo 6

25 =1
precisíón=—
25

exhaustívídad=-3--1 -o’6o
41

Consulta 2. Composición bioquímica de huevos de moluscos

Súsajueda en lenouaie libre

O [gastrópodo*) .345
1 (mollus*) 921
2 (lípidos .0 carbohidratos .0
proteinas*J 929
.3 fentbrio*1 618
4 [huevo*1 230
5 [(.LO .0 .L1) .Y .L2 .Y
(.L3 .0 .L4)J 2

2 =1
preciisión=—
2

exhaustívidad=.?.
4
=o’so

Súsaueda en lenqual e controlado

O (mollusca) 918
1 [huevos) 214
2 [embriones) 152
3 [.LO .Y (.L1 .0 .L2)) 4

296
Capítulo 6

precísíón= ‘~ ti.
4

exhaustívtí dad-
4

Consulta 3. Fauna marina gallega

Súsa’aeda en lenaua-ie libre

O (.faunaj 560
1 (marti 15575
2 (Galicia .0 galleg*J 2260
.3 (.LO .Y .L1 .Y .L2 9

precísíón= ~ _
9

exhaustívídad =1
5

Súsajueda en lenauale controlado

O (fauna marina) 4.3


1 (Galicia) 1639
2 (.LO .Y .LI) 5

297
Capítulo 6

precisíón= ~ -O’60
5

exhaustividadl =O’60
5

Consulta 4. Diferenciación celular en el desarrollo de


embriones de anfibios.

Súsaueda en lencuale libre

O [diferenciación) 239
1 (celul*) 1162
2 tanfibio*) 88
3 (embríon*) 466
4 (.LO .7 .L1 .7 .L2 .7 .L3) 2

precísíón 2
2

exhaustí val dadz~2 =O’25


8

Súsajueda en lencua-ie controlado

O [citodiferenciaci Sn) 95
1 (amphibia) 325
2 [desarrollo embrionario) .330
3 (.LO .7 .L1 .7 .L2J 3

298
Capítulo 6

preciisión=—33 =1

exhaustí vi dad- ~ -O~37


8

Consulta 5. Ecología de sistemas forestales

Súsaueda en lenauale libre

O [ecología) 2064
1 (bosques) 247
2 [sistemas forestales) 3
3 [.L1 .0 .L2) 250
4 (.LO .7 .L31 55

precísíón= ~ -O~34
55

19
exhaustivídad=—=O’65
29

Súsajueda en lenaua-ie controlado

O [ecología1 1344
1 (ecosís temas forestales) 90
3 (.LO .Y .L1) 13

‘3
p.recisión=— =1
13

299
Capitulo 6

exhaustividad=-1-1
29
=O’44

Consulta 6. Fósiles vertebrados del pleistoceno en España

Búsajueda en lenouaie libre

O (fósiles) 1242
1 [vertebrados) 509
2 (pleistoceno) 199
3 (España) 79262
4 (.LO .7 .LI .Y .L2 .Y .L31 74

74 =1
precisión=—74

exhaustivídad= =O’73
101

Búscnzeda en lenauale controlado

O [fósiles vertebrados) 471


1 [pleistoceno) 193
2 [España) 79262
3 (.LO .7 .L1I 77
4 (.L2 .7 .L31 71

precísíón= 71~

300
Capítuf o 6

exhaustívídad=~~Z~!~.. =0’? 0
101

Consulta 7. Fisiología de la reproducción en los insectos

Súsajueda en lenaua le libre

O (insect*J 2039
1 [reproduc*) 1158
2 tfisiolog*j 1414
3 [.LO .7 .1,1) 30
4 (.L2 .7 .L3j 4

precisíón— 44 =1

exhaustívidad=—4— =0’30

‘3

Búsa-ízeda en lenauale controlado

O (insec tal 1546


1 [reproducción) 979
2 (fisiología) 1188
3 (.LO .7 .LlI 20
4 [.L2 .Y .L3) 4

4
precisión =— =1
4

301
Capítulo 6

exhaustivídad=—5--
‘3
=0/30

Consulta 8. Cultivo de la dorada

Bus aiieda en lenquale libre

O [dorada) 27
1 (cultivo) 1692
2 (acuicultura) 225
3 [.L1 .0 .L2) 1868
4 (.LO .7 .L31 9

precísíón= ~ -0’87
8

exhaustividad=~?~— =0’61
13

Súsajueda en lengua-le controlado

O (dorada) 18
1 [sparus aura tal 16
2 (acuicultura) 218
3 (piscicultura) 79
4 [.LO .0 .L1I 18
4 (.L2 .0 .L31 291
5 [.L4 .7 .L5) 11

11 =1
precisíóitr=—
:ii

302
Capítulo 6

exhaustividad=-4‘3 =0’84

Consulta 9. Anídamiento de aves acuáticas

Búsaueda en lengua-le libre

o [anidamientoj 1
1 (nidos) 35
2 (aves acuáticas) 113
3 [.LO .0 .L1) .36
4 (.L2 .7 .LSI 1

precísíón ~ -1
1

exhaustívidad=—4— =0’09
11

Btisaueda en lenouale controlado

O (nidificación) 114
1 [aves acuáticas) 113
2 (.LO .7 .L1) 9

precísíón=’—99 =1

exhaust2ivídad—2— -0’81
11

303
Capítulo 6

Consulta 10. Distribución geográfica de aicromamíferos

Búsaueda en lenoua le libre

O (distribución) 3351
1 (geografi*) 2406
2 (micromamiferos) 58
3 (España) 79262
2
4 [.LO .7 .L1 .7 .L2 .7 .L31

precisión=—22 =1

exhaustivídad=—2 =0’66
3

Búsajueda en lenguaje controlada

O (biogeografía) 1768
1 [micromammalia) 89
2 (España) 79262
3 (.LO .7 .L1 .7 .L21 2

precisíón— 22 =1

exhaustívída&1 3 =0’66

304
Capítulo 6

Cuadro comparativo de resultados:

Lenguaj, libre Tesauro

r do

B6sqtids tel@Yun tas Preci si Sn flbaustl vi dad relevan te Proal si 6n flbausti ridad

Ze~fl~

1. 26 1 O’63 25 1 O’60

2. 2 1 O’5O 4 1 1

3. 5 O’55 1 3 O’60 O’6O

4. 2 1 025 3 1 O’37

5. 19 O’34 reS i. O’44

6. 74 1 O’73 71 1 O’70

7. 4 1 030 4 1 O’30

8. 7 O’87 O’61 11 1 O’84

9. 1 1 O’O9 9 1

10. 2 1 O’66 a a

305
Capítulo 6

En las ecuaciones en lenguaje natural incluimos todos los sinónimos y cuasisinóní-


mos posibles para evitar omisiones, siendo más cómodo (por no necesitar tener en cuenta
otros términos) el use del lenguaje controlado. Tuvimos, por ejemplo que pensar en
células, huevos, embriones, etc.. para sustituir al término preferente del tesauro
citod¡ferenciación.

En la consulta número uno, formulada en lenguaje controlado, se perdió


información debido a que el topónimo utilizado en la indización era más específico que
el genérico España empleado en las ecuaciones de búsqueda. En las referencias
encontramos, por ejemplo, Río Guadiana, Costa Cantábrica, Estrecho de Gibraltar.
etc... Los documentos en los cuales se encontraban son obviamente relevantes, pero no
se recuperaron con la estrategia por la razón mencionada.

En la segunda consulta, los 6 documentos recuperados con los dos tipos de


lenguajes son relevantes, pero no son coincidentes. Los dos de libre son distintos a los
cuatro de controlado, quizá porque la búsqueda en lenguaje técnico recupera más (4 sobre
2 de libre) pero no tiene en cuenta términos vulgares que aparecen en libre.

El nivel de precoerdinación del tesauro, del I’36%, tal y como veíamos en el


capítulo anterior, permite precisar conceptos que, en libre, han de tratar de recuperarse
mediante unitérminos o palabras clave, con un nivel de generalidad que, obviamente
produce ruido o imprecisión, como en este caso de la quinta consulta, en el que la
elección entre ecología, bosques, y sistemas forestales o el descriptor precoordinado
ecosistemas forestales, hace variar el resultado en una proporción de 55/13 documentos
recuperados. La sintagmatización de los descriptores del tesauro hace igualmente
innecesarias un gran número de operaciones lógicas que, si bien restringen el volumen
de items recuperados, provocan a veces pérdida de información pertinente.

307
Capítulo 6

Algunos documentos no se recuperaron porque estaban indizados por descriptores


específicos, como, por ejemplo, los que respondían a la sexta pregunta: rhinocerontidae,
fósiles humanos y mammalia, y en la ecuación de búsqueda se empleó el término genérico
fósiles vertebrados.

Se dieron casos en los que entre las referencias aparecieron documentos que no
estaban relacionados con el tema, al darse la coincidencia de que, tanto el descriptor,
como la palabra clave se utilizaron en esta área de conocimiento con distintas
connotaciones. El descriptor dorada, por ejemplo, aparece en asuntos relacionados con
la vitivinicultura, en protección de la Costa Dorada, y en relación con la minería, en el
articulo titulado: La inina dorada: Un ejemplo de mineralización filoniana en un terreno
metamórfico ligado a un magmatismo leucogranítico. Estas imprecisiones se evitaron en
lenguaje controlado al utilizar el término preferente sparus aurata, que resuelve la
polisemia.

En ocasiones, y en contra de lo esperado, se consiguieron niveles de exhaustividad


muy bajos, debido al escaso número de documentos que respondieron a los términos
utilizados en las ecuaciones en lenguaje libre, por ejemplo, anidamento y nidos, en la
consulta número nueve, recuperaron concretamente 36 items, mientras que con la entrada
normalizada en el tesauro nid(ficación, se obtuvieron 114.

Se dió un único caso, concretamente en la consulta número diez, en el que


coincidieron el número de registros y los documentos recuperados con ambos lenguajes.

308
Capítulo 6.6.2.
6 Base de datos PIE (Programa de Investigación y Desarrollo

Electrotécnico)

Consulta 1. Sistemas de seguridad en centrales nucleares

Súsaveda en lenaua le libre

Si [sistema *1 630
52 (seguridad) 128
Sa (central *1 430
54 [nuclear*) 106
55 (Si Y S2j 73
S6 (53 Y S4) 89
57 (55 y S6) 12

precísíón= ‘ -0’58
12

exhaustil vidad=—— =O’63


11

Súscrueda en lenajuale controlado

Sí (seguridad nuclear) 11
S2 [mantenimiento nuclear) 2
53 [51 0 52) 13

precisíón ~ -0’53
13

309
Capítu!o 6

exhaustividad=—10 _
-0’90
1’

Consulta 2. Ninicentrales de producción hidráulica

Búscrueda en lenaua-ie libre

SI [central o minícentral) 438


52 [producción) 150
53 [hidrdulic*1 156
54 (52 7 831 42
SS [Sl 7 34) 27

precísíón= ~ -o’ís
27

exhaustívidad=-1-28 =O’17

Búscueda en lenouaie controlado

51 [minicentral hidr¿ulical 28

precisíón—28 =1
28

28 =1
exhaustí vi dad=—
28

310
Capítulo 6

Consulta 3. Centrales de energía solar

Búsciueda en lenaua-ie libre

Si [energía* y 501*) 57
S2 [central) 422
S3 (Si Y S2j 17

precísíón ~ -0’23
17

exhaustivídad4 9 =0’44

Búsaueda en lenouale controlado

51 (energía solar 1 33
52 (central de energía) 20
S3 [51 y S2) 20

precísíónz ‘~ -O’20
20

exhaustívidad=4 =0’44
9

Consulta 4. Sensares ópticos

Búscrueda en lencn¿ale libre

51 (sensor*) 41
32 (óptico *1 13
53 [Sl 7 52) .3

311
Capítulo 6

precísíón= ~ ti.
3

exhaustí vi dad— -i
3

Búsaueda en lenguaje controlado

Sí [sensor óptico) 2

precísíón1 2 2.

exhaustival dad- 2 -0’66


3

Consulta 5. Recursos de agua en forma de nieve

Bascrueda en lenaua-te libre

SI (agua o nieve) 185


S2 trecurso*1 69
53 (Sl Y S21 17

precísíón 2
17

exhaustivídadz~ 2 =0’S O
4

312
CapítuLo 6

Súsaueda en lenguaje controlado

SI (recurso de nieve) 2
52 (agua de nieve) 1
SS [51 0 52) 3

p.recísíón= 2 -o’66
3

exhaustívídad=A =O’50
4

Consulta 6. Análisis del rendimiento de turbinas

Súsaueda en lenguaje libre

51 [turbina*1 54
82 [análisis*) 356
SS (rendimiento) 100
S4 (52 Y S31 31
55 (51 y S4) 9

precísíón= ~ -0’33
9

exhaustívidad=-15 =O’60

313
Capítulo 6

Búsatzeda en lenauaie controlado

SI (turbina) 11
32 [rendimiento energético) 8
53 [central hidráulica) 20
S4 [análisis) 35
SS (ensayo) 50
S6 (540 Ss) 80
S7 [Sí Y S2) 3
38(S67S7) 1

precisíól2 2
1

exhaustívídad=-25 =0160

Consulta 7. Construcción de laboratorios de ensayo

Eúscnzeda en lenoua le libre

Si [construcción*) 147
32 (planificación*) 87
53 [instalación*) 354
S4 [ensay*) 249
SS (laboratorio*) 116
SG [Sl 0 32) 225
37 (53 0 SS) 429
58 [54 y 37) 131
59 (S6 7 58) 40

314

.
Capítulo 6

precísíón= ~ -0’22
40

exhaustívídad=—2—
11
=0’81

Eúsc¡ueda en lenaua-ie controlado

Sí (construcción) 40
52 (laboratorio de ensayo) 24
33 (51 y 52) 11

precísíón 8 -0’72
:i.i

exhaustívidad=—i- =0’? 2
11

Consulta 8. Sistemas expertos utilizados en líneas

Búsaueda en lenaua-ie libre

SI. [sistema* 7 experto~<J 53


52 [linea*) 165
S3 (Sí 7 S2) 4

precísíón= ~ _
4

315
Capítulo 6

exhaustíví dad- ~ _0’60


5

Bgscn.zeda en lenaua<ie controlado

Sí (sistema experto) 22
52 (línea de alta tensión) 9
53 [red eléctrica de alta
tensión) 10
54 (52 0 531 18
SS (Sí y 54) 2

precísíón= 2 _
2

exhaustívídad=—2 zO’40
5

Consulta 9. Defectos o problemas generados en la red eléctrica

Súsaueda en lenauaie libre

Sí (avería*1 35
32 (intenferen*) 5
SS (problem*1 155
S4 (defecto*) 27
55 (apagón*) 3
36 (red*) 457
57 (electr*1 607
38 [S10S20530S40951 211
59 (S6 y S7) 286
310 (SS Y 59) 64

316
Capítulo 6

precísíón= 19 -0’29
64

exhaustividad=-1-2-
19
=1

Búscueda en lenguaje controlado

51 (perturbación eléctrica) 12
52 [perturbación de la red) 9
S3 [defecto de línea eléctrica) O
S4 (red eléctrica 1 47
55 (51 0 32) 14
56 [54 7 SS) 6

precisíón— 66 =1

exhaustívidad=—Q- -0’31
19

Consulta 10. Almacenamiento de energía por superconductividad

Búsaueda en lenaua-f e libre

51 [energia*J 393
52 [almacena*) 71
S3 (superc* O conduct*j 43
34 (51 7 S2) 44
55 [53 7 54) 5

317
Capítulo 6

precísíón= ‘~ -0’80
5

exhaustí vídad=-45 =o’8o

Búsa’aeda en lenaua-ie controlado

Sí (superconductividad) 6
52 [almacenamiento) 5
Si [SI y 521 4

precísíón= ~ -ots
4

exhaustiví dad- ~ -0’60


5

318
Capítulo 6

Cuadro comparativo de resultados:

Lenguaje Ubre Tesauro

r da I»,cntog Dccatog

Bes—a reina Preciaién reienntas Preaiai6a ~... ti —L dad

re— flan—

1. 7 0’58 0’63 7 0’53 0’90

2. 5 0MB 0’17 28 ¿‘00 ¿‘00

3. 4 0’23 0’44 4 0’20 0’44

4. 3 ¿‘00 ¿‘00 2 ¿‘00 0’66

5. 2 0’11 0’5O 2 0’66 0’50

6. 3 0’33 O’60 1 ¿‘00 0’60

7. 9 O’22 0’81 ¡ 8 0’72 0’72

8. 3 0’75 0’60 2 ¿‘00 0’40

9. 19 0’29 ¿‘00 6 ¿‘00 0’31

10. 4 0’80 0’80 3 O’~75 0’60

319
Capítulo 6

producción habría propiciado resultados óptimos en este caso, pero el tesauro excluye
sistemáticamente la inclusión de términos generales, como decíamos anteriormente,
incluyendo, sin embargo, entradas de extraordinario nivel de especificidad, lo cual
beneficia la recuperación en casos concretos, pero la dificulta en otros, como el de la
consulta de referencia.

Apareció un documento referido a terreno, que se recuperó al emplear el término


polisémico solar. No obstante, se obtuvo en esta consulta prácticamente la misma tasa
de precisión con ambos lenguajes, 0’23 y 0’20, e idéntica tasa de exhaustividad.

En lenguaje natural se obtuvo un documento más que, indizado bajo sensor, no

se recuperó con el descriptor sintagmático sensor óptico. Podría deducirse de este caso
que puede que el lenguaje libre dé mejores resultados cuando el proceso de indización
se realiza a un nivel de especificidad bajo. El documento en sí trata de sensores en
general y de sensores ópticos, aunque no lo hace de forma particular. En el supuesto de
que hubieramos establecido baremos para estimar los índices de relevancia, este
documento podría considerarse menos relevante que los otros dos recuperados en lenguaje
controlado, pero como no se tuvo en cuenta esta variable, hemos de juzgarlo adecuado
para la pregunta formulada.

El ruido producido en la quinta consulta en lenguaje libre, comparativamente al


nivel de precisión conseguido en lenguaje controlado, se puede justificar por el
desconocimiento del descriptor especializado recurso de nieve, que consiguió con mayor
exactitud dar con las respuestas adecuadas.

En la séptima consulta se consiguió una baja precisión en lenguaje libre debido


a la ambigúedad derivada de la combinación (intersección) de los unitérminos ensayos

321
Capítulo 6

y laboratorio, que dieron como resultado no sólo la obtención de documentos relativos


a laboratorios de ensayo, sino los relacionados con ensayos de laboratorio. En lenguaje

controlado, el descriptor sintagmático laboratorio de ensayo eliminó dicha ambiguedad.

Con la estrategia realizada mediante el tesauro se recuperaron todos los


documentos relevantes de la colección, razón por la que coinciden los valores precisión
y exhaustividad en este caso.

En la octava consulta se confirmó una vez más el hecho de que el uso de


descriptores compuestos aporta mayor especificidad que el empleo de unitérminos.

Lo más significativo de la novena pregunta fue que el uso de sinónimos de la


palabra perturbación (aceptada como entrada preferente en el tesauro) motivó un elevado
volumen de referencias que, si bien perjudicaron la precisión, favorecieron la
exhaustividad que, en este caso, resultó ser del 100%. Con tesauro, sin embargo, se
logró un 100% de efectividad en el nivel de precisión y una baja tasa de exhaustividad,
debido fundamentalmente al nivel de precoordinación de los descriptores y a la
inexistencia de términos expresivos de conceptos tales como avería, interferencia, etc.,
presentes en los documentos recuperados mediante lenguaje libre.

322
Capítulo 6

6.6.3. Base de datos Biblioma, del Ministerio de Medio ambiente

Consulta 1. Futuro de la producción de energía a partir de


energías renovables.

Súsajueda en lenguaje libre

1 (producción) 224
2 (generación) 257
3 [energía) 1308
4 [energías renovables) 215
5 (.L1 .0 .L2 .7 .L3) 424
6 (.L5 .7 .L4) 35

precísíón= 30 _

35

exhaustividad=-3-9-
56
-O’54

Súsajueda en lenguaje controlado

o [generación de energía) 199


1 (energías renovables) 215
2 (.LO .7 .LlI 31

precisi6n~ 30 _

31.

323
Capítulo 6

exhaustívídad=-9-9-
56
=O’54

Consulta 2. Contaminación de aguas subterráneas por residuos


de plaguicidas.

Búso-ueda en lenguaje libre

O [contaminación)
6008
1 [aguas subterráneas)
326
2 (pesticidas)
222
3 [insecticidas) 66
4 [plaguicidas)
29
5 (.LO y .L1) 195
6 (ÑL2 .0 .L3 0L4J
.
277
7 flL6 .7 .L1) 12

precísíón= 11
12

exhaustividad=-Ai =O’42
26

Búsoueda en lenoua-ie controlado

O [contaminación de aguas
subterráneas) 140
1 (pesticidas) 222
2 (.LO .7 .L1I 11

324
Capítulo 6

11 =1
precisíón=”—
11

exhaustí vi dad- 11 =O’42


26

Consulta 3. Influencia del turismo en el medio ambiente de las


costas españolas.

Búsaueda en lenaua-ie libre

o (turis*1 490
1 [playas o costas) 5
2 (contamin*J 6323
3 (España) 2506
4 t.L1 .7 .L2 .7 .L31 3

precísión= 1 -O’33
3

exhaustiví dad— ~ -O’5O


2

Búsa’ueda en ¿ancua-le controlado

o (turismo) 494
1 [contaminacidn del litoral) 88
2 (España) 2506
3 [.LO .7 .L1 .7 .L2) 1

325
Capítulo 6

precisíón= 1
1

exhaustívida&4 2 =0’50

Consulta 4. Impacto economico de la lluvia ácida

Búsoueda en lenquaie libre

O (lluvia ácida) 205


1 teconom*) 4977
2 [LO .7 .L1) 14

precísíón= ‘~ -O’50
14

exhaustívídacb2- =O’87
8

Búscueda en lenguaje controlado

O (lluvia ácida) 205


1 (economía) 3666
2 [.LO .7 .L1) 5

precísíón ~ -í
5

326
Capítulo 6

exhaustívidad=5- 8 =O’62

Consulta 5. rncineración de residuos industriales tóxicos y/o


peligrosos.

Búscj-ueda en lengua-le libre

O (incineración) 141
1 (residuos) 2228
2 [industri*1 2276
.3 (toxic”<) 707
‘4 (peligrosos) 332
5 [.L1 .7 .L2) 639
6 (.L3 .0 .L41 923
7 [.LO .7 .L5 .7 .L6) 10

precísíón= ‘ -O’7O
‘o

exhaustívidad=—2— =O’17
39

Búscrueda en lenquale controlado

O (incineración) 141
1 (residuos peligrosos) 311
2 (residuos industriales) 336
3 (.L1 .7 .L2) 46
4 [.LO .7 .L3) 4

327
Capitulo 6

precisíón— 44 =1

t =O’lO
exhaustívídad=—39

Consulta 6. Técnicas de reutilización y reciclado de neumáti-


cos

Súscnzeda en lenguaje libre

O (neumáticos) 12
1 [reutilización) 393
2 (.LO .7 L1I 11

precísíón—:i.i =1
11

exhaustivídad=-1i =O’91

12

.Búsaueda en lenaua-te controlado

o (neumáticos) 12
1 [reutilización de residuos) .366
2 (transformación de residuos) 107

3 [.Ll .0 .L21 452


4 (.LO .7 .L31 11

328
Capítulo 6

prec.isión= I.1~1
11

exhaustí vi dad- ~ =O’91


12

Consulta 7. Actividades agrarias lesivas para el medio natural

Súsaueda en lenguaje libre

O (agricti 1513
1 (degradación) 522
2 (daños) 32
3 [deterioro) 24
4 [perjuicios) 9
5 [medio ambiente) 5803
6 [medio natural) 119
7 [.L1 .0 .L2 -0 .L3
.0 .L4) 5888
8 (.LO .7 .L7 .7 .LSJ 23

precísíón’ 18 -0’? 8
23

exhaustívídad=i?- =O’51
35

329
Capítulo 6

Búscueda en lenguaje controlado

O [agricultura) 541
1 [sobreexplotación del
suelo) 5
2 (agotamiento de recursos) 28
3 (degradación de recursos
naturales) 20
4 [destrucción de recursos
naturales) 7
5 [degradación del suelo) 116
6 [deforestación) 79
7 [.L1 .0 .L2 .0 .L3
.0 .L4 .0 .LS .0 .L6) 244
8 [.LO .7 .L7) 13

precísíón 12
13

exhaustividad— 12 =O’34
35

Consulta 8. Efectos de la radiactividad sobre el hombre

Súscrueda en lenguaje libre

o [radiactiv*) 417
1 [hombre) 495
2 [efectos) 2011
3 [.LO Y .L1 .7 .L2) 20

330
Capítulo 6

precisión~ 15 -0’?
20

exhaus ti vi dad- 15 =1
‘5

Búsa-ueda en len oua-le controlado

O (radiactividad o
contaminación radiactiva) 165
1 (efectos sobre el hombre) 286
2 (.LO •y .L1) 15

15
precisíón=— =1
‘5

exhaustíví dad- 15,


15

Consulta 9. Polución por aceite

Súsoueda en lenaua-Ie libre

O (polución) 16
1 (contaminación) 6008
2 (aceite) 12
3 1.LO .0 .L1 7 .L21 24

precisíón= 24
~ -0’29

331
Capítuto 6

exhaustí vi dad- -í
7

Búscrueda en lenczuaje controlado

O [aceites y grasas) 15
1 (aceites usados 1 25
2 (industria de aceites y
grasas 1 8
3 [contaminación) 4690
4 (.LO .0 .Ll .0 .L21 40
5 E.U .7 .L41 7

precísíón= 6
7

exhaustividad=-É- =O’80
7

Consulta 10. Avances tecnológicos en la descontaminación


atmosférica.

Súsaueda en lenguaje libre

O (tecnologi*) 1784
1 (contaminación atmos-
férica) 1429
2 (control) 4600
3 [.LZ y .L2) 701
4 (.LO •y .L31 77

332
Capítulo 6

precísíón~ 26 _

exhaustí vidad=Áf 1
26

Búsaueda en lenauaie controlado

O [control de la con ta-


minad ón) 760
1 (desarrollo tecnológí col 81
2 (nuevas tecnologías) 48
3 (tecnología am.bíentalj 416
4 [contaminación atmos-
férica) 1163
5 [control ambiental) 518
6 [.LO .0 .LS) 1267
7 E.L1 .0 .L2 .0 .L3) 523
8 [.L4 .7 .L6 .7 .L71 37

precisión= 26 _

37

exhaustívidad=-3á.
26
=1

333
Capítulo 6

Cuadro comparativo de resultados:

Lenguaj. libro Tesauro

r de Doctcnto. Doe tos

n6. queda relevantes Preci.i&iz ~.us tlfldad relevante. Preaisi6n nhaug ti vi dad

re-~ re~~

1 30 0<85 0<54 30 0<96 0<54

2. 11 0<91 0<42 11 1 0<42

3. 1 0<33 0<50 1 1 0<50

4. 7 0<50 0<87 5 1 0<62

5. 7 0<70 0<17 4 1 0<10

6. 11 1 0<91 11 1 0<91

7. 18 0<78 0<51 12 0<92 0<34

8. 15 0<75 1 15 1 1

9. 7 0<29 1 6 0<80 0<80

10. 26 0<33 1 26 0<70 1

334
Capítulo 6

relevantes, 4 de ellos coincidentes con los 4 conseguidos mediante tesauro, siendo útiles
también los 5 restantes. La causa por la que parecen haberse perdido 5 referencias al
formular la ecuación mediante tesauro puede deberse a que, en el momento de la mdi-
zación, no se caracterizaron los documentos por el descriptor desechos industriales, el
cual, sin embargo, aparecía en los títulos de las revistas en las que se encontraban los
artículos.

En búsquedas destinadas a usuarios potenciales, sería suficiente, en algunos casos,


facilitar resultados obtenidos de forma bastante genérica, especialmente si el volumen de
documentos no es muy amplio, así, por ejemplo, en la consulta número seis, la primera
respuesta, con resultado de 12 documentos sobre el tema, probablemente sería suficiente
para satisfacer sus necesidades, dada la escasez de referencias recuperadas, y el nivel de
especialización de la base de datos en la que se realizó la operación Sin embargo, dadas
las características del proyecto que estamos desarrollando, preferimos confirmar la
cantidad de registros que se obtienen en cada supuesto, procediendo, además, a la inter-
sección con otros términos, que en el ejemplo de referencia correspondería a reutiliza-
ción, descriptor que, como podemos comprobar, combinado con neumáticos, restringe
solamente en uno el número de documentos relevantes hallados.

En casos aislados, en el listado de descriptores del CD-ROM no aparecieron


descriptores que figuran en el tesauro impreso, por lo que fue necesario replantear la
estrategia.

Como podremos observar en los comentarios realizados sobre las incidencias de


las diferentes bases de datos consultadas, el recurso del truncamiento no siempre dió

336
Capítulo 6

los resultados apetecidos. En esta base en concreto, al truncar en sufijo agri* se


recuperaron, entre otros, un documento no relevante en el que aparecía el Ministerio de
Agricultura como editor, sin que dicho documento tenga relación alguna con el tema de
la consulta.

En la octava estrategia podemos comprobar una vez más la importancia de la


sintagmatización de los descriptores para obtener niveles de precisión altos, a expensas
de la exhaustividad.

En la penúltima ecuación, el uso del término aceite en la estrategia en lenguaje


libre originé considerable ruido documental, puesto que de los 24 documentos
recuperados, sólo 7 resultaron relevantes, mientras que con los descriptores precoordi-
nados del tesauro se consiguieron mejores niveles de precisión. No obstante, como es
lógico, entre toda la información recuperada en lenguaje libre se encontraban todas las
referencias relevantes de la base en lo que a polución por aceite se refiere.

De la última consulta podemos decir que el término control de la contaminación


no está aceptado en el Tesauro de Medio Ambiente como descriptor. Sin embargo, al
visualizar los registros, observamos que se utiliza en los procesos de indización como
término preferente, por lo que tuvimos que hacer la unión de las entradas: control de la
contaminación y control ambiental, no descriptor y descriptor respectivamente, para no
perder información. Por lo que se refiere al lenguaje libre se dió el caso de que la
intersección de tecnologi* y contaminación atmosférica produjo interferencias en los
resultados, debido a las falsas combinaciones. Entre los documentos analizados se
encontraban 26 relevantes que armonizaban con el tema de la consulta, y otros que
trataban del impacto de las tecnologías en los procesos de contaminación atmosférica, que
se oponía a la cuestión formulada.

33.7
Capitulo 6

6.6.4. Base de datos del Centro de Documentación de la Mujer

Consulta 1. Participación laboral de la mujer en el área de la


ingeniería.

Búsoneda en .Zenauaje libre

$1 participación laboral y ingeniería 1 (desc.)


$2 *participación* y *íngen* 0 (tít.)
$3 *participación* y *ingen* 6 (res.)

preciisíón= ~-0’16
6

exhaustivíded- 1
‘O

Búsaueda en lenauaje controlado

$1 ingení eras 10
$2 ingeni eras y datos estadísticos 5

precisión=—55 1

exhaustividad- ~ =o’so
‘O

338

::
Capítulo 6

Consulta 2. Intervención de la mujer en el mundo sindical

Búscrueda en lenguaje libre

$1 *sindica* 30 (en campo de


descriptores)
$2 *sindica* y mujer 17 (en campo de
título)
$3 *sindica* y mujer 194 (en campo de resu—
men)

precísíón= 86 o4 4

exhaustiví dad- 86 =O’92


93

Eúsoueda en lenguaje controlado

$1 sindicatos o sindicalistas
o afiliación sindical 82

precísíón= 56 -O’68
82

exhaustí vi dad— 56 =O’60


93

339
Capítulo 6

Consulta 3. La alfabetización femenina en el medio rural

Súscraeda en lenaua-ie libre

título:

$j *medio rural * 8
$2 *mundo rural * 2
$3 *pueblos* 3
$4 *alfabetización femenina* 1
$5 *alfabetización* 8
$6 $lo$20$3 13
$7 ($4 o $5) y mujeres 8
$8 $6y$7 21

resumen:

$1 *medio rural* 37
$2 *mundo rural* 20
$3 *pueblos* 4
$4 talfabetización fenlenina* 1
$5 *alfabetización* 34
$6 $lo$20$3 85
$7 ($40 $5) 34
$8 mujeres 5407
$9 $6y$7y$8 26

precisíón= 2
26

exhaustívídad=2 =O’25
8

340
Capítulo 6

Búsoueda en lengua-te controlado

$1 alfabetización o analfabetas 34
$2 mujer rural 163
$3 acceso a la educación o edu-
cación de adultos 84
$4 ($10 $3)y$2 5

precísíón= ~ -o’so
5

exhaustívídad=-18 =O’SO

Consulta 4. Consumo de alcohol por adolescentes

Búsa-ueda en lenguaje libre

título:

$1 *alcohol* 16
$2 *adolescen* 52
$3 *consumo de alcohol* 1
$4 *bebidas alcohólicas* 1
$5 $lo$3o$4 16
$6 $Sy$2 1

resumen:

$1 *alcohol* 66
$2 *adolescen* 134
$3 *consuzno de alcohol* 14
$4 *bebidas alcohdlicas* 3
$5 $1o$3o$4 66
$6 $Sy$2 3

341
Capítulo 6

precisión= ~ -O’25
4

exhausti vi dad- 1 _O’20


5

Búsaueda en lenaua-Ie controlado

$1 alcohólicas 32
$2 adolescentes 67
$3 $ly$2 2

prec.ísíón~A í

exhaustiví dad- 2 _

Consulta 5. Índices de participación de la mujer en el


deporte en Espafia.

Súsoueda en lengua-le libre

titulo:

$1 *deporte* o *deportista* o
*gimnasia* o *giflulasta* o
*aerobic* .38
$2 $1 o *ejercicio físico* 40

resumen:

$1 *deport* o *ejercicio físico


o *gin.JIas* o *aerobic* 149
$2 $1 y *Espajia* 26

342
Capítulo 6

precísíón= 29 -O’52
55

exhaustí vi dad- 29 —O’76


38

Súscrueda en leno’uae controlado

$1 deporte 89
$2 educación física 22
$3 $1 o $2 y España 39

precisíón= ~ _0’84
39

exhaustivi dad- ~ =O’86


38

Consulta 6. Sexismo en la escuela.

Búsoueda en lenoua-ie libre

título:

$1 *sexismo* o *discríminación
sexual * 32
$2 $1 y *escuela* 2

343
Capítulo 6

resumen:

$1 *sexismo* o *discriminación
sexual * 68
$2 $1 y *escuela* 27

precísíón= 27
29

exhaustívídad=—27 -O’51
52

Búsoueda en lenouaie controlado

$1 educación sexista 201


$2 enseñanza preescolar o
enseñanza de 10 grado
o enseñanza de 20 grado
o estudiantes de 10 grado
o estudiantes de 20 grado 104
$3 $ly$2 33

precisíón— 33 =1
33

exhaustívida&fl =O’63
52

344
Capítulo 6

Consulta 7. Imagen de la mujer en la publicidad

Súsaueda en lenguaje libre

título:

$1 *publici* 41
$2 *televisi* 46
$3 *medios de comunicación* 33
$4 *anuncios* 2
$5 *imagen de la mujer* 23
$6 <$lo$2o$3o$4)y$5 7

resumen:

$1 *publici* 142
$2 *televisi* 135
$3 *medios de comunicación* 249
$4 *nuncios* 41
$5 *imagen de la mujer* 101
$6 <$lo$2o$3o$4)y$5 46

precísíón= —O~84

exhaustividad=-2A
73
=O’52

Búscrueda en lenguaje controlado

$1 publicidad 90
$2 imagen de la mujer 56

345
Capítulo 6

preci¡síón= ~ _0’94
56

exhaustí vi dad- ~ -O~72


73

Consulta 9. El absentismo laboral de la mujer

Súsaueda en lenauaie libre

titulo:

$1 *absentismo laboral* 3
$2 *baja por enfennedad* o
$3 *fr~j~ laboral * o
resumen:

$~ *absentismo laboral* lo
$2 *baja por enfermedad* o
$3 *baja la.boral* 1
$4 $lo$2o$3 11

precísíón= ~ _0’64
14

exhaustividad- ~ =O’9O
‘o

Búsoueda en lenoua~ie controlado

$1 absentismo laboral 8

346
Capítulo 6

precísíón= 8 _

exhaustivídad- 8
‘o

Consulta 9. flnpleo de mujeres inmigrantes

Búsoueda en lenguaje libre

título:

$1 *inmigra* 22
$2 *muj eres inmigran tes* 3
$3 *dominicanas* 5
$4 *empleo* 164
$5 *trabajo* 406
$6 *empleadas del hogar O
$7 $lo$2o$3 27
$8 $7y($4o$S) O

resunien

$1 *inmi ura * 64
$2 *mujeres inmigran tes* 17
$3 *dominicanas* 12
$4 *empleo* 909
$5 *trabajo* 2988
$6 *empleadas del hogar* 4
$7 $lo$2o$3 70
$8 $4o$So$6 3304
$9 $7y$8 30

precísíón= ~ _0’30
30

347
Capítulo 6

exhaustividad=—2—-
12
=0’? 5

Búscyueda en lenguaje controlado

$1 migran tes 95
$2 migración .35
$3 acceso al empleo 79
$4 empleo 29
$5 servicio doméstico 42
$6 $10 $2 115
$7 $3o$4o$5 109
$8 $6y$7 .3

precísíón=—o =0
3

exhaustivída&—9— =0
12

Consulta 10. Feminismo en España

Búsoneda en lenauale libre

título:

$1 *feminismo* 147
$2 *movimiento femínista* 12
$3 *liberación de la mujer* 9
$4 ($1 o $2 o $3> y España 54

348
Capítulo 6

resumen:

$1 *feminismo* 547
$2 *movimiento feminista* 201
$3 *liberación de la mujer* 63
$4 ($1 o $2 o $3) y España 151

9 ~‘
151

exhaustividad=—2-4--=O’63
148

Búsaueda en lengua-le controlado

$1 feminismo 162
$2 feminismo socialista 54
$3 movimiento sufragista 76
$4 movimiento feminista 239
$5 feministas 115
$6 $1 o $2 o $3 o $4 o $5 5.36
$7 $6 y España 125

2.230¡98
125

exhaustívi dad— 123 _0’83


148

349
Capítulo 6

Cuadro comparativo de resultados:

Lenguaj. libre Tesauro

»~ de Docas tos nocastos


96, qneda tea PrecIsIón Xrhaustivld.d nl eran tos Proal alón flhns tlvldád

nc.— nc.—

1 O’16 O’1O 5 1 O’5O

2. 86 O’44 O’92 56 O’68 O’60

3. 2 O’07 O’25 4 O’80 O’5O

4. 1 O’25 O’20 2 1 O’40

5. 29 O’52 O’76 33 O’84 O’86

6. 27 O’S1 33 1 O’63

7. 38 O’84 O’52 53 O’94 O’72

8. 9 O’64 O’90 8 1 O’8O

9. 9 O’30 O’75 O O O

10. 94 O’62 O’63 123 098 O’83

350
Capítulo 6

En la tercera estrategia en lenguaje libre, truncamos en prefijo y sufijo en el


campo de título para que apareciera información, de lo contrario, sólo se recuperaba si
coincidía el título con la palabra clave que se incluye en la ecuación, porque el ordenador
lee secuencialmente. El resultado, en cualquier caso, mostró que en Lenguaje natural,
salvo dos documentos, los demás trataban el tema de forma marginal.

El truncamiento de sufijo deport*, en la quinta consulta, motivó la recuperación


de un documento que trataba el tema de deportadas de guerra, que, naturalmente, no era
relevante.

En la novena consulta, la incorporación a la estrategia del término dominicanas,

en lenguaje libre, fue decisivo para hacer posible la recuperación de 9 documentos


relevantes, que no se localizaron por medio del tesauro al no estar incluida esta palabra
en su vocabulario. Este es probablemente el supuesto que muestra de forma más evidente
cómo la facilidad de uso de términos nuevos en el vocabulario favorece la recuperación
en lenguaje natural.

352
Capítulo 6

6.6.5. Base de datos PSEDISOC del CSIC

Consulta 1. Desensibilización sistemática aplicada a fobias

Búsaueda en len qUale libre

1 42 ‘desensibilización’
2 56 ‘sensibilización’
3 9 ‘desensibilización’
and ti ‘sistemática’
4 14 ‘desensibilización’
and re ‘sistemática’
5 20 #3or#4
6 98 #lor#2or#5
7 186 ‘fobias’ or ‘aversión’
or ‘temor’
8 9 #6and#7

precísíón= ~ -O’44
9

exhausti vidad=É.
5
=o’8o

Súsaueda en lencruale controlado

1 212 ‘fobias’ or de ‘miedo’


or de has ‘aversión’
2 134 de ‘*fobia’
3 337 #1 or #2
4 31 de ‘terapia de desensibilización
sistemática’
5 5 #3and#4

353
Capítulo 6

precísíón= ‘~
5

exhaustividad=-S =O’80
5

Consulta 2. Técnicas de relajación aplicadas a trastornos


del sueño.

Búscrueda en lenguaje libre

1 151 ‘reíajacion’
2 428 ‘sueño’ or ‘descanso’
3 4024 ‘problemas*’ or
4 ‘perturbaciones’ or ‘desordenes*’
5 2207 ‘tras tornos ~‘
6 55 143 and <#3 or #4)
7 1 #1 and #5
8 3 #1 and #2

precísíón= 2 _

exhaustívidad=—2 -O’40
5

BúsQueda en lengua-le controlado

1 58 ‘tecnicas de relajacion’
2 30 ‘insomnio’ or ‘trastornos del sueño’
3 2 #land#2

354
Capítulo 6

precísíón=—22 =1

exhaustívidad=1 5 0’40

Consulta .3. El papel del psicólogo en los servicios sociales

Búsaueda en lengua-le libre

1 7630 ‘papel’ or ‘rol’


or ‘funcion’
595 ‘psi cologo?’
2
95 #1 and 1*2
3
4
1033 ‘servicios sociales’
£ 7 #3and#4

precísíón= 6 -o’ss
7

exhaustividad=—f-- =O’09
62

Búsa-ueda en lenguaje controlado

1 532 ‘psicologoi” or
‘rol del terapeuta’
2 954 ‘servicios sociales’
3 22 1*1 and 1*2

355
Capítulo 6

precisíón= 16
22 -O’72

exhaustivi dad- 16
62

Consulta 4. Peritaje de niños en casos de maltrato infantil

Búsoueda en lenaual e libre

1 300 ‘peritaje’ or ‘peritacion’


or ‘dictamen’
2 30 ‘perito?’
3 321 #lor#2
4 3741 ‘niños’ or ‘infancia’
5 1010 ‘maltrato’, ‘maltratamiento’,
‘daño’, ‘violencia’, ‘lesiones’
6 235 ‘víctimas’
7 92 #4and(#Sor#6)
8 74 ‘niños maltratados’
9 138 #7or#8
10 2 1*3 and 1*9

precisíón=—2 1
2

exhaustiví dad- 2 _0’33


6

356
Capítulo 6

.Súscnzeda en lengua-le controlado

1 68 ‘niños’, ‘niños maltratados’


2 2151 ‘niños’
3 641 ‘violencia’,
‘violencia familiar’
4 2760 1*2 or #3
5 32 #2and#4
6 125 ‘niños maltratados’
‘niños abandonados’, ‘abuso de
niños’
7 14 ‘abuso sexual’ and ‘niños’
8 147 #Sor#6or#7
9 1269 ‘medida’. ‘infozte pericial’
5 7 #Sand#9

precísíón, -o’85

exhaustívidad=-9-6 =1

Consulta 5. Efectos de la fatiga en la conduccion

Búscueda en lenguaje libre

1 67 ‘conduccion’
2 121 ‘fatiga’,
‘cansancio’, ‘agotamiento’
3 1 #land#2

precisión- 1 -1
1

357
Capítulo 6

exhaustivídad=-1 2 =O’50

Búscrueda en lengua-fe controlado

1 216 ‘conductores’, ‘accidentes de


trafico’, ‘seguridad vial’
2 381 ‘fatiga*’, ~estres*~
3 2 #land#2

precísíón=A ~
2

exhaustivídad=1 .1
2

Consulta 6. Trastornos de la alimentación en adolescentes

Búsaueda en lengua-te libre

1 891 ~adolescentes
2 2752 ‘trastornos*’,’ desordenes’,
‘perturbaciones *‘, ‘ansiedad’
3 873 ‘alimentacion’
4 11 1*2 and 1*3
5 228 ‘bulimia’, ‘anorexia’, ‘inapetencia’,
‘apetito’, ‘hambre’
6 231 1*4 or #5
7 22 1*1 and 1*6

358
Capítulo 6

precísíón=-~{=í

exhaustívidad=—21 =O’48
43

Búsaueda en lencruaje controlado

1 721 ‘adolescentes’, ‘preadolescentes’


2 201 ‘nutricion’,’ apetito’, ‘bulimias,
‘anorexia nerviosa’
3 31 ‘tras tornos de la conducta
alimenticia’
4 3 #land1*3
5 20 1*1 and (#2 or 1*3>
6 2 ‘nutricion’ and ~trastornos*~
7 32 #Sor#6
8 91 ‘nutricion’
9 110 1*2 and not #8
10 20 1*1 and (1*3 or #9>

19
precisíc$n=— =1
19

exhaustivída&-1-2-
43
=O’44

359
Capítulo 6

Consulta 7. Estrás o ansiedad en el contexto hospitalario

Búscrueda en lenaua-Ie libre

1 1124 ‘estres’, ‘agotamiento’,


‘cansancio’, ‘ansiedad’

2 1116 ‘hospitales’, ‘clinicas’,


‘sanatorios’, ‘convalecencia’
3 0 ‘quirófano’, ‘ambulancia’
4 47 #land1*2

precísíón 16 -0’34
47

exhaustívídad=—16 =0’53
30

Búsaueda en lenouaie controlado

1 873 ‘hospitales’, ‘medio


hospitalario’, ‘pacientes
hospitalizados’
2 114 ‘clínicas’
3 884 ‘estres’,’estres mental’,
‘ansiedad’
4 23 #3 arad (1*1 or #2>

precísíón= 16 -0’? 3
23

exhaustividad=~!Z~ =0’56
30

360
Capítulo 6

Consulta 8. Estrategias meta-cognitivas en estudiantes


universitarios.

Súsaueda en lenguaje libre

1 504 ‘estudiantes universitarioB’,


‘universitarios’
2 2749 ‘me tacognicion’, ‘cogni clon’,
‘conocimiento’
3 14 #1 arad 1*2

precisión— 6 —0’4 2
14

exhaustividad=—6 =1
6

Súscrueda en lenguaje controlado

1 2222 ‘estudiantes’, ‘universidad’


2 1234 ‘metaconocímiento’,
‘conocimiento’
3 13 1*1 and 1*2

precisíón= ~ -O’30
13

exhaustividad=.± =0’66
6

361
Capítulo 6

Consulta 9. Evaluación de mecanismos de defensa con crite-


rios del DSM.

Búsaueda en lenouaie libre

1 136 ‘dsm’,’criteríos del dsm’


2 212 ‘trastornos afectivos’
3 19 #1 and #2

precísíón= ~ -O’57
‘9

exhaustí vii! dad=-1-i


31
-O’35

Súsaueda en lenquale controlado

1. 502 ‘trastornos afectivos’,


‘trauma emocional’~ ‘depresion mayor’
2 70 ‘dsm-Xfl’
3 18 1*1 and #2

precísíón= 14
28

exhaustívidad=-1-4 -O’4 5
31

362
Capítulo 6

Consulta 10. Factores psicosociales o tras tonos de persona-


lidad que influyen sobre el consumo en los jóvenes.

Súso-ueda en lencua le libre

1 3982 ‘consumo’, ‘consumismo’


2 2294 ‘personalidad’, ‘rasgos
de personalidad’,
‘caracteristicas de la
personalidad’
3 49 ‘factores psicosociales’
4 1327 ‘publicidad’
5 3658 1*2 or 1*3 or 1*4
6 2030 ‘jovenes’, ‘juventud’
7 11 1*5 and 1*6 and 1*1

precisión— ~ —0’09
11

exhaustividad1 1 =1

Súsa-ueda en lenguaje controlado

1 508 ‘rasgos de personalidad’,


‘factores psicosociales’,
‘factores de personalidad’
2 1776 ‘publicidad’, ‘factores
sociales’
3 2255 1*1 or 1*2
4 101 ‘consumismo’, ‘comportamiento
de los consumidores’
5 1654 ‘juventud’,’
adolescencia’
6 1 #Sand#4and1*5

363
Capítulo 6

prectí ~2Lón=—11 =1

exhaustívídad=l =1
1

Cuadro comparativo de resultados:

Lenguaje libre Tesauro

E. da DóCc Dooastoa

Búsqueda rol ayas tas ~.cIsI6s ¡ atan. tirldad rela,nt.ea PreclaUn abane tirldad

recuperas

1. 4 O’44 0’8O 4 O’8O O’80

2. 2 O’66 2 1

3. 6 O’85 16 O’72 O’25

4. 2 1 O’33 6 O’85 1

5. 1 1 ¡ O’5O 2 1 1

6. 21 1 O’48 19 1 O’44

7. 16 O’34 O’17 O’73

9. 6 O’42 4 O’30

9. ¡ 11 O’57 0’35 14 O’77 O’45 ¡

10. 1 O’0S 1 1 1 1

364
Capítulo 6

En respuesta a la tercera pregunta, la razón por la que se obtuvieron más


referencias en lenguaje controlado, hecho poco habitual, fue la capacidad de inducción
del tesauro, que hizo posible la localización del descriptor rol del terapeuta. Este aportó
la mayor parte de los documentos referidos al tema de consulta, con más exactitud que
la palabra clave psicólogo, a pesar de estar ésta incluida en la pregunta.

En la base de datos había más documentos indizados bajo metacognición que bajo
el descriptor aceptado en el tesauro inetaconocimiento, de ahí que, en la octava consulta,
se recuperaran más referencias relevantes en lenguaje libre que por medio de la estrategia
elaborada con el tesauro.

En la última pregunta, la búsqueda por medio de los unitérminos consumo y


consumismo dió como resultado 10 documentos irrelevantes, que no aparecieron cuando
se concretó más la ecuación con el descriptor comportamiento de los consumidores, que
recuperó un único documento totalmente relevante.

366
Capítulo 6

6.6.6. Base de datos de la Biblioteca del Instituto de Migraciones y


Servicios Sociales.

Consulta 1. Ayuda a familiares con enfermos de A.lzheímer

Búsc¡u eda en lenqua-f e libre

$1 69 respuesta (5) para: AYUDA Y FAMILI*


$2 178 respuesta (5) para: ALZHEIMER
$3 6 respuesta (a) para: $1 Y $2

precrísíón= 6 -1
E

exhaustívidad— 6 .0’28
21

BúsQueda en lenaua-f e controlado

$1 172 respuesta(s) para: ENFERM2DAD DE ALZHEIMER


$2 20 respuesta(s) para: SERVICIOS DE APOYO PAbLE-
LIAR
$3 1 respuesta(s) para: ENTRENAMIENTO EN FLABILI -

DA-
DES DE CUIDADO
$4 3 respuesta(s) para: ESTANCIAS TEMPORALES
$5 6 respuesta(s) para: GRUPOS DE APOYO
$6 4 respuesta(s) para: $1 Y ($2 o $3 o $4 o $5)

precisíón=—4 =2.
4

367
Capítulo 6

exhaustívídad=—4--
21
-0’19

Consulta 2. Viviendas compartidas por estudiantes y ancianos

Búscueda en lena’ua-f e libre

$1 135 respuesta(s) para: ALOJAMIENTOS O VIVIENDAS O


PISOS
$2 11 respuesta(s) para: ESTUDIANTES Y ANCIANOS
$3 1 respuesta(a) para: $1 Y $2

precísión=—11 =1

exhaustivi dad- 10/50

Súsoueda en lengua-le controlado

$1 6 respuesta(s) para: ALOJAMIENTOS ALTERNATIVOS


$2 21 respuesta(s) para: VIVIENDAS COMPARTIDAS
$3 119 respuesta(s) para: ESTUDIANTES
$4 2883 respuesta(s) para: 1* TERCERA EDAD
$5 240 respuesta(s) para: ¿7TJVENTUD
$6 235 respuesta(s) para: JOVENES
$7 573 respuesta(B) para: ANCIANOS
$8 1083 respuesta(s) para: CLASIF=TE
$9 1 respuesta(s) para: ($1 o $2) Y ($3 o $5 o $6)
Y
($4 o $7 o $8)

368
Capítulo 6

#TERCERA EDAD equivale a:

TER CERAEDAD O ANCIANOS ABANDONADOS O BONIFICACIONES A LA


TERCERA EDAD O DERECHOS DEL ANCIANO O ENVEJECIMIENTO O
ENVEJECIMIENTO BIOLOGICO O ENVEJECIMIENTO PSICOLOGICO O
GERONTOLOGíA O JUBILADOS O PREPARACION A LA JUBILACION

precísíón=—1 =1
1

exhaustívídad=l =0’50
2

Consulta 3. Trabajo en granjas escuela para niños deficien-


tes psíquicos.

Súscueda en lenaua-ie libre

$1 102 respuesta(s) para:


CAMPO O GRA&JA* O HORTICULT*
$2 4981 respuesta(s) para: DEFICIEN* O MINUSVAL* O
DISCAPACí *
$3 1208 respuesta(s) para: TERAPIA
$4 10 respuesta(s) para: $1 Y $2
$5 1 respuesta(s) para: $3 Y $4

precísión=—11 =1

exhaustívidad=l =1
1

369
Capítulo 6

Busaueda en lenoua-f e controlado

$1 1429 respuesta(s) para: DEFICIENCIA MENTAL


$2 160 respuesta(s) para: TERAPIA OCUPACIONAL
$3 1 respuesta(s) para: GRANJAS ESCUELA
$4 21 respuesta(s) para: $1 Y $2
$5 O respuesta(s) para: $3 Y $4

precisión=—:1.1 1

exhaustividad=-11 =1

Consulta 4. Sexualidad en personas con deficiencia mental

BúsQueda en lenaua-~e libre

$1 509 respuesta(s) para: SEX*


$2 1774 respuesta(s) para: (DEFIC* O MINLYSVAL*) Y
(MENTAL* O PSIQUrC*)
$3 269 respuesta(s) para: SUSNORMAL* O (RETRASe Y
MENTAL tt)
$4 1825 respuesta(s) para: $2 O $3
$5 72 respuesta(s) para: $1 Y $4

precisión- ~ —0’6 O
72

exhaustividad=~±4. -0’80
55

370
Capítulo 6

Búsgueda en lenouaie controlado

$1 247 respuesta(s) para: SEXUALIDAD


$2 104 respuesta(s) para: CONDUCTA SEXUAL
$3 1596 respuesta(s) para: #DEFICIENCIA MENTAL
$4 305 respuesta(s) para: $1 O $2
$5 44 respuesta(s) para: $3 Y $4

precisión- 40
44

exhaustividad=-4-9-
55
=0’72

Consulta 5. Animales de compañía como medios terapéuticos en


niños autistas.

Búsaueda en lenguaje libre

$1 337 respuesta(s) para: AUTIS*


$2 386 respuesta(s) para: TERAPIA
$3 6 respuesta(s) para: ANIMALES O PERROS O GATOS
O COBAYAS
$4 5 respuesta(s) para: $1 Y $2
$5 1 respuesta(s) para: $3 Y $4

precisi ¿u -_
1

exhaustividad=—2. ‘0’33
3

371
Capítulo 6

$1 5 respuesta(s) para: ANIMALES DE COMPAÑíA


$2 315 respuesta(s) para: AUTISMO
$3 79 respuesta(s) para: NIÑOS CON NECESIDADES
ESPECIALES
$4 3 respuesta(s) para: $1 Y ($2 O $3)

precisión=—33 =1

exhaustividad=-2-3 =1

Consulta 6. Avances genéticos en la prevención de deficien-


cias.

BúsQueda en lenaua-ie libre

$1 12 respuesta(s) para: PREVENCIÓN Y GENETICA Y


DEFICIEN*

precisión- 2
12

exhaustivídad=-1 =O’66
:3

372
Capítulo 6

BúsQueda en lenaua-le controlado

$1 58 respuesta(s) para: PREVENCION DE LA DEFI-


CIENCIA
$2 52 respuesta(s) para: GENÉTICA
$3 1 respuesta(s) para: $1 Y $2

precisión=~ 11 1

exhaustivíclad=1 3 -0’33

Consulta 7. Métodos de comunicación con discapacítados


sensoriales.

BúsQueda en lengua-le libre

$1 141 respuesta(s) para: SORDOS O CIEGOS O SORDO-


MUDOS
$2 1194 respuesta(s) para: COMUNICACIÓN O LENGUAJE
$3 49 respuesta(s) para: $1 Y $2

precisión- 26 ~ 3

49

exhaustívidad=—26 0’49
53

373
Capítulo 6

Súscueda en lenana-le controlado

$1 20 respuesta(s) para: COMUNICACIÓN NO VOCAL


$2 125 respuesta(s) para: DEFICIENCIA SENSORIAL
$3 282 respuesta(s) para: SORDERA
$4 241 respuesta(s) para: DISCAPACIDAD
$5 76 respuesta(s) para: DIS CAPACIDAD PARA LA
COMUNICACIÓN
$6 7 respuesta(s) para: $1 Y ($2 O $3 O $4 O $5)

prec’ísíón=—77 =1

exhaustívídad=-2—
53
=0’13

Consulta 8. Actitudes sociales hacia los inmigrantes

Bdsaueda en lena-uaie libre

$1 158 respuesta(s) para: 1W.!IGRA *


$2 79 respuesta(s) para: SMI GRA *
$3 71 respuesta(s) para: EXTRANJEROS
$4 32 respuesta(s) para: COMPORTAMIENTO
$5 738 respuesta(s) para: CONDUCTA
$6 254 respuesta(s) para: ACTITUD
$7 SS respuesta(s) para: RACISMO
$8 33 respuesta(s) para: XENOFOBIA
$9 225 respuesta(s) para: MI GRA *
$10 412 respuesta(s) para: ($1 O $2 O $3 O $9)
$11 1079 respuesta(s) para: ($4 O $5 O $6 O $7 O $8)
$12 31 respuesta(s) para: $10 Y $11

374
Capítulo 6

precisión- 26
31

exhaustividad=A§ ~
32

BúsQueda en lenauaje controlado

$1 111 respuesta(s) para: ACTITUDES SOCIALES


$2 32 respuesta(s) para: XENOFOBIA
$3 88 respuesta(s) para: RACISMO
$4 263 respuesta(s) para: #MIGRACIÓN
$5 20 respuesta(s) para: TRABAJADORES EXTRANJEROS
$6 5 respuesta(s) para: TRABAJADORES MIGRANTES
$7 231 respuesta(s) para: ($1 O $2 O $3)
$8 274 respuesta(s) para: ($4 O $5 O $6)
$9 22 respuesta(s) para: $7 Y $8

precisión- 16 -0’? 2
22

exhaustividad=—16 =0’50
32

375
Capítulo 6

Consulta 9. Problemas de alimentación en la tercera edad.

Búscnieda en lenauale libre

$1 526 respuesta(s) para: PROBLEMA *


$2 48 respuesta(s) para: DIFICULTAD *
$3 947 respuesta(s) para: TRASTORNO*
$4 44 respuesta(s) para: ALIME2JT*
$5 2563 respuesta(s) para: TERCERA
$6 2655 respuesta(s) para: EDAD
$7 806 respuesta(s) para: ANCIAN*
$8 30 respuesta(s) para: VIEJ*
$9 91 respuesta(s) para: vEJ*
$10 159 respuesta(s) para: MAYORES
$11 2549 respuesta(s) para: $5 Y $6
$12 1428 respuesta(s) para: $1 O $2 O $3
$13 3143 respuesta(s) para: $7 O $8 O $9 O $10
$14 4 respuesta(s) para: ($4 Y $12) Y $13

precisión- ~ -O’25
4

exhaustivida&l -O’20
5

sús mi eda en lerzguaf e controlado

$1 16 respuesta(s) para: TRASTORNOS ALIMERTAR 105


$2 14 respuesta(s) para: DIETÉTICA
$3 2905 respuesta(s) para: TERCERA EDAD
$4 573 respuesta(s) para: ANCIANOS
$5 3351 respuesta(s) para: $3 O $4
$6 30 respuesta(s) para: $1 O $2
$7 9 respuesta(s) para: $5 Y $6

376
Capítulo 6

precisión- ~ -0’44
9

exhaustividad=-± -0’80
5

Consulta 10. El ejercicio físico en personas mayores.

Búscueda en lengua-le libre

$1 198 respuesta(s) para: DEPORT*


$2 74 respuesta(s) para: ACTIVIDAD
$3 159 respuesta(s) para: MAYORES
$4 30 respuesta(s) para: VIEJ*
$5 91 respuesta(s) para: VEJ*
$6 2563 respuesta(s) para: TERCERA
$7 2655 respuesta(s) para: EDAD
$8 10 respuesta(s) para: GIFOJASIA
$9 769 respuesta(s) para: FISIC*
$10 88 respuesta(s) para: EJERCICI *
$11 17 respuesta(s) para: $2 Y $9
$12 2549 respuesta(s) para: $6 Y $7
$13 31 respuesta(s) para: $9 Y $10
$14 219 respuesta(s) para: $1 O $8 O $11 O $13
$15 2585 respuesta(s) para: $3 O $4 O $5 O $12
$16 48 respuesta(s) para: $14 Y $15

precísión= ~ -o’si.
48

exhaustivídad=—~39-0’7 5_

52

377
Capítulo 6

BúsQueda en lenaua-e controlado

$1 2905 respuesta(s) para: #TERCERA EDAD


$2 573 respuesta(s) para: ANCIANOS
$3 169 respuesta(s) para: ACTIVIDADES DEPORTIVAS
$4 14 respuesta(s) para: EJERCICIO FÍSICO
$5 3351 respuesta(s) para: $1 O $2
$6 178 respuesta(s) para: $3 O $4
$7 49 respuesta(s) para: $5 Y $6

precisión- 40
49

exhaustividad== 0’76
52

378
Capítulo 6

Cuadro comparativo de resultados:

Lenguaje libre TeBauro

Docuu~s

M de rei ev.. tea Doefls

6. queda rea.pera- PrecIsiún atan. ti reinan PrecIsidn atan. ti vi dad

¡ dos

6 1 0’28 4 1 O’19

2. 1 1 O’S 1 1 0’5

3. 1 1 1 1 1 1

4. 44 0’61 0’80 40 0’90 O’72

5. 1 1 0’33 3 1 1

6. 2 0’20 0’66 1 1 0’33

7. 26 0’55 0’45 7 1 0’13

9. 26 0’83 0’81 16 0’72 0’5O

9. 1 0’25 O’20 4 0’44 0’80

10. 39 0’81 0’75 40 0’81 076

379
Capítulo 6

Al igual que en la base de datos de Biología animal, se dió un caso en este centro,
concretamente el segundo, en el que existió coincidencia de resultados en los dos tipos
de lenguajes.

En relación con la tercera consulta, podemos decir que en el tesauro no existe el


descriptor horticultura, no hallándose ninguna referencia en el proceso de búsqueda con
entradas más específicas del tesauro tales como granjas escuela. En lenguaje libre, en
cambio, pudimos llegar hasta ese nivel de especificidad, recuperándose un documento en
cuyo título figuraba el mencionado término.

En la misma consulta, en lenguaje controlado y como puede observarse en el


desarrollo de ¡a ecuación, al recuperar un documento bajo el descriptor granjas escuela

no seguimos realizando operaciones de intersección (sets $4 y $5), porque perdíamos el


único documento relevante recuperado. Fue posible evitar su omisión porque la pregunta
era muy específica y, por tanto, fácilmente controlable.

En la octava pregunta, el descriptor compuesto comunicación no vocal restringió


la cantidad de documentos recuperados, al contrario que comunicación o lenguaje,

utilizados en la ecuación en lenguaje libre.

6.7. Resultados obtenidos

Al proceder a la comparación de resultados se detectaron accidentes lingúisticos


tales como polisemias, sinonimias, etcétera, que hemos comentado al finalizar el desarro-
lío de las estrategias de cada base de datos. Estas cuestiones lingtiísticas explican, por sí
solas las diferencias encontradas entre ambos procedimientos de búsqueda.

381
Capítulo 6

En total, las 60 búsquedas en lenguaje libre recuperaron L524 documentos, de


los cuales 838 fueron relevantes. El mismo número de búsquedas utilizando lenguaje
controlado dió como resultado un total de 983 referencias, 848 de las cuales fueron
relevantes. Los conjuntos de documentos recuperados variaron en función del nivel de
especificidad de la información requerida.

De las estrategias realizadas en lenguaje libre, poco más de la mitad dieron


resultados relevantes, concretamente el 54’98 %. En general la mayor parte de los
documentos resultantes en lenguaje controlado respondieron al tópico de la consulta; en
total el 86% se juzgaron relevantes.

Se puede decir que del análisis del test resulta lo siguiente: de cada 100
documentos recuperados en lenguaje libre, el 45 % podrían ser eliminados por carecer de
interés y que la proporción de documentos irrelevantes recuperados mediante tesauro es
de tan sólo el 13’7%.

Estos datos confirman el alto porcentaje de ruido documental que genera el


lenguaje natural en comparación con el controlado. La tasa de silencio, sin embargo, fue
muy similar con ambos procedimientos de búsqueda; a lo largo del test, el total de
documentos relevantes no recuperados con tesauro fue de 568, en libre la cifra ascendió
a 573. La diferencia, de tan sólo 5 documentos, no es estadísticamente significativa. El
silencio documental generado en la búsqueda con lenguaje controlado tuvo su origen en
la ausencia de descriptores apropiados en casos muy concretos. Este fenómeno se dió,
por ejemplo, en la consulta número 9 de la base de datos del Centro de Documentación
de la Mujer, motivado por la falta de un término representativo de un concepto que ha
cobrado significación en el entorno social en fecha posterior a la edición del tesauro. En
la cuestión se solicitaba documentación acerca del Empleo de mujeres inmigrantes, tema

382
Capítulo 6

sobre el que no se halló ninguna referencia con la ayuda del tesauro, pero que, con la
introducción de la palabra clave dominicanas, dió como resultado un total de 9
referencias.

Las tasas de precisión y exhaustividad conseguidas mediante lenguaje libre y con


tesauro se pueden comparar en el siguiente cuadro:

Lenguaje libre Tesauro

Documentos
Documentos relevantes Exhaustl-

reja,. ates Precisión ExhaustA- recuperados Precisión vidad

recuperados vidad

Biología animal 142 876% 54’20% 145 96% 6320%

Electrotecnia 59 4.490% 6550% 63 7866% 6130%

Medio ambiente 133 6446% 6920% 121 9380% 6230%

Mujer 287 4770% 5546% 317 8240% 5840%

Psicología 70 6370% 5480% 85 8170% 6560%

Servicios sociales 147 7250% 58’20% 117 8870% 5930%

Si hallamos la media de los seis sistemas de recuperación los resultados arrojan


las siguientes cifras: en lenguaje libre se dió una precisión del 54’98% y una exhausti-
vidad del 59’5 %; con la ayuda del tesauro ambos índices mejoraron: la precisión alcanzó
un 86’8% y la exhaustividad un 61’6%.

Las diferencias son del 23’4 % en precisión, favorables a la recuperación por


medio de tesauro, y del 2’ 1% en exhaustividad, también con la balanza a favor del

383
Capítuio 6

lenguaje controlado. Como puede observarse, uno de los resultados más significativos fue
que los dos lenguajes proporcionan prácticamente el mismo nivel de rendimiento en lo
que a exhaustividad se refiere, siendo, sin embargo, las diferencias registradas en las
¡asas de precisión estadísticamente significativas. Al comparar los valores de dichas ¡asas
conseguidos en las tres bases de datos de ciencia y técnica con las de ciencias sociales
no hallamos diferencias destacables. En lenguaje libre los valores de precisión en los dos
tipos de bases alcanza una diferencia del 21’1%, y la exhaustividad un 20’3%, ambas
favorables al campo de la técnica. La variación en los resultados obtenidos mediante
tesauro es algo más significativa en lo que a índices medios de precisión se refiere (en
los tres primeros servicios de recuperación se obtuvo un promedio del 23’83 % y de un
22’96 en las tres últimas). En consecuencia, las diferencias muestran un 0’87% más de
precisión en el conjunto de las bases de ciencias sociales, superando las del campo de la
técnica a las sociales en tan sólo un 0’6% en lo que respecta a exhaustividad.

Los errores más comunes derivaron de las siguientes razones: a> inadecuada
selección de términos de búsqueda; b) establecimiento de relaciones incorrectas entre los
términos utilizados para preparar las ecuaciones; c) no tener en cuenta la existencia de
polisemia en algunas materias para nosotros del todo desconocidas; d) incluir en las
estrategias algún término incorrecto; e> representar algún concepto de forma demasiado
amplia.

Como consecuencia, se dieron casos de irrelevancia, debido a que se utilizaron


términos de búsqueda que representaban conceptos que no aparecían reflejados en las
referencias recuperadas o que lo estaban de forma marginal Los fallos fueron menos al
emplear tesauros en las estrategias, gracias a que el nivel de precoordinación de todos
ellos fue adecuado haciendo innecesario el uso de recursos sintácticos extra para unir los

384
Capitulo 6

índice de exhaustividad sea superior con el uso del tesauro, lo cual contradice la creencia
generalizada de que en lenguaje libre esta tasa es siempre mayor a la conseguida bajo
control del vocabulario. Si bien a lo largo de la experimentación hubo casos en los que
el uso del lenguaje libre dió un mayor índice de exhaustividad que el tesauro, fueron tan
pocos que sus resultados no son estadísticamente significativos.

En resumen, el test tiende a mostrar que se obtienen mejores resultados en


lenguaje controlado en lo que respecta a ambos índices.

386
Conclusiones
Conclusiones

En este trabajo hemos investigado acerca de los origenes del empleo de los
tesauros en España y establecido la comparación entre el uso del lenguaje libre y el
controlado en Ja fase de recuperación documental. Los objetivos en este sentido fueron
realizar una serie de observaciones o experimentos bajo condiciones reales en seis bases
de datos, durante un período de diez meses. El análisis se centró en valorar las tasas de
precisión y exhaustividad que permiten conseguir ambos tipos de lenguajes.

De los resultados de la investigación se pueden extraer las siguientes conclusiones:

1. Hasta 1982 no se empezaron a elaborar tesauros en España, existiendo hasta


esa fecha un vacío prácticamente total en relación con su construcción y uso en sistemas
documentales. Su desarrollo coincide con la creación de bases de datos, particularmente
en el seno del CSIC, y la necesidad de conectar con Sistemas de Recuperación de
Información internacionales.

2. El índice de utilización de tesauros en bases de datos españolas es bajo debido,


a la falta de adecuación de dichos lenguajes documentales a necesidades específicas, o
simplemente a su inexistencia en áreas temáticas especializadas. En los centros en los que
existen, por ejemplo, listas de descriptores, desearían contar con un tesauro, pero no se
construye porque requiere tiempo y esfuerzo económico que las bases no siempre están
dispuestas a invertir.
Conclusiones

3. Del análisis de los seis tesauros utilizados como muestrá para comprobar su
rendimiento se puede concluir que, cuanto más alto es su nivel de precoordinación,
mayor es la diferencia en favor del tesauro (en relación con el lenguaje libre) en lo que
a tasas de precisión se refiere. Igualmente, gracias a la tasa de precoordinación de los
tesauros, que permitió definir los temas de las preguntas, se recuperaron menos
documentos irrelevantes, es decir se generó menos ruido documental, que con el lenguaje
libre.

4. La baja tasa de equivalencia de algunos tesauros -Electrotecnia (0’ 1) y Medio


ambiente (O’26)- pudo haber influido en las tasas de exhaustividad, ya que son las dos
únicas bases en las que el lenguaje libre supero al controlado en lo que a dicho valor se
refiere.

5. El uso de un vocabulario inadecuadamente específico produce resultados con


bajo nivel de relevancia y afecta a la exhaustividad en aquellos casos en los que no hay
términos para describir conceptos significativos. De hecho, la ausencia de descriptores
genéricos en algunos tesauros parece haber sido la causa por la cual el índice de
exhaustividad utilizando estos lenguajes fue inferior al conseguido con lenguaje libre.

6. Los resultados de la comparación de la efectividad de seis tesauros y el


lenguaje natural en el que se presentan los documentos de seis bases de datos bibliográfi-
cas demuestran que el control del vocabulario es factor determinante del éxito en el
proceso de recuperación de información para lograr altos niveles de precisión; el aporte
de sinónimos y otros términos relacionados con los conceptos de las preguntas mejoraron
este índice en un 23’4% el conseguido mediante lenguaje natural.

389
Conclusiones

7. El tesauro es el lenguaje de recuperación por excelencia en bases de datos


especializadas, superando al libre incluso en Jo que a índices de exhaustividad se refiere.
Este hecho se da de forma particular en bases de ciencia y tecnología, caracterizadas por
una terminología muy consolidada.

Si el lenguaje documental es completo, es decir, si incluye todos los posibles


términos referidos a un mismo concepto, se consigue un elevado nivel de exhaustividad,
en cuyo caso hay poca propensión por parte del usuario a utilizar en la recuperación
términos no recogidos en su corpus. También puede influir en el mencionado resultado
el nivel de consistencia en la indización (la utilización de los mismos términos siempre
en eJ proceso), más probable en bases que emplean descriptores genéricos. La variable
indización no ha sido, sin embargo, tenida en cuenta en este estudio, de modo que sólo
la apuntamos como hipotética causa de influencia en los resultados.

Así pues, en contra de la creencia generalizada de que el empleo del lenguaje libre
aporta más altos niveles de exhaustividad que el de los tesauros en la recuperación, con
este lenguaje documental se consiguieron mejores tasas con el simple recurso de
incorporar descriptores genéricos de partida y todos los específicos que comprenden.
Paralelamente, en libre, la exhaustividad se incrementó usando todos los posibles
sinónimos de los términos de búsqueda.

8. El lenguaje controlado consigue más bajos niveles de ruido que el libre,


particularmente cuando los títulos de los documentos no son representativos de sus
contenidos.

390
Conclusiones

9. La tasa de silencio es muy similar con los procedimientós de búsqueda libre


y controlada. El silencio documental generado en la búsqueda con tesauro tuvo su origen
en la ausencia de descriptores apropiados en casos muy concretos.

10. El control de la sinonimia en búsquedas en lenguaje libre obliga al buscador


a realizar malabarismos linguisticos para encontrar todas las posibles acepciones de un
mismo concepto. Esta situación no se da con el uso de un tesauro, en cuyo índice
sistemático se encuentran todos los descriptores organizados por categoría semántica.

11. El uso del tesauro permite contextualizar los términos de búsqueda evitando
falsas combinaciones que surgen en lenguaje libre, particularmente cuando se han de
emplear términos polisémicos en el proceso.

12. La preparación de ecuaciones se simplifica -cuando se utiliza un tesauro- por


su capacidad de incorporar a la búsqueda términos alternativos que concretan los temas
propuestos en las cuestiones. Esa capacidad de inducción beneficia además la recupera-
ción de documentos relevantes evitando un exceso de referencias inútiles cuyo examen
lleva tiempo. Con lenguaje libre es el propio usuario quien ha de controlar el vocabulario
cada vez que quiere recuperar información. De la experiencia aquí desarrollada se infiere
que este hecho se da especialmente en bases de datos de ciencias sociales, en las que
surgieron más casos de polisemia que en las bases técnicas.

13. El lenguaje libre ofrece la posibilidad de recuperar información muy


especializada y actualizada, cuya terminología o no está incluida en el vocabulario
controlado o no está representada de forma suficientemente específica.

391
Conclusiones

14. Cuando las palabras del lenguaje natural coinciden con lós descriptores o con
los términos componentes de descriptores sintagmáticos, la recuperación con ambos
procedimientos es equivalente, al igual que los resultados.

15. EJ análisis comparativo de uno y otro permite deducir que el Jenguaje


controlado neutraliza las deficiencias del lenguaje libre y viceversa, por lo que los dos
sistemas no sólo no son antagonistas sino que se complementan uno al otro. La lista finita
de descriptores de un tesauro no puede abarcar todos Jos conceptos de que se compone
una disciplina y la inclusión de un campo adicional de palabras clave podría permitir la
identificación de conceptos que no están recogidos en el corpus del tesauro. En muchas
consuJtas (entre otros, este caso se dió, por ejempJo, en Ja base de datos ICYT de
Biología, en la consulta referida a fauna marina) no coinciden los documentos recupera-
dos por medio de ambos lenguajes, siendo, sin embargo, en ambos casos documentos
relevantes los conseguidos, de ahí la conveniencia de utilizar los dos lenguajes en
combinación para no perder información. Ello pone de manifiesto la inconsistencia en la
indización en que, en mayor o menor grado, caen los analistas y productores de datos.

16. Los índices de precisión resultantes con ambos lenguajes tienen diferencias,
en las cuales no ha influido el tipo de base de datos consultada, es decir, no se ha
observado variación sustancial en lo que a este valor se refiere, si se comparan los
resultados obtenidos en bases de datos de ciencia y tecnología o bases de ciencias sociales
y humanidades.

Propuestas:

- Programas automáticos internos de transformación del lenguaje libre en


controlado (por el procedimiento de pregunta-respuesta). Como se procede en traducción

392
Conclusiones

automática, que, por otra parte, debe estar incluida en los programas que proponemos,
porque hay usuarios que buscan información en dos idiomas.

- Ofrecer al usuario formas de presentación de los lenguajes documentales más


fáciles de usar, por ejemplo, interfaces de presentación de tesauros para usuarios más
próximas al lenguaje natural, sin claves internas (TG, TE, etc.), o alternativas de
presentación gráficas.

393
Bibliografía
Capitulo 1. Objetivos, método, fuentes y biblio2rafía

BOSCH GARCíA, C. La técnica de investigación documental. Caracas: Facultad de


Ciencias Económicas, 1972.

CURRAS, E. Documentación y metodología de la investigación científica. Cuaderno


de trabajo. Madrid: Paraninfo, 1985.

ECO, Umberto. Cómo se hace una tesis. Técnicas y procedimientos de estudio,


investigación y escritura. 6~’ ed. Barcelona: Gedisa, 1987.

LASSO DE LA VEGA JIMENEZ-PLACER, J. Técnicas de investigación y


Documentación. Normas y ejercicios. Madrid: Paraninfo, 1980.

LOPEZ YEPES, J. El estudio de la Documentación: bibliografía y metodología


fundamentales. Madrid: Tecnos, 1981.

La aventura de la investigación científica: Guía del investigador y del


director de investigación. Madrid: Síntesis, 1995.

SIERRA BRAVO, R. Tesis doctorales y trabajos de investigación científica. Madrid:


Paraninfo, 1994.

Canítulo 2. El tesauro en el marco de los lenguales documentales

AITCHISON, J. Indexing languages. Classification schemes and thesauri. En L.J.


Anthony, Handbook of Special Libraries and information work. ~a ed. London:
ASLIB, 1982, Pp. 207-261.

AMAT NOGUERA, N. Documentación científica y nuevas tecnologías de la


infonnación. Madrid: Pirámide, 1987.

AMERICAN SOCIETY FOR TESTING AND MATERIALS (ASTM). Thesaurus on


resnurce recovery terminology. Philadelphia: American Society for Testing and
Materials, 1983.

395

.
Bibliografía

AMERICAN NATIONAL STANDARDS INSTITUTE (ANSI). Guidelines for


thesaurusstructure, construction and use, aprovedJuly 10,1973. ANSI-239-19-1974.
New York: ANSI, 1974.

AMERICAN NATIONAL STANDARDS INSTITUTE (ANSI). Guidelines for


tbesaurus: structure, construction and use. (Z 3919-1980). New York: ANSI, 1980.

ARTANDÍ, 5. Coordinate indexing. En Kent, A. y Lancour, 1-1. En: Encycloped¡a of


Library and Information Science New York: Marcel Dekker, 1971, y. 5., Pp. 679-
.

682.

AS IS, M. Símbolos universales para su empleo en tesauros. Revista Española de


Documentación Científica, v.2, 1979, Pp. 39-47.

ASSOCIATION FRAN%JSE DE NORMALISATION (AFNOR). Thesaurus


monolingues et multiingues. Simbolisation des relations (norme experimental). NF
Z47-103. Paris: La Defense, 1978.

ASSOCIATION FRANCAISE DE NORMALISATION (AFNOR). Regles


d’etablissement des thesaurus en langue fran~aise. Paris: AFNOR, 1973.

AUSTíN, D. Vocabulary control and information technology. ASLIB Proceedings, y.

38, n0 1(1986) Pp. 1-15.

AUSTíN, D. y WATERS, J. Guidelines for the Establisbment and Development of


Multiingual Thesauri. Revised text. London, Paris: UNESCO, The British Library,
1980.

AUSTíN, D. y DALE, P. Guidelines for the establishment and development of


monolingual thesauri. 2~ ed. rey. (PGI/81WS). Paris: UNESCO, 1981.

AUSTíN, D.; DALE, P.; UNESCO. Directrices para el establecimiento y desarrollo


de tesauros monolingúes. 2nd ed. rey. Paris: Unesco, 1984.

AVRAMESCU, A. Probabilistic criteria for the objetive design of descriptor languages.


Journal of the American Society for linformation Science. y. 22, n0 1 (1971) pp. 85-
95.

BLAGOEN, J. Management Information Retrieval: A new indexing language.


London: British Institute of Management, 1969.

396
Bibliografía

BRITISH STANDARD INSTITUTION (BSI). Guidelines for tbe establishment aud


development of multilingual tbesauri. Norma 5723. London: BSI, 1979.

BRITISH STANDARD INSTITUTION (BSI). Guidelines for the establishmnent and


development of monolingual tbesauri. Norma 5723. London: BSI, 1979.

BUREAU MARCEL VAN DIJK. Definition of Thesauri Essential Character¡stics. 2


vol. Brussels, 1976.
COYAUD, M. Introduction á l’étude des langages documentaires. Paris: Klincksieck,
1966.

CURRÁS, E. Thesauros. Lenguajes tenninológicos. Madrid: Paraninfo, 1991.

CHAUMIER, 1. Análisis y lenguajes documentales: El tratamiento lingúístico de la


información documental. Barcelona: Mitre, 1986.
CHAUMIER, J. y FOURTEAU, P. Le traitement des thesaurus a schemas fleches para
I’informatique graphique interactive. Documentaliste, y. 16, n0 1 (1979) Pp. 9-14.
CREN, FI. [etal]. Automatic thesaurus generation for an electronic community system.
Journal of the American Society for Information Science, 46, 3, Apr (1995), Pp.
175-93.

DAHLBERG, 1. Concerning thesaurus terminology. International Classification, y. 2,


nov. (1975> Pp. 111-112.

The Broad System of Ordering (BSO) as a Basis for an Integrated Social


Sciences Thesaurus?. International Classification, y. 7, n’~ 2 (1980) pp. 66-72.

DEVADASON, F.J. [et al]. Computer generation of thesaurus from structures subject-
prepositions. Information Processing & Management, n0 17, (1981) Pp. 1-11.

DIEMER, A. Classification, thesaurus and what next? The problem of the “third
generation’ in documentation and information. Nachrichten flir dokumentat¡on, y. 23
(1972) Pp. 52-57.

DILLON, M.; CAPLAN, P.A. A technique for evaluating automatic terms clustering.
Journal of th American Society for linformation Science, 31, 2 (1980) pp. 89-96.

397
Bibliografía

EUROPEAN ATOMIC ENERGY COMMUNITY (EURATÓM). EURATOM


thesaurus., 2 y., »~ ed. Bruselas: European Atomic Energy Commnunity (EURATOM),
1967.

FOSKETT, D.J. Thesaurus. En Encyclopedia of Library and Information Science, y.


30 New York: Marcel Dekker, 1980, pp. 416-463.
.

FOSKETT, A.C. Postcoordinate indexing systems. En Foskett, A.C. The subject


approach to information. London: Clive Bingley, 1996, Pp. 379-440.

FREEDMAN, B. Thesauri for vocabulary control. Drexel Library Quarterly, y. 8


(1972) Pp. 125-128.

FUGMANN, R. The glamour and the misery of the thesaurus approach, y. 4: On


informacion retrieval cheory. International Classification, y. 1, n0 2 (1974) pp. 76-86.

GANZMANN, J. Criteria for the evaluation of thesaurus software. International


Classification, y. 17, n0 3-4 (19%) Pp. 148-157.

GARCÍA GUTIÉRREZ, A. Lingilística documental: Aplicación a la documentación


de la comunicación social. Barcelona: Mitre, 1984.
GARCíA GUTIERREZ, A. y LUCAS FERNANDEZ, R. Documentación automatizada

en los medios informativos. Madrid: Paraninfo, 1987.

GILCHRIST, A. Tbe thesaurus lix retrieval. London: ASLIB, 1971.

The role of thesauri in mechanized systems. Indexer, n0 9, Oct. (1975) pp. 146-
154.

HAYNES, D. Thesaurus construction using a micro. Library Micromation News, n0


13 (1986) Pp. 8-12.

HINES, T. C. y HARRIS, J.L. Columbia University School of Library Service system


for thesaurus development and maintenance. Information Storage and Retrieval, y. 7,
n0 1(1971) Pp. 39-50.

INFOTERM. International Bibliography of Standardized and Non-Standardized


Guidelines for Terminology. International Classification, y. 8, n0 2 (1981) Pp. 98-lOO.

398
Bibliografía

INTERNATIONAL ORGANIZATION FOR STANDARDIZATION. (150). Guidelines


for Une Establishment and Development of’ Monolingual Thesauri (2788). Geneva:
ISO, 1974.

Directrices para el establecimiento y desarrollo de tesauros monolingúes PNE


50.106, ISO 2788-1986 (E), parte 1, Revista Española de Documentación Científica,
y. 12, n
0 4 (1989) pp. 463-483.

Directrices para el establecimiento y desarrollo de tesauros monolingúes PNE


50.106, ISO 2788-1986 (E), parte 2, Revista Española de Documentación Científica,
y. 13, n0 1(1989) Pp. 601-629.

Guidelines for the Establisbment aud Development of Multilingual


Tbesauri (5964). Geneva: 150, 1985.

Thesaurus ISO. 3 y. Ginebra: ISO, AFNOR, 1976.

ISONET indexing handbook. Ginebra: ISO, 1978.

JEREZ, R. y RIOS, A. Los lenguajes documentales en España. Documentación de las


Ciencias de la Información, n0 2 (1978) Pp. 33-37.
IONES, K.S. Automatic thesaurus construction and the relation of a thesaurus to
indexing terms. ASLLB Proceedings, y. 22, n0 5 (1970) Pp. 226-228.
JONES, 5. A thesaurus data model for an intelligent retrieval system. Journal of
Information Science. y. 19, n0 3 (1993) Pp. 167-178.
KAZLAUSKAS, E.J.; HOLT, T.D. The application of a minicomputer to thesaurus
construction. Journal of the American Society for Information Science, 31, 5 (1980)
pp. 363-368.

KLE1NBART, P. Prolegomenon to ‘intelligent” thesaurus software. Jaurnal of


Information Science, 11. 2 (1985) pp. 45-53.

KROOKS, D.A. & LANCASTER, F.W. The evolution of guidelines for thesaurus
construction. Libri, 43, 4, Oct-Dec (1993), Pp .326-42.

LANCASTER, F. W. Vocabuíary control for information retrieval. Washington:


information Resource Press, 1972.

399
Bibliografía

Thesaurus construction and use: acondensed course. Paris: Unesco, 1985.

El control del vocabulario en la recuperación de información. Valencia:


Universitat, 1995.

LAUREJLHE, M.T. Le thesaurus, son róle, sa structure, son elaboration. Y’ ed.


Villeurbanne: Presses de l’E.N.S.B, 1981.
LORCH, W.T. International guidelines for thesauri: a description of the third Unesco
draft. Nachrichten fiAr dokumentation, y. 21(1970) Pp. 72-75.

MACCAFFERTY, M.A. Thesauri and thesauri construction. London: ASLIB, 1977.

MAIXNER, y. Towards compensation laws in constructing thesauri. Information


Storage and Retrieval, y. 6, n0 4 (1970) pp. 383-385.

MANIEZ, J. Lenguajes documentales y de clasificación: Concepción, construcción,


y utilización en los sistemas documentales. Madrid: Fundación Germán Sánchez
Ruipérez, 1992.

NEELAMEGHAN, A. Non hierarchical associative relationships: their types and the


compuwer generation of TR links. En: Seminar on tbesaurus iii information systems.
Bangalore, December 1-5, 1975, pp. Al-AS.

RICHMOND, P.A. A~ thesaurus within a thesaurus: a study in ambiguity. En: Towards


a theory of librarianship: papers lix honour ofJesse Hauk Sbera. (Conrad H. Rawski,
ed.). Metuchen, N.J.: Scarecrow Press, 1973, Pp. 268-301.

RODRIGUEZ DELGADO, R. Uso de descriptores y tesauros. Santiago de Chile:


CEPAL-CLADES. 1971.

Teoría de sistemas y tesauros facetados. Revista Española de Documentación


Científica, y. 1, n0 3 (1978) pp. 213-224.

Unificación de lenguajes documentarios. Bases para la creación de tesauros


comunes en español. Boletín de la ANABAD, y. 28, n0 4 (1978) pp. 57-63.

Towards the integration of Decimal Classification and Thesauri concepts. En


Taylor, P. J., editor. En: New trends in documentation and information. Proceedings
of the 39th FID Congress. London: ASLIB, 1980, Pp. 277-294.

400
Bibliografía

La integración de Jos Jenguajes documentarios, fin de BabeJ. Revista


Española de Documentación Científica, y. 4, n0 3 (1980) Pp. 333-34 1.

ROHOU, C. La gestion automatisée des thesaurus: étude comparative de logiclels.


Documentaliste. y. 24, no 3, May June (1987), Pp. 103-108.

ROLLING, L.N. The role of graphic display of concept relationships in indexing and
retrieval vocabularies. En: Classification research: Proceedings of tbe second
international study conference (Pauline Atherton, ed.). Munksgaard, Copenhagen.
1965, pp. 295-320.

ROLLING, L.N. Compilation of thesauri for use in computer systems. Information


storage and retrieval, no 6 (1970) Pp. 101-350.

SALTON, G. Experiments in automatic tbesaurus construction for information


retrieval. Information storage and retrieval. Ithaca, NY: Cornelí University,
Department of Computer Science, 1971.

SHEPHERD, M. & WATTERS, C. Coniputer generation of thesaurus. Library Sc¡ence


with a Slant to Documentation (Thesaurus Ser. 1), n0 12, June (1975) Pp. 40-54.

SHILL, D.A. The role of a thesaurus in information retrieval. Management Datamatics,


y. 4, Feb. (1975) Pp. 9-15.

SLYPE, G. van. Los lenguajes de indización: Concepción, construcción y utilización


en los sistemas documentales. Madrid: Fundación Germán Sánchez Ruipérez, 1991.

SOERGEL, D. Indexing languages and thesauri: Construction aud maintenance. Los


Angeles: Melville, 1974.

SOMERS, H.L. Observations on standards and guidelines concerning thesaurus


construction. International Classification, no 2 (1981) pp.69-74.

TAUBE, M. Notes on the use of roles and links in coordinate indexing. American
Documentation, y. 12, n0 2 (1961) Pp. 98-100.

TDCK Circular Thesaurus System. The Hague: Wetenschappe¡ijk en Technich


Documentatie-en Informatiecentrum voor de Krijgsmacht, 1963.

401
Bibliografía

TIIESAURUS URiBAMET. 6~’ ed. Paris: Ministére de 1 ‘Equipemént des Transports et


du Tourisme; Council Régional d’ ile-de-France, 1993.

UNITED NATIONS ECONOMIC AND SOCIAL COUNCIL. Use of descriptors and


thesauri. New York: United Nations Economic Commission for Latin America, 1971.

UNESCO; LANCASTER, L.W. Tbesaurus construction and use: A condensed course.


Paris: Unesco, 1985.

URBAN Thesaurus. Kent, Ohio: Kent State University, Cerner for Urban Regionalism,
1968.

UNISISTGuidelines for tbe Establishment and development of Multilingual Thesauri


(PGI-8O/ws/12). Revised edition. Paris: Unesco, 1980.

UNISIST Guidelines for the Establisbment and development of Monolingual


Tbesauri (PGI-81/ws/15). Revised edition. Paris: Unesco, 1980.

WILLETTS, M. Investigation of the nature of the relation between terms in thesauri.


Journal of Documentation, y. 31, n0 3, September (1975) Pp. 158-184.
WOLFF-TERROINE, M. “A macrothesaurus. Why? How?. En: Ordering Systems for
Global Information Networks. Edited by A. Neelameghan. Bangalore, India:
International Federation for Documentation, 1979, Pp. 431-436.

Capítulo 3. Evolución histórica de los tesauros

AA, H.J. van der. Thesaurus bibliography. Amsterdam: Studiecentrum NOVI, 1977.
AARON, K. Tbesauri bibliography. Haifa: Elyachar Library, Technion Israel Institute
of Technology, 1975.

AENOR. Documentación. Tomo 2 Normas fundamentales. Madrid: Aenor, 1994.

AITCHISON, J. The EUDISED thesaurus: a preliminary appraisal. Educational


Libraries Bulletin, y. ¡8 (1975) pp. 12-25.

402
Bibliografía

Tesauro de la Unesco. 2 y. Paris: UNESCO, 1984.

Integration of thesauri in the Social Sciences. International Classification, y.

8, n 0 2, Pp. 75-85.

The Thesaurofacet: a multipurpose retrieval language tool. Jaurnal of


Documentation, y. 26, n0 3 (1970) Pp. 187-203.

AITCHISON, J. [et al]. Thesaurofacet: A thesaurus and faceted classification for


engineering and related subjects. Whetstone: English Electric Co., 1969.

AITCHISON, J. y ALLEN, C.G. Bibliografía de vocabularios, tesauros,


encabezamientos de materia y esquemas de clasificación de las Ciencias Sociales.
Paris: UNESCO, 1983.

AITCHISON, J, GOMERSALL, A. y IRELAND, R. Thesaurofacet: A thesaurus and


faceted classification for engineering and related subjects. Whetstone: The English
Electric Company, 1969.

AITCHISON, J.; SMITH, 1. A. y THOMPSON, 5. Thesaurus on Youth: an integrated


classification and thesaurus for youth affairs and related topics. Leicester: National
Youth Bureau, 1981.

ALVES, S.C.; BASILIO, M.B.; BASTOS, 5. Tesauros, bibliografia, 1970-1982.


Brasilia: IBICT, 1983.

AMERICAN INSTITUTE OF CHEMICAL ENGINEERS. Chemical engineering


thesaurus; a wordbook for use with the concept coordination system of information
storage and retrieval. New York: American Institute of Chemical Engineers, 1961.

ARMED SERVICE TECHNICAL INFORMATION AGENCY, ARLINGTON,


VIRGINIA. Thesaurus of Astia Descriptors. 2nd. ed. Arlington, Virginia: Astia, 1962.

ARNTZ, R. & PICHT, FI. Introducción a la terminología. Madrid: Fundación Germán


Sánchez Ruipérez, 1995.

ASSOCIATION FRANCAISE DE NORMALISATION (AFNOR). Thesaurus


international tecbnique. Noriane, bonet, bases de donnés normatives. Additif
cumulatif, n’> 2. Version franqaise. Paris: La Defense, 1987.

403
Bibliografía

BALTZ, C.F. Tbe need for a thesaurus in automated information retrieval. New
York: Owego; IBM, 1962.
BARHYDT, G.T. & SCHMIDT, C.T. Inforniation Retrieval Thesaurus of Education

Temis Cleveland (Ohio): Case Western Reserve University, 1968.

BASE de datos Thesauri/ditribuida por ECHO.

BASILIO, M.B.; BRANCHER, M.; FERRAZ BARBOZA, E.M.; TESAUROS


bibliografia, 1983-1984. Brasilia: Ibict, 1985.

BECK, H. Book review of International Classification and bidexing Bibliography.


V.L: Classification system and tbesauri 1950-1982. Frankfurt: Indeks Verlag, 1982.

BERNIER, C.L. Correlative indexes U: Correlative trope índexes. American


Documentation, y. 8 (1957) Pp. 103-122.

BERNIER, C.L. & HEUMANN, K.F. Correlative indexes III: semantic relations among
sermanternis -the technical thesaurus. American Documentation, y. 8 (1957) Pp. 211-
220.

BERTRAND-GASTALDY, 5. & DAVIDSON, C.H. Improved design of graphic


displays in thesauri through technology and ergonomics. Journal of Documentation,
-

y. 42, n
0 4 (1986) pp. 225-251.

BETZ PARKER, Elisabeth, comp. LC thesaurus for graphics materials: Topical temis
for subject access. Washington: Library of Congress, 1987.

BIBLIOGRAFIA de vocabularios, tesauros, encabezamientos de materia y esquemas


de clasificación de ciencias sociales (mono y plurilinglies). ¡preparado por la biblioteca
ASLIB en colaboración con Jean Aitchison y C.G. Alíen. Paris: Unesco, 1982.

BIBLIOGRAPHIE des tbesaur¡ et index par matiéres parus depuis 1960: extraits dii
bulletin des bibliotheques de France 1969-1974. /par Marie Thérese Laureilhe. Paris:
Bibliothéque Nationale, 1975.

BIiBLIOGRAPHY of United Nations Tbesauri, classifications, nomenclatures.


Genéve: Inter-Organization board for information systems, 1979.

404
Bibliografía

BLAGDEM, J.F. Thesaurus compilation methods. A literature review. Aslib


Proceedings, y. 20, n0 8 (1968) pp. 345-359.

BO[SSIÉRE, P. Dictionnaire analogique de la langue fransaise, Répertoire complet


des MOTS par les IiDÉES et des IL)ÉES par les MOTS. Paris: Aug. Boyer et Ce.,
Libraires-Éditeurs. 1862.

BOLL, J.J. From subject headings to descriptors: the hidden trend in Library of
Congress Subject Headings. Cataloguing and Classification Quarterly, y. 1(1982) Pp.
3-28.

BRITISH STANDARD INSTITUTION (BSI). BSI Root tbesaunus. 2 y. London: BSI,


1981.

BROWNSON, ¡-1. Proceedings of the international study conference on classification


for information retrieval. Aslib, 1957, pp. 99-100.

BUCHANAN, B. A glossary of indexing terms. London: Clive Bingley, 1976.

BUREAU NATIONAL D’INFORMATION SCIENTIFIQUE ET TECHNIQUE.


Annuaire des thésaurus suivi d’un índex des domaines et sous-domaines couverts par
les tbésaurus et d’une Liste des Organismes auteurs. Y’ ed. Paris: Comité de
Coordination des Thesaurus Sectoriels, 1975.

CABRE CASTELLVI, T. La terminología: Teoría, metodología, aplicaciones.


Barcelona: Edit. Empúries, 1883.

CURRÁS, E. Sistemas mecanizados de almacenamiento y recuperación de lenguajes


gráficos y científicos. Su aplicación en los países de habla hispana. Revista Española de
Documentación Científica, y. 4, n0 2 (1981) pp. 91-110.

Tratado sobre Ciencia de la Información. Rosario (Argentina): Universidad


Nacional, 1996.

CASARES, J. Nuevo concepto del Diccionario de la Lengua, y otros problemas de


Lexicografía y Gramática. Tomo V de las Obras completas. Madrid: Espasa Calpe,
1941.

CASARES, J. Diccionario ideológico de la lengua española. Barcelona: Gustavo Gili,


1984.

405
Bibliografía

CATÁLOGO de recursos terminológicos detectados en España. Antony (Francia):


Unión Latina/ICYT, 1995.

CENTRO DE ESTUDIOS Y EXPERIMENTACIÓN DE OBRAS PÚBLICAS.


Departamento de Información y Documentación. Tesauro DIC. Madrid: Centro de
Estudios y experimentación de Obras Públicas, 1982.

COMMISSION DES COMMUNAUTES EUROPEENES. ASTUTE. AutomatedSystem


for theaunus updating, testing and editing. Bruxelies: CEE, 1976.

COMMISSION OF THE EUROPEAN COMMUNITIES. Thesaurus guide. Analytical


directory of selected vocabularies for information retrieval. Amsterdam: North-
FIolland, 1979.

COSTELLO, J.C. Uniterm indexing: principIes, problems and solutions. American


Docwnentation, y. 12. n0 1 (1961) Pp. 20-26.

Coordinate indexing. New Brunswick: Graduate SchooJ of Library Service,


1966.

COVARRUBIAS OROZCO, 5. de. Tesoro de la lengua castellana o española. Madrid:


Por Luis Sánchez, 1611.

CHAN, L.M. & POLLARD, R. Tbesauri used iii online databases: An Analytical
Guide. New York, etc: Greenwood Press, 1988.

DAHLBERG, 1. Reference Tools and Conferences in Classification and Indexing,


International Classification and Indexing Bibliography. V. 2. Frankfurt: lndeks
Verlag, 1984.

The International Classification and lndexing Bibliography (ICIB) and its


classification systems. International Classification y. 12, n0 3 (1985) Pp. 143-152.

DICCIONARIO de la lengua castellana, en que se explica el verdadero sentido de


las voces, su naturaleza y calidad, con las pbrases o modos de hablar, los proverbios
o refranes, y otras cosas convenientes al uso de la lengua. Madrid: En la Imprenta de
Francisco del Hierro, Impresor de la Real Academia Española, 1739.

DOGGEN, J. e ILJON, A. ASTUTE. Automated system for thesaunus updating,


test’ng and editing. Luxemburgo: Comisión de las Comunidades Europeas, 1976.

406
Bibliografía

ENCICLOPEDIA universal ilustrada europeo americana. Madrid: Espasa Calpe.


1928.

ENGINEERS JO[NT COUNCIL, NEW YORK. First Revision of the Tbesaurus of


Astia Descriptors. Final report on Contract AF 18(600)1944: Office of Technical
Services AD-278, 168, E. Wall, Arlington, Va.: Astia, 1962.

ESPAÑA. Ministerio de Educación y Ciencia. LEDA Thesaurus [inédito], 1982.

FEDERATION INTERNATIONALE DE DOCUMENTATION (FID). Bibliography of


thesauri and controlled vocabularies. La Haya: FID, 1977.

FEDERATION INTERNATIONALE DE DOCUMENTATION (FID). Documentación.


Directrices para el establecimiento y desarrollo de tesauros monolingues. Bogotá:
FID/CLA, 1980.

FELBER, FI; UNESCO. Terminology manual. Paris: Unesco, 1984.

FIELD, B.J.; INSTITUTION OF ELECTRICAL ENGINEERS. Semi-automatic


development of thesauri using free-language vocabulary analysis. London: The
Institution of Electrical Engineers, 1975.

FUNDACION DE LA RED DE INFORMACION CIENTIFICA (FUINCA). Catálogo


de bases de datos españolas. Madrid: FUINCA, 1985.

FURTFI, S.E. Luhn, Hans Peter. En: ALA World Encyclopedia of Library and
Information Services. 2nd. ed. Chicago: ALA, 1983.

GALINDO, E. Thesaurus jurídico inteligente. En Actas de las Segundas Jornadas


Españolas de Documentación Automatizada. Málaga: Consejo Superior de
Investigaciones Científicas, 1986, Pp. 471-482.

GARCÍA GUTIÉRREZ, A. Los lenguajes documentales. En: Fundamentos de


información y documentación, comp. J. López Yepes. Madrid: Eudema, 1990.

GAUDENZI, N. Thesaurus: an ancient term for a modern documentation tool. Bolietino


mf. Doc., y. 13, n0 1/4 (1974) pp. 13-22

GILBERT, V. A list of thesauri and subject headings held in the ASLIB library. ASLIB
Proceedings, y. 31, n0 6 (1979) pp. 264-274.

407
Bibliografía

GORKOVA, V.I.; INTERNATIONAL FEDERATION OF DOCUMENTATION


(F[D/DT>; ALLUNIONSINSTITUTFURWISSENCHAFTLICHEUNDTECHNISCHE
INFORMATION (VINITI). Essential problenis in terminology for Informat¡cs and
Documentation. Frequency temis lists. Moskva: VINITI, 1982.

GUINCHAT & SKOURI. Guide pratique des techniques documentaires. Paris:


EDICEF, 1989.

FIOLM, B.E. y RAMUSSEN, L.E. Development of a technicaí thesaurus. American


Documentation, y. 12, July (1961) pp. 184-190.

INDEKS GMBH; FÉDÉRATION INTERNATIONAL DE DOCUMENTATION (FID>.


Classification systems and tbesauri 1950-1982. Frankfurt: Indeks Verlag, 1982.

INFOTERM, International Information Center for Terminology. Terminologies for tbe


Eighties. Mtinchen: K.G. Saur Verlag, 1984.

INFOTERM; KROMMER-BENZ, M. Networking in terminology. International


Cooperation in terininology work. Proceedings of the second Infoterm Symposium,
Vienna, 14-17 April 1985. Múnchen: K.G: Saur Verlag, 1986.

INSTITUTE FOR SCIENTIFIC, TECHNICAL AND ECONOMIC INFORMATION


([INTE). Bibliographic Bulietin of the Clearinghouse IINTE. Suplement 1980.
Warszawa: IINTE, 1981.

INSTITUTO DE CIENCIA Y TECNOLOGíA (ICYT). Tesauro SPINES 2 y.(Versión


provisional, sujeto a revisión). Madrid: Consejo Superior de Investigaciones Científicas,
1985.

INSTITUTO EDUARDO TORROJA DE LA CONSTRUCCIÓN Y EL CEMENTO.


Léxico de la construcción. Madrid: I.E.T.C.y C., 1968

INTERNATIONAL BUSINESS MACHINES CORPORATION. Technical Infor-


mation Center mesaurus. New York: IBM, 1964.

INVENTARIO de lenguajes documentanos no tradicionales en lengua castellana y/o


portuguesa/. Grupo de trabajo sobre lenguajes documentarios Reuniber 78. Buenos
Aires: (impreso en el ICYT, Madrid), 1981.

408
Bibliografía

IRAZAZABAL NERPELL, A. de. La terminología ¿por qué?. En U Encuentro


Hispano-Luso de Investigación Científica y Técnica. Marzo 1988, Pp. 323-330.

Aplicación de la cadena de elaboración y desarrollo de tesauros en un


microordenador a la construcción del tesauro de la programación (1987-1988> del CSIC.
En: Terceras Jornadas Españolas de Documentación Automatizada. Palma de
Mallorca: Consejo Superior de Investigaciones Científicas, 1990, pp. 876-889.

La terminología científica. Su enseñanza en lengua española. Política


científica, y. 38, nov. (1993> Pp. 52-58.

IRAZAZABAL NERPELL, A. de; ALVAREZ 5., ORTIZ, M.C. y ZARCO, J.


Inventario automatizado de recursos terminológicos en lengua española y portuguesa. En
Actas de las Segundas Jornadas Españolas de Documentación Automatizada.
Málaga: Consejo Superior de Investigaciones Científicas Málaga: Consejo Superior
.

de Investigaciones Científicas, 1986, pp. 111-124.

IRAZAZABAL NERPELL, A. de., ALVAREZ 5., ORTIZ, M.C. y ZARCO, .1.


Catálogo de recursos terminológicos en lengua española. Madrid: ICYT, 1987.

IZQUIERDO ARROYO, J.M. & MORENO FERNÁNDEZ, L.M. Listas de


encabezamientos de materia y Thesauri en perspectiva comparada. Documentación de
las Ciencias de la Información, n0 17 (1994).

iONES, K.S. Compound words: a problem in postcoordinate retrieval systems. Jaurnal


of the American Society for Information Science, y. 22, n0 4 (1971) Pp. 242-250.

Automatic keyword classification for information retrieval. London:


Butrerwords, 1971.

Some thesauric history. ASLTIB Proceedings, y. 24, Jul. (1972) Pp. 400-4 11.

Linguistics and information science. New York and London: Academic


Press, 1973.
JOYCE & NEEDHAM. The thesaurus approach to information retrieval. American
Documentation n0 9 (1958) Pp. 192-197.

409
Bibliografía

KAZLAUSKAS, E. y HOLTZ, T. The application of a minicoinputer to thesaurus


construction. Journal of the American Society for Information Science, y. 3 1, n0 5
(1980) Pp. 363-368.

KLEINBERT, P. Prolegomenon to “intelligent” thesaurus software. Journal of


Information Science, y. 11, n0 2 (1985) Pp. 45-53.

LAFUENTE CASTAÑEIRA, 1. El concepto de tesauro en España ayer y hoy: 1970-


94. Proyecto de investigación dirigido por la Dra. Emilia Currás. Curso de Especialista
Universitario en Documentación Pedagógica 1994/95. Facultad de Ciencias de la
Educación. Universidad Complutense de Madrid.

LAGUNA SERRANO, E.; IRAZAZABAL NERPELL, A. de y VALLE BRACERO,


A. Confección automática de tesauros. Revista Española de Documentación Científica,
y. 12, n0 2 (1989) Pp. 129-140.

LANCASTER, F.W. Vocabulary control in information retrieval systems. Advances in


librarianship, n0 7 (1977).

LASSO DE LA VEGA JIMÉNEZ-PLACER. Organización de la Documentación por


palabras y descriptores específicos de materia: Los Thesaurus. Racionalización, n0 6
(1966) pp. 433-445.

LAUREILFIE, M.T. Bibliographie courante des Thesauri et index par matiéres. Bulletin
des Bibliothéques de France, n0 3 (1982).

LAUREILHE, M.T. Essai de bibliographie des thésauri et index par matiéres parus
depuis 1960 (jusqu’á Mars 1969). Bulletin des Biblioth~ques de France, y. 14, n0 5
(1969) Pp. 203-218.

LUFIN, H.P. A new method for recording and searching information. Documentation,
y. 4, n0 1(1953> Pp. 14-16.

A Statistical Approach to Mechanised Literature Searching. New York:


IBM Research Center, 1957

Keyword in Conten Index for technical literature. New York: IBM, 1959.

Auto-encoding ofdocuments for information retrieval systems. Modern trends


in docwnentation. Pergamon Press, 1959, pp. 45-58.

410
Bibliografía

MARCUS, R.S. An automated expert system for information retriéval. Proceed¡ngs of


the 44th Annual ASíS Meeting 18 (1981) pp. 270-273.

MIYAJIMA, T. A study of specialized terminolgy: the problem of technical terms.


International Classification, y. 9, n0 3 (1982) pp. 152-154.

MOOERS, C. Zatocoding and developments in Information Retrieval. Aslib


Proceedings, y. 8 (1956) Pp. 1-20.

MOSQUERA MARTíNEZ, R.; RODRíGUEZ MARTIN, F. y MOLOWNY GOMEZ,


1. Tesauro de drogodependencias. Cuadernos Técnicos de Estudios y Docwnentación.
Madrid: Ministerio de Sanidad y Consumo. Monografía n0 ti de Comunidad y drogas,
Junio 1990.

NACIONES UNIDAS. UNBIS tbesaurus. Edición francesa, lista Érilingúe. New York:
Naciones Unidas, 1986.

NATIONAL AERONAUTICS AND SPACE ADMINISTRATION (NASA). NASA


thesaurus: subject terms for indexing scientific and teclmical information. 3 y.
Washington: NASA, 1967.

NEDOBITY, W. Terminology and artificial inteligence. International Classification,


12, n0 1 (1985) Pp. 17-19.

OFICINA INTERNATIONAL DEL TRABAJO (OIT). Tesauro OIT. Terminología de


trabajo, empleo y formación. Multilingúe (inglés, francés, español>. Y’ ed. Ginebra:
OIT, 1978.

OKLA UNIVERSITY, TULSA. Exploration and production thesaurus; listing of


scientific and engineering terms and their relationship for use in vocabuíary control
in indexing and retrieving Petroleum Abstracts. Tulsa: Okla University, 1965.

OLMEDO, M.I. [etal]. Bibliografía comentada sobre lenguajes de indización y


automatización. Revista Española de Documentación Científica, 10, 4 (1987) pp. 453-
471.

ORGANIZACION PARA LA COOPERACION Y EL DESARROLLO ECONOMICO


(OCDE). Macrothesaurus: A basis list of Economic and Social Development terms.
Paris: OCDE, 1972.

411
Bibliografía

ORGANIZACION PARA LA COOPERACION Y EL DESARROLLO ECONOMICO


(OCDE>. International road researcb documentationthesaurus (IRRD). Paris: OCDE,
1972.

PÉREZ ALVAREZ-OSSORIO, J.R.; RIUDAVETS MONTES, A.; VALLE BRACERO,


A. Cambio automático de lenguaje pivote en un tesauro multilingúe informatizado. En:
Actas de las Primeras Jornadas Españolas de Documentación Automatizada. Madrid:
20-21 Nov. 1984. Madrid: Consejo Superior de Investigaciones Científicas, 1984,
PP .601-622.

PULP AND PAPER RESEARCH INSTITUTE OF CANADA. Thesaurus of pulp and


paper terms; a list of keywords with tbeir cross-relationships for use in indexing and
retrieving information on pulp and paper technology. Point Claire, Quebec: Pulp and
Paper Research Institute of Canada, 1965.

RIZZO, 5. Bibliografia internazionale di thesauriulnternational bibliography of


thesauri. Roma: Camera dei Deputati, 1987.

ROBERTS, N. The prehistory of the information retrieval thesaurus. Journal of


Documentation, y. 40, n0 4 (1984> Pp. 271-285.

ROGET, P. M. Roget’s International Thesaurus. 4~’ ed revised by Robert L. Chapman.


New York, etc.: Harper Collins Publishers, 1977.

SANCHO LOZANO, R. Los tesauros de términos científicos y técnicos en general, y


especialmente los relativos a la química (revisión bibliográfica). Revista Española de
Documentación Científica, y. 8, n0 1 (1985) pp. 17-55.

SCHULTZ, C.K., ed. H.P. Lubn: Pioneer in Information Science. New York: Spartan
Books, 1968.

SVENONIUS, E. Design of controlled vocabularies in the context of emerging


technologies. Library Science with a slant to Documentation, y. 25, n0 4, Dec (1988)
pp. 215-227.

TAUBE, M. Storage and retrieval of information by means of association of ideas.


American Documentation, n0 6 (1955>.

Emerging solutions for storage and retrieval of information. Documentation


Inc., 1959, pp. 112-140.

412
Bibliografía

THIESAIJRI and thesauri construction ¡compiled by Mexine Mac Cafferty. London:


ASLIB, 1977.

TRESAURI rela~ao bibliografica /Centro de Documenta~ao cientifica ultramarina/Junta


de InvestigaQoes de ultramar. Lisboa: Centro de Documentagao Cientifica, 197 1-1977.

THESAURUS guide: Analytical directory of selected vocabularies for information


retr¡eval/ prepared by Gesells Chaft fiAr information und dokumentat¡on for the
Commission of the European Communities. Amsterdam; North FIolland; Luxeúibourg:
Office for Official Publications of the European Communities, 1985.

THESAURUS of Eng¡neers Terms. New York: Engineers Joint Council, 1961.

THESAURUS Textil Internacional. Tarrasa: Escuela Técnica Superior de Ingenieros


Industriales, 1971.

TINKER, L. An annotated Bibliography of Library Automation 1968-1972. London:


Aslib, 1973.

UNESCO. Bibliografía de vocabularios, tesauros, encabezamientos de materias y


esquemas de clasificación de Ciencias Sociales (Mono y Phurilinglies). Paris:
UNESCO, 1982.

UNESCO. SPINES thesaurus: a controhled and structured vocabulary of science ¿md


technology for pohicy-making, management and development, 3 y. Paris: UNESCO,
1976.

U.S. DEFENSE DOCUMENTATION CENTER. ASTIA chemical thesaurus.


Springfield, Virginia: U.S. Defense Documentation Center, 1962.

Thesaurus of ASTIA descriptors. Springfield, Virginia: U.S. Defense


Documentation Center, 1964.

U.S. RECLAMATION SERVICE. Thesaurus of descriptors; a list of keywords and


cross-references for indexing and retrieving the literature of water resources
deveíopment. Denver: U.S. Reclamation Service, 1964.

VICKERY, B.C. Thesaurus: a new word in documentation. Journal of Documentation,


y. 16, n
0 4 (1966) Pp. 181-189.

413
Bibliografía

WALL, E. A practical system for documenting building research; Documentation of


buulding science literature, pub. 791 (1960) p. 15: US Senate Report, S6th Congress,
2nd Session, Document n0 113, 1960.

WALL, E. Symbiotic development of thesauri and information systems: A case history.


Journal of the ASíS, y. 26, March-April (1975) Pp. 71-79.

WELLISCH, H.H. Indexingandabstracting: acurrentawareness bibliography. Indexer,


y. 15, n0 1, Pp. 29-36.

Capítulo 4. La recuperación de información

ADAMS, R. Comunicaciones y acceso a la información en la biblioteca. Madrid:


Fundación Germán Sánchez Ruipérez/Pirámide, 1994.

AMAT NOGUERA, N. La documentación y sus tecnologías, Y’ ed. Madrid: Pirámide,


1995.

ARENAS ALEGRÍA, L. Efectividad y dinamismo en la recuperación documental


mediante análisis cluster. Tesis doctoral, Universidad de Deusto, 1991.

BARES, M. La búsqueda documental en el contexto telemático: Modalidades de


automatización y utilización de bases de datos. Madrid: Díaz de Santos, 1988.

BOOKSTEIN, A. Implication of boolean structures for probabilistic retrieval:


researcb and development in information retrieval. Montreal: Association for
computing machinery, 1985.

CAREY [etal]. Manifiesto del sistema de base de datos de tercera generación. Comité
para la Función Avanzada en SGBD. Novática, y. 17, n0 91(1991).

COOPER, W.S. A definition of relevance for information retrieval. Information storage


and retrieval, y. 7, n0 1(1971) Pp. 19-37.

Getting beyond Boole. Information process¡ng and ¡nanagenient, y. 24, n0


3 (1988) Pp. 243-248.

414
Bibliografía

CORNELIO, E.R. Bases de datos relacionales. Madrid: Paraninfo, 1988.

CHAUMIER, J. L’accés automatisé á l’information. Paris: Enterprise Moderne

d’Edition, 1982.
CHEN, C.C. & SCHWEIZER, 5. Online bibliographic searching: a learning manual.
New York: Neal-Schuman, 1981.

DATE, C.J. An introduction to database systems. y. 1. 5a ed. Reading, Massachusetts:


Addison-Wesley, 1990.

DEEN, S.M. Fundamentos de los sistemas de bases de datos. Barcelona: Gustavo Gili,
1987.

DEWEZE, A. L’accés en ligne aux bases documentaires. Paris: Masson, 1983.

DUBOIS, of thesauri in online retrieval. Journal of Information Science,


0 2 C.P. ThePp.use63-66.
(1984)
y. 8, n

FARRADANE, J.E.L. Analysis and organization of knowledge for retrieval. ASLIIB


Proceedings, y. 22 (1970) pp. 607-616.

FEDERATION INTERNATIONAL DE DOCUMENTATION (FID). The role of


graphic display of concepts relationships in indexing and retrieval vocabularies
¡ncluding a tbesaurus of documentation terms. Bruselas: European Atomic Energy
Community (EURATOM), 1965.

FERNÁNDEZ, C. El modelo relacional de datos: De los fundamentos a los modelos


deductivos. Madrid: Din de Santos, 1987.

FOSKETT, A.C. The subject approach to information. ~a ed. London: Clive Bingley,
1996.

GARCÍA GUTIÉRREZ, A. Procedimientos de Análisis Documental Automático:


Estudio de caso. Sevilla: Instituto Andaluz del Patrimonio Histórico, 1996.

GARCÍA MARCO, F.J. De la consulta de catálogos a la gestión de información:


Tensiones hacia el cambio en el diseño de OPACs. Boletín de la ANABAD, y. 41, n0
3-4 (1991).

415
Bibliografía

Interfaces amigables para la recuperación de la inforniación bibliográfica.

Scire, y. 1, n0 1 (1995).

GARDARIN, G. Bases de datos. Madrid: Paraninfo, 1987.

GARDIN, J.C. Systémes experts et Sciences humaines. Paris: Eyrolles, 1987.

GILCHRIST, A. The thesaurus in retrieval. London: Aslib, 1971.

FIARTLEY, R.J. Online searching: principies & practice. London, etc.: Bowker-Saur,
1990.

HARTNER, E. P. An introduction to automated literature searching. New York:


Dekker, 1981.

HAWKINS, D. T. Applications ofartificial intelligence (Al) and expert systems for online
searching. Online, y. 12, n0 1 (1988) Pp. 31-40.

HOOVER, R.E. Online searcb strategies. White Plains, NY.: Knowledge lndusiry,
1982.

KEEN, E.M. In the processing of printed subject entries during searching. Journal of
Documentation, y. 33, 4 (1977> Pp. 266-276.

Some aspects of proximity searching in text retrieval systems. Journal of


Information Science, n0 18 (1992) pp. 89-98.

KEHOE, C.A. Interfaces and expert systems for online retrieval. Online, y. 9, n0 6
(1985) Pp. 489-505.

KORTH, H.F. & SILBERSCHATZ, A. Database system concepts. New York:


McGraw-Hill, 1986.

LÓPEZ RINCÓN, C. Diseño e implementación de un sistema automático de análisis


documental. Madrid: Universidad Complutense, Dept. de Lógica y Filosofía de la
Ciencia, 1995. <Tesis doctoral).

LANCASTER, F.W. Vocabulary control for information retrieval. Washington, D.C.:


Information Resources Press, 1972.

416
Bibliografía

LUFIN, H.P. A statistical approach to mechanized encoding and searching of literary


information. IBM Journal of researcb and development, y. 1, n0 4, October (1957)
pp. 309-3 17.

A business intelligence system. IBM Journal of research and development.


n0 2 (1985) pp. 314-319.

MANIEZ, 1. Le rále de la syntaxe dans les syst~mes de recherche documentaire.


Dijon: lnstitut Universitaire de Technologie, 1976-1977, 2 y.

MARCUS, R.S. An experimental comparison of the effectiveness of computers and


humans as search intermediaries. Journal of the American Society for Inforination
Science, y. 34, 6 (1983) pp. 381-404.

MARON, M.E. & KUHNS, J.L. On relevance probabilistic indexing and information
retrieval. Journal of the ACM, y. 7, n0 3 <1960).

MATTI-IEWS, J.R. Public Access to Online Catalogs. 2~ ed. New York: Neal
Schuman, 1985.

MIGUEL CASTAÑO, A. de & PIATTINI VELTHUIS, M.G. Concepción y diseño de


bases de datos: Del modelo E/R al modelo relacional. Madrid: RA-MA, 1993.

MOYA ANEGÓN, F. de. Los sistemas integrados de gestión bibliotecaria. Madrid:


Anabad, 1995

ODDY, R.N. [et al]. Information retrieval through man-machine dialogue. Journal of
Documentation, y. 33, 1 March (1977) Pp. 1-14.

Information retrieval research. London: Butterworths, 1981.

PRASSE, M.J. Interface design procedure. Annual review of OCLC research. JuIy
(1990) June (1991), Pp. 17-18.

ROBERTSON. S.E. Theories and models in information retrieval. .Journal of


Documentation, y. 33, n0 2, June (1977) Pp. 126-148.

The probability ranking principIe in IR. Journal of Documentation, y. 33,


n0 4, December (1977> Pp. 294-304.

417
Bibiiograf¡a

Probability of relevance: a unification of two competing models for


documental retrieval. Information tecbnology researcb and development, y. 1, n0 1
(1982) pp. 1-21.

ROBSON, A. & LONGMAN, J.S. Automatic aids to profiles construction. Journal of


ASíS, y. 27, n0 4, JuIy-August (1976) pp. 213-223.

SALTON, O. A simple blueprint for automatic boolean query processing. Information


processing and management, y. 24, n0 3 (1988) pp. 269-280.

SCHANK, R. El ordenador inteligente. Barcelona: A. Bosch, 1986.

SCHAUB, J.A. CD-Rom for public access catalogs. Library High Tech, y. 3 n0 3
(1985) pp. 7-13.

SERVAN-SCHREJBER, J.J. El desafio mundiaJ. Madrid: PJaza & Janes, 1980.

STANDERA, O. On-line retrieval systems: some observation on the user/system


interface. En: Proceedings of the ASíS Annual Meeting, y. 12: Information
revolution. Washington: ASíS, 1975, pp. 38-40.

STONEBRAKER, M. The INGRES papers: The anatomy of a relational database


management systezn. Reading, Massachusetts: Addison Wesley, 1986.

VAN RIJSBERGEN, C.J. Information retrieval. London: Butterworths, 1979.

WALKER, 5. Improving subject access painlessly: recent work on the OKAPI online
catalogue projects. Program, y. 22 n 0 1(1988) pp. 21-31.

WIEDERHOLD, G. Diseño de bases de datos. México: McGraw-Hill, 1985.

418
Bibliografía

Capítulo 5. Análisis semántico y estructural de diferentes tesauros y de las bases de


datos en las oue se utilizan

AITCHISON, T.M., A.M. HALL, and J.M. TRACY. Comparative Evaluation of


índex Languages. Pafl II. Results. London: Institution of Electrical Engineers, 1970.

ALVARO BERMEJO, C.; VILLAGRA RUBIO, A. y SORLI ROJO, A. Desarrollo de


lenguajes documentales formalizados en lengua española: Una evaluación. Parte 1:
Vigencia teórica y práctica de lenguajes controlados. Revista Española de
Documentación Científica, y. 12, n0 2 (1989) pp. 154-159.

ALVARO BERMEJO, C., VILLAGRA RUBIO, A. y SORLI ROJO. A. Desarrollo de


lenguajes documentales formalizados en lengua española. Parte II: Evaluación de los
tesauros disponibles en lengua española. Revista Española de Documentación
Científica. y. 12, n0 3 <1989) pp. 283-305.

BUREAU MARCEL VAN DIJK. Definition of Tbesauri Essential Cbaracteristics. 2


vols. Brussels: Bureau M. Van Dijk, 1976

DAHLBERG, 1. “The Broad System of Ordering (BSO) as a Basis for an Integrated


Social Sciences Thesaurus?”. International Classification, y. 7, n0 2 (1980) pp. 66-72.

GERD, A.S. Associative Relations in an Information Retrieval Thesaurus and Ways to


Identify Them. Automatic Documentation and Mathematical Lingu¡stics, y. ¡4 n0 3
(1980) pp. 25-30.

JONES, K.P. Problems Associated With the Use of Compound Words in Thesauri With
Special Reference to BS 5723: 1979. Journal of Documentation, y. 37, n0 2, June
(1981) Pp. 53-68.

KOCHEN, M. & TAGLIACOZZO, R. A Study of Cross-Referencing. Journal of


Documentation, y. 24, n0 3 (1968) Pp. 173-191.

MAGARIÑOS, A. [et al]. El tesauro de Medio Ambiente de la Secretaría General de


Medio Ambiente. Boletín de la ANABAD, y. 4, oct.-dic. (1990) pp. 14 1-162.

ROOT Thesaurus. London: British Standard Institution, 1981.

419

.
Bibliografía

SHUMWAY, R.H. Sorne Estimation Problems Associated with Eváluating Information


Retrieval Systems. En: Evaluation of document Retrieval Systems: Literature
Perspective, Measurement, Technical Papers. Bethesda, Md.: Westat Research, Inc.,
1968, pp. 78-96.
SOERGEL, D. The Broad System of Ordering: A Critique. International Forum on
Information and Documentation, y. 4, no 3. July (1979) pp. 21-24.

SPINES Thesaurus. Paris: Unesco, 1976.

WELLISCH, H.H. The Broad System of Ordering or Bishop Wilkins Redivivus: A

Review Article. Library Quarterly, y. 49, n0 4, October (1979) Pp. 444-452.

Capítulo 6. Evaluación del rendimiento de tesauros españoles en sistemas de


información

AITCHISON, J. et al. Comparative evaluation of index languages. London: Institution


of Electrical Engineers, 1970.

ANGUERA, M.T. Metodología de la observación en las Ciencias humanas. Madrid:


Cátedra, 1989

BARKER, F.H.; VEAL, D.C.; WYATI’, B.K. Comparative efficiency of searching


titíes, abstracts and index terms in a freetext data base. Journal of Documentation, y.
28, n0 1 (1972) Pp. 22-36.

BATES, M.J. How to use controlled vocabularies more effectively in online searching.
Online, y. 12, n0 6 (1988) Pp. 45-56.

BETTS, R. & MARRABLE, D. Free text vs controlled vocabulary: retrieval precision


and recalí over large databases. En: Online llnformation 91. Proceedings of the lSth
International Online Information Meeting, London, 10-12 December 1991 Oxford New
Jersey: Learned Information (Europe) Ltd, 1991, Pp. 153-165.

BHATTACHARYYA, K. The effectiveness of natural language in science indexing and


retrieval. Journal of Documentation, y. 3Q, n0 3 (1974) Pp. 235-254.

420

.
Bibliografía

BIVINS, K.T. New trends in docuinentation and information. Lohdon: ASLIB, 1980.

BLAIR, D.C. Language and representation in information retrieval. Amsterdam, etc.:


Elsevier, ¡990.

BLAIR, D.C. & MARON, M. E. An evaluation of retrieval effectiveness for a fulí text
document retrieval system. Communications of the ACM, y. 28, n0 3 (1985) Pp. 289-
299.

BOURNE, C.P. Evaluation of indexing systems. Annual review of information science


and technology, n0 1 (1966).

BRIER, 5. Cybersemiotics: A new interdisciplinary development applied to the problenis


of knowledge organisation and document retrieval in information science. Journal of
Documentation, y. 52, n0 3 (1996) Pp. 296-344.

BROOKS, H.M. Experts systems and intelligent information retrieval. Jinformation


processing and management, y. 23, no 4 (1987) Pp. 367-382.

CALKINS, M.L. Free text or controlled vocabulary?. Database y. 3, n0 2, June (1980)


PP. 53-67.

CLEVERDON, C.W. ASLIIB Cranfleld research project: report on the testing and
analysis of an investigation into the comparative efficiency of indexing systems.
Cranfield: College of Aeronautics. 1962.

On the inverse relationship of recalí and precision. Journal ofdocumeotation,


y. 28, n0 3 (1972) Pp. 195-201.

Evaluation tests of information retrieval systems. Journal of Documentation,


y. 26, n0 1 (1970) pp. 55-67.

The Metbodology of Evahuation of Operational Information Retrieval


Systems Based on the Medlars. Cranfield: Cranfleld Institute of Technology Report,
1968.

CLEVERDON, C.W. & THORNE, R.G. A brief Experiment witl, dic Uniterm
System of Coordinate Indexing for the Cataloging of Structural Data. RAE Library
Memorandum N0 7, AD 35004. Farnborough, England: Royal Aircraft Establishment,
1954.

421
Bibliografía

CLEVERDON, C.W. & MILLS, J. The testing of mdcx langúage devices. Aslib
Proceedings, y. 15, n0 4 (1963) Pp. 106-130.
CLEVERDON, C.W.; MILLS, 1.; KEEN, M. Factors determining the performance
of indexing systems. 2 y. Cranfield: The National Science Foundation; ASLIR, 1966.

COOPER, W.S. A definition of relevance for information retrieval. Information storage


and retrieval, y. 7 n0 1 (1971) Pp. 19-37

CROFT, W.B. A model of cluster searching based on classification. Information


Systems, n0 5 (1980).

DIMITROFF, A. & WOLFRAM, D. The effect of linkage structure on retrieval


performance and user response in a hypertext-based bibliographic retrieval systern. Aun.
Rey. OCLC Researcb 1995, pp. 58-60.

DRINKWATER, C. Social and behavioural sciences. En: Manual of Online Search


Strategies, ed. por C.J. Armstrong & J.A. Large. Aldershot: Gower Press, 1988, Pp.
469-506.

Free text vs. controlled vocabulary: A reassessment. Online Review, y. u. no


10 (1987) pp. 243-253.

ELLIS, D. New horizons in information retrieval. London: The Library Association,


1990.

FAIRTHORNE, R. Automatic retrieval of recorded information. Computer journal


(1958).

FESTINGER, L.; KATZ, D. (eds.). Los métodos de investigación en las Ciencias


sociales. Buenos Aires: Paidós, 1972.

FIDEL, R. Searchers selection of search keys: 2. Controlled vocabulary or free-text


searching. Journal of the American Society for linformation Science. y. 42, n0 7, Aug
(1991) pp. 501-514.

FOSKETT, A.C. The evaluation of information retrieval systems. En: The subject
approach to information. London: Clive Bingley, 1982, Pp. 518-551.

FREE text retrieval systems: A review and evahuation. London: Taylor Graham, 1989.

422
Bibliografía

GIERE, W. & DETTMER, H. Free-text classification and retrieval based on a thesaurus.


Eight years of experience at the Johann Wolfgang-Goethe University, Medical School.
En: IOth. Annual Symp. Comput. Appl. Med. Care. Washington: (s.n.), 1986, pp. 85-
88.

GILCHRIST, A. Tbe thesaurus iii retrieval. London: ASLIB: 1971.

GOFFMAN, W. & NEWILL, V.A. A methodology for test and evaluation of


information retrieval systems. Information storage and retrieval, n0 3, (1966) Pp. 19-
25.

GULL, D. Seven years of work on the organisation of materials in the special Iibrary.
American Documentation, y. 7 (1956).

HARTER, SP. Online information retrieval: Concepts, principIes and techniques.


Orlando, FJorida: Academie Press, 1986.

HARTER, S.P. & CHENG, Y. Colinked descriptors: Improving vocabulary selection for
end user searching. Journaí of tbe American Society for linformation Science, y. 47,
n0 4(1996) Pp. 311-325.

1-IENDERSON, M.M. Evaluation of information systems: A selected bibliography


with informative abstracts. NBS Technical note 297. Washington, D.C.: National
Bureau of Standards, 1967.

HERSEY, D.F. [et al]. Free text word retrieval and scientist indexing: performance
profiles and costs. Journal of Documentation, y. 27, n0 3 (1971) Pp. 167-183.

HIRSCHHEIM, R.A. & SMITHSON, S.C. A critical analysis of information systems


evaluation. en Bjorn-Andersen, N. & Davis, G.B. (eds.) linformation Systems
Assessement: Issues and Challenges, Proc. IFIP WG 8.2 Working Conf.
Noordwijkerhout, The Netherlands, 27-29 August 1986. North Holland, Amsterdam:
IFIPWG, 1986.

JACHNA, 1.5.; POWSNER, S.M.; MILLER, P.L. Augmenting GRATEFUL MED with
rhe UMLS Metathesaurus: an initial evaluation. Bulletin of the Medical Library
Association, y. 81, n0 1, Jan (1993) pp. 20-28.

JONES, K.S. Natural language access to databases: some questions and a specific
approach. Journal of Information Science, y. 4, n0 1(1982) pp. 4 1-48.

423
Bibliografía

iONES, K.S. & RIJSBERGEN, C.J. van. Information retrieval test collections. Jonrual
of documentation, y. 32, n0 1 (1976) Pp. 59-75.
JONES, S. A thesaurus data model for an intelligent retrieval system. Journal of
Information Science, y. 19, n0 3 (1993) Pp. 167-178.

JONES, K.P. Prospects for information retrieval. Informatics 10. Proceedings of a


conference jointly sponsored by Aslib Informatics Group, and the Information Retrieval
Specialist Group of the British Computer Society. King’s College, Cambridge, 21-23
March 1989. Edited by K. P. Jones. Cambridge: Aslib, 1990.

KEEN, M. On the performance of nine printed subject index types; a selective report
of EPSILON. Aberystwyth: College of Librarianship Wales, 1978.

The Aberystwyth index languages test. Journal of Documentation, y. 29, n0


1 (1973) pp. 1-35.

KEEN, M. y DIGGER. J.A. (1972). Repon of an Information Science index


languages test. Aberystwyth: College of Librarianship, 1972.
KISH, L. Selección de la muestra. En: L. Festinger & D. Katz, Los métodos de
investigación en las Ciencias sociales. Barcelona: Paidós, 1953, reimp. 1987.

KRIPPENDORF, K. Metodología del análisis de contenido. Barcelona: Paidós, 1990.

KRISTENSEN, 1. y JARVELIN, K. The effectiveness of a searching thesaurus in free-


text, searching in a full-text database. International Classification, y. 17, n0 2 (1990)
pp. 77-84.

LANCASTER, F.W. Guidelines for the evaluation of information systems and


services. Paris: Unesco, 1978.

Information retrieval systems: Cbaracteristics, testing and evahuation. 2nd.


ed. New York: Willey. 1979.

Evahuation of the MEDLARS Demand Search Service. Bethesda, Maryland:


National Library of Medicine, 1968.

Precision and recalí. En: Encyclopedia of Library and Information Science.


New York: Marcel Dekker, 1978, y. 23, pp. 170-180.

424
Bibliografía

Natural language in information retrieval. En: Lancaster, F.W. Inforniation


retrieval systems, characterist¡cs testing and evaluation. 2a ed. New York: Wiley,
1979. Cap. 20, Pp. 279-292.

Evaluation and testing of information retrieval systems. En: Enclyclopedia of


Library and Information Science.
New York: Marcel Dekker, 1978, y. 8, pp. 234-259.

Evaluating the performance of a large computerized information


0 1(1969) service.
pp. 114-120.
Journal of the American Medical Assoc¡ation, y. 207, n
LANCASTER, F.W. & GILLESPIE, C.J. Design and evaluation of information systems.
Annual review of information science and technology, n0 5 (1970).

LANCASTER, F.W. & MILLS. Testing indexes and index language devices: The
Cranfield Project. American Documentation, n0. 15 (1964) pp. 4-13.

MALDONADO, A. El control del lenguaje en la producción de una base de datos: el


tesauro de urbanismo ISOC. En: Actas de las Segundas Jornadas Españolas de
Documentación Automatizada. Málaga: Consejo Superior de Investigaciones Científicas,
etc., 1986, pp. 125-136.

MALRIEU, D. (1983). La base de donnes ERIC: evaluation de son utilisation et


discussion des choix du systéme. Brises, n0 3 (1983) pp. 53-62.

MANIEZ, Jacques. Problémes de syntaxe dans les systémes de recherche documentaire.


Documentaliste, y. 20, n0 2 (1983) PP. 52-58.

MARKEY, K.; ATRERTON, P.; NEWTON, C. An analysis of controlled vocabulary


and free text search statements in online searches. Online Review, y. 4, n0 3 (1980) Pp.
225-236.

MARTIN, W.A. Methods for evaluating the number of relevant documents. Journal of
the American Society for Information Science, y. 34, n0 6 (1983) pp. 173-177.

McCAIN, K.W.; WHITE, H.D.; GRIFFITH, B.C. Comparing retrieval performance in


online data bases. Infonnation processing and management, y. 23, n0 6 (1987) Pp.
539-553.

425
Bib(iogratfa

McJUNKIN, M.C. Precision and recalí in title keyword searches. Information


Technology & Libraries, y. 14, n’~ 3 (1995) pp. 161-171.

MEYRIAT, 1. Social Science information languages: a comparative analysis.


International Classification, y. 7, n0 2 (1980) pp. 60-65.

MOLL, W..J.D. MEDLJNE evaJuation study. Buuletin of’ tite Medical Library
Association, y. 62, n0 1 (1974) pp 1-15.

NUYL, T. W. Examination of the validity of the conclusions arrived at in the Aslib


Cranfleld Research Project. Copenhagen: Danish Center for Documentation. (FID/CR
report; 7), 1968.

OLDROYD, B.K. & CITROEN, C.L. Study of strategies used in on-line searching.
Online review, y. 1, n0 4 (1977) pp. 295-310.

PASQUAL, G. Development of an agricultural database for dissemination of research


information to research and extension workers using STATUS software. Program, y. 20,
n0 3 (1986> pp. 323-33 1.

PEREZ, E. Text enhancement, controlled vocabulary versus free text. Spec¡al Libraries,
y. 73, n0 2 (1984) pp. 51-58.

PERRY, J.; KENT, A.; BERRY, M. Machine literature searching. New York, etc.:
lnterscience Publishers, 1956.

RAITT, D.I. Recalí and precision in interactive bibliographies search and retrieval
systems. Aslib Proceedings, y. 36, n0 5 (1984> pp. 229-234.

REGAZZI, J.J. Evaluating indexing systems: a review after Cranfield. The Indexer, y.
12, n0 1(1980) Pp. 14-21.

Performance measures for information retrieval systems: An experimental


approach. Journal of the American Society for Information Science, y. 39, n’ 4
(1988) Pp. 235-251.

TILE RETRIEVAL of information the bumanities and the social sciences:


iii
problems as aids to learning. Ed. T. P. Slavens. New York & Basel: Marcel Dekker,
1981.

426
Bibliografía

REY ROCHA, J. Tesauro ICVT de biología animal. Madrid: CINDOC, 1995.

ROBERTSON, S.E. The parametric description of retrieval tests. Journal of


Documentation, y. 25, n0 1, (1969> Pp. 1-27 y y. 25, n0 2, Pp. 93-107.

ROTHENBERG, D.H. an efficiency model and a performance function for an


information retrieval system. Information storage and retrieval, y. 5, n0 3 (1969) Pp.
109- 122.

ROWLEY, 1. E. A comparison between free language and controlled language indexing


and searching. Information Services and Use, 10 (1990) Pp. 147-155.

SALTON, G. A new comparison between conventional indexing (MEDLARS) and


automatic text processing (SMART). Journal of tbe American Society for Information
Science, y. 23, n0 2 (1972> pp. 75-84.

Automaticinfonnation organizationand retrieval. New York, etc.: McGraw


Hill, 1968.

The evaluation of automatic retrieval procedures selected test results using ate
SMART system. American documentation, y. 16, n0 3 (1965) pp. 209-222.

SALTON, G. y McGILL, M.J. Introduction to modern Information Retrieval. New


York: McGraw-Hill, 1983.

SAN MILLAN, M.J. Las bases de datos españolas en Ciencias humanas y sociales: las
bases de datos ISOC. En: Actas de las Segundas Jornadas Españolas de
Documentación Automatizada. Málaga: Consejo Superior de InvestigacionesCientíficas,
etc., 1986, PP. 41-45.

SARACEVIC, T. An inquiry into testing of information retrieval systems, Pan 1:


Objetives, methodology, design and controis, comparative systems laboratory,
Report N0. CSL: TR-FINAL-1. Cleveland, Ohio: Western Reserve University, 1968.

Relevance: a Review and a Framework for the Thinking on the Notion in


Information Science. Journal of tbe American Society for Information Science, y. 26,
n0 6, Nov.-Dec. (1975) pp. 321-343.

Comparative effects of titíes, abstracts and fulí texts on relevance judgments.


Proceedings of the ASíS, n0 6 (1969) pp. 293-299.

427
Bibí iogratta

SARACEVIC, T. [et al]. A study of information seeking and retriéving 1. Background


and methodology; II. Users, questions and effectiveness ; III. Searchers, searches and
overlap. Journal of the American Society for Information Science, y. 39, n0 3 (1988).
SCHABAS, A.H. Postcoordinate retrieval: a comparison of two indexing languages.
Journal of the American Society for Information Science, y. 33, n0 1(1982) Pp. 32-
37.

SCRIVEN INVERNESS, M. Evaluation tbesaurus. Pt. Reyes, Ca: Edgepress, 1980.

SHUMWAY, R.H. Some estimation problems associated with evaluationg information


retrieval systems. En: Westat Research Inc. Evaluation of Document Retrieval
Literature Perspective, Measurement, Technical Papers. Bethesda, Maryland: Westat
Research Inc., 1968, pp. 78-96.

SMITHSON, 5. The evaluation of information retrieval systems: a case study approach.


En: Prospects for intelligent retrieval. Ilnformatics 10. Proceedings of a conference
jointly sponsored by Aslib Informatics Group, and the Information Retrieval Specialist
Group of the British Computer Society. King’s College, Cambridge, 21-23 March 1989.
London: Aslib, 1990, pp. 75-89.

SNYDER, M.B. [et al]. Metbodology for test and evaluation of document retrieval
systems: A critical review and recommendations. McLean, Virginia: Human Sciences
Research Inc., 1966.

SVENONIUS, E. The effect of indexing specificity on retrieval performance.


Washington: National Science Foundation, 1971.

Unanswered questions in te design of controlled vocabularies. Jonrnal of the


American Society for Information Science, y. 37, n0 5 (1986) pp. 331-340.

SWANSON, D. R. The evidence underlying the Cranfleld results, Library Quarterly,


n~’ 35 (1965) pp. 1-20.

SWETS, J.A. Effectiveness of information retrieval methods. American Documentation,


y. 20, n0 1 (1969) Pp. 72-89.

TAGUE-SUTCLIFFE, J.M. (ed.). Evaluation of information retrieval systems. Special


topic issue. Journal of the American Society for Information Sc¡ence y. 47, n0 1
(1996) Pp. 1-105.

428
Bibliografía

TESAURO Electrotécnico. Madrid: Asociación de Investigación Industrial Eléctrica

(ASINEL), 1993.

TESAURO de Asuntos sociales. Y’ ed. Madrid: Ministerio de Asuntos sociales, 1994.

TESAURO de Medio Ambiente. Y’ ed. Madrid: Ministerio de Obras Públicas y


Urbanismo, 1990.

TESAURO ‘Mujer”. Madrid: Instituto de la Mujer, 1993.

TESAURO ISOC de Psicología. 2~ ed. Madrid: CINDOC, 1995.

VAN RIJSBERGEN, C.J. [et al]. The selection of good search terms. Information

Processing & Management, no 17 (1981) pp. 77-91.


WALLIS, P. & THOM, J.A. Relevance judgements for assessing recail. Information
Process. & Management, y. 32, n0 3 (1996) Pp. 273-286.
WILBUR, W.J. Human subjectivity and performance limits in document retrieval.
Inform. Process. & Management, y. 32, n0 5 (1996) pp. 515-527.

429

También podría gustarte