Gestión Efectiva de la Información en Internet
Gestión Efectiva de la Información en Internet
fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 1
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
2. Organización de la información
Desde los inicios de la civilización, el hombre ha manifestado su tendencia para
organizar la información, desde el agrupamiento y clasificación de utensilios de trabajo,
de caza, de pesca, etc. o de la propia creación de las estructuras comunitarias
-cazadores, guerreros, sabios-, entre otras entidades que surgieron en las primeras
formas de sociedad. El hombre organiza para entender, explicar y controlar su entorno.
Pero, justamente, como la clasificación la hacen los hombres, hay en potencia tantas
clasificaciones como seres humanos.
Si hablamos de información, la organización de estos recursos es una tarea
esencial en todo sistema de información. Como es de suponer, en la sistematización de
información están trabajando bibliotecarios, documentalistas, gestores de contenidos
digitales y especialistas de las distintas disciplinas, en ámbitos tan diversos como
bibliotecas, universidades u organizaciones nacionales e internacionales, dado el
volumen de la misma y la complejidad que ha alcanzado. Es muy importante señalar que
estos avances han superado lo exclusivamente instrumental y han generado una
evolución de las Ciencias de la Documentación y de las Ciencias de la Información que
supera ampliamente las posibilidades de describirla en este texto.
Aun así, las cinco preguntas clásicas -quién, qué, cuándo, dónde y por qué- son
un buen punto de partida para convertir las características de un tema en nuestros
requerimientos de búsqueda. Pero que exigen tener en cuenta una sexta pregunta:
¿Cómo?
fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 2
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
2) dado el carácter ambiguo del lenguaje natural, organizar un vocabulario
razonablemente estructurado y con su ayuda buscar los documentos,
cualesquiera hayan sido los términos que emplearon los autores para
enunciar sus ideas.
El primer procedimiento es atractivo por su simplicidad: buscar los conceptos del
documento tal cual se encuentran. Obviamente es sencillo, pero no es eficaz.
¿Por qué? Porque los documentos tratan diversas nociones. Es muy raro que un
texto trate una sola noción: por el contrario, la riqueza de una información es el
resultado, con frecuencia, de la yuxtaposición e integración de varios conceptos de los
que el autor muestra las relaciones. Esa integración constituye el tema del documento.
Consecuentemente, los conceptos podrán estar enunciados, a su vez, con la ayuda de
expresiones compuestas, ya sea de una o de varias palabras. Del mismo modo, las
consultas de los usuarios se descomponen en un cierto número de nociones, que no
necesariamente coinciden con las que tiene cada documento.
El segundo procedimiento es más depurado, requiere definir la estructura y
organización de un vocabulario tipo antes de comenzar realmente la búsqueda
propiamente dicha. En este caso tenemos no sólo la búsqueda de los conceptos
presentes en el documento, sino también la traducción del lenguaje del autor a lo que
habitualmente se llama lenguaje documental –un sistema convencional de signos que
permite representar el contenido de los documentos con el fin de encontrar aquellos
pertinentes en respuesta a preguntas sobre un tema (Rubio Liniers, 2001)–. Una primera
distinción entre lenguaje natural y lenguaje documental puede apreciarse en la tabla que
sigue (Tabla Nº 1).
Tabla Nº 1: Diferencias entre lenguaje natural y lenguaje documental.
fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 3
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
información pertinente, con un máximo de utilidad y precisión y con un mínimo de gasto,
en respuesta a una pregunta. Entre las numerosas clasificaciones de documentos, las
más utilizadas son: 1) la alfabética; 2) la numérica; 3) la alfanumérica, 4) la geográfica,
5) la cronológica, 6) la sectorial, 7) la analógica, 8) la jerárquica, etcétera.
La clasificación alfabética comprende tantas clases principales como letras del
alfabeto. Es una de las más sencillas y sin sutilezas. Presenta dificultades en el caso de
palabras de múltiple ortografía y en las palabras o nombres compuestos. La clasificación
numérica es igualmente simple y se sirve de nuestro sistema numérico. Entre ellas figura
la Clasificación Decimal, concebida por Melvil Dewey en 1876.
La clasificación alfanumérica asocia las dos clasificaciones precedentes
combinando letras del alfabeto y las cifras de la numeración decimal. Se conserva el
alfabeto, lo que facilita la búsqueda, permitiendo las cifras la inserción de elementos
nuevos posteriormente. La clasificación geográfica es también una clasificación clásica
que se basa en la división por países, regiones, departamentos, ciudades, pueblos,
etcétera. La clasificación cronológica es sencilla y cómoda, y en la práctica es muy
utilizada asociada a la alfanumérica, u otras. De manera análoga, tanto la clasificación
sectorial como la analógica y la jerárquica –más complejas y depuradas– permiten
estructurar distintas configuraciones, que pueden adaptarse a una institución, a una
técnica o a una rama particular de un ámbito específico del conocimiento.
El álgebra booleana –la teoría de conjuntos– y los programas informáticos de
búsqueda permiten tener en cuenta la complejidad de los encabezados de las diferentes
nociones conceptuales, contenidas en los distintos documentos.
fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 4
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
todo lo pequeña que se desee y que sólo debe ser explorada durante la búsqueda, lo
que reduce considerablemente las operaciones.
La división de las materias se hace desde lo más general a lo más específico y
preciso, con números cada vez más altos. Por otra parte, siempre se puede insertar un
nuevo elemento conceptual sin modificar el orden de los elementos existentes.
Ejemplo:
600 Tecnología
620 Técnica
621 Física aplicada
Si necesitamos más de tres cifras se separan las cifras siguientes con un punto:
621.3 Electrotecnia
621.38 Electrónica
621.388 Televisión
Como puede apreciarse, cuanto mayor es el número que caracteriza un
documento más específico es el concepto simbolizado.
Las clasificaciones universales muchas veces resultan poco pertinentes como
único lenguaje de recuperación ya que parten de una división del conocimiento que tiene
en cuenta los "puntos de vista" de las disciplinas científicas y no incluye la
interdisciplinariedad y la especificidad actual. Consecuentemente, su estructura
jerárquica dificulta la combinación de los múltiples aspectos de una investigación y no
siempre permite recoger temas muy específicos, o novedosos.
2.2.2. Tesauros
En el campo de las Ciencias de la Información, un Tesauro es un vocabulario
controlado que permite el análisis y la recuperación de documentación especializada.
Sus ventajas son la especificidad de sus términos y sus posibilidades de combinación de
temas relacionados entre sí de distinta manera. Consecuentemente, es un sistema de
organización del conocimiento, cuyos términos de indización se estructuran en un
sistema de relaciones explícitas.
Un tesauro de descriptores es una lista estructurada de enunciados de conceptos.
Dichos enunciados buscan representar, de forma unívoca, el contenido conceptual de
los documentos y de las preguntas en un sistema documental. Un tesauro multilingüe
ofrece otra ventaja: las correspondencias entre conceptos idénticos expresados en
diferentes lenguas permiten comenzar la búsqueda en la lengua del usuario y encontrar
los documentos indizados en cualquiera de las lenguas del mismo.
Habitualmente, el mismo concepto puede expresarse mediante varios sinónimos o
términos muy próximos –por ejemplo, educación, sistema educativo–. Sería muy difícil
encontrar un documento indizado bajo cualquiera de esos términos a partir de una
pregunta referente a uno de sus sinónimos. Otro ejemplo: prensa puede significar tanto
una máquina para comprimir como, en sentido figurado, una imprenta, el conjunto de las
publicaciones periódicas, o las personas dedicadas al periodismo. Esta homonímia nos
remitiría a documentos sin ninguna relación con el tema que nos interesa. Otro de los
objetivos de un tesauro consiste en evitar los inconvenientes derivados de la homonímia:
todos los descriptores se sitúan en un contexto determinado, de forma que su significado
sea unívoco.
fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 5
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
Consecuentemente, todo tesauro tiene un vocabulario de indización conformado
por descriptores e identificadores. Ambos son términos que permiten describir el
contenido de los documentos. También se incluyen no descriptores –sinónimos o
cuasisinónimos de los descriptores– cuya función es remitir al término que se usa.
Descriptores: palabras o expresiones que designan sin ambigüedad los
conceptos constitutivos del tesauro; por ejemplo, sector educativo.
No-descriptores: palabras o expresiones que designan, en lenguaje
natural, el mismo concepto, por ejemplo, sistema educativo, o
conceptos equivalentes –educación–.
Por su parte, los identificadores o nombres propios, representan una entidad
individual y única.
Por último, están las relaciones semánticas: relaciones vinculadas al sentido de
los términos –relaciones entre descriptores y no-descriptores–, y relaciones de los
descriptores entre sí. En un tesauro se hacen explícitos diversos tipos de relaciones: 1)
las relaciones de equivalencia, 2) las relaciones de jerarquía y 3) las relaciones de
asociación.
Los principales tipos de relación que se utilizan, son:
1) Jerarquía: documentos sobre transporte público conducirán automáticamente a
recibir información sobre, por ejemplo: tren, colectivo, ómnibus, coche,
subterráneo, autobús, etcétera.
2) Sinonimia: siguiendo el ejemplo anterior, los términos subterráneo y colectivo
pueden ser significativos para un argentino, pero otros usuarios podrían
estar más relacionados con la palabra metro, o autobús, respectivamente.
Ejemplo: colectivo: utilizar autobús.
3) Asociación: una respuesta comprensiva debe tener en cuenta términos
explícitamente relacionados con la búsqueda, por ejemplo: tren y vapor (o
electricidad); ómnibus y terminal.
Dado al carácter ambiguo del lenguaje natural, muy frecuentemente una noción
puede expresarse a través de varias palabras o expresiones sinónimas. Inversamente,
una palabra, o una expresión polisémica, expresa varias nociones. Cabe tener en cuenta
que distintos significados de una misma palabra es una característica de la terminología
científica e incluso en Educación es el indicio claro de la existencia de distintas
posiciones y modelos conceptuales. Las posibles homonimias, sinonimias, polisemias,
así como el uso de metáforas, no siempre son resueltas por los lenguajes documentales.
Por último, debe tenerse en cuenta que los tesauros:
1) se construyen en función de un conjunto posible de documentos que pueden
aparecer sobre un tema, es decir, se considera el tema como caso general, de forma
impersonal, anónima, objetiva e intemporal.
2) no tienen por qué ser completos, en el sentido de abarcar todo el conocimiento.
Generalmente se limitan a un área temática específica, y desde cierta perspectiva
específica. Por ello existen innumerables tesauros específicos. Sirvan como ejemplo: el
ERIC, que suministra información, recogida por el Education Resources Information
Center del Departamento de Educación de Estados Unidos; el Tesauro de la UNESCO;
el Tesauro Europeo para la Educación, etcétera.
fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 6
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
2.2.3. Indización manual o automática
En términos generales podemos distinguir tres procedimientos de indización
diferentes:
1) Indización manual: es la realizada por personas sin ninguna intervención
informática (algo difícil de aceptar actualmente).
2) Indización semiautomática: es la realizada como interacción entre hombre y
programa informático, que presentan al indizador las palabras que ha
extraído del texto y que sus algoritmos de funcionamiento ofrecen
como relevantes, y la persona toma la decisión de cuales se conservan
en el sistema.
3) Indización automática: es la realizada por programas informáticos sin
intervención humana mediante algoritmos basados fundamentalmente
en técnicas de asignación de pesos a las palabras, construcción de
tablas de asignaciones y consideraciones sobre la proximidad de las
palabras dentro del texto, dentro de cada párrafo y dentro de cada
línea. Puede dar resultados aceptables, pero es difícil de afinar y
ajustar dado que cada conjunto de términos tiene características
particulares que lo diferencian de los demás.
Este método y el anterior suelen utilizarse actualmente, sobre todo en la
indización de documentos digitales.
fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 7
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
memorias, anuarios, planes de estudio, etcétera,
4) otros documentos secundarios: bibliografías y bases de datos de educación
como el BIBE –Boletín Internacional de Bibliografía sobre Educación–, el ERIC
Database, Bulletin Signaletique Sciences de l´Education, las Bases de datos
del Ministerio de Educación, de las universidades, etcétera, y
5) lenguajes documentales: el ERIC Thesaurus, el Tesauro de la Unesco, el
Tesauro Europeo de la Educación de la Comisión de las Comunidades
Europeas y del Consejo de Europa, etcétera.
Fig. Nº 1: Fuentes de información
fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 8
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
También una publicación final puede responder únicamente a un fragmento de un
contenido original, a la totalidad de varios contenidos simultáneamente, y a todo el rango
de ocurrencias posibles entre ambos casos.
Un sitio bien diseñado, que refleje la existencia de una gestión de contenidos
permitirá:
- Almacenar diferentes versiones de cada documento.
- Compartir y actualizar documentos a varias personas en diferentes entornos y
con conocimiento desigual sobre el sistema.
- Almacenar un mismo documento en formatos diferentes (XHTML, PDF, etc.).
- Contener documentos en formato multimedia
- Proporcionar una navegación flexible a partir de la estructura de organización de
la información (secuencial, jerárquica, hipertextual, etc).
- Disponer de un sistema flexible y eficiente de búsqueda, indexación y consulta
de documentos.
La naturaleza heterogénea de la Web hace difícil la adopción de un sistema de
organización rígidamente estructurado. Para los recursos tradicionales eso era resuelto
por catalogadores, personas especializadas que agregaban metadatos (etiquetas que
explicitan información) a los libros: qué tema trata, dónde está ubicado, cuál es el autor,
etc. Estos metadatos están accesibles en un catálogo en las bibliotecas. En la Web no
tenemos catálogo ni catalogadores. Más aún, con el volumen de información que crece
cada día, es imposible que las personas se preocupen en clasificar la información.
Además, porque el modelo de la Web es distribuido, quienes publican tienen diversas
visiones sobre cómo clasificar sus objetos informativos. Por esta razón, el intento de
encontrar un sistema único para organizar los contenidos heterogéneos de la Web es
una tarea de difícil solución.
Por otra parte, el concepto de "organizado" cambia de un usuario a otro. Lo que
para nosotros puede resultarnos muy "lógico" puede que para otra persona no lo sea.
Para Gómez Reyes (2002) “si se estudia el fenómeno de Internet y de toda la
información que ella contiene, se encuentra que sus principales dificultades radican en
que no siempre es posible recuperar la información existente sobre un tema determinado
porque no se realiza un adecuado proceso de clasificación e indización o se dificulta la
recuperación de la información ubicada en una página web por una inadecuada
organización de los contenidos”.
No es sorprendente, entonces, que casi un tercio del tiempo que los usuarios
pasan en Internet lo dediquen a hacer búsquedas (Navarro, 2008).
fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 9
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
- Esquemas cronológicos, los encontramos en los diarios, las carteleras de
televisión, los archivos de revistas electrónicas, etc.
- Esquemas ambiguos, dividen la información en categorías que proponen
definiciones exactas. Están impregnados por la ambigüedad del lenguaje y de la
subjetividad humana. En estos esquemas alguien que no es el usuario ha tomado
una decisión sobre cómo agrupar los elementos, por ello este esquema soporta
un modo "casual" de buscar información a partir de la agrupación de los
elementos de manera que puedan comprenderse intelectualmente. Entre los
esquemas ambiguos, los más comunes son los que organizan la información:
- según el asunto o la materia,
- según los intereses de la audiencia potencial,
- a través de metáforas de la vida cotidiana.
Pero, aún suponiendo que todos los sitios disponibles en la Web se encuentren
organizados de alguna forma –según la visión del emisor– la Web se vuelve telaraña –y
en ese sentido un espacio desorganizado– a partir de la vinculación sin patrones entre
los diversos sitios –o páginas de éstos–. Internet nos ofrece una nueva organización que
no es rígida, que crece y se modifica diariamente, se autotransforma y por lo tanto tiene
la flexibilidad de lo imprevisible y de las incertidumbres En este espacio “global” los
contenidos están poco estructurados y organizados y existen necesidades acuciantes de
un ordenamiento, clasificación y análisis para facilitar su búsqueda, uso y la disminución
del consumo de tiempo para encontrar aquello que realmente necesitamos.
Navegar en la Web nos proporciona enormes cantidades de información,
transitamos constantemente del orden al desorden y viceversa. Lo hacemos a través de
un sistema de redes que se interconectan entre sí, para proporcionarnos acceso a esa
gran cantidad de información, o para permitirnos la comunicación con personas
apartadas geográficamente, que se acercan inmediata y simultáneamente mediante
Internet. Estamos hablando de experiencias tecnológicas que se insinúan impredecibles,
recorridos llenos de incertidumbres, con innumerables posibilidades. Estamos
experimentando transformaciones en los procesos tanto de información como de
comunicación, por lo que cabe preguntarnos:
¿Cómo recuperar en un espacio (des)organizado?
¿Son las herramientas de búsqueda las que nos ofrecerán un orden a partir del
desorden?
¿Es la Web semántica la solución?
fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 10
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
El entusiasmo con que fueron recibidos los tesauros y los programas informáticos
de búsqueda, como es de imaginar, llevó a que no todos adopten el mismo sistema.
Unos prefieren el Dewey, otros la CDU, otros el Catálogo por abecedario del Congreso
de EEUU. Y no faltan quienes sostienen que clasificar y catalogar datos tan efímeros es
una pérdida de tiempo. Ahora se han incorporado los programas informáticos –los
motores de búsqueda– que facilitan la recuperación con distintos enfoques simultáneos.
Pero sea cual fuere la organización utilizada, hay que considerar que toda
clasificación:
1) es restrictiva, ya que siempre es posible admitir otra clasificación con otras
ventajas y desventajas.
2) debe ser satisfactoria conceptualmente y permitir búsquedas rápidas y
seguras (obviamente, una clasificación no es inmutable).
3) debe crear un vínculo entre la persona que emite el mensaje y la que lo
recibe –un metalenguaje que armonice pregunta y respuesta–.
A menudo, la búsqueda de información es iterativa e interactiva. Lo hallado en los
momentos iniciales de la búsqueda puede influir sobre lo que se halle más adelante. En
todo este proceso de búsqueda de información están presentes elementos del
conocimiento asociativo y el aprendizaje.
Se percibe claramente que siempre se podrá generar una estrategia de
búsqueda eficaz, que indicará qué términos deben ser usados y en qué forma deben
ser expresados. De eso hablaremos más adelante.
fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 11
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
Figura Nº 2.
Fig. Nº 2: Personas conectadas a la Web según lengua nativa (IWS, 2017)
fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 12
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
Si bien en general pocos estudios suelen tener en cuenta los correos, los foros
electrónicos, las bases de datos o páginas que no son públicas, la representación del
español no ha llegado aún a un nivel acorde con su población en el mundo real.
La Organización de las Naciones Unidas para la Educación, la Ciencia y la
Cultura (UNESCO) ha publicado un informe titulado "Hacia las sociedades del
conocimiento" (noviembre 2005) en el que alerta el riesgo que tienen de desaparecer, a
lo largo de este siglo, cerca de un tercio de los 6.000 idiomas que se hablan hoy en el
planeta, posibilidad agravada por el uso de tecnologías como Internet, dado que estas
lenguas no se escriben, sino que son exclusivamente orales. El 96% de las lenguas son
habladas por 4% de la población mundial, y más de 80% de las lenguas son endémicas
y están confinadas a un solo país. Únicamente veinte idiomas del mundo cuentan varios
cientos de miles de hablantes en diferentes países. Aunque las cifras varían en función
de los métodos de recuento -los datos de Linguasphere, SIL, Ethnologue, Encyclopédie
Millenium son sensiblemente comparables, algunas de estas organizaciones suman a
los que las tienen como lengua materna y a quienes las hablan como una segunda
lengua-, la Encyclopédie Millenium (1998) estima que cerca de la mitad de la población
mundial se expresa en una de las ocho lenguas de mayor difusión. Además, en la
actualidad existen, según el proyecto de la Alianza para la Diversidad Lingüística, 3054
idiomas en peligro de extinción (http://www.endangeredlanguages.com, 2012)
La UNESCO explica que Internet, a pesar de la ventaja que conlleva, puede
acelerar la "extinción" de ciertos idiomas al favorecer la "homogeneización" en lugar de
la diversidad: "Tres de cada cuatro páginas en Internet están escritas en inglés. Sin
embargo, el número de cibernautas cuya lengua materna no es el inglés excede del
50%, porcentaje que sigue aumentando", indica el documento (Figura Nº 3).
en peligro
de extinición
representadas
52% en Internet
10%
Hasta ahora, la mayoría de las lenguas que existen están ausentes en Internet en
beneficio de las ocho lenguas más utilizadas del mundo, encabezadas por el inglés. Esto
no sólo margina a miles de culturas, sino que constituye una posible amenaza para la
diversidad de los contenidos.
“La globalización de la ciencia ofrece innumerables oportunidades para el
adelanto intelectual. Pero a menos que construyamos mejores puentes entre las
comunidades lingüísticas, innumerables ideas e innovaciones serán ignoradas y
perdidas efectivamente” (Barany, 2005)
fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 13
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
Un estudio realizado por las organizaciones ISOC, OCDE Y UNESCO (2011)
corrobora “que los contenidos locales, la infraestructura y los precios del acceso a
Internet son tres elementos que están relacionados entre sí y que se pueden sustentar
mutuamente en un círculo virtuoso:
• cuanto mejor es la conectividad, tanto mayor suele ser el nivel de creación
de contenidos locales digitales;
• los países que cuentan con mayor infraestructura de Internet (a todos los
niveles de ingresos) son también los que producen mayor cantidad de
contenidos digitales, como lo muestra el número de artículos de Wikipedia
y páginas web con determinados códigos de país en dominios de alto
nivel”.
Esto nos lleva a apreciar que la capacidad de acceso y asimilación que permite
tratar la avalancha creciente de información y conocimiento es muy desigual, según los
grupos sociales y los países.
➔El acceso a Internet es menos democrático de lo que parece, a pesar de que se
afirma lo contrario con alguna ligereza. Este comentario se verifica cotejando no sólo los
porcentajes de población real que accede a este medio, sino también las distintas
posibilidades de acceso real a sus contenidos.
¿Es, entonces, la ficción de la igualdad de oportunidades?
fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 14
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
4. Recuperación de información
¿Cómo buscar en la Web?, ¿Cómo recuperar información en la Web?
¿Cómo se reconocen las configuraciones que aseguran la “calidad” de la
información?
¿Cuánto tiempo se pierde buscando dónde está la información?
Coincidimos en que:
1) la cantidad de información nos supera;
2) la información se estructura en forma más compleja;
3) existe variabilidad espacial y temporal;
4) los medios de comunicación son imprecisos;
5) esos medios tienen un enorme poder en nuestra sociedad.
Entonces, tenemos que concentrarnos en:
1) eliminar rápidamente la información poco confiable o repetitiva;
2) buscar los puntos de imprecisión, para poner a prueba la consistencia de
la realidad que se nos plantea;
3) resistirnos a aceptar la tendencia mayor, sin una crítica lo más objetiva
posible.
Mucha información, ¿es sólo cuestión de números?
En un estudio realizado en la Universidad de Berkeley, Bergman (2000) distingue
dos ámbitos en la Web:
a) la Web visible cuya información puede recuperarse utilizando las
herramientas de búsqueda tradicionales, y
b) la Web invisible o Web profunda (Figura Nº 4) a la que no tienen
acceso los motores de búsqueda. En cuanto a esta denominación Codina
la refiere como inadecuada, ya que, si ese concepto refiere al sector de
sitios y de páginas web que no pueden indizar los motores de búsqueda de
uso público, “debería denominarse, en realidad, la web "no indizable", lo
cual es un término mucho más adecuado, pero claramente alejado de la
capacidad sugeridora del término invisible”. (Codina, 2003)
A su vez, Sherman y Price (2001) caracterizan cuatro tipos de contenidos
invisibles en la Web profunda, que llaman: 1) Web “opaca", 2) Web “privada", 3) Web
“propietaria”, y 4) Web “realmente invisible”.
La Web opaca se compone de archivos que podrían estar incluidos en los índices
de los motores de búsqueda, pero no lo están debido a razones de extensión de la
indización. La Web privada consiste de sitios que podrían estar indizados en los motores
de búsqueda, pero que son excluidos en forma deliberada, porque sus páginas están
protegidas por contraseñas o porque contienen restricciones para esos dispositivos de
búsqueda. La Web propietaria incluye a todas aquellas páginas en las que es necesario
registrarse para tener acceso al contenido, ya sea en forma gratuita o paga. Y la Web
realmente invisible, que se compone de páginas que no pueden ser indizadas por
limitaciones técnicas de los buscadores.
Hoy en día nos encontramos con algo más de 1.200 millones de sitios web,
aunque debemos indicar que cerca del 75% no se encuentran activos (InternetLiveStats,
fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 15
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
2017). De este universo y según un estudio de la Universidad de Iowa (Gulli y Signorini,
2005) la Web indizada –la parte de la Web a la que los buscadores pueden acceder– es
de alrededor de 11.500 millones de páginas. En cuanto a la Web profunda, la
investigación de Bergman (2001) ha estimado que la información contenida en la Web
invisible es aproximadamente 550 veces mayor que la de la web superficial y crece a
mucha mayor velocidad. Un estudio de Cyveillance (2000) calcula que el tamaño de la
Web profunda es 275 veces mayor que el de la Web visible mientras que estimaciones
posteriores señalan que el tamaño de la Web invisible es sólo entre 2 y 50 veces mayor
que el de la Web visible (Sherman y Price, 2001). Las diferencias en las cifras se deben
a las diferentes metodologías utilizadas en las investigaciones. En cualquier caso, el
tamaño de Internet hoy es significativamente mayor -1000 millones de sitios cada uno
con cientos o miles de páginas-, por lo que el valor de la información contenida en la
llamada Web profunda justifica el estudio de sus formas de acceso.
Fig. Nº 4: La Web invisible
Web visible
Base de datos
Sitios protegidos
Web sin enlazar
Sitios estatales
Intranets
OPAC
etc. Web invisible
“Web oscura”
fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 16
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
nuestras estrategias de búsqueda.
Para Jaczynski (1999), existen dos métodos básicos a través de los cuáles los
usuarios buscan información en la Web: a) preguntando –querying–y, b) explorando
–browsing–.
Querying es una búsqueda basada en palabras claves, en la que el motor de
búsqueda coloca la palabra –o combinación de palabras– clave en su índice de palabras
y devuelve una lista ordenada de documentos.
Browsing es la navegación a través de vínculos hacia un tema de interés. Los
usuarios suelen explorar cuando tienen objetivos generales o no pueden expresar sus
objetivos explícitamente como combinación de palabras clave. Algunos estudios dan
cuenta de la dificultad de los usuarios con los mecanismos de los motores de búsqueda,
ya que la expresión booleana a veces no se acerca al lenguaje natural. Es así que la
búsqueda de información resulta, en muchas ocasiones un proceso iterativo, en el que la
respuesta a una pregunta produce una reformulación de la propia pregunta y por lo tanto
de lo que realmente es relevante para el que busca.
Para avanzar en el tema de recuperación de información, nos vamos a centrar en:
• Buscadores y metabuscadores
• Directorios de información y portales
• Bases de datos electrónicas
Cada uno de ellos tiene fortalezas y debilidades, así como características
particulares y proveen diferentes servicios. Conocerlos y compararlos es importante para
los usuarios, ya que ello les permitirá llevar adelante las estrategias adecuadas para
optimizar su utilización. Podemos comparar los motores de búsqueda según:
A. las características de la búsqueda:
- Concepto de búsqueda: el motor no sólo busca la palabra clave, sino
también sinónimos o similares.
- Exclusión: posibilidad de excluir resultados a partir de la inclusión de
términos específicos.
- Restricciones: búsqueda de términos contenidos en alguna parte de la
página o dentro de una página especial (de imagen o video) o en sitios con
dominios específicos (.com, .edu). Restricciones en cuanto a la fecha de
creación o actualización de una página, así como la búsqueda en varios
idiomas.
B. las características del motor:
- Tamaño: qué cantidad de páginas tiene indizada en su base de datos.
- Lugares en el que busca: en toda la página, en el encabezado, en la URL,
etc.
- Recursos indizados: además de la Web, otros recursos como newsgroup,
e-mail, ftp, etc.
C. los resultados obtenidos:
- Métodos de ordenamiento o visualización: diferentes parámetros pueden
ser utilizados para especificar el orden de los resultados.
- Sugerencias de búsqueda: a partir de la búsqueda inicial.
fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 17
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
- Resultados similares: visualización de páginas con resultado similar.
4.1. Buscadores
fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 18
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
mayor número de empresas que están montando “Intranets”', esto es, redes de
computadoras con características muy similares a Internet pero cuyo acceso está
restringido a los empleados de la empresa. Si la empresa es suficientemente grande, es
muy probable que exista un elevado número de servidores Web suministrando
información dentro de la Intranet. Empresas como AltaVista o Google proporcionan el
motor de búsqueda para construir un buscador que funcione en una Intranet, facilitando,
de esta forma, el acceso a la información por parte de las personas que han de trabajar
en ella.
Por último, cabe agregar que los buscadores arrojan resultados sobre las
búsquedas realizadas en sus propios índices y no sobre la web directamente. Esto
último sería imposible debido al volumen de información y al tiempo requerido para
realizar la búsqueda. El rastreo de páginas web que efectúan los spider o robots se
realiza con periodicidad variable, por ello siempre existe una diferencia entre lo que
pueden recuperar los buscadores y lo que realmente se encuentra en la web.
4.2 Meta-buscadores
A veces resulta difícil encontrar lo que uno busca en la red, aún haciendo uso de
buscadores. Cualquiera que haya realizado una búsqueda algo compleja en la red habrá
encontrado que, dependiendo del buscador que utilice, el número y tipo de respuestas
puede ser de lo más variado.
Generalmente, el proceso de búsqueda en la red consta de los siguientes pasos:
1. Elegir un buscador
2. Describir la información de interés a través de palabras clave o tópicos, de
acuerdo con la estructura particular de consultas que permita el buscador, el cuál
la traducirá a una especificación formal interna, más fácilmente manejable.
3. Iniciar la búsqueda.
4. Analizar la lista de respuestas.
En función del número de respuestas obtenidas y de su interés, se refina la
búsqueda volviendo al paso 2 o se elige un nuevo buscador, paso 1, repitiéndose el
proceso.
Este proceso puede ser automatizado de alguna forma. Existen programas en la
red –metabuscadores– que funcionan como buscadores, pero en donde el proceso de
búsqueda se realiza entre un conjunto relativamente elevado de otros buscadores,
integrando la información resultante de forma que obtengamos mejores resultados. El
proceso de integración consiste, entre otras cosas, en eliminar la multiplicidad de las
respuestas y establecer un orden en función de las respuestas proporcionadas por los
buscadores y por el número de veces que el resultado haya aparecido en distintos
buscadores.
En síntesis: los metabuscadores no disponen de una base de datos propia, sino
que utilizan la información almacenada en las bases de datos de otros buscadores y
directorios, es decir que hacen las búsquedas simultáneamente en varios motores.
Dogpile http://www.dogpile.com
Se trata de un metabuscador que lista las salidas suministradas por los
buscadores tales como: Google, Yahoo!, Bing y Ask.
fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 19
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
4.3 Google: algo más que un buscador
Google –con alrededor de 49 mil millones de páginas web indexadas
(WorldWideWebSize, 2016)– es un buscador que mantiene todas las ventajas de un
robot de búsqueda automática, pues consigue rastreos muy amplios, pero elimina el
problema de la información basura y atrasada. Este avance lo logra dado que aplica
como criterio principal para ordenar los resultados el número de enlaces que se dirigen
desde los millones de páginas rastreadas hacia otras webs y no, como algunos de los
buscadores automáticos, el número de veces que una palabra clave se repite en una
página. Esto, en definitiva, consigue que sean los propios usuarios de Internet, mediante
sus particulares selecciones de páginas favoritas en cada momento, quienes determinen
el orden en el que aparecerán los resultados al realizar una búsqueda en Google. En
teoría, los resultados de este buscador son de calidad adecuada y actual.
Para ordenar documentos (decidir su importancia respecto de una consulta)
Google utiliza un algoritmo propio denominado PageRank. El concepto básico del
algoritmo PageRank es que una página es más importante en la medida en que más
páginas apuntan hacia ella –principio inspirado en el número de citas que garantiza la
calidad de los artículos académicos: cuantos más artículos citan una publicación, más
valor adquiere ese trabajo, y más valor y visibilidad adquieren los artículos que ese
trabajo cita (Grau, 2013–. Por lo tanto, según el algoritmo la importancia de una página
depende de:
(1) cuántas páginas apuntan a ella,
(2) la cantidad de enlaces en estas páginas, y
(3) cuántas y cuán importantes son las páginas que apuntan a la página.
Con el tiempo Google comenzó a diseñar algoritmos que le permiten: listar sitios
con publicidades (lo que lo ha llevado a ser una de las empresas más ricas), corregir
errores de ortografía y aprender de nuestras búsquedas anteriores. Este último algoritmo
que procesa información basada en nuestro comportamiento, filtra los resultados
teniendo en cuenta “nuestras búsquedas anteriores”. Estos sistemas de recomendación
limitan el espectro de la búsqueda porque sólo nos ofrecen “lo que queremos”
desechando la objetividad, lo casual, lo inesperado, lo no-buscado (Grau, 2013).
¿Porqué algo más que un buscador?
Google tiene intereses en multitud de industrias: internet, publicidad, automotor,
electricidad, biotecnología, aeronáutica, telefonía, etc. Además, es la mayor base de
datos personales jamás creada, concentrando información sobre tendencias y
comportamientos de los usuarios a través de sus diferentes aplicaciones: Google
Desktop, Google Docs, Google+, Google Chrome, Google Analytics, Gmail, Google
Maps, YouTube, etc. Dado su tamaño y poder tiene la capacidad “de imponer sus
productos y servicios a un volumen de mil millones de usuarios” (Suarez Sánchez-
Ocaña, 2012). Según un estudio realizado en mayo de 2011 por la empresa ComScore,
Google superó en dicho mes la cifra de 1000 millones de visitantes únicos.
El proceso de búsqueda no es tan anónimo como los usuarios creemos y los
correos de Gmail son escaneados, es por ello que a partir del análisis y estudio de todos
esos datos recogidos Google no le da al usuario lo que quiere o cree necesitar, sino que
le ofrece lo que “realmente” necesita según “el criterio Google”.
Por otra parte, ya hay estudios (Reischl, 2008) que demuestran que Google
fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 20
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
manipula los resultados e influye en el ranking (por ejemplo, favoreciendo a Wikipedia).
Más que una guía en el proceso de búsqueda Google se ha transformado en un
proveedor de “sus propios contenidos” (fotos, videos, libros, etc). Queda claro que este
comportamiento avanza sobre los conceptos de libertad, objetividad y privacidad.
Los conocimientos sobre los usuarios son el verdadero capital de esta empresa y
la base para sus futuros proyectos.
fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 21
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
4.5 En síntesis
Como hemos visto, los buscadores y directorios se conforman y funcionan de
manera diferente. Así, las formas de búsqueda más eficientes varían en unos y otros.
Mientras que la búsqueda por palabras -querying- es más adecuada en los buscadores,
la navegación –browsing- es más recomendable en los directorios. En general las
herramientas hasta aquí descriptas tienen ciertas limitaciones que hemos detallado
previamente y que podemos resumir de la siguiente manera:
• Mecanismo de pregunta: las preguntas de los usuarios son introducidas a
partir de un conjunto de palabras clave. Muchas veces las necesidades de
información no pueden ser formuladas fácilmente a través de la sintaxis
booleana.
• Cobertura de páginas web: sólo “barren” una porción limitada de la Web visible
•Largas listas de resultados con baja relevancia respecto a la pregunta del
usuario. La relevancia está dada por algún método del motor de búsqueda
(análisis estadístico de frecuencia de palabras en el texto, análisis de la
frecuencia con que las páginas están ligadas a otras, etc.), método que carece
de información acerca del contexto, del comportamiento y de las preferencias
del usuario.
Según Cornellá (1998) podemos definir “dos tipos fundamentales de relevancia.
La relevancia formal: cuando los resultados de una búsqueda de información responden
a la ecuación de búsqueda que se había planteado. Y la relevancia semántica: cuando
los resultados obtenidos responden a las necesidades del usuario.” Cuando hablamos
de baja relevancia podemos referirnos, entonces, a información poco relevante
formalmente: la sintaxis de búsqueda es pobre, está mal definida o el lugar en el que se
busca no es el adecuado, y a información irrelevante semánticamente: no sirve para
resolver la necesidad de información.
Por todo ello –y si bien los motores de búsqueda han mejorado en su
funcionamiento y cobertura– es que usuarios con necesidades específicas no siempre
encuentran la información requerida en la Web ya que los motores de búsqueda son
incapaces de responder a “la necesidad que hay detrás de la pregunta”.
Podemos describir este problema como el problema de los lenguajes:
La necesidad de información se plantea en lenguaje natural ➔ Esta necesidad
expresada se transforma en un lenguaje documental formalizado ➔ A su vez,
éste debe transformase en una expresión en lenguaje de recuperación.
En la web, y aún con la ayuda de las interfaces gráficas, el problema se encuentra
en la transición entre los lenguajes.
fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 22
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
Google Scholar http://scholar.google.com
Redalyc http://www.redalyc.org/home.oa
DOAJ -Directory of Open Access Journals- https://doaj.org
SCIELO http://www.scielo.org.ar/scielo.php
EdITLib http://www.editlib.org (aprendizaje y tecnología)
SISBI –Sistemas de Bibliotecas y de Información de la UBA–
http://www.sisbi.uba.ar/
CiteSeerX http://citeseer.ist.psu.edu (Computer and Information Science)
UNESCO Library http://www.unesco.org/library/
fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 23
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
¿Cómo recuperamos información en las bases de datos electrónicas? ¿Por qué
los catálogos en línea nos resultan difíciles de usar?
Según Borgman (1988a) los catálogos en línea presentan dificultades en su uso
porque su diseño no incorpora conocimiento sobre el comportamiento de búsqueda de
los usuarios. La estructura de los registros, contenidos y los campos primarios de
búsqueda son diseñados desde el modelo del catálogo tradicional, mientras que las
funciones de búsqueda y algunas características de la interface, desde los modelos de
recuperación de la información.
Cuando nos referimos al modelo tradicional de estructura de los catálogos –card
catalogs- hablamos del modelo del siglo XIX aún presente (Buckland, 1992) y definido
por Cutter en 1904 como aquel que está diseñado para:
1.- permitir al usuario encontrar un libro del cual conoce:
el autor
el título
el tema
2. para demostrar lo que una biblioteca tiene:
de un autor dado
sobre un tema en particular
sobre algún género literario
3. asistir en la elección de un trabajo:
en cuanto a su edición (bibliográfico)
en cuanto a su carácter (literario o temático).
Basados en este modelo se asume que el usuario comienza su proceso de
búsqueda sabiendo al menos uno de los tres puntos de acceso (autor, título o tema), sin
embargo, varios estudios sobre el comportamiento en la búsqueda de información
(Borgman y Siegfried, 1992; Chen y Dhar, 1990) –tanto en ámbitos de búsqueda manual
o automática– muestran que las personas inician su proceso de búsqueda con
información incompleta sobre algunos de los tres puntos de acceso.
En las bases de datos electrónicas, y dependiendo de los campos que conformen
sus registros, la indexación suele estar hecha por autor, título, editorial, disciplina,
corrientes filosóficas, años, descriptores, etc. Es importante hacer hincapié que la
sintaxis booleana de búsqueda -por palabra clave- actuará sobre los campos
bibliográficos indexados y que éstos no son índices de ocurrencia de palabras como los
generados por los buscadores. Es por ello que, si el usuario desconoce los puntos de
acceso tradicionales, la forma más adecuada para comenzar la búsqueda será a partir
del uso de los descriptores. Recordemos que los descriptores no son lo mismo que las
palabras clave. Son términos organizados en un tesauro que describen el tema con que
se relaciona el documento o artículo (ver punto 2.2.2 de este documento).
Para la recuperación de información en estos sistemas sugerimos, antes de
comenzar la búsqueda, tomar un tiempo para conocer el modelo de indexación por
campos y explorar el tesauro, siguiendo los siguientes pasos:
fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 24
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
1. Describir el tema con palabras propias
2. Dividir el tema en conceptos principales
3. Utilizar el tesauro para localizar los descriptores apropiados a cada
concepto identificado.
La parte más compleja del proceso suele ocurrir “fuera de línea”: analizar la
necesidad de información, identificar los conceptos principales y articularlos.
Buscadores
Querying ➔ sobre índices de palabras
Metabuscadores
Portales
Directorios Browsing
Base de Datos
OPAC Querying ➔ sobre descriptores de un tesauro
fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 25
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
• Venta de estupefacientes y armas
• Trata de personas
• Publicación de información secreta sobre organizaciones legales (ej.
servicios secretos o grandes empresas comerciales).
• Publicación de información secreta sobre organizaciones criminales
Pero es importante resaltar que en la Web Profunda no es este su único
contenido, hay un montón de páginas que no tienen nada de incorrecto. Al ser un
sistema autónomo, inmenso y hasta el momento desconocido para millones de
personas, la Web Profunda está inmersa en un roce permanente entre lo lícito y lo ilícito.
Incorrecta Correcta
fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 26
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
palabra buzzword.
¿Cómo traducimos buzzword? O deberíamos mejor plantear ¿cómo explicamos
qué es un buzzword?
Es un término utilizado en área específicas (tecnológicas, administrativas,
políticas, etc.) que “suena importante y es usado para impresionar a las personas o
describir vagamente un concepto en forma intencional”. Si bien difiere de la jerga, ya que
ésta es entendida como el lenguaje especial y familiar que usan entre sí los individuos
de ciertas profesiones y oficios, para ambos casos nos encontramos que la traducción a
otro idioma de un término de esas características resulta dificultosa.
Y si no, ¿cómo traduciríamos al inglés el término infoxicación, y el término
infonomía (Cornellá, 2000)?
Y en castellano ¿qué significa la expresión Social Informatics? ¿Algo así como
Socioinformática? ¿Y qué queremos decir con Socioinformática?
El texto de este documento también es ejemplo de uso de jergas informáticas en
inglés de compleja traducción (nos referimos a traducción con sentido, no a traducción
literal): querying, browsing, crawl, academic gateways, etc.
Por último, debemos referirnos a las denominaciones en otros idiomas del
concepto buscado. Este aspecto nos obliga no sólo a saber (o por lo menos tener idea)
de la traducción de los conceptos, sino a conocer los paradigmas desde los cuales se
aborda la disciplina en cuestión.
Un ejemplo que nos puede interesar: en el ámbito de las ciencias de la educación
buscaríamos didáctica para recuperar información sobre metodologías de enseñanza.
Su traducción literal “didactics” puede ayudarnos a encontrar documentos de origen
europeo, pero si deseamos revisar la literatura norteamericana sobre el tema… poco o
nada encontraremos. La clave allí es que para los norteamericanos desde el paradigma
desde el cual estudian y analizan los métodos de enseñanza, la expresión bajo la cual
definen este concepto es “Instructional Design”. Una simple exploración del Tesauro del
ERIC da cuenta de la inexistencia del término “didactics” como descriptor, pero sí
encontraremos el término “Instructional Design”.
El carácter flexible, plural y descentralizado de Internet, es una virtud para la
diversidad de contenidos en distintos idiomas, pero a la vez una desventaja para la
efectividad de la búsqueda de información, requiriendo de una reflexión profunda antes
de comenzar a planificar una estrategia.
Hasta aquí hemos visto que el proceso de búsqueda en la Web requiere tres tipos
de “conocimiento”:
- conceptual, del proceso de traducción de una necesidad de información a una
expresión investigable,
- semántico, de cómo expresar la pregunta o expresión investigable en lenguaje
de recuperación de un sistema dado,
- tecnológico (habilidades) en cómo usar los sistemas de búsqueda basados en
computadora.
fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 27
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
5. Del tesauro a la Web Semántica
Suele suceder –bastante a menudo- que los motores de búsqueda no “listan” lo
que buscamos. Esto pasa porque los buscadores funcionan de manera puramente
“sintáctica”, es decir, no “entienden” las palabras. Desafortunadamente, al nivel del
significado (semántica) aún estamos muy por debajo de nuestras necesidades. Estamos
lejos de responder preguntas como “todos los museos que exhiban trabajos de Dalí” o
“¿Cuál es la biblioteca que tiene la mejor colección de los escritos de Gandhi?” o “¿Cuál
es la compañía que ofrece el mejor tour a Tailandia teniendo en cuenta precio y
categoría?”. Un motor de búsqueda estándar (como Google, Yahoo!, etc.) no puede
responder tales consultas. Sin embargo, la información está allí: hay que relacionarla y
agregarla. La limitación obedece a la falta de capacidad de las máquinas para entender
el significado y las relaciones entre las partes de información que recolectan. Hoy en día
somos los humanos quienes agregamos el contexto, interpretamos y damos sentido a la
información que existe en la Web. Entonces, ¿qué hacer?
El proyecto que intenta señalar el futuro de la Web es el promovido por el
organismo W3 Consortium: la Web Semántica - Semantic Web-, que intenta transformar
la Web actual de tal forma que la información y los servicios sean entendibles y usables
tanto por computadores como por personas. Para explicar este concepto, nos
permitimos introducir el siguiente ejemplo:
- Año 2009: para un docente de una institución educativa es muy simple solicitar
a sus alumnos que busquen información en Internet, sin preocuparse
demasiado por el tiempo que les toma y si entienden las razones de la
búsqueda. El alumno busca información así: utiliza un browser y en Sitios
como Google o Altavista encuentra gran cantidad de enlaces. Los revisa y, si
tiene suerte, extrae la información solicitada por su profesor, que recibe la
información por parte de su alumno algunas horas después.
- Año ¿2020?: un niño pregunta a “su asistente personal” -que lleva puesto
(algo así como un monóculo como pantalla y un teclado en su chaqueta)-:
¿quién era el entrenador cuando mi equipo favorito le hizo dos goles al
campeón del mundo en el 2006?”. El asistente personal busca Sitios Web
dónde encontrar lo solicitado por el niño, quien en poco más de un minuto
recibe la respuesta.
En ambos casos, el alumno y el asistente son agentes que tienen las siguientes
características:
• entienden lo que se le pide buscar,
• comprenden el contenido de los Sitios Web que visitan,
• validan si lo encontrado corresponde a lo que se le pidió buscar, y
• deducen nueva información de la ya obtenida.
Pero, en el año 2009 el alumno es un agente humano, mientras que en el año
2020 el asistente es un agente digital. En el ¿2020? se espera que las computadoras
puedan desarrollar tareas de gestión que requieran interpretar información y tomar
decisiones adaptándolas al contexto.
Actualmente la Web se asemeja a un grafo formado por nodos –sin distinción de
tipos- y enlaces igualmente indiferenciados. Por ejemplo, no se hace distinción entre la
página personal de un profesor y el portal de un negocio on-line, como tampoco se
fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 28
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
distinguen explícitamente los enlaces a las asignaturas que imparte un profesor de los
enlaces a sus publicaciones. Por el contrario en la Web semántica (Figura Nº 5) cada
nodo se corresponde a un tipo y los enlaces representan relaciones explícitamente
diferenciadas.
Fig. Nº 5: La web semántica
fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 29
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
6. ¿Cómo buscar?
Recuperar información es un problema complejo porque requiere describir
información que aún no se tiene. Dicha necesidad resulta difícil de trasladar a un
lenguaje normalizado y la respuesta será un conjunto de documentos que pueden
contener, sólo probablemente, lo deseado y con un evidente nivel de incertidumbre. En
la recuperación información, el criterio de valor es el grado en el que la respuesta
obtenida satisface las necesidades de información del usuario, es decir, su percepción
personal de utilidad (Blair, 1990).
Tramullas (1997) destaca un aspecto importante de las reflexiones de Blair, “la
importancia, en ocasiones ignorada, que tiene el factor de predicción. Predicción por
parte del usuario, ya que éste debe intuir, en numerosas ocasiones, los términos que
han sido utilizados para representar el contenido de los documentos,
independientemente de la presencia de mecanismos de control terminológico. Este
criterio de predicción es otro de los elementos que desempeñan un papel fundamental
en el complejo proceso de la recuperación de información”
Buscar información en Internet no implica, necesariamente, “encontrar
información”. Por ello, por evidente que pueda parecer, la primera pregunta que hay que
formularse cuando se desea encontrar información es:
¿Qué necesito encontrar?
Martinet y Martin en su libro L'Intelligence Economique (1995) proponen la
existencia de dos tipos de ignorancia: "ignorancia profunda" e "ignorancia conocedora".
Analicemos esta idea mediante un ejemplo aportado por Cornellá (1998): Supongamos
una situación en la que alguien precisa una determinada información. Puede ocurrir que
ese alguien sea muy conocedor del tema en cuestión, y que, en consecuencia, tenga
muy claro cuál es la información que le falta; en esta situación, esa persona es
consciente de su ignorancia (sabe lo que no sabe), y conoce bien su horizonte de
conocimientos; esta es la situación de la ignorancia conocedora. Pero puede también
ocurrir que la persona no sea consciente de mucha información que le podría ser de
utilidad; en este caso, que podemos denominar ignorancia profunda, no tenga idea de
un gran panorama de información, que ni conoce ni ha manifestado necesitar (no sabe lo
que no sabe).
Y aquí surge una cuestión interesante: buscar información en Internet, ¿ayuda a
reducir la ignorancia conocedora (nos ayuda a encontrar justo la información que
necesitamos), o bien ayuda a darnos cuenta de lo muy profunda que es nuestra
ignorancia (encontramos más información de las que imaginábamos)?
Las estrategias para buscar información implican tomar decisiones y escoger las
fuentes de información más convenientes para el trabajo en cuestión. Por ello, cuando el
problema esté claramente definido, se analiza la gama de posibles fuentes de
información.
En el contexto que hemos estado describiendo a lo largo de este artículo,
gestionar información se ha transformado en una tarea cada vez más importante ya sea
para nuestra actividad personal como para nuestro trabajo. Normalmente dedicamos
poco tiempo, lo hacemos mal, de manera poco estructurada, y nadie nos forma para
saber manejar información.
Por ello, nuestra siguiente reflexión será:
¿Cómo nos informamos? ¿Cómo debo buscar? (Figura Nº 6).
fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 30
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
Fig. Nº 6: El proceso de informarse
3a.- Identificar
las fuentes
3b.-Aprovechar
el tropiezo pasivo
2.- Saber buscar – serendipia–
1.- Identificar la
4.-“Saber” filtrar
información
según los objetivos
necesitada
fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 31
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
saberes socialmente significativos y para desarrollar competencias y habilidades
cognitivas e interpretativas propias del área en estudio.
En lo referente a la búsqueda, una correcta planificación nos permitirá separar el
éxito del fracaso más que ninguna otra competencia. (Figura Nº 7).
Obviamente, no hay una receta definida y fiable para buscar información en
Internet en tiempo y calidad razonables, pero disponemos de elementos que nos
permiten construir estrategias y esquemas de comportamiento para afrontar un uso
satisfactorio y encontrar lo deseado.
Figura Nº 7: Decisiones relevantes en el proceso de búsqueda de información
fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 32
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
información. Algunas situaciones que originan esa dificultad son:
- el conocimiento del tema, la forma de expresarlo y el tipo de lenguaje que
empleamos.
- la inhabilidad para escribir una especificación correcta de requisitos.
- la falta de conocimientos para la verificación de los requisitos.
- no identificar qué herramienta y/o metodología usar.
Definir correctamente las necesidades de información, disminuye aburridas,
inútiles y costosas tareas de búsqueda. Una vez establecido el valor de una buena
especificación de requisitos, surgen otras cuestiones:
¿Cómo desarrollarlos?
¿Cómo saber si un conjunto de requisitos es bueno?
¿Qué herramientas y métodos pueden ayudar?
Estas preguntas no tienen una respuesta única y definitiva, puesto que
continuamente surgen nuevas herramientas y métodos. Pero lo importante es entender
que la caracterización de los requisitos debe realizarse con la mayor claridad posible.
Dependiendo de la definición de los requisitos, variarán los métodos, las técnicas y
herramientas a utilizar en la búsqueda de información.
Por lo tanto, en la estrategia de búsqueda habrá que tener en cuenta:
1) Ámbito temático que se abarcará: especificidad del tema que se desea
desarrollar.
2) Especificidad de los términos: determinar si hay que tomar todos los
términos posibles, si bastará un número reducido, si es necesario incluir el
conjunto de relaciones con los términos relacionados.
3) Adecuación de los términos: determinar qué términos son los más
adecuados para expresar los conceptos del tema de trabajo.
4) Idiomas elegidos: pensar siempre en una búsqueda multilingüe.
En el caso de respuestas no satisfactorias, es posible revisar el proceso. En la
mayoría de los casos se trata del uso incorrecto de algún término. En esa situación se
sugiere replantear la estrategia de búsqueda modificando los términos que se cree que
no son adecuados a esa demanda de información. Aún así, muchas búsquedas terminan
con una sensación desagradable, ya sea por la enorme cantidad de documentos
relacionados que no nos permiten una concentración en los temas específicos, como por
la sensación de “sobrecarga” que se siente al realizar un trabajo con excesiva
información.
fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 33
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
las fuentes, experiencias pasadas, preferencias personales, etc.”
Marchionini (1995) propone tres patrones de búsqueda diferenciados en función
de la necesidad de información –objeto de la búsqueda- y las tácticas utilizadas:
- Exploración dirigida -Directed browsing-, la exploración es sistematizada,
focalizada a un destino específico (por ejemplo buscar en una base de datos
un tema específico verificando los atributos de la información)
- Exploración semidirigida -Semidirected browsing-, la información a buscar
es algo indefinida y el proceso de exploración menos sistemático (por ejemplo
buscar a partir de términos generales y examinar los resultados)
- Exploración sin dirección -Undirected browsing-, no hay un objetivo
específico (por ejemplo navego en una web explorando su contenido).
Por otro lado, ampliando la propuesta –previa a la Web– de Aguilar (1967), Choo
(1999) describe cuatro modos de exploración en función de la necesidad de información,
la acción –técnica– y el uso que se hace de la información recuperada (Tabla N° 3).
Tabla Nº 3: Modos de exploración (Choo, 1999)
"Sweeping" –barrido-
Visión sin Exploración amplia de
diversidad de fuentes, “Browsing"
dirección No hay necesidad
tomando aquellas fácilmente -exploración-
- undirected específica
accesibles. Indagación
viewing-
Serendipia
"Discriminating" "Learning"
Visión
–discriminación- -aprendizaje-
condicionada Temas generales
Ojear en fuentes incrementar el
-conditioned de interés
preseleccionadas sobre conocimiento sobre
viewing-
tópicos de interés tópicos de interés
"Selecting"
"Satisfying"
-selección-
Búsqueda informal –Satisfacción-
incrementar el
La búsqueda se focaliza en
-informal search- conocimiento en un
áreas, pero una búsqueda
área (con algunos
sencilla es satisfactoria
límites)
Entender y
profundizar sobre
"Optimizing"
temas específicos "Retrieving"
–optimización-
Reunión sistemática de la -recuperación-
Búsqueda formal
información sobre una uso formal de la
-formal search-
entidad, después de utilizar información para la
un cierto método o toma de decisiones
procedimiento
fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 34
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
Tabla Nº 4: Modelo de búsqueda (Ellis, 1989. Fuente, Choo, 1999)
Seguir los
vínculos de
las páginas
Identificar de inicio a
y/o otras con
Visión sin
selecciona contenidos
dirección
r páginas relacionado
de inicio s (aunque
no verifique
la
predicción)
Explorar en Filtrar y
listas, seleccionar sitios
mapas de útiles a través de Recibir la
Visión
contenidos, “favoritos”, actualización
condicionada
índices, impresión, de sitios
directorios, copiado y utilizando
etc. pegado, etc. agentes,
suscripcione
Búsqueda Ir directamente a s, listas, etc. Utilizar
informal Sitios conocidos Re-visitar los herramientas
sitios de búsqueda
“favoritos”. parar extraer
Búsqueda
información
formal
de útil.
fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 35
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
El conocimiento de los modos de exploración y de las categorías de conducta en
la búsqueda de información son aspectos esenciales que deben analizarse e
investigarse, a fin de tenerlos en cuenta en el diseño de los sistemas de recuperación de
la Web para que éstos mejoren su funcionamiento y aumenten su utilidad –la percibida
por el usuario- al apoyarse en estas características conductuales. Sin embargo, el
modelado con control preciso y consciente del proceso congnitivo enmarcado en la
recuperación de información de la red hipermedial que es la Web, no es una tarea
sencilla.
6.3.1 Serendipia
El término serendipia procede de la palabra serendipity y hace referencia al
modo en que se produce un descubrimiento que se realiza de repente gracias a un
accidente o una casualidad. No existe traducción al español de esta palabra. Royston
Roberts en su libro “Serendipity. Accidental Discoveries in Science” (1989) introduce la
definición del término como “hallazgo inesperado de cosas o ideas interesantes en el
proceso de búsqueda de otras”. Podemos pensar a la palabra “serendipia” como un
neologismo del término en inglés.
Para Olivier Ertzcheid y Gabriel Gallezot, existen tres estados iniciales que
favorecen la serendipia y que se asocian a tres procesos relacionados con la
Recuperación de Información:
- Sé lo que busco: el usuario sabe ya (en parte) lo que busca. Por tanto
realizará una búsqueda clásica según los modelos clásicos de los sistemas de
documentales (booleanos, lenguajes documentales, etc). El usuario se
encuentra en una lógica de consulta y búsqueda que le proporciona resultados
(matching) sabiendo, aproximadamente, lo que puede aportar el sistema de
información. Este usuario utiliza un razonamiento hipotético-deductivo. Aquí la
serendipia es prácticamente nula o no conlleva ninguna acción voluntaria
consciente.
- No sé lo que busco: el usuario se embarca en un proceso exploratorio
(browsing). El usuario va, a partir de lo que sabe, a razonar por inferencia y
abducción en función de su duda o de su perfil. La serendipia, en este caso, es
de tipo estructural.
- Sé que no sé lo que busco: es el que más se puede beneficiar del fenómeno
de la serendipia. El usuario suele adoptar un comportamiento muy simple, muy
asociativo y muy intuitivo, sea cual sea la complejidad del sistema que vaya a
consultar. Sobre los resultados de la búsqueda, el usuario irá descubriendo, de
manera asociativa, nuevas palabras clave, nuevos nombres de personas,
nuevas pistas de investigación, etc, que van a ayudar a constituir una
respuesta/solución a la pregunta/problema. Aquí la serendipia es asociativa.
En definitiva, la serendipia durante un proceso de búsqueda de información puede
ser pasajera, dependerá del momento en que los modelos mentales se impongan, o
convertirse en un modo privilegiado de acceso a la información. La serendipia aplicada a
la Recuperación de la Información pone de manifiesto que no es necesariamente más
fácil encontrar la información en un sistema ordenado, estructurado y formateado que en
un sistema de información caracterizado por una entropía fuerte y que no dispone de
ningún nivel de control único.
Por tanto, deberemos tener en cuenta, a la hora de hablar de Recuperación de
fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 36
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
Información, los fenómenos de serendipia en complemento a las preguntas (querying) y
a la exploración (browsing).
fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 37
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
el trabajo, y evitar la sobrecarga cognitiva, use el menú emergente (botón
derecho: Abrir en ventana nueva). De esta forma podrá explorar el documento, y
otros relacionados con el mismo, sin perder la ventana con el listado de
respuestas, lo que facilitará nuevas exploraciones. Si el documento, o
documentos a los que ha accedido le interesan, márquelos. En caso contrario,
cierre la ventana y vuelva al listado respuestas.
6. Replanteamiento de estrategias. Si tras analizar las quince o veinte primeras
respuestas no ha obtenido algún resultado satisfactorio, es necesario cambiar la
táctica. El cambio puede referirse a las expresiones utilizadas, o al motor
seleccionado. Si el número de respuestas obtenido es muy elevado, y los
primeros resultados son poco pertinentes o muy generales, formule una nueva
expresión de búsqueda, con más condiciones y limitaciones. En el caso contrario,
es decir con nulo o escaso número de resultados, puede suceder que: a) si la
expresión no es restrictiva, entonces no hay documentos, o los documentos no
contienen esos términos; b) que la expresión sea demasiado restrictiva, con
demasiadas condiciones. Para estos casos, debe probar con una expresión con
menos condiciones, y usar términos sinónimos o similares a los usados en la
primera formulación.
7. En el proceso de recuperación de información en Internet, el usuario siempre
debe pensar que no es suficiente con seguir los resultados obtenidos de un motor
de búsqueda: hay que explorarlos, analizarlos, valorarlos, y seleccionarlos como
adecuados, o desecharlos como no pertinentes. Las herramientas de
recuperación de información son un medio más, una fase intermedia, no un fin.
Los resultados proporcionados por un motor de búsqueda, no son sólo el
resultado de un cruce combinatorio entre páginas que responden a una determinada
demanda y las que corresponden menos o nada. La neutralidad está claramente
ausente, en realidad se nos está proporcionando una visión sobre el mundo que no es
nada inocente. Con una lista de resultados nos llega, al mismo tiempo, toda una
jerarquía de principios de clasificación del saber, y otros más implícitos todavía, de
organización del conocimiento.
➔Por ello, es preciso insistir que “no hay una sola herramienta ni un único método
que asegure encontrar resultados óptimos en todos los casos”.
Una vez alcanzados los resultados: ¿qué información seleccionamos? ¿cómo
reconocemos las configuraciones que aseguran la “calidad” de la información? ¿qué
entendemos por información de calidad?
Sin duda el concepto de calidad de la información depende del uso que se haga
de la información en la práctica. Es posible que lo que se entiende como buena
información en un caso concreto sea insuficiente para otros casos. Para Harris (1997)
determinar la calidad de la información es un arte, ya que hay que inferir a partir de un
conjunto de indicadores, basados en el propósito con el que se quiera utilizar la
información.
Siguiendo algunos autores (Tramullas, 2000; Cooke, 2001) podemos listar
algunos criterios tradicionales de calidad:
1. Autoridad: quién es el autor/es y cuál es su competencia (autoridad) sobre el
tema
2. Fiabilidad: confianza en que la información es cierta, creíble y libre de errores
fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 38
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
3. Objetividad: nivel de expresión de la información sin distorsiones personales,
falta de sesgo
4. Actualidad: estado de actualización de la información (inclusión de la fecha de
creación, revisión o última actualización)
5. Cobertura y audiencia: nivel de temas y profundidad de tratamiento, ¿es
información primaria o secundaria?; quienes son los destinatarios.
6. Validez: indicación de fuentes y documentación de apoyo
7. Escritura y sintaxis: buena gramática, sin faltas de ortografía
8. Metainformación: resúmenes, sumarios, revisiones y comentarios
9. Relevancia: pertinencia para las necesidades del usuario –criterio subjetivo-
En síntesis, podemos decir que existen dos maneras de evaluar la calidad de la
información:
1) objetivamente determinando la autoridad, fiabilidad, objetividad, actualidad, etc.
y
2) subjetivamente determinando si la información recuperada es pertinente a la
necesidad.
➔Establecer criterios que filtren la información encontrada es un buen comienzo
para convertirse en un consumidor crítico de información.
fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 39
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
información suficiente para permitir predicciones exactas.
Por ello, desde la óptica de poseer competencias para el acceso y uso de la
información –entendida éstas como la función de "reconocer cuándo se necesita
información y poseer la capacidad de localizar, evaluar y utilizar eficazmente la
información requerida" (American Library Association, 1989)– tiene sentido preguntarnos
cómo buscaremos la información. Dentro de esta configuración, las competencias para
el manejo de la información (Grau, 1995), serían:
1) explorar,
2) percibir nexos y relaciones,
3) captar y desentrañar estructuras conceptuales,
4) almacenar el significado,
5) condensar la información,
6) adoptar lógicas diferentes al sí-no,
7) tratar la complejidad,
8) moverse intuitivamente,
9) capacidad de síntesis,
10) albergar incertidumbres,
11) capacidad de transferencia, y
12) tomar decisiones a partir de información incompleta.
A su vez, toda esta información está determinada por un esquema semántico –el
estudio de los signos en relación con los objetos designados– que nos lleva a la idea
transmitida, al mensaje, o al dato.
Las competencias para el manejo de la información constituyen la base para el
aprendizaje continuo, son comunes a todas las disciplinas, a todos los entornos de
aprendizaje y a todos los niveles de educación.
Un informe del National Research Council (1999) enumera varios rasgos
distintivos útiles a la hora de comprender las relaciones entre las competencias para el
acceso y uso de la información, las competencias en el uso de computadoras y las
destrezas tecnológicas más amplias. El informe señala que la "competencia en
computadoras" tiene que ver con el aprendizaje rutinario de aplicaciones informáticas
específicas, mientras que el "dominio de las tecnologías" se centra en la comprensión de
los conceptos básicos de la tecnología y en la aplicación de técnicas de solución de
problemas y pensamiento crítico para el uso de la misma. Por el contrario, las
competencias para el acceso y uso de la información constituyen un marco intelectual
para la comprensión, hallazgo, evaluación y utilización de la información –actividades
todas ellas que pueden ser llevadas a cabo en parte gracias al dominio de tecnologías
de la información, pero sobre todo por medio del discernimiento crítico y el raciocinio–.
Las competencias para el manejo de la información se valen de la tecnología pero, en
última instancia, son independientes de ella.
fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 40
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
Competencia en el Manejo de Información
Estándar 1: El estudiante competente en el manejo de información accede a la
información de manera eficiente y efectiva.
Estándar 2: El estudiante competente en el manejo de información evalúa la información
crítica e idóneamente.
Estándar 3: El estudiante competente en el manejo de información utiliza la información
de manera creativa y precisa.
Aprendizaje Independiente
Estándar 4: El estudiante que aprende independientemente es competente en el manejo
de información y se interesa por información relacionada con sus intereses
personales.
Estándar 5: El estudiante que aprende independientemente es competente en el manejo
de información y valora la literatura y las otras formas de expresión creativa.
Estándar 6: El estudiante que aprende independientemente es competente en el manejo
de información y se esfuerza por alcanzar la excelencia en la búsqueda y
generación de conocimiento.
Responsabilidad Social
Estándar 7: El estudiante que contribuye positivamente a la comunidad de aprendizaje y
a la sociedad es competente en el manejo de información y reconoce la
importancia de la información en una sociedad democrática.
Estándar 8: El estudiante que contribuye positivamente a la comunidad de aprendizaje y
a la sociedad es competente en el manejo de información y se comporta de
manera ética en lo que respecta a la información y a las Tecnologías (TICs)
Estándar 9: El estudiante que contribuye positivamente a la comunidad de aprendizaje y
a la sociedad es competente en el manejo de información y participa
efectivamente en grupos que buscan y generan información.
fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 41
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
seguridad, pero no una conservación sistemática de la información que puede tener
valor para un uso futuro.
Antes de avanzar definamos “información personal”. Jones (2008) destaca 6 tipos:
1. Controlada por “mi”: Archivos en nuestras computadoras, mensajes en
nuestra cuenta de correo, papeles en nuestro cajón, etc.
2. Sobre “mi” y posiblemente bajo control de otros: Ficha médica, registro de
impuestos, historial crediticio, sitios web visitados, etc.
3. Dirigida a “mi” y no necesariamente relevante pero que puede distraer,
hacer perder tiempo, etc: Spam que llega a nuestro correo, publicidad en
páginas web, televisión o radio, una carta, la cuenta de un servicio, etc.
4. Enviada, publicada o provista por “mi”: En la que tenemos control (a
veces) sobre quién ve, qué información y cuándo.
5. Conocida por “mi”: Libros que están en la biblioteca, páginas web que
permanecen en la web (como artículos de diarios), programas de TV. Es
información sobre la cuál volvemos en algún momento pero no está bajo
nuestro control.
6. Relevante (útil) para “mi”: Esta categoría incluye información que poseemos
y controlamos, que conocemos y también información que aún no hemos
visto. ¡Tan sólo necesitamos encontrarla!
Hoy en día esta información personal está disponible no sólo en papel sino en
documentos digitales, emails, páginas web, mensajes de texto, fotografías digitales,
música, video y otras formas adicionales de información digital. La dificultad de gestionar
la información se incrementa si una persona tiene múltiples cuentas de email, usa varios
dispositivos tecnológicos –tablet, netbook, teléfonos inteligentes, notebook, etc.- Todos
estos dispositivos, así como nos ayudan en diferentes situaciones, también aumentan el
problema de la “fragmentación de la información”. Por otra parte, varios estudios han
demostrado (Barreau, 2009) que los usuarios suelen estar demasiados ocupados o ser
un tanto desorganizados para estructurar a conciencia su información, así como también
son poco precisos cuando definen el tipo, tamaño y extensión de sus ficheros. Además
las herramientas de gestión de contenidos digitales suelen ser limitadas e
insastifactorias: sólo podemos descubrir el contenido de un objeto digital si lo abrimos.
Frente a esta situación nos preguntamos, ¿qué significa gestionar
adecuadamente la información personal?
Cabe distinguir “organizar” de “gestionar”, “gestionar” de “utilizar”; pero, además,
para ser efectivos la gestión y el uso de la información deben estar interrelacionadas. La
gestión de la información personal debe permitirnos responder preguntas como: ¿Es la
información potencialmente útil? Si lo es: ¿cómo la guardo?, ¿dónde?, ¿en qué
dispositivo?, ¿en qué formato? Para ser recuperada, ¿cuándo?
Barreau (2009) describe a la PIM como un sistema desarrollado para uso
personal en un ambiente de trabajo. Tal sistema incluye “las reglas y métodos
personales para adquirir información […] los mecanismos para organizar y almacenar la
información, las reglas y procedimientos para mantener el sistema, los mecanismos para
la recuperación y los procedimientos para producir variadas salidas”.
Desde esta perspectiva Jones (2008) define a la PIM con tres operaciones
escenciales (Figura Nº 8):
fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 42
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
1. Finding y re-finding: De la necesidad a la información. En nuestros esfuerzos
por reconocer la información relacionada a nuestra necesidad, buscamos,
exploramos, escaneamos a través de una lista de resultados o carpetas. Estas
actividades son ejemplos de Finding –encontrar-. Re-finding incluye otro paso:
recordar lo que vimos en primer lugar.
2. Keeping: De la información a la necesidad. En vez de tener una necesidad
para la que buscamos información, tenemos información y debemos determinar qué
hacer con ella. ¿Podemos anticipar una necesidad para esa información?, ¿cuál es
el costo de no tenerla? Gracias a las tecnologías de almacenamiento, algunas
decisiones de “mantener” la información no son tomadas en cuenta. Si tenemos
espacios, entonces ¡guardemos! Luego, el problema será la recuperación.
3. Mantenimiento y organización: ¿Cómo organizar la información para su uso?
¿Etiquetado, categorización, clasificación, agrupamiento? ¿Cómo actualizarla?, ¿y
resguardarla? ¿Cómo actualizar sus formatos de manera que esté disponible en
otros estándares tecnológicos? ¿Cómo asegurarse que la información vieja sea
borrada o archivada? ¿Cómo localizar la información duplicada? ¿Cómo asegurar la
privacidad de nuestros contenidos?
Figura Nº 8: Actividades en la PIM (adaptado de Jones, 2008)
fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 43
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
¿Qué información necesito, en qué forma y cuándo?
¿A quién debo qué información y cuándo y dónde?
Cabe agregar:
¿Cómo buscar información, razonablemente?
¿Al no consultar todas las fuentes de información disponibles, es completa
mi búsqueda de información?
Esta característica se hace palpable con el empleo de las herramientas
tradicionales –como las consultas a bibliotecas–, las cuales sólo dan como resultados
unos pocos libros o referencias al tema.
¿La incorporación de nuevas herramientas de búsqueda, mejorará nuestra
capacidad para la obtención eficaz de datos relevantes?
El problema no es solamente correr los riesgos de no ser efectivo transfiriendo
información sino, antes que eso, dilucidar cuál es la información útil y relevante para
nosotros, nuestros alumnos o colegas y para los procesos de enseñanza y transferencia
de información relevante. Y ésta es una tarea que requiere cuidado.
Para Cornellá (2000), conseguir una mejora en el proceso de informarse pasa por
recibir la información adecuada de forma que se pueda usar, y esto se conseguiría con
saber, cada uno de nosotros, cuáles son:
- los cinco temas fundamentales en los que estamos trabajando,
- los cinco temas secundarios,
- cuál es la lista de información crítica para los cinco temas fundamentales, y
- la lista de información secundaria para los cinco temas secundarios.
Frente a esta tarea de dilucidar información es interesante el modelo TRAF –del
inglés: Throw, Refer, Act, File → Tirar, Remitir, Actuar y Fichar–, propuesto por Quinn
(1990) que sugiere que ante cualquier entrada –input- de información, sólo es posible
una de las siguientes cuatro acciones (Figura Nº 9):
Figura Nº 9: Modelo TRAF (Quinn, 1990)
fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 44
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
Tirar, si no está en una de mis 10 áreas básicas
Remitir (transferir), si puede interesar a alguien del entorno
Actuar (utilizar), si está en la lista de las áreas críticas
Fichar (guardar) si está en la lista de las 5 áreas secundarias
Este método nos ayuda a gestionar el tráfico de la información que nos llega, pero
en este proceso de gestión aplicamos criterios de evaluación de la calidad de
información que son subjetivos y que tienen en cuenta si la información nos es
realmente útil, es interesante, o no nos interesa en absoluto.
Desafortunadamente, precisar la información y los recursos disponibles en
Internet en una determinada área de conocimiento, como paso previo a la evaluación de
su calidad, no es un proceso tan sencillo. Por ello, debemos avanzar unos pasos más
allá de las búsquedas informales basadas en las ocurrencias de términos, explotando
todas las posibilidades que ofrecen las distintas herramientas de búsqueda en Internet,
acercándonos así (en nuestro caso) a los objetivos de la investigación académica.
fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 45
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
8. Algunas reflexiones…
Los aportes realizados hasta el momento, nos permiten ir apuntando una serie de
hechos:
- la carencia de información ha dejado de ser un problema en el terreno
educativo debido a la amplitud de fuentes (Figura Nº 10) y posibilidades que
se le ofrecen tanto al profesor como al estudiante,
- Figura Nº 10: Posibles fuentes de información en Internet
fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 46
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
camino a abrir “ventanas”, a conocer “portales” y motores de búsqueda y navegadores.
Nos encontramos ante una manera diferente de “in-formar”, un espacio dónde la
información se reorganiza constantemente. Y este orden ha sido impuesto por la
mediatización tecnológica, que nos obliga a recorrer otros espacios y otros tiempos.
Bajo esta perspectiva, buscar información para acceder a la información que
necesitamos resulta un reto complejo. La persona que protagonice una búsqueda por
Internet no sólo debe identificar las condiciones de búsqueda y planificar sus acciones,
sino también conocer, gestionar y regular su propio proceso de navegación, habilidad
que puede favorecer la búsqueda. Así como desarrollar las competencias necesarias
para el manejo de la información.
Acceder a la información significa relacionar:
1) nuestras estrategias de búsqueda –nuestro estilo cognitivo–, con
2) el diseño de los sitios de búsqueda y su interacción telemática –la
capacidad de comunicación que genera ese espacio interactivo–.
Una estrategia de búsqueda de información se define con acciones u operaciones
lógicas que resuelven cosas como:
- Sobre qué buscar información: definir necesidades.
- Cuál es el ámbito de relaciones (o de información) del tema principal: definir el
tema general, los subtemas, los temas relacionados y los equivalentes.
- Dónde buscar: responder a: ¿quién tiene o dónde está la información?
- Con qué herramientas buscar: determinar cómo llegar donde se encuentra la
información.
- Cómo hacerlo: definir con qué criterios, acotaciones, indicadores, palabras
claves.
- En qué puntos o ámbitos temáticos: definir desde qué otros temas
relacionados y subtemas se puede llegar a la información.
Esto implica tener en cuenta que hay un enriquecimiento de los modos
tradicionales de rastrear y buscar información, como consecuencia de:
1) el impacto de las ya no tan nuevas tecnologías sobre el procesamiento y la
transmisión de información,
2) las nuevas modalidades de organización y acceso a la información,
3) la permanente reubicación de la información disponible y la detección de su
existencia y el acceso a la misma, y
4) la aparente dilución de la figura del mediador tradicional de la información
–el clásico bibliotecario–,
que contribuye a repensar competencias, habilidades y estrategias para rastrear y
recuperar información.
¿La incorporación de nuevas herramientas de recuperación, mejorará nuestra
capacidad para la obtención eficaz de datos relevantes?
Por último, recordar que a la limitación material para acceder a la mayoría de los
libros existentes en el mundo –condición natural del lector hasta hoy–, le reemplaza la
ilusión de tener a su alcance, desde su escritorio o su biblioteca y gracias a las
posibilidades de Internet, a todos los libros del mundo. Como contrapartida, sabemos
fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 47
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
que las personas enfrentadas a procesar cantidades excesivas de información,
distinguirla, seleccionarla y comprenderla, necesitan más tiempo, más esfuerzo de
atención, más concentración y más capacidad.
En palabras del escritor Antonio Skármeta: “....Hay gente que deambula sin ton ni
son porque no sabe, ya no el lugar donde está lo que busca, sino qué es lo que busca...”
9. Bibliografía
Barany, M. J. (2005, 16 de marzo). Science’s Language Problem. Business Week.
Recuperado de http://www.businessweek.com/technology/content/mar2005-
/tc20050317_4179.htm
Barreau, D. (2009). “Gestión” de información personal, no solo recuperación de
información personal. El profesional de la información, 2009, julio-agosto, v.18,
n.4, pp361-364. Doi: 10.3145/epi.2009.jul.01
Bergman, M. (2001). The Deep Web: Surfacing Hidden Value. The Journal of Electronic
Publishing, August, 2001 Volume 7, Issue 1. Recuperado
http://www.press.umich.edu/jep/07-01/bergman.html
Blair, D.C. (1990). Language and representation in information retrieval. Amsterdam:
Elsevier Science Publishers.
Burbules, N. y Callister, T. (2001). Educación. Riesgos y promesas de las nuevas
tecnologías de la información. Barcelona: Granica.
Cornella, A. (2000). Infonomia.com! La empresa es información. Bilbao: Deusto.
Currás, E. (1991). Tesauros, lenguajes terminológicos. Madrid: Paraninfo.
Chang, G., Healey, M.J., McHugh, J.A.M. y Wang, J.T.L. (2001). Mining the World Wide
Web: an information search approach. Norwell, MA: Kluwer Academic Publishers.
Choo, Ch. (1999). La organización inteligente. México: D.F.: Oxford.
Cove, J.F. y Walsh, B.C. (1988). On-Line Text Retrieval via Browsing. Information
Processing and Management, 24(1):31-37.
Davenport, T. (1997). Ecología de la información. New York: Oxford University Press.
Gómez Reyes M. (2002) Arquitectura de información. La Habana: INFO 2002, IDICT.
Gulli, A. y Signorini, A. (2005). The Indexable Web is More than 11.5 billion pages.
WWW 2005, May 10–14, 2005, Chiba, Japan.
Huang, T. (1999). Calidad de la información y gestión del conocimiento. Madrid: AENOR.
IDC (2014). The digital universe of opportunities. Recuperado de
http://www.emc.com/collateral/analyst-reports/idc-digital-universe-2014.pdf
Internet2. http://www.internet2.edu
Internet Live Stats. http://www.internetlivestats.com
International Telecommunication Union (ITU). http://www.itu.int
Internet World Stats. http://www.internetworldstats.com/
Jones W. (2008). Keeping found things found. The study and practice of personal
information management. Massachusetts: Morgan Kaufmann.
fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 48
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
Lyman, P. y Varian, H. (2003). How Much Information. Recuperado de
http://www.sims.berkeley.edu/how-much-info-2003.
Martínez Tamayo, A. M. (1999). Tesauro. Cátedra de Organización del Conocimiento I,
Departamento de Bibliotecología, Facultad de Humanidades y Ciencias de la
Educación, Universidad Nacional de La Plata.
Murray, B. (2000). Sizing the Internet. Cyveillance, Inc.
Netcraft. http://www.netcraft.com
Sherman, C. y Price, G. (2001). The Invisible Web. CyberAge Books
Suarez Sánchez-Ocaña, A. (2012). Desnudando a Google. Madrid: Deusto
Tramullas Saz, J. (2001). La recuperación de información en el World Wide Web. En J.
López Yepes (coord.) Manual de Ciencias de la Documentación. Madrid: Síntesis.
UNESCO (2011). Contenidos locales, desarrollo de Internet y precios del acceso.
Recuperado de http://www.unesco.org/new/es/communication-and-
information/resources/news-and-in-focus-articles/all-
news/news/local_content_internet_development_and_access_prices_new_study_
presented_at_igf_2011/
UNESCO (2005). Hacia las sociedades del conocimiento. París: Ediciones UNESCO
W3techs. http://w3techs.com
WorldWidewebSize. http://www.worldwidewebsize.com
Zuazo, N. (2015). Guerras de Internet. [Epub version]. Buenos Aires: Debate.
fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 49
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.