0% encontró este documento útil (0 votos)
26 vistas49 páginas

Gestión Efectiva de la Información en Internet

El documento aborda la gestión de la información en el contexto educativo y de investigación, destacando la importancia de desarrollar competencias para la búsqueda y recuperación de información en Internet. Se discuten las técnicas de sistematización y organización de la información, así como la necesidad de utilizar lenguajes documentales y sistemas de clasificación para mejorar la eficacia de las búsquedas. Además, se enfatiza el desafío de enseñar a los usuarios a navegar en un entorno de información complejo y diverso.

Cargado por

Ivana Fasano
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
26 vistas49 páginas

Gestión Efectiva de la Información en Internet

El documento aborda la gestión de la información en el contexto educativo y de investigación, destacando la importancia de desarrollar competencias para la búsqueda y recuperación de información en Internet. Se discuten las técnicas de sistematización y organización de la información, así como la necesidad de utilizar lenguajes documentales y sistemas de clasificación para mejorar la eficacia de las búsquedas. Además, se enfatiza el desafío de enseñar a los usuarios a navegar en un entorno de información complejo y diverso.

Cargado por

Ivana Fasano
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Gestión de la Información: organización,

búsqueda y recuperación en Internet


Estela Muelas
1. Introducción
El manejo de la información y la producción de conocimiento representan una de
las competencias que todo docente y todo investigador, de cualquier disciplina, debe
desarrollar y poseer. Asimismo, la evolución del procesamiento de información ha ido
desde unidades aisladas hasta una interconexión global a través de Internet, medio que
integra el almacenamiento de información con las telecomunicaciones.
Hoy, “la Web se ha convertido en una torre de Babel no sólo al nivel del lenguaje
natural, sino esencialmente al nivel del significado” (Gutierrez, 2008). Hace 30 años un
docente o un alumno que buscaba información debía recorrer biblioteca por biblioteca y
correlacionar o comparar la información a mano. Hoy en día escribimos algunas
palabras en nuestro buscador favorito y encontramos inmediatamente “toneladas” de
información, eso sí no siempre acorde a nuestra necesidad.
Buscar información en la Web puede transformarse en una experiencia frustrante
y decepcionante. Los recursos en la red son significativamente diferentes a los
tradicionales dado que están relacionados, combinados, disponibles en múltiples
formatos y por sobre todo son dinámicos. Los esquemas de organización y los métodos
de acceso también son diversos, tanto como los usuarios y sus diferentes competencias
informacionales y aptitudes “tecnológicas”. Muchos usuarios naufragan en su búsqueda
de información por la Web. Principiantes y expertos constatan la importancia de ser
estratégico y disponer de técnicas de búsqueda y criterios de selección de la
información. Por ello, enseñar a buscar información en “la Babel actual” resulta un gran
desafío en el futuro inmediato. Pero, ¿qué enseñar?
Ante la proliferación de herramientas de búsqueda que están disponibles para los
profesores y alumnos, queda planteada la cuestión de acentuar los procesos de
selección de las mismas a partir de criterios básicos que orienten la toma de decisiones
estratégicas según el contexto de aplicación, los grupos destinatarios, los objetivos y
necesidades de información del usuario.

fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 1
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
2. Organización de la información
Desde los inicios de la civilización, el hombre ha manifestado su tendencia para
organizar la información, desde el agrupamiento y clasificación de utensilios de trabajo,
de caza, de pesca, etc. o de la propia creación de las estructuras comunitarias
-cazadores, guerreros, sabios-, entre otras entidades que surgieron en las primeras
formas de sociedad. El hombre organiza para entender, explicar y controlar su entorno.
Pero, justamente, como la clasificación la hacen los hombres, hay en potencia tantas
clasificaciones como seres humanos.
Si hablamos de información, la organización de estos recursos es una tarea
esencial en todo sistema de información. Como es de suponer, en la sistematización de
información están trabajando bibliotecarios, documentalistas, gestores de contenidos
digitales y especialistas de las distintas disciplinas, en ámbitos tan diversos como
bibliotecas, universidades u organizaciones nacionales e internacionales, dado el
volumen de la misma y la complejidad que ha alcanzado. Es muy importante señalar que
estos avances han superado lo exclusivamente instrumental y han generado una
evolución de las Ciencias de la Documentación y de las Ciencias de la Información que
supera ampliamente las posibilidades de describirla en este texto.
Aun así, las cinco preguntas clásicas -quién, qué, cuándo, dónde y por qué- son
un buen punto de partida para convertir las características de un tema en nuestros
requerimientos de búsqueda. Pero que exigen tener en cuenta una sexta pregunta:
¿Cómo?

2.1. Técnicas de sistematización


En las tareas de sistematizar y catalogar información es necesario registrar los
datos que corresponden a toda clase de documentos, sean libros, artículos científicos,
actas de congresos, etcétera. Un repaso a la última edición del Diccionario de la Real
Academia Española (D.R.A.E., 2001) permite despejar algunas dudas. Por ejemplo,
figura el verbo verbo indizar, pero su definición remite a indexar:
1) Hacer índices.
2) Registrar ordenadamente datos e informaciones.
La necesidad de recurrir a las técnicas de indexación o indización se hace más
evidente cuando se tiene en cuenta que el lenguaje natural utilizado –tanto por el autor
del documento como por las personas que pretendemos encontrarlos– es a menudo
ambiguo y no siempre lógico, lo que permite diversas interpretaciones. Títulos como Las
sombras del pasado o Recuerdos del futuro difícilmente nos orienten sobre el qué, el
quién, el cuándo o el dónde de esos documentos. Incluso en títulos más precisos la
recuperación de información crea problemas derivados de la indización con el lenguaje
natural.
Analizando a la organización de la información desde las posibles demandas, la
búsqueda puede ser realizada por nosotros o por otras personas: un bibliotecario, un
documentalista, o un programa informático, que actuarán de acuerdo a lo que
solicitemos. Como puede apreciarse, debemos especificar –con la mayor claridad
posible–, qué información estamos buscando.
En principio, para buscar información habría dos caminos:
1) buscar los documentos con la ayuda de las palabras que allí figuran y que
son utilizadas por el propio autor para expresar su pensamiento, y

fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 2
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
2) dado el carácter ambiguo del lenguaje natural, organizar un vocabulario
razonablemente estructurado y con su ayuda buscar los documentos,
cualesquiera hayan sido los términos que emplearon los autores para
enunciar sus ideas.
El primer procedimiento es atractivo por su simplicidad: buscar los conceptos del
documento tal cual se encuentran. Obviamente es sencillo, pero no es eficaz.
¿Por qué? Porque los documentos tratan diversas nociones. Es muy raro que un
texto trate una sola noción: por el contrario, la riqueza de una información es el
resultado, con frecuencia, de la yuxtaposición e integración de varios conceptos de los
que el autor muestra las relaciones. Esa integración constituye el tema del documento.
Consecuentemente, los conceptos podrán estar enunciados, a su vez, con la ayuda de
expresiones compuestas, ya sea de una o de varias palabras. Del mismo modo, las
consultas de los usuarios se descomponen en un cierto número de nociones, que no
necesariamente coinciden con las que tiene cada documento.
El segundo procedimiento es más depurado, requiere definir la estructura y
organización de un vocabulario tipo antes de comenzar realmente la búsqueda
propiamente dicha. En este caso tenemos no sólo la búsqueda de los conceptos
presentes en el documento, sino también la traducción del lenguaje del autor a lo que
habitualmente se llama lenguaje documental –un sistema convencional de signos que
permite representar el contenido de los documentos con el fin de encontrar aquellos
pertinentes en respuesta a preguntas sobre un tema (Rubio Liniers, 2001)–. Una primera
distinción entre lenguaje natural y lenguaje documental puede apreciarse en la tabla que
sigue (Tabla Nº 1).
Tabla Nº 1: Diferencias entre lenguaje natural y lenguaje documental.

Lenguaje natural Lenguaje documental

Comunicación inmediata Comunicación mediata


Simple Compleja
Conceptos del lenguaje cotidiano Conceptos dados por definiciones
Ambiguo Preciso
Equívoco Unívoco
Arbitrario Controlado
No siempre lógico Lógico y asociativo
Libre Normalizado

Los lenguajes documentales tienen en cuenta: a) las referencias al tema, y b) la


manera en que es empleado el lenguaje en los documentos: la redacción, sus
características lingüísticas, el tipo de lenguaje usado, el tratamiento de los conceptos, la
terminología propia del tema tratado, el conocimiento del tema por parte del autor. Este
último punto será importante a la hora de pensar los términos con que realizaremos la
búsqueda, cuando relacionemos nuestros requerimientos con las palabras que el autor
ha utilizado para expresar sus ideas.

2.2. Sistemas de organización de la información


El objetivo de cualquier sistema de recuperación de información es proporcionar

fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 3
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
información pertinente, con un máximo de utilidad y precisión y con un mínimo de gasto,
en respuesta a una pregunta. Entre las numerosas clasificaciones de documentos, las
más utilizadas son: 1) la alfabética; 2) la numérica; 3) la alfanumérica, 4) la geográfica,
5) la cronológica, 6) la sectorial, 7) la analógica, 8) la jerárquica, etcétera.
La clasificación alfabética comprende tantas clases principales como letras del
alfabeto. Es una de las más sencillas y sin sutilezas. Presenta dificultades en el caso de
palabras de múltiple ortografía y en las palabras o nombres compuestos. La clasificación
numérica es igualmente simple y se sirve de nuestro sistema numérico. Entre ellas figura
la Clasificación Decimal, concebida por Melvil Dewey en 1876.
La clasificación alfanumérica asocia las dos clasificaciones precedentes
combinando letras del alfabeto y las cifras de la numeración decimal. Se conserva el
alfabeto, lo que facilita la búsqueda, permitiendo las cifras la inserción de elementos
nuevos posteriormente. La clasificación geográfica es también una clasificación clásica
que se basa en la división por países, regiones, departamentos, ciudades, pueblos,
etcétera. La clasificación cronológica es sencilla y cómoda, y en la práctica es muy
utilizada asociada a la alfanumérica, u otras. De manera análoga, tanto la clasificación
sectorial como la analógica y la jerárquica –más complejas y depuradas– permiten
estructurar distintas configuraciones, que pueden adaptarse a una institución, a una
técnica o a una rama particular de un ámbito específico del conocimiento.
El álgebra booleana –la teoría de conjuntos– y los programas informáticos de
búsqueda permiten tener en cuenta la complejidad de los encabezados de las diferentes
nociones conceptuales, contenidas en los distintos documentos.

2.2.1. Clasificación decimal de Dewey –DDC–


La Clasificación Decimal de M. Dewey fue creada en 1873 y es actualizada
constantemente por la Online Computer Library Center (OCLC) desde 1988 cuando
adquiere los derechos.
Las 10 grandes clases que lo conforman son:
000 - Ciencia de los Computadores, Información y Obras Generales.
100 - Filosofía y Psicología.
200 - Religión, Teología.
300 - Ciencias Sociales.
400 - Lenguas.
500 - Ciencias Básicas.
600 - Tecnología y Ciencias Aplicadas.
700 - Artes y recreación.
800 - Literatura.
900 - Historia y Geografía
En el nivel principal, la DDC se divide en diez clases principales, cada clase
principal se divide en diez divisiones, y cada división en diez secciones (no todos los
números de las divisiones y secciones son utilizadas).
El método contó, en su momento, de un inmenso éxito, ya que permite obtener un
sistema arboriforme de clases encasilladas, que posibilita afinar la indización hasta el
nivel deseado. Cada documento tiene su lugar en una "casilla conceptual" que puede ser

fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 4
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
todo lo pequeña que se desee y que sólo debe ser explorada durante la búsqueda, lo
que reduce considerablemente las operaciones.
La división de las materias se hace desde lo más general a lo más específico y
preciso, con números cada vez más altos. Por otra parte, siempre se puede insertar un
nuevo elemento conceptual sin modificar el orden de los elementos existentes.
Ejemplo:
600 Tecnología
620 Técnica
621 Física aplicada
Si necesitamos más de tres cifras se separan las cifras siguientes con un punto:
621.3 Electrotecnia
621.38 Electrónica
621.388 Televisión
Como puede apreciarse, cuanto mayor es el número que caracteriza un
documento más específico es el concepto simbolizado.
Las clasificaciones universales muchas veces resultan poco pertinentes como
único lenguaje de recuperación ya que parten de una división del conocimiento que tiene
en cuenta los "puntos de vista" de las disciplinas científicas y no incluye la
interdisciplinariedad y la especificidad actual. Consecuentemente, su estructura
jerárquica dificulta la combinación de los múltiples aspectos de una investigación y no
siempre permite recoger temas muy específicos, o novedosos.

2.2.2. Tesauros
En el campo de las Ciencias de la Información, un Tesauro es un vocabulario
controlado que permite el análisis y la recuperación de documentación especializada.
Sus ventajas son la especificidad de sus términos y sus posibilidades de combinación de
temas relacionados entre sí de distinta manera. Consecuentemente, es un sistema de
organización del conocimiento, cuyos términos de indización se estructuran en un
sistema de relaciones explícitas.
Un tesauro de descriptores es una lista estructurada de enunciados de conceptos.
Dichos enunciados buscan representar, de forma unívoca, el contenido conceptual de
los documentos y de las preguntas en un sistema documental. Un tesauro multilingüe
ofrece otra ventaja: las correspondencias entre conceptos idénticos expresados en
diferentes lenguas permiten comenzar la búsqueda en la lengua del usuario y encontrar
los documentos indizados en cualquiera de las lenguas del mismo.
Habitualmente, el mismo concepto puede expresarse mediante varios sinónimos o
términos muy próximos –por ejemplo, educación, sistema educativo–. Sería muy difícil
encontrar un documento indizado bajo cualquiera de esos términos a partir de una
pregunta referente a uno de sus sinónimos. Otro ejemplo: prensa puede significar tanto
una máquina para comprimir como, en sentido figurado, una imprenta, el conjunto de las
publicaciones periódicas, o las personas dedicadas al periodismo. Esta homonímia nos
remitiría a documentos sin ninguna relación con el tema que nos interesa. Otro de los
objetivos de un tesauro consiste en evitar los inconvenientes derivados de la homonímia:
todos los descriptores se sitúan en un contexto determinado, de forma que su significado
sea unívoco.

fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 5
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
Consecuentemente, todo tesauro tiene un vocabulario de indización conformado
por descriptores e identificadores. Ambos son términos que permiten describir el
contenido de los documentos. También se incluyen no descriptores –sinónimos o
cuasisinónimos de los descriptores– cuya función es remitir al término que se usa.
Descriptores: palabras o expresiones que designan sin ambigüedad los
conceptos constitutivos del tesauro; por ejemplo, sector educativo.
No-descriptores: palabras o expresiones que designan, en lenguaje
natural, el mismo concepto, por ejemplo, sistema educativo, o
conceptos equivalentes –educación–.
Por su parte, los identificadores o nombres propios, representan una entidad
individual y única.
Por último, están las relaciones semánticas: relaciones vinculadas al sentido de
los términos –relaciones entre descriptores y no-descriptores–, y relaciones de los
descriptores entre sí. En un tesauro se hacen explícitos diversos tipos de relaciones: 1)
las relaciones de equivalencia, 2) las relaciones de jerarquía y 3) las relaciones de
asociación.
Los principales tipos de relación que se utilizan, son:
1) Jerarquía: documentos sobre transporte público conducirán automáticamente a
recibir información sobre, por ejemplo: tren, colectivo, ómnibus, coche,
subterráneo, autobús, etcétera.
2) Sinonimia: siguiendo el ejemplo anterior, los términos subterráneo y colectivo
pueden ser significativos para un argentino, pero otros usuarios podrían
estar más relacionados con la palabra metro, o autobús, respectivamente.
Ejemplo: colectivo: utilizar autobús.
3) Asociación: una respuesta comprensiva debe tener en cuenta términos
explícitamente relacionados con la búsqueda, por ejemplo: tren y vapor (o
electricidad); ómnibus y terminal.
Dado al carácter ambiguo del lenguaje natural, muy frecuentemente una noción
puede expresarse a través de varias palabras o expresiones sinónimas. Inversamente,
una palabra, o una expresión polisémica, expresa varias nociones. Cabe tener en cuenta
que distintos significados de una misma palabra es una característica de la terminología
científica e incluso en Educación es el indicio claro de la existencia de distintas
posiciones y modelos conceptuales. Las posibles homonimias, sinonimias, polisemias,
así como el uso de metáforas, no siempre son resueltas por los lenguajes documentales.
Por último, debe tenerse en cuenta que los tesauros:
1) se construyen en función de un conjunto posible de documentos que pueden
aparecer sobre un tema, es decir, se considera el tema como caso general, de forma
impersonal, anónima, objetiva e intemporal.
2) no tienen por qué ser completos, en el sentido de abarcar todo el conocimiento.
Generalmente se limitan a un área temática específica, y desde cierta perspectiva
específica. Por ello existen innumerables tesauros específicos. Sirvan como ejemplo: el
ERIC, que suministra información, recogida por el Education Resources Information
Center del Departamento de Educación de Estados Unidos; el Tesauro de la UNESCO;
el Tesauro Europeo para la Educación, etcétera.

fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 6
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
2.2.3. Indización manual o automática
En términos generales podemos distinguir tres procedimientos de indización
diferentes:
1) Indización manual: es la realizada por personas sin ninguna intervención
informática (algo difícil de aceptar actualmente).
2) Indización semiautomática: es la realizada como interacción entre hombre y
programa informático, que presentan al indizador las palabras que ha
extraído del texto y que sus algoritmos de funcionamiento ofrecen
como relevantes, y la persona toma la decisión de cuales se conservan
en el sistema.
3) Indización automática: es la realizada por programas informáticos sin
intervención humana mediante algoritmos basados fundamentalmente
en técnicas de asignación de pesos a las palabras, construcción de
tablas de asignaciones y consideraciones sobre la proximidad de las
palabras dentro del texto, dentro de cada párrafo y dentro de cada
línea. Puede dar resultados aceptables, pero es difícil de afinar y
ajustar dado que cada conjunto de términos tiene características
particulares que lo diferencian de los demás.
Este método y el anterior suelen utilizarse actualmente, sobre todo en la
indización de documentos digitales.

2.3. Fuentes de información


El concepto fuente de información ha evolucionado, alcanzando una definición
amplia que considera fuente de información a aquellos recursos que permiten
localizar e identificar información, independientemente de su soporte.
Pueden desglosarse en:
a. Fuentes de información personales o relacionales. Ofrecen información que
poseen las personas o grupos que se relacionan profesionalmente. Lo más común es la
transmisión oral de la información (aunque después puede fijarse en documentos).
Destacan los organismos educativos y las asociaciones profesionales. Se caracterizan
por su difícil acceso, aunque cualquier persona o grupo puede constituir una fuente
personal.
b. Fuentes de información documentales. Proporcionan información a partir o sobre
un documento. El documento es el soporte que contiene la información y el que la
transmite. Esta tipología, propicia a su vez una nueva clasificación: la de fuentes de
información según su contenido
En cuanto a nivel de contenido las fuentes pueden clasificarse en (Figura Nº 1):
1) documentos de carácter primario: artículos de revistas científicas y de
información general sobre enseñanza y universidad, noticias de prensa,
monografías, publicaciones de universidades e instituciones dedicadas a la
política y gestión educativa, universitaria y científica,
2) otros documentos primarios: literatura gris –informes y documentos de trabajo no
publicados de instituciones y organismos públicos y privados de carácter
nacional e internacional–,
3) documentos secundarios y referenciales: guías y directorios de universidades,

fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 7
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
memorias, anuarios, planes de estudio, etcétera,
4) otros documentos secundarios: bibliografías y bases de datos de educación
como el BIBE –Boletín Internacional de Bibliografía sobre Educación–, el ERIC
Database, Bulletin Signaletique Sciences de l´Education, las Bases de datos
del Ministerio de Educación, de las universidades, etcétera, y
5) lenguajes documentales: el ERIC Thesaurus, el Tesauro de la Unesco, el
Tesauro Europeo de la Educación de la Comisión de las Comunidades
Europeas y del Consejo de Europa, etcétera.
Fig. Nº 1: Fuentes de información

2.4. La (des)organización de la Web


La WWW –World Wide Web– es un medio de información y comunicación,
inmenso, complejo y flexible, sus conexiones son dinámicas y muchas de ellas quedan
obsoletas sin ser nunca actualizadas. Ciertos atributos, tales como el carácter
hipertextual y el uso de elementos multimediales, estimulan determinados modos de
organización y obtención de la información, o la comunicación, y desalientan otros
porque no es neutral en su estructura (Burbules, 2001).
En la Web no tiene por qué existir una concordancia entre lo que un autor aporta y
lo que el usuario final recibe. El primero puede escribir un artículo y el segundo obtener
una página web que incluye dicho artículo, pero también otros elementos. Por ejemplo,
en una página podemos encontrar: el artículo, un menú de navegación, un bloque de
comentarios, un cuadro de búsqueda, un formulario de sugerencias, etc. Y, por supuesto
sin tocar el contenido original, el resultado de la búsqueda podría ser otro, tanto dentro
como fuera del contexto de las páginas web.

fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 8
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
También una publicación final puede responder únicamente a un fragmento de un
contenido original, a la totalidad de varios contenidos simultáneamente, y a todo el rango
de ocurrencias posibles entre ambos casos.
Un sitio bien diseñado, que refleje la existencia de una gestión de contenidos
permitirá:
- Almacenar diferentes versiones de cada documento.
- Compartir y actualizar documentos a varias personas en diferentes entornos y
con conocimiento desigual sobre el sistema.
- Almacenar un mismo documento en formatos diferentes (XHTML, PDF, etc.).
- Contener documentos en formato multimedia
- Proporcionar una navegación flexible a partir de la estructura de organización de
la información (secuencial, jerárquica, hipertextual, etc).
- Disponer de un sistema flexible y eficiente de búsqueda, indexación y consulta
de documentos.
La naturaleza heterogénea de la Web hace difícil la adopción de un sistema de
organización rígidamente estructurado. Para los recursos tradicionales eso era resuelto
por catalogadores, personas especializadas que agregaban metadatos (etiquetas que
explicitan información) a los libros: qué tema trata, dónde está ubicado, cuál es el autor,
etc. Estos metadatos están accesibles en un catálogo en las bibliotecas. En la Web no
tenemos catálogo ni catalogadores. Más aún, con el volumen de información que crece
cada día, es imposible que las personas se preocupen en clasificar la información.
Además, porque el modelo de la Web es distribuido, quienes publican tienen diversas
visiones sobre cómo clasificar sus objetos informativos. Por esta razón, el intento de
encontrar un sistema único para organizar los contenidos heterogéneos de la Web es
una tarea de difícil solución.
Por otra parte, el concepto de "organizado" cambia de un usuario a otro. Lo que
para nosotros puede resultarnos muy "lógico" puede que para otra persona no lo sea.
Para Gómez Reyes (2002) “si se estudia el fenómeno de Internet y de toda la
información que ella contiene, se encuentra que sus principales dificultades radican en
que no siempre es posible recuperar la información existente sobre un tema determinado
porque no se realiza un adecuado proceso de clasificación e indización o se dificulta la
recuperación de la información ubicada en una página web por una inadecuada
organización de los contenidos”.
No es sorprendente, entonces, que casi un tercio del tiempo que los usuarios
pasan en Internet lo dediquen a hacer búsquedas (Navarro, 2008).

2.4.1 Esquemas de organización de la información en la Web


Diariamente nos encontramos navegando por medio de diferentes esquemas de
organización: la guía telefónica, diccionarios, nuestra agenda, los diarios, carteleras,
etcétera. Todos ellos cuentan con una estructura que facilita el acceso a la información
contenida en ellos, se trata de los esquemas de organización de la información.
En la Web existen esquemas de organización de la información, aunque a veces
no nos percatemos de ello:
- Esquemas alfabéticos, es el predominante en enciclopedias, diccionarios, ventas
en línea, etc.

fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 9
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
- Esquemas cronológicos, los encontramos en los diarios, las carteleras de
televisión, los archivos de revistas electrónicas, etc.
- Esquemas ambiguos, dividen la información en categorías que proponen
definiciones exactas. Están impregnados por la ambigüedad del lenguaje y de la
subjetividad humana. En estos esquemas alguien que no es el usuario ha tomado
una decisión sobre cómo agrupar los elementos, por ello este esquema soporta
un modo "casual" de buscar información a partir de la agrupación de los
elementos de manera que puedan comprenderse intelectualmente. Entre los
esquemas ambiguos, los más comunes son los que organizan la información:
- según el asunto o la materia,
- según los intereses de la audiencia potencial,
- a través de metáforas de la vida cotidiana.
Pero, aún suponiendo que todos los sitios disponibles en la Web se encuentren
organizados de alguna forma –según la visión del emisor– la Web se vuelve telaraña –y
en ese sentido un espacio desorganizado– a partir de la vinculación sin patrones entre
los diversos sitios –o páginas de éstos–. Internet nos ofrece una nueva organización que
no es rígida, que crece y se modifica diariamente, se autotransforma y por lo tanto tiene
la flexibilidad de lo imprevisible y de las incertidumbres En este espacio “global” los
contenidos están poco estructurados y organizados y existen necesidades acuciantes de
un ordenamiento, clasificación y análisis para facilitar su búsqueda, uso y la disminución
del consumo de tiempo para encontrar aquello que realmente necesitamos.
Navegar en la Web nos proporciona enormes cantidades de información,
transitamos constantemente del orden al desorden y viceversa. Lo hacemos a través de
un sistema de redes que se interconectan entre sí, para proporcionarnos acceso a esa
gran cantidad de información, o para permitirnos la comunicación con personas
apartadas geográficamente, que se acercan inmediata y simultáneamente mediante
Internet. Estamos hablando de experiencias tecnológicas que se insinúan impredecibles,
recorridos llenos de incertidumbres, con innumerables posibilidades. Estamos
experimentando transformaciones en los procesos tanto de información como de
comunicación, por lo que cabe preguntarnos:
¿Cómo recuperar en un espacio (des)organizado?
¿Son las herramientas de búsqueda las que nos ofrecerán un orden a partir del
desorden?
¿Es la Web semántica la solución?

2.5. Algunas conclusiones


En los últimos años, se han planteado nuevos desafíos en relación con la manera
de organizar la información. La era digital ha aportado la posibilidad de gestionar el
audio, el video, la fotografía y los textos de manera totalmente integrada, aunque no
siempre en forma eficaz.
Como hemos visto, hay diversos tipos de índices: alfabético, por categorías, por
materias, por palabras-clave, por descriptores, etcétera. Para facilitarnos la organización
de la información y, consecuentemente, la búsqueda y la recuperación, la indización
puede hacerse sobre: 1) las palabras, 2) los conceptos, o 3) los temas, lo que genera
tres tipos de lenguajes documentales.

fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 10
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
El entusiasmo con que fueron recibidos los tesauros y los programas informáticos
de búsqueda, como es de imaginar, llevó a que no todos adopten el mismo sistema.
Unos prefieren el Dewey, otros la CDU, otros el Catálogo por abecedario del Congreso
de EEUU. Y no faltan quienes sostienen que clasificar y catalogar datos tan efímeros es
una pérdida de tiempo. Ahora se han incorporado los programas informáticos –los
motores de búsqueda– que facilitan la recuperación con distintos enfoques simultáneos.
Pero sea cual fuere la organización utilizada, hay que considerar que toda
clasificación:
1) es restrictiva, ya que siempre es posible admitir otra clasificación con otras
ventajas y desventajas.
2) debe ser satisfactoria conceptualmente y permitir búsquedas rápidas y
seguras (obviamente, una clasificación no es inmutable).
3) debe crear un vínculo entre la persona que emite el mensaje y la que lo
recibe –un metalenguaje que armonice pregunta y respuesta–.
A menudo, la búsqueda de información es iterativa e interactiva. Lo hallado en los
momentos iniciales de la búsqueda puede influir sobre lo que se halle más adelante. En
todo este proceso de búsqueda de información están presentes elementos del
conocimiento asociativo y el aprendizaje.
Se percibe claramente que siempre se podrá generar una estrategia de
búsqueda eficaz, que indicará qué términos deben ser usados y en qué forma deben
ser expresados. De eso hablaremos más adelante.

3. Los usuarios y los contenidos en Internet, hoy


Uno de los atributos más destacado de Internet reside en ser el primer medio o
conjunto de medios de comunicación masivo que permite la comunicación de doble vía:
cualquier persona puede con relativa facilidad ser receptora y emisora de mensajes, y
además, Internet parece encarnar un sueño: el acceso de todos a toda la información en
todo momento y desde cualquier lugar, aunque ello implique algún tipo de regulación y la
consideración de ciertas normas y convenciones consensuadas para su acceso y su
uso. Como expresa Raghavan (2005), Internet es la colección más grande de
conocimiento, noticias, opiniones, rumores, falsedades, propagandas y contradicciones
que la humanidad ha montado. Cada página Web puede estar escrita en cualquier
idioma por personas con diferentes niveles de educación, cultura, interés y motivación.
Todo parece indicar que la información se multiplicará de manera mucho más
rápida -diez veces entre 2013 y 2020: de 4.4 zettabytes a 44 zettabytes (IDC, 2014)- que
la capacidad que tenemos de generar tecnología y metodologías para buscar, recuperar,
filtrar y manejar el flujo de información en exceso y dar respuesta a las necesidades de
información. Queda claro que nuestro universo digital en el año 2020 será más grande
que nunca, pero también más volátil que nunca.
¿Estamos preparados para crear, consumir y gestionar 40 zettabytes de datos?

3.1 ¿Internet global o el mito del acceso democrático, la diversidad cultural y el


plurilingüismo?
Según la organización Internet World Stats (2017), a marzo de 2017 algo más de
3700 millones de personas –el 49,7% de la población total– se conectaban a Internet. De
este porcentaje, el acceso a Internet por lengua nativa (primera lengua) se observa en la

fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 11
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
Figura Nº 2.
Fig. Nº 2: Personas conectadas a la Web según lengua nativa (IWS, 2017)

Se consideran usuarios de habla inglesa a los habitantes de Estados Unidos,


Gran Bretaña, Irlanda, Canadá, Australia, Nueva Zelanda, Sudáfrica y Filipinas. Los
usuarios de habla hispana son, aproximadamente, unos 510 millones y corresponden a
España, América Central y Sudamérica –excepto Brasil–. El 57,6% –293 millones– de
personas de habla hispana acceden a Internet, lo que representa el 7,9% del total de
usuarios de la red. El número de usuarios de Internet que hablan español como primera
lengua creció el 1516% en los últimos dieciséis años (2000-2017) (Internet World Stats,
2017).
“En teoría, Internet está abierto a todos los idiomas del mundo” (Unesco, 2012),
sin embargo el mapamundi de la diversidad lingüística no coincide con la marcada
división que se observa en Internet (Tabla Nº 2).
Tabla Nº 2: Idioma de los contenidos en Internet -% sitios- (W3Techs, 2017)

2012 2013 2014 2015 2016 2017

INGLÉS 56,6 55,2 55,8 55,4 53,2 51,3

RUSO 4,8 6,5 5,9 5,8 6,4 6,6

ALEMÁN 6,5 5,3 6,1 5,7 5,5 5,6

JAPONÉS 4,7 4,9 5 5 5,4 5,6

ESPAÑOL 4,6 4,5 4,6 4,5 4,9 5,1

fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 12
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
Si bien en general pocos estudios suelen tener en cuenta los correos, los foros
electrónicos, las bases de datos o páginas que no son públicas, la representación del
español no ha llegado aún a un nivel acorde con su población en el mundo real.
La Organización de las Naciones Unidas para la Educación, la Ciencia y la
Cultura (UNESCO) ha publicado un informe titulado "Hacia las sociedades del
conocimiento" (noviembre 2005) en el que alerta el riesgo que tienen de desaparecer, a
lo largo de este siglo, cerca de un tercio de los 6.000 idiomas que se hablan hoy en el
planeta, posibilidad agravada por el uso de tecnologías como Internet, dado que estas
lenguas no se escriben, sino que son exclusivamente orales. El 96% de las lenguas son
habladas por 4% de la población mundial, y más de 80% de las lenguas son endémicas
y están confinadas a un solo país. Únicamente veinte idiomas del mundo cuentan varios
cientos de miles de hablantes en diferentes países. Aunque las cifras varían en función
de los métodos de recuento -los datos de Linguasphere, SIL, Ethnologue, Encyclopédie
Millenium son sensiblemente comparables, algunas de estas organizaciones suman a
los que las tienen como lengua materna y a quienes las hablan como una segunda
lengua-, la Encyclopédie Millenium (1998) estima que cerca de la mitad de la población
mundial se expresa en una de las ocho lenguas de mayor difusión. Además, en la
actualidad existen, según el proyecto de la Alianza para la Diversidad Lingüística, 3054
idiomas en peligro de extinción (http://www.endangeredlanguages.com, 2012)
La UNESCO explica que Internet, a pesar de la ventaja que conlleva, puede
acelerar la "extinción" de ciertos idiomas al favorecer la "homogeneización" en lugar de
la diversidad: "Tres de cada cuatro páginas en Internet están escritas en inglés. Sin
embargo, el número de cibernautas cuya lengua materna no es el inglés excede del
50%, porcentaje que sigue aumentando", indica el documento (Figura Nº 3).

Fig. Nº 3: La extinción de los idiomas en Internet

en peligro
de extinición
representadas
52% en Internet

10%

Hasta ahora, la mayoría de las lenguas que existen están ausentes en Internet en
beneficio de las ocho lenguas más utilizadas del mundo, encabezadas por el inglés. Esto
no sólo margina a miles de culturas, sino que constituye una posible amenaza para la
diversidad de los contenidos.
“La globalización de la ciencia ofrece innumerables oportunidades para el
adelanto intelectual. Pero a menos que construyamos mejores puentes entre las
comunidades lingüísticas, innumerables ideas e innovaciones serán ignoradas y
perdidas efectivamente” (Barany, 2005)

fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 13
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
Un estudio realizado por las organizaciones ISOC, OCDE Y UNESCO (2011)
corrobora “que los contenidos locales, la infraestructura y los precios del acceso a
Internet son tres elementos que están relacionados entre sí y que se pueden sustentar
mutuamente en un círculo virtuoso:
• cuanto mejor es la conectividad, tanto mayor suele ser el nivel de creación
de contenidos locales digitales;
• los países que cuentan con mayor infraestructura de Internet (a todos los
niveles de ingresos) son también los que producen mayor cantidad de
contenidos digitales, como lo muestra el número de artículos de Wikipedia
y páginas web con determinados códigos de país en dominios de alto
nivel”.
Esto nos lleva a apreciar que la capacidad de acceso y asimilación que permite
tratar la avalancha creciente de información y conocimiento es muy desigual, según los
grupos sociales y los países.
➔El acceso a Internet es menos democrático de lo que parece, a pesar de que se
afirma lo contrario con alguna ligereza. Este comentario se verifica cotejando no sólo los
porcentajes de población real que accede a este medio, sino también las distintas
posibilidades de acceso real a sus contenidos.
¿Es, entonces, la ficción de la igualdad de oportunidades?

fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 14
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
4. Recuperación de información
¿Cómo buscar en la Web?, ¿Cómo recuperar información en la Web?
¿Cómo se reconocen las configuraciones que aseguran la “calidad” de la
información?
¿Cuánto tiempo se pierde buscando dónde está la información?
Coincidimos en que:
1) la cantidad de información nos supera;
2) la información se estructura en forma más compleja;
3) existe variabilidad espacial y temporal;
4) los medios de comunicación son imprecisos;
5) esos medios tienen un enorme poder en nuestra sociedad.
Entonces, tenemos que concentrarnos en:
1) eliminar rápidamente la información poco confiable o repetitiva;
2) buscar los puntos de imprecisión, para poner a prueba la consistencia de
la realidad que se nos plantea;
3) resistirnos a aceptar la tendencia mayor, sin una crítica lo más objetiva
posible.
Mucha información, ¿es sólo cuestión de números?
En un estudio realizado en la Universidad de Berkeley, Bergman (2000) distingue
dos ámbitos en la Web:
a) la Web visible cuya información puede recuperarse utilizando las
herramientas de búsqueda tradicionales, y
b) la Web invisible o Web profunda (Figura Nº 4) a la que no tienen
acceso los motores de búsqueda. En cuanto a esta denominación Codina
la refiere como inadecuada, ya que, si ese concepto refiere al sector de
sitios y de páginas web que no pueden indizar los motores de búsqueda de
uso público, “debería denominarse, en realidad, la web "no indizable", lo
cual es un término mucho más adecuado, pero claramente alejado de la
capacidad sugeridora del término invisible”. (Codina, 2003)
A su vez, Sherman y Price (2001) caracterizan cuatro tipos de contenidos
invisibles en la Web profunda, que llaman: 1) Web “opaca", 2) Web “privada", 3) Web
“propietaria”, y 4) Web “realmente invisible”.
La Web opaca se compone de archivos que podrían estar incluidos en los índices
de los motores de búsqueda, pero no lo están debido a razones de extensión de la
indización. La Web privada consiste de sitios que podrían estar indizados en los motores
de búsqueda, pero que son excluidos en forma deliberada, porque sus páginas están
protegidas por contraseñas o porque contienen restricciones para esos dispositivos de
búsqueda. La Web propietaria incluye a todas aquellas páginas en las que es necesario
registrarse para tener acceso al contenido, ya sea en forma gratuita o paga. Y la Web
realmente invisible, que se compone de páginas que no pueden ser indizadas por
limitaciones técnicas de los buscadores.
Hoy en día nos encontramos con algo más de 1.200 millones de sitios web,
aunque debemos indicar que cerca del 75% no se encuentran activos (InternetLiveStats,

fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 15
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
2017). De este universo y según un estudio de la Universidad de Iowa (Gulli y Signorini,
2005) la Web indizada –la parte de la Web a la que los buscadores pueden acceder– es
de alrededor de 11.500 millones de páginas. En cuanto a la Web profunda, la
investigación de Bergman (2001) ha estimado que la información contenida en la Web
invisible es aproximadamente 550 veces mayor que la de la web superficial y crece a
mucha mayor velocidad. Un estudio de Cyveillance (2000) calcula que el tamaño de la
Web profunda es 275 veces mayor que el de la Web visible mientras que estimaciones
posteriores señalan que el tamaño de la Web invisible es sólo entre 2 y 50 veces mayor
que el de la Web visible (Sherman y Price, 2001). Las diferencias en las cifras se deben
a las diferentes metodologías utilizadas en las investigaciones. En cualquier caso, el
tamaño de Internet hoy es significativamente mayor -1000 millones de sitios cada uno
con cientos o miles de páginas-, por lo que el valor de la información contenida en la
llamada Web profunda justifica el estudio de sus formas de acceso.
Fig. Nº 4: La Web invisible

Web visible

Base de datos
Sitios protegidos
Web sin enlazar
Sitios estatales
Intranets
OPAC
etc. Web invisible

“Web oscura”

El volumen de información disponible en la Web excede a la capacidad de


“rastreo” -crawl- de los motores de búsqueda y el nivel de solapamiento entre
buscadores justifica, tal vez, su proliferación, ya que cada uno va cubriendo diferentes
áreas del espacio web, sin que por ahora sea técnicamente posible que alguno de ellos
alcance la exhaustividad. Se estima que la Web indizada contiene al menos 47 mil
millones de páginas (WorldWideWebSize, 2016) y el NEC Research Institute ha
evaluado que cada motor de búsqueda indiza no más del 16% de la Web visible, por lo
tanto cuando los usuarios realizan sus búsquedas pierden la posibilidad de rastrear, no
sólo en la Web profunda, sino también en el 84% de la Web visible.
Por otra parte, es preciso desarrollar nuevos instrumentos que faciliten la
localización de información relevante para quién la busca; en este sentido, los sistemas
de bases de datos y los motores de búsqueda están experimentando una evolución
constante.
¿Por qué es importante conocer acerca de los motores de búsqueda?
Dado el cambio y crecimiento constante de la Web, que ofrece nuevos contenidos
cada día, conocer el modo de operar de los motores de búsqueda resulta crucial para
encontrar respuestas a nuestras preguntas, focalizar nuestros esfuerzos y concebir

fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 16
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
nuestras estrategias de búsqueda.
Para Jaczynski (1999), existen dos métodos básicos a través de los cuáles los
usuarios buscan información en la Web: a) preguntando –querying–y, b) explorando
–browsing–.
Querying es una búsqueda basada en palabras claves, en la que el motor de
búsqueda coloca la palabra –o combinación de palabras– clave en su índice de palabras
y devuelve una lista ordenada de documentos.
Browsing es la navegación a través de vínculos hacia un tema de interés. Los
usuarios suelen explorar cuando tienen objetivos generales o no pueden expresar sus
objetivos explícitamente como combinación de palabras clave. Algunos estudios dan
cuenta de la dificultad de los usuarios con los mecanismos de los motores de búsqueda,
ya que la expresión booleana a veces no se acerca al lenguaje natural. Es así que la
búsqueda de información resulta, en muchas ocasiones un proceso iterativo, en el que la
respuesta a una pregunta produce una reformulación de la propia pregunta y por lo tanto
de lo que realmente es relevante para el que busca.
Para avanzar en el tema de recuperación de información, nos vamos a centrar en:
• Buscadores y metabuscadores
• Directorios de información y portales
• Bases de datos electrónicas
Cada uno de ellos tiene fortalezas y debilidades, así como características
particulares y proveen diferentes servicios. Conocerlos y compararlos es importante para
los usuarios, ya que ello les permitirá llevar adelante las estrategias adecuadas para
optimizar su utilización. Podemos comparar los motores de búsqueda según:
A. las características de la búsqueda:
- Concepto de búsqueda: el motor no sólo busca la palabra clave, sino
también sinónimos o similares.
- Exclusión: posibilidad de excluir resultados a partir de la inclusión de
términos específicos.
- Restricciones: búsqueda de términos contenidos en alguna parte de la
página o dentro de una página especial (de imagen o video) o en sitios con
dominios específicos (.com, .edu). Restricciones en cuanto a la fecha de
creación o actualización de una página, así como la búsqueda en varios
idiomas.
B. las características del motor:
- Tamaño: qué cantidad de páginas tiene indizada en su base de datos.
- Lugares en el que busca: en toda la página, en el encabezado, en la URL,
etc.
- Recursos indizados: además de la Web, otros recursos como newsgroup,
e-mail, ftp, etc.
C. los resultados obtenidos:
- Métodos de ordenamiento o visualización: diferentes parámetros pueden
ser utilizados para especificar el orden de los resultados.
- Sugerencias de búsqueda: a partir de la búsqueda inicial.

fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 17
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
- Resultados similares: visualización de páginas con resultado similar.
4.1. Buscadores

Un buscador es un programa en el que el trabajo de clasificación de las páginas


se realiza de forma completamente automática.
Constan de los siguientes elementos:
- Arácnidos. Son programas cuya labor se centra en analizar la red e ir
recopilando las páginas que residen en los distintos servidores Web a los
cuales se van conectando. A medida que van recopilando las páginas las van
“indizando” (registrar ordenadamente datos e informaciones, para elaborar su
índice), extrayendo de las mismas las palabras clave más representativas
(índices) que serán comparados con una serie de palabras clave en el proceso
de búsqueda. Generalmente, para cada buscador existe un elevado número
de estos programas, de forma que en un tiempo razonable se tenga analizado
un número significativo de servidores Web de la red.
- Portal. Espacio del sistema de búsqueda que es visible al usuario. Su función
es el diálogo con el usuario, recibiendo sus consultas. Éstas, por norma
general, serán enviadas a otra computadora con una elevada potencia de
cálculo cuya función es resolver la consulta en base a comparar los datos
suministrados por el usuario con el contenido de la base de datos generada
por los arácnidos. Tras la resolución de la consulta, los resultados son
devueltos al portal para su presentación.
Las principales características de estas herramientas de búsqueda son:
- La búsqueda se realiza por palabras clave.
- Los resultados se presentan con una prioridad en función de la posición,
proximidad y número de apariciones de las palabras clave.
- El proceso de clasificación de las páginas se realiza de forma automática.
- Baja relevancia en las respuestas.
La baja relevancia en las respuestas es consecuencia directa del hecho de que
esta propiedad está ligada a la subjetividad del usuario.
Buscadores en la Web hay miles y con diferentes grados de importancia. No hay
estudios actuales que indiquen el número exacto de buscadores, como tampoco de
directorios y la posible combinación de los mismos.
Algunos de los buscadores más representativos son los siguientes:
Yahoo! http://www.search.yahoo.com/
Ask http://www.ask.com/
Hay que destacar que la rentabilidad económica de los buscadores inicialmente
podría parecer muy discutible, al ser servicios que se prestan con carácter gratuito en la
red. No obstante, su rentabilidad se basa fundamentalmente en dos aspectos: la
mayoría de los motores de búsqueda destinan espacios específicos a posicionamientos
pagos -Sponsored Links o Ads–. Mediante el posicionamiento pago los buscadores
garantizan que el sitio será incluido en dicha sección según una serie de términos o
palabras clave relacionados con dicha página Este posicionamiento suele estar dado en
función del precio pagado. Por otro lado, hay que tener en cuenta que hay cada vez

fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 18
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
mayor número de empresas que están montando “Intranets”', esto es, redes de
computadoras con características muy similares a Internet pero cuyo acceso está
restringido a los empleados de la empresa. Si la empresa es suficientemente grande, es
muy probable que exista un elevado número de servidores Web suministrando
información dentro de la Intranet. Empresas como AltaVista o Google proporcionan el
motor de búsqueda para construir un buscador que funcione en una Intranet, facilitando,
de esta forma, el acceso a la información por parte de las personas que han de trabajar
en ella.
Por último, cabe agregar que los buscadores arrojan resultados sobre las
búsquedas realizadas en sus propios índices y no sobre la web directamente. Esto
último sería imposible debido al volumen de información y al tiempo requerido para
realizar la búsqueda. El rastreo de páginas web que efectúan los spider o robots se
realiza con periodicidad variable, por ello siempre existe una diferencia entre lo que
pueden recuperar los buscadores y lo que realmente se encuentra en la web.

4.2 Meta-buscadores
A veces resulta difícil encontrar lo que uno busca en la red, aún haciendo uso de
buscadores. Cualquiera que haya realizado una búsqueda algo compleja en la red habrá
encontrado que, dependiendo del buscador que utilice, el número y tipo de respuestas
puede ser de lo más variado.
Generalmente, el proceso de búsqueda en la red consta de los siguientes pasos:
1. Elegir un buscador
2. Describir la información de interés a través de palabras clave o tópicos, de
acuerdo con la estructura particular de consultas que permita el buscador, el cuál
la traducirá a una especificación formal interna, más fácilmente manejable.
3. Iniciar la búsqueda.
4. Analizar la lista de respuestas.
En función del número de respuestas obtenidas y de su interés, se refina la
búsqueda volviendo al paso 2 o se elige un nuevo buscador, paso 1, repitiéndose el
proceso.
Este proceso puede ser automatizado de alguna forma. Existen programas en la
red –metabuscadores– que funcionan como buscadores, pero en donde el proceso de
búsqueda se realiza entre un conjunto relativamente elevado de otros buscadores,
integrando la información resultante de forma que obtengamos mejores resultados. El
proceso de integración consiste, entre otras cosas, en eliminar la multiplicidad de las
respuestas y establecer un orden en función de las respuestas proporcionadas por los
buscadores y por el número de veces que el resultado haya aparecido en distintos
buscadores.
En síntesis: los metabuscadores no disponen de una base de datos propia, sino
que utilizan la información almacenada en las bases de datos de otros buscadores y
directorios, es decir que hacen las búsquedas simultáneamente en varios motores.
Dogpile http://www.dogpile.com
Se trata de un metabuscador que lista las salidas suministradas por los
buscadores tales como: Google, Yahoo!, Bing y Ask.

fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 19
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
4.3 Google: algo más que un buscador
Google –con alrededor de 49 mil millones de páginas web indexadas
(WorldWideWebSize, 2016)– es un buscador que mantiene todas las ventajas de un
robot de búsqueda automática, pues consigue rastreos muy amplios, pero elimina el
problema de la información basura y atrasada. Este avance lo logra dado que aplica
como criterio principal para ordenar los resultados el número de enlaces que se dirigen
desde los millones de páginas rastreadas hacia otras webs y no, como algunos de los
buscadores automáticos, el número de veces que una palabra clave se repite en una
página. Esto, en definitiva, consigue que sean los propios usuarios de Internet, mediante
sus particulares selecciones de páginas favoritas en cada momento, quienes determinen
el orden en el que aparecerán los resultados al realizar una búsqueda en Google. En
teoría, los resultados de este buscador son de calidad adecuada y actual.
Para ordenar documentos (decidir su importancia respecto de una consulta)
Google utiliza un algoritmo propio denominado PageRank. El concepto básico del
algoritmo PageRank es que una página es más importante en la medida en que más
páginas apuntan hacia ella –principio inspirado en el número de citas que garantiza la
calidad de los artículos académicos: cuantos más artículos citan una publicación, más
valor adquiere ese trabajo, y más valor y visibilidad adquieren los artículos que ese
trabajo cita (Grau, 2013–. Por lo tanto, según el algoritmo la importancia de una página
depende de:
(1) cuántas páginas apuntan a ella,
(2) la cantidad de enlaces en estas páginas, y
(3) cuántas y cuán importantes son las páginas que apuntan a la página.
Con el tiempo Google comenzó a diseñar algoritmos que le permiten: listar sitios
con publicidades (lo que lo ha llevado a ser una de las empresas más ricas), corregir
errores de ortografía y aprender de nuestras búsquedas anteriores. Este último algoritmo
que procesa información basada en nuestro comportamiento, filtra los resultados
teniendo en cuenta “nuestras búsquedas anteriores”. Estos sistemas de recomendación
limitan el espectro de la búsqueda porque sólo nos ofrecen “lo que queremos”
desechando la objetividad, lo casual, lo inesperado, lo no-buscado (Grau, 2013).
¿Porqué algo más que un buscador?
Google tiene intereses en multitud de industrias: internet, publicidad, automotor,
electricidad, biotecnología, aeronáutica, telefonía, etc. Además, es la mayor base de
datos personales jamás creada, concentrando información sobre tendencias y
comportamientos de los usuarios a través de sus diferentes aplicaciones: Google
Desktop, Google Docs, Google+, Google Chrome, Google Analytics, Gmail, Google
Maps, YouTube, etc. Dado su tamaño y poder tiene la capacidad “de imponer sus
productos y servicios a un volumen de mil millones de usuarios” (Suarez Sánchez-
Ocaña, 2012). Según un estudio realizado en mayo de 2011 por la empresa ComScore,
Google superó en dicho mes la cifra de 1000 millones de visitantes únicos.
El proceso de búsqueda no es tan anónimo como los usuarios creemos y los
correos de Gmail son escaneados, es por ello que a partir del análisis y estudio de todos
esos datos recogidos Google no le da al usuario lo que quiere o cree necesitar, sino que
le ofrece lo que “realmente” necesita según “el criterio Google”.
Por otra parte, ya hay estudios (Reischl, 2008) que demuestran que Google

fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 20
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
manipula los resultados e influye en el ranking (por ejemplo, favoreciendo a Wikipedia).
Más que una guía en el proceso de búsqueda Google se ha transformado en un
proveedor de “sus propios contenidos” (fotos, videos, libros, etc). Queda claro que este
comportamiento avanza sobre los conceptos de libertad, objetividad y privacidad.
Los conocimientos sobre los usuarios son el verdadero capital de esta empresa y
la base para sus futuros proyectos.

4.4 De los directorios de información a los portales


Tradicionalmente, los directorios de búsqueda han sido clasificaciones de
recursos de información de la Web realizadas por personas en vez de forma
automatizada. Son agrupaciones temáticas que permiten ir navegando a través de
enlaces hipertextuales. La mayoría de los directorios contienen además un motor de
búsqueda que permite buscar sobre las categorías y los elementos dependientes de
esas categorías.
Los directorios tienen dos formas de generar sus índices:
• Captura pasiva, en la que los propios interesados, los administradores de
los sitios web envían la información al directorio mediante un formulario
porque les interesa aparecer en el directorio.

Captura activa, cuando es la propia organización que genera el directorio la
que busca direcciones de acuerdo a unos criterios establecidos.
Este tipo de directorios recoge tan sólo las páginas principales de las diversas
organizaciones. O sea, no indexa el contenido de todo el sitio Web sino que
simplemente representa mediante la asignación a una categoría la actividad o las
actividades que caracterizan al sitio Web (agencias de viajes, ventas de discos,
universidades, etc.). El directorio lo que hace es guiar hasta un recurso, por organización
o por tema, y el usuario luego tendrá que buscar en él.
Todos los directorios tienen también una opción que permite realizar búsquedas
por palabras claves. Pero, la búsqueda se realiza no sobre todos los documentos de
Internet sino sobre la base de datos del directorio, que a veces incluye no sólo las
categorías sino también una pequeña descripción de los recursos. Últimamente muchos
de los directorios existentes en la red se han ocupado de introducir sistemas de
búsqueda más potentes o de realizar alianzas con algun/os de los motores de búsqueda
existentes en Internet.

4.4.1 Los portales


Los portales (o directorios temáticos) son sitios Web que ofrecen una serie de
servicios a los navegantes: directorios de información, motores de búsqueda, correo
electrónico, mensajería instantánea, chat, almacenamiento de información, etc. Los
portales segmentan su actividad de acuerdo a criterios temáticos, los hay especializados
en arte, en arquitectura, en biología, en medicina, en informática, en educación, etc.
Algunos portales educativos en español destacados:
IIEP Buenos Aires http://www.buenosaires.iipe.unesco.org/recursos
Portal de las Américas http://www.educoas.org
El Portal de las universidades http://www.universia.com.ar
Educ.ar http://www.educ.ar

fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 21
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
4.5 En síntesis
Como hemos visto, los buscadores y directorios se conforman y funcionan de
manera diferente. Así, las formas de búsqueda más eficientes varían en unos y otros.
Mientras que la búsqueda por palabras -querying- es más adecuada en los buscadores,
la navegación –browsing- es más recomendable en los directorios. En general las
herramientas hasta aquí descriptas tienen ciertas limitaciones que hemos detallado
previamente y que podemos resumir de la siguiente manera:
• Mecanismo de pregunta: las preguntas de los usuarios son introducidas a
partir de un conjunto de palabras clave. Muchas veces las necesidades de
información no pueden ser formuladas fácilmente a través de la sintaxis
booleana.
• Cobertura de páginas web: sólo “barren” una porción limitada de la Web visible
•Largas listas de resultados con baja relevancia respecto a la pregunta del
usuario. La relevancia está dada por algún método del motor de búsqueda
(análisis estadístico de frecuencia de palabras en el texto, análisis de la
frecuencia con que las páginas están ligadas a otras, etc.), método que carece
de información acerca del contexto, del comportamiento y de las preferencias
del usuario.
Según Cornellá (1998) podemos definir “dos tipos fundamentales de relevancia.
La relevancia formal: cuando los resultados de una búsqueda de información responden
a la ecuación de búsqueda que se había planteado. Y la relevancia semántica: cuando
los resultados obtenidos responden a las necesidades del usuario.” Cuando hablamos
de baja relevancia podemos referirnos, entonces, a información poco relevante
formalmente: la sintaxis de búsqueda es pobre, está mal definida o el lugar en el que se
busca no es el adecuado, y a información irrelevante semánticamente: no sirve para
resolver la necesidad de información.
Por todo ello –y si bien los motores de búsqueda han mejorado en su
funcionamiento y cobertura– es que usuarios con necesidades específicas no siempre
encuentran la información requerida en la Web ya que los motores de búsqueda son
incapaces de responder a “la necesidad que hay detrás de la pregunta”.
Podemos describir este problema como el problema de los lenguajes:
La necesidad de información se plantea en lenguaje natural ➔ Esta necesidad
expresada se transforma en un lenguaje documental formalizado ➔ A su vez,
éste debe transformase en una expresión en lenguaje de recuperación.
En la web, y aún con la ayuda de las interfaces gráficas, el problema se encuentra
en la transición entre los lenguajes.

4.6 ¿Cómo acceder a la Web profunda?


Dado que la localización de información útil y de calidad en Internet es una tarea
cada día más compleja y difícil, que no se basa únicamente en la utilización de
buscadores clásicos, necesitamos caminos que nos permitan acceder a todo este
volumen de información "profunda" o "invisible".
Uno de estos caminos consiste en la consulta a buscadores y directorios que nos
den enlaces a los sitios donde se encuentran la documentación y las bases de datos.
Por ejemplo:

fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 22
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
Google Scholar http://scholar.google.com
Redalyc http://www.redalyc.org/home.oa
DOAJ -Directory of Open Access Journals- https://doaj.org
SCIELO http://www.scielo.org.ar/scielo.php
EdITLib http://www.editlib.org (aprendizaje y tecnología)
SISBI –Sistemas de Bibliotecas y de Información de la UBA–
http://www.sisbi.uba.ar/
CiteSeerX http://citeseer.ist.psu.edu (Computer and Information Science)
UNESCO Library http://www.unesco.org/library/

4.6.1 Bases de Datos, Opac y Journals


Mucha información en la Web profunda es mantenida por las instituciones
académicas y suelen ser de mejor calidad que los resultados obtenidos por los
buscadores. Los accesos académicos –academic gateways– que pueden ayudarnos a
encontrar dicha información son las bases de datos electrónicas –online databases-, las
OPAC –online public access catalog- y las publicaciones electrónicas –electronic
journals-. Entendemos por OPAC a catálogos que contienen información sobre el
material existente en las bibliotecas. El acceso puede realizarse desde una estación de
trabajo -computer Workstation- ubicada en la biblioteca o a una interface Web –OPAC
Web- que permite el acceso público al catálogo vía Internet.
Las bases de datos que dan referencias a bibliografía publicada en un área
específica constituyen un buen vehículo para identificar la documentación de calidad
(Talbot, 2003). Muchas de estas bases de datos son de acceso restricto, aunque no
necesariamente pago.
Como ejemplo podemos listar:
Tesauro UNESCO http://databases.unesco.org/thessp/
ERIC Database http://www.eric.ed.gov/
EBSCOhost http://www.ebscohost.com/
Otro de los recursos disponibles para acceder a información científica son las
electronic journals, definidas como publicaciones académicas o colecciones de artículos
–algunos con referato- sobre temas relacionados que son publicados periódicamente en
formato digital y distribuidos a través de Internet. Estas publicaciones suelen tener
antecedentes de publicación tradicional en papel. En general, para acceder a los
artículos completos disponibles en dichos sitios hay que estar suscripto, aunque sí es
posible obtener los resúmenes –abstract- de los mismos.
REDC –Revista Española de Documentación Científica-
http://redc.revistas.csic.es/index.php/redc
Revistas Científicas Complutenses http://revistas.ucm.es
RELIEVE -Revista ELectrónica de Investigación y EValuación Educativa-
http://www.uv.es/relieve/
REICE -Revista Iberoamericana sobre Calidad, Eficacia y Cambio en
Educación- http://www.rinace.net/reice/index.htm
Elsevier http://www.elsevier.com/openaccess

fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 23
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
¿Cómo recuperamos información en las bases de datos electrónicas? ¿Por qué
los catálogos en línea nos resultan difíciles de usar?
Según Borgman (1988a) los catálogos en línea presentan dificultades en su uso
porque su diseño no incorpora conocimiento sobre el comportamiento de búsqueda de
los usuarios. La estructura de los registros, contenidos y los campos primarios de
búsqueda son diseñados desde el modelo del catálogo tradicional, mientras que las
funciones de búsqueda y algunas características de la interface, desde los modelos de
recuperación de la información.
Cuando nos referimos al modelo tradicional de estructura de los catálogos –card
catalogs- hablamos del modelo del siglo XIX aún presente (Buckland, 1992) y definido
por Cutter en 1904 como aquel que está diseñado para:
1.- permitir al usuario encontrar un libro del cual conoce:
el autor
el título
el tema
2. para demostrar lo que una biblioteca tiene:
de un autor dado
sobre un tema en particular
sobre algún género literario
3. asistir en la elección de un trabajo:
en cuanto a su edición (bibliográfico)
en cuanto a su carácter (literario o temático).
Basados en este modelo se asume que el usuario comienza su proceso de
búsqueda sabiendo al menos uno de los tres puntos de acceso (autor, título o tema), sin
embargo, varios estudios sobre el comportamiento en la búsqueda de información
(Borgman y Siegfried, 1992; Chen y Dhar, 1990) –tanto en ámbitos de búsqueda manual
o automática– muestran que las personas inician su proceso de búsqueda con
información incompleta sobre algunos de los tres puntos de acceso.
En las bases de datos electrónicas, y dependiendo de los campos que conformen
sus registros, la indexación suele estar hecha por autor, título, editorial, disciplina,
corrientes filosóficas, años, descriptores, etc. Es importante hacer hincapié que la
sintaxis booleana de búsqueda -por palabra clave- actuará sobre los campos
bibliográficos indexados y que éstos no son índices de ocurrencia de palabras como los
generados por los buscadores. Es por ello que, si el usuario desconoce los puntos de
acceso tradicionales, la forma más adecuada para comenzar la búsqueda será a partir
del uso de los descriptores. Recordemos que los descriptores no son lo mismo que las
palabras clave. Son términos organizados en un tesauro que describen el tema con que
se relaciona el documento o artículo (ver punto 2.2.2 de este documento).
Para la recuperación de información en estos sistemas sugerimos, antes de
comenzar la búsqueda, tomar un tiempo para conocer el modelo de indexación por
campos y explorar el tesauro, siguiendo los siguientes pasos:

fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 24
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
1. Describir el tema con palabras propias
2. Dividir el tema en conceptos principales
3. Utilizar el tesauro para localizar los descriptores apropiados a cada
concepto identificado.
La parte más compleja del proceso suele ocurrir “fuera de línea”: analizar la
necesidad de información, identificar los conceptos principales y articularlos.

Habiendo analizado las principales herramientas de búsqueda disponibles en la


Web, podemos sintetizar el modelo de búsqueda en dichas herramientas de la siguiente
forma:

Buscadores
Querying ➔ sobre índices de palabras
Metabuscadores
Portales
Directorios Browsing
Base de Datos
OPAC Querying ➔ sobre descriptores de un tesauro

4.6.2 El lado oscuro de la Web Profunda


La Web Profunda se ha transformado con los años en un repositorio de
información que puede alojar desde lo más inocente hasta lo más impensado. En la Web
Profunda coexiste la Web Oscura que es una colección de redes y tecnologías usadas
para compartir información y contenidos digitales que está "distribuida" entre los distintos
nodos y que trata de preservar el anonimato de quienes intercambian dicha información.
Debido a la búsqueda del anonimato, es frecuente que este tipo de redes hagan un uso
intensivo de algoritmos criptográficos. Por ejemplo, es frecuente que la información
(tanto cuando está almacenada lista para ser compartida, como cuando está siendo
transferida) esté cifrada para que si alguien captura algún dato sea difícil que lo
interprete.
Tor es un sistema que actúa como puerta de entrada a la Web Profunda.
Funciona estableciendo una herramienta que encripta sucesivamente la información del
usuario, y la envía a gran cantidad de servidores en todo el mundo. Esta técnica permite
que tanto la información como el usuario sean casi imposibles de rastrear.
Muchos usuarios estarán familiarizados con el lado “ilícito” de Internet: cómo
descargar música de forma ilegal, dónde encontrar el último estreno del cine sin tener
que pagar, dónde conseguir la licencia de un software sin comprarlo, etc. Pero la Web
Oscura va mucho más allá, en ella se pueden encontrar:

• Soporte a actividades terroristas


• Servicio de sicariato
• Soporte a actividades pederastas

fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 25
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
• Venta de estupefacientes y armas
• Trata de personas
• Publicación de información secreta sobre organizaciones legales (ej.
servicios secretos o grandes empresas comerciales).
• Publicación de información secreta sobre organizaciones criminales
Pero es importante resaltar que en la Web Profunda no es este su único
contenido, hay un montón de páginas que no tienen nada de incorrecto. Al ser un
sistema autónomo, inmenso y hasta el momento desconocido para millones de
personas, la Web Profunda está inmersa en un roce permanente entre lo lícito y lo ilícito.

4.7 Los idiomas y la recuperación en la Web


Tal como indicamos en este texto, Internet pone a nuestra disposición
documentos en varios idiomas que provienen, frecuentemente, del inglés, el alemán, el
francés, y el español. Estos documentos presentan, por la simple transcripción de ideas
de un idioma a otro, dificultades particulares, y es preciso ser prudentes cuando son
consultados. Muchos términos técnicos –o específicos de la disciplina en cuestión– son
objeto de falsas interpretaciones, o no producen en otros idiomas toda la densidad de
búsqueda que tienen en su idioma original. Las palabras, las expresiones, las frases
idiomáticas y las interpretaciones no siempre se corresponden. Es preciso desconfiar
también de las lenguas aparentemente parecidas, como el español y el italiano, o el
alemán y el sueco, en los que los errores de traducción e interpretación son frecuentes.
Por ello la simple traducción literal de un término o una expresión de un idioma a otro es
peligrosa como única estrategia en el proceso de búsqueda. Por otra parte creemos que
a este último problema debemos añadir dos situaciones no menos importantes:
- las modas idiomáticas y el uso de jergas, y
- la denominación que se hace en otro idioma del concepto buscado, en el que
intervienen tanto la conceptualización propia de la disciplina, así como los
paradigmas desde la que se aborda.
Veamos algunos ejemplos….
Si hablamos de traducciones o interpretaciones incorrectas, aquí hay algunos:

Inglés Interpretación en Castellano

Incorrecta Correcta

Billion Billón Mil millones

Library Librería Biblioteca

Muchas veces estas interpretaciones incorrectas están “ayudadas” por el uso de


servicios de traducción gratuitos. Estos servicios suelen tener serias deficiencias en la
traducción, ya que suele no tenerse en cuenta la jerga de la disciplina, así como el
contexto en el cual la información toma significado.
Para ilustrar el uso de los modismos en las disciplinas, un buen ejemplo es la

fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 26
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
palabra buzzword.
¿Cómo traducimos buzzword? O deberíamos mejor plantear ¿cómo explicamos
qué es un buzzword?
Es un término utilizado en área específicas (tecnológicas, administrativas,
políticas, etc.) que “suena importante y es usado para impresionar a las personas o
describir vagamente un concepto en forma intencional”. Si bien difiere de la jerga, ya que
ésta es entendida como el lenguaje especial y familiar que usan entre sí los individuos
de ciertas profesiones y oficios, para ambos casos nos encontramos que la traducción a
otro idioma de un término de esas características resulta dificultosa.
Y si no, ¿cómo traduciríamos al inglés el término infoxicación, y el término
infonomía (Cornellá, 2000)?
Y en castellano ¿qué significa la expresión Social Informatics? ¿Algo así como
Socioinformática? ¿Y qué queremos decir con Socioinformática?
El texto de este documento también es ejemplo de uso de jergas informáticas en
inglés de compleja traducción (nos referimos a traducción con sentido, no a traducción
literal): querying, browsing, crawl, academic gateways, etc.
Por último, debemos referirnos a las denominaciones en otros idiomas del
concepto buscado. Este aspecto nos obliga no sólo a saber (o por lo menos tener idea)
de la traducción de los conceptos, sino a conocer los paradigmas desde los cuales se
aborda la disciplina en cuestión.
Un ejemplo que nos puede interesar: en el ámbito de las ciencias de la educación
buscaríamos didáctica para recuperar información sobre metodologías de enseñanza.
Su traducción literal “didactics” puede ayudarnos a encontrar documentos de origen
europeo, pero si deseamos revisar la literatura norteamericana sobre el tema… poco o
nada encontraremos. La clave allí es que para los norteamericanos desde el paradigma
desde el cual estudian y analizan los métodos de enseñanza, la expresión bajo la cual
definen este concepto es “Instructional Design”. Una simple exploración del Tesauro del
ERIC da cuenta de la inexistencia del término “didactics” como descriptor, pero sí
encontraremos el término “Instructional Design”.
El carácter flexible, plural y descentralizado de Internet, es una virtud para la
diversidad de contenidos en distintos idiomas, pero a la vez una desventaja para la
efectividad de la búsqueda de información, requiriendo de una reflexión profunda antes
de comenzar a planificar una estrategia.

Hasta aquí hemos visto que el proceso de búsqueda en la Web requiere tres tipos
de “conocimiento”:
- conceptual, del proceso de traducción de una necesidad de información a una
expresión investigable,
- semántico, de cómo expresar la pregunta o expresión investigable en lenguaje
de recuperación de un sistema dado,
- tecnológico (habilidades) en cómo usar los sistemas de búsqueda basados en
computadora.

fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 27
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
5. Del tesauro a la Web Semántica
Suele suceder –bastante a menudo- que los motores de búsqueda no “listan” lo
que buscamos. Esto pasa porque los buscadores funcionan de manera puramente
“sintáctica”, es decir, no “entienden” las palabras. Desafortunadamente, al nivel del
significado (semántica) aún estamos muy por debajo de nuestras necesidades. Estamos
lejos de responder preguntas como “todos los museos que exhiban trabajos de Dalí” o
“¿Cuál es la biblioteca que tiene la mejor colección de los escritos de Gandhi?” o “¿Cuál
es la compañía que ofrece el mejor tour a Tailandia teniendo en cuenta precio y
categoría?”. Un motor de búsqueda estándar (como Google, Yahoo!, etc.) no puede
responder tales consultas. Sin embargo, la información está allí: hay que relacionarla y
agregarla. La limitación obedece a la falta de capacidad de las máquinas para entender
el significado y las relaciones entre las partes de información que recolectan. Hoy en día
somos los humanos quienes agregamos el contexto, interpretamos y damos sentido a la
información que existe en la Web. Entonces, ¿qué hacer?
El proyecto que intenta señalar el futuro de la Web es el promovido por el
organismo W3 Consortium: la Web Semántica - Semantic Web-, que intenta transformar
la Web actual de tal forma que la información y los servicios sean entendibles y usables
tanto por computadores como por personas. Para explicar este concepto, nos
permitimos introducir el siguiente ejemplo:
- Año 2009: para un docente de una institución educativa es muy simple solicitar
a sus alumnos que busquen información en Internet, sin preocuparse
demasiado por el tiempo que les toma y si entienden las razones de la
búsqueda. El alumno busca información así: utiliza un browser y en Sitios
como Google o Altavista encuentra gran cantidad de enlaces. Los revisa y, si
tiene suerte, extrae la información solicitada por su profesor, que recibe la
información por parte de su alumno algunas horas después.
- Año ¿2020?: un niño pregunta a “su asistente personal” -que lleva puesto
(algo así como un monóculo como pantalla y un teclado en su chaqueta)-:
¿quién era el entrenador cuando mi equipo favorito le hizo dos goles al
campeón del mundo en el 2006?”. El asistente personal busca Sitios Web
dónde encontrar lo solicitado por el niño, quien en poco más de un minuto
recibe la respuesta.
En ambos casos, el alumno y el asistente son agentes que tienen las siguientes
características:
• entienden lo que se le pide buscar,
• comprenden el contenido de los Sitios Web que visitan,
• validan si lo encontrado corresponde a lo que se le pidió buscar, y
• deducen nueva información de la ya obtenida.
Pero, en el año 2009 el alumno es un agente humano, mientras que en el año
2020 el asistente es un agente digital. En el ¿2020? se espera que las computadoras
puedan desarrollar tareas de gestión que requieran interpretar información y tomar
decisiones adaptándolas al contexto.
Actualmente la Web se asemeja a un grafo formado por nodos –sin distinción de
tipos- y enlaces igualmente indiferenciados. Por ejemplo, no se hace distinción entre la
página personal de un profesor y el portal de un negocio on-line, como tampoco se

fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 28
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
distinguen explícitamente los enlaces a las asignaturas que imparte un profesor de los
enlaces a sus publicaciones. Por el contrario en la Web semántica (Figura Nº 5) cada
nodo se corresponde a un tipo y los enlaces representan relaciones explícitamente
diferenciadas.
Fig. Nº 5: La web semántica

La Web semántica se caracterizará por estar personalizada y sólo proporcionará


buenos resultados cuando reconozca el contexto y acceda a fondo a los datos del
usuario.
La realización de esta visión –de este proyecto de conocimiento distribuido y de
provisión de contexto a los datos, tal como lo hacen los seres humanos–, tras la cual
están, entre otros, Tim Berners-Lee, necesitará de un nuevo lenguaje de codificación de
las páginas, de una gramática lógica para que los autores de páginas Web puedan
describir las propiedades semánticas de los documentos en una notación estándar, de la
incorporación de las muchas herramientas software y tecnologías sobre las que se está
trabajando y de la adopción de unos y otras por parte del mercado.
No sabemos si la Web semántica, con todo su potencial imaginado, será realidad
algún día. De momento es un proyecto que, de cumplirse, cambiaría de forma
substancial la Web tal como la conocemos hoy.

fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 29
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
6. ¿Cómo buscar?
Recuperar información es un problema complejo porque requiere describir
información que aún no se tiene. Dicha necesidad resulta difícil de trasladar a un
lenguaje normalizado y la respuesta será un conjunto de documentos que pueden
contener, sólo probablemente, lo deseado y con un evidente nivel de incertidumbre. En
la recuperación información, el criterio de valor es el grado en el que la respuesta
obtenida satisface las necesidades de información del usuario, es decir, su percepción
personal de utilidad (Blair, 1990).
Tramullas (1997) destaca un aspecto importante de las reflexiones de Blair, “la
importancia, en ocasiones ignorada, que tiene el factor de predicción. Predicción por
parte del usuario, ya que éste debe intuir, en numerosas ocasiones, los términos que
han sido utilizados para representar el contenido de los documentos,
independientemente de la presencia de mecanismos de control terminológico. Este
criterio de predicción es otro de los elementos que desempeñan un papel fundamental
en el complejo proceso de la recuperación de información”
Buscar información en Internet no implica, necesariamente, “encontrar
información”. Por ello, por evidente que pueda parecer, la primera pregunta que hay que
formularse cuando se desea encontrar información es:
¿Qué necesito encontrar?
Martinet y Martin en su libro L'Intelligence Economique (1995) proponen la
existencia de dos tipos de ignorancia: "ignorancia profunda" e "ignorancia conocedora".
Analicemos esta idea mediante un ejemplo aportado por Cornellá (1998): Supongamos
una situación en la que alguien precisa una determinada información. Puede ocurrir que
ese alguien sea muy conocedor del tema en cuestión, y que, en consecuencia, tenga
muy claro cuál es la información que le falta; en esta situación, esa persona es
consciente de su ignorancia (sabe lo que no sabe), y conoce bien su horizonte de
conocimientos; esta es la situación de la ignorancia conocedora. Pero puede también
ocurrir que la persona no sea consciente de mucha información que le podría ser de
utilidad; en este caso, que podemos denominar ignorancia profunda, no tenga idea de
un gran panorama de información, que ni conoce ni ha manifestado necesitar (no sabe lo
que no sabe).
Y aquí surge una cuestión interesante: buscar información en Internet, ¿ayuda a
reducir la ignorancia conocedora (nos ayuda a encontrar justo la información que
necesitamos), o bien ayuda a darnos cuenta de lo muy profunda que es nuestra
ignorancia (encontramos más información de las que imaginábamos)?
Las estrategias para buscar información implican tomar decisiones y escoger las
fuentes de información más convenientes para el trabajo en cuestión. Por ello, cuando el
problema esté claramente definido, se analiza la gama de posibles fuentes de
información.
En el contexto que hemos estado describiendo a lo largo de este artículo,
gestionar información se ha transformado en una tarea cada vez más importante ya sea
para nuestra actividad personal como para nuestro trabajo. Normalmente dedicamos
poco tiempo, lo hacemos mal, de manera poco estructurada, y nadie nos forma para
saber manejar información.
Por ello, nuestra siguiente reflexión será:
¿Cómo nos informamos? ¿Cómo debo buscar? (Figura Nº 6).

fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 30
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
Fig. Nº 6: El proceso de informarse

3a.- Identificar
las fuentes
3b.-Aprovechar
el tropiezo pasivo
2.- Saber buscar – serendipia–

1.- Identificar la
4.-“Saber” filtrar
información
según los objetivos
necesitada

5.- Usarla, aplicarla

El proceso de informarse puede ser descripto, en forma sintética, de la siguiente


manera: 1) cuál es la información de interés –la que necesito-, 2) dónde la busco
-fuentes-, 3a) cómo la busco –con qué metodologías y herramientas-, 3b) cómo gestiono
lo que encuentro por casualidad –tropiezo pasivo, serendipia- y, finalmente, 4) cómo la
filtro de acuerdo con lo que a mí me interesa y al final 5) cómo aplico esta información.

6.1 ¿Porqué utilizar una Estrategia de Búsqueda?


Nadie puede negar la importancia y utilidad que tienen los buscadores para
encontrar información en la Web. Sin embargo, muchos usuarios pueden decir que su
experiencia con ellos no ha sido completamente satisfactoria. Aprender una estrategia
de búsqueda de información supone aprender cuándo y por qué utilizar un
procedimiento, un concepto o una actitud determinada. Es decir, cuándo y por qué
seguir un determinado proceso de búsqueda, cuándo y por qué hacer uso o no de
operadores, cuándo y por qué limitar la búsqueda, cuándo y por qué utilizar
determinados términos, cuándo y por qué utilizar ciertas opciones de búsqueda que nos
ofrecen las diferentes Bases de Datos.
En definitiva, ¿cuál es el trabajo de búsqueda?:
1) recuperar comprensivamente datos de textos de Internet,
2) procesar los datos que se ajusten a la situación planteada, y
3) con el uso de diferentes estrategias cognitivas y metacognitivas,
convertir estos datos e información, en conocimientos significativos.
Dicho así, Internet funcionaría como otro recurso más de búsqueda de datos, pero
en realidad un hiper-recurso con una gran superabundancia de datos, que requiere del
profesional, del docente, y del alumno, nuevas estrategias de búsqueda y recuperación
de información, tales como: comprensión, selección, procesamiento de datos,
organización de los mismos en torno a mapas y redes conceptuales. Esto no sólo como
instrumento para recuperación de información sino como paso para lograr un dominio de

fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 31
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
saberes socialmente significativos y para desarrollar competencias y habilidades
cognitivas e interpretativas propias del área en estudio.
En lo referente a la búsqueda, una correcta planificación nos permitirá separar el
éxito del fracaso más que ninguna otra competencia. (Figura Nº 7).
Obviamente, no hay una receta definida y fiable para buscar información en
Internet en tiempo y calidad razonables, pero disponemos de elementos que nos
permiten construir estrategias y esquemas de comportamiento para afrontar un uso
satisfactorio y encontrar lo deseado.
Figura Nº 7: Decisiones relevantes en el proceso de búsqueda de información

6.2 Requisitos para una búsqueda


¿Cómo llegamos a la definición de los requisitos?
El problema de trabajar con datos es determinar los requisitos para obtener la
información que necesitamos. Pero el mundo de los seres humanos y de los objetos
físicos en el cual se ubican los requisitos es bastante informal, y no siempre puede ser
tratado adecuadamente sin métodos.
¿Cómo establecer y documentar requisitos para obtener determinados datos?
Consiste en la caracterización, el análisis, la especificación, la verificación y la
administración de los requisitos –la elicitación–.
La falla en el desarrollo y documentación de buenas especificaciones de
requisitos es una de las principales causas de errores en el desarrollo de sistemas de

fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 32
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
información. Algunas situaciones que originan esa dificultad son:
- el conocimiento del tema, la forma de expresarlo y el tipo de lenguaje que
empleamos.
- la inhabilidad para escribir una especificación correcta de requisitos.
- la falta de conocimientos para la verificación de los requisitos.
- no identificar qué herramienta y/o metodología usar.
Definir correctamente las necesidades de información, disminuye aburridas,
inútiles y costosas tareas de búsqueda. Una vez establecido el valor de una buena
especificación de requisitos, surgen otras cuestiones:
¿Cómo desarrollarlos?
¿Cómo saber si un conjunto de requisitos es bueno?
¿Qué herramientas y métodos pueden ayudar?
Estas preguntas no tienen una respuesta única y definitiva, puesto que
continuamente surgen nuevas herramientas y métodos. Pero lo importante es entender
que la caracterización de los requisitos debe realizarse con la mayor claridad posible.
Dependiendo de la definición de los requisitos, variarán los métodos, las técnicas y
herramientas a utilizar en la búsqueda de información.
Por lo tanto, en la estrategia de búsqueda habrá que tener en cuenta:
1) Ámbito temático que se abarcará: especificidad del tema que se desea
desarrollar.
2) Especificidad de los términos: determinar si hay que tomar todos los
términos posibles, si bastará un número reducido, si es necesario incluir el
conjunto de relaciones con los términos relacionados.
3) Adecuación de los términos: determinar qué términos son los más
adecuados para expresar los conceptos del tema de trabajo.
4) Idiomas elegidos: pensar siempre en una búsqueda multilingüe.
En el caso de respuestas no satisfactorias, es posible revisar el proceso. En la
mayoría de los casos se trata del uso incorrecto de algún término. En esa situación se
sugiere replantear la estrategia de búsqueda modificando los términos que se cree que
no son adecuados a esa demanda de información. Aún así, muchas búsquedas terminan
con una sensación desagradable, ya sea por la enorme cantidad de documentos
relacionados que no nos permiten una concentración en los temas específicos, como por
la sensación de “sobrecarga” que se siente al realizar un trabajo con excesiva
información.

6.3 Modelos de exploración y búsqueda


Tal como lo hemos descrito hasta el momento, la Web dispone de diversas
herramientas para la recuperación de datos en línea. A pesar de esta supuesta
flexibilidad en los modelos de recuperación –dada básicamente por la hipertextualidad y
la variedad de lenguajes simbólicos-, algunas investigaciones han sugerido que las
diferencias en las características individuales de los usuarios pueden ser uno de los
factores más influyentes que afectan el comportamiento de la búsqueda.
Y así lo expresa Choo (1999): “para la misma necesidad de información, cada uno
de nosotros buscaría de un modo un tanto diferente, según nuestro conocimiento sobre

fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 33
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
las fuentes, experiencias pasadas, preferencias personales, etc.”
Marchionini (1995) propone tres patrones de búsqueda diferenciados en función
de la necesidad de información –objeto de la búsqueda- y las tácticas utilizadas:
- Exploración dirigida -Directed browsing-, la exploración es sistematizada,
focalizada a un destino específico (por ejemplo buscar en una base de datos
un tema específico verificando los atributos de la información)
- Exploración semidirigida -Semidirected browsing-, la información a buscar
es algo indefinida y el proceso de exploración menos sistemático (por ejemplo
buscar a partir de términos generales y examinar los resultados)
- Exploración sin dirección -Undirected browsing-, no hay un objetivo
específico (por ejemplo navego en una web explorando su contenido).
Por otro lado, ampliando la propuesta –previa a la Web– de Aguilar (1967), Choo
(1999) describe cuatro modos de exploración en función de la necesidad de información,
la acción –técnica– y el uso que se hace de la información recuperada (Tabla N° 3).
Tabla Nº 3: Modos de exploración (Choo, 1999)

Modos de Necesidad de Acción Uso de


exploración información –técnica– información

"Sweeping" –barrido-
Visión sin Exploración amplia de
diversidad de fuentes, “Browsing"
dirección No hay necesidad
tomando aquellas fácilmente -exploración-
- undirected específica
accesibles. Indagación
viewing-
Serendipia

"Discriminating" "Learning"
Visión
–discriminación- -aprendizaje-
condicionada Temas generales
Ojear en fuentes incrementar el
-conditioned de interés
preseleccionadas sobre conocimiento sobre
viewing-
tópicos de interés tópicos de interés

"Selecting"
"Satisfying"
-selección-
Búsqueda informal –Satisfacción-
incrementar el
La búsqueda se focaliza en
-informal search- conocimiento en un
áreas, pero una búsqueda
área (con algunos
sencilla es satisfactoria
límites)
Entender y
profundizar sobre
"Optimizing"
temas específicos "Retrieving"
–optimización-
Reunión sistemática de la -recuperación-
Búsqueda formal
información sobre una uso formal de la
-formal search-
entidad, después de utilizar información para la
un cierto método o toma de decisiones
procedimiento

Mientras que Ellis (1989) plantea un modelo conductual de búsqueda de


información con seis categorías (Tabla N° 4):

fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 34
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
Tabla Nº 4: Modelo de búsqueda (Ellis, 1989. Fuente, Choo, 1999)

“Starting” Identificar fuentes de interés que sirven como punto de partida. Su


iniciación exploración, probablemente sugieran referencias adicionales.

“Chaining” Proseguir con los indicios dados por la fuente inicial.


vinculación

“Browsing” Búsqueda semidirigida en áreas de posible interés.


examen superficial

“Differentiating” Filtrar y seleccionar entre las fuentes exploradas a partir del


diferenciación reconocimiento de la calidad de la información.

“Monitoring” Inspeccionar en forma sistemática las fuentes de interés.


supervisión

“Extracting” Trabajar metódicamente a través de las fuentes particulares a fin


extracción de identificar material de interés.

En una propuesta interesante, Choo (1999) combina el modo de exploración de


Aguilar y el modelo conductual de búsqueda de Ellis, en un nuevo modelo de que refleja
el comportamiento de búsqueda de información en la Web (Tabla N° 5):
Tabla Nº 5: Modelo de búsqueda de información (Choo, 1999)

Starting Chaining Browsing Differentiating Monitoring Extracting

Seguir los
vínculos de
las páginas
Identificar de inicio a
y/o otras con
Visión sin
selecciona contenidos
dirección
r páginas relacionado
de inicio s (aunque
no verifique
la
predicción)

Explorar en Filtrar y
listas, seleccionar sitios
mapas de útiles a través de Recibir la
Visión
contenidos, “favoritos”, actualización
condicionada
índices, impresión, de sitios
directorios, copiado y utilizando
etc. pegado, etc. agentes,
suscripcione
Búsqueda Ir directamente a s, listas, etc. Utilizar
informal Sitios conocidos Re-visitar los herramientas
sitios de búsqueda
“favoritos”. parar extraer
Búsqueda
información
formal
de útil.

fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 35
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
El conocimiento de los modos de exploración y de las categorías de conducta en
la búsqueda de información son aspectos esenciales que deben analizarse e
investigarse, a fin de tenerlos en cuenta en el diseño de los sistemas de recuperación de
la Web para que éstos mejoren su funcionamiento y aumenten su utilidad –la percibida
por el usuario- al apoyarse en estas características conductuales. Sin embargo, el
modelado con control preciso y consciente del proceso congnitivo enmarcado en la
recuperación de información de la red hipermedial que es la Web, no es una tarea
sencilla.
6.3.1 Serendipia
El término serendipia procede de la palabra serendipity y hace referencia al
modo en que se produce un descubrimiento que se realiza de repente gracias a un
accidente o una casualidad. No existe traducción al español de esta palabra. Royston
Roberts en su libro “Serendipity. Accidental Discoveries in Science” (1989) introduce la
definición del término como “hallazgo inesperado de cosas o ideas interesantes en el
proceso de búsqueda de otras”. Podemos pensar a la palabra “serendipia” como un
neologismo del término en inglés.
Para Olivier Ertzcheid y Gabriel Gallezot, existen tres estados iniciales que
favorecen la serendipia y que se asocian a tres procesos relacionados con la
Recuperación de Información:
- Sé lo que busco: el usuario sabe ya (en parte) lo que busca. Por tanto
realizará una búsqueda clásica según los modelos clásicos de los sistemas de
documentales (booleanos, lenguajes documentales, etc). El usuario se
encuentra en una lógica de consulta y búsqueda que le proporciona resultados
(matching) sabiendo, aproximadamente, lo que puede aportar el sistema de
información. Este usuario utiliza un razonamiento hipotético-deductivo. Aquí la
serendipia es prácticamente nula o no conlleva ninguna acción voluntaria
consciente.
- No sé lo que busco: el usuario se embarca en un proceso exploratorio
(browsing). El usuario va, a partir de lo que sabe, a razonar por inferencia y
abducción en función de su duda o de su perfil. La serendipia, en este caso, es
de tipo estructural.
- Sé que no sé lo que busco: es el que más se puede beneficiar del fenómeno
de la serendipia. El usuario suele adoptar un comportamiento muy simple, muy
asociativo y muy intuitivo, sea cual sea la complejidad del sistema que vaya a
consultar. Sobre los resultados de la búsqueda, el usuario irá descubriendo, de
manera asociativa, nuevas palabras clave, nuevos nombres de personas,
nuevas pistas de investigación, etc, que van a ayudar a constituir una
respuesta/solución a la pregunta/problema. Aquí la serendipia es asociativa.
En definitiva, la serendipia durante un proceso de búsqueda de información puede
ser pasajera, dependerá del momento en que los modelos mentales se impongan, o
convertirse en un modo privilegiado de acceso a la información. La serendipia aplicada a
la Recuperación de la Información pone de manifiesto que no es necesariamente más
fácil encontrar la información en un sistema ordenado, estructurado y formateado que en
un sistema de información caracterizado por una entropía fuerte y que no dispone de
ningún nivel de control único.
Por tanto, deberemos tener en cuenta, a la hora de hablar de Recuperación de

fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 36
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
Información, los fenómenos de serendipia en complemento a las preguntas (querying) y
a la exploración (browsing).

6.4 Guía para la búsqueda de información


Los siguientes párrafos proponen un proceso de recuperación; pero debe
recordarse que la recuperación de información no es un proceso y una actividad exacta:
pueden haber varios procesos y varias soluciones distintas para el mismo problema
(adaptado de Tramullas, 2001).
1. Planteamiento del tema y nivel de conocimientos: debe establecer claramente
cuál es el objetivo de su interés. Hay objetivos que pueden parecer adecuados,
pero que en realidad necesiten un refinamiento; plantee todas las situaciones
posibles que pueden darse, y piense en varias tácticas para acercarse al
problema. Si prepara estas tácticas alternativas, las respuestas que obtenga
durante una consulta, sobre temas relacionados con lo que está buscando,
pueden servirle como punto de partida para buscar por exploración (procesos
basados en la navegación.). Debe establecer cuál es su propio nivel de
conocimientos sobre el tema. Si su nivel de conocimientos es adecuado, podrá
abordar el problema de la fiabilidad con mayores garantías. En cualquier
situación, esta fase debe dar como resultado una formulación clara e inequívoca
del objetivo de su búsqueda.
2. Identificación de los tipos de información: la web contiene diferentes tipos de
información, tanto por el tipo de fichero que los contiene, como por el objetivo y
finalidad de las páginas web y de los creadores de las mismas. Debe establecer
la posible utilidad de cada una de estos tipos de documentos, y no descartar
ninguno a priori, ya que por exploración puede encontrar información
complementaria que le sea de utilidad.
3. Selección de los recursos de información y de las herramientas de consulta: La
selección de los recursos de información, es decir, índices, directorios y motores
de búsqueda a utilizar, es de suma importancia. Continuamente están
apareciendo directorios especializados en los temas más diversos; en numerosas
ocasiones, ofrecen coberturas muy parciales, aunque los índices que ofrecen
tienen un alto nivel de fiabilidad. Si no conoce estos directorios, debe recurrir a los
motores. Si desea comparar los resultados ofrecidos por varios de éstos, lo más
recomendable es utilizar un metabuscador. La segunda parte de esta fase definirá
que herramienta utilizará para consultar los recursos de información.
4. Redacción de la expresión lógica (de búsqueda). Ejecución. Recepción de
respuestas. Debe introducir en la interface o herramienta que haya seleccionado
para desarrollar la búsqueda, la expresión que reúne los términos elegidos, y los
operadores que establecen las relaciones existentes entre aquellos. Los motores
ofrecen siempre páginas de ayuda, en las que explican las posibilidades del
lenguaje de interrogación que usan, y suelen incluir ejemplos. También ofrecen
interfaces simples y avanzadas para formular las expresiones. Es preferible
utilizar las interfaces avanzadas, ya que ofrecen más potencial y parámetros que
ayudan a perfeccionar las expresiones y a obtener resultados ajustados.
5. Preselección de respuestas pertinentes. Exploración de los documentos
originales: lea los datos que ofrece el listado para desechar aquellos que no sean
adecuados. Presione en el enlace que le lleva al documento original. Para aligerar

fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 37
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
el trabajo, y evitar la sobrecarga cognitiva, use el menú emergente (botón
derecho: Abrir en ventana nueva). De esta forma podrá explorar el documento, y
otros relacionados con el mismo, sin perder la ventana con el listado de
respuestas, lo que facilitará nuevas exploraciones. Si el documento, o
documentos a los que ha accedido le interesan, márquelos. En caso contrario,
cierre la ventana y vuelva al listado respuestas.
6. Replanteamiento de estrategias. Si tras analizar las quince o veinte primeras
respuestas no ha obtenido algún resultado satisfactorio, es necesario cambiar la
táctica. El cambio puede referirse a las expresiones utilizadas, o al motor
seleccionado. Si el número de respuestas obtenido es muy elevado, y los
primeros resultados son poco pertinentes o muy generales, formule una nueva
expresión de búsqueda, con más condiciones y limitaciones. En el caso contrario,
es decir con nulo o escaso número de resultados, puede suceder que: a) si la
expresión no es restrictiva, entonces no hay documentos, o los documentos no
contienen esos términos; b) que la expresión sea demasiado restrictiva, con
demasiadas condiciones. Para estos casos, debe probar con una expresión con
menos condiciones, y usar términos sinónimos o similares a los usados en la
primera formulación.
7. En el proceso de recuperación de información en Internet, el usuario siempre
debe pensar que no es suficiente con seguir los resultados obtenidos de un motor
de búsqueda: hay que explorarlos, analizarlos, valorarlos, y seleccionarlos como
adecuados, o desecharlos como no pertinentes. Las herramientas de
recuperación de información son un medio más, una fase intermedia, no un fin.
Los resultados proporcionados por un motor de búsqueda, no son sólo el
resultado de un cruce combinatorio entre páginas que responden a una determinada
demanda y las que corresponden menos o nada. La neutralidad está claramente
ausente, en realidad se nos está proporcionando una visión sobre el mundo que no es
nada inocente. Con una lista de resultados nos llega, al mismo tiempo, toda una
jerarquía de principios de clasificación del saber, y otros más implícitos todavía, de
organización del conocimiento.
➔Por ello, es preciso insistir que “no hay una sola herramienta ni un único método
que asegure encontrar resultados óptimos en todos los casos”.
Una vez alcanzados los resultados: ¿qué información seleccionamos? ¿cómo
reconocemos las configuraciones que aseguran la “calidad” de la información? ¿qué
entendemos por información de calidad?
Sin duda el concepto de calidad de la información depende del uso que se haga
de la información en la práctica. Es posible que lo que se entiende como buena
información en un caso concreto sea insuficiente para otros casos. Para Harris (1997)
determinar la calidad de la información es un arte, ya que hay que inferir a partir de un
conjunto de indicadores, basados en el propósito con el que se quiera utilizar la
información.
Siguiendo algunos autores (Tramullas, 2000; Cooke, 2001) podemos listar
algunos criterios tradicionales de calidad:
1. Autoridad: quién es el autor/es y cuál es su competencia (autoridad) sobre el
tema
2. Fiabilidad: confianza en que la información es cierta, creíble y libre de errores

fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 38
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
3. Objetividad: nivel de expresión de la información sin distorsiones personales,
falta de sesgo
4. Actualidad: estado de actualización de la información (inclusión de la fecha de
creación, revisión o última actualización)
5. Cobertura y audiencia: nivel de temas y profundidad de tratamiento, ¿es
información primaria o secundaria?; quienes son los destinatarios.
6. Validez: indicación de fuentes y documentación de apoyo
7. Escritura y sintaxis: buena gramática, sin faltas de ortografía
8. Metainformación: resúmenes, sumarios, revisiones y comentarios
9. Relevancia: pertinencia para las necesidades del usuario –criterio subjetivo-
En síntesis, podemos decir que existen dos maneras de evaluar la calidad de la
información:
1) objetivamente determinando la autoridad, fiabilidad, objetividad, actualidad, etc.
y
2) subjetivamente determinando si la información recuperada es pertinente a la
necesidad.
➔Establecer criterios que filtren la información encontrada es un buen comienzo
para convertirse en un consumidor crítico de información.

7. Competencias para el manejo de la información


Las competencias necesarias para la comprensión y procesamiento de
información, constituidas en gran parte por la competencia lingüística, posibilitan una
serie de procesos de distinto nivel de complejidad (A. Rivière, 1992):
a) procesos básicos de reconocimiento y elaboración semántico-sintáctica de los
elementos del mensaje (palabras, imagen, sonido, etc.).
b) procesos superiores de elaboración semántica que van más allá de la
información representada en la búsqueda.
Es importante distinguir entre (Baxley, 2003):
a) el modelo conceptual, la descripción de cómo una persona puede buscar
información, y
b) el modelo mental que caracteriza cómo una persona espera buscar
información.
El modelo conceptual nos permite formar expectativas exactas y útiles sobre qué
tipo de funcionalidad o de contenido está disponible. Complementariamente, los modelos
mentales describen cómo esperamos que ese sistema o servicio esté organizado.
Siempre un modelo mental es individual –varía de una persona a otra–, y frente a la
misma actividad de búsqueda pueden plasmarse varios modelos mentales posibles.
Para Mc Daniel (2003), un modelo mental posee las siguientes características:
1) incluye lo que la persona piensa que es verdad, y no necesariamente lo que es
verdad,
2) es similar en estructura al objeto o concepto que representa,
3) permite predecir a la persona los resultados de su acción, y
4) es lo más simple que el objeto o concepto representa, incluyendo la

fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 39
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
información suficiente para permitir predicciones exactas.
Por ello, desde la óptica de poseer competencias para el acceso y uso de la
información –entendida éstas como la función de "reconocer cuándo se necesita
información y poseer la capacidad de localizar, evaluar y utilizar eficazmente la
información requerida" (American Library Association, 1989)– tiene sentido preguntarnos
cómo buscaremos la información. Dentro de esta configuración, las competencias para
el manejo de la información (Grau, 1995), serían:
1) explorar,
2) percibir nexos y relaciones,
3) captar y desentrañar estructuras conceptuales,
4) almacenar el significado,
5) condensar la información,
6) adoptar lógicas diferentes al sí-no,
7) tratar la complejidad,
8) moverse intuitivamente,
9) capacidad de síntesis,
10) albergar incertidumbres,
11) capacidad de transferencia, y
12) tomar decisiones a partir de información incompleta.
A su vez, toda esta información está determinada por un esquema semántico –el
estudio de los signos en relación con los objetos designados– que nos lleva a la idea
transmitida, al mensaje, o al dato.
Las competencias para el manejo de la información constituyen la base para el
aprendizaje continuo, son comunes a todas las disciplinas, a todos los entornos de
aprendizaje y a todos los niveles de educación.
Un informe del National Research Council (1999) enumera varios rasgos
distintivos útiles a la hora de comprender las relaciones entre las competencias para el
acceso y uso de la información, las competencias en el uso de computadoras y las
destrezas tecnológicas más amplias. El informe señala que la "competencia en
computadoras" tiene que ver con el aprendizaje rutinario de aplicaciones informáticas
específicas, mientras que el "dominio de las tecnologías" se centra en la comprensión de
los conceptos básicos de la tecnología y en la aplicación de técnicas de solución de
problemas y pensamiento crítico para el uso de la misma. Por el contrario, las
competencias para el acceso y uso de la información constituyen un marco intelectual
para la comprensión, hallazgo, evaluación y utilización de la información –actividades
todas ellas que pueden ser llevadas a cabo en parte gracias al dominio de tecnologías
de la información, pero sobre todo por medio del discernimiento crítico y el raciocinio–.
Las competencias para el manejo de la información se valen de la tecnología pero, en
última instancia, son independientes de ella.

7.1 Los Nueve Estándares de la Competencia en Manejo de Información


La American Association for School Librarians en su libro "Information Literacy
Standards for Student Learning" del 2002, indica como características que hacen a un
usuario competente en el manejo de la información las siguientes:

fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 40
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
Competencia en el Manejo de Información
Estándar 1: El estudiante competente en el manejo de información accede a la
información de manera eficiente y efectiva.
Estándar 2: El estudiante competente en el manejo de información evalúa la información
crítica e idóneamente.
Estándar 3: El estudiante competente en el manejo de información utiliza la información
de manera creativa y precisa.

Aprendizaje Independiente
Estándar 4: El estudiante que aprende independientemente es competente en el manejo
de información y se interesa por información relacionada con sus intereses
personales.
Estándar 5: El estudiante que aprende independientemente es competente en el manejo
de información y valora la literatura y las otras formas de expresión creativa.
Estándar 6: El estudiante que aprende independientemente es competente en el manejo
de información y se esfuerza por alcanzar la excelencia en la búsqueda y
generación de conocimiento.

Responsabilidad Social
Estándar 7: El estudiante que contribuye positivamente a la comunidad de aprendizaje y
a la sociedad es competente en el manejo de información y reconoce la
importancia de la información en una sociedad democrática.
Estándar 8: El estudiante que contribuye positivamente a la comunidad de aprendizaje y
a la sociedad es competente en el manejo de información y se comporta de
manera ética en lo que respecta a la información y a las Tecnologías (TICs)
Estándar 9: El estudiante que contribuye positivamente a la comunidad de aprendizaje y
a la sociedad es competente en el manejo de información y participa
efectivamente en grupos que buscan y generan información.

7.2 PIM –Personal Information Management-


Documentos, libros, música, fotos, videos, emails, contactos, calendario, registros,
recibos, etc.: ¿cómo podemos mantener nuestra información bajo control? Necesitamos
de la información para tomar buenas decisiones, hacer cosas, aprender, actuar en en el
mundo que nos rodea y también para reflexionar y recordar. Pero no siempre tenemos
control sobre la misma. El crecimiento de la información, así como el aumento de los
dispositivos tecnológicos que permiten crearla, almacenarla, recuperarla, distribuirla y
usarla es asombroso y a la vez desconcertante.
El abaratamiento de los dispositivos de almacenamiento ha alentado los malos
hábitos de los usuarios, pues no hay necesidad de limpiar y filtrar nuestros archivos
dado que es más fácil mantener información que tomar una decisión –y acción– sobre su
utilidad o valor potencial. Con el paso del tiempo solemos olvidar lo que poseemos y no
distinguimos lo inútil de lo importante. En el mejor de los casos, realizamos copias de

fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 41
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
seguridad, pero no una conservación sistemática de la información que puede tener
valor para un uso futuro.
Antes de avanzar definamos “información personal”. Jones (2008) destaca 6 tipos:
1. Controlada por “mi”: Archivos en nuestras computadoras, mensajes en
nuestra cuenta de correo, papeles en nuestro cajón, etc.
2. Sobre “mi” y posiblemente bajo control de otros: Ficha médica, registro de
impuestos, historial crediticio, sitios web visitados, etc.
3. Dirigida a “mi” y no necesariamente relevante pero que puede distraer,
hacer perder tiempo, etc: Spam que llega a nuestro correo, publicidad en
páginas web, televisión o radio, una carta, la cuenta de un servicio, etc.
4. Enviada, publicada o provista por “mi”: En la que tenemos control (a
veces) sobre quién ve, qué información y cuándo.
5. Conocida por “mi”: Libros que están en la biblioteca, páginas web que
permanecen en la web (como artículos de diarios), programas de TV. Es
información sobre la cuál volvemos en algún momento pero no está bajo
nuestro control.
6. Relevante (útil) para “mi”: Esta categoría incluye información que poseemos
y controlamos, que conocemos y también información que aún no hemos
visto. ¡Tan sólo necesitamos encontrarla!
Hoy en día esta información personal está disponible no sólo en papel sino en
documentos digitales, emails, páginas web, mensajes de texto, fotografías digitales,
música, video y otras formas adicionales de información digital. La dificultad de gestionar
la información se incrementa si una persona tiene múltiples cuentas de email, usa varios
dispositivos tecnológicos –tablet, netbook, teléfonos inteligentes, notebook, etc.- Todos
estos dispositivos, así como nos ayudan en diferentes situaciones, también aumentan el
problema de la “fragmentación de la información”. Por otra parte, varios estudios han
demostrado (Barreau, 2009) que los usuarios suelen estar demasiados ocupados o ser
un tanto desorganizados para estructurar a conciencia su información, así como también
son poco precisos cuando definen el tipo, tamaño y extensión de sus ficheros. Además
las herramientas de gestión de contenidos digitales suelen ser limitadas e
insastifactorias: sólo podemos descubrir el contenido de un objeto digital si lo abrimos.
Frente a esta situación nos preguntamos, ¿qué significa gestionar
adecuadamente la información personal?
Cabe distinguir “organizar” de “gestionar”, “gestionar” de “utilizar”; pero, además,
para ser efectivos la gestión y el uso de la información deben estar interrelacionadas. La
gestión de la información personal debe permitirnos responder preguntas como: ¿Es la
información potencialmente útil? Si lo es: ¿cómo la guardo?, ¿dónde?, ¿en qué
dispositivo?, ¿en qué formato? Para ser recuperada, ¿cuándo?
Barreau (2009) describe a la PIM como un sistema desarrollado para uso
personal en un ambiente de trabajo. Tal sistema incluye “las reglas y métodos
personales para adquirir información […] los mecanismos para organizar y almacenar la
información, las reglas y procedimientos para mantener el sistema, los mecanismos para
la recuperación y los procedimientos para producir variadas salidas”.
Desde esta perspectiva Jones (2008) define a la PIM con tres operaciones
escenciales (Figura Nº 8):

fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 42
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
1. Finding y re-finding: De la necesidad a la información. En nuestros esfuerzos
por reconocer la información relacionada a nuestra necesidad, buscamos,
exploramos, escaneamos a través de una lista de resultados o carpetas. Estas
actividades son ejemplos de Finding –encontrar-. Re-finding incluye otro paso:
recordar lo que vimos en primer lugar.
2. Keeping: De la información a la necesidad. En vez de tener una necesidad
para la que buscamos información, tenemos información y debemos determinar qué
hacer con ella. ¿Podemos anticipar una necesidad para esa información?, ¿cuál es
el costo de no tenerla? Gracias a las tecnologías de almacenamiento, algunas
decisiones de “mantener” la información no son tomadas en cuenta. Si tenemos
espacios, entonces ¡guardemos! Luego, el problema será la recuperación.
3. Mantenimiento y organización: ¿Cómo organizar la información para su uso?
¿Etiquetado, categorización, clasificación, agrupamiento? ¿Cómo actualizarla?, ¿y
resguardarla? ¿Cómo actualizar sus formatos de manera que esté disponible en
otros estándares tecnológicos? ¿Cómo asegurarse que la información vieja sea
borrada o archivada? ¿Cómo localizar la información duplicada? ¿Cómo asegurar la
privacidad de nuestros contenidos?
Figura Nº 8: Actividades en la PIM (adaptado de Jones, 2008)

Se destaca la necesidad de abordar, sobre todo en entornos educativos, buenas


prácticas de la gestión personal de la información, con buenas herramientas y buenas
estrategias para apoyar la interacción y la reflexión sobre nuestro material digital.

7.3 Acotando el problema


Ya hace varios años, Peter Drucker planteaba que antes de iniciar cualquier tarea
de búsqueda, teníamos que aprender a plantear las siguientes preguntas:

fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 43
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
¿Qué información necesito, en qué forma y cuándo?
¿A quién debo qué información y cuándo y dónde?
Cabe agregar:
¿Cómo buscar información, razonablemente?
¿Al no consultar todas las fuentes de información disponibles, es completa
mi búsqueda de información?
Esta característica se hace palpable con el empleo de las herramientas
tradicionales –como las consultas a bibliotecas–, las cuales sólo dan como resultados
unos pocos libros o referencias al tema.
¿La incorporación de nuevas herramientas de búsqueda, mejorará nuestra
capacidad para la obtención eficaz de datos relevantes?
El problema no es solamente correr los riesgos de no ser efectivo transfiriendo
información sino, antes que eso, dilucidar cuál es la información útil y relevante para
nosotros, nuestros alumnos o colegas y para los procesos de enseñanza y transferencia
de información relevante. Y ésta es una tarea que requiere cuidado.
Para Cornellá (2000), conseguir una mejora en el proceso de informarse pasa por
recibir la información adecuada de forma que se pueda usar, y esto se conseguiría con
saber, cada uno de nosotros, cuáles son:
- los cinco temas fundamentales en los que estamos trabajando,
- los cinco temas secundarios,
- cuál es la lista de información crítica para los cinco temas fundamentales, y
- la lista de información secundaria para los cinco temas secundarios.
Frente a esta tarea de dilucidar información es interesante el modelo TRAF –del
inglés: Throw, Refer, Act, File → Tirar, Remitir, Actuar y Fichar–, propuesto por Quinn
(1990) que sugiere que ante cualquier entrada –input- de información, sólo es posible
una de las siguientes cuatro acciones (Figura Nº 9):
Figura Nº 9: Modelo TRAF (Quinn, 1990)

fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 44
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
Tirar, si no está en una de mis 10 áreas básicas
Remitir (transferir), si puede interesar a alguien del entorno
Actuar (utilizar), si está en la lista de las áreas críticas
Fichar (guardar) si está en la lista de las 5 áreas secundarias
Este método nos ayuda a gestionar el tráfico de la información que nos llega, pero
en este proceso de gestión aplicamos criterios de evaluación de la calidad de
información que son subjetivos y que tienen en cuenta si la información nos es
realmente útil, es interesante, o no nos interesa en absoluto.
Desafortunadamente, precisar la información y los recursos disponibles en
Internet en una determinada área de conocimiento, como paso previo a la evaluación de
su calidad, no es un proceso tan sencillo. Por ello, debemos avanzar unos pasos más
allá de las búsquedas informales basadas en las ocurrencias de términos, explotando
todas las posibilidades que ofrecen las distintas herramientas de búsqueda en Internet,
acercándonos así (en nuestro caso) a los objetivos de la investigación académica.

fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 45
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
8. Algunas reflexiones…
Los aportes realizados hasta el momento, nos permiten ir apuntando una serie de
hechos:
- la carencia de información ha dejado de ser un problema en el terreno
educativo debido a la amplitud de fuentes (Figura Nº 10) y posibilidades que
se le ofrecen tanto al profesor como al estudiante,
- Figura Nº 10: Posibles fuentes de información en Internet

- la potenciación de la interactividad no sólo entre las personas sino también


con una diversidad de códigos y sistemas simbólicos para el procesamiento de
la información,
- la pluralidad de contenidos de carácter abierto y dinámico,
- la dificultad que se presenta en la búsqueda, recuperación, acceso y manejo
de las fuentes de información disponibles en la Web,
- la insatisfacción de los usuarios con el funcionamiento de la generación actual
de los motores de búsqueda (mala calidad de los resultados, escasa
relevancia en relación a la necesidad, etc.), y
- la posibilidad para que los sujetos se conviertan en procesadores activos de
información y no en meros receptores de la misma.

Todo indica que en Internet los flujos de conocimiento están renovándose


continuamente, lo que ayer era actualidad hoy es pasado. Se accede a la información en
forma hipertextuada y recorriendo caminos sin conocer la meta, aprendiendo en el

fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 46
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
camino a abrir “ventanas”, a conocer “portales” y motores de búsqueda y navegadores.
Nos encontramos ante una manera diferente de “in-formar”, un espacio dónde la
información se reorganiza constantemente. Y este orden ha sido impuesto por la
mediatización tecnológica, que nos obliga a recorrer otros espacios y otros tiempos.
Bajo esta perspectiva, buscar información para acceder a la información que
necesitamos resulta un reto complejo. La persona que protagonice una búsqueda por
Internet no sólo debe identificar las condiciones de búsqueda y planificar sus acciones,
sino también conocer, gestionar y regular su propio proceso de navegación, habilidad
que puede favorecer la búsqueda. Así como desarrollar las competencias necesarias
para el manejo de la información.
Acceder a la información significa relacionar:
1) nuestras estrategias de búsqueda –nuestro estilo cognitivo–, con
2) el diseño de los sitios de búsqueda y su interacción telemática –la
capacidad de comunicación que genera ese espacio interactivo–.
Una estrategia de búsqueda de información se define con acciones u operaciones
lógicas que resuelven cosas como:
- Sobre qué buscar información: definir necesidades.
- Cuál es el ámbito de relaciones (o de información) del tema principal: definir el
tema general, los subtemas, los temas relacionados y los equivalentes.
- Dónde buscar: responder a: ¿quién tiene o dónde está la información?
- Con qué herramientas buscar: determinar cómo llegar donde se encuentra la
información.
- Cómo hacerlo: definir con qué criterios, acotaciones, indicadores, palabras
claves.
- En qué puntos o ámbitos temáticos: definir desde qué otros temas
relacionados y subtemas se puede llegar a la información.
Esto implica tener en cuenta que hay un enriquecimiento de los modos
tradicionales de rastrear y buscar información, como consecuencia de:
1) el impacto de las ya no tan nuevas tecnologías sobre el procesamiento y la
transmisión de información,
2) las nuevas modalidades de organización y acceso a la información,
3) la permanente reubicación de la información disponible y la detección de su
existencia y el acceso a la misma, y
4) la aparente dilución de la figura del mediador tradicional de la información
–el clásico bibliotecario–,
que contribuye a repensar competencias, habilidades y estrategias para rastrear y
recuperar información.
¿La incorporación de nuevas herramientas de recuperación, mejorará nuestra
capacidad para la obtención eficaz de datos relevantes?
Por último, recordar que a la limitación material para acceder a la mayoría de los
libros existentes en el mundo –condición natural del lector hasta hoy–, le reemplaza la
ilusión de tener a su alcance, desde su escritorio o su biblioteca y gracias a las
posibilidades de Internet, a todos los libros del mundo. Como contrapartida, sabemos

fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 47
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
que las personas enfrentadas a procesar cantidades excesivas de información,
distinguirla, seleccionarla y comprenderla, necesitan más tiempo, más esfuerzo de
atención, más concentración y más capacidad.
En palabras del escritor Antonio Skármeta: “....Hay gente que deambula sin ton ni
son porque no sabe, ya no el lugar donde está lo que busca, sino qué es lo que busca...”

9. Bibliografía
Barany, M. J. (2005, 16 de marzo). Science’s Language Problem. Business Week.
Recuperado de http://www.businessweek.com/technology/content/mar2005-
/tc20050317_4179.htm
Barreau, D. (2009). “Gestión” de información personal, no solo recuperación de
información personal. El profesional de la información, 2009, julio-agosto, v.18,
n.4, pp361-364. Doi: 10.3145/epi.2009.jul.01
Bergman, M. (2001). The Deep Web: Surfacing Hidden Value. The Journal of Electronic
Publishing, August, 2001 Volume 7, Issue 1. Recuperado
http://www.press.umich.edu/jep/07-01/bergman.html
Blair, D.C. (1990). Language and representation in information retrieval. Amsterdam:
Elsevier Science Publishers.
Burbules, N. y Callister, T. (2001). Educación. Riesgos y promesas de las nuevas
tecnologías de la información. Barcelona: Granica.
Cornella, A. (2000). Infonomia.com! La empresa es información. Bilbao: Deusto.
Currás, E. (1991). Tesauros, lenguajes terminológicos. Madrid: Paraninfo.
Chang, G., Healey, M.J., McHugh, J.A.M. y Wang, J.T.L. (2001). Mining the World Wide
Web: an information search approach. Norwell, MA: Kluwer Academic Publishers.
Choo, Ch. (1999). La organización inteligente. México: D.F.: Oxford.
Cove, J.F. y Walsh, B.C. (1988). On-Line Text Retrieval via Browsing. Information
Processing and Management, 24(1):31-37.
Davenport, T. (1997). Ecología de la información. New York: Oxford University Press.
Gómez Reyes M. (2002) Arquitectura de información. La Habana: INFO 2002, IDICT.
Gulli, A. y Signorini, A. (2005). The Indexable Web is More than 11.5 billion pages.
WWW 2005, May 10–14, 2005, Chiba, Japan.
Huang, T. (1999). Calidad de la información y gestión del conocimiento. Madrid: AENOR.
IDC (2014). The digital universe of opportunities. Recuperado de
http://www.emc.com/collateral/analyst-reports/idc-digital-universe-2014.pdf
Internet2. http://www.internet2.edu
Internet Live Stats. http://www.internetlivestats.com
International Telecommunication Union (ITU). http://www.itu.int
Internet World Stats. http://www.internetworldstats.com/
Jones W. (2008). Keeping found things found. The study and practice of personal
information management. Massachusetts: Morgan Kaufmann.

fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 48
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.
Lyman, P. y Varian, H. (2003). How Much Information. Recuperado de
http://www.sims.berkeley.edu/how-much-info-2003.
Martínez Tamayo, A. M. (1999). Tesauro. Cátedra de Organización del Conocimiento I,
Departamento de Bibliotecología, Facultad de Humanidades y Ciencias de la
Educación, Universidad Nacional de La Plata.
Murray, B. (2000). Sizing the Internet. Cyveillance, Inc.
Netcraft. http://www.netcraft.com
Sherman, C. y Price, G. (2001). The Invisible Web. CyberAge Books
Suarez Sánchez-Ocaña, A. (2012). Desnudando a Google. Madrid: Deusto
Tramullas Saz, J. (2001). La recuperación de información en el World Wide Web. En J.
López Yepes (coord.) Manual de Ciencias de la Documentación. Madrid: Síntesis.
UNESCO (2011). Contenidos locales, desarrollo de Internet y precios del acceso.
Recuperado de http://www.unesco.org/new/es/communication-and-
information/resources/news-and-in-focus-articles/all-
news/news/local_content_internet_development_and_access_prices_new_study_
presented_at_igf_2011/
UNESCO (2005). Hacia las sociedades del conocimiento. París: Ediciones UNESCO
W3techs. http://w3techs.com
WorldWidewebSize. http://www.worldwidewebsize.com
Zuazo, N. (2015). Guerras de Internet. [Epub version]. Buenos Aires: Debate.

fundec- 2017 ISBN: 987 - 9225 - 30 - 3 – Hecho el depósito que marca la Ley 11.723 49
El editor se reserva todos los derechos sobre esta obra, la que no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los de fotocopiado, registro magnético o de almacenamiento de datos, sin su consentimiento.

También podría gustarte