Métodos y técnicas al
buscar y analizar
información en
internet mediante los
motores de búsqueda
¿que son los motores de búsqueda
Los motores de búsqueda son herramientas en línea que permiten a los usuarios buscar y
encontrar información en la web. Utilizan algoritmos avanzados para rastrear, indexar y
clasificar una gran cantidad de contenido web, lo que les permite proporcionar resultados
relevantes a las consultas de los usuarios.
Google como motor de
búsqueda
Google es uno de los motores de búsqueda más populares y
ampliamente utilizados en el mundo. Utiliza algoritmos
complejos y constantemente actualizados para rastrear,
indexar y clasificar una inmensa cantidad de contenido web.
Google tiene en cuenta una variedad de factores, como la
relevancia del contenido, la calidad del sitio web, la autoridad
de la página y la experiencia del usuario, para mostrar los
resultados más útiles.
Además de sus funciones básicas de búsqueda, Google
ofrece una amplia gama de servicios complementarios, como
Google Maps, Google Imágenes, Google Noticias y m
Yahoo como motor
de búsqueda
Yahoo también es conocido por su motor de
búsqueda, aunque en los últimos años ha
adoptado tecnologías de búsqueda de
terceros, como Bing. Durante mucho tiempo,
Yahoo tuvo su propio algoritmo de búsqueda y
presentaba resultados únicos, pero
eventualmente se asoció con otros motores de
búsqueda para proporcionar resultados a sus
usuarios.
Originalmente, Yahoo Search ofrecía una
amplia gama de servicios, incluyendo noticias,
mapas, imágenes y más. Sin embargo, su
enfoque principal ha cambiado a lo largo del
tiempo.
Badoo como motor
de búsqueda
Badoo es una red social que permite a sus
usuarios conectarse con personas nuevas,
chatear, compartir intereses y descubrir posibles
coincidencias. Aunque Badoo no es un "motor
de búsqueda" en el sentido tradicional, ofrece
funciones de búsqueda que permiten a los
usuarios encontrar perfiles basados en
preferencias específicas.
Los usuarios de Badoo pueden buscar perfiles
utilizando filtros como edad, ubicación,
intereses, género y más.
Además de las funciones de búsqueda, Badoo
ofrece servicios de mensajería, juegos y una
experiencia de red social interactiva.
Bing como motor
de búsqueda
Bing es un motor de búsqueda desarrollado por
Microsoft. Al igual que Google, Bing rastrea y
muestra resultados de búsqueda en función de
la relevancia y otros factores. A lo largo de los
años, Bing ha implementado varias
características únicas, como la integración con
el motor de búsqueda de imágenes y la
visualización de resultados enriquecidos.
TECNICAS DE BUSQUEDA
EN LOS PRINCIPALES
MOTORES DE BUSQUEDA
¿QUE PERMITEN? ESTRATEGIAS TIPOS
¿QUE TE PERMINTEN LAS
ESTRATEGIAS DE
BUSQUEDA?
Permite saber qué se desea buscar y qué recursos se disponen para
buscar. La ausencia de una estrategia de búsqueda es como entrar en
un laberinto donde habrá muchas dificultades para encontrar la salida y
donde, posiblemente, se localice información después de varios
intentos. Las estrategias son como un mapa de ruta que conduce por el
camino correcto en el menor tiempo.
¿QUE PERMITEN? ESTRATEGIAS TIPOS
ESTRATEGIAS DE BUSQUEA
1. INDICAR UNA FRASE EXACTA UTILIZANDO
COMILLAS
Si ingresamos libro de lecturarecuperamos resultados con páginas que
contengan esos dos términos, «libro» y «lectura», juntos o separados, e
incluso en diferente orden.
2. EXCLUIR TÉRMINOS PARA HILAR MÁS FINO
Para refinar la búsqueda anterior, utilizaremos un guion o signo «menos»
(–). Es decir, vamos a restar o evitar en los resultados algunos términos
que no queremos que aparezcan en las páginas recuperadas.
¿QUE PERMITEN? ESTRATEGIAS TIPOS
3.BUSCAR EN UN SITIO ESPECÍFICO
Empleando la sintaxis «libro de lectura» site:educ.ar, restringimos la
búsqueda al interior de un solo sitio, por medio del operador site: (en
este caso, solo a las páginas que conforman el portal educ.ar).
4. BUSCAR SOLAMENTE ARCHIVOS PDF
Al agregar el operador filetype, se restringe el tipo de archivo que
queremos recuperar. Así se escribiría para obtener documentos en
formato PDF: «libro de lectura» site:educ.ar filetype:pdf, yi lo mismo para
otros tipos de archivo (.DOC; .XLS; .PPT y varios más).
¿QUE PERMITEN? ESTRATEGIAS TIPOS
5. BUSCAR DEFINICIONES
A través del operador define: se recuperan páginas que contengan texto
donde se defina el término buscado: define:lectura en nuestro ejemplo.
Google Búsqueda muestra una sola definición, para ver las demás
debemos hacer clic en Más información.
6.BUSCAR SITIOS SIMILARES A UNO CONOCIDO
Para encontrar páginas web o sitios similares al de una URL en particular,
se usa el operador related:.
TIPOS DE MOTORES DE BUSQUEA
JERÁRQUICOS METABUSCADORES DIRECTORIO
Recopilan la información de Los directorios o índices son
Son organizados y clasifican los varios motores de búsqueda listas de recursos organizados
resultados de la búsqueda según la para ofrecer un resultado por temas o categorías
relevancia que tiene el sitio en el general de la consulta generales se estructuran
buscador web. Cuentan con una jerárquicamente ofreciendo
realizada, es decir permiten
interfaz de interrogación textual y enlaces directos a otras
buscar en varios buscadores
revisan las páginas web a través de páginas o recursos de Internet.
al mismo tiempo. Una vez
sus arañas. Con ellas recopilan toda Los resultados de las
reciben la respuesta, se la
la información de los contenidos solicitudes se organizan
que tienen relación con la búsqueda remiten al usuario tras realizar
basándose en la fecha de
que realiza el usuario. Toman el un filtrado de los resultados
publicación. Requieren de
historial del usuario como guía para que depura los repetidos y
intervención humana para su
mostrar los resultados. ordena los enlaces, como por correcto funcionamiento.
ejemplo MetaCrawler o
Buscopio.
Arañas (Web)
Francisco Villegas Ocampo
Ing. Civil 2do Semestre. Grupo A8
Definición
También llamado rastreador, indexador, bot o crawler, es
un programa informático que escanea el internet de forma
metódica y automatizada, para buscar, analizar y clasificar la
base de datos de un buscador.
Es decir, las arañas visitan las páginas web nuevas, donde las
analiza, clasifica e identifica los vínculos a otras páginas web
nuevas, para su posterior visita, haciendo esto sucesivamente
y alimentando las bases de datos de los buscadores.
Antecedentes
World Wide Web Wanderer: primer
1993 crawler, basado en lenguaje PERL
Wandex: primer índice de internet
Webcrawler: primer navegador y motor
1994 de búsqueda
¿Para que sirve una
araña?
• Son el instrumento de los motores de búsqueda para
rastrear internet y clasificar su contenido.
• Actualiza la información que se ofrecen a los Usuarios (los
buscadores se volverían obsoletos)
• Son útiles para detectar errores en las páginas web,
comprobar su estado o detectar cambios.
¿Cómo funciona?
Las arañas web están compuestas por códigos de algoritmos y
scripts, que establecen comandos e instrucciones claras. La
araña repite las funciones del código de forma automática y
continua.
Las arañas web se desplazan por internet a través de
hipervínculos en los sitios web existentes, evaluando palabras
claves y hashtags, indexando las URL y sus contenidos de cada
sitio web, copian páginas web y abren algunos o todos los
hipervínculos para su análisis y comprueban que sus códigos
HTML estén actualizados.
Obtenido de:
https://www.ionos.mx/digitalguide/online-marketing/marketing-para-motores-de-busqueda/que-es-un-
web-crawler/
Ventajas de las arañas
web
• Económicos y eficaces.
• Fácil de usar y de gran alcance
• Ayudan a mejorar la reputación online
• Publicidad dirigida: puede canalizar a ciertos clientes de un
sector.
• Evaluación de la evolución de clientes y empresas
• Optimización del SEO
Ejemplos de arañas web
No. Motor de búsqueda Nombre araña Web Empresa Uso País origen
1 Google Googlebot Google LLC Múltiple EEUU
2 Bing Bingbot Microsoft SL Múltiple EEUU
3 Yandex Yandexbot Yandex LLC Múltiple Rusia
4 Apple Applebot Apple INC Múltiple EEUU
5 Duckduckgo Duckduckbot Duckduckgo INC Múltiple EEUU
6 Baidu Baidu Spider Baidu INC Múltiple China
7 Sogou Sogou Spider Sogou INC Múltiple China
8 Facebook Facebook External Hit Meta Plataforms INC Múltiple EEUU
9 Exalead Exabot Dassault Sytemes SE Empresarial Francia
10 Swiftype Swiftbot Swiftype Empresarial EEUU
11 Yahoo Search Slurp Bot Yahoo! INC Múltiple EEUU
Fuente:
Elaboración propia con datos de: https://kinsta.com/es/blog/lista-de-rastreadores/#10-swiftbot
Referencias Electrónicas
1.- Isocial Web. Araña Web. Que es, para que sirve y como funciona.
[https://www.isocialweb.agency/wiki/arana-
web/#:~:text=Una%20araña%20web%20es%20un,datos%20o%20index%20del%20busca
dor.] Fecha de consulta: 14/04/2024.
2.- Digital Guide IONOS. ¿Qué es un web crawler? Cómo las arañas web optimizan
Internet. [https://www.ionos.mx/digitalguide/online-marketing/marketing-para-
motores-de-busqueda/que-es-un-web-crawler/] Fecha de consulta: 14/04/2024.
3.- Diferenciador. Algoritmo y programa.
[https://www.diferenciador.com/algoritmo-y-programa/] Fecha de consulta:
14/04/2024.
4.- Kinsta. Lista de rastreadores: como aprovechar los rastreadores web para tener
éxito. [https://kinsta.com/es/blog/lista-de-rastreadores/] Fecha de consulta:
14/04/2024.
Glosario
1.- Algoritmo: Un algoritmo es una lista de
instrucciones paso a paso diseñadas para realizar una
tarea específica o resolver un problema concreto, en
una máquina o persona.
2.- Script: secuencia de comandos que indica
instrucciones que se deben realizar en una máquina o
software.
3.- Hashtags: etiquetas o palabras claves.
Glosario
4.- Search Engine Optimization (SEO): tr.
Optimización de motores de búsqueda, Se trata del
conjunto de estrategias y técnicas de optimización
que se hacen en una página web para que aparezca
orgánicamente en buscadores de Internet como
Google, Yahoo o Youtube.
Gracias por tu atención