Instituto Tecnológico Superior de Occidente del Estado de Hidalgo.
Ingeniería en TIC’s.
Bases de Datos Distribuidas.
Prácticas de laboratorio.
Práctica No. Nombre de la práctica: Optimización de consultas Fecha:
distribuidas.
4 Semestre/ Grupo: 5° “B” 30/11/20
INTRODUCCIÓN:
Las consultas distribuidas se encargan de detener el acceso a varios datos, su
procesamiento de consultas se basa en reducir datos, consultas en paralelo y
datos compartidos en la red. Mientras que la consulta es generada por un
código con representación interna, además de una reformulación y
optimización.
Se necesita de una localización, con heterogeneidad en los datos para formular
las consultas. Como bien sabemos los tipos de bases de datos (centralizada y
distribuida) mantienen en cierta forma una estrategia de funcionamiento,
operaciones de selección, combinar el producto y la asociatividad de
operaciones.
El procesamiento de consultas tiene varias etapas a seguir para resolver una
consulta SQL, las características del modelo relacional permiten que cada motor
de base de datos elija su propia representación que, comúnmente, resulta ser el
álgebra relacional. la optimización de consultas es, entonces, una de estas
etapas.
Existen distintos métodos para optimizar consultas relacionadas, sin embargo el
enfoque de la optimización basada en costos, permiten reducir el espacio de
búsqueda de solución, que es el método mayormente utilizado por los motores
de base de datos relacionales de la actualidad.
Dentro de estas estrategias podemos encontrar los árboles, así como la
sentencia join SQL que permite combinar registros de dos o más tablas.
OBJETIVO:
Crear estrategias de optimización de procesamiento de
consultas distribuidas para la recuperación de datos.
PROCEDIMIENTO:
Considere las vistas de la práctica #3:
1. vw_EmpleadosXRegion
2. vw_PresupuestoXDepartamento
3. vw_HorasTrabajadas,
4. vw_EmpleadosXProyecto
Realice lo siguiente:
1. Represente en álgebra relacional las vistas (de la práctica 3), utilice el
software RAT (Relational Algebra Translator)
Instituto Tecnológico Superior de Occidente del Estado de Hidalgo.
Ingeniería en TIC’s.
Bases de Datos Distribuidas.
Prácticas de laboratorio.
2. Para cada vista construya en el DBMS SQL Server otra alternativa de
solución, empleando distintas estructuras o sentencias SQL, por ejemplo
uso de joins, subconsultas, etc.
3. Una vez realizado el paso 2, utilice la herramienta “Compare query” del
software RAT, con la finalidad de comparar las dos propuestas de
solución, para cada vista. Finalmente argumente sobre la optimización de
consultas, considerando el tiempo de ejecución.
Por ejemplo:
4. Ejecute en el DBMS SQL Server las dos propuestas de solución y utilice la
herramienta “Plan de ejecución estimado” y “Estadísticas del cliente”
para argumentar sobre la optimización de las consultas.
Por ejemplo:
Instituto Tecnológico Superior de Occidente del Estado de Hidalgo.
Ingeniería en TIC’s.
Bases de Datos Distribuidas.
Prácticas de laboratorio.
RESULTADOS.
Vistas (práctica 3) en álgebra relacional. RAT
1. vw_EmpleadosXRegion
Img 1. Representación (árbol) de la vista EmpleadosXRegion con álgebra
relacional
Instituto Tecnológico Superior de Occidente del Estado de Hidalgo.
Ingeniería en TIC’s.
Bases de Datos Distribuidas.
Prácticas de laboratorio.
2. vw_PresupuestoXDepartamento
Img 2. Representación (árbol) de la vista PresupuestoXDepartamento con
álgebra relacional
3. vw_HorasTrabajadas
Img 3. Representación (árbol) de la vista HorasTrabajadas con álgebra relacional
Instituto Tecnológico Superior de Occidente del Estado de Hidalgo.
Ingeniería en TIC’s.
Bases de Datos Distribuidas.
Prácticas de laboratorio.
4. vw_EmpleadosXProyecto
Img 4. Representación (árbol) de la vista EmpleadosXProyecto con álgebra
relacional
Comparar las dos propuestas de solución (Herramienta: compare query)
Img 5. PresupuestoxDepartamento.
Instituto Tecnológico Superior de Occidente del Estado de Hidalgo.
Ingeniería en TIC’s.
Bases de Datos Distribuidas.
Prácticas de laboratorio.
Argumento: Al comparar estas dos vistas y haciendo uso de la palabra clave LIKE
y los [] hicieron parte de la optimización al reducir nuestra segunda versión de la
consulta a un 0.0014.
Img 6. PresupuestoXDepartamento
Argumento: Al comparar los tiempos de respuesta quedando la primera versión
como la más óptima, observamos que fue mínimo el cambio haciendo uso de un
inner join.
Img 7. EmpleadoXProyecto
Instituto Tecnológico Superior de Occidente del Estado de Hidalgo.
Ingeniería en TIC’s.
Bases de Datos Distribuidas.
Prácticas de laboratorio.
Argumento: Al igual podemos observar la comparación de nuestras dos vistas,
siendo la más óptima la segunda versión al ser reemplazado = por un inner join
arrojándose un 0.0018
Img 8. EmpleadosXRegión
Argumento: En esta última comparación, la optimización fue más optima nuestra
versión original, manteniendo únicamente los inner join que muestran un
conjunto de resultados mínimos.
Plan de ejecución estimado y Estadísticas del cliente
vw_PresupuestoXDepartamento
Instituto Tecnológico Superior de Occidente del Estado de Hidalgo.
Ingeniería en TIC’s.
Bases de Datos Distribuidas.
Prácticas de laboratorio.
Img1. Plan de ejecución estimado de la vista PresupuestoxDepartamento
Argumento: Al ejecutar nuestra vista (primera versión) observamos que mantiene
un porcentaje del 100% de optimización.
Img 2. Estadísticas del cliente de la vista PresupuestoxDepartamento
PresupuestoxDepartamento_V2
Img 1.2 Plan de ejecución estimado de la vista PresupuestoxDepartamento_V2
Instituto Tecnológico Superior de Occidente del Estado de Hidalgo.
Ingeniería en TIC’s.
Bases de Datos Distribuidas.
Prácticas de laboratorio.
Argumento: Al igual que nuestra primera versión, observamos que mantiene un
porcentaje del 100% de optimización, sin variación de nuestro resultado original.
Img 2.2 Estadísticas del cliente de la vista PresupuestoxDepartamento_V2
vw_EmpleadosXRegion
Img 3. Plan de ejecución de la vista EmpleadosxRegion
Instituto Tecnológico Superior de Occidente del Estado de Hidalgo.
Ingeniería en TIC’s.
Bases de Datos Distribuidas.
Prácticas de laboratorio.
Argumento: El plan de ejecución, arroja un porcentaje del observamos que
mantiene un porcentaje del 100% de optimización.
Img 4. Estadísticas del cliente de la vista EmpleadosxRegion
EmpleadosxRegion_V2
Img 3.2 Plan de ejecución de la vista EmpleadosxRegion_V2
Instituto Tecnológico Superior de Occidente del Estado de Hidalgo.
Ingeniería en TIC’s.
Bases de Datos Distribuidas.
Prácticas de laboratorio.
Argumento: Para nuestra segunda versión en plan de ejecución observamos que
mantiene un porcentaje mayor del 150% de optimización, lo cual no es
satisfactorio en cuanto a el tiempo.
Img 4.2 Plan de ejecución de la vista EmpleadosxRegion_V2
vw_HorasTrabajadas
Img 5. Plan de ejecución de la vista HorasTrabajadas
Instituto Tecnológico Superior de Occidente del Estado de Hidalgo.
Ingeniería en TIC’s.
Bases de Datos Distribuidas.
Prácticas de laboratorio.
Argumento:E n la vista horas trabajadas, la ejecución en cuanto optimización del
uso de los inner arroja un porcentaje del 77 y 87%.
Img 6. Estadísticas del cliente de la vista HorasTrabajadas
HorasTrabajadas_V2
Img 5.2 Plan de ejecución estimado de la vista HorasTrabajadas_V2
Instituto Tecnológico Superior de Occidente del Estado de Hidalgo.
Ingeniería en TIC’s.
Bases de Datos Distribuidas.
Prácticas de laboratorio.
Argumento:E n la vista horas trabajadas de la segunda versión, la ejecución en
cuanto optimización del uso de los inner arroja un porcentaje igual del 77 y 87% a
la versión original.
Img 6.2 Estadísticas del cliente de la vista HorasTrabajadas_V2
vw_EmpleadoXProyecto
Img 7. Plan de ejecución estimado de la vista EmpleadoXProyecto
Instituto Tecnológico Superior de Occidente del Estado de Hidalgo.
Ingeniería en TIC’s.
Bases de Datos Distribuidas.
Prácticas de laboratorio.
Argumento: Vista EmpleadosXProceso, muestra un porcentaje de 105% dentro de
nuestra ejecución en planeación.
Img 8. Estadísticas del cliente de la vista EmpleadoXProyecto
EmpleadoXProyecto_V2
Img 7.2 Plan de ejecución de la vista EmpleadoXProyecto_V2
Instituto Tecnológico Superior de Occidente del Estado de Hidalgo.
Ingeniería en TIC’s.
Bases de Datos Distribuidas.
Prácticas de laboratorio.
Argumento: A comparación de la primera versión, la ejecución de esta vista es
más óptima, pues con el uso de los inner arroja un porcentaje del 100%.
Img 8.2 Estadísticas del cliente de la vista EmpleadoXProyecto_V2
Argumento: El plan de ejecución es confiable y está basado en la
ejecución real, no estimado, en una estimación de comportamiento
esperado.
CONCLUSIONES.
Con esta actividad hemos adquirido conocimientos sobre consultas distribuidas,
además de reforzar conocimientos adquiridos anteriormente a partir del uso de
la herramienta RAT, además de desarrollar un poco más nuestra lógica
realizando esta práctica para poder buscar soluciones o alternativas de solución
empleando distintas estructuras o sentencias SQL, por ejemplo uso de joins, por
ejemplo. Las consultas dadas por el docente y la versión implementada por
nosotros fueron comparadas mediante la herramienta “compare query”, las dos
propuestas de solución para hacer de nuestra consulta lo cual fue satisfactorio
para nosotros observar que la optimización de procesamiento de consultas
distribuidas es más eficiente en comparación con la que se nos fue entregada,
cabe mencionar que la forma de trabajo en la que se realizó esta práctica fue
en línea colaborando todo el equipo y utilizando algunas herramientas
Instituto Tecnológico Superior de Occidente del Estado de Hidalgo.
Ingeniería en TIC’s.
Bases de Datos Distribuidas.
Prácticas de laboratorio.
recomendadas por el docente y adjuntando evidencias que se nos pide por
parte de la actual situación que estamos pasando.
REFERENCIAS:
Valduriez, P. (2014). Principles of Distributed Database Systems (Tercera Edición).
Springer.
Navathe, S. B. (2012). Sistemas de bases de datos (3a edición). Addison-Wesley
Iberoamericana.
Toledo, V. (2020, 11 febrero). Sylabus IFM-0406. ITESCAM.
[Link]
a=LINF-2004-303&id_d=151
ANEXOS
Instituto Tecnológico Superior de Occidente del Estado de Hidalgo.
Ingeniería en TIC’s.
Bases de Datos Distribuidas.
Prácticas de laboratorio.
Elaboró: Revisó:
Angeles García Manuel 18011480 MGTI. Talhia Heidi Hernández Omaña
Pérez López Genaro Javier 18011159
Pérez Arteaga Mahetsi 18011338
Velázquez Díaz Fernando Yarib
18011316