Facultad de Ingeniera de Sistemas e Informtica
Base de Datos
Ing. Noel Juipa Campo
Agenda
Dato en los Negocios Metodologa de Base de Datos Herramientas Tecnolgicas de Base de Datos Sistemas Orientados a Procesos Sistemas Orientados a los Datos Definicin y Objetivos de una Base de Datos Sistema Orientado a Archivos Tradicionales y Sistema Apoyado con Base de Datos Usuarios de Base de Datos Tipos de Base de Datos Evolucin y Futuro
Dato en los Negocios
Cualquier Negocio necesita disponer de una gran cantidad de datos acerca de su funcionamiento (datos de operacin) La informacin de la empresa es un activo y quienes trabajan en una empresa necesitan un acceso fcil y rpido a la informacin correcta, para deslumbrar a sus clientes, acrecentar sus ingresos e incrementar su participacin en el mercado.
Dato en los Negocios
Niveles de Gestin en las Organizaciones
NIVEL ESTRATEGICO -Elaboracion de Planes - Objetivos Generales
NIVEL TACTICO -Control de Gestion -Objetivos Especificos
NIVEL OPERACIONAL -Tareas Administrativas
Los datos son utilizados en los negocios con el fin de incrementar las ganancias y vencer a la competencia ( recurso fundamental de las organizaciones). La empresa que aprende a utilizar sus datos son mejores; estn verdaderamente en posicin de construir planes, ejecutarlos y afinarlos para una ventaja competitiva.
Importancia de la Integracin de Datos en las Organizaciones
Qu estn haciendo las Instituciones, Tendencias:
Integracin Corporativa de la Informacin: Crecimiento lento del nivel operacin al superior. Interconexin entre Sistemas de las diferentes Areas: Lograr un ptimo SIG integral. Interconexin entre las diferentes islas de auto-matizacin: Apoyndose en Redes (C/S). Reingeniera de los viejos Sistemas.
El Proceso de la Toma de Decisiones: Datos - Informacin - Conocimiento
Informacin Gerencial Empresa
Herramientas para el apoyo al anlisis y toma de decisiones
OLAP
Estrategia B. I.
Data : integrada, pertinente, concisa y consistente
DW
OLTP
Herramientas para el manejo transaccional de la informacin Da a da
Informacin Operativa
CUALIDADES DE LA INFORMACIN
INFORMACIN RECURSO FUNDAMENTAL
Precisin :
Porcentaje de informacin correcta sobre la informacin total del sistema Tiempo transcurrido desde la entrada de datos hasta la salida de informacin al usuario. Ha de ser completa para poder cumplir con sus fines. Debe poseer el mximo contenido semntico posible. Tanto frente a deterioros como a accesos no autorizados.
Oportunidad: Complecin :
Significativa:
Seguridad :
COMPONENTES DE UN SISTEMA DE INFORMACION
Contenido -DatosReferencial Factual
Estructurados
No estructurados
Equipo Fsico -hardware-
Unidad Central de Proceso Equipos perifricos Sistema Operativo Gestin de datos SGBDControl de la comunicaciones Tratamientos especficos rea de datos rea informtica Informticos No informticos
SISTEMA DE INFORMACIN
Soporte Lgico -software-
Administrador
Usuarios
Necesidad: Metodologa basada en modelamiento del mundo real
Abstraccin
Modelo del mundo real en mente del cliente Modelo entidad (o de objetos) del Modelo del cliente
Modelo de tablas normalizadas del modelo entidad Tablas en disco (Base de Datos)
Metodologa de BDs
Mundo Real
Hacer uso de procedimientos ordenados y metdicos. Diseo Conceptual Diseo Lgico Diseo Fsico
Esquema Conceptual AUTOR
Esquema Lgico (relacional)
Escribe
LIBRO
Diseo Conceptual
Obtener una buena representacin de los recursos de informacin de la empresa, con independencia de usuarios o aplicaciones en particular y fuera de consideraciones sobre eficiencia del ordenador.
Diseo Lgico
Transformar el esquema conceptual obtenido en la etapa anterior adaptndolo al modelo de datos en el que se apoya el SGBD que se va utilizar.
Diseo Fsico
Conseguir una implementacin los mas eficiente posible del esquema lgico
OTROS MODELOS
MODELO JERARQUICO MODELO DE RED (CODASYL)
MODELOS DE DATOS
Coleccin de Herramientas conceptuales para describir los datos, las relaciones, la semntica, y los vnculos de consistencia.
1. 2. 3.
Modelos Lgicos basado en objetos Modelos Lgicos Basados en Registros Modelo de Datos Fsico
Ejm. de la necesidad de adoptar una metodologa para el diseo de B.D (Por P.Chen)
En una empresa se ha presentado la siguiente situacin:
a. Se necesita una aplicacin para hacer seguimiento a los empleados que trabajan en el departamento de la compaa. La aplicacin debe aceptar datos sobre un screen, almacenarlos en disco, e imprimir reportes segn demanda. Un grupo de Analista/Prog. termina estableciendo la siguiente estructura de archivo:
Diseo de registro Formato
No. L.E. NOMBRE X(8) X(20)
EDAD 9(2)
# DPTO PRESUPUESTO 9(3) 9(9)
CONTINUA ...
b. Al mismo tiempo otro grupo de la compaa necesita implementar una aplicacin para hacer seguimiento a los empleados por proyecto al que estn asignados. El formato de archivo para este caso difiere del otro. Ver
Diseo de registro Formato
L.E. NOM-EMP EDAD No.PROYECTO NOMBRE %TIEMPO
X(8) X(20) 9(3).9(2) 9(4) X(30) 9(2)
Hasta aqu, cada aplicacin satisface las necesidades del Grupo que los pidi. Sin embargo, un da el Presidente quiere conocer qu departamentos tienen empleados trabajando en el proyecto X ? Entonces cada grupo se rompe la cabeza tratando de convertir la data de un archivo al formato del otro archivo.
CONTINUA ...
Fijmonos profundamente en estos dos archivos para ver qu tipos de problemas tienen:
1. 2. 3. 4. Hay sinnimos. Ej. No. ELECTORAL y L.E. Existe el mismo nombre para diferentes campos. Ej. NOMBRE de empleado y NOMBRE de proyecto. Incompatibilidad de formatos de datos. Ej. EDAD. Duplicacin de datos. Ej. (No.Proyecto, Nombre) El PRESUPUESTO en a. se repite por cada empleado de cada departamento. Anomalas de actualizacin. Ej. Cambiando cualquiera de los datos de un empleado en un archivo pero no en el otro, resultar en inconsistencias de datos.
5.
CONTINUA ...
Entonces si el diseo anterior no es bueno:
Existe un mejor diseo ? Cuntos tipos de registros debe existir ? Debera haber un solo registro grande con todos los datos o varios registros con pasos de ellos ?
Cul es la clave primaria de cada registro (relacin) ?
CONTINUA ...
Las respuestas a estas interrogantes las proporciona la metodologa Entidad-relacin, que consta de los siguientes pasos: 1. Desarrollar un diagrama entidad-relacin (ERD), para: a) Determinar tipos de entidad-relacin y sus atributos y determinar las claves primarias de cada entidad-tipo.
Entidad : Cosa, concepto, organizacin o un evento de
inters para la organizacin que se est modelando. (sustantivos) En a. y b. : DPTO, EMPLEADO Y PROYECTO. Entidad-tipo : Grupo o clase de entidades que cumplen un criterio. Relacin : Interaccin entre entidades (verbos) Ej. TIENE, TRABAJA, PARA. Relacintipo : Grupo o clase de relacionamientos que cumplen un criterio.
CONTINUA ...
b) Identificar la cardinalidad de las relaciones-tipo. Ej. La cardinalidad de TIENE entre DPTO y EMPLEADO es 1 a n, uno a muchos. Esto es un Dpto. tiene muchos empleados, pero c/u de ellos pertenece a un solo Dpto. La cardinalidad de TRABAJA-PARA entre EMPLEADO y PROYECTO es n a n, muchos a muchos.
c) Identificar los atributos de cada entidad.
Diagrama entidad-relacin para una base de datos apropiada al problema
DPTO
TIENE
EMPLEADO
TRABAJA PARA
PROYECTO
#DPTO
PSPTO
#LE
NOMBRE
EDAD
#PROY
PNOMB
%TIEMPO
Evolucin de la Tecnologa de BD
Primera Etapa: A) Datos integrados a los programas de computadoras.
No existe estructura lgica ni fsica de los datos. La definicin de los datos se integra a los programas. Solo se pueden analizar partes muy pequeas del mundo real. Se manejaban archivos subordinados a los programas.
B) Archivos Secuenciales y Planos Distribucin a nivel conceptual entre la estructura fsica y lgica. La estructura fsica y lgica son equivalentes Siguen representandose porciones parciales del mundo real pero estos se orientan a la gestin de la empresa. El soporte Input/Output sigue siendo la cinta.
Evolucion de la Tecnologia de BD(Cont..)
Segunda Etapa:
Mtodo de Acceso a Archivos (1960-1970) El procesamiento se hace por lotes, en lnea o en tiempo real. Se distingue la organizacin fisica de la logica pero las relaciones entre ellas son muy sencillas se pueden cambiar las unidades de almacenamiento sin necesidad de modificar los programas de aplicacin La estructura de datos son de tipo secuencial. No hay recuperacin por claves multiples
Se incluyen ciertos recursos de seguridad pero no tan viables Hay una tendencia al diseo y optimizacion de los datos principalmente para una aplicacin Existe todavia mucha redundancia en los datos El software aporta metodos de acceso pero no administracion de datos.
Evolucion de la Tecnologia de BD(Cont..)
Tercera Etapa: Primeras BD (70-80) De las mismas BD fsicas se derivan multiples BD logicas. Se puede tener acceso a los mismos datos de distintos modos segn los requisitos de la aplicacin. El software provee medios para reducir la redundancia. Las distintas aplicaciones comparten los mismos elementos de datos. El almacenamiento fsico es independiente de los programas de aplicacin. Es posible recuperar por claves mltiples. Se utiliza formas de organizar los datos muy complejos si que ellos se refleje en los programas de aplicacin. Cuarta Etapa: Requisitos Actuales de los Sistemas de BD El software procura la independencia lgica y fsica de los datos. Los datos pueden evolucionar sin incurrir en costos de mantenimientos excesivos. Se proveen medios para que un DBA actue como controlador y custodio de los datos y asegure la mejor organizacin de estos. Se proveen procedimientos eficaces para control de la seguridad e integridad. Algunos sistemas usan archivos compartidos para una rapida exploracion a la BD.
Herramientas Tecnolgicas de BD(Cont...)
Brindan capacidades de gestin de datos, multimedia, activas, deductivas, orientadas a objetos, seguras,temporales,moviles,paral elas,difusas,etc. Gestores de este tipo son: Oracle, PL4, DB2 o SQL Server, que est pensados nicamente para este uso y no se emplean para bases de datos personales
Sistemas Tradicionales de Ficheros a Base de datos
D1
f1
T1
R1
D2
D3 D4 D5
f2
T2
R2
f3
T3
R3
f6
f4
T4 R4 R5
D6 D7
f5
FICHEROS
T5
DATOS
TRATAMIENTOS
RESULTADOS
SISTEMAS ORIENTADOS AL PROCESO
Proliferacin de ficheros; uno para cada aplicacin Los datos se almacenan varias veces, de tal forma que se encuentran repetidos en los distintos archivos Redundancia, uso inadecuado de los recursos, como resultado de ellos se origina divergencia en los resultados. Se dice orientados al proceso por que se pone nfasis en los tratamientos que reciben los datos. Las aplicaciones se analizan e implantan con entera independencia, los datos no se suelen transferir entre ellas, al contrario estos se duplican siempre que los trabajos los necesiten.
SIST. ORIENT. AL PROCESO
INCONVENIENTES:
Ocupacin intil de Memoria Aumento de los tiempos de proceso Necesidad de repetir los mismos controles y operaciones en los distintos ficheros Inconsistencias es una caracterstica de estos tipos de sistemas La actualizacin de los mismos datos cuando se encuentran en mas de un fichero no se suele realizar de forma simultanea en todos ellos. Dependencia de los datos respecto al soporte fsico y a los programas da lugar a una falta de flexibilidad y de adaptabilidad frente a los cambios que repercute negativamente en el rendimiento de conjunto del sistema informtico.
SISTEMAS ORIENTADOS A LOS DATOS
D1 D2 D3 D4 D5 RESULTADOS DATOS CREACION Y ACTUALIZACION RECUPERACION Y TRATAMIENTO R1 DEPURACION
RECUPERACION
ACTUALIZACION B.D ALMACENAMIEBNTO TRATAMIENTO
R2
R3
SISTEMAS ORIENTADOS A LOS DATOS
La necesidad de una gestin mas racional del conjunto de datos, surge un nuevo enfoque que se apoya sobre una Base de Datos. Los datos son recogidos y almacenados una sola vez con independencia de los tratamientos. Los datos se organizan y se mantienen en un conjunto estructurado que no esta diseado para una aplicacin concreta, sino por el contrario tiende a satisfacer las necesidades de informacin de toda la organizacin. Mejoran la calidad de las prestaciones de los Sist. Informticos y aumentan su rendimiento, presentan una multitud de ventajas frente a los sist. Orientados a los procesos.
VENTAJAS E INCONVENIENTES DE LAS BASES DE DATOS FRENTE A LOS ARCHIVOS TRADICIONALES
Referidas a: A) LOS DATOS:
Independencia de los datos respecto a los tratamientos. Mejor disponibilidad de los datos para el conjunto de los usuarios. Mayor eficiencia en el almacenamiento, validacin e introduccin de los datos en el sistema Mayor Coherencia Mayor valor informativo. Mejor y mas normalizada documentacin de la informacin la cual esta integrada con los datos
B) LOS RESULTADOS
VENTAJAS E INCONVENIENTES DE LAS BASES DE DATOS FRENTE A LOS ARCHIVOS TRADICIONALES
(Cont...)
Referidas a: C) LOS USUARIOS
Acceso mas rpido y sencillo de los usuarios finales Mas facilidades para compartir los datos por el conjunto de los usuarios Mayor flexibilidad para atender las demandas cambiantes.
RAZONES QUE PUEDEN LLEVAR A DECIDIR TRANSFORMAR UN SISTEMA ORIENTADO A ARCHIVOS EN UN SISTEMA APOYADO EN BASE DE DATOS
Relaciones en el Modelo de la Informacion Alta volatividad en los requerimientos de las aplicaciones y como consecuencia alta carga de reprogramacion. Necesidad de integracion de nuevas aplicaciones junto a las ya existentes. Exceso de redundancia no controlada con resultados incoherentes.
RAZONES QUE PUEDEN LLEVAR A DECIDIR TRANSFORMAR UN SISTEMA ORIENTADO A ARCHIVOS EN UN SISTEMA APOYADO EN BASE DE DATOS (Cont...)
Requerimientos de diferentes tipos de registros en archivos. Convivencia de modos mltiples de acceso ( Secuencial, Indexado). Exigencia de modos mltiples de tratamiento (Procesos batch, transaccional,etc). Requerimiento en cuanto a seguridad y rendimiento.
Inconvenientes
Instalacin Costosa Personal especializado Implantacin larga y difcil Falta de rentabilidad a corto plazo Escasa estandarizacin Desfase entre teora y practica
Definicin y Objetivos de una Base de Datos
Definicin:
Conjunto de datos lgicamente coherentes, con significado, los cuales representan algn aspecto del mundo real, para un propsito especifico y dirigida hacia determinado grupo de usuarios. Almacenar un conjunto de datos estructurados, interrelacionados, sin redundancias perjudiciales e innecesarias de modo que resulten independientes de los programas que los utilizan, a su vez permitan facilmente consultar. Modificar y extraer los datos almacenados.
Objetivos:
Tipos de Base de Datos
A) BASE DE DATOS CENTRALIZADAS
Tipos de Base de Datos(Cont...)
B) BASE DE DATOS DISTRIBUIDAS
Especie de objeto virtual cuyas partes componentes se almacenan fsicamente en varias bases de datos ubicadas en diferentes sitios geogrficamente separados. Un Sistema distribuido permite que la estructura de la BD refleje la estructura de la empresa Las BD distribuidas hacen uso de redes de computadores, geogrficamente separados que se conectan por medio de protocolos de comunicaciones . El objetivo de un Sistema Distribuido es que el usuario lo perciba como un sistema centralizado.
Tipos de Base de Datos (Cont...)
BASE DE DATOS DISTRIBUIDAS
Usuario
Tipos de Base de Datos (Cont...)
Razones para hacer uso de SBDD:
1.
Sucursales de las organizaciones en diferentes localidades.
Hacer uso de una BD centralizada genera mayor costo y las comunicaciones pueden convertirse en cuellos de botella. Permitir a sucursal mantener su propia BD esto facilita el acceso inmediato y eficaz de los datos que se usan con mayor frecuencia. Mejoran la fiabilidad, si un servidor falla o el enlace de comunicacin el resto de la red puede seguir funcionando Permitir el control local de los datos que se usan con mas frecuencia puede mejorar el grado de satisfaccin de los usuarios, esto quiere decir que la BD puede reflejar mejor la estructura administrativa local y de esta manera brindar un mejor servicio a las necesidades de la gestin.
2.
3.
4.
5.
Tipos de Base de Datos (Cont...)
Replica de datos: Las BD Distribuidas conservan varias replicas (copias) idnticas de la relacin, cada replica se guarda en un emplazamiento diferente Ventajas e Inconvenientes de las BDD: Disponibilidad: Si falla un emplazamiento que contiene la relacin se puede continuar procesando utilizando la replica disponible en otro desplazamiento Aumento del paralelismo: Si la mayor parte de accesos a los datos sean de tipo lectura entonces los diversos emplazamiento pueden atender estos requerimientos paralelamente esto optimizara el procesamiento de la operaciones as como minimizara el trafico de datos entre los emplazamientos. Aumento de la sobrecarga en las actualizaciones: Todas las replicas deben disponer del mismo contenido, de lo contrario generar inconsistencias en las operaciones. Dando lugar a resultados no confiables. Cada vez que se actualice una replica debe actualizarse en cascada todas las dems de los diferentes emplazamientos. Como consecuencia de ello es un aumento en la sobrecarga
Tipos de Base de Datos (Cont...)
En resumen: las replicas mejoran el rendimiento de las operaciones leen y aumentan la disponibilidad de los datos para las transacciones de solo lectura, sin embargo las transacciones de actualizacin requieren una sobrecarga mayor.
Replica
El Control de la concurrencia es mas complicado que en los Sistemas centralizados.
Tipos de Usuarios
A) USUARIOS INFORMATICOS:
Diseadores Administradores Analistas y programadores
B) USUARIOS FINALES:
Habituales Espordicos
Evolucin y Futuro
Nueva Generacin de BD
Gestin de datos:
Grandes cantidades de datos son compartidas por muchos usuarios.
Gestin de objetos
Tipos de datos mucho mas complejos, objetos multimedia, datos derivados y nuevas capacidades.
Gestin de conocimiento
Soporta un gran numero de reglas complejas para inferencia automtica de informacin y tambin para mantener las restricciones de integridad entre datos.
DIMENSIONES EN LA EVOLUCION DE LAS BD
FUNCIONALIDAD/ INTELIGENCIA
DISTRIBUCION/ INTEGRACION
BD
RENDIMIENTO
Plano cientfico: La investigacin dedicada a la tecnologa Plano Industrial: Desarrollo de productos que empleen la tecnologa por parte de suministradores Plano Comercial: Aceptacin y utilizacin por usuarios.
Ventas mundiales segn tipos de SGBD Inversin en Tecnologa de B. D.
Miles de millones de dlares
14 12 10 08 06 04 02 00
O a Objetos Pre-relacional Relacional
1994
1995
1996
1997
1998
Segn IDC, en 1999: Mercado de Relacionales: 89.7 % y No-relacionales 10.3% (bajan 3%) Segn Price Waterhouse: Ligero aumento de los SGBD Orientado a Objetos. Espectante en 2000-10
RETOS TECNOLGICOS DEL MERCADO
La informacin es un recurso estratgico y decisivo para lograr ventaja competitiva . (Peter Druker)
En la era de la Informacin, las estrategias del negocio se apoyan en las tecnologas de informacin . (Michael Porter) Las TI, estn copando todos los campos de accin y niveles del negocio y ninguna Empresa puede escapar a sus efectos. (Los expertos de Negocios).