Bases de Datos Archivos V/S Datos
Por qu estudiar Bases de Datos Archivos Arquitectura de un Motor de Base de Datos
Ing PEDRO BELTRN CANESSA
Porqu estudiar Bases de datos?
Todas las organizaciones tienen datos crticos.
Los Bancos almacenan informacin de cuentas. Las bibliotecas almacenan informacin acerca de los libros. Los hospitales almacenan informacin acerca de los pacientes. Las casas de remates almacenan informacin acerca de los tems a rematar y de los clientes que los rematan
Ing PEDRO BELTRN CANESSA
Porqu estudiar Bases de datos?
Todas las organizaciones deben crear y manipular datos tan eficientemente como sea posible.
Considere retirar dinero de un banco, sin un sistema informtico. Usted camina hasta la caja para retirar $100.000. El cajero debe llamar a la oficina central" para comprobar el libro mayor principal para estar seguro que hay suficientes fondos. Si hay, ese libro mayor se debe actualizar a mano para reflejar el retiro. Es esto eficiente para el banco o los clientes?
Ing PEDRO BELTRN CANESSA
Porqu estudiar Bases de datos?
Los datos de la organizacin deben ser almacenados en forma confiable.
Los datos no pueden ser destruidos o perdidos. Los datos no pueden ser inconsistentes.
Ing PEDRO BELTRN CANESSA
Conceptos y Definiciones
Origen de Las Bases de Datos
Anterior a las Bases de datos, solo exista una coleccin de Archivos tradicionales. Su administracin se realizaba a travs de cada programa que lo utilizaba. Los sistemas se desarrollaban absolutamente Parcelados dentro de la misma organizacin. Cada Parcela generaba datos similares, lo que produce la no deseada Duplicidad Cada Parcela actualizaba en sus ciclos los datos comunes a la Organizacin, lo que produce la no deseada no-Integridad
Ing PEDRO BELTRN CANESSA
El enfoque de Archivos
Usando archivos de datos tradicional, las aplicaciones deben acceder a los datos directamente.
Las aplicaciones deben estar enterados de la estructura de archivo. Si la estructura de archivo cambia, todos los programas que tienen acceso a estos datos se deben tambin modificar para reflejar los cambios. Las aplicaciones pueden tener que acceder datos que no necesitan mientras buscan alguna pieza de datos.
Ing PEDRO BELTRN CANESSA
El enfoque de Archivos
Una coleccin de programas de aplicacin que realizan servicios para el usuario final, (Ej: produccin de reportes.) Cada programa define y administra sus propios datos.
Ing PEDRO BELTRN CANESSA
Ejemplo: Archivos Biblioteca
Considere una biblioteca que almacena informacin de libros en archivos de texto. Los ttulos se asignan en treinta caracteres, los nombres del autor se asignan en veinte caracteres, y el numero de pginas se asigna en cuatro caracteres. Se delimita cada campo usando el carcter ` | ' . Por ejemplo, la estructura del archivo seria como sigue: Title Dr. Zhivago |Author |Boris Pasternack |Page | 540
Cada aplicacin que accede a estos datos debe conocer, que el titulo es ledo en string de 30 caracteres, el autor en string de 20 caracteres, y el numero de pginas del libro en string de cuatro caracteres.
Ing PEDRO BELTRN CANESSA
El enfoque de Archivos
Que ocurre si
al archivo de propietarios se decide aadirle un campo que almacene un segundo telfono? deseamos insertar <Database Systems: A practical approach to Design, Implementation, and Management , Thomas M. Connolly, et al, 950> al archivo de Biblioteca? Hay Que Modificar las aplicaciones, incluso las que no utilizan esos campos se pueden ver afectadas y tener que ser modificadas Migrar los archivos al nuevo formato
Ing PEDRO BELTRN CANESSA
El enfoque de Archivos
Los sistemas orientados hacia el proceso, pone el nfasis en los tratamientos que reciben los datos, los cuales se almacenan en Archivos diseados para una determinada aplicacin. Las aplicaciones se analizan e implantan con entera independencia unas de otras, y los datos no se suelen transferir entre ellas, sino que se duplican siempre que los correspondientes proyectos los necesitan.
Ing PEDRO BELTRN CANESSA
Limitaciones con el enfoque basado en archivos
Separacin y aislamiento de datos
Cada programa maneja su propio conjunto de datos Los usuarios de un programa pueden no estar enterados de los datos potencialmente tiles llevados a cabo por otros programas
Duplicacin de datos
Mismos datos son mantenidos por diferentes programas Espacio perdido y valores potencialmente diversos y/o diferentes formatos para el mismo dato.
Ing PEDRO BELTRN CANESSA
Limitaciones con el enfoque basado en archivos
Dependencia de datos
La estructura fsica y almacenamiento de los archivos son definidos en el cdigo de la aplicacin.
Formatos de archivos incompatibles
las estructuras son dependientes del lenguaje de programacin de aplicaciones.
Proliferacin de programas de aplicacin y consultas Pre-definidas
Los programas se escriben para satisfacer funciones particulares. Cualquier nuevo requisito necesita un nuevo programa
Ing PEDRO BELTRN CANESSA
Limitaciones con el enfoque basado en archivos
No pueden almacenar reglas de Integridad Dificultad para procesar consultas que no se realizan con frecuencia
Ing PEDRO BELTRN CANESSA
Esto no es eficiente!
Ing PEDRO BELTRN CANESSA
Conceptos y Definiciones
Origen de Las Bases de Datos
Solucin
La creacin de un Software especializado que se encargue de realizar la ADMINISTRACION de los datos de que hacen uso los Software de Aplicaciones...
Ing PEDRO BELTRN CANESSA
Conceptos y Definiciones
Sistema Administrador de Base de Datos (DBMS: Data Base Managment System)
Definicion de DBMS Un DBMS es una coleccin de numerosas rutinas de software interrelacionadas, cada una de las cuales es responsable de una tarea especfica en relacin a la administracin y organizacin de las bases de datos. El objetivo primordial de un sistema manejador base de datos es proporcionar un entorno que sea a la vez conveniente y eficiente para ser utilizado al extraer, almacenar y manipular informacin de la base de datos. Todas las peticiones de acceso a la base, se manejan centralizadamente por medio del DBMS.
Ing PEDRO BELTRN CANESSA
Conceptos y Definiciones
Sistema Administrador de Base de Datos (DBMS: Data Base Managment System) Las bases de datos han evolucionado durante los pasados 30 aos desde sistemas de archivos rudimentarios hasta sistemas gestores de complejas estructuras de datos que ofrecen un gran nmero de posibilidades.
Ing PEDRO BELTRN CANESSA
Conceptos y Definiciones
Sistema Administrador de Base de Datos
Potencialidades
Redundancia mnima Acceso concurrente por parte de mltiples usuarios Distribucin espacial de los datos
Ing PEDRO BELTRN CANESSA
Conceptos y Definiciones
Sistema Administrador de Base de Datos
Objetivos de los DBMS
Independencia lgica y fsica de los datos: se refiere a la capacidad de modificar una definicin de esquema en un nivel de la arquitectura sin que esta modificacin afecte al nivel inmediatamente superior. Para ello un registro externo en un esquema externo no tiene por qu ser igual a su registro correspondiente en el esquema conceptual. Integridad de los datos: se refiere a las medidas de seguridad que impiden que se introduzcan datos errneos. Esto puede suceder tanto por motivos fsicos (defectos de hardware, actualizacin incompleta debido a causas externas), como de operacin (introduccin de datos incoherentes). Consultas complejas optimizadas: la optimizacin de consultas permite la rpida ejecucin de las mismas.
Ing PEDRO BELTRN CANESSA
Conceptos y Definiciones
Sistema Administrador de Base de Datos
Seguridad de acceso y auditora: se refiere al derecho de acceso a los datos contenidos en la base de datos por parte de personas y organismos. El sistema de auditora mantiene el control de acceso a la base de datos, con el objeto de saber qu o quin realiz una determinada modificacin y en qu momento. Respaldo y recuperacin: se refiere a la capacidad de un sistema de base de datos de recuperar su estado en un momento previo a la prdida de datos. Acceso a travs de lenguajes de programacin estndar: se refiere a la posibilidad ya mencionada de acceder a los datos de una base de datos mediante lenguajes de programacin basados en estndares.
Ing PEDRO BELTRN CANESSA
Conceptos y Definiciones
Sistema Administrador de Base de Datos
El Rol de las Bases de Datos y los SIAs
Prcticamente todo Sistema de Informacin esta sustentado por una Base de Datos. La eficiencia e integridad de un Sistema de Informacin se ve directamente influenciado por el diseo de la base de datos que lo sustenta y sus mecanismos de acceso. En el mundo informtico empresarial existen bsicamente dos reas de especializacin:
Desarrollo: el rol del diseador de Bases de Datos Produccin: el rol del Administrador de Base de Datos
Ing PEDRO BELTRN CANESSA
Conceptos y Definiciones
Sistema Administrador de Base de Datos
DBMS: Componentes
Un DBMS tpico integra los siguientes componentes:
Un lenguaje de definicin de datos (DDL: Data Definition Language). Un lenguaje de manipulacin de datos (DML: Data Manipulation Language) Un lenguaje de consulta (QL: Query Language). De forma accesoria, pero ya casi obligada, los DBMS modernos aaden un interfaz de usuario grfico (GUI: Graphical User Interface).
Ing PEDRO BELTRN CANESSA
Conceptos y Definiciones
Sistema Administrador de Base de Datos
DBMS Comerciales
Existen numerosos DBMS comerciales, los principales son:
Oracle (Oracle Corp.) Sybase (Sybase Inc.) SQL Server (Microsoft) Informix (actualmente pertenece a IBM) DB2 (IBM) Postgres Progress MySQL
Ing PEDRO BELTRN CANESSA
Enfoque de Base de Datos
La importancia de almacenar, manipular y recuperar la informacin en forma eficiente ha llevado al desarrollo de una teora esencial para las bases de datos. Esta teora ayuda al diseo de bases de datos y procesamiento eficiente de consultas por parte de los usuarios.
Las arquitecturas de bases de datos han evolucionado mucho desde sus comienzos, aunque la considerada estndar hoy en da es la descrita por el comit ANSI/X3/SPARC (Standard Planning and Requirements Committee of the American National Standards Institute on Computers and Information Processing), que data de finales de los aos setenta.
Ing PEDRO BELTRN CANESSA
ARQUITECTURA
Este comit propuso una arquitectura general para DBMSs basada en tres niveles o esquemas: el nivel fsico, o de mquina, el nivel externo, o de usuario, y el nivel conceptual. As mismo describi las interacciones entre estos tres niveles y todos los elementos que conforman cada uno de ellos. EL uso de las BD es contrario al enfoque tradicional, en que cada sistema maneja sus propios datos y archivos. Al usar BD, todos los datos se almacenan en forma integrada, y estn sujetos a un control centralizado. Las diversas aplicaciones operan sobre este conjunto de datos.
Ing PEDRO BELTRN CANESSA
Arquitectura ANSI
Objetivo
Hay tres caractersticas importantes inherentes a los sistemas de bases de datos: la separacin entre los programas de aplicacin y los datos, el manejo de mltiples vistas por parte de los usuarios y el uso de un catlogo para almacenar el esquema de la base de datos. En 1975, el comit ANSI-SPARC (American National Standard Institute - Standards Planning and Requirements Committee) propuso una arquitectura de tres niveles para los sistemas de bases de datos, que resulta muy til a la hora de conseguir estas tres caractersticas. Propiedad que asegura que los programas de aplicacin sean independientes de los cambios realizados en datos que no usan o en detalles de representacin fsica de los datos a los que acceden
Ing PEDRO BELTRN CANESSA
Arquitectura ANSI
Estructura
Grupo de estudio ANSI/SPARC en 1977 propuesta de arquitectura para los DBMS que plantea la definicin de la base de datos a tres niveles de abstraccin: Nivel conceptual Nivel interno Nivel externo
Ing PEDRO BELTRN CANESSA
Arquitectura ANSI
Estructura Nivel conceptual representa la abstraccin de como la realidad es. Ejemplo: Empleado (nombre, direccin, telfono, depto, sueldo)
Ing PEDRO BELTRN CANESSA
Arquitectura ANSI
Estructura
Nivel interno
En el nivel interno se describe la estructura fsica de la base de datos mediante un esquema interno. Este esquema se especifica mediante un modelo fsico y describe todos los detalles para el almacenamiento de la base de datos, as como los mtodos de acceso. Esquema interno: descripcin de la BD en trminos de su representacin fsica. Ejemplo: Archivo Empleados Nombre : char [20] Direccin : char [40] Telfono : char [10] Depto : char [15] Sueldo : REAL Archivo ndices por nombre Archivo ndices por depto
Ing PEDRO BELTRN CANESSA
Arquitectura ANSI
Estructura
Nivel externo En el nivel externo se describen varios esquemas externos o vistas de usuario. Cada esquema externo describe la parte de la base de datos que interesa a un grupo de usuarios determinado y oculta a ese grupo el resto de la base de datos. En este nivel se puede utilizar un modelo conceptual o un modelo lgico para especificar los esquemas. Esquema externo: descripcin de las vistas parciales de la BD que poseen los distintos usuarios. Ejemplo: Subschema1: E1 (nombre, direccin, telfono) Subschema2: E2 (nombre, depto, sueldo)
Ing PEDRO BELTRN CANESSA
Diagrama
Cules son los datos?
Cmo se almacenan?
Arquitectura de 3 esquemas
Ing PEDRO BELTRN CANESSA
Enfoque de Base de Datos
En el enfoque de bases de datos se mantiene un nico almacn de datos que se define una sola vez y al cual tienen acceso muchos usuarios.
Las principales ventajas del enfoque de Base de Datos sobre el enfoque tradicional son:
Evita los datos repetidos (redundancia). Evita que distintas copias de un dato tengan valores distintos (inconsistencia). Evita que usuarios no autorizados accedan a los datos (seguridad). Protege los datos contra valores no permitidos (integridad o restricciones de consistencia). Permite que uno o ms usuarios puedan accesar simultneamente a los datos (concurrencia). Ing PEDRO BELTRN CANESSA
FIN INTRODUCCION
Ing PEDRO BELTRN CANESSA