0% encontró este documento útil (0 votos)
14 vistas184 páginas

Introducción a Bases de Datos

Cargado por

ignacio martinez
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
14 vistas184 páginas

Introducción a Bases de Datos

Cargado por

ignacio martinez
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Sesión síncrona 11:

Reforzamiento

Administración de las bases de datos Ing. Eiselda Gpe. Rios Astorga


Concepto de bases de datos

Es un conjunto de datos ordenados que están relacionados


entre si y se almacenan sistemáticamente para su posterior
consulta.
Tipos de bases de datos

Jerárquicas • Según los datos de almacenamiento


De Red • Bases de datos estáticas
• Son de almacenamiento histórico, para
realizar proyecciones y toma de decisiones
Transaccionales • Bases de datos dinámicas
• De almacenamiento pero se modifican con el
Relacionales tiempo, se puede borrar, actualizar, editar
etc.
Dinámicas • Según el contenido
• Bibliográficas: Es la que contiene nombre
Orientada a objetos de autor, fecha publicación, etc.
• Texto completo : Contenidos completos
como de revistas científicas.
• Información química o bilógica: Diferentes
tipos de información.
• Clínicas: de hospitales
Año de creación de las bases de
datos

• Sus orígenes es desde la antigüedad, donde ya existían bibliotecas y


toda clase de registro, recolectaban información desde cosechas y
censos.
• 1950 -1960 Cintas magnéticas –se automatiza la información

• 1960 -1970 Las computadoras bajan de precio, para las compañías


pudieran adquirirlas (Alianza de IBM y Amercan Airlines ) = (sistema
CODASYL (Conference on Data Systems Languages)

• 1980 -1990 Se creó un lenguaje de consulta de estructurado (SQL)


con sistemas de bases de datos relacionales con bases de datos de
red y jerárquicas.

• 1990 -2000 Surgió las bases de datos orientas a objetos ( Excel,


Access, Visual Basic, etc.) también llamada tercera generación.
Características de las bases de
datos

 Independencia de datos (cualquier programa puede utilizar los datos)


 Seguridad de acceso y auditoria ( control de seguridad sobre los datos)
 Reducción de la duplicación de datos ( aprovechando el espacio)
 Concurrencia por múltiples usuarios ( permitir la conexión de barios usuarios en el mismo tiempo)
 Integridad de los datos ( Los datos sean reales)
 Consultas complejas y optimizadas. (rápida ejecución de información)
 Acceso de lenguaje de programación estándar (possible acceso a trabes de cualquier lenguaje).
 Independencia del Hardware (poder ser ejecutadas desde cualquier Plataforma)
¿Como esta compuesta una
de las bases de datos?

Tablas • Contienen campos y registros

Formularios • Es la actualización de datos

Consultas • Para analizar datos

Informes • Presentación de datos

Macros • Conjunto de instrucciones


Características de los sistemas de
administración de bases de datos

Reducidas

• Deben de tener los esencial no saturación de datos o información innecesaria para la empresa

Consistencia

• Es básicamente el reglamento de la empresa (evitar la duplicidad de datos)

Integridad

• Es la congruencia entre la relación de datos

Seguridad

• Que los datos que se encuentren en una base de datos estén seguros
Arquitectura de los sistemas de
administración de bases de datos

Nivel interno
Es el nivel mas bajo y es el que define como se
almacenan los datos

Nivel conceptual
Es el nivel medio: En esta parte se representan los
datos organizándolos según los requerimientos del
usuario

Nivel externo

Es el nivel mayor: correspondiendo a las vistas que


tiene una base de datos con los diferentes usuarios
Impactos organizacionales de la
teoría de las bases de datos

• Es la aplicación de conocimientos relativos a la manera en que las


personas actúan dentro de las organizaciones.
• Personas: constituyen el sistema social interno de la organización
• Estructura: la estructura define las relaciones oficiales de las personas en
el interior de las organizaciones
• Tecnología: la tecnología proporciona los recursos con los que trabajan
las personas e influyen en la tarea que desempeñan
• Medio: todas las organizaciones operan en un determinado entorno
externo
Concepto de bases de
datos

Es un conjunto de datos ordenados que están relacionados


entre si y se almacenan sistemáticamente para su posterior
consulta.
Tipos de bases de datos

Jerárquicas • Según los datos de almacenamiento


• Bases de datos estáticas
De Red • Son de almacenamiento histórico, para
realizar proyecciones y toma de decisiones
• Bases de datos dinámicas
Transaccionales • De almacenamiento pero se modifican con el
tiempo, se puede borrar, actualizar, editar
Relacionales etc.
• Según el contenido
Dinámicas • Bibliográficas: Es la que contiene nombre
de autor, fecha publicación, etc.
Orientada a objetos • Texto completo : Contenidos completos
como de revistas científicas.
• Información química o bilógica: Diferentes
tipos de información.
• Clínicas: de hospitales
Año de creación de las bases de
datos

• Sus orígenes es desde la antigüedad, donde ya existían bibliotecas y


toda clase de registro, recolectaban información desde cosechas y
censos.
• 1950 -1960 Cintas magnéticas –se automatiza la información

• 1960 -1970 Las computadoras bajan de precio, para las compañías


pudieran adquirirlas (Alianza de IBM y Amercan Airlines ) = (sistema
CODASYL (Conference on Data Systems Languages)

• 1980 -1990 Se creó un lenguaje de consulta de estructurado (SQL)


con sistemas de bases de datos relacionales con bases de datos de
red y jerárquicas.

• 1990 -2000 Surgió las bases de datos orientas a objetos ( Excel,


Access, Visual Basic, etc.) también llamada tercera generación.
Características de las bases de
datos

 Independencia de datos (cualquier programa puede utilizar los datos)


 Seguridad de acceso y auditoria ( control de seguridad sobre los datos)
 Reducción de la duplicación de datos ( aprovechando el espacio)
 Concurrencia por múltiples usuarios ( permitir la conexión de barios usuarios en el mismo tiempo)
 Integridad de los datos ( Los datos sean reales)
 Consultas complejas y optimizadas. (rápida ejecución de información)
 Acceso de lenguaje de programación estándar (possible acceso a trabes de cualquier lenguaje).
 Independencia del Hardware (poder ser ejecutadas desde cualquier Plataforma)
¿Como esta compuesta una
de las bases de datos?

Tablas • Contienen campos y registros

Formularios • Es la actualización de datos

Consultas • Para analizar datos

Informes • Presentación de datos

Macros • Conjunto de instrucciones


Características de los sistemas de
administración de bases de datos

Reducidas

• Deben de tener los esencial no saturación de datos o información innecesaria para la empresa

Consistencia

• Es básicamente el reglamento de la empresa (evitar la duplicidad de datos)

Integridad

• Es la congruencia entre la relación de datos

Seguridad

• Que los datos que se encuentren en una base de datos estén seguros
Desarrollo de la tecnología de las bases
de datos y la estructura de mercado

• Consiste en recolectar toda la información de los clientes


CRM

• Ayuda a la transformar la forma en que los datos son


Analítica
aumentada
analizados, consumidos y compartidos

• Se indica como inteligencia artificial, para clasificar con


Manejo de los
datos
aumentados
mayor calidad los datos brindados
Desarrollo de la tecnología de las bases de
datos y la estructura de mercado

• Se utiliza para la toma de decisiones por su capacidad para procesar datos


Inteligencia
continua

Inteligencia • También es para la toma de decisiones justificando la toma de decisiones


artificial
explicable

• Modelar, explorar y mostrar los datos de forma eficiente


Gráficos
Desarrollo de la tecnología de las
bases de datos y la estructura de
mercado
• Facilita el acceso a bases de datos y permite que los datos sean
Tejido de datos compartidos

Procesamiento • Consultas a través de ordenes de voz


de lenguaje
natural

• Soluciones para usuario final que actualmente se generan a través de técnicas de IA y ML se


Inteligencia desarrollarán a través de soluciones comerciales y no con plataformas de código libre.
artificial
comercial
Desarrollo de la tecnología de las bases de
datos y la estructura de mercado

• El valor de esta tecnología es ofrecer confianza


Blockchain
entre los participantes de una red

• Esta tecnología ayudará a reducir los costos de


Servidores de
adoptar arquitecturas de almacenamiento y a
memoria
persistentes
mejorar las cargas de trabajo de alto rendimiento
Arquitectura de los sistemas de
administración de bases de datos

Nivel interno
Es el nivel mas bajo y es el que define como se
almacenan los datos

Nivel conceptual
Es el nivel medio: En esta parte se representan los
datos organizándolos según los requerimientos del
usuario

Nivel externo

Es el nivel mayor: correspondiendo a las vistas que


tiene una base de datos con los diferentes usuarios
Impactos organizacionales de la teoría
de las bases de datos

• Es la aplicación de conocimientos relativos a la manera en que las personas


actúan dentro de las organizaciones.
• Personas: constituyen el sistema social interno de la organización
• Estructura: la estructura define las relaciones oficiales de las personas en el interior de
las organizaciones
• Tecnología: la tecnología proporciona los recursos con los que trabajan las personas e
influyen en la tarea que desempeñan
• Medio: todas las organizaciones operan en un determinado entorno externo
Representación grafica de una
base de dados

Base de datos biblioteca

Base de datos biblioteca Base de datos empresa

• Libros • Clientes
• Prestamos • Productos
• Usuario • Proveedores
Base de datos biblioteca Base de datos empresa

Entidades
Libro
Clientes

Autor Relaciones
Nombre
Editorial
Dirección
Año publicación
Producto
Titulo del libo
Cantidad
Fecha
Conceptos básicos
• Definición
• Una base de datos es una entidad software cuya principal característica es la
capacidad para almacenar y gestionar grandes cantidades de datos.
• Operaciones básicas
• Toda base de datos debe permitir añadir, modificar, eliminar y consultar los
datos que almacena. – A estas cuatro operaciones básicas se las conoce como
CRUD por sus siglas en inglés: Create, Read, Update and Delete.
• Tecnologías
• Aunque existen distintas tecnologías (relacional, orientadas a objetos, objeto-
relacional, …) la mayoría de las bases de datos se basan en el modelo
relacional de datos de Codd y utilizan SQL (Structured Query Language) como
lenguaje de consulta y manipulación de datos.
Conceptos básicos

• Dominio del problema: La parte del mundo real de la que el sistema de información
debe almacenar información y a cuyos actores (personas u otros sistemas de
información) debe ofrecer servicios.
• Sistema de información: conjunto de hardware, software, mobiliario de oficina,
documentos en papel, personas y procedimientos manuales responsable de ofrecer
una serie de servicios a los actores del dominio del problema.
• Sistema informático: conjunto de hardware y software del sistema de información que
es responsable del tratamiento automatizado de la información. Normalmente incluye
una base de datos y debe ofrecer servicios tanto a actores internos del sistema de
información como a actores en el dominio del problema (a través de Internet, por
ejemplo).
Conceptos básicos

• Entidad
• representa un concepto relevante del dominio del
problema sobre el que el sistema debe almacenar
información
• puede tener atributos, que son datos simples que
representan la información que el sistema debe
almacenar sobre las propiedades o características del
concepto relevante que representa la entidad.
• Una entidad se representa gráficamente mediante un
rectángulo con el nombre de la entidad, que debe ser
un sustantivo en singular, en su interior.
• Los atributos se representan gráficamente mediante
círculos o elipses enlazados a la entidad.
• Los atributos identificativos se subrayan o se dibujan de
otro color.
Ejemplo de entidad.

• Una entidad Alumno de un sistema para la gestión de


matriculación de alumnos de una universidad.
• Cada alumno registrado en el sistema estará representado
por una ocurrencia de la entidad Alumno

nombre
apellidos

ID dirección

Fecha
teléfono nacimiento

Alumno
Conceptos básicos

 Atributos
 debe ser siempre un valor simple, nunca una estructura de datos como un
conjunto, una secuencia, etc.
 Aquellos atributos que identifican de forma única a una entidad se denominan
identificativos. No puede haber más de una ocurrencia de una entidad con el
mismo valor de los atributos.
 Los atributos de una interrelación siguen las mismas reglas que los de las
entidades, con la diferencia de que no pueden ser identificativos.
Conceptos básicos
• Interrelación
• Una interrelación se representa gráficamente como un rombo con el nombre en su interior.
• El nombre de la interrelación, que debe ser una forma verbal, debe tener sentido leído junto con
el nombre de las entidades de izquierda a derecha o de arriba abajo
• El rombo se conecta mediante líneas con las entidades que participan en la interrelación.

• Ejemplo de una interrelación


• Una interrelación se matricula de entre las entidades Alumno y Asignatura de un sistema de
gestión de matriculación de alumnos.
• Observe que Alumno-se matricula de-Asignatura tiene sentido leído de izquierda a derecha.

Alumno Se matricula Asignatura

fecha curso
Conceptos básicos
• La tabla (o relación) es el concepto básico del modelo relacional.
• La tabla contiene un conjunto de filas en las que se almacenan los valores de
los campos.
• Toda tabla tiene un nombre único en la base de datos, en la que pueden
almacenarse múltiples tablas.
• Cada campo de una tabla tiene un nombre y un tipo de datos asociados
Conceptos básicos
• La clave primaria de una tabla es el conjunto de campos que
identifica de manera única a cada fila, es decir, no puede haber
dos filas con el mismo valor en los campos de la clave primaria.
• Una clave ajena es un conjunto de campos de una tabla cuyos
valores deben coincidir con los de la clave primaria de otra tabla o
ser nulos.
Fases de una base de datos

Fase 1 Diseño conceptual


Fase 2 Deseño lógico
Definición de uso y
objetivos Fase 3 Diseño Físico
Esquematización de la
Funciones a cumplir estructura
Creación de la base de
Análisis y categorización Generación de propuesta datos
de la información de la base de datos
Realización de la interfaz
Esquematización de la de la base de datos
visualización de la base
de datos
Requerimientos de una base de datos

• Son exigencias del software.


• Las bases de datos contienen una forma estructurada, para
cumplir su función.
• Buen manejo de la información
• Información requeridas
• Campos y registros
• Información correcta
• Información de fuentes fiables
• Saber manejar el programa en la que se encuentra la base de
datos
Modelo conceptual de
datos
Diagrama de entidad
relación
Diseño lógico de base de datos
¿Qué es una base de
datos relacional?

• Una base de datos relacional es un tipo de base de datos que almacena y proporciona acceso a
puntos de datos relacionados entre sí. Las bases de datos relacionales se basan en el modelo
relacional, una forma intuitiva y directa de representar datos en tablas.

• En una base de datos relacional, cada fila de la tabla es un registro con un ID único llamado clave.
• Las columnas de la tabla contienen atributos de los datos, y cada registro generalmente tiene un
valor para cada atributo, lo que facilita el establecimiento de las relaciones entre los puntos de
datos.
¿Cómo se estructuran las bases
de datos relacionales?

• El modelo relacional significa que las estructuras lógicas de datos—las tablas de datos,
vistas e índices—están separadas de las estructuras físicas de almacenamiento.
• Esta separación significa que los administradores de bases de datos pueden administrar el
almacenamiento físico de datos sin afectar el acceso a esos datos como una estructura
lógica.
• Por ejemplo, cambiar el nombre de un archivo de base de datos no cambia el nombre de
las tablas almacenadas en él.
¿Cómo se estructuran las bases
de datos relacionales?

• La distinción entre lógica y física también se aplica a las operaciones de la base de


datos, que son acciones claramente definidas que permiten a las aplicaciones
manipular los datos y las estructuras de la base de datos.
• Las operaciones lógicas permiten que una aplicación especifique el contenido que
necesita, mientras que las operaciones físicas determinan cómo se debe acceder a
esos datos y luego realizan la tarea.
El modelo relacional

• En los primeros años de las bases de datos, cada aplicación almacenaba datos en su propia
estructura única. Cuando los desarrolladores querían crear aplicaciones para usar esos
datos, tenían que saber mucho sobre la estructura de datos particular para encontrar los
datos que necesitaban.
• Estas estructuras de datos eran ineficientes, difíciles de mantener y difíciles de optimizar
para ofrecer un buen rendimiento de la aplicación. El modelo de base de datos relacional se
diseñó para resolver el problema de varias estructuras de datos arbitrarias.
• El modelo relacional proporcionó una forma estándar de representar y consultar datos que
cualquier aplicación podría utilizar.
Bases de Datos
Relacionales
Las transacciones de bases de datos relacionales se definen mediante cuatro propiedades
cruciales:

• La atomicidad :define todos los elementos que conforman una transacción


completa en la base de datos.
• La consistencia: define las reglas para mantener los puntos de datos en un
estado correcto después de una transacción.
• El aislamiento: mantiene el efecto de una transacción invisible para otros
hasta que se comprometa, para evitar confusiones.
• La durabilidad: garantiza que los cambios en los datos se vuelvan
permanentes una vez que se confirma la transacción.
¿Qué buscar a la hora de seleccionar una base
de datos relacional?

El software que se utiliza para almacenar, administrar, consultar y recuperar datos almacenados en una
base de datos relacional se denomina sistema de gestión de bases de datos relacionales (RDBMS). El
RDBMS proporciona una interfaz entre usuarios y aplicaciones y la base de datos, así como funciones
administrativas para administrar el almacenamiento, el acceso y el rendimiento de los datos.

Varios factores pueden guiar tu decisión al momento de elegir entre tipos de bases de datos y productos
de bases de datos relacionales. El RDBMS que se elija dependerá de las necesidades de su negocio.
Hágase las siguientes preguntas:

• ¿Cuáles son nuestros requisitos de precisión de datos? ¿El almacenamiento de datos y la precisión
dependerán de la lógica empresarial? ¿Nuestros datos tienen requisitos estrictos de precisión (por
ejemplo, datos financieros e informes gubernamentales)?
¿Qué buscar a la hora de seleccionar
una base de datos relacional?

• ¿Necesitamos escalabilidad? ¿Cuál es la escala de los datos a administrar y cuál es su crecimiento


previsto? ¿Será necesario que el modelo de base de datos admita copias de base de datos duplicadas
(como instancias separadas) para la escalabilidad? Si es así, ¿puede mantener la consistencia de los datos
en esas instancias?
• ¿Qué tan importante es la concurrencia? ¿Varios usuarios y aplicaciones necesitarán un acceso simultáneo
a los datos? ¿El software de la base de datos admite concurrencia mientras protege los datos?
• ¿Cuáles son nuestras necesidades de rendimiento y confiabilidad? ¿Necesitamos un producto de alto
rendimiento y alta confiabilidad? ¿Cuáles son los requisitos para el rendimiento de la consulta-respuesta?
¿Cuáles son los compromisos de los proveedores para los acuerdos de nivel de servicio (SLA) o tiempo de
inactividad no planificado?
Elementos básicos de una base de
datos relacional
Elementos básicos de una base de
datos relacional
Elementos básicos de una
base de datos relacional

❑ Los datos se organizan en tablas compuestas por filas (registros)


y columnas (campos).
❑ A cada tabla se le asigna un nombre único.
❑ Una tabla tiene 0 o más filas, y cada fila contiene la información de un
determinado ‘sujeto’ de la relación.
❑ Las filas en un principio están desordenadas.
Reglas de Integridad

Integridad se refiere a la corrección o exactitud de la


información contenida en la base de datos. Una base de
datos puede estar sujeta a una serie de restricciones de
integridad de una complejidad arbitraria.

Un ejemplo de integridad:

Un alumno no puede tener más de una matrícula.


Reglas de Integridad

Un dominio de valores posibles puede estar asociado a


Regla de integridad de dominios
cada atributo.
Las reglas de integridad de relación son restricciones que
se deben cumplir en todas las bases de datos
relacionales
Reglas de integridad de relación
Existen dos reglas de integridad asociadas con el modelo
relacional. La integridad de entidad y la integridad
referencial

Las restricciones de entidades aseguran la integridad de


Integridad de entidad las entidades que son modeladas por el sistema
“cada entidad debe estar identificada de forma única”;

Integridad referencial La regla de integridad referencial, no debe contener


valores de clave ajena sin concordancia
Acciones para eliminar y actualizar filas
referenciadas

Restringir: no permitir que una fila se borre si existen


renglones relacionados, ni permitir que se modifique.

Cascada: si se elimina una fila, se deben eliminar


las filas relacionadas
Existen varias acciones posibles para dar respuesta a
la eliminación de una fila referenciada o a la
actualización de la llave primaria de una fila Nulificar: si se elimina una fila, entoses de sebe de
referenciada igualar las filas relacionadas

Por omisión: si se elimina una fila se debe realizar de


la misma manera a las filas que esten relacionadas.
Operadores de algebra relacional

❑ Operadores de restricción (select) y proyección (project)


❑ Restricción: un operador que extrae un subconjunto de filas de la tabla de entrada
satisfaciendo una condición determinada.
❑ La restricción genera un subconjunto de renglones,

❑ Proyección: un operador que extrae un subconjunto específico de columnas de la


tabla de entrada.
❑ La proyección genera un subconjunto de columnas
Comprensión de los
diagramas entidad relación.

Símbolos básicos:
* Tipos de entidad: una colección de entidades de interés representadas por un
rectángulo en un diagrama entidad relación.
* Atributos: es una propiedad de un tipo de entidad o relación . Cada atributo tiene su
tipo de datos, que define el tipo de valor y operaciones permitidas sobre dicho atributo.
* Relación: es una asociación nombrada entre los tipos de entidades. Una relación
representa una asociación de dos sentidos o bidireccional entre entidades. La mayoría de
las relaciones involucran dos distintos tipos de entidades.
* Cardinalidad: es una restricción sobre el número de entidades que participan en una
relación. En una ERD, el numero mínimo y máximo de cardinalidad se especifican cada dos
direcciones de las relaciones.
* Dependencia de existencia: una entidad no puede existir a menos de que exista otra
entidad relacionada . Una relación obligatoria crea una dependencia de la existencia.
*Entidad débil: es un tipo de entidad que pide prestada toda o parte de la llave
primaria de otro tipo de entidad. Las relaciones identificables señalan los tipos de entidades
que proporcionan los componentes de la llave primaria prestada.
Comprensión de los diagramas entidad
relación.

Diagrama de entidad-relación que ilustra los símbolos básicos


Diagrama entidad-relación con la
notación
de las cardinalidades

 Resumen de la clasificación de cardinalidades


Notación de pata de cuervo
Relaciones opcionales para
ambos tipos de entidad

Ejemplos de relaciones M-N y 1-1


Comparación con los diagramas de bases
de datos relacionales

 Los diagramas de bases de datos relacionales no usan nombres para las


relaciones. En su lugar, las llaves foráneas representan relaciones
 Los diagramas de bases de datos relacionales sólo muestran las
cardinalidades máximas.
 Los diagramas de bases de datos relacionales sólo permiten que las tablas
tengan columnas.
 Los diagramas de bases de datos relacionales permiten una relación entre
dos tablas
 En algunas notaciones ERD, la posición de las cardinalidades es inversa.
Identificación de dependencias
(entidades débiles y relación identificable)

 La identificación de dependencias ocurre porque algunas entidades se


relacionan demasiado con otras.
Patrones de relaciones
 Relaciones M-N adicionales con
atributos: Esta situación típicamente
ocurre con las relaciones M-N. En
una relación M-N, los atributos se
asocian con la combinación de los
tipos de entidad, y no sólo con uno
de los tipos de entidad.

 Relación 1-M con un atributo:


también pueden tener atributos,
pero las relaciones 1-M con
atributos son mucho menos
comunes que las relaciones M-N
con atributos
Patrones de relaciones

 Relación autorreferenciada (unitaria):


una relación que incluye el mismo tipo
de entidad. Las relaciones
autorreferenciadas representan
asociaciones entre los miembros del
mismo conjunto.

Diagramas de instancias
para relaciones
autorreferenciadas
Desarrollo de modelos de datos para la base de
datos de un negocio

Resumen de las reglas


de negocio en un ERD
Desarrollo de modelos de
datos para la base de datos
de un negocio

Reglas de consistencia
e integridad
Diseño de bases de datos
relacionales
En las bases de datos se ha establecido un ciclo de desarrollo que consta de tres
etapas de diseño:
• El diseño conceptual
• El diseño lógico
• El diseño físico
Etapas de diseño

 Diseño conceptual:
 Su objetivo es definir las entidades y las relaciones
entre ellos de forma abstracta, sin centrarse en
ningún modelo lógico en concreto
 Herramienta: Modelo conceptual de datos. Se usa
alguna variante del modelo entidad-relación para las
bases de datos relacionales.
 Resultado: Esquema conceptual de la base de datos.
Diseño conceptual

 En este apartado se estudia el modelo entidad-relación que permite


diseñar el esquema conceptual de una BD, y es muy adecuado para las
BDs relacionales. Su resultado es un diagrama entidad-relación.
 Entidad
 Atributo
 Clave
 Tipo de entidad
 Relación
 Tipos de relaciones
Etapas de diseño
 Diseño lógico:
Su objetivo es definir el esquema de la base de datos según el
modelo que implementa
Herramienta: Modelo lógico de datos. Se usa el modelo lógico que
implemente el sistema de gestión de bases de datos objetivo, pero es
independiente de los aspectos físicos. Se usan técnicas formales para
verificar la calidad del esquema lógico; la más usual es la normalización. En
el modelo relacional se usan las tablas
Resultado: Esquema lógico de la base de datos.
Diseño lógico
 El diseño lógico es la segunda etapa del diseño de bases de datos en general y de
las bases de datos relacionales en particular. En nuestro caso, las BD relacionales, el
resultado de esta etapa es un esquema relacional basado en un modelo
relacional.
 Entidad
 Atributo
 Esquema de una relación
 Conjunto de entidades (relación o tabla)
 Clave
 Instancia de una relación
Etapas de diseño

 Diseño físico
 Su objetivo es definir el esquema físico de la base de datos de forma que se
den todas las instrucciones para que un DBA pueda implementar la base de
datos sin ninguna ambigüedad. Se considera el rendimiento como un
aspecto que no se ha tratado en las etapas anteriores.
 Herramienta: Modelo físico de datos. Se consideran todos los detalles de la
implementación física: organización de archivos e índices para el SGBD
considerado.
 Resultado: Esquema físico de la base de datos.
Diseño físico

 El objetivo del diseño físico es la generación del esquema físico de la base


de datos en el modelo de datos que implementa el SGBD. Esto incluye la
definición sobre el SGBD de las tablas con sus campos, la imposición de
todas las restricciones de integridad y la definición de índices.
 Los índices son estructuras de datos implementadas con ficheros que
permiten un acceso más eficaz a los datos.
 Todas las claves primarias llevan asociado un índice de forma
predeterminada
El modelo relacional

 En el modelo relacional las dos capas de diseño conceptual y lógico, se


parecen mucho. Generalmente se implementan mediante diagramas de
Entidad/Relación (modelo conceptual) y tablas y relaciones entre éstas
(modelo lógico). Este es el modelo utilizado por los sistemas gestores de
datos más habituales (SQL Server, Oracle, MySQL...).
El modelo relacional de
bases de datos se rige por
algunas normas sencillas:

1. Todos los datos se representan en forma de tablas (también llamadas “relaciones”, ver nota
anterior). Incluso los resultados de consultar otras tablas. La tabla es además la unidad de
almacenamiento principal.
2. Las tablas están compuestas por filas (o registros) y columnas (o campos) que almacenan cada
uno de los registros (la información sobre una entidad concreta, considerados una unidad).
3. Las filas y las columnas, en principio, carecen de orden a la hora de ser almacenadas. Aunque
en la implementación del diseño físico de cada SGBD esto no suele ser así. Por ejemplo, en SQL
Server si añadimos una clave de tipo "Clustered" a una tabla haremos que los datos se ordenen
físicamente por el campo correspondiente.
4. El orden de las columnas lo determina cada consulta (que se realizan usando SQL).
5. Cada tabla debe poseer una clave primaria, esto es, un identificador único de cada registro
compuesto por una o más columnas.
6. Para establecer una relación entre dos tablas es necesario incluir, en forma de columna, en una
de ellas la clave primaria de la otra. A esta columna se le llama clave externa. Ambos
conceptos de clave son extremadamente importantes en el diseño de bases de datos.
Modelo lógico

 Una vez tenemos claro el modelo E-R debemos traducirlo a


un modelo lógico directamente en el propio sistema gestor
de bases de datos (Oracle, MySQL, SQL Server...).
 Entonces, todo este modelo conceptual se traduce en
un modelo lógico que trasladaremos a la base de datos
concreta que estemos utilizando y que generalmente será
muy parecido
Según Thomas H. Grayson, un buen diseño de base de datos debe
poseer siempre las siguientes cualidades, aunque algunas puede
llegar a ser contradictorias entre sí:

1. Reflejar la estructura del problema en el mundo real.


2. Ser capaz de representar todos los datos esperados, incluso con el paso
del tiempo.
3. Evitar el almacenamiento de información redundante.
4. Proporcionar un acceso eficaz a los datos.
5. Mantener la integridad de los datos a lo largo del tiempo.
6. Ser claro, coherente y de fácil comprensión.
Anomalías de modificación
 Un buen diseño de base de datos se cerciora de que los usuarios puedan modificar los
contenidos de la base sin tener efectos colaterales inesperados.
 También una buena base de datos evita las anomalías de modificación eliminando las
redundancias excesivas.

 Tipos de anomalías:
 De inserción: se presenta cuando se agregan datos adicionales además de los requeridos por las
bases de datos.
 De actualización: ocurre cuando es necesario modificar varias filas para un solo hecho.
 De eliminación: ocurre cuando una sola fila y de forma indebida ocasiona que se borren otros
datos.
Dependencias funcionales

 Son poderosas herramientas cuando se analiza una tabla en la búsqueda de


redundancia innecesaria.
 Se clasifican:
 Valor-base : involucra una comparación de una columna con una constante usando un
operador de comparación como <, = o >.
 Valor-neutral: involucra una comparación de columnas por ejemplo llaves primarias y
foráneas.
Formas normales
 Es el proceso de eliminación de redundancias en una tabla para que sea más fácil de
modificar.
 Es una regla sobre las dependencias permisibles. Cada forma normal elimina cierto
tipo de redundancias.
Procedimiento de síntesis simple.

 La palabra síntesis significa que las dependencias funcionales individuales se combinan para
construir tablas.
 Pasos:
 Elimine las columna ajenas a mano izquierda de FD
 Elimine las FD derivadas de la lista de FD
 Acomode las FD en grupos en los que cada uno tenga el mismo determinante.
 Para cada grupo de FD, haga una tabla en donde el determinante sea la llave primaria.
 Combine las tablas en las que una tabla contenga todas las columnas de la otra tabla.
 Elija la llave primaria de una de las tablas separadas como la llave primaria de la nueva tabla combinada .

 Defina las restricciones de exclusividad para el resto de las llaves primarias que no fueron designadas como la
llave primaria de la tabla nueva
Interdependencia de Relación
 La relación que puede derivarse de dos relaciones independientes.
 Es similar al de independencia estadística. Si dos relaciones son independientes (es
decir, que no están relacionadas entre sí), es redundante almacenar datos acerca de
una tercera relación.
Dependencias multivaluadas y
cuarta forma normal
 En la terminología de bases de datos relacionales, una relación que puede
derivarse de otras relaciones se conoce como dependencia multivaluada
(MVD, por sus siglas en inglés).
 Una MVD implica tres columnas.
 Las MVD pueden ocasionar redundancias por la independencia que hay
entre las columnas.
Ventajas de la normalización como
herramientas de refinamiento

 Se utiliza la normalización para eliminar las redundancias después de la conversión de un ERD a


una tabla de diseño en lugar de una herramienta inicial de diseño:
 Es más fácil traducir los requisitos en un ERD en lugar de las listas de FD.
 Son menos las FD por especificar porque la mayor parte de éstas se derivan de llaves primarias.
 Son menos las tablas a dividir porque la normalización se llevó a cabo de manera intuitiva durante el
desarrollo del ERD.
 Es más fácil identificar las relaciones, especialmente las relaciones M-N sin atributos.
Problemas de enlaces normales
 Este ejemplo se encuentra en tu libro en la pág. 240. La cual habla de un caso completo
de diseño de una base de datos , incluyendo el modelo de la base de datos, la
conversión de esquema y la normalización.
Problemas de enlaces normales
Problemas de
enlaces normales

Diagrama de
entidad relación
Niveles de almacenamiento de las bases de datos
 El nivel de almacenamiento está más cerca del hardware y del sistema operativo.
 En el nivel de almacenamiento, una base de datos está formada de registros físicos
(también conocidos como bloques o páginas) organizados en archivos.
 Un registro físico:
 Es un conjunto de bytes que se transfieren entre el almacenamiento volátil de la memoria principal
y el almacenamiento fijo de un disco.
 A la memoria principal se le considera como almacenamiento volátil porque los
contenidos de la memoria principal se pueden perder si ocurre alguna falla.
 Un archivo es:
 Un conjunto de registros físicos organizados para conseguir un acceso eficiente.
Transferencia de
registros físicos
Objetivos y restricciones

 El objetivo del diseño físico de bases de datos es minimizar los tiempos de respuesta
para acceder y modificar una base de datos.
 Los recursos que consume el procesamiento de la base de datos son la transferencia
de registros físicos, las operaciones de la unidad central de procesamiento (CPU), la
memoria principal y el espacio en disco.
 El número de accesos a los registros físicos limita el desempeño de la mayoría de las
aplicaciones de bases de datos.
 La velocidad del acceso a disco se mide en milisegundos (milésimas de un segundo),
mientras que el acceso a la memoria se mide en nanosegundos (millonésimas de un
segundo).
 El objetivo del diseño físico de bases de datos es minimizar la medida combinada
para todas las aplicaciones que usan la base de datos. Por lo general, las mejoras en
el desempeño de las aplicaciones de recuperación ocasionan un gasto en las
aplicaciones de actualización y viceversa.
Entradas, salidas y entorno

 El diseño físico de bases de datos está formado por varias entradas y salidas distintas.
 El punto de partida es el diseño de tablas a partir de la fase del diseño lógico.
 Los perfiles de las tablas y aplicaciones se usan específicamente para el diseño físico de
bases de datos.
Dificultades

 La dificultad se debe al número de decisiones, relaciones entre las decisiones, entradas detalladas,
complejidad del entorno e incertidumbre para predecir los accesos a los registros físicos. Como:
 El número de posibles opciones a disposición del diseñador puede ser grande. Para bases de datos que
tengan muchas columnas, el número de posibles opciones puede ser demasiado grande como para
evaluarlo, incluso con computadoras grandes.
 Las decisiones no se pueden hacer de forma aislada entre ellas. Por ejemplo, las decisiones sobre la
estructura de archivos de una tabla pueden influir en las decisiones de otras tablas.
 La calidad de las decisiones se limita a la precisión de los perfiles de las tablas y aplicaciones. Sin embargo,
estas entradas pueden ser difíciles de obtener. Además, las entradas se modifican con el tiempo, por lo que
es necesaria su obtención periódica.
 La calidad de las decisiones se limita a la precisión de los perfiles de las tablas y aplicaciones. Sin embargo,
estas entradas pueden ser difíciles de obtener. Además, las entradas se modifican con el tiempo, por lo que
es necesaria su obtención periódica.
 El número de accesos a los registros físicos es difícil de predecir dada la incertidumbre de los contenidos de
los búfers del DBMS. La incertidumbre surge debido a que la combinación de aplicaciones que acceden a
la base de datos cambia constantemente.
Entradas del diseño físico de bases de datos

 El diseño físico de bases de datos requiere de entradas específicas con detalles suficientes. Las
entradas no especificadas con el detalle suficiente pueden llevar a tomar pobres decisiones en el
diseño físico de bases de datos y la optimización de consultas.
 Perfiles de las tablas
 El perfil de una tabla resume una tabla como un todo, las columnas dentro de la tabla y la relación entre las tablas.

 Perfiles de la aplicación
 Los perfiles de las aplicaciones resumen las consultas, formularios y reportes que acceden a una base de datos.
Perfiles de las tablas
Perfiles de las tablas
Estructura de archivos
 La selección entre estructuras de archivos alternativas es una de las decisiones más
importantes del diseño físico de bases de datos.
 Archivos Secuenciales
 El tipo más simple de estructura de archivos almacena los registros lógicos en el orden en el que se insertaron.
 Los registros lógicos nuevos se agregan después del último registro físico del archivo.
 La principal ventaja de los archivos secuenciales desordenados es la inserción rápida.
 De forma alternativa, los registros lógicos nuevos siempre se pueden insertar en el último registro físico.
Estructura de archivos

 Archivos hash
 En contraste con los archivos secuenciales, soportan el acceso rápido a los registros mediante el
valor de la llave primaria.
 La idea básica detrás de los archivos hash es una función que convierta el valor de una llave en la
dirección de un registro físico.
Estructura de archivos
 Archivos de árbol multiforme
 Los archivos secuenciales y archivos hash proporcionan un buen desempeño en algunas
operaciones pero un pobre desempeño en otras.
 Los archivos secuenciales se desempeñan bien en búsquedas secuenciales pero mal en
búsquedas con llaves.
 Los archivos hash se desempeñan bien en búsquedas con llaves pero mal en búsquedas
secuenciales.
 El árbol multiforme, o Btree, como se conoce popularmente, es una estructura de archivos
ampliamente utilizada.
 Btree proporciona buen desempeño tanto en búsquedas secuenciales como con llaves.
Índice bitmap
 Estructura secundaria de archivos consistente en un valor de columna y un bitmap.
 Un bitmap contiene una posición de bit para cada fila de la tabla referenciada.
 Un índice de columna bitmap hace referencia a las filas que contienen el valor de la
columna.
 Un índice bitmap de enlace hace referencia a las filas de una tabla hija que se une
con filas de la tabla madre contenidas en la columna.
 Los índices bitmap funcionan correctamente para columnas estables con algunos
valores típicos de tablas en un almacén de datos.
Opciones adicionales del diseño físico
de la base de datos

 Aunque la selección de índices es la decisión más importante del


diseño físico de las bases de datos, existen otras decisiones que
pueden mejorar el desempeño de manera significativa.
 Diseños normalizados
 Tienen un mejor desempeño para las actualizaciones.
 Requieren menos código para obligar a que se cumplan las restricciones de
integridad.
 Soportan más índices para mejorar el desempeño de las consultas.
Opciones adicionales del diseño físico de la base
de datos
 Desnormalización
La desnormalización combina tablas para que sean más fáciles de consultar. Después de
combinar las tablas, la nueva tabla puede violar alguna de las formas normales.
La desnormalización siempre debe hacerse con mucho cuidado ya que un diseño normalizado
tiene importantes ventajas.
 Grupos de repetición: es un conjunto de valores asociados como la historia de las ventas, los elementos de una orden,
o el historial de pagos.
 Jerarquías de generalización: Si se sigue la regla de conversión de jerarquías de generalización se pueden obtener
muchas tablas. Si las consultas necesitan combinar regularmente estas tablas separadas, es factible almacenarlas
como una sola tabla.
 Códigos y significados. Las reglas de normalización requieren que las llaves foráneas se almacenen en forma aislada
para representar las relaciones 1-M. Si una llave foránea representa un código, generalmente el usuario necesita un
nombre asociado o descripción, además del valor de la llave foránea. La desnormalización puede ser una opción
razonable si la columna del nombre o de la descripción no cambia de forma constante
Opciones adicionales del diseño físico de la base
de datos
Opciones adicionales del diseño físico de la base
de datos
Opciones adicionales del diseño físico de la base
de datos
Opciones adicionales del diseño físico de la base
de datos
Opciones adicionales del diseño físico de la base
 Formatos de registro de datos
 Las decisiones sobre el formateo de registros incluyen la compresión y datos derivados
 La compresión se está convirtiendo en un elemento importante con mayor énfasis en el
almacenamiento de tipos de datos complejos, tales como audio, video e imágenes.
 La compresión tiene sus ventajas y desventajas con respecto al esfuerzo del procesamiento de
entradas-salidas.
 La compresión reduce el número de registros físicos transferidos, pero puede requerir de un esfuerzo de
procesamiento considerable para comprimir y descomprimir los datos.
 Procesamiento paralelo
 El desempeño se puede mejorar de forma significativa al efectuar operaciones de recuperación y
modificación a través del procesamiento paralelo. Las recuperaciones que involucren muchos
registros se pueden mejorar al leer los registros físicos en paralelo.
 La distribución es un concepto importante del almacenamiento RAID. La distribución incluye la
colocación de los registros físicos en distintos discos.
 Una distribución es un conjunto de registros físicos que pueden leerse o escribirse en paralelo.
 RAID es: una colección de discos (un arreglo de discos) que operan como un solo disco. Soporta
operaciones de lectura y escritura en paralelo comuna alta confiabilidad.
Comprensión de los diagramas entidad relación.

Símbolos básicos:
* Tipos de entidad: una colección de entidades de interés representadas por un rectángulo
en un diagrama entidad relación.

* Atributos: es una propiedad de un tipo de entidad o relación . Cada atributo tiene su tipo
de datos, que define el tipo de valor y operaciones permitidas sobre dicho atributo.

* Relación: es una asociación nombrada entre los tipos de entidades. Una relación
representa una asociación de dos sentidos o bidireccional entre entidades. La mayoría de las
relaciones involucran dos distintos tipos de entidades.

* Cardinalidad: es una restricción sobre el número de entidades que participan en una


relación. En una ERD, el numero mínimo y máximo de cardinalidad se especifican cada dos
direcciones de las relaciones.
Comprensión de los
diagramas entidad relación.

Símbolos básicos:
* Dependencia de existencia: una entidad no puede existir a menos de que
exista otra entidad relacionada . Una relación obligatoria crea una
dependencia de la existencia.

*Entidad débil: es un tipo de entidad que pide prestada toda o parte de la llave
primaria de otro tipo de entidad. Las relaciones identificables señalan los tipos
de entidades que proporcionan los componentes de la llave primaria prestada.
Comprensión de los diagramas entidad relación.

Diagrama de entidad-relación que ilustra los símbolos básicos


Comprensión de los diagramas entidad relación.

Diagrama de
instancias
para la relación
Has
Diagrama entidad-relación con la notación
de las cardinalidades

 Resumen de la clasificación de cardinalidades


Relaciones opcionales para
ambos tipos de entidad

Ejemplos de relaciones M-N y 1-1


Comparación con los diagramas de
bases
de datos relacionales

 Los diagramas de bases de datos relacionales no usan nombres para las


relaciones. En su lugar, las llaves foráneas representan relaciones
 Los diagramas de bases de datos relacionales sólo muestran las
cardinalidades máximas.
 Los diagramas de bases de datos relacionales sólo permiten que las tablas
tengan columnas.
 Los diagramas de bases de datos relacionales permiten una relación entre
dos tablas
 En algunas notaciones ERD, la posición de las cardinalidades es inversa.
Identificación de dependencias
(entidades débiles y relación identificable)

 La identificación de dependencias ocurre porque algunas entidades se


relacionan demasiado con otras.
Patrones de relaciones

 Relaciones M-N adicionales con


atributos: Esta situación típicamente
ocurre con las relaciones M-N. En
una relación M-N, los atributos se
asocian con la combinación de los
tipos de entidad, y no sólo con uno
de los tipos de entidad.

 Relación 1-M con un atributo:


también pueden tener atributos,
pero las relaciones 1-M con
atributos son mucho menos
comunes que las relaciones M-N
con atributos
Patrones de relaciones
 Relación autorreferenciada (unitaria):
una relación que incluye el mismo tipo
de entidad. Las relaciones
autorreferenciadas representan
asociaciones entre los miembros del
mismo conjunto.

Diagramas de instancias
para relaciones
autorreferenciadas
Notación de pata de cuervo
Desarrollo de modelos de datos para la base de
datos de un negocio

Resumen de las reglas


de negocio en un ERD
Desarrollo de modelos
de datos para la base
de datos de un
negocio

Reglas de consistencia
e integridad
Diseño de bases de datos
relacionales

En las bases de datos se ha establecido un ciclo de desarrollo que consta de tres


etapas de diseño:
• El diseño conceptual
• El diseño lógico
• El diseño físico
Etapas de diseño
 Diseño conceptual:
 Su objetivo es definir las entidades y las relaciones entre ellos de forma
abstracta, sin centrarse en ningún modelo lógico en concreto
 Herramienta: Modelo conceptual de datos. Se usa alguna variante del
modelo entidad-relación para las bases de datos relacionales.
 Resultado: Esquema conceptual de la base de datos.
Diseño conceptual
 En este apartado se estudia el modelo entidad-relación que permite
diseñar el esquema conceptual de una BD, y es muy adecuado para las
BDs relacionales. Su resultado es un diagrama entidad-relación.
 Entidad
 Atributo
 Clave
 Tipo de entidad
 Relación
 Tipos de relaciones
Etapas de diseño
 Diseño lógico:
Su objetivo es definir el esquema de la base de datos según el
modelo que implementa
Herramienta: Modelo lógico de datos. Se usa el modelo lógico que
implemente el sistema de gestión de bases de datos objetivo, pero es
independiente de los aspectos físicos. Se usan técnicas formales para
verificar la calidad del esquema lógico; la más usual es la normalización. En
el modelo relacional se usan las tablas
Resultado: Esquema lógico de la base de datos.
Diseño lógico

 El diseño lógico es la segunda etapa del diseño de bases de datos en general y de las
bases de datos relacionales en particular. En nuestro caso, las BD relacionales, el
resultado de esta etapa es un esquema relacional basado en un modelo relacional.
 Entidad
 Atributo
 Esquema de una relación
 Conjunto de entidades (relación o tabla)
 Clave
 Instancia de una relación
Etapas de diseño
 Diseño físico
 Su objetivo es definir el esquema físico de la base de datos de forma que
se den todas las instrucciones para que un DBA pueda implementar la
base de datos sin ninguna ambigüedad. Se considera el rendimiento como
un aspecto que no se ha tratado en las etapas anteriores.
 Herramienta: Modelo físico de datos. Se consideran todos los detalles de la
implementación física: organización de archivos e índices para el SGBD
considerado.
 Resultado: Esquema físico de la base de datos.
Diseño físico

 El objetivo del diseño físico es la generación del esquema físico de la base


de datos en el modelo de datos que implementa el SGBD. Esto incluye la
definición sobre el SGBD de las tablas con sus campos, la imposición de
todas las restricciones de integridad y la definición de índices.
 Los índices son estructuras de datos implementadas con ficheros que
permiten un acceso más eficaz a los datos.
 Todas las claves primarias llevan asociado un índice de forma
predeterminada
El modelo relacional

 En el modelo relacional las dos capas de diseño conceptual y lógico, se


parecen mucho. Generalmente se implementan mediante diagramas de
Entidad/Relación (modelo conceptual) y tablas y relaciones entre éstas
(modelo lógico). Este es el modelo utilizado por los sistemas gestores de
datos más habituales (SQL Server, Oracle, MySQL...).
El modelo relacional de bases de
datos se rige por algunas normas
sencillas:
1. Todos los datos se representan en forma de tablas (también llamadas “relaciones”, ver nota
anterior). Incluso los resultados de consultar otras tablas. La tabla es además la unidad de
almacenamiento principal.
2. Las tablas están compuestas por filas (o registros) y columnas (o campos) que almacenan cada
uno de los registros (la información sobre una entidad concreta, considerados una unidad).
3. Las filas y las columnas, en principio, carecen de orden a la hora de ser almacenadas. Aunque
en la implementación del diseño físico de cada SGBD esto no suele ser así. Por ejemplo, en SQL
Server si añadimos una clave de tipo "Clustered" a una tabla haremos que los datos se ordenen
físicamente por el campo correspondiente.
4. El orden de las columnas lo determina cada consulta (que se realizan usando SQL).
5. Cada tabla debe poseer una clave primaria, esto es, un identificador único de cada registro
compuesto por una o más columnas.
6. Para establecer una relación entre dos tablas es necesario incluir, en forma de columna, en una
de ellas la clave primaria de la otra. A esta columna se le llama clave externa. Ambos
conceptos de clave son extremadamente importantes en el diseño de bases de datos.
Modelo lógico

 Una vez tenemos claro el modelo E-R debemos


traducirlo a un modelo lógico directamente en
el propio sistema gestor de bases de datos
(Oracle, MySQL, SQL Server...).
 Entonces, todo este modelo conceptual se
traduce en un modelo lógico que
trasladaremos a la base de datos concreta
que estemos utilizando y que generalmente
será muy parecido
Según Thomas H. Grayson, un buen diseño de base de datos debe
poseer siempre las siguientes cualidades, aunque algunas puede
llegar a ser contradictorias entre sí:

1. Reflejar la estructura del problema en el mundo real.


2. Ser capaz de representar todos los datos esperados, incluso con el paso
del tiempo.
3. Evitar el almacenamiento de información redundante.
4. Proporcionar un acceso eficaz a los datos.
5. Mantener la integridad de los datos a lo largo del tiempo.
6. Ser claro, coherente y de fácil comprensión.
Anomalías de
modificación
 Un buen diseño de base de datos se cerciora de que los usuarios puedan modificar los
contenidos de la base sin tener efectos colaterales inesperados.
 También una buena base de datos evita las anomalías de modificación eliminando las
redundancias excesivas.

 Tipos de anomalías:
 De inserción: se presenta cuando se agregan datos adicionales además de los requeridos por las
bases de datos.
 De actualización: ocurre cuando es necesario modificar varias filas para un solo hecho.
 De eliminación: ocurre cuando una sola fila y de forma indebida ocasiona que se borren otros
datos.
Dependencias
funcionales

 Son poderosas herramientas cuando se analiza una tabla en la búsqueda de


redundancia innecesaria.
 Se clasifican:
 Valor-base : involucra una comparación de una columna con una constante usando un
operador de comparación como <, = o >.
 Valor-neutral: involucra una comparación de columnas por ejemplo llaves primarias y
foráneas.
Formas normales
 Es el proceso de eliminación de redundancias en una tabla para que sea más fácil de
modificar.
 Es una regla sobre las dependencias permisibles. Cada forma normal elimina cierto
tipo de redundancias.
Procedimiento de
síntesis simple.

 La palabra síntesis significa que las dependencias funcionales individuales se combinan para
construir tablas.
 Pasos:
 Elimine las columna ajenas a mano izquierda de FD
 Elimine las FD derivadas de la lista de FD
 Acomode las FD en grupos en los que cada uno tenga el mismo determinante.
 Para cada grupo de FD, haga una tabla en donde el determinante sea la llave primaria.
 Combine las tablas en las que una tabla contenga todas las columnas de la otra tabla.
 Elija la llave primaria de una de las tablas separadas como la llave primaria de la nueva tabla combinada .

 Defina las restricciones de exclusividad para el resto de las llaves primarias que no fueron designadas como la
llave primaria de la tabla nueva
Interdependencia de
Relación

 La relación que puede derivarse de dos relaciones independientes.


 Es similar al de independencia estadística. Si dos relaciones son independientes (es
decir, que no están relacionadas entre sí), es redundante almacenar datos acerca de
una tercera relación.
Dependencias multivaluadas
y cuarta forma normal

 En la terminología de bases de datos relacionales, una relación que puede


derivarse de otras relaciones se conoce como dependencia multivaluada
(MVD, por sus siglas en inglés).
 Una MVD implica tres columnas.
 Las MVD pueden ocasionar redundancias por la independencia que hay
entre las columnas.
Ventajas de la normalización
como herramientas de
refinamiento

 Se utiliza la normalización para eliminar las redundancias después de la conversión de un ERD a


una tabla de diseño en lugar de una herramienta inicial de diseño:
 Es más fácil traducir los requisitos en un ERD en lugar de las listas de FD.
 Son menos las FD por especificar porque la mayor parte de éstas se derivan de llaves primarias.
 Son menos las tablas a dividir porque la normalización se llevó a cabo de manera intuitiva durante el
desarrollo del ERD.
 Es más fácil identificar las relaciones, especialmente las relaciones M-N sin atributos.
Problemas de enlaces normales
 Este ejemplo se encuentra en tu libro en la pág. 240. La cual habla de un caso completo
de diseño de una base de datos , incluyendo el modelo de la base de datos, la
conversión de esquema y la normalización.
Problemas de enlaces
normales
Problemas de
enlaces normales

Diagrama de
entidad relación
Niveles de almacenamiento de las bases de datos
 El nivel de almacenamiento está más cerca del hardware y del sistema operativo.
 En el nivel de almacenamiento, una base de datos está formada de registros físicos
(también conocidos como bloques o páginas) organizados en archivos.
 Un registro físico:
 Es un conjunto de bytes que se transfieren entre el almacenamiento volátil de la memoria principal
y el almacenamiento fijo de un disco.
 A la memoria principal se le considera como almacenamiento volátil porque los
contenidos de la memoria principal se pueden perder si ocurre alguna falla.
 Un archivo es:
 Un conjunto de registros físicos organizados para conseguir un acceso eficiente.
Transferencia de
registros físicos
Objetivos y restricciones

 El objetivo del diseño físico de bases de datos es minimizar los tiempos de respuesta
para acceder y modificar una base de datos.
 Los recursos que consume el procesamiento de la base de datos son la transferencia
de registros físicos, las operaciones de la unidad central de procesamiento (CPU), la
memoria principal y el espacio en disco.
 El número de accesos a los registros físicos limita el desempeño de la mayoría de las
aplicaciones de bases de datos.
 La velocidad del acceso a disco se mide en milisegundos (milésimas de un segundo),
mientras que el acceso a la memoria se mide en nanosegundos (millonésimas de un
segundo).
 El objetivo del diseño físico de bases de datos es minimizar la medida combinada
para todas las aplicaciones que usan la base de datos. Por lo general, las mejoras en
el desempeño de las aplicaciones de recuperación ocasionan un gasto en las
aplicaciones de actualización y viceversa.
Entradas, salidas y entorno
 El diseño físico de bases de datos está formado por varias entradas y salidas distintas.
 El punto de partida es el diseño de tablas a partir de la fase del diseño lógico.
 Los perfiles de las tablas y aplicaciones se usan específicamente para el diseño físico de
bases de datos.
Dificultades

 La dificultad se debe al número de decisiones, relaciones entre las decisiones, entradas detalladas,
complejidad del entorno e incertidumbre para predecir los accesos a los registros físicos. Como:
 El número de posibles opciones a disposición del diseñador puede ser grande. Para bases de datos que
tengan muchas columnas, el número de posibles opciones puede ser demasiado grande como para
evaluarlo, incluso con computadoras grandes.
 Las decisiones no se pueden hacer de forma aislada entre ellas. Por ejemplo, las decisiones sobre la
estructura de archivos de una tabla pueden influir en las decisiones de otras tablas.
 La calidad de las decisiones se limita a la precisión de los perfiles de las tablas y aplicaciones. Sin embargo,
estas entradas pueden ser difíciles de obtener. Además, las entradas se modifican con el tiempo, por lo que
es necesaria su obtención periódica.
 La calidad de las decisiones se limita a la precisión de los perfiles de las tablas y aplicaciones. Sin embargo,
estas entradas pueden ser difíciles de obtener. Además, las entradas se modifican con el tiempo, por lo que
es necesaria su obtención periódica.
 El número de accesos a los registros físicos es difícil de predecir dada la incertidumbre de los contenidos de
los búfers del DBMS. La incertidumbre surge debido a que la combinación de aplicaciones que acceden a
la base de datos cambia constantemente.
Entradas del diseño físico de bases de datos

 El diseño físico de bases de datos requiere de entradas específicas con detalles suficientes. Las
entradas no especificadas con el detalle suficiente pueden llevar a tomar pobres decisiones en el
diseño físico de bases de datos y la optimización de consultas.
 Perfiles de las tablas
 El perfil de una tabla resume una tabla como un todo, las columnas dentro de la tabla y la relación entre las tablas.

 Perfiles de la aplicación
 Los perfiles de las aplicaciones resumen las consultas, formularios y reportes que acceden a una base de datos.
Perfiles de las tablas
Perfiles de las tablas

Estructura de archivos
La selección entre estructuras de archivos alternativas es una de las decisiones más
importantes del diseño físico de bases de datos.
 Archivos Secuenciales
 El tipo más simple de estructura de archivos almacena los registros lógicos en el orden en el que se insertaron.
 Los registros lógicos nuevos se agregan después del último registro físico del archivo.
 La principal ventaja de los archivos secuenciales desordenados es la inserción rápida.
 De forma alternativa, los registros lógicos nuevos siempre se pueden insertar en el último registro físico.
Estructura de archivos

 Archivos hash
 En contraste con los archivos secuenciales, soportan el acceso rápido a los registros mediante el
valor de la llave primaria.
 La idea básica detrás de los archivos hash es una función que convierta el valor de una llave en la
dirección de un registro físico.
Estructura de archivos

 Archivos de árbol multiforme


 Los archivos secuenciales y archivos hash proporcionan un buen desempeño en algunas
operaciones pero un pobre desempeño en otras.
 Los archivos secuenciales se desempeñan bien en búsquedas secuenciales pero mal en
búsquedas con llaves.
 Los archivos hash se desempeñan bien en búsquedas con llaves pero mal en búsquedas
secuenciales.
 El árbol multiforme, o Btree, como se conoce popularmente, es una estructura de archivos
ampliamente utilizada.
 Btree proporciona buen desempeño tanto en búsquedas secuenciales como con llaves.
Índice bitmap
 Estructura secundaria de archivos consistente en un valor de columna y un bitmap.
 Un bitmap contiene una posición de bit para cada fila de la tabla referenciada.
 Un índice de columna bitmap hace referencia a las filas que contienen el valor de la
columna.
 Un índice bitmap de enlace hace referencia a las filas de una tabla hija que se une
con filas de la tabla madre contenidas en la columna.
 Los índices bitmap funcionan correctamente para columnas estables con algunos
valores típicos de tablas en un almacén de datos.
Opciones adicionales del diseño físico
de la base de datos

 Aunque la selección de índices es la decisión más importante del


diseño físico de las bases de datos, existen otras decisiones que
pueden mejorar el desempeño de manera significativa.
 Diseños normalizados
 Tienen un mejor desempeño para las actualizaciones.
 Requieren menos código para obligar a que se cumplan las restricciones de
integridad.
 Soportan más índices para mejorar el desempeño de las consultas.
Opciones adicionales del diseño físico de la base
de datos
 Desnormalización
La desnormalización combina tablas para que sean más fáciles de consultar. Después de
combinar las tablas, la nueva tabla puede violar alguna de las formas normales.
La desnormalización siempre debe hacerse con mucho cuidado ya que un diseño normalizado
tiene importantes ventajas.
 Grupos de repetición: es un conjunto de valores asociados como la historia de las ventas, los elementos de una orden,
o el historial de pagos.
 Jerarquías de generalización: Si se sigue la regla de conversión de jerarquías de generalización se pueden obtener
muchas tablas. Si las consultas necesitan combinar regularmente estas tablas separadas, es factible almacenarlas
como una sola tabla.
 Códigos y significados. Las reglas de normalización requieren que las llaves foráneas se almacenen en forma aislada
para representar las relaciones 1-M. Si una llave foránea representa un código, generalmente el usuario necesita un
nombre asociado o descripción, además del valor de la llave foránea. La desnormalización puede ser una opción
razonable si la columna del nombre o de la descripción no cambia de forma constante
Opciones adicionales del diseño físico de la base
de datos
Opciones adicionales del diseño físico de la base
de datos
Opciones adicionales del diseño físico de la base
de datos
Opciones adicionales del diseño físico de la base
de datos
Opciones adicionales del diseño físico de la base
de datos
 Formatos de registro
 Las decisiones sobre el formateo de registros incluyen la compresión y datos derivados
 La compresión se está convirtiendo en un elemento importante con mayor énfasis en el
almacenamiento de tipos de datos complejos, tales como audio, video e imágenes.
 La compresión tiene sus ventajas y desventajas con respecto al esfuerzo del procesamiento de
entradas-salidas.
 La compresión reduce el número de registros físicos transferidos, pero puede requerir de un esfuerzo de
procesamiento considerable para comprimir y descomprimir los datos.
 Procesamiento paralelo
 El desempeño se puede mejorar de forma significativa al efectuar operaciones de recuperación y
modificación a través del procesamiento paralelo. Las recuperaciones que involucren muchos
registros se pueden mejorar al leer los registros físicos en paralelo.
 La distribución es un concepto importante del almacenamiento RAID. La distribución incluye la
colocación de los registros físicos en distintos discos.
 Una distribución es un conjunto de registros físicos que pueden leerse o escribirse en paralelo.
 RAID es: una colección de discos (un arreglo de discos) que operan como un solo disco. Soporta
operaciones de lectura y escritura en paralelo comuna alta confiabilidad.
Biblioteca
1. Cree una base de datos nueva con el nombre:
“Biblioteca”
2. Agregue las siguientes tablas definidas a continuación:

Tabla: Libros

Campo Tipo Tamaño/Formato Observaciones

Id Libro Autonumérico Clave Principal

Título Texto 80

Autor Texto 50

Género Texto 10

Prestado Sí/No
Tabla: Préstamos
Campo Tipo Tamaño/Formato Observaciones

Nro Préstamo Autonumérico Clave Principal

Fecha préstamo Fecha/Hora Fecha corta

Id Libro Número Entero largo

Id Lector Número Entero largo

Fecha devolución Fecha/Hora Fecha corta

Tabla: Lectores

Campo Tipo Tamaño/Formato Observaciones

Id Lector Autonumérico Clave Principal

Nombre Lector Texto 50


CI Número
Dirección Texto 80
Teléfono Texto 10
Abra la base de datos: “Biblioteca” y
establezca las relaciones entre sus tablas.

También podría gustarte