0% encontró este documento útil (0 votos)
540 vistas45 páginas

4.1 Normalización de Base de Datos

El proceso de normalización de una base de datos consiste en aplicar una serie de reglas a las relaciones obtenidas tras el paso del modelo E-R (entidad-relación) al modelo relacional. Las formas normales son aplicadas a las tablas de una base de datos. Decir que una base de datos está en la forma normal N es decir que todas sus tablas están en la forma normal N. En general, las primeras tres formas normales son el mínimo que deben cubrir la mayoría de las bases de datos

Cargado por

healsogo
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
540 vistas45 páginas

4.1 Normalización de Base de Datos

El proceso de normalización de una base de datos consiste en aplicar una serie de reglas a las relaciones obtenidas tras el paso del modelo E-R (entidad-relación) al modelo relacional. Las formas normales son aplicadas a las tablas de una base de datos. Decir que una base de datos está en la forma normal N es decir que todas sus tablas están en la forma normal N. En general, las primeras tres formas normales son el mínimo que deben cubrir la mayoría de las bases de datos

Cargado por

healsogo
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

INGENIERÍA EN TECNOLOGÍAS DE LA INFORMACIÓN Y COMUNICACIONES - 3° SEMESTRE

UNIDAD 4 - NORMALIZACIÓN
PROPÓSITO

Que sepas aplicar las reglas


de la normalización en tu
d i s e ñ o d e b a s e d e d a to s y
así tener integridad y
congruencia en la misma,
id e nti fi c a n d o c a d a u n a d e
l a s fo r m a s n o r m a l e s y l o s
pasos necesarios para ello.
INTRODUCCIÓN A LA NORMALIZACIÓN

 El proceso de normalización de una


base de datos consiste en aplicar una
serie de reglas a las relaciones
obtenidas tras el paso del modelo E-R
(entidad-relación) al modelo
relacional.
 Las formas normales son aplicadas a
las tablas de una base de datos.
 Deci r que una base de dato s está e n
la forma normal N es deci r que to das
sus tablas están en la forma normal N.
 En general, l as pr i mer as tr es fo r mas
normales son el mínimo que deben
cubrir la mayoría de las bases de
datos
HISTORIA Y ANTECEDENTES DE LA FN

El creador de estas 3


primeras formas normales
(o reglas) fue Edgar F. Codd

Edgar Frank Codd se percató


de que existían bases de
datos en el mercado que
decían ser relacionales, pero
lo único que hacían era
guardar la información en
las tablas.
A Relational Model of Data for Large Shared Data Banks Communications of
the ACM, Vol. 13, No. 6, June 1970, pp. 377-387
¿QUÉ ES LA NORMALIZACIÓN DE BASES DE DATOS?

 Es el paso clave tras su creación,


pues evita cualquier tipo de
anomalía, redundancia y borrado
que pudiera haber en el diseño de
tablas y en la relación entre la
información.
 Además, esta técnica permite
definir bases de datos más
naturales y limpias, reduciendo su
tamaño y simplificando la
estructura para que los datos de
producto sean más fáciles de
localizar, contrastar y recuperar
¿QUÉ ES LA NORMALIZACIÓN DE BASES DE DATOS?

 Estas reglas están diseñadas  Cada tabla debe tener un único


para proteger y dar una nombre.
flexibilidad a la base de datos
con el fin de eliminar  No puede haber dos filas
redundancias y dependencias iguales.
incoherentes.
 No está permitido tener
 Para que las tablas de nuestra duplicados.
base de datos estén
normalizadas deben cumplir las  Todos los datos en una
siguientes características: columna deben ser del mismo
tipo.
¿POR QUÉ SE NORMALIZA UNA BASE DE DATOS?

 Evitar la redundancia de datos.


 Proteger la integridad de los datos.
 Reducir el tiempo y complejidad de
revisión de las bases de datos.
 Evitar problemas de actualización
de los datos en las tablas.
 Optimizar el espacio de
almacenamiento.
 Prevenir borrados indeseados de
datos.
ANTES DE COMENZAR A NORMALIZAR...

Debemos dominar bien Cada columna debe tener su


varios conceptos aplicables nombre único.
a la base de datos, desde
que es una base de datos No puede haber dos filas
relacional hasta sus iguales. No se permiten los
características y elementos duplicados.
comunes.
Recuerda que para que una Todos los datos en una
tabla bidimensional sea columna deben ser del
considerada como una mismo tipo.
relación tiene que cumplir
con algunas restricciones:
TERMINOLOGÍA EQUIVALENTE

 Entidad = tabla
 Tupla = registro, fila o renglón
 Atributo = campo o columna
 Clave = llave
 Clave primaria = superclave
 Clave ajena = clave externa o
clave foránea
 RDBMS = del inglés Relational
Data Base Manager System que
significa, Sistema Gestor de Bases
de Datos Relacionales
DEPENDENCIAS FUNCIONALES

 El proceso de normalización se Las dependencias funcionales del sistema se escriben


basa en relaciones que se utilizando una flecha, de la siguiente manera:
conocen que mantienen los
datos, principalmente FechaDeNacimiento -> Edad
dependencias funcionales
 Una dependencia funcional es
una relación entre u n o o más
atributos.
 Por ejemplo, si se conoce el
valor de CURP; tiene una
conexión con Apellido, Nombre,
Nacionalidad, Fecha_Nac...
EJEMPLO DEPENDENCIA FUNCIONAL

CURP APELLIDO_P APELLIDO_M NOMBRE GÉNERO TELÉFONO


SOMR981010MMNRRMAC9 SORIA MARTÍNEZ ROMINA FEMENINO 4382312323
DALC960224HMNVPROP3 DAVILA LÓPEZ CARLOS MASCULINO 4381201234
UNICIDAD

PAIS CIUDAD POBLACIÓN SEMÁFORO


Una restricción de unicidad COVID
es una regla en la que los
valores de una clave MÉXICO CDMX 14,263,101 ROJO

ú n i c a m e n te s o n v á l i d o s s i MÉXICO LEÓN 4,124,114 NARANJA


MÉXICO GUADALAJARA 6,453,123 ROJO
son exclusivos de una tabla.
ESPAÑA TOLEDO 2,192,391 AMARILLO
E s t a b l e c e q u e t o d a c l a v e ESPAÑA GUADALAJARA 3,934,125 AMARILLO
primaria que se elija para
una relación no debe tener
valores repetidos.
La llave primaria compuesta se utiliza para poder
identificar en forma única las lineas de las tablas una
por una
CLAVE/LLAVE CANDIDATA

 Tanto ID_empleado como Seguro § ESTUDIANTE


Social son claves candidatas. Por lo § ID_PERSONA
general la forma más eficiente y
segura para escoger o hacer la clave § CURP
primaria es poniendo un número y § INE
aumentando éste a medida que se van § NSS
añadiendo filas, pero si de casualidad § NUM CONTROL
se diera el caso de que existan varias § ...
claves candidatas de las cuales se
deba escoger la clave primaria, esta
elección se hace utilizando el sentido
común
CLAVE/LLAVE ALTERNATIVA

S o n a q u e l l a s c l a v e s
candidatas que no han sido
elegidas. En el ejemplo
a n t e r i o r N S S , C U R P, I N E
pasarían a ser una clave
alternativa en caso de no
ser elegida como clave
primaria.
LLAVE SIMPLE VS LLAVE COMPUESTA

Clave simple
Es una clave que esta
compuesta solo de un
atributo.

Clave compuesta
Es una clave que esta
compuesta por más de un
atributo
REDUNDANCIA

En bases de datos o en  Incremento del trabajo: como un mismo


d a to e s t á a l m a c e n a d o e n d o s o m á s l u g a r e s , e s to h a c e
ficheros, la redundancia q u e c u a n d o s e g r a b e n o a c t u a l i c e n l o s d a to s , d e b a n
h a c e r s e e n to d o s l o s l u g a r e s a l a v e z .
hace referencia al  Desperdicio de espacio de
almacenamiento de los almacenamiento: y a q u e l o s m i s m o s d a to s
e s t á n a l m a c e n a d o s e n v a r i o s l u g a r e s d i s t i n to s ,
mismos datos varias veces o c u p a n d o a s í m á s b y t e s d e l m e d i o d e a l m a c e n a m i e n to .
Este problema es más evidente en grandes bases de
en diferentes [Link] d a to s .

redundancia de datos puede  Inconsistencia de datos: e s to s u c e d e

provocar problemas como: c u a n d o l o s d a to s r e d u n d a n te s n o s o n i g u a l e s e n t r e


s í . E s to p u e d e s u c e d e r, p o r e j e m p l o , c u a n d o s e
a c t u a l i z a e l d a to e n u n l u g a r, p e ro e l d a to
d u p l i c a d o e n ot ro l u g a r n o e s a c t u a l i z a d o
DUPLICIDAD

Se produce durante el


ingreso de datos al sistema
informático y debe ser
evitada o eliminada.
En la práctica, la duplicidad
de datos es un
inconveniente propio de las
compañías que cuentan con
numerosas aplicaciones
empresariales en silos.
EJEMPLO DE DUPLICIDAD

EN MUCHAS OCASIONES SE GENERA AL ENTRAR DATOS CON


CAMBIOS EN SU CONTENIDO INDETECTABLES.

CURP APELLIDO_P APELLIDO_M NOMBRE GÉNERO TELÉFONO

SOMR981010MMNRRMAC9 SORIA MARTÍNEZ ROMINA FEMENINO 4382312323

DALC960224HMNVPROP3 DAVILA LÓPEZ CARLOS MASCULINO 4381201234

SOMR981010MDFRRMHG1 SORIA MARTÍNEZ ROMINA FEMENINO 5531231459


INTEGRIDAD

 El término integridad de datos


se refiere a la correctitud y
completitud de la información
en una base de datos.
 La integridad de los datos
almacenados puede perderse
de muchas maneras diferentes.
Pueden añadirse datos no
válidos a la base de datos,
tales como un pedido que
especifica un producto no
existente
COMENCEMOS NORMALIZANDO

CABE MENCIONAR QUE EN


ESTA PRESENTACIÓN
VEREMOS HASTA LA
TERCERA FORMA NORMAL
ÚNICAMENTE.

1FN
2FN
3FN
Las primeras tres formas normales son suficientes para cubrir las
necesidades de la mayoría de las bases de datos
1FN (PRIMERA FORMA NORMAL)

Una relación está en Primera Forma


Normal si y sólo si:
 Todos los atributos son atómicos.
 No debe existir variación en el número
de columnas.
Los campos no clave deben
identificarse por la clave
(dependencia funcional).
 Debe existir una independencia del
o r d e n t a n to d e l a s fi l a s c o m o d e l a s
columnas.
Esta fo r ma no r m a l e l i m i n a l o s va l o r e s
repetidos dentro de una base de datos.
APLICAR 1FN: NO DEBEN HABER GRUPOS REPETIDOS

N° Tutor Despacho- clase1 clase2 clase3


Alumno tut
1022 García 412 101-07 143-01 159-02
4123 Díaz 216 201-01 211-02 214-01

N° alumno Tutor Despacho-tut N°clase


1022 Garcia 412 101-07
1022 Garcia 412 143-01
1022 Garcia 412 159-02
4123 Diaz 216 201-01
4123 Diaz 216 211-02
4123 Diaz 216 214-01
EJEMPLO 02:
2FN (SEGUNDA FORMA NORMAL)

 Una relación está en 2FN si está en


1FN y si l o s atr i buto s qu e n o fo r m a n
p a r te d e n i n g u n a c l ave d e p e n d e n d e
forma completa de la clave principal.
Es decir, que no existen dependencias
parciales. Todos los atributos que no
son clave principal deben depender
únicamente de la clave principal.
 En otras palabras, podríamos decir
que la segunda forma normal está
basada en el concepto de
dependencia completamente
funcional.
EJEMPLO 02:
EJEMPLO 03:
EJEMPLO 04:
APLICAR 2FN:SE DEBEN ELIMINAR LOS DATOS
REDUNDANTES

Alumnos:
N°alumno Tutor Despacho-tut
1022 Garcia 412
4123 Diaz 216

Registro:
N°alumno N°clase
1022 101-07
1022 143-01
1022 159-02
4123 201-01
4123 211-02
4123 214-01
3FN (TERCERA FORMA NORMAL)

La tabla se encuentra en


3FN si es 2FN y si
no existe ninguna
dependencia funcional
transitiva en los atributos
que no son clave.
DEPENDENCIA TRANSITIVA

Supongamos que tenemos


una relación con tres
conjuntos de atributos: X, Y
y Z, y las siguientes
Una dependencia transitiva en una base
dependencias X -> Y, Y -> Z,
de datos es una relación indirecta entre
Y -> |X. Es decir X determina valores en la misma tabla que causa una
Y e Y determina Z, pero Y no dependencia funcional. Para lograr el
determina X. En ese caso, estándar de normalización de la Tercera
decimos que Z tiene Forma Normal (3NF), debe eliminar
dependencia transitiva con cualquier dependencia transitiva.
respecto a X, a través de Y.
EJEMPLO 02:
EJEMPLO 03:
EJEMPLO 05: DESARROLLADO
FIN DEL TEMA

También podría gustarte