Normalización de datos
Escuela de Ingeniería
De Sistemas
Base de Datos
2018 Dr. Luis Boy Chavil
1 Reglas de normalización de datos
2018 Dr. Luis Boy Chavil
Normalización de datos
• Reglas bien definidas sobre las entidades que presentan anomalías en
los atributos que las describen. Se pretende eliminar o disminuir al
máximo la redundancia de datos y de datos innecesarios.
2018 Dr. Luis Boy Chavil
Terminología Relacional
Modelo Relacional Programador Usuario
Afinidad Archivo Tabla
Tupla (Fila) Registro Fila
Atributo Campo Columna
2018 Dr. Luis Boy Chavil
Ejemplo
Atributos
NumEmpleado Edad Sexo Nombre
T
010110 21 F Andrés
U 010100 22 M David
P 101000 22 M Grover
L
201100 21 F Josué
111100 19 M Mario
A
111101 20 F Nancy
S
Estructura de la Afinidad: 111111 19 M Eduardo
EMPLEADO(NumEmpleado, Edad, Sexo, Nombre)
2018 Dr. Luis Boy Chavil
Dependencias funcionales
• Es una relación entre uno o más atributos; es decir, si se da el valor de
un atributo se puede obtener o buscar el valor de otro atributo.
• En general:
• El atributo Y depende del atributo X; siempre y cuando el valor de X
determine el valor de Y.
• Notación:
XY (X se llama Determinante!!)
2018 Dr. Luis Boy Chavil
Ejemplo
• IdCliente NombreCliente
• El atributo IdCliente determina funcionalmente al atributo NombreCliente.
• Cuando se conozca el dato IdCliente, se podrá obtener el dato
NombreCliente.
• Otro ejemplo:
• Sea: Importe = Cantidad * Precio
• Entonces:
(Cantidad, Precio) Importe
2018 Dr. Luis Boy Chavil
Dependencias funcionales de atributos concatenados
• Las dependencias funcionales pueden involucrar grupos de atributos.
• Ejemplo:
• Sea: NOTAS(IdAlumno, IdCurso, Semestre, Puntaje)
• La combinación: IdAlumno + IdCurso + Semestre; determina un Puntaje.
• Entonces:
• (IdAlumno, IdCurso, Semestre) Puntaje
2018 Dr. Luis Boy Chavil
Regla de transitividad
• Si X(Y, Z) ; Entonces: XY ^ X Z
• Ejemplo:
• Si IdAlumno(NombreAlumno, Especialidad)
• Entonces:
• IdAlumno NombreAlumno y
• IdAlumno Especialidad
• Al Contrario:
• Si (X, Y) Z
• No es cierto que: X Z o Y Z
2018 Dr. Luis Boy Chavil
Particularidad
• Ejemplo:
• Si (IdAlumno, IdCurso, Semestre) Puntaje
• Entonces:
• IdAlumno por sí mismo NO puede determinar Puntaje, del mismo modo que
IdCurso por si solo no puede determinar puntaje, igual ocurre con Semestre..
2018 Dr. Luis Boy Chavil
Claves
• Son grupos de uno o más atributos que identifican de modo único a
una hilera (fila de datos).
• Ejemplo:
• DOCENTE(CodigoID, Nombre, DNI, Telefono, Especialidad)
• La Clave primaria, se encuentra subrayada!!
2018 Dr. Luis Boy Chavil
Clave Concatenada
• Son claves formadas por dos o más atributos.
• Ejemplo:
• Usaremos los atributos: NumFactura+CodServicio para registrar el PAGO por
un servicio atendido.
2018 Dr. Luis Boy Chavil
Clave Foránea
• Se usan para establecer una relación con otra tabla, en la cuál estos
atributos se han definido como Clave Primaria.
2018 Dr. Luis Boy Chavil
Formas Normales
Primera Forma Normal (1NF)
Segunda Forma Normal (2NF)
Tercera Forma Normal (3NF)
Forma Normal de Boyce-Codd (BNF)
Cuarta Forma Normal (4NF)
Quinta Forma Normal (5NF)
2018 Dr. Luis Boy Chavil
Relación No Normalizada
• En un Sistema de Ventas se registra la
FACTURA; para llevar la cuenta de las
ventas efectuadas.
Datos contenidos en
el documento
FACTURA
2018 Dr. Luis Boy Chavil
Primera Anomalía
• En una misma Factura, hay un grupo de Productos distintos que
conforman la Línea de Venta.
• Entonces, Aplicaremos la siguiente regla para reducir esta anomalía:
2018 Dr. Luis Boy Chavil
Primera Forma Normal
• “Eliminar los grupos repetidos”.
• Estrategia: Dividir la entidad FACTURA en dos entidades, de la siguiente
manera:
2018 Dr. Luis Boy Chavil
Segunda Anomalía
• No todos los atributos de la entidad LINEA DE VENTA dependen de la
clave concatenada!
2018 Dr. Luis Boy Chavil
Segunda Forma Normal
• “Los atributos de una entidad serán funcionalmente dependientes
de la clave primaria”.
• Esta regla se aplica a las entidades que se identifican a través de atributos de claves concatenadas.
2018 Dr. Luis Boy Chavil
Tercera Anomalía
• En FACTURA hay atributos dependientes de otros atributos no claves.
2018 Dr. Luis Boy Chavil
Tercera Forma Normal
• “Todos los atributos deben ser funcionalmente dependientes de su
clave principal”.
• Además; se pueden eliminar
los atributos calculables.
2018 Dr. Luis Boy Chavil
Consideraciones para la BCNF
• Sea la entidad ASESOR; con las características:
• Un IdAlumno puede tener varias especialidades
• IdAlumno Especialidad
• Un IdAlumno puede tener varios Asesores.
• IdAlumno Asesor
• IdAlumno por sí mismo NO puede ser una CLAVE !!
• (IdAlumno, Especialidad) Asesor y
• (IdAlumno, Asesor) Especialidad
• Cualquiera de estas combinaciones puede ser la Clave.
• Aparece el término: Clave Candidata
2018 Dr. Luis Boy Chavil
Otras consideraciones . . .
• Una Especialidad puede tener varios Asesores
• Especialidad Asesor
• Un Asesor sólo imparte asesoría en una Especialidad.
• Asesor Especialidad
• Luego; Asesor es un DETERMINANTE !!
2018 Dr. Luis Boy Chavil
Anomalías
• De Eliminación
• Si un Estudiante deja la Escuela; al eliminar la fila perderíamos el hecho de que
un Asesor imparte Asesoría en una Especialidad determinada.
• De Inserción
• ¿Cómo almacenaremos el hecho de que un Asesor asesora en una
Especialidad determinada? Esto no será posible hasta que el Estudiante se
inscriba en una materia!!
2018 Dr. Luis Boy Chavil
Forma Normal de Boyce y Codd
• Una entidad está en BCNF si cada determinante es una clave
candidata.
• En el ejemplo anterior; ASESOR no está en BCNF porque tiene un determinante
Asesor que no es una clave candidata.
• Así:
• ESTUDIANTE_ASESOR(IdAlumno +Asesor)
• ASESOR_ESPECIALIDAD(Asesor, Especialidad)
2018 Dr. Luis Boy Chavil
Consideraciones para la 4NF
• Sea la entidad ESTUDIANTE con las características:
• Un estudiante puede inscribirse en varias Especialidades y participar en
diversas Actividades.
• Existe una dependencia multivaluada entre IdAlumno y Especialidad; y,
Actividades.
• IdAlumno Especialidad
• IdAlumno Actividad
2018 Dr. Luis Boy Chavil
Otras consideraciones
• La entidad ESTUDIANTE está en 2NF porque todo es Clave.
• Está en 3NF porque no tiene dependencias transitivas; y
• Está en BCNF porque no tiene determinantes que no son claves.
2018 Dr. Luis Boy Chavil
Anomalías
• De Inserción
• Si un estudiante toma otra especialidad; se debe ingresar una fila para la nueva
especialidad, y juntarla con cada una de las actividades del estudiante.
• Sucede lo mismo si un estudiante se inscribe en una nueva actividad.
• De Eliminación
• Si un estudiante deja una especialidad se deben eliminar cada uno de los
registros que contienen tal materia.
2018 Dr. Luis Boy Chavil
Cuarta Forma Normal
• Una entidad está en 4NF si está en BCNF y no tiene dependencias de
valores múltiples.
• Para evitar tales anomalías, se deben eliminar las dependencias de valores
múltiples. Esto se hace construyendo dos entidades, donde cada una almacena
datos para solamente uno de los atributos de valores múltiples.
• Las entidades resultantes, no tienen anomalías; así:
• ESTUDIANTE-ESPECIALIDAD(IdAlumno, Especialidad)
• ESTUDIANTE-ACTIVIDAD(IdAlumno, Actividad)
2018 Dr. Luis Boy Chavil
Quinta Forma Normal
• Dependencias de Unión
• Ocurre cuando una entidad tiene dependencia de unión con varias de sus proyecciones y se
puede obtener la entidad por medio de la unión de dichas proyecciones.
• PROYECCION
• Creación de una entidad cuyos elementos forman un subconjunto de una entidad dada. Se
incluyen todas las filas y algunas columnas.
• UNIÓN
• Formar a partir de 2 entidades, una nueva con todos los campos de una de ellas y los registros
de ambas; excepto los repetidos. Ambas entidades deben tener el mismo grado y las mismas
columnas.
2018 Dr. Luis Boy Chavil
Quinta Forma Normal
• Conocida como FN de Proyección-Unión; es un nivel de normalización
designado para reducir redundancias que guardan hechos multivalores
aislando semánticamente relaciones múltiples.
• Una entidad se dice que está en 5NF si y sólo si; está en 4NF y las
únicas dependencias que existen son las dependencias de Unión de
una entidad con sus proyecciones; relacionándose entre las distintas
proyecciones mediante la clave primaria o cualquier clave candidata.
2018 Dr. Luis Boy Chavil
Quinta Forma Normal
• Este es el caso de una Empresa que guarda información
de sus empleados con sus datos Personales, datos
Profesionales, datos Clínicos y datos de su vivienda.
• Si esta entidad ya está en 4NF; entonces podremos tener
las entidades:
• Empleados-Personales
• Empleados-Profesionales
• Empleados-Clínicos
• Empleados-Vivienda
2018 Dr. Luis Boy Chavil
Entidades en 5NF
2018 Dr. Luis Boy Chavil
Resumen
Forma Características que la define
1NF Cualquier Afinidad
2NF Todos los atributos que no son clave dependen por completo de las
claves
3NF No hay dependencias transitivas
BCNF Cada determinante es una candidata para clave
4NF No hay dependencias de valores múltiples
5NF Proyección-Unión
DK/NF Todas las restricciones en las actividades son consecuencias
lógicas de los dominios y las claves
2018 Dr. Luis Boy Chavil
Relacionamiento de entidades uno-a-uno
• Los atributos que tienen una relación uno-a-uno deben aparecer juntos en
cuando menos una entidad. Llame a esta entidad R y a los atributos A y B.
• A o B deben ser la clave de R
• Un atributo puede agregarse a R si está determinado funcionalmente por A o
B.
• Un Atributo que no está determinado funcionalmente por A o B no puede
agregarse a R.
• A y B deben aparecer juntos en R, pero no deberán aparecer juntos en otras
entidades.
• A o B deben usarse consistentemente para representar el par en las
entidades diferentes a R.
2018 Dr. Luis Boy Chavil
Relacionamiento de entidades muchos-a-uno
• Los atributos que tienen una relación muchos-a-uno pueden existir
juntos en una entidad.
• Supongamos que C determina D en una entidad S.
• C debe ser la clave de S
• Un atributo puede agregarse a S si está determinado por C
• Un atributo que no está determinado por C no puede agregarse a S.
2018 Dr. Luis Boy Chavil
Relacionamiento de entidades muchos-a-muchos
• Los atributos que tienen una relación muchos-a-muchos pueden existir
juntos en una entidad.
• Supongamos que los atributos E y F, residen juntos en la entidad T.
• La clave de T debe ser (E, F)
• Un atributo puede agregarse a T si está determinado por la
combinación (E, F)
• Un atributo no puede agregarse a T, si no está determinado por la
combinación (E, F)
• Si agregar un nuevo atributo G, expande la clave a (E, F, G); entonces
el tema de la entidad ha sido cambiado. G no pertenece a T o el
nombre de T debe cambiarse para reflejar el nuevo tema.
2018 Dr. Luis Boy Chavil
Normalización de datos
Escuela de Ingeniería
De Sistemas
Base de Datos
2018 Dr. Luis Boy Chavil