Ministerio de Educación
I.P.T. Jeptha B. Duncan G.
Informática
Investigación Base de Datos
Profesor: Jorge Martínez
Ariza, Mariani
Vergara, José
12B1
2015
Introducción
Una base de datos es una herramienta muy útil, principalmente en
organizaciones ya que contribuye al buen manejo de la información y
agiliza la búsqueda de la misma, cabe recalcar que también facilita a
los internautas el acceso a contenido de interés, ya sea música, videos,
bibliotecas entre otras. El presente documento realiza una inspección
con respecto a conocimientos básicos que se deben tener acerca de una
base de datos desarrollando temas como su definición, clasificación,
tipos, los modelos o estructuras (Entidad Relación y Relacional) los
Sistemas Gestores de Bases de Datos y los procesos que se realizan
para la elaboración de una BD utilizando el programa o aplicación de
Microsoft, Access.
Las bases de datos representan una manera especializada de recaudar
información, puesto que anteriormente se ocupaba mucho espacio y se
consumían recursos para dicho proceso y a su vez a la hora de solicitar o
investigar acerca de algo o alguien resultaba un poco complicado.
¿Qué es una base de Datos?
Definición: Una Base de Datos es un conjunto de información
relacionada con un asunto, tema o actividad específica. Así, se pueden
utilizar Bases de Datos para cosas tan sencillas como mantener un
registro de nuestra colección de discos de música, hasta llevar toda la
gestión de una gran empresa u organización.
Una base de datos puede ser de diverso tipo, desde un pequeño fichero
casero para ordenar libros y revistas por clasificación alfabética hasta
una compleja base que contenga datos de índole gubernamental en un
Estado u organismo internacional. Recientemente, el término base de
datos comenzó a utilizarse casi exclusivamente en referencia a bases
construidas a partir de software informático, que permiten una más fácil
y rápida organización de los datos. Las bases de datos informáticas
pueden crearse a partir de software o incluso de forma online usando
Internet. En cualquier caso, las funcionalidades disponibles son
prácticamente ilimitadas.
Las bases de datos se clasifican como estáticas – en casos en que sólo
sirven para su lectura y almacenamiento – o dinámicas – la información
se modifica y puede ser actualizada -. También, según su contenido
pueden ser bibliográficas, de texto completo, directorios, o de tipo
biblioteca.
Este tipo de clasificadores contribuyen, por supuesto, a labores diarias
de casi todo tipo de empleos, como registrar las comunicaciones que se
sostienen con clientes,
almacenar datos de proveedores,
archivar datos, números y todo
tipo de información que
el usuario quiera poner en
relación o encontrar
fácilmente con sólo ingresar
una palabra clave.
Clasificación
Según la naturaleza de la información contenida en las bases de datos,
se distinguen dos grandes grupos:
Bases de datos referenciales: La información que contiene es muy
estructurada principalmente a través de tablas. Con éstas se
pueden establecer relaciones que pueden dar lugar a nuevas
tablas o bases de datos. Ejemplo de este tipo de base de datos es
el programa Access, Oracle, etc.
Bases de datos documentales: Los registros que componen la base
de datos se relaciona con los documentos almacenados. Su
organización se estructura de la siguiente manera: un registro se
relacionan con un número de identificación del documento
original, y se puede acceder a éste mediante los distintos campos.
Dependiendo del tipo de cobertura temática pueden ser:
o Bases de datos multidisciplinares: la documentación almacenada
abarca distintas disciplinas científicas como es el caso de TESEO
(tesis de todas las disciplinas)
o Bases de datos especializadas: la documentación almacenada
abarca sólo una disciplina como es el caso de Medline (sólo
documentación relacionada con Medicina)
Según la cobertura geográfica:
o Internacionales: Almacenan la documentación publicada en
cualquier lugar del mundo. Por ejemplo: LISA
o Nacionales: Almacenan la documentación publicada sólo en un
ámbito nacional. Por ejemplo: IME.
Tipos de Base de Datos
Hay diversos tipos de base de datos dependiendo de los objetivos de su
uso. Por ejemplo, son distintos objetivos mantener el historial médico de
los pacientes de un hospital o el registro de operaciones financieras de
un banco. Pero en general los sistemas de bases de datos más populares
son las bases de datos relacionales, aunque también se usan otros tipos
de bases de datos, entre los que cabe destacar las denominadas “bases
de datos orientadas a objetos”.
Las bases de datos relacionales se basan en la idea fundamental del uso
de relaciones para definir los tipos de datos o información. Así en
nuestro ejemplo anterior podemos ver que un usuario queda definido
por un nombre y un teléfono es decir la relación de nombre y teléfono
nos da un usuario.
Modelo Entidad Relación
El Modelo de Entidad Relación es un modelo de datos basado en una
percepción del mundo real que consiste en un conjunto de objetos
básicos llamados entidades y relaciones entre estos objetos,
implementándose en forma gráfica a través del Diagrama Entidad
Relación.
Se puede definir cono
Entidad a cualquier
objeto, real o abstracto,
Entidad = Tabla
que existe en un
contexto determinado o
puede llegar a existir y
del cual deseamos
guardar información.
Ejemplares =
registros
Hablamos de ejemplares
Ejemplares de cuando nos referimos a
información similar se una clase de objetos con
agrupan en entidades. características similares.
Atributos = Campos
Claves Candidatas Clave Principal
Alumno Alumno
Alu_Nombre Alu_DNI
Alu_Direccion Alu_Nombre
Alu_tel Alu_Legajo
Alu_Direccion
Alu_Legajo
Alu_tel
Alu_DNI
Compuesta
Curso
Cur_Nivel
Cur_Grado
Cur_Seccion
Cur_Turno
Tipos de Relaciones
Se entiende por Relación a la asociación entre 2 o más entidades.
o Clasificación por Cardinales
Relación Uno a Uno: Cuando un registro de una tabla sólo puede
estar relacionado con un único registro de la otra tabla y
viceversa. En este caso la clave foránea se ubica en alguna de las
2 tablas.
Relación Uno a Muchos: Cuando un registro de una tabla (tabla
secundaria) sólo puede estar relacionado con un único registro de
la otra tabla (tabla principal) y un registro de la tabla principal
puede tener más de un registro relacionado en la tabla secundaria.
En este caso la clave foránea se ubica en la tabla secundaria.
Relación Muchos a Muchos: Cuando un registro de una tabla puede
estar relacionado con más de un registro de la otra tabla y
viceversa. En este caso las dos tablas no pueden estar
relacionadas directamente, se tiene que añadir una tabla entre las
dos (Tabla débil o de vinculación) que incluya los pares de valores
relacionados entre sí.
El nombre de tabla débil deviene que con sus atributos propios no
se puede encontrar la clave, por estar asociada a otra entidad. La
clave de esta tabla se conforma por la unión de los campos claves
de las tablas que relaciona.
o Clasificación por Modalidad
Dadas las tablas A y B, que se encuentran relacionadas: Si para
todo registro de A debe existir siempre al menos un registro de B
asociado, se dice que la relación en sentido A->B es Obligatoria. Si
para todo registro de A, pueden existir o no, uno o varios registros
de B asociados, se dice que la relación en sentido A->B es
Optativa. La modalidad de las relaciones se debe analizar en
ambos sentidos.
Optativa
Obligatoria
Pasos para la construcción del Diagrama Entidad Relaciones
1. Identificar las entidades.
2. Determinar las claves primarias.
3. Describir los atributos de las entidades.
4. Establecer relaciones entre las entidades.
5. Dibujar el modelo de datos.
6. Realizar comprobaciones.
Modelo Relacional
El modelo de datos relacional organiza y representa los datos en forma
de tablas o relaciones:
Una base de datos relacional es una colección de relaciones [tablas].
Representación Lógica Representación Física Modelo Relacional
Tabla Archivo Secuencial Relación
Fila Registro Tupla
Columna Campo Atributo
Ejemplo
id_trabajado nombre tarifa_hr tipo_de_ofici id_supv
r o
1235 F. Aguilera 12,50 Electricista 1311
1412 A. Calvo 13,75 Fontanero 1540
2920 N. Marín 10,00 Carpintero null
Concepto de Tupla, Relación y Dominio.
Atributo (Ai): Elemento susceptible de tomar valores (cada una
de las columnas de la tabla).
Dominio (Di): Conjunto de valores que puede tomar un atributo
(se considera finito).
Tupla: Cada uno de los elementos que contiene una instancia de
la relación (filas).
Proceso de Diseño de la Base de Datos
Problema:
Diseñar la estructura lógica y física de una o más bases de datos para
atender a las necesidades de información de los usuarios en una
organización para un conjunto definido de aplicaciones.
Actividades paralelas:
Diseño del contenido y estructura de la base de datos.
Diseño de las aplicaciones de la base de datos.
Fase 1:
Análisis de requisitos
Recabar información sobre el uso que se piensa dar a la base de
datos (elicitación de requisitos del sistema).
Fase 2:
Diseño conceptual (modelo E/R)
Creación de un esquema conceptual de la base de datos
independiente del DBMS que se vaya a utilizar.
Fase 3:
Elección del sistema gestor de bases de datos
Elección del modelo de datos (tipo de DBMS) y del DBMS concreto
([Link]. relacional, multidimensional…).
Fase 4:
Diseño lógico
Creación del esquema conceptual para el modelo de datos del DBMS
elegido
([Link]. paso del modelo E/R a un conjunto de tablas).
Fase 5:
Diseño físico:
Creación de la base de datos utilizando el DDL (lenguaje de definición
de datos del DBMS).
Fase 6:
Uso y mantenimiento
Gestión de los datos utilizando el DML (lenguaje de manipulación de
datos del DBMS).
Del modelo E/R (Entidad Relación) al modelo relacional:
Diseño lógico de bases de datos relacionales
Transformación de un diagrama E/R en un esquema relacional (esto es,
en un conjunto de tablas):
Se transforman en tablas todas los tipos de entidades y relaciones
que aparecen en el diagrama E/R.
Se seleccionan las claves primarias para cada una de las tablas de
nuestro esquema lógico.
Se fusionan aquellas tablas que compartan su clave primaria.
Las bases de datos relacionales se basan en la idea fundamental del uso
de relaciones para definir los tipos de datos o información. Así en
nuestro ejemplo anterior podemos ver que un usuario queda definido
por un nombre y un teléfono es decir la relación de nombre y teléfono
nos da un usuario.
Normalización de bases de datos
El proceso de normalización de bases de datos consiste en designar y
aplicar una serie de reglas a las relaciones obtenidas tras el paso del
modelo entidad-relación al modelo relacional.
Las bases de datos relacionales se normalizan para:
• Evitar la redundancia de los datos.
• Disminuir problemas de actualización de los datos en las tablas.
• Proteger la integridad de los datos.
En el modelo relacional es frecuente llamar tabla a una relación, aunque
para que una tabla sea considerada como una relación tiene que cumplir
con algunas restricciones:
• Cada tabla debe tener su nombre único.
• No puede haber dos filas iguales. No se permiten los duplicados.
• Todos los datos en una columna deben ser del mismo tipo.
Figura 1.0: Trabajo (Código, Nombre, Posición, Salario), donde Código es la Clave Primaria.
Relación = tabla o archivo
Registro = registro, fila , renglón o tupla
Atributo = columna o campo
Clave = llave o código de identificación
Clave Candidata = superclave mínima
Clave Primaria = clave candidata elegida
Clave Ajena (o foránea) = clave externa o clave foránea
Clave Alternativa = clave secundaria
Dependencia Multivaluada = dependencia multivalor
RDBMS = Del inglés Relational Data Base Manager System que
significa,Sistema Gestor de Bases de Datos Relacionales.
1FN = Significa, Primera Forma Normal o 1NF del inglés First Normal
Form.
Los términos Relación, Tupla y Atributo derivan del álgebra y cálculo
relacional, que constituyen la fuente teórica del modelo de base de
datos relacional.
Todo atributo en una tabla tiene un dominio, el cual representa el
conjunto de valores que el mismo puede tomar. Una instancia de una
tabla puede verse entonces como un subconjunto del producto
cartesiano entre los dominios de los atributos. Sin embargo, suele haber
algunas diferencias con la analogía matemática, ya que algunos RDBMS
permiten filas duplicadas, entre otras cosas. Finalmente, una tupla
puede razonarse matemáticamente como un elemento del producto
cartesiano entre los dominios.
Sistemas Gestores de Bases de Datos
Un Sistema Gestor de Bases de Datos (SGBD) o DBMA (DataBase
Management System) es una colección de programas cuyo objetivo es
servir de interfaz entre la base de datos, el usuario y las aplicaciones. Se
compone de un lenguaje de definición de datos, de un lenguaje de
manipulación de datos y de un lenguaje de consulta. Un SGBD permite
definir los datos a distintos niveles de abstracción y manipular dichos
datos, garantizando la seguridad e integridad de los mismos.
Algunos ejemplos de SGBD son Oracle, DB2, PostgreSQL, MySQL, MS
SQL Server, etc.
Un SGBD debe permitir:
o Definir una base de datos: especificar tipos, estructuras y
restricciones de datos.
o Construir la base de datos: guardar los datos en algún medio
controlado por el mismo SGBD
o Manipular la base de datos: realizar consultas, actualizarla, generar
informes.
Las características de un Sistema Gestor de Base de Datos SGBD son:
Abstracción de la información. Los SGBD ahorran a los usuarios detalles
acerca del almacenamiento físico de los datos. Da lo mismo si una base
de datos ocupa uno o cientos de archivos, este hecho se hace
transparente al usuario. Así, se definen varios niveles de abstracción.
Independencia. La independencia de los datos consiste en la capacidad
de modificar el esquema (físico o lógico) de una base de datos sin tener
que realizar cambios en las aplicaciones que se sirven de ella.
Redundancia mínima. Un buen diseño de una base de datos logrará
evitar la aparición de información repetida o redundante. De entrada, lo
ideal es lograr una redundancia nula; no obstante, en algunos casos la
complejidad de los cálculos hace necesaria la aparición de redundancias.
Consistencia. En aquellos casos en los que no se ha logrado esta
redundancia nula, será necesario vigilar que aquella información que
aparece repetida se actualice de forma coherente, es decir, que todos
los datos repetidos se actualicen de forma simultánea.
Seguridad. La información almacenada en una base de datos puede
llegar a tener un gran valor. Los SGBD deben garantizar que esta
información se encuentra segurizada frente a usuarios
malintencionados, que intenten leer información privilegiada; frente a
ataques que deseen manipular o destruir la información; o simplemente
ante las torpezas de algún usuario autorizado pero despistado.
Normalmente, los SGBD disponen de un complejo sistema de permisos a
usuarios y grupos de usuarios, que permiten otorgar diversas categorías
de permisos.
Integridad. Se trata de adoptar las medidas necesarias para garantizar la
validez de los datos almacenados. Es decir, se trata de proteger los
datos ante fallos de hardware, datos introducidos por usuarios
descuidados, o cualquier otra circunstancia capaz de corromper la
información almacenada.
Respaldo y recuperación. Los SGBD deben proporcionar una forma
eficiente de realizar copias de respaldo de la información almacenada en
ellos, y de restaurar a partir de estas copias los datos que se hayan
podido perder.
Control de la concurrencia. En la mayoría de entornos (excepto quizás
el doméstico), lo más habitual es que sean muchas las personas que
acceden a una base de datos, bien para recuperar información, bien
para almacenarla. Y es también frecuente que dichos accesos se
realicen de forma simultánea. Así pues, un SGBD debe controlar este
acceso concurrente a la información, que podría derivar en
inconsistencias.
SGBD libres o gratuitos
NOMBRE DE BASE DE
LOGOTIPO
DATOS
PostgreSQL
DB2-Express C
MySQL (edición gratuita)
SGBD que requieren de pago.
NOMBRE DE BASE DE
LOGOTIPO
DATOS
MySQL (ediciones de
pago)
dBase
IBM Informix
Microsoft SQL SERVER
Oracle
Sybase
Proceso de un Diseño de Base de Datos
El proceso de diseño de una base de datos se guía por algunos
principios. El primero de ellos es que se debe evitar la información
duplicada o, lo que es lo mismo, los datos redundantes, porque
malgastan el espacio y aumentan la probabilidad de que se produzcan
errores e incoherencias. El segundo principio es que es importante que
la información sea correcta y completa. Si la base de datos contiene
información incorrecta, los informes que recogen información de la base
de datos contendrán también información incorrecta y, por tanto, las
decisiones que tome a partir de esos informes estarán mal
fundamentadas.
Un buen diseño de base de datos es, por tanto, aquél que:
o Divide la información en tablas basadas en temas para reducir los
datos redundantes.
o Proporciona a Access la información necesaria para reunir la
información de las tablas cuando así se precise.
o Ayuda a garantizar la exactitud e integridad de la información.
o Satisface las necesidades de procesamiento de los datos y de
generación de informes.
El proceso de diseño
El proceso de diseño consta de los pasos siguientes:
Determinar la finalidad de la base de datos
Esto le ayudará a estar preparado para los demás pasos.
Buscar y organizar la información necesaria
Reúna todos los tipos de información que desee registrar en la base
de datos, como los nombres de productos o los números de pedidos.
Dividir la información en tablas
Divida los elementos de información en entidades o temas principales,
como Productos o Pedidos. Cada tema pasará a ser una tabla.
Convertir los elementos de información en columnas
Decida qué información desea almacenar en cada tabla. Cada elemento
se convertirá en un campo y se mostrará como una columna en la tabla.
Por ejemplo, una tabla Empleados podría incluir campos como Apellido y
Fecha de contratación.
Especificar claves principales
Elija la clave principal de cada tabla. La clave principal es una columna
que se utiliza para identificar inequívocamente cada fila, como Id. de
producto o Id. de pedido.
Definir relaciones entre las tablas
Examine cada tabla y decida cómo se relacionan los datos de una tabla
con las demás tablas. Agregue campos a las tablas o cree nuevas tablas
para clarificar las relaciones según sea necesario.
Ajustar el diseño
Analice el diseño para detectar errores. Cree las tablas y agregue
algunos registros con datos de ejemplo. Compruebe si puede obtener los
resultados previstos de las tablas. Realice los ajustes necesarios en el
diseño.
Aplicar las reglas de normalización
Aplique reglas de normalización de los datos para comprobar si las
tablas están estructuradas correctamente. Realice los ajustes necesarios
en las tablas.
Conclusión
Una base de datos es una la estructura organizativa que ordena la
información de forma muy disciplinada, esto lo logra a través de un
Sistema Gestor de Base de Datos, el cual se encarga de brindar
seguridad, integridad entre otras cosas al tipo de información que se
ingrese a la base de datos. Existen Gestores de pago y otros gratuitos,
entre los gratuitos tenemos PostgreSQL y Microsoft SQL SERVER
mientras que entre los de pago están Oracle y Sybase. Una base de
datos puede ser Online u Offline,
DefinicionABC
Título: [Link]
[En línea] 28/5/15
[Link]
Título: [Link]/es-es/article/Conceptos-básicos-del-diseño-de-
una-base-de-datos-1eade2bf-e3a0-41b5-aee6-d2331f158280?ui=es-
ES&rs=es-ES&ad=ES
[En línea] 28/5/15
Genbetadev
Título: [Link]
bases-de-datos-modelo-entidad-relacion
[En línea] 28/5/15
[Link]
Título: [Link]
de-datos-15434811
[En línea] 4/6/15
[Link]
Título: [Link]
[En línea] 4/6/15
[Link]
Título: [Link]
[En línea] 4/6/15
[Link]
Título: [Link]
%C3%B3n_de_bases_de_datos
[En línea] 4/6/15