CONCEPTOS Y TIPOS DE BASE DE DATOS
¡BIENVENIDOS!
A continuación, profundizaremos en lo relativo a conceptos básicos y tipos de base de datos
con el propósito de distinguir los conceptos básicos de base de datos, considerando los
modelos y la estructura esquemática, para relacionar los niveles de abstracción con los tipos
de datos de los lenguajes de programación.
COMENCEMOS
ANTECEDENTES RELEVANTES
El surgimiento de las bases de datos se dió como respuesta a la necesidad de manejar y
organizar eficientemente grandes cantidades de información. Con el creciente manejo de
datos en los sistemas informáticos, se hizo evidente que era necesario contar con una
solución estructurada y centralizada que permitiera almacenar, acceder y administrar estos
datos de manera efectiva.
En el área de la informática, la aparición de las bases de datos se ubica en la década de 1960
según gran cantidad de autores. Durante este período, los sistemas informáticos
comenzaron a manejar grandes volúmenes de datos, lo que llevó a la necesidad de una
solución estructurada para organizar y gestionar la información de manera más eficiente.
En la actualidad, las bases de datos son herramientas indispensables en las organizaciones
y/o empresas de uso común que recolectan y protegen la información, permitiendo
gestionar sus actividades y decisiones de su negocio. Se pueden nombrar empresas que
lideran el desarrollo de las bases de datos como IBM, Microsoft y Oracle, sin embargo,
también se encuentran otras que suministran excelentes sistemas como MongoDb y
PostgreSQL.
Antecedentes relevantes de las bases de datos
• En la década de los 60 se populariza el uso de los discos duros, surge la primera
generación de bases de datos de red y las bases de datos jerárquicas.
• En la década de los 70, Edgar Frank Codd aclaró el modelo relacional a la vez que
publicó una serie de reglas para los sistemas de datos relacionales.
• En la década de los 80 se creó un lenguaje de consulta estructurado (SQL -
Structured Query Language).
CONCEPTOS BÁSICOS DE BASE DE DATOS
Antes de abordar los conceptos básicos en detalle de las bases de datos, es importante
comenzar por una descripción general que proporcione una visión amplia y comprensión
básica de cada concepto. A continuación, se muestra una breve descripción de cada uno de
ellos:
• Datos: los datos son elementos sin procesar que representan hechos, cifras o
valores. Puedes explicar que los datos pueden ser de diferentes tipos, como
numéricos, textuales, fechas, imágenes, entre otros. Es conocido que los datos se
almacenan en sistemas informáticos y forman la base de la información que
utilizamos.
• Información: la información es entendida como el resultado del procesamiento de
los datos para darles significado y utilidad. La información se obtiene al organizar,
analizar y presentar los datos de manera que sea comprensible y relevante para una
determinada finalidad. Resalta que la información es lo que permite tomar
decisiones sustentadas y comprender el mundo que nos rodea.
• Base de datos: una base de datos es aceptada en los diferentes campos de trabajo,
como una colección estructurada de datos relacionados entre sí. Las cuales se
utilizan para almacenar y gestionar grandes volúmenes de información de manera
organizada. Por tanto, las bases de datos permiten acceder y manipular los datos de
manera eficiente, garantizando su integridad y seguridad.
• Sistemas gestores de bases de datos (DBMS): son software especializados que
permiten la creación, manipulación y gestión de bases de datos. Estos DBMS
proporcionan interfaces y herramientas para definir la estructura de los datos,
realizar consultas, administrar la seguridad y asegurar la consistencia de los datos.
• Llaves primaria y secundaria: las llaves primarias y secundarias son atributos
utilizados para identificar y organizar los datos dentro de una base de datos. La llave
primaria es única para cada registro y se utiliza para garantizar la integridad y la
unicidad de los datos. Las llaves secundarias son atributos adicionales que permiten
una organización y búsqueda más eficiente de los datos.
DATOS
En el contexto de las bases de datos, los datos son información estructurada y organizada
que se almacenan y administran en un sistema de gestión de bases de datos (DBMS, por su
sigla en inglés). Los datos representan hechos, observaciones, eventos o cualquier tipo de
información que sea relevante y útil para una aplicación o sistema.
Por tanto, en una base de datos, los datos se almacenan en forma de registros, también
conocidos como filas, que representan entidades individuales. Cada registro está
compuesto por campos o atributos, que son las diferentes categorías de información que
se desean almacenar para cada entidad. Por ejemplo, en una base de datos de empleados,
los campos pueden incluir el nombre, el número de empleado, el cargo, el salario, y otros.
Es así, como los datos en una base de datos pueden ser de diferentes tipos, como texto,
números, fechas, imágenes, audio, entre otros. Además, los datos pueden estar
relacionados entre sí mediante la estructura de la base de datos, permitiendo establecer
conexiones y consultas complejas.
• Cada dato tiene un tipo que define la naturaleza de la información que representa.
Algunos tipos comunes son enteros, decimales, cadenas de texto, fechas, booleanos
y otros.
• El tipo de datos ayuda a definir las operaciones que se pueden realizar con ellos y
cómo se almacenan en la base de datos.
• Para ciertos tipos de datos, como cadenas de texto o números decimales, es posible
especificar la longitud máxima o la cantidad de dígitos decimales permitidos. Estas
características definen la capacidad de almacenamiento y la precisión de los datos.
INFORMACIÓN
En la informática se entiende por información al conjunto de datos ordenados,
secuenciados, procesados por un algoritmo de programación, que permiten recomponer
un referente, como un hecho concreto o algún sentido real.
Por otro lado, para varios autores en el contexto de las bases de datos, la información se
refiere a los datos organizados y estructurados que se almacenan en la base de datos y que
son accesibles para su uso y consulta. La información en una base de datos se compone de
registros, campos y relaciones entre ellos. A continuación, en la imagen descripción de cada
uno de estos elementos.
En resumen, en el contexto de las bases de datos, la información se compone de registros
estructurados en campos, relacionados entre sí mediante claves, y es accesible mediante
consultas y presentada en informes. La base de datos proporciona un entorno organizado
y eficiente para almacenar, gestionar y recuperar información de manera confiable.
• Registros: colección de datos relacionados que se agrupan como una entidad
indivisible en la base de datos. Por ejemplo, en una base de datos de empleados,
cada registro podría representar a un empleado individual e incluir campos como el
nombre, apellido, número de empleado, dirección, salario, y otros. Los registros se
almacenan en tablas o colecciones, dependiendo del modelo de base de datos
utilizado.
• Campos: es una unidad de datos indivisible dentro de un registro. Representa una
característica específica o un atributo del objeto que se está almacenando.
Siguiendo el ejemplo de registros, los campos serían los elementos individuales
como el nombre, apellido, número de empleado, y otros. Cada campo tiene un tipo
de datos asociado que define la naturaleza de la información que puede almacenar,
como texto, número, fecha, y otros.
• Relaciones: en las bases de datos la información se organiza en tablas que están
relacionadas entre sí mediante claves primarias y claves externas. Las relaciones
establecen conexiones lógicas entre los registros de diferentes tablas, lo que
permite recuperar información relacionada de manera eficiente. Por ejemplo, en
una base de datos que almacena información de empleados y departamentos,
puede haber una relación entre la tabla de empleados y la tabla de departamentos
utilizando un campo común, como el ID del departamento
BASE DE DATOS
A continuación, algunas definiciones de base de datos de algunas empresas lideres en
tecnología:
Es un sistema diseñado para almacenar y gestionar datos de manera eficiente. Proporciona
una estructura organizada para almacenar información y permite realizar consultas y
análisis sobre los datos almacenados.
Es una herramienta para recopilar y organizar información. Estas pueden almacenar
información sobre personas, productos, pedidos u otras cosas. Muchas bases de datos
comienzan como una lista en una hoja de cálculo o en un programa de procesamiento de
texto.
En resumen, se puede decir que una base de datos es un sistema de software diseñado para
almacenar y administrar grandes volúmenes de información estructurada de manera
eficiente. El cual está conformado por un conjunto de estructuras y algoritmos que
permiten la organización, el acceso y la manipulación de los datos de manera rápida y
precisa.
• Una estructura organizada: en la cual se almacenan datos de manera estructurada,
utilizando modelos como el modelo relacional, jerárquico o de documentos. Esto
permite organizar los datos en tablas, documentos o árboles, lo que facilita la
manipulación y recuperación de la información.
• Independencia de los datos: proporcionando una capa de abstracción entre los
datos y las aplicaciones que los utilizan. Esto significa que los cambios en la
estructura de la base de datos no deberían afectar a las aplicaciones que la utilizan,
lo que permite una mayor flexibilidad y escalabilidad del sistema.
• Escalabilidad: permitiendo manejar grandes volúmenes de datos y soportar un alto
rendimiento. Esto significa que pueden escalar para adaptarse al crecimiento de la
cantidad de datos y al número de usuarios que acceden a la base de datos.
SISTEMAS GESTORES DE BASE DE DATOS (DBMS)
Para PowerData un Sistema Gestor de Base de Datos (SGBD) o DGBA (Data Base
Management System) es un conjunto de programas no visibles que administran y gestionan
la información que contiene una base de datos. Los gestores de base de datos o gestores
de datos hacen posible administrar todo acceso a la base de datos ya que tienen el objetivo
de servir de interfaz entre ésta, el usuario y las aplicaciones.
Para Microsoft “Microsoft SQL Server es un sistema gestor de base de datos relacional
(DBMS) que proporciona un entorno completo para administrar bases de datos
relacionales. Ofrece herramientas para el almacenamiento, consulta, administración y
seguridad de datos, permitiendo a las organizaciones gestionar de manera eficiente su
información”. (Microsoft, 2023).
En resumen, un sistema gestor de base de datos (DBMS) es un software que permite
administrar y organizar bases de datos. Actúa como una interfaz entre los usuarios o
aplicaciones y la base de datos, facilitando el almacenamiento, recuperación y manipulación
de datos, así como la gestión de la seguridad y la integridad de la base de datos. Varias
empresas de tecnología ofrecen este tipo de software como Oracle, Microsoft e IBM.
Un DBMS permite:
• Almacenar y organizar los datos en una estructura lógica, como tablas, documentos
o grafos, dependiendo del modelo de datos utilizado.
• Acceder y recuperar datos de manera eficiente a través de consultas y búsquedas,
utilizando lenguajes de consulta como SQL.
• La integridad de los datos mediante la aplicación de restricciones y reglas, como
claves primarias y restricciones de integridad referencial, para mantener la
consistencia y la coherencia de los datos almacenados.
• Mecanismos de seguridad para controlar el acceso a los datos, como autenticación
de usuarios, asignación de permisos y encriptación de datos sensibles.
• Manejar la concurrencia cuando múltiples usuarios o procesos acceden a la base de
datos simultáneamente, asegurando la consistencia y evitando conflictos en las
operaciones concurrentes.
• Proporciona un lenguaje de consulta estándar, como SQL (Structured Query
Language), que permite realizar operaciones como inserción, actualización,
eliminación y consulta de datos en la base de datos.
LLAVES PRIMARIAS, SECUNDARIAS, CANDIDATAS Y FORÁNEAS
Para varios autores y empresas de la tecnología las llaves o claves en una base de datos
pueden ser las siguientes:
• Llave primaria (primary key): es un atributo o conjunto de atributos que identifica
de manera única cada registro dentro de una tabla. Cumple con la propiedad de
unicidad, lo que significa que no puede haber dos registros con el mismo valor en la
llave primaria. Una tabla solo puede tener una llave primaria.
• Llave secundaria (secondary key): es un atributo o conjunto de atributos que no se
selecciona como llave primaria, pero que se utiliza para mejorar el rendimiento y
facilitar el acceso a los datos. Las llaves secundarias pueden ayudar a acelerar las
consultas y búsquedas en la tabla. También llamado indexes.
• Llave candidata (candidate key): es un atributo o conjunto de atributos que puede
funcionar como llave primaria. Cumple con la propiedad de unicidad y cada valor en
la llave candidata debe ser único en la tabla. Una tabla puede tener múltiples llaves
candidatas, pero solo una de ellas se selecciona como llave primaria.
• Llave foránea (foreign key): es un atributo o conjunto de atributos en una tabla que
establece una relación referencial con la llave primaria de otra tabla. La llave foránea
se utiliza para vincular datos entre tablas y garantizar la integridad referencial.
Llaves primarias, secundarias, candidatas y foráneas:
• Ejemplo de llave candidata: supongamos una tabla llamada “Clientes” con los
atributos: ID_Cliente, Número de Teléfono y Correo Electrónico. Tanto “ID_Cliente”
como “Número de Teléfono” cumplen con la propiedad de unicidad y podrían
funcionar como llaves primarias. En este caso, ambos atributos son llaves
candidatas, pero solo uno de ellos se seleccionaría como llave primaria.
• Ejemplo de llave primaria: supongamos una tabla llamada “Estudiantes” con los
siguientes atributos: ID (identificación del estudiante), Nombre, Apellido y Fecha de
Nacimiento. En este caso, la llave primaria podría ser el atributo “ID”, ya que
identifica de manera única a cada estudiante en la tabla.
• Ejemplo de llave secundaria: continuando con el ejemplo anterior de la tabla
“Estudiantes”, se agrega un atributo adicional llamado “Correo Electrónico”.
Aunque no se utiliza para identificar de manera única a los estudiantes, este atributo
puede ser útil para realizar búsquedas y consultas rápidas en la tabla. En este caso,
“Correo Electrónico” sería una llave secundaria.
• Ejemplo de llave foránea: dos tablas: “Pedidos” y “Clientes”. En la tabla “Pedidos”,
tienes un atributo llamado “ID_Cliente” que hace referencia al ID del cliente que
realizó el pedido. En este caso, “ID_Cliente” es una llave foránea en la tabla
“Pedidos”, ya que establece una relación referencial con la llave primaria
“ID_Cliente” en la tabla “Clientes”.
TIPOS DE BASES DE DATOS
Antes de profundizar en los tipos de base datos, es importante comenzar por una
descripción general que proporcione una visión amplia y comprensión de estas, los cuales
se clasifican principalmente según su modelo de datos y su estructura de almacenamiento.
A continuación, las más comunes:
• Base de datos relacional: es un tipo de base de datos que utiliza el modelo relacional
para organizar y gestionar los datos. En este modelo, los datos se almacenan en
tablas compuestas por filas y columnas. Cada tabla representa una entidad o
relación, y las filas contienen los registros individuales, mientras que las columnas
representan los atributos o características de esos registros. La información se
relaciona a través de claves primarias y claves externas, lo que permite establecer
relaciones entre las tablas.
• Bases de datos no relacionales: también conocidas como NoSQL (Not Only SQL),
son una categoría de bases de datos que se utilizan para gestionar grandes
volúmenes de datos no estructurados o semiestructurados. A diferencia de las bases
de datos relacionales, no siguen un modelo de tablas y relaciones fijas. En su lugar,
utilizan modelos de datos más flexibles, como bases de datos de documentos,
columnares, clave-valor o de grafos. Estos modelos están diseñados para abordar
escenarios con alta escalabilidad, rendimiento y agilidad en el desarrollo.
• Bases de datos multidimensionales: son especialmente adecuadas para el análisis
y la gestión de datos multidimensionales, como los utilizados en aplicaciones de
inteligencia empresarial (BI) y análisis de datos. Estas bases de datos están diseñadas
para trabajar con datos que se pueden organizar en múltiples dimensiones, como
tiempo, ubicación y medidas. Utilizan un modelo multidimensional que permite una
estructura optimizada para consultas analíticas rápidas y eficientes.
BASE DE DATOS RELACIONALES
A continuación, algunas definiciones de base de datos relacional de algunas empresas
líderes en tecnología:
“Es un tipo de base de datos que almacena y proporciona acceso a puntos de datos
relacionados entre sí. Las bases de datos relacionales se basan en el modelo relacional, una
forma intuitiva y directa de representar datos en tablas. En una base de datos relacional,
cada fila en una tabla es un registro con una ID única, llamada clave. Las columnas de la
tabla contienen los atributos de los datos y cada registro suele tener un valor para cada
atributo, lo que simplifica la creación de relaciones entre los puntos de datos” (Oracle, s. f.).
“Una base de datos relacional organiza los datos en filas y columnas, que en conjunto
forman una tabla. Los datos normalmente se estructuran en varias tablas, que se pueden
unir a través de una clave principal o una clave externa” (IBM, s. f.b).
En resumen, una base de datos relacional es un sistema que utiliza tablas relacionadas entre
sí para almacenar y organizar datos de manera estructurada, facilitando la consulta y
manipulación de la información.
Las bases de datos relacional presentan:
• Una estructura tabular: utilizando tablas para almacenar y organizar los datos. Cada
tabla tiene un nombre único y está compuesta por filas y columnas. Las filas
representan registros individuales y las columnas representan los atributos o
campos de los datos.
• Claves primarias: cada tabla en una base de datos relacional tiene una clave
primaria que identifica de manera única cada registro dentro de la tabla. La clave
primaria garantiza la integridad y la unicidad de los datos en la tabla.
• Relaciones: las tablas usan claves externas (o claves foráneas). Estas relaciones
permiten vincular los registros de diferentes tablas, lo que facilita el acceso y la
manipulación de los datos relacionados.
• Integridad referencial: esta se refiere a la consistencia y la precisión de las
relaciones entre tablas. Donde se garantiza que los valores de las claves externas
estén relacionados correctamente con las claves primarias correspondientes en
otras tablas.
BASE DE DATOS NO RELACIONALES
A continuación, algunas definiciones de base de datos no relacionales de algunas empresas
líderes en tecnología:
“El término NoSQL se refiere a tipos de bases de datos no relacionales que almacenan datos
en un formato distinto a las tablas relacionales. Sin embargo, las bases de datos NoSQL se
pueden consultar utilizando API de lenguaje natural, lenguajes de consulta estructurados
declarativos y lenguajes de consulta mediante ejemplo, por lo que también se les llama
bases de datos no solo SQL” (Oracle, s.f.).
“NoSQL, también conocido como no solo SQL, no SQL, es un enfoque de diseño de base de
datos que permite almacenar y consultar datos fuera de las estructuras tradicionales que
se encuentran en las bases de datos relacionales” (IBM, s.f.c).
En resumen, una base de datos no relacional es un tipo de base de datos que difiere del
enfoque tradicional basado en tablas y relaciones de las bases de datos relacionales.
Ofreciendo flexibilidad, escalabilidad y alto rendimiento, y es adecuada para aplicaciones
que requieren estructuras de datos más dinámicas y tienen necesidades específicas en
cuanto al manejo de grandes volúmenes de datos.
Las bases de datos no relacionales o NoSQL presentan:
• Modelos de datos flexibles: ofreciendo una variedad de modelos de datos flexibles
que se adaptan a diferentes tipos de información y casos de uso. Algunos de los
modelos más populares son: clave-valor, documentos, columnas y grafos.
• Escalabilidad horizontal: lo cual permite distribuir los datos a través de múltiples
servidores o clústeres, permitiendo un crecimiento sencillo y el manejo de grandes
volúmenes de información.
• Esquema dinámico: por tanto, no requieren un esquema de datos fijo y
predeterminado. Esto significa que se pueden agregar o modificar campos en los
registros sin afectar a otros registros de la base de datos.
• Alto rendimiento: en velocidad y escalabilidad. Están optimizadas para realizar
consultas rápidas y eficientes, lo que las hace adecuadas para aplicaciones con
grandes volúmenes de datos y alta concurrencia.
• Distribución y replicación de los datos: en múltiples nodos o servidores. Esto
proporciona una mayor disponibilidad y tolerancia a fallos, así como la capacidad de
realizar operaciones en paralelo.
BASE DE DATOS MULTIDIMENSIONALES
A continuación, algunas definiciones de base de datos multidimensionales de empresas
líderes de tecnología:
“El cubo OLAP (del inglés Online Analytical Processing, procesamiento analítico en línea) es
una base de datos multidimensional que permite el procesamiento y análisis de datos de
manera más rápida y eficiente que una base de datos relacional tradicional. Este cubo es el
núcleo de la mayoría de los sistemas OLAP” (Microsoft, 2023).
“Una base de datos SQL Server Analysis Services es una colección de orígenes de datos,
vistas de origen de datos, cubos, dimensiones y roles. Opcionalmente, una base de datos
de SQL Server Analysis Services puede incluir estructuras para la minería de datos y
ensamblados personalizados que proporcionan una manera de agregar funciones definidas
por el usuario a la base de datos” (Microsoft, 2023).
En resumen, una base de datos multidimensional es una estructura de almacenamiento y
gestión de datos diseñada para organizar y analizar información en múltiples dimensiones.
En lugar de utilizar una estructura tabular tradicional, como en las bases de datos
relacionales, una base de datos multidimensional utiliza un enfoque basado en cubos y
matrices multidimensionales.
Una base de datos multidimensional permite:
• Organización en cubos: los cuales representan las diferentes combinaciones de
dimensiones. Cada celda del cubo contiene valores numéricos o medidas
relacionadas con las dimensiones. Por ejemplo, un cubo de ventas puede tener
dimensiones de tiempo, producto y ubicación, y las medidas podrían ser la cantidad
vendida y los ingresos generados.
• Análisis multidimensional: con lo cual se realiza análisis en múltiples dimensiones.
Donde Los usuarios pueden explorar los datos y realizar operaciones como la
agregación, el desglose y la segmentación en diferentes dimensiones. Por ejemplo,
se podría analizar las ventas por mes, por producto o por región específica.
• Esquema estrella o copo de nieve: donde una tabla de hecho central se conecta a
tablas de dimensiones. Por ejemplo, en un esquema estrella para la venta de
productos, la tabla de hechos contendría las medidas de ventas, mientras que las
tablas de dimensiones contendrían información adicional sobre tiempo, producto y
ubicación.
AVERIGUA MÁS
TE RECOMENDAMOS
Para continuar profundizando acerca de los conceptos y los tipos de base de datos. Te
invitamos a consultar e investigar en las siguientes referencias:
• Google Cloud (s. f.). ¿Qué es una base de datos relacional (RDBMS)?
[Link]
• IBM (2021). Modelos lógicos de datos.
[Link]
• Microsoft (2023). Conceptos básicos del diseño de una base de datos.
[Link]
dise%C3%B1o-de-una-base-de-datos-eb2159cf-1e30-401a-8084-bd4f9c9ca1f5
Te invitamos a revisar las siguientes referencias de interés:
• IBM (s.f.a). ¿Qué es OLAP? [Link]
• IBM (s.f.b). ¿Qué es una base de datos relacional? [Link]
es/topics/relational-databases#:~:text=el%20siguiente%20paso-
,%C2%BFQu%C3%A9%20es%20una%20base%20de%20datos%20relacional%3F,pri
ncipal%20o%20una%20clave%20externa
• IBM (s.f.c). ¿Qué son las bases de datos NoSQL? [Link]
es/topics/nosql-databases#:~:text=el%20siguiente%20paso-
,%C2%BFQu%C3%A9%20es%20una%20base%20de%20datos%20NoSQL%3F,las%2
0bases%20de%20datos%20relacionales