ACTIVIDAD 2:
DIAGRAMA
Fecha:24/09/2023
Nombre del estudiante: Edwin Fernando Heredia May
Nombre del docente: Cuauhtémoc Leon Puertos
En esta actividad se desarrollarán los siguientes temas:
Modelo de proceso
Componentes de un modelo
Modelo de Proceso
1. Conforme al material revisado esquematiza en un diagrama un modelo de
proceso de datos. Identifica en cada etapa los procesos de datos involucrados
cuando aplique. Destaca los elementos que contiene el modelo revisado:
• Fases
• Características
• Tipos de procesos de datos involucrados
• Procesos de soporte
El modelado de datos es el proceso de diagramación de los flujos de datos. Al
crear la estructura de una base de datos nueva o alternativa, el diseñador
comienza con un diagrama del flujo de los datos por dentro y fuera de la base de
datos. Este diagrama se usa para definir los formatos y estructuras de los datos
y las funciones de gestión de la base de datos, a fin de dar un soporte eficiente
al flujo de datos. Una vez creada e implementada la base de datos, el modelo de
datos es la documentación y justificación de por qué existe la base de datos y
cómo se diseñaron los flujos.
¿Por qué es importante el modelado de datos?
Un modelo de datos integral y optimizado ayuda a crear una base de datos
lógica simplificada que elimina la redundancia, reduce los requisitos de
almacenamiento y permite una recuperación eficiente. También equipa a todos
los sistemas con una "única fuente de verdad" –que es esencial para operaciones
eficaces y cumplimiento regulatorio–. El modelado de datos es un paso clave en
dos funciones vitales de una empresa digital.
¿Cuáles son los tipos de modelado de datos?
Los tres principales modelos de datos son relacional, dimensional, y de
entidad-relación (E-R). También hay otros cuyo uso no está generalizado,
incluyendo jerárquico, en red, orientado a objetos, y multivalor. El tipo de modelo
define la estructura lógica –el modo en que se almacenan, organizan y recuperan
los datos–.
Relacional: Aunque el enfoque es "más antiguo", el modelo de base de datos
más común que aún se usa hoy en día es relacional, que almacena los datos en
registros de formato fijo y organiza los datos en tablas con filas y columnas. El
tipo más básico de modelo de datos tiene dos elementos: indicadores y
dimensiones. Los indicadores son valores numéricos, como cantidades e
ingresos, que se usan en cálculos matemáticos como suma o promedio. Las
dimensiones pueden ser de texto o numéricas. No se usan en cálculos e incluyen
descripciones o ubicaciones. Los datos brutos se definen como un indicador o
una dimensión. Otra terminología usada en el diseño de la base de datos
relacional incluye "relaciones" (la tabla con filas y columnas), "atributos"
(columnas), "tuplas" (filas) y "dominio" (conjunto de valores permitidos en una
columna). Si bien hay términos adicionales y requisitos estructurales que definen
una base de datos relacional, el factor importante son las relaciones definidas
dentro de esa estructura. Los elementos de datos comunes (o claves) vinculan
tablas y conjuntos de datos. Las tablas también se pueden relacionar
explícitamente, como las relaciones principales y secundarias, como ser uno a
uno, uno a varios o varios a varios.
Dimensional: Menos rígido y estructurado, el enfoque dimensional favorece
una estructura de datos contextual que está más relacionada con el uso o
contexto de negocio. Esta estructura de base de datos está optimizada para
consultas online y herramientas de almacenamiento de datos. Los elementos de
datos críticos, como una cantidad de transacción, por ejemplo, se denominan
"hechos" y van acompañados de información de referencia llamada
"dimensiones", ya sea el ID de producto, el precio unitario o la fecha de
transacción. Una tabla de hechos es una tabla primaria en un modelo
dimensional. La recuperación puede ser rápida y eficiente, con datos para un tipo
específico de actividad almacenados juntos, pero la falta de vínculos de relación
puede complicar la recuperación analítica y el uso de los datos. Dado que la
estructura de datos está vinculada con la función de negocio que produce y usa
los datos, la combinación de datos producidos por sistemas diferentes (en un
almacén de datos, por ejemplo) puede ser problemática.
Rico en entidades (E-R): Un modelo E-R representa una estructura de datos
de negocio en forma gráfica que contiene cuadros de varias formas para
representar actividades, funciones o "entidades" y líneas para representar
asociaciones, dependencias o "relaciones". El modelo E-R se usa para crear una
base de datos relacional con cada fila que representa una entidad y los campos
de esa fila contienen atributos. Como en todas las bases de datos relacionales,
los elementos de datos "clave" se usan para vincular tablas.
¿Cuáles son los tres niveles de abstracción de datos?
Existen muchos tipos de modelos de datos, con diferentes tipos de layouts. La
comunidad de procesamiento de datos identifica tres tipos de modelado que
representan el nivel de desarrollo.
Modelo conceptual de datos
El modelo de "panorama general" representa la estructura general y el
contenido, pero no el detalle del plan de datos. Es el punto de partida típico para
el modelado de datos, que identifica los diversos data sets y flujos de datos en
toda la organización. El modelo conceptual es el blueprint para el desarrollo de
los modelos lógicos y físicos, y es una parte importante de la documentación de
la arquitectura de datos.
Modelo lógico de datos
El segundo nivel de detalle es el modelo lógico de datos. Se relaciona más
estrechamente con la definición general de "modelo de datos" dado que describe
el flujo de datos y el contenido de la base de datos. El modelo lógico añade
detalles a la estructura general del modelo conceptual pero no incluye
especificaciones para la propia base de datos, ya que puede aplicarse a varias
tecnologías y productos. (Tenga en cuenta que quizás no haya un modelo
conceptual si el proyecto se relaciona con una sola aplicación u otro sistema
limitado).
Modelo de datos físico
El modelo de base de datos física describe los detalles de cómo se realizará
el modelo lógico. Debe contener suficiente detalle para permitir a los tecnólogos
crear la estructura real de la base de datos en hardware y software para soportar
las aplicaciones que lo usarán. Huelga decir que el modelo físico de datos es
específico de un sistema de software de base de datos designado. Puede haber
varios modelos físicos derivados de un único modelo lógico si se usan diferentes
sistemas de base de datos.
Procesos y técnicas de modelado de datos
El modelado de datos es inherentemente un proceso descendente, que
comienza con el modelo conceptual para establecer la visión general, luego pasa
al modelo lógico, y finalmente al diseño detallado del modelo físico.
Construir el modelo conceptual es convertir una idea en una forma gráfica que
se asemeje al diagrama de flujo de un programador.
Las herramientas modernas para modelado de datos pueden ayudar a definir
y crear bases de datos y modelos de datos lógicos y físicos. Estas son algunas
técnicas y pasos típicos de modelado de datos:
Determine entidades y cree un diagrama de entidad-relación (ERD). Las
entidades se pueden describir como "elementos de datos de interés para su
negocio". Por ejemplo, “cliente” sería una entidad. “Ventas” sería otra. Un ERD
documenta cómo estas diferentes entidades se relacionan entre sí en su
empresa, y qué conexiones existen entre ellas.
Defina sus hechos, indicadores y dimensiones. Un hecho es la parte de sus
datos que indica una ocurrencia o transacción específica, como la venta de un
producto. Sus indicadores son cuantitativos, como cantidad, ingresos, costos,
etc. Sus dimensiones son indicadores cualitativos, como descripciones,
ubicaciones y fechas.
Crear un enlace de vista de datos usando una herramienta gráfica o mediante
consultas SQL. Si no está familiarizado con SQL, la herramienta gráfica es la
opción más intuitiva, lo que le permite arrastrar y soltar elementos en su modelo
y crear sus conexiones visualmente. Al crear una vista, tiene la opción de
combinar tablas e incluso otras vistas en una sola salida. Al seleccionar una
fuente en la vista gráfica y arrastrarla encima de una fuente ya asociada con la
salida, tendrá la opción de unir o crear una unión de estas tablas.
Las soluciones analíticas modernas también pueden ayudar a elegir, filtrar y
conectar fuentes de datos usando una función gráfica de arrastrar y soltar. Hay
herramientas avanzadas disponibles para los típicos expertos en datos de TI –
pero los demás usuarios también pueden crear sus propias historias generando
modelos de datos con herramientas visuales, y organizando tablas, gráficos,
mapas y otros objetos para contar historias basadas en la información estratégica
de los datos
1. Recopilación de datos
El procesamiento y análisis de datos parte recopilando los datos de las fuentes
de almacenamiento que estén disponibles y que contengan información de
calidad. Por lo que deberán estar en óptimas condiciones y actualizadas.
Estas fuentes pueden estar compuestas por ejemplo de un almacén de datos
o de un data lake. El primero debe estar nutrido con los datos arrojados por los
departamentos de ventas, de servicios, de marketing, finanzas, etc.
El segundo, es un almacén centralizado de información del big data de
diversas fuentes que pueden estar o no estructuradas, con almacenamiento en
la nube y con etiquetas de búsqueda.
2. Preparación de datos
En este punto comienza la preparación para su organización, la detección de
errores y el descarte de información repetitiva e incompleta. De este modo, pasa
a seleccionar la información necesaria y puntual con la que se trabajará para el
procesamiento y análisis de datos.
3. Introducción de datos
Los datos ya seleccionados ahora son enviados a sus destinos
correspondientes, traducidos a un lenguaje entendible.
A partir de aquí, los datos en bruto comienzan a tomar forma como información
útil, que podrá visualizarse, por ejemplo, en un CRM o en un almacén de datos.
Por ello también se define como el “pre-procesamiento”.
4. Procesamiento / limpieza de datos
En esta etapa, los datos procesados por la etapa anterior son finalmente
preparados y optimizados para su uso final. Esto ocurre a través de algoritmos
por medio de una técnica de programación denominada machine learning.
Lo que ayuda a tu computadora a aprender de forma autónoma sobre todos
los datos e información que está recibiendo para que actúe como corresponda.
Así podrá realizar la actividad prevista de diagnóstico o estudio de la
interpretación realizada.
5. Interpretación de datos
¿Recuerdas las gráficas, tablas, documentos y demás que tendrías para
trabajar óptimamente? Es en este punto será cuando finalmente tendrás todo el
resultado de las etapas previas. De una forma totalmente entendible para ti y los
miembros que la requieran.
Ahora tus proyectos de analítica necesarios para la optimización de tu
empresa podrán ser realizados con mayor facilidad, rapidez y eficacia.
Mejorando así la productividad del trabajo de todos de forma considerable.
6. Almacenamiento de datos
Finalmente, queda la última etapa de este proceso que consiste en el
almacenamiento de toda esta información útil resultante del procesamiento y
análisis de datos.
Para su uso inmediato o posterior según convenga, con la tranquilidad de que
estarán conservados bajo la legislación de protección de datos.
2. Desarrolla un reporte en el que incluyas los siguientes puntos:
• Planteamiento: Explica los procesos de datos involucrados para cada
etapa.
Nivel Inicial: Calidad de datos es la cualidad de un conjunto de información
recogida en una base de datos, un sistema de información que reúne entre
sus atributos la exactitud, completitud, integridad, actualización, coherencia,
relevancia, accesibilidad y confiabilidad necesarias para resultar útiles al
procesamiento, análisis y cualquier otro fin que un usuario quiera darles.
Nivel Definido: Procesos enfocados a los proyectos, son repetibles,
reactivos, consiste en el chequeo de datos, los cuales se integran
dependiendo del método de procesamiento que se vaya a usar para este fin .
Es una agrupación de datos para clasificarlos según el sistema que se vaya a
usar.
Nivel Integrado: Permite combinar datos heterogéneos de muchas fuentes
diferentes en la forma y estructura de una única aplicación. Esto facilita que
diferentes tipos de información, tales como matrices de datos, documentos y
tablas, sean fusionados por usuarios, organizaciones y aplicaciones para un uso
personal, de procesos de negocio o de funciones.
Nivel Gestionado: La organización desarrolla procesos propios, los cuales son
documentados y utilizados, son evaluados constantemente y mejorados.
También se planifica la gestión de mediciones del proyecto para desarrollar
planes para conseguir las medidas en gestión de la calidad de datos.
Nivel Optimizado: El proyecto es cuantitativamente cuestionado y las métricas
son usadas para mejorar su rendimiento, por lo cual el proceso sigue mejorando
continuamente, también tenemos el análisis para la gestión de la prevención de
errores, la cual identifica la raíz de las causas de la baja calidad de datos,
así mismo se desarrolla una gestión organizacional y de información para
mejorar el rendimiento del proyecto.
• Diagrama de modelo de procesos: incluye la imagen del diagrama
generado en Lucidchart
Lucidchart. Recuperado de
https://www.lucidchart.com/pages/es/ejemplos/herramientas-bpm
Plantillas de Herramienta BPM Online y Modelador de Procesos
3. Redacta una conclusión en la que expliques la importancia de un modelo
basado en procesos para una adecuada administración y funcionamiento de las
bases de datos.
Conclusión
Un modelo de datos completo y bien pensado es clave para el desarrollo de una
base de datos verdaderamente funcional, útil, segura y precisa. Comience con el
modelo conceptual para presentar todos los componentes y funciones. Luego,
adapte esos planes dentro de un modelo de datos lógico que describa flujos y defina
qué datos se necesitan y cómo serán adquiridos, gestionados, almacenados y
distribuidos. El modelo de datos lógico dirige el modelo físico que es específico para
una base de datos, y es el documento de diseño detallado que guía la creación de
la base de datos y el software de la aplicación.
Un buen modelado de datos y diseño de la base de datos son esenciales para
desarrollar aplicaciones funcionales, confiables y seguras, y bases de datos que
funcionan bien con almacenes de datos y herramientas analíticas –y facilitan el
intercambio de datos con los socios de negocio y entre múltiples aplicaciones–. Los
modelos de datos bien pensados ayudan a garantizar la integridad de los datos,
haciendo que los datos de su empresa sean aún más valiosos y confiable
4. Elabora el reporte en este mismo documento.
5. Al finalizar esta actividad, vuelve a la plataforma y sigue los pasos que se indican
para enviar tu trabajo.
* * *
Referencias
Bantu Group. (s/f). Las 6 etapas del procesamiento y análisis de datos.
Bantugroup.com. Recuperado el 25 de septiembre de 2023, de
https://www.bantugroup.com/blog/etapas-del-procesamiento-y-analisis-de-datos
Evaluación de la madurez de la gestión de datos: protección de auditoría,
2012, https://es.alydata.com/datamaturity,
Modelos de Madurez en los Datos de una Organización, RevActaNova. v.5
n.4 Cochabamba sep. 2012,
http://www.scielo.org.bo/scielo.php?script=sci_arttext&pid=S1683-
07892012000200004#f4, .
¿Qué es el modelado de datos? (s/f). SAP. Recuperado el 25 de septiembre de
2023, de https://www.sap.com/latinamerica/products/technology-
platform/datasphere/what-is-data-modeling.html
Calidad de Datos. Cómo impulsar tu negocio con los datos, 2022,
https://www.powerdata.es/calidad-de-datos,