0% encontró este documento útil (0 votos)
80 vistas43 páginas

DP 900T00A ES PowerPoint - 01

El documento describe conceptos básicos de datos como estructurados, semiestructurados y no estructurados. También cubre roles como administrador de base de datos, ingeniero de datos y analista de datos junto con sus tareas y herramientas comunes.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PPTX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
80 vistas43 páginas

DP 900T00A ES PowerPoint - 01

El documento describe conceptos básicos de datos como estructurados, semiestructurados y no estructurados. También cubre roles como administrador de base de datos, ingeniero de datos y analista de datos junto con sus tareas y herramientas comunes.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PPTX, PDF, TXT o lee en línea desde Scribd

Módulo 1: Explorar los

conceptos de datos base


Nombre del autor
Fecha

© Copyright Microsoft Corporation. All rights reserved.


Explorar los conceptos básicos de datos

Explorar los roles, tareas y responsabilidades en el mundo


de los datos (opcional)

Agenda Describir los conceptos de datos relacionales

Examinar los conceptos de datos no relacionales

Explorar los conceptos de análisis de datos

© Copyright Microsoft Corporation. All rights reserved.


Lección 1: Explorar los conceptos básicos de datos

© Copyright Microsoft Corporation. All rights reserved.


Identificar cómo se definen y almacenan los datos.

Identificar características de datos relacionales y no


relacionales.
Objetivos
de la
lección 1 Describir y diferenciar las cargas de trabajo de datos.

Describir y diferenciar datos por lotes y en streaming.

© Copyright Microsoft Corporation. All rights reserved.


¿Qué son los datos?
Colección de hechos, números, descripciones, objetos, almacenados de forma estructurada,
semiestructurada y no estructurada.
Estructurados Semiestructurados No estructurados
Tabla

© Copyright Microsoft Corporation. All rights reserved.


Almacenes de datos transaccionales frente a analíticos
Procesamiento transaccional en línea (OLTP) Procesamiento analítico en línea (OLAP)

Cliente
IDdeCliente CustomerName CustomerPhone

Pedidos
OrderID IDdeCliente OrderDate

Los datos se cargan, agregan


y almacenan en la nube
Los datos se almacenan periódicamente
transacción a transacción

© Copyright Microsoft Corporation. All rights reserved.


Cargas de trabajo transaccionales

Los datos transaccionales son información que realiza un seguimiento de las


interacciones relacionadas con las actividades de una organización.
• Atomicidad: cada transacción se trata como una
sola unidad que triunfa o fracasa por completo.
• Coherencia : una transacción solo puede llevar los
datos de la base de datos de un estado válido a -$
otro.
• Aislamiento: la ejecución concurrente de
+$
transacciones deja la base de datos en el mismo
estado.
• Duración: una vez que una transacción se ha
comprometido, permanecerá comprometida.

© Copyright Microsoft Corporation. All rights reserved.


Cargas de trabajo analíticas

Las cargas de trabajo analíticas se utilizan para el análisis de datos y la toma


de decisiones.
• Summaries Transacciones de 2020

• Tendencias

• Información
empresarial

© Copyright Microsoft Corporation. All rights reserved.


Procesamiento de datos
El procesamiento de datos es la conversión de datos sin procesar en información
significativa a través de un proceso.

Procesamiento por lotes: los A diario


elementos de datos se recopilan en Trabajo
por lotes
un grupo. Luego, todo el grupo se
procesa en el futuro como un lote Todas las
Todas las
entradas salidas

Carga del Carga del


Procesamiento de secuencia: cada sistema sistema
nuevo dato se procesa cuando llega.
Entrada 1 Entrada 2

© Copyright Microsoft Corporation. All rights reserved.


Lección 1: Prueba de conocimientos
¿Cómo se organizan los datos en una tabla relacional?
 Filas y columnas
 Encabezado y pie de página
 Páginas y párrafos

¿Cuál de las siguientes opciones es un ejemplo de datos no estructurados?


 Una tabla de empleados con columnas con id. de empleado, nombre y designación de empleado

 Archivos de audio y vídeo

 Una tabla dentro de la base de datos de SQL Server

¿Cuál de las siguientes opciones es un ejemplo del conjunto de datos de streaming?


 Datos de las fuentes del sensor

 Datos de ventas del último mes

 Lista de empleados que trabajan para una compañía


Lección 2: Explorar los roles, tareas y responsabilidades en el
mundo de los datos

© Copyright Microsoft Corporation. All rights reserved.


Explorar roles de trabajo de datos

Objetivos
Explorar tareas y herramientas comunes para roles de
de la trabajo de datos
lección 2

© Copyright Microsoft Corporation. All rights reserved.


Roles en los datos

Administrador de base
Ingeniero de datos Analista de datos
de datos
Administración de base de datos Procesos y canalizaciones de datos Proporciona conclusiones sobre los
datos
Implementa la seguridad de los Almacenamiento de ingesta de
datos datos Informes visuales
Copias de seguridad Prepara datos para el análisis Modelado de datos para análisis
Acceso de usuarios Prepara datos para el Combina datos para visualización
procesamiento analítico y análisis
Supervisa el rendimiento
Herramientas comunes: Administrador de la base de datos

SQL Server
Azure Data Studio Azure Portal/CLI
Management Studio
Interfaz gráfica para administrar Interfaz gráfica para administrar Herramientas para la
servicios de datos locales y basados servicios de datos locales y basados administración y el
en la nube. en la nube. aprovisionamiento de Azure
Data Services.
Se ejecuta en Windows, macOS, Se ejecuta en Windows.
Linux. Ejecución manual y automatizada
Herramienta integral de
de scripts usando Azure Resource
administración de bases de datos.
Manager o interfaz de scripting de
la línea de comandos.
Herramientas comunes: Ingeniería de datos

SQL Server
Azure Synapse Studio Azure Portal/CLI
Management Studio
Azure Portal integrado para Interfaz gráfica para administrar Herramientas para la
administrar Azure Synapse. servicios de datos locales y basados administración y el
en la nube. aprovisionamiento de recursos de
Ingesta de datos (Azure Data
Azure.
Factory). Se ejecuta en Windows.
Ejecución manual y automatizada
Administración de recursos de Herramienta integral de
de scripts usando Azure Resource
Azure Synapse (grupos de administración de bases de datos.
Manager o interfaz de scripting de
SQL/grupo de Spark).
la línea de comandos.
Herramientas comunes: Analista de datos

Portal de Power BI/


Power BI Desktop Power BI Report Builder
Servicio Power BI
Herramienta de visualización de Crear y administrar informes de Herramienta de visualización de
datos. Power BI. datos para informes paginados.
Modelar y visualizar datos. Crear paneles de Power BI. Modelar y visualizar informes
paginados.
Administración de recursos de Compartir informes/conjuntos de
Azure Synapse (grupos de datos
SQL/grupo de Spark).
Lección 2: Prueba de conocimientos
¿Cuál de las siguientes tareas es un rol de un administrador de base de datos?
 Copias de seguridad y restauración de bases de datos
 Crear paneles e informes
 Identificar problemas de calidad de datos

¿Cuál de las siguientes herramientas es para la visualización y generación de informes?


 SQL Server Management Studio

 Power BI

 SQL

¿Cuál de los siguientes roles no es una función de datos?


 Administrador de sistemas

 Analista de datos

 Administrador de base de datos


Lección 3: Describir los conceptos de datos relacionales

© Copyright Microsoft Corporation. All rights reserved.


Explorar las características de los datos relacionales

Objetivos
de la Defina tablas, índices y vistas
lección 3

Explorar los servicios de cargas de trabajo de datos


relacionales en Azure

© Copyright Microsoft Corporation. All rights reserved.


Identificar casos de uso de bases de datos relacionales
IoT:
Aunque se suelen considerar como datos no relacionales, los datos de dispositivos de IoT pueden estar
estructurados y ser coherentes

Procesamiento de transacciones en línea:


Por ejemplo, sistemas de pedidos que realizan muchas actualizaciones transaccionales pequeñas

Almacenamiento de datos:
Una cantidad enorme de datos se puede importar de diferentes fuentes y estructurar para poder realizar
consultas de alto rendimiento

© Copyright Microsoft Corporation. All rights reserved.


Tablas
Clientes
Los datos se almacenan en una tabla
IDdeCliente CustomerName CustomerPhone
100 Mateo Lara XXX-XXX-XXXX
101 Noam Maoz XXX-XXX-XXXX La tabla consta de filas y columnas
102 Vanja Matkovic XXX-XXX-XXXX
103 Qamar Mounir XXX-XXX-XXXX
Todas las filas tienen el mismo
104 Oscar Zamora XXX-XXX-XXXX número de columnas
105 Alexander Romero XXX-XXX-XXXX
106 Eduardo Ponce XXX-XXX-XXXX Cada columna está definida por un
107 Francisco Robles XXX-XXX-XXXX
tipo de dato

© Copyright Microsoft Corporation. All rights reserved.


Entidades
Clientes
IDdeCliente CustomerName CustomerPhone
100 Mateo Lara XXX-XXX-XXXX
101 Noam Maoz XXX-XXX-XXXX
102 Vanja Matkovic XXX-XXX-XXXX
103 Qamar Mounir XXX-XXX-XXXX
104 Oscar Zamora XXX-XXX-XXXX
105 Alexander Romero XXX-XXX-XXXX
106 Eduardo Ponce XXX-XXX-XXXX
Una entidad es una representación de un elemento que puede ser físico (como un cliente o un producto)
o virtual (como un pedido).
Las entidades se conectan mediante relaciones, que permiten interactuar con ellas. Por ejemplo, un cliente
puede realizar un pedido de un producto

© Copyright Microsoft Corporation. All rights reserved.


Normalización
Clientes Pedidos
IDdeCliente CustomerName CustomerPhone OrderID CustomerName CustomerPhone
100 Mateo Lara XXX-XXX-XXXX AD100 Noam Maoz XXX-XXX-XXXX
101 Noam Maoz XXX-XXX-XXXX AD101 Noam Maoz XXX-XXX-XXXX
102 Vanja Matkovic XXX-XXX-XXXX AD102 Noam Maoz XXX-XXX-XXXX
103 Qamar Mounir XXX-XXX-XXXX AX103 Qamar Mounir XXX-XXX-XXXX
104 Oscar Zamora XXX-XXX-XXXX AS104 Qamar Mounir XXX-XXX-XXXX
105 Alexander Romero XXX-XXX-XXXX AR105 Alexander Romero XXX-XXX-XXXX
106 Eduardo Ponce XXX-XXX-XXXX MK106 Mateo Lara XXX-XXX-XXXX
Los datos se normalizan para:
Reducir el almacenamiento. Evitar la duplicación de datos. Mejorar la calidad de los datos.

© Copyright Microsoft Corporation. All rights reserved.


Relaciones
Clientes Pedidos
IDdeCliente CustomerName CustomerPhone OrderID IDdeCliente SalesPersonID
100 Mateo Lara XXX-XXX-XXXX AD100 101 200
101 Noam Maoz XXX-XXX-XXXX AD101 101 200
102 Vanja Matkovic XXX-XXX-XXXX AD102 101 200
103 Qamar Mounir XXX-XXX-XXXX AX103 103 201
104 Oscar Zamora XXX-XXX-XXXX AS104 103 201
105 Alexander Romero XXX-XXX-XXXX AR105 105 200
106 Eduardo Ponce XXX-XXX-XXXX MK106 105 201
En un esquema de base de datos normalizado:
Las claves primarias y externas se utilizan para No existe duplicación de datos (excepto los Los datos se recuperan uniendo tablas
definir relaciones. valores de clave en 3.ª forma normal (3NF). en una consulta

© Copyright Microsoft Corporation. All rights reserved.


Índices
Clientes IDX-CustomerRegion
IDdeCliente CustomerName CustomerPhone IDdeCliente Región
100 Mateo Lara XXX-XXX-XXXX 100 Francia
101 Noam Maoz XXX-XXX-XXXX 101 Brasil
102 Vanja Matkovic XXX-XXX-XXXX 102 Croacia
103 Qamar Mounir XXX-XXX-XXXX 103 Jordán
104 Oscar Zamora XXX-XXX-XXXX 104 España
105 Alexander Romero XXX-XXX-XXXX 105 Francia
106 Eduardo Ponce XXX-XXX-XXXX 106 EE. UU.
Un índice:
Reduce la cantidad de páginas de datos que deben
Optimiza las consultas de búsqueda para una Los datos se recuperan uniendo tablas
leerse para recuperar los datos en una instrucción
recuperación de datos más rápida. en una consulta
SQL.

© Copyright Microsoft Corporation. All rights reserved.


Vista
Clientes Pedidos Crear la definición de una
vista:

IDdeCliente CustomerName CustomerPhone OrderID IDdeCliente SalesPersonID CREATE VIEW


vw_customerorders AS

100 Mateo Lara XXX-XXX-XXXX AD100 101 200 SELECT


Customers.CustomerID,
AD101 101 200
101 Noam Maoz XXX-XXX-XXXX Customers.CustomerName,
Orders.OrderID FROM
AD102 101 200 Customers JOIN Orders on
102 Vanja Matkovic XXX-XXX-XXXX
AX103 103 201 Customers.CustomerID =
Orders.CustomerID
103 Qamar Mounir XXX-XXX-XXXX AS104 103 201 Recupere los pedidos
104 Oscar Zamora XXX-XXX-XXXX AR105 105 200
realizados por el cliente
102 utilizando la vista:
105 Alexander Romero XXX-XXX-XXXX MK106 105 201 SELECT CustomerName,
OrderID from
106 Eduardo Ponce XXX-XXX-XXXX DB205 100 205 vw_customerorders WHERE
CustomerID=102
Una vista es una tabla virtual que se basa en el conjunto de resultados de la consulta:
Las vistas se crean para simplificar la consulta. Combinan datos relacionales en una vista única de panel.

© Copyright Microsoft Corporation. All rights reserved.


Lección 3: Prueba de conocimientos
¿Cuál de las siguientes afirmaciones es una característica de una base de datos relacional?
 Todos los datos deben almacenarse como cadenas de caracteres.
 Una fila en una tabla representa una sola entidad
 Diferentes filas en la misma tabla pueden contener diferentes columnas

¿Qué es un índice?
 Una estructura que le permite ubicar filas en una tabla rápidamente, usando un valor indexado
 Una tabla virtual basada en el conjunto de resultados de una consulta
 Una estructura que comprende filas y columnas que usa para almacenar datos

© Copyright Microsoft Corporation. All rights reserved.


Lección 4: Examinar los conceptos de datos no relacionales

© Copyright Microsoft Corporation. All rights reserved.


Explore las características de los datos no relacionales

Objetivos
de la Defina los tipos de datos no relacionales
lección 4

Describa NoSQL y los tipos de bases de datos no relacionales

© Copyright Microsoft Corporation. All rights reserved.


Explorar las características de los datos no relacionales
Entidades
## Customer 1 ID: 1
Nombre: Mark Hanson
Teléfono: [ Domicilio: 1-999-9999999, Empresa: 1-888-8888888, Móvil: 1-777- 7777777 ]
Dirección: [ Domicilio: 121 Main Street, Alguna ciudad, NY, 10110,
Trabajo: 87 Big Building, Some City, NY, 10111 ]
## Customer 2 ID: 2
Título: D.
Nombre: Jorge Salgado
Teléfono: [ Domicilio: 0044-1999-333333, Móvil: 0044-17545-444444 ]
Dirección: [ Reino Unido: 86 High Street, Ciudad, Condado, GL8888, Reino Unido,
EE. UU.: 777 7th Street, Another City, CA, 90111 ]

Las colecciones no relacionales pueden tener:

Varias entidades en la misma colección o Un esquema diferente Se suelen definir etiquetando cada campo con el
contenedor con campos diferentes no tabular nombre que representan

© Copyright Microsoft Corporation. All rights reserved.


Identificar casos de uso de bases de datos no relacionales
IoT y telemática:
A menudo requieren ingerir grandes cantidades de datos en ráfagas frecuentes de actividad, los datos
son semiestructurados o estructurados, a menudo requieren procesamiento en tiempo real

Comercio y marketing:
Escenarios comunes para datos distribuidos globalmente, almacenamiento de documentos

Juegos:
Estadísticas del juego, integración en redes sociales, marcadores, aplicaciones de baja latencia

Web y móvil:
Se suelen usar con análisis de clics en web y aplicaciones modernas que incluyen bots

© Copyright Microsoft Corporation. All rights reserved.


Tipos de datos no relacionales
¿Qué son los datos semiestructurados?
La estructura de datos se define en los mismos datos por medio de campos. Los tipos
de formato/archivo incluyen:

JSON AVRO ORC Parquet

© Copyright Microsoft Corporation. All rights reserved.


¿Qué son los datos no estructurados?
No contienen campos de forma natural:
Ejemplos: vídeo, audio, streaming de elementos multimedia y documentos

A menudo se usa para extraer la organización de datos y categorizar o identificar “estructuras”

Se usa con frecuencia en combinación con las capacidades de Machine Learning o Cognitive
Services para "extraer datos" mediante:
Text Analytics
Análisis de sentimiento con API cognitivas
Vision API

© Copyright Microsoft Corporation. All rights reserved.


¿Qué es NoSQL?
Término suelto para describir no relacional

Bases de datos de
Almacenes clave- Basado en Bases de datos de
familias de
valor documentos grafos
columnas

© Copyright Microsoft Corporation. All rights reserved.


¿Qué es una base de datos de gráficos?
Almacenes de entidades centradas en relaciones

Permite que las aplicaciones realicen consultas


atravesando una red de nodos y bordes

© Copyright Microsoft Corporation. All rights reserved.


Lección 4: Prueba de conocimientos
¿Cuál de los siguientes servicios debería utilizar para implementar una base de datos no relacional?
 Azure Cosmos DB
 Azure SQL Database
 La API de Gremlin

¿Cuál de las siguientes es una característica de las bases de datos no relacionales?


 Las bases de datos no relacionales contienen tablas con registros planos de columna fija
 Las bases de datos no relacionales requieren el uso de técnicas de normalización de datos para reducir la duplicación de datos
 Las bases de datos no relacionales no tienen esquemas o tienen esquemas laxos

Está creando un sistema que supervisa la temperatura en un conjunto de bloques de oficinas y configura el aire acondicionado
en cada sala de cada bloque para mantener una temperatura ambiente agradable. Su sistema tiene que administrar el aire
acondicionado en varios miles de edificios repartidos por el país o la región, y cada edificio suele contener al menos 100 salas
con aire acondicionado. ¿Qué tipo de almacén de datos NoSQL es el más apropiado para capturar los datos de temperatura y así
permitir que se procesen rápidamente?
 Un almacén de valores clave
 Una base de datos de familias de columnas
 Escribir las temperaturas en un blob de Azure Blob Storage
Lección 5: Explorar los conceptos de análisis de datos

© Copyright Microsoft Corporation. All rights reserved.


Más información sobre la ingesta y el procesamiento
de datos

Objetivos
de la Explorar la visualización de datos
lección 5

Explorar los análisis de datos

© Copyright Microsoft Corporation. All rights reserved.


El viaje de los datos
Procesamiento Visualización
Ingesta de datos de datos de datos
El proceso de obtener e importar datos para Toma los datos sin procesar, los limpia y los Consultar los datos y crear representaciones
su uso inmediato o almacenamiento en una convierte a un formato más valioso gráficas de la información y los datos
base de datos
ETL
Extracción, transformación y carga

Dispositivos de IoT

Consultas

Transacciones ELT
financieras
Extracción, carga y transformación

Punto de venta Visualizaciones


Datos

© Copyright Microsoft Corporation. All rights reserved.


Visualización de datos
Un modelo de negocio puede contener una gran cantidad de
información: existen técnicas para analizar y comprender la
información de sus modelos

Informes Inteligencia empresarial (BI) Visualización de datos

©Microsoft Corporation
Azure
Explorar los análisis de datos

Descriptivo Diagnóstico Predictivo Prescriptivo Cognitivo

© Copyright Microsoft Corporation. All rights reserved.


Lección 5: Prueba de conocimientos
¿Qué es la ingesta de datos?
 El proceso de transformar datos sin procesar en modelos que contienen información significativa.
 Analizar datos en busca de anomalías
 Recopilar streaming de datos sin procesar de varios orígenes y almacenarlos

¿Cuál de los siguientes objetos visuales muestra los principales colaboradores a un resultado o valor
seleccionado?
 Elementos influyentes clave
 Gráfico de columnas y barras
 Gráfico de matriz

¿Qué tipo de análisis responder preguntas sobre lo que sucedió en el pasado?


 Análisis descriptivo
 Análisis prescriptivo
 Análisis predictivo
de cierre

© Copyright Microsoft Corporation. All rights reserved.

También podría gustarte