0% encontró este documento útil (0 votos)

111 vistas35 páginas

MS Fabric TalentoHumano

Cargado por

1061732145

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PPTX, PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

111 vistas35 páginas

MS Fabric TalentoHumano

Cargado por

1061732145

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PPTX, PDF, TXT o lee en línea desde Scribd

MS Fabric

Talento Humano

Prueba de Concepto
Objetivo:

Implementar una arquitectura de datos sobre MS Fabric como prueba de

concepto tomando de referencia el caso de uso para la iniciativa de
puntuación de evaluadores desarrollada por el equipo de Talento Humano.
Temas Guía:

1. Arquitectura de datos
2. Workspace
3. Lakehouse
4. Notebooks
5. Data Pipelines
6. Power BI
Arquitectura de Datos
MS Fabric

Prueba de Concepto
Arquitectura de Datos – v1

MS Fabric

Fuente de Medium / Big

Datos 1 Data

Fuente de
Datos 2 Lakehous
Power Sharepoin
Automat t Data Pipelines e Power BI
e Online
Ingesta / Orquestador Visualización
Fuente de Files Tables
Datos 3

Dataflow
Fuente de PBI Notebooks
Small
Datos n Ingesta
Data Procesamiento
Procesamient
o Workspace

Costos Ingenieria de Datos – $180.000 /hora

Costos BI - $125.00 /hora

Costos Plataforma e Infraestructura – MS Fabric – F2

Licencia PBI PRO - $9,40 EUROS
Soporte y Operación – 1 IGD
Workspace
MS Fabric
Crear una serie de carpetas para organizar el espacio de trabajo.

Pipelines
Crear los elementos de tipo
data pipeline para ingestar
datos desde diferentes
fuentes.

Notebooks
Crear los elementos de tipo
notebook para procesar datos
ingestados en el Lakehouse y
llevarlo a tablas estructuradas.

PowerBI
Permite disponer
organizadamente de un lugar
donde hacer la publicación de los
tableros de PBI.
La idea es crear una estructura de carpetas que sea negocio / iniciativa

Pipelines
Dentro de Pipelines crear la
carpeta thyso /
puntuacion_evaluadores

Notebooks
Dentro de Notebooks crear la
carpeta thyso /
puntuacion_evaluadores

Hacer lo mismo en la
carpeta de PowerBI.
Lakehouse
MS Fabric
1. Dentro del Workspace crear un nuevo elemento (Almacén de datos Lakehouse)

Crearlo con esquemas habilitado

En el Workspace se verá creado el Lakehouse.
Notebooks
MS Fabric
Agregar dos Notebooks dentro de la carpeta Notebooks / thyso /
puntuacion_evaluadores, uno para Ingestar los datos y otro para procesarlos.

El nombre de los notebooks se puede cambiar, lo ideal es que

describa claramente lo que realiza.
Notebooks

Notebook de Ingesta: este contendrá la lógica para conectarse a Sharepoint utilizando

un App Service Principal para luego descargar los archivos al Lakehouse (Files).

Para poder conectarse a Sharepoint se debe hacer uso de un

permiso especial a través de la creación de un App Service
Principal (client_id, secret_id) que es necesario para interactuar
con el repositorio online. Esta es una actividad que debe realizar
el administrador de Sharepoint en la organización.

Notebook de Procesamiento: este contendrá la lógica de procesamiento de los datos

para dejarlos accionables en la capa de visualización, aquí es donde se implementa toda la
transformación de los datos y se dejan como tablas estructuradas en el Lakehouse.
Una vez se crea el notebook, se debe vincular el Lakehouse existente (lkh_analiticagh)

2
1

3
El Lakehouse se divide entre tablas y files, la idea es construir una ruta de
almacenamiento de archivos como repositorio central de los datos que se ingestarán
desde las fuentes.
La idea es que los notebooks tengan una estructura definida con el objetivo de
estandarizar el desarrollo, en este caso se ha dividido el notebook de ingesta en las
siguientes secciones.

Introducción: descripción general del notebook

Instalación de Dependencias: sección donde se

instalan todas las librerías necesarias.

Importación de Librerías: se instancian todas las

librerías y funciones necesarias.

Funciones y Parametros: sección donde se

configuran parámetros y se definen las funciones
propias.
Ingesta de datos: se obtienen los datos desde la
fuente Sharepoint.
El notebook de procesamiento está dividido en las siguientes secciones.

Introducción: descripción general del notebook

Instalación de Dependencias: sección donde se

instalan todas las librerías necesarias.

Importación de Librerías: se instancian todas las

librerías y funciones necesarias.

Funciones y Parametros: sección donde se

configuran parámetros y se definen las funciones
propias.
Ingesta de datos: se obtienen los datos a utilizar
desde Lakehouse.

Procesamiento: lógica de estandarización, limpieza

y cálculos derivados de los datos.

Salida de datos: guardado de datos persistente en

tablas estructuradas del Lakehouse.
Data Pipelines
MS Fabric
Una vez se han desarrollado los notebooks (ingesta y procesamiento) se deberá crear un
Data Pipeline dentro de la carpeta Pipelines, el cual orquestará la ejecución de los
notebooks, este también permite configurar una programación para que se realice de
manera periódica.

Crear el data pipeline con el nombre 01_ORQ_Data_Sharepoint

Se deberá seleccionar la opción ‘actividad de canalización’ y buscar la opción ‘Bloc de
Notas’
Automáticamente se creará una actividad de tipo Bloc de Notas, la cual debemos
configurar seleccionando el espacio de trabajo, luego se listarán los notebooks allí
creados. Como previamente ya hemos creado los dos notebooks entonces se debe crear
una actividad que ejecutara el notebook de ingesta y luego otra actividad que ejecute el
notebook de procesamiento.
El Pipeline de datos se vera de la siguiente manera, la primera actividad apunta al
notebook de ingesta y la segunda al notebook de procesamiento.

Teniendo en cuenta que en este caso estamos usando el

comando %pip install en los notebooks para instalar las
librerías en línea, se debe adicionar el siguiente
parámetro en la actividad del pipeline para que no
genere error.
Para ejecutar el pipeline a demanda, podemos hacer clic en la opción ‘Ejecutar’.

Se iniciará la ejecución de todo

el pipeline (orquesta la
ejecución de los notebooks)
Una vez finaliza la ejecución del Data Pipeline, podemos ver los resultados.
Podemos ir al Lakehouse y corroborar que se haya creado el archivo de la ingesta y
también la tabla en el Lakehouse producto del procesamiento.

1
2

En el espacio de trabajo abrimos el

Lakehouse.

En el caso que no aparezca se debe refrescar. Se

evidencia la tabla creada y el archivo descargado desde
Sharepoint.
Power BI
MS Fabric
Ahora, debemos conectar un tablero PBI a la tabla estructurada en el Lakehouse para
construir la capa de visualización. Se debe copiar el String de conexión SQL.

Para visualizar el string de conexión, en el lakehouse ir a ‘Configuración’, luego en la

opción ‘Punto de Conexión de Análisis SQL’ y copiar la cadena de conexión.

qca4gwlorzxupn4x75qijzazdy-
[Link]
Desde PBI, conectar una nueva fuente de datos, y seleccionar ‘Lakehouse’

Se listarán los Lakehouse que tiene permisos el usuario, en este

caso el tablero de PBI esta autenticado con el mismo usuario que
creo el Lakehouse, por ello se muestra en la lista.

Seleccionar el Lakehouse y luego en la opción conectar,

seleccionar ‘Conectar al punto de conexión SQL’, pues es el que
nos da acceso a las tablas estructuradas.
Seleccionar la tabla requerida, hay tablas de control del Lakehouse y las tablas propias.

Se listarán todas las tablas del Lakehouse, entre ellas la

nueva que creamos en el esquema thyso.

Es posible que se demore un poco en listarla, se debe

esperar unos minutos y volver a intentar la conexión.
En Power BI desktop ya podemos trabajar con los datos, crear las visualizaciones,
medidas, etc. Utilizando los datos directamente desde Lakehouse.
Desde Power BI también podemos hacer la conexión al Lakehouse utilizando el conector
de SQL Server.
Se listarán las tablas
1
3

Pegar el string de conexión SQL

qca4gwlorzxupn4x75qijzazdy-
[Link]
Una vez que el tablero ha sido construido, se deberá publicar en el Servicio de Power
BI. Autenticado con el usuario que tiene permisos en el Workspace hacer clic en Publicar.
Seleccionar la ruta dentro del Workspace dentro de la carpeta ‘PowerBI’ que hemos
creado al inicio.

Se iniciará la publicación del

tablero en el servicio de PBI
Terminada la publicación, podemos ir al Workspace a la ruta de publicación y veremos el
tablero y el conjunto de datos o modelo semántico.

También podría gustarte

? Glosario de Conceptos Clave en Microsoft Fabric
Aún no hay calificaciones
? Glosario de Conceptos Clave en Microsoft Fabric
4 páginas
Ingeniería de datos en Microsoft Fabric
Aún no hay calificaciones
Ingeniería de datos en Microsoft Fabric
698 páginas
Ejercicio - Creación de Una Instancia de Microsoft Fabric Lakehouse
Aún no hay calificaciones
Ejercicio - Creación de Una Instancia de Microsoft Fabric Lakehouse
10 páginas
Presentacion Power BI Por Herwig Poleyn
Aún no hay calificaciones
Presentacion Power BI Por Herwig Poleyn
14 páginas
Diagrama de flujo de Power BI
Aún no hay calificaciones
Diagrama de flujo de Power BI
3 páginas
INAD-20241 MS Fabric - Implementación de Un Datawarehouse 64ha - Informe
Aún no hay calificaciones
INAD-20241 MS Fabric - Implementación de Un Datawarehouse 64ha - Informe
8 páginas
Guía de IA
Aún no hay calificaciones
Guía de IA
35 páginas
Instalación de Herramientas BI y MongoDB
Aún no hay calificaciones
Instalación de Herramientas BI y MongoDB
10 páginas
Configuración de API y Base de Datos en Python
Aún no hay calificaciones
Configuración de API y Base de Datos en Python
7 páginas
INAD-20241 MS Fabric - Implementación de Un LakeHouse 64ha
Aún no hay calificaciones
INAD-20241 MS Fabric - Implementación de Un LakeHouse 64ha
8 páginas
Arquitectura de Power BI
Aún no hay calificaciones
Arquitectura de Power BI
14 páginas
Análisis de Datos con Azure Databricks
Aún no hay calificaciones
Análisis de Datos con Azure Databricks
19 páginas
Carga de Archivos Parquet en Azure DataFactory
Aún no hay calificaciones
Carga de Archivos Parquet en Azure DataFactory
37 páginas
Curso de Datos
Aún no hay calificaciones
Curso de Datos
9 páginas
Evidencias Plan Practica III 20231014 GregorioPalma E1
Aún no hay calificaciones
Evidencias Plan Practica III 20231014 GregorioPalma E1
24 páginas
Máster en Big Data y Analytics
Aún no hay calificaciones
Máster en Big Data y Analytics
7 páginas
Plan de Trabajo para Inteligencia de Negocios
Aún no hay calificaciones
Plan de Trabajo para Inteligencia de Negocios
7 páginas
Herramientas Esenciales para Científicos de Datos
100% (1)
Herramientas Esenciales para Científicos de Datos
26 páginas
Herramientas Esenciales para Científicos de Datos
Aún no hay calificaciones
Herramientas Esenciales para Científicos de Datos
26 páginas
Introducción a Microsoft Power BI
Aún no hay calificaciones
Introducción a Microsoft Power BI
9 páginas
Gestión de Archivo - Unidad 3
Aún no hay calificaciones
Gestión de Archivo - Unidad 3
4 páginas
SOP Proyectos PBI-ABI
Aún no hay calificaciones
SOP Proyectos PBI-ABI
17 páginas
Sesion 01-PBI
Aún no hay calificaciones
Sesion 01-PBI
57 páginas
Enlazando Componentes a Bases de Datos
Aún no hay calificaciones
Enlazando Componentes a Bases de Datos
7 páginas
Guía de Diseño de Bases de Datos
Aún no hay calificaciones
Guía de Diseño de Bases de Datos
28 páginas
Informes y Consultas de Business Intelligence
Aún no hay calificaciones
Informes y Consultas de Business Intelligence
10 páginas
Brief Fabric Architect
Aún no hay calificaciones
Brief Fabric Architect
2 páginas
Informe Semanal de Ingeniería en Ciencia de Datos
Aún no hay calificaciones
Informe Semanal de Ingeniería en Ciencia de Datos
37 páginas
Guía Completa de Microsoft Power BI
Aún no hay calificaciones
Guía Completa de Microsoft Power BI
29 páginas
Fabric Fundamentals
Aún no hay calificaciones
Fabric Fundamentals
995 páginas
Tópicos Avanzados en Bases de Datos
Aún no hay calificaciones
Tópicos Avanzados en Bases de Datos
10 páginas
03 - Tutorial Power BI PDF
75% (4)
03 - Tutorial Power BI PDF
2836 páginas
Gestión y Visualización de Datos en Power BI
Aún no hay calificaciones
Gestión y Visualización de Datos en Power BI
9 páginas
Construcción e Implementación de BD con MySQL y Power BI
Aún no hay calificaciones
Construcción e Implementación de BD con MySQL y Power BI
108 páginas
Fundamentos de Power BI y su Uso
Aún no hay calificaciones
Fundamentos de Power BI y su Uso
7 páginas
Reportes Power BI para Gestión de Tickets
Aún no hay calificaciones
Reportes Power BI para Gestión de Tickets
24 páginas
Arquitectura Del Software y Hardware
Aún no hay calificaciones
Arquitectura Del Software y Hardware
14 páginas
Proyecto de Bigdata
Aún no hay calificaciones
Proyecto de Bigdata
14 páginas
Diagrama de Clases As Is
Aún no hay calificaciones
Diagrama de Clases As Is
2 páginas
Preguntas Importantes de Bda
Aún no hay calificaciones
Preguntas Importantes de Bda
4 páginas
Guía Completa de Power BI Desktop
100% (6)
Guía Completa de Power BI Desktop
56 páginas
Herramientas y Funciones en Power Builder
Aún no hay calificaciones
Herramientas y Funciones en Power Builder
26 páginas
Crear Una Aplicación Web Utilizando Visual Basic o C#Visual Studio
Aún no hay calificaciones
Crear Una Aplicación Web Utilizando Visual Basic o C#Visual Studio
22 páginas
M11b-Arquitecturas de Macrodatos - Azure Architecture Center - Documentos de Microsoft
Aún no hay calificaciones
M11b-Arquitecturas de Macrodatos - Azure Architecture Center - Documentos de Microsoft
12 páginas
Diseño de Cubos OLAP en BI
Aún no hay calificaciones
Diseño de Cubos OLAP en BI
44 páginas
Bases de Datos Paralelas y MapReduce
Aún no hay calificaciones
Bases de Datos Paralelas y MapReduce
27 páginas
Modelamiento de Datos y Dashboards en Minería
Aún no hay calificaciones
Modelamiento de Datos y Dashboards en Minería
8 páginas
Guía Completa de Microsoft Power BI
Aún no hay calificaciones
Guía Completa de Microsoft Power BI
5 páginas
Power BI: Preparación y Análisis de Datos
Aún no hay calificaciones
Power BI: Preparación y Análisis de Datos
32 páginas
Sílabo Curso Diseño e Ingeniería de Datos 2023-3
Aún no hay calificaciones
Sílabo Curso Diseño e Ingeniería de Datos 2023-3
6 páginas
Curso de Bases de Datos y Big Data
Aún no hay calificaciones
Curso de Bases de Datos y Big Data
3 páginas
Tópicos Avanzados en Bases de Datos
Aún no hay calificaciones
Tópicos Avanzados en Bases de Datos
4 páginas
Cómo compartir informes en Power BI
Aún no hay calificaciones
Cómo compartir informes en Power BI
44 páginas
Especialización en SQL y Python BI
Aún no hay calificaciones
Especialización en SQL y Python BI
10 páginas
Actividad 2.2 Sistema Operativo GNU LINUX
Aún no hay calificaciones
Actividad 2.2 Sistema Operativo GNU LINUX
6 páginas
1AMA0461 - Guía de Instalación de R y RCommander
Aún no hay calificaciones
1AMA0461 - Guía de Instalación de R y RCommander
15 páginas
Atajos Del Teclado en Windows
Aún no hay calificaciones
Atajos Del Teclado en Windows
2 páginas
Base de Datos para Inventario Automatizado
Aún no hay calificaciones
Base de Datos para Inventario Automatizado
46 páginas
Montar Cloud Computing: Guía Esencial
Aún no hay calificaciones
Montar Cloud Computing: Guía Esencial
28 páginas
Catálogo Fotográfico Teresa Carreño
Aún no hay calificaciones
Catálogo Fotográfico Teresa Carreño
264 páginas
Anexo Notarios y Registradores 2017
Aún no hay calificaciones
Anexo Notarios y Registradores 2017
32 páginas
Manual de Manejo de Historia Clinica
100% (1)
Manual de Manejo de Historia Clinica
14 páginas
Guía para Crear un Proyecto Django
Aún no hay calificaciones
Guía para Crear un Proyecto Django
10 páginas
Guía para Editar el Registro de Windows
Aún no hay calificaciones
Guía para Editar el Registro de Windows
23 páginas
Términos de Referencia: Ingeniería Básica
Aún no hay calificaciones
Términos de Referencia: Ingeniería Básica
30 páginas
Guía Completa de Programación con OpenMP
Aún no hay calificaciones
Guía Completa de Programación con OpenMP
47 páginas
Configuración y Puesta en Marcha Del Sistema
Aún no hay calificaciones
Configuración y Puesta en Marcha Del Sistema
21 páginas
Integrar Subtítulos en Blue-Rays
Aún no hay calificaciones
Integrar Subtítulos en Blue-Rays
21 páginas
Multiproceso y Jerarquía de Procesos
Aún no hay calificaciones
Multiproceso y Jerarquía de Procesos
2 páginas
Curso de Diseño Gráfico en Corel Draw
Aún no hay calificaciones
Curso de Diseño Gráfico en Corel Draw
6 páginas
Software WinFlume para Aforadores de Agua
Aún no hay calificaciones
Software WinFlume para Aforadores de Agua
49 páginas
Programa de Asignatura: Programación I
Aún no hay calificaciones
Programa de Asignatura: Programación I
7 páginas
EYP1113 Laboratorio 02 PDF
Aún no hay calificaciones
EYP1113 Laboratorio 02 PDF
51 páginas
Crear Barra de Herramientas en NetBeans
Aún no hay calificaciones
Crear Barra de Herramientas en NetBeans
4 páginas
Manual Dia V 0.97.1
88% (8)
Manual Dia V 0.97.1
99 páginas
Primitiva Novena de La Santísima Virgen Del Rosario
Aún no hay calificaciones
Primitiva Novena de La Santísima Virgen Del Rosario
23 páginas
Instructivo para Nuevo Envia OnLine
Aún no hay calificaciones
Instructivo para Nuevo Envia OnLine
27 páginas
Desastres de software: 20 casos impactantes
100% (1)
Desastres de software: 20 casos impactantes
6 páginas
Manejo de Archivos en Lenguaje Ensamblador
Aún no hay calificaciones
Manejo de Archivos en Lenguaje Ensamblador
4 páginas
Características del sistema NTFS
Aún no hay calificaciones
Características del sistema NTFS
6 páginas
Informe Final Uso de Internet
0% (1)
Informe Final Uso de Internet
9 páginas
NTC-ISO 14641-1: Archivado Electrónico
Aún no hay calificaciones
NTC-ISO 14641-1: Archivado Electrónico
14 páginas
Eje 3 Sistemas Operativos
100% (1)
Eje 3 Sistemas Operativos
37 páginas
Introducción a Windows 10
Aún no hay calificaciones
Introducción a Windows 10
49 páginas