Microsoft Fabric: Transformación de Datos IA
Microsoft Fabric: Transformación de Datos IA
1
Microsoft Fabric
Prólogo
El mundo actual está inundado de datos: la transmisión de Y no es casualidad dado el mercado de datos y tecnología
datos constante desde los dispositivos que utilizamos, las de IA enormemente fragmentado con cientos de
aplicaciones que creamos y las interacciones que tenemos. proveedores y miles de servicios. Los clientes deben reunir
un conjunto complejo de servicios desconectados de
Organizaciones de todos los sectores han aprovechado múltiples proveedores e incurrir en los costes y las cargas
estos datos para transformarse digitalmente y obtener de hacer que estos servicios funcionen juntos.
ventajas competitivas. Y ahora que estamos entrando en
una nueva era regida por la IA, estos datos cada vez son Es por eso que hemos introducido una nueva solución,
más importantes. Microsoft Fabric, un producto de análisis completo
y centrado en las personas que reúne en un solo lugar
La IA generativa y los servicios de modelos lingüísticos, las herramientas de análisis y los datos. Fabric integra
como Azure OpenAI Service, están permitiendo a los tecnologías de eficacia probada como Azure Data Factory,
clientes utilizar y crear experiencias de IA cotidianas Azure Synapse y Microsoft Power BI en un único producto
que están reinventando la forma en que los empleados unificado, lo que permite tanto a los profesionales de datos
invierten su tiempo. Para poder disfrutar de experiencias como del negocio desbloquear el potencial de los datos
de IA específicas de cada organización se requiere un y sentar las bases para la era de la IA.
suministro constante de datos limpios desde un sistema de
análisis bien administrado y sumamente integrado. Pero los La plataforma de datos para la era de la IA:
sistemas de análisis de la mayoría de las organizaciones son presentamos Microsoft Fabric
un laberinto de servicios especializados y desconectados.
2
Índice
Prólogo2 EXPERIMENTAR Y APRENDER20 CREAR Y ESCALAR36
Estado actual de los datos, análisis y business intelligence 4
Marketing21 Crear las bases de alineación 37
El desafío: un patrimonio de datos que evoluciona
orgánicamente5 Operaciones22 Alinearse con los líderes y administradores de datos
de la organización 38
Desafíos complejos de datos y análisis 6 Recursos humanos 23
Conversaciones y preguntas para impulsar la hoja
Tendencias actuales: malla de datos, tejido de datos, Ventas24 de ruta de valor empresarial 39
centro de datos 7
Identificar a los expertos técnicos y usuarios de la empresa Conversaciones y consideraciones para impulsar
Las arquitecturas de datos modernas no son mutuamente para la prueba de concepto 26 la hoja de ruta de la infraestructura 41
excluyentes. Son transformadoras en su conjunto 8
Documentar objetivos claros para la prueba de concepto Cartografiar el patrimonio actual de datos y análisis 42
Presentamos Microsoft Fabric: una solución de y los criterios que definirán su éxito 27
análisis unificada para la era de la IA 9 Idear los planes y los resultados de la transformación 43
Usar escenarios de análisis comunes y actividades propuestas
Una solución unificada basada en SaaS que para guiar la prueba de concepto 28 Establecer una red de embajadores de la transformación 44
almacena todos los datos de la organización
donde operan las cargas de trabajo de análisis 11 Almacén de lago de datos 29 Formar a la red de embajadores 45
Enfoque en tres fases para desbloquear el valor de los datos 12 Almacén de datos 31 Estás en camino de transformar el valor de los datos 46
Sanidad15
Servicios financieros 16
Sector público 17
Sector minorista18
3
Sostenibilidad/energía 19
Estado actual de Experiencia Experiencias
inteligentes
4
VARIOS El desafío: un patrimonio
Equipo empresarial Equipo empresarial Equipo empresarial
de datos que evoluciona
orgánicamente
Equipo técnico Equipo técnico El desafío más común en los patrimonios de datos Las organizaciones tienen muchas fuentes de datos
empresariales es la evolución orgánica de los datos. on-premises o en el cloud aisladas de diferentes
Computación y servicios Computación y servicios Las empresas tienen patrimonios de datos con una proveedores en diferentes formatos que guardan
gran cantidad de datos e infraestructura redundante. información crítica. Es muy difícil encontrar
Administración de datos Administración de datos A menudo hay varios equipos que utilizan silos conocimientos profundos y precisos sin una única
de datos que no están realmente conectados. Las fuente fidedigna. Reunir las herramientas de
plataformas necesarias para transformar los datos análisis únicas que necesitan las organizaciones es
Almacenamiento Almacenamiento
en conocimientos útiles son por naturaleza muy complicado. Los costes asociados con la adquisición
técnicas y están fragmentadas. Por lo general, se y la administración de estas capacidades pueden ser
Ingesta Ingesta necesitan equipos de ingenieros y desarrolladores desorbitados. Y existe un riesgo importante asociado
para implementar y administrar estas plataformas. a la falta de gobierno.
45+55+Q
Las organizaciones saben que para tener éxito y • Dificultad para hacer que la organización
prosperar en el panorama actual en constante cambio opere basándose en los datos debido a los datos El 55 % de las empresas usa
en silos y a la falta de herramientas unificadas
55 %
deben ser capaces de transformar la enorme cantidad un enfoque principalmente
de datos que tienen en conocimientos profundos e • Equilibrar la necesidad de acceso a los datos
y los análisis en régimen de autoservicio
manual para encontrar los
impactantes. Hemos hablado con una amplia variedad
de clientes que han liderado la modernización basada mientras se mantiene el control datos internamente.
Fuente: Accenture
en datos de sus organizaciones. Y sabemos que las • Escalabilidad limitada de las soluciones
68+32+Q
empresas se enfrentan hoy en día a una gran variedad heredadas a medida que la demanda de datos
de desafíos de datos y análisis que pueden ser aumenta exponencialmente
32 %
costes y optimizando los datos y la administración limitados afirma ser capaz de
existentes Los obstáculos de tu ecosistema de datos actual obtener un valor tangible
se pueden solventar invirtiendo en una plataforma
• Conseguir la adopción de BI para optimizar y cuantificable de los datos.
el intercambio de datos y agilizar la obtención completa de datos y análisis. Cuando se generaliza la Fuente: Accenture
de conocimientos entre las líneas de negocio adopción de herramientas de business intelligence y
y los equipos análisis basadas en el cloud, es imprescindible trabajar
• Fomentar la alfabetización de datos haciendo con un partner que tenga una cartera de productos de
que los datos sean más accesibles y fáciles de seguridad fiables que permitan tomar decisiones más
manejar para los usuarios técnicos y no técnicos rápidas y basadas en datos de una manera segura. 6
Tendencias actuales:
malla de datos, tejido
de datos, centro de datos
Existen tres arquitecturas y conceptos de patrimonio de datos
que las organizaciones aplican a la modernización de su patrimonio
de datos: la malla de datos, el tejido de datos y el centro de datos.
7
Las arquitecturas de datos modernas
no son mutuamente excluyentes.
Son transformadoras en su conjunto.
25+75+Q
Sabemos que «en 2024, el 75 % de las organizaciones habrá Aunque existe un amplio debate académico en torno a estas
establecido un centro de excelencia de datos y análisis (D&A) arquitecturas modernas, la realidad es que la combinación de estas
unificado para apoyar las iniciativas federadas de D&A y evitar la constituirá la mejor solución.
75 %
quiebra de la empresa». Los datos federados, también denominados
El enfoque de Microsoft se basa en prácticas recomendadas
«estandarizados», son un componente esencial de la creación de un
perfeccionadas a lo largo de más de dos décadas de experiencia de
centro de excelencia de datos y análisis (D&A) unificado, que cada
primera mano en la creación de productos y servicios a escala global.
vez más es una prioridad clave para las organizaciones. Mediante
Comienza con una visión integral de la organización, que tiene en cuenta
la implementación de un enfoque estandarizado para administrar
a las personas, los procesos, la cultura y la tecnología. A continuación,
los datos, las organizaciones pueden garantizar que sus datos sean
mediante la aplicación del gobierno de datos, la seguridad y el
coherentes, precisos y fiables, lo que facilita el análisis y la obtención
de conocimientos a partir de ellos. cumplimiento en todas las capas de la pila, se garantiza que los clientes
tengan un entorno verdaderamente innovador que permita a todos
rendir al máximo.
Fuente: Gartner, Our Top Data & Analytics Predicts
8
Integración de datos
Esta solución ofrece una migración e integración de datos
completas para permitir un patrón basado en un lago de
Presentamos Microsoft
datos. Los conectores de Azure Data Factory permiten la
integración de datos, mientras que los conectores de Azure
Synapse Link permiten la integración de datos «sin código»
OneLake
de análisis unificada
Todos los datos se ingieren en un lago de datos de Azure
Data Storage Gen, un servicio de almacenamiento de lagos
de datos optimizado en cuanto al coste y el rendimiento
Análisis
Permitir el arte de lo posible, superar las expectativas de los clientes
Los científicos de datos pueden llevar sus plataformas de
y ofrecer valor empresarial transformador es ahora más fácil con la
computación, lenguajes, runtimes y herramientas preferidos al
introducción de Microsoft Fabric.
almacén de lago de datos y mejorar aún más los datos a través
Microsoft Fabric reúne las mejores partes de la malla de datos, el tejido de de la ingeniería de características y técnicas estadísticas.
datos y el centro de datos para proporcionar un punto único de integración
de datos, ingeniería de datos, análisis en tiempo real, ciencia de datos y Business intelligence
necesidades de business intelligence sin poner en peligro la privacidad ni la Las mejores soluciones integradas de su clase para
seguridad de los datos. Al unirte a las grandes empresas que usan Microsoft
democratizar de forma responsable la business intelligence
Fabric, permitirás que tus equipos disfruten de una solución completa
con herramientas y experiencias de autoservicio para analistas
sumamente integrada que es fácil de entender, incorporar, crear y utilizar.
de datos y usuarios amateur.
Con esta nueva solución, establecerás una fuente fidedigna unificada
al reunir todas las cargas de trabajo de análisis mediante un patrón basado Gobierno
en un lago de datos. Los equipos también podrán reducir el tiempo Microsoft Purview proporciona una solución de gobierno de
y el esfuerzo necesario para obtener conocimientos impactantes a través un solo panel que te ayuda a analizar y administrar eficazmente
del acceso democratizado a los datos. Y esto se puede hacer con total tu patrimonio de datos, incluso conforme crece y se amplía.
confianza a través de una solución gobernada y segura. 9
Microsoft Fabric
IMAGINAR
organización al transformar tu patrimonio de datos En esta guía se desglosa el viaje en tres fases: Imaginar, Experimentar
para desbloquear el valor de tus datos. Y averigua y aprender y Crear y escalar. A medida que avancemos por cada una
cómo Microsoft Fabric lo hace posible. de las fases, te ayudaremos a descubrir y considerar todos los factores
implicados en la alineación de los equipos con una fuente fidedigna
unificada, el establecimiento de un próspero centro de habilitación para
todos los usuarios con conocimientos seguros y democratizados en toda
EXPERIMENTAR
Empieza a desarrollar una cultura de datos
la organización y la obtención de un valor transformador de los datos.
y a generar confianza a través de una prueba
Y APRENDER
de concepto a menor escala que ofrezca un valor
empresarial inmediato.
Experimentar
Imaginar y aprender Crear y escalar
FASE 1: IMAGINAR
El arte de lo posible
¿Cuáles son las necesidades insatisfechas de tus clientes,
empleados, partners y proveedores y cómo puedes resolver
de forma única esas necesidades no satisfechas a través de datos
unificados, conocimientos completos y una toma de decisiones
más rápida? Echemos un vistazo más de cerca a lo que permite
hacer Microsoft Fabric a los siguientes sectores de la industria.
Sanidad
Servicios financieros
Sector público
Sector minorista
Sostenibilidad/energía
14
Experimentar
Imaginar y aprender Crear y escalar
Desafíos de los datos
• No existe una fuente exhaustiva para todos los datos agregados.
Servicios financieros
fidedigna unificada.
Sector público
fidedigna unificada.
Sector minorista
• Obtén una vista integral de todos los clientes recopilando
y analizando el comportamiento en las tiendas web, digitales
e inteligentes.
Sostenibilidad/energía
• Combina datos en tiempo real de fuentes dispares como
aerogeneradores y paneles solares y utiliza el ML y la IA para
identificar la demanda.
FASE 2
Experimentar
y aprender
El primer paso recomendado es experimentar y aprender
a través de una prueba de concepto. Empezar con un
escenario de un departamento en lugar de una situación
que se aplique a toda la organización puede ayudarte
a garantizar que el tiempo empleado se reduzca al
mínimo y que se maximice el valor obtenido.
Ten en cuenta los siguientes escenarios de departamento
al embarcarte en tu prueba de concepto.
20
Experimentar
Imaginar y aprender Crear y escalar
Marketing
Mejorar el análisis y la planificación Optimizar el gasto Optimizar el análisis de ubicaciones Mejorar el análisis de sitios web,
de las campañas en medios de pago redes sociales y correo electrónico
• Realiza un seguimiento de la eficacia de
• Unifica los datos de las campañas de diferentes • Las impresiones y los datos de ventas las campañas de conocimiento de la marca • Recopila datos en tiempo real, como
fuentes en una única ubicación para facilitar se pueden combinar con los datos de gasto a escala regional y en cada tienda recopilando impresiones, porcentajes de clics y tasas
el seguimiento del rendimiento de la campaña y atribución de medios en OneLake. datos de la tienda y del comportamiento de finalización de vídeo de anuncios digitales
frente a los objetivos y el presupuesto. en un almacén de lago centralizado. en sitios web, canales sociales y correos
• Desarrolla modelos que ayuden a identificar
• Los datos de compra y atribución se pueden • Analiza estos datos con métodos avanzados electrónicos en un solo lugar.
las mejores áreas y canales para mover
utilizar para desarrollar modelos que ayuden y presenta datos de comportamiento • Realiza análisis del rendimiento de los
el presupuesto y obtener la mayor cantidad
a identificar qué datos demográficos o áreas complejos en formatos visualmente digeribles. productos, regiones y segmentos para
de impresiones o clientes potenciales por
se deben utilizar en las campañas futuras. dinero invertido. • Mejora la comprensión de los patrones de desarrollar anuncios más específicos
• Convierte los datos en acciones recibiendo compra de los clientes combinando los datos para tus clientes objetivo.
alertas en tiempo real cuando cambien de las campañas digitales dentro de la tienda
las métricas importantes de la campaña y los datos de comercio electrónico
y ajustándolas si es necesario. en una sola vista.
• Reúne los silos de datos recopilando • Segmenta a los clientes de forma más eficaz
información en una sola vista de todas examinando las fuentes de datos del cloud
tus tecnologías de marketing: analiza varias y on-premises para identificar patrones
campañas juntas, compara datos de los de afluencia y ofertas por tiempo limitado
mercados y plataformas, etc. de acuerdo con el momento en que el grupo
demográfico objetivo está comprando.
• Realiza un seguimiento del rendimiento frente
a los objetivos y el presupuesto utilizando
informes rápidos e interactivos que te ayuden
a mostrar el ROI y a administrar el gasto.
21
Experimentar
Imaginar y aprender Crear y escalar
Operaciones
22
Experimentar
Imaginar y aprender Crear y escalar
Recursos humanos
Reducir la rotación de empleados Facilitar la planificación Supervisar beneficios, recompensas Prever tendencias de la salud
y obtener visibilidad de de la plantilla y la demanda y compensaciones de la organización
la contratación y retención
• Combina todos los datos de los • Combina los datos dispares de recursos • Prevé tendencias sanitarias, como el tipo
• Combina datos de aplicaciones financieras empleados de Dynamics 365 Human humanos en una sola ubicación mediante y la frecuencia de una enfermedad, para
y sistemas de contratación en informes Resources en un único panel para facilitar la conexión ininterrumpida con fuentes de poder prepararte para una epidemia.
personalizados en solo unos minutos, su visualización y manipulación y obtener datos on-premises y basadas en el cloud,
utilizando visualizaciones completas que un mayor conocimiento de tu negocio. como sistemas de gestión de capital humano
aceleren la obtención de conocimientos. como Dynamics 365 Human Resources
• Obtén actualizaciones importantes
y plataformas de contratación como LinkedIn
• Explora el embudo de dotación de personal rápidamente, como los cambios no
Recruiter.
o el rendimiento de los reclutadores con planificados en el presupuesto o la plantilla,
un formato intuitivo de motor de búsqueda con actualización de datos en tiempo real • Informa al instante de las métricas de
que te permite hacer preguntas a los datos y alertas móviles personalizadas. recompensas y compensaciones importantes
y obtener respuestas visuales instantáneas. creando visualizaciones y paneles
• Investiga las anomalías de planificación
personalizados, en lugar de usar soluciones
• Mantente informado de las fluctuaciones de la demanda de forma rápida y sencilla
de proveedores preconfiguradas.
en métricas clave, como cuando las tasas con informes detallados directamente desde
de retención no llegan a un determinado tu panel o aprovechando la capacidad • Investiga los picos imprevistos de uso
umbral o los puestos clave se cubren con de búsqueda propia de los motores de de beneficios u otras áreas de interés
notificaciones móviles. búsqueda para hacer preguntas a tus datos analizando al instante los informes
y obtener respuestas inmediatas. subyacentes directamente desde tu panel
y desarrolla modelos que puedan ayudar
a prever cuándo es posible que aparezcan
estos picos en el futuro.
23
Experimentar
Imaginar y aprender Crear y escalar
Ventas
Identificar mejores oportunidades Aumentar la localización Desarrollar planes mejorados Mejorar el análisis del
para las ventas adicionales de gestión de precios rendimiento de las ventas
• Adapta las iniciativas de ventas a los mercados
y cruzadas
locales para aumentar y maximizar las ventas • Crea un plan exhaustivo de gestión • Supervisa y compara métricas clave
generales. de precios para usar análisis detallados sobre de diferentes fuentes de datos en tiempo
• Reúne varios puntos de datos en una imagen
más grande y detallada para revelar patrones • Utiliza el análisis de ventas para conocer las ventas, las promociones y la competencia. real, incluidas las tasas de éxito, el número
de ventas repetidos, factores que influyen cada detalle de la conversión de ventas de ventas conseguidas, los ingresos previstos,
• Agrupa estos datos en un único panel para
en la repetición de los recorridos de ventas y poder estructurar las iniciativas de ventas, los márgenes, los descuentos, etc.
ayudar a los equipos a segmentar y analizar
y dónde se encuentran los clientes en ese las campañas promocionales e incluso rápidamente los datos de varias formas • Desarrolla un único panel al que pueda
proceso. los niveles de existencias más adecuados para ofrecer mejores estrategias de precios acceder fácilmente cualquier persona para
para los mercados locales. y promociones. que pueda rastrear estas métricas por
• Identifica oportunidades de ventas
adicionales y cruzadas y acciones su cuenta.
recomendadas para aprovechar esas • Compara las ventas reales con las previstas
oportunidades. por territorio, línea de producto y segmento
de clientes, y obtén respuestas a preguntas
como «¿qué territorio ha tenido el mayor
porcentaje de ventas el mes pasado?»
en forma de gráficos interactivos.
24
Experimentar
Imaginar y aprender Crear y escalar
Ventas
25
Experimentar
Imaginar y aprender Crear y escalar
Identificar a los expertos
técnicos y usuarios de
la empresa para la prueba
de concepto
Identifica la disponibilidad de los expertos y usuarios
de la empresa para que te ayuden durante la ejecución de la
prueba de concepto. Lo ideal sería que los responsables de la
toma de decisiones técnicas de tu organización, ya sea un líder
de TI o un líder de datos, comiencen creando requisitos claros
para la prueba de concepto. A continuación, los profesionales
de los datos como arquitectos, ingenieros, científicos de
datos y analistas ejecutarán la prueba de concepto. Y, por
último, los responsables de la toma de decisiones del negocio
o los directivos de las líneas de negocio desempeñarán un
papel importante en la evaluación de los resultados.
26
Experimentar
Imaginar y aprender Crear y escalar
HOJA DE TRABAJO
de concepto y los criterios que definirán su éxito • Reducción del número de productos
utilizados de X a Y
• Tiempo ahorrado de X a Y
Ten en cuenta que una prueba de concepto debe ser una iniciativa breve y centrada
para probar rápidamente un conjunto limitado de conceptos y prestaciones. Estos • Mejora del tiempo de desarrollo de X a Y
conceptos y prestaciones deben ser representativos de la carga de trabajo general. • Ampliar el potencial analítico entre X e Y
Empieza creando objetivos para tu prueba de concepto. mediante la incorporación de los nuevos datos
• Ampliar la base de usuarios de X a Y
Usa los objetivos para identificar pruebas específicas y proporcionar los resultados
• Satisfacer la base de usuarios demostrada por
que has identificado. Es importante que te asegures de que tienes al menos una
la puntuación X en las encuestas de usuarios
prueba para respaldar cada objetivo y el resultado previsto.
• Mejorar el rendimiento del panel de X a Y
• Reducir el tiempo hasta la obtención
de conocimientos de X a Y
Objetivo Resultado Prueba 1 Prueba 2 • Añadir valor empresarial. Esto debe ser específico
del escenario que elijas
• Evaluación comparativa del rendimiento
• Canalización de datos «low-code» o sin código
27
Experimentar
Imaginar y aprender Crear y escalar
Microsoft Fabric admite cuatro escenarios
de análisis completos comunes:
2. Almacén de datos
28
Experimentar
Imaginar y aprender Crear y escalar
Almacén de lago de datos Crea e implementa un almacén de lago de datos
completo para tu organización:
El escenario de análisis del almacén de lago de datos de Microsoft Fabric permite ingerir
datos en OneLake con accesos directos a otros repositorios, canalizaciones y flujos de datos 1. Crea un área de trabajo de Microsoft Fabric.
en el cloud para permitir a los usuarios finales aprovechar otros datos.
2. Crea rápidamente un almacén de lago de datos:
Una vez que esos datos se han introducido en Microsoft Fabric, los usuarios pueden un módulo opcional para implementar la arquitectura
usar los cuadernos para transformar esos datos en OneLake y después almacenarlos de medalla (bronce, plata y oro).
en almacenes de lagos con una estructura de medalla.
3. Ingiere, transforma y carga los datos en el almacén
Desde allí, los usuarios pueden comenzar a analizar y visualizar los datos con de lago de datos: zonas de bronce, plata y oro como
Power BI mediante el modo Direct Lake o los puntos de conexión SQL. tablas de lagos delta para la arquitectura de medalla.
30
Experimentar
Imaginar y aprender Crear y escalar
Almacén de datos Crea e implementa un almacén de datos completo
El escenario de análisis de almacén de datos utiliza las fuentes existentes instaladas, para tu organización:
mientras que las canalizaciones y los flujos de datos pueden traer todos los demás datos
que se necesitan. 1. Habilita Microsoft Fabric en tu inquilino.
Los equipos de TI pueden definir y almacenar procedimientos para transformar los datos, 2. Crea un área de trabajo de Fabric.
que se almacenan como archivos Parquet/Delta Lake en OneLake. 3. Crea rápidamente un almacén de datos.
Desde allí, los usuarios de la empresa pueden comenzar a analizar y visualizar los datos 4. Ingiere datos desde el origen hasta el modelo
con Power BI, usando de nuevo el modo Direct Lake o los puntos de conexión SQL. dimensional del almacén de datos.
Almacén de datos
7. Consulta el almacén de datos con T-SQL y un editor
Acceso directo Montajes PBI
habilitado de consultas visual.
Datos estructurados/ Canalizaciones Almacén 9. Limpia los recursos eliminando el área de trabajo
no estructurados y flujos de datos y otros elementos.
Transformar
Procedimientos
31
Experimentar
Imaginar y aprender Crear y escalar
Fuentes de datos: Microsoft Fabric simplifica y acelera la conexión
con Azure Data Services, otras plataformas de cloud y fuentes de datos
Almacén de datos
on-premises de las que se van a ingerir los datos.
32
Experimentar
Imaginar y aprender Crear y escalar
Ciencia de datos En este escenario, se podrían realizar las siguientes
El escenario de análisis de ciencia de datos se puede ingerir de forma similar a las rutas actividades:
del almacén de lago y almacén de datos.
1. Usar los cuadernos de Microsoft Fabric
Una vez ingeridos los datos, se limpian y preparan con cuadernos y, a continuación, para escenarios de ciencia de datos
se almacenan en el almacén de lago con una estructura de medalla.
2. Ingerir datos en el almacén de lago de Microsoft
Después de limpiar y almacenar los datos, los modelos de machine learning se pueden utilizando Apache Spark
entrenar y probar directamente en el almacén de lago. 3. Cargar los datos existentes de las tablas delta
del almacén de lago
Fuente de datos Limpiar y preparar Almacenar Exponer 5. Crear experimentos y ejecuciones para entrenar
un modelo de machine learning
Modelos Experimentos
33
Experimentar
Imaginar y aprender Crear y escalar
Fuentes de datos: Microsoft Fabric simplifica y acelera la conexión con
Azure Data Services, otras plataformas de cloud y fuentes de datos on-premises
Ciencia de datos
de las que se van a ingerir los datos. Con los cuadernos de Microsoft Fabric
puedes ingerir datos de los conjuntos de datos integrados del almacén de lago,
almacén de datos y Power BI, así como de varias fuentes de datos personalizadas
compatibles con Apache Spark y Python.
Explorar, limpiar y preparar: la experiencia de ciencia de datos en
MicrosoftFabric admite la limpieza de datos, la transformación, la exploración
y la caracterización utilizando las experiencias integradas de Spark y las
El escenario completo de ciencia de datos herramientas basadas en Python como Data Wrangler y SemPy Library.
Modelos y experimentos: Microsoft Fabric te permite entrenar, evaluar
Fuente de datos Limpiar y preparar Almacenar Exponer y puntuar los modelos de machine learning mediante el uso de artefactos
de experimentación y modelos integrados con integración perfecta con
MLflow para el seguimiento de los experimentos y el registro/implementación
de modelos. Microsoft Fabric también cuenta con funciones para la predicción
de modelos a escala (PREDICT) que permiten obtener y compartir conocimientos
Almacén de lago empresariales.
Cuadernos Almacenes de lagos PBI
y Almacén de datos
Almacenamiento: Microsoft Fabric utiliza Delta Lake como estándar, lo que
significa que todos los motores de Microsoft Fabric pueden interactuar con
el mismo conjunto de datos almacenado en el almacén de lago. Esta capa
Probar de almacenamiento permite almacenar datos estructurados y no estructurados,
entrenamien- y admite tanto el almacenamiento basado en archivos como el formato tabular.
Almacén A los conjuntos de datos y archivos almacenados se puede acceder fácilmente
to y aplicar de lago a través de todos los artefactos de carga de trabajo de Microsoft Fabric, como
cuadernos y canalizaciones.
Exponer análisis y conocimientos: Power BI, una herramienta líder del sector
Modelos Experimentos de business intelligence para informes y visualización, puede consumir los
datos del almacén de lago. Los datos persistentes del almacén de lago también
se pueden visualizar en cuadernos con bibliotecas de visualización nativas de
Spark o Python como matplotlib, seaborn, plotly, etc. Los datos también se
pueden visualizar con la biblioteca SemPy, que admite visualizaciones integradas
específicas de tareas para el modelo semántico de datos, las dependencias y sus
infracciones, y casos de uso de clasificación y regresión.
34
Experimentar
Imaginar y aprender Crear y escalar
Análisis en tiempo real
A diferencia de los escenarios de análisis de ciencia Una vez ingeridos en Microsoft Fabric, los datos de
de datos, almacén de lago y almacén de datos, los datos streaming se pueden almacenar en Kusto DB y reflejarse
de streaming se pueden ingerir en Microsoft Fabric en el almacén de lago. Después de almacenar los datos,
de varias maneras para realizar análisis en tiempo real. los modelos de machine learning se pueden entrenar
y probar directamente en el almacén de lago con En este escenario, se podrían realizar las siguientes
Los usuarios pueden utilizar Event Hub, IoT Hub, experimentos.
canalizaciones, flujos de datos, cuadernos o productos actividades:
de código abierto como Kafka, Logstash, etc. Al igual que con los otros escenarios, los usuarios
de la empresa pueden analizar y visualizar los datos 1. Crear una base de datos KQL
con Power BI, usando el modo Direct Lake o los puntos
de conexión SQL. Los datos también pueden exponerse 2. Crear un flujo de eventos
a través de KQL o cuadernos mediante Spark.
3. Transmitir los datos desde el flujo de eventos
El escenario completo de análisis en tiempo real
a la base de datos KQL
Fuente de datos Ingesta Almacenar Exponer 4. Comprobar los datos con consultas de ejemplo
Modelo de ML 35
Experimentar
Imaginar y aprender Crear y escalar
FASE 3
Crear y escalar
Ofrecer valor con los datos más rápidamente
no es un proceso que se pueda hacer de la noche
a la mañana. Se requiere un alto grado de coordinación
de la organización. Es necesario crear unos cimientos
de datos robustos y fiables. Y, por último, requiere
ofrecer constantemente valor empresarial y permitir
la toma de decisiones para generar confianza a través
del éxito incremental a lo largo del tiempo.
36
Experimentar
Imaginar y aprender Crear y escalar
Crear las bases de alineación
Recomendamos los siguientes pasos para garantizar que las bases
de tu recorrido sean robustas y puedas ayudar a toda la organización
a adoptar la cultura del conocimiento y la innovación.
37
Experimentar
Imaginar y aprender Crear y escalar
Alinearse con los líderes
y administradores de datos
de la organización Partes interesadas cruciales para la
transformación del patrimonio de datos
• Director financiero y otros responsables financieros
4 veces
a estas partes interesadas a obtener una visión más amplia • Directivos de investigación y desarrollo
39
Experimentar
Imaginar y aprender Crear y escalar
PREDICCIÓN
VALOR EMPRESARIAL
diagnóstico, y responde a lo que ocurrió y por qué ocurrió
40
Experimentar
Imaginar y aprender Crear y escalar
HOJA DE TRABAJO
Ingeniería
Conversaciones y consideraciones de datos y cloud,
para impulsar la hoja de ruta ETL, lagos de datos
y almacenes
de la infraestructura de datos
La coordinación del director de datos, el director de
tecnología y el director de información es imprescindible
en la transformación de tu patrimonio de datos. Garantizar
las alianzas mediante una clara alineación funcional, así como
la autoridad en la toma de decisiones y el marketing durante Conocimientos
estas iniciativas, allanará el camino para un proceso fluido.
Orquestación
HOJA DE TRABAJO
Cartografiar
el patrimonio actual Computación
de datos y análisis
Con tu equipo de infraestructura, empieza
a documentar el patrimonio de datos
actual. Asegúrate de captar qué fuentes Almacenamiento
de datos, tecnologías, escenarios de ELT/
ETL, canalizaciones de datos y dispositivos
existen. Documenta también cómo
los usuarios consumen los datos.
42
Experimentar
Imaginar y aprender Crear y escalar
Tecnología Dentro o fuera del ámbito Transformación planificada Resultados esperados
HOJA DE TRABAJO
43
Experimentar
Imaginar y aprender Crear y escalar
HOJA DE TRABAJO
Establecer una red de embajadores de la transformación Recomendamos los siguientes roles como
Empieza a formar a tu equipo de embajadores de la transformación parte de tu equipo de innovación.
de tu patrimonio de datos. Selecciona personas que trabajen bien juntas, • Jefes de departamento (vicepresidentes/directores):
pero que también provengan de diferentes funciones y competencias quienes pueden aportar importantes conocimientos
sobre la materia
en la organización, con conocimientos y experiencias diversos. Querrás
encontrar un equilibrio entre la funcionalidad y la experiencia. • Líderes de TI: administradores de infraestructura
y desarrolladores
44
Experimentar
Imaginar y aprender Crear y escalar
Formar
a la red de 1 2 3 4
embajadores Introducción a los
análisis de extremo
a extremo con
Introducción a los
almacenes de lago
Uso de Apache
Spark para trabajar
con archivos en
Uso de tablas
de Delta Lake en
en Microsoft Fabric Microsoft Fabric
Para ayudar a tu equipo a conocer mejor Microsoft Fabric Microsoft Fabric
Microsoft Fabric, hemos reunido algunos
módulos de aprendizaje:
5 6 7 8 9 10
Introducción a los
Utilizar canalizaciones Ingesta de datos con Empieza a utilizar los Introducción a la
almacenamientos Administrar
de Data Factory flujos de datos de Gen análisis en tiempo real ciencia de datos en
de datos en Microsoft Fabric
en Microsoft Fabric 2 en Microsoft Fabric en Microsoft Fabric Microsoft Fabric
Microsoft Fabric
45
Experimentar
Imaginar y aprender Crear y escalar
Microsoft Fabric
Estás en camino
de Microsoft Fabric
el valor de los
datos Suscríbete para estar al día
46