La Guía Definitiva para Desarrollar Una Estrategia de Datos Integral
La Guía Definitiva para Desarrollar Una Estrategia de Datos Integral
La guía definitiva
para desarrollar
una estrategia
de datos integral
Tres atributos clave para ayudar a su organización
a obtener más valor de los datos
Índice
Los datos son la luz que lo guían a una innovación significativa .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
Tres atributos clave que pueden ayudar a su organización a obtener más valor de los datos .. . 5
Exhaustiva . ..... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
Integrada ........ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
Gobernada . ..... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2
I N T R O D U CCIÓ N
Los datos son la luz que ¿Existe una estrategia de datos comprobada?
La respuesta es “Sí”.
lo guían a una innovación La buena noticia es que no tiene que reinventar la rueda. Las organizaciones
ya están aprovechando los beneficios de una estrategia de datos integral
significativa basada en Amazon Web Services (AWS). Por ejemplo, AstraZeneca integra
y escala sus capacidades de datos e inteligencia artificial (IA) en toda la
Ahora más que nunca, los datos están en el centro de cada aplicación, proceso empresa con el fin de innovar más rápido y mejorar los resultados de los
y decisión empresarial. Es la génesis de la invención moderna, y en el panorama pacientes. Con los servicios de datos de AWS, ahora pueden ejecutar más de
complicado y cambiante de hoy en día, la forma en que pone a trabajar los datos 51 mil millones de pruebas estadísticas en menos de 30 horas, lo que facilita
de su organización puede ser la clave para acelerar la innovación y lograr los la entrega de información genómica para proyectos de descubrimiento de
objetivos de su organización. Hay mucho en juego. Según Forrester Research, medicamentos. BMW Group y muchos otros fabricantes utilizan los datos para
las organizaciones que cuentan con un sistema para promover la información optimizar sus cadenas de suministros y mejorar la capacidad de producción.
controlada por datos tienen un 140 % más de probabilidades de crear una ventaja Organizaciones como LG AI Research están sacando partido de los datos
competitiva sostenible y un 78 % más de probabilidades de impulsar un entorno para desarrollar aplicaciones de IA generativa que transformen los procesos
de crecimiento de los ingresos.1 empresariales y amplíen el acceso a la IA en diferentes sectores, como la moda,
la fabricación, la investigación, la educación y las finanzas.
Con una necesidad urgente de capacitar a toda la organización a fin de usar
los datos para tomar decisiones mejores y más rápidas que impulsen nuevas Si bien los logros son ilimitados, el desafío central es que muchas organizaciones
ideas e inciten la agilidad empresarial, los líderes están aceptando una verdad tienen un tesoro escondido de datos, pero no saben cómo obtener valor de ellos.
fundamental: el viaje hacia la innovación empieza por los datos, y convertirse En este libro electrónico, aprenderá los aspectos básicos de la creación de una
con éxito en una organización impulsada por datos comienza a partir de la estrategia de datos integral con el fin de mantenerse al día con sus necesidades
implementación de una estrategia de datos integral. de datos ahora y en el futuro, lo que permite una ventaja sostenible que proviene
de desbloquear el valor de sus datos.
1
Creating a data-driven culture, CIO.com, marzo de 2022
3
C Ó M O C O N V E R T IR SE E N U N A O R G A N I Z A CIÓ N B A S A DA E N DAT O S
Gartner informa que el 65 % de las decisiones que se toman hoy son más
complejas (involucran a más partes interesadas u opciones) que hace cinco Los datos son cada vez más difíciles de proteger
años.2 Para agilizar y mejorar la toma de decisiones, las organizaciones Hubo una época en que los equipos de TI elegían entre desarrollar arquitecturas
necesitan la capacidad de realizar operaciones de análisis y machine learning rápidas o seguras. Ahora, necesitan de ambos aspectos. Los ataques de seguridad
(ML) de una manera ágil y rentable, utilizando herramientas y rendimiento aumentaron un 31 % de 2020 a 2021, según el informe State of Cybersecurity
óptimos para escalar en cada caso de uso. Las organizaciones ya no pueden Resilience 2021 de Accenture, en cuanto el promedio de ataques por organización
perder tiempo valioso implementando y configurando de nuevo y en forma aumentó de 206 a 270 de un año a otro.4 Pero ¿cómo pueden las organizaciones
constante la infraestructura para escalar el rendimiento y la capacidad. maximizar la privacidad y la seguridad?
2
How to Make Better Business Decisions, Gartner, octubre de 2021
3
Half of AI Models Never Make It To Production: Gartner, EnterpriseAI, agosto de 2022 4
4
State of Cybersecurity Resilience 2021: How aligning security and the business creates cyber resilience, Accenture, 2021
C Ó M O C O N V E R T IR SE E N U N A O R G A N I Z A CIÓ N B A S A DA E N DAT O S
Según una encuesta de PwC a más de mil ejecutivos sénior, las organizaciones que se basan en
gran medida en datos tienen tres veces más probabilidades de informar mejoras significativas
en la toma de decisiones en comparación con aquellas que dependen menos de los datos.5
Gobernada
AWS puede ayudar a su organización a implementar una estrategia integral que facilite
la administración de datos en cada paso del trayecto, desde la ingesta, el almacenamiento
y la consulta de datos hasta el análisis, la visualización y la ejecución de modelos del ML.
Independientemente de los desafíos de su empresa, su estrategia de datos debe ser:
1. Exhaustiva: equipada con las herramientas adecuadas, con una relación óptima entre
precio y rendimiento para cualquier tipo de usuario, caso de uso y tipo de datos
2. Integrada: con la capacidad de integrar datos almacenados y analizados en diferentes
herramientas y sistemas para poder obtener una mejor comprensión de su empresa
y predecir qué ocurrirá
3. Gobernada: con políticas de gobernanza de todos sus datos a fin de permitir el acceso a
estos de manera segura cuando y donde lo necesiten sus usuarios para acelerar la innovación
Una mentalidad impulsada por los datos también puede requerir un cambio cultural más
amplio en el que ambos objetivos y decisiones estén respaldados por la estrategia de datos.
Siga el enlace a continuación con el fin de explorar por qué los datos juegan un rol vital para
permitir este cambio cultural. Y descubra por qué cada vez más empresas aprovechan las
capacidades impulsadas por datos con el objetivo de automatizar un conjunto de casos de uso
críticos para la empresa.
6
E X H A U ST I VA
Para tomar decisiones en tiempo real, necesitará servicios de streaming de datos como Amazon
Kinesis Data Streams (Amazon KDS), lo que le permite crear aplicaciones para datos de eventos
94 %
de alta frecuencia, como datos de secuencias de clics y obtener acceso a información en segundos.
Amazon Kinesis Data Firehose carga flujos de datos de manera simple y confiable en lagos de
datos, almacenes y servicios de análisis, sin necesidad de extracción, transformación y carga (ETL)
ni preparación de datos engorrosa.
AWS también brinda un amplio rango de servicios que le permiten agregar capacidades de IA
como reconocimiento de imágenes, predicción y búsqueda inteligente a aplicaciones con una
simple llamada a la API. Si desea crear sus propios modelos de ML, Amazon SageMaker le brinda
todas las herramientas necesarias para crear, entrenar e implementar modelos de ML a escala.
Además, Amazon SageMaker JumpStart brinda FM no disponibles en Amazon Bedrock, como
Cohere y LightOn, además de modelos de código abierto, como FLAN-T5, GPT-J y Bloom.
8
EXHAUSTIVA Escale la toma de decisiones basadas
en datos en toda su organización
• Amazon QuickSight: satisfaga las diversas
Habilitación de información de datos en toda la organización
necesidades analíticas desde la misma fuente
Ya no son solo las personas expertas en datos las que pueden extraer con rapidez información de verdad a través de paneles interactivos
valiosa y relevante de los datos para ayudar a informar la toma de decisiones. Las soluciones de modernos, informes paginados, análisis
BI basadas en ML, como Amazon QuickSight, permiten una fácil conectividad con los orígenes integrados y consultas en lenguaje natural
de datos. Los analistas de empresas pueden utilizar estos datos para mostrar nuevas tendencias • Amazon SageMaker Canvas: interfaz sin
e información predictiva en visualizaciones y tableros de BI interactivos. código de AWS que permite a los analistas
de empresas generar predicciones precisas
Amazon QuickSight Q usa ML, lo que permite a los usuarios consultar sus datos en un lenguaje
de ML sin experiencia previa
sencillo sin escribir una sola línea de código. Los usuarios empresariales pueden incluso
cuestionar los “por qué” para comprender mejor los factores que afectan las tendencias de • Amazon DataZone: simplifica el acceso
datos. También pueden prever métricas con instrucciones como “Pronóstico de ventas para los gobernado a los datos para usuarios
próximos 12 meses” y, así, recibir una respuesta inmediata basada en la información de los datos de empresas
pasados y la estacionalidad. Una interfaz visual de seleccionar y hacer clic permite a los analistas • AWS Training and Certification: más
de empresas generar predicciones precisas de ML sin experiencia previa. Con solo unos pocos de 150 cursos de desarrollo profesional
clics, los analistas pueden importar datos de varias fuentes, preparar datos de forma automática, relacionados con datos, análisis y ML
y crear y analizar modelos de ML. • Amazon Bedrock: la forma más sencilla de
crear y escalar aplicaciones de IA generativa
Impulso del dominio de los datos con FM
Tener empleados que puedan usar los datos de manera efectiva ayudará a su organización
a lograr sus objetivos de datos. Invierta en educar y mejorar las habilidades de su personal
en cuanto a datos, análisis y ML con la formación de AWS.
9
HIST O R I A D E U N C LIE N T E
10
HIST O R I A D E U N C LIE N T E
11
2
Integrada
Eliminación de los silos para poner los datos en uso de forma efectiva
12
I N T EG R A DA Conéctese con cientos de orígenes
Sin operaciones ETL de datos
• Amazon AppFlow: integre lagos de datos
Muchas organizaciones tienen varios lagos de datos además de almacenamientos de datos,
y almacenamientos de datos con más
herramientas de análisis, herramientas de ML y aplicaciones de software como servicio (SaaS).
de 50 fuentes de datos
La integración de datos entre silos requiere canalizaciones de ETL complejas, que pueden llevar
horas, si no días. Eso no es lo suficientemente rápido para la toma de decisiones moderna. Las • AWS Data Exchange: acceda a más
organizaciones deben adoptar tecnologías que automaticen o eliminen ETL cuando sea posible. de 350 proveedores de terceros y más
de 3500 productos de datos públicos
AWS está invirtiendo en un futuro sin ETL, lo que permite a las organizaciones integrar de forma
• Amazon SageMaker Data Wrangler: cree
automática todos sus datos. Esto incluye llevar ML al origen de datos con la integración de
modelos de ML con más de 40 orígenes
SageMaker en Amazon Redshift, Amazon Aurora, Amazon Athena y Amazon Neptune, integrando
de datos con un solo clic
Amazon Aurora y Amazon Redshift para análisis en tiempo real y proporcionando una integración
directa entre Amazon S3 y Amazon Redshift en lo que respecta a flujos de datos en tiempo
real. Además, puede ejecutar consultas en datos almacenados en bases de datos operativas,
almacenamientos de datos y lagos de datos con el fin de proporcionar información a través de
múltiples orígenes de datos sin movimiento de datos utilizando Amazon Athena y Amazon Redshift.
13
HIST O R I A D E U N C LIE N T E
Cómo la entrega de
datos permite a Goldman
Sachs trabajar de manera
más inteligente
Goldman Sachs ha visto aumentar de manera exponencial la demanda
de datos del mercado financiero, por lo general duplicándose año
tras año. AWS Data Exchange es un servicio administrado que permite
centralizar, optimizar y automatizar los procesos de datos siempre
que sea posible. La migración de las fuentes de datos de mercados
existentes a AWS Data Exchange puede mejorar la eficiencia general
del consumo de datos de terceros, lo que permite dedicar más tiempo
al análisis de valor agregado de los datos y menos a analizar los datos
a fin de prepararlos para su uso. La entrega de datos sin fricción
a través de AWS Data Exchange es fundamental a fin de preparar
la organización para el futuro.
14
HIST O R I A D E U N C LIE N T E
ENGIE acelera
su transición a cero
emisiones de carbono
Una empresa global de servicios públicos en el proceso de una
transición a cero emisiones de carbono, ENGIE construyó su lago
de datos Common Data Hub en AWS. ENGIE recibió el apoyo
de AWS Professional Services en el diseño e implementación de
la solución y la formación de un equipo de servicio interno para
monitorear la plataforma. Con más de mil proyectos en todo el
mundo actualmente en el Common Data Hub, esta solución cohesiva
elimina los silos, dando a todos los departamentos acceso igualitario
a un marco de datos común.
15
3
Gobernada
Libere a sus equipos para que se muevan más rápido con el acceso a datos
gobernados a lo largo del ciclo de vida de los datos
A medida que más datos migran a la nube, impulsados por la escala casi infinita
y la potencia de la nube, es imperativo que los modelos de gobernanza de datos
de las empresas evolucionen juntos. Los líderes empresariales y de TI necesitan
políticas actualizadas para proteger los datos a medida que avanzan y retroceden
entre diferentes repositorios y para adaptarse a las cambiantes normas de
privacidad y seguridad de datos sobre dónde se pueden almacenar los datos.5
6
Wexler, J., A unified approach to data governance, CIO, agosto de 2021
16
G O B E R N A DA Gobernanza holística con AWS
Simplificación de los permisos de acceso a datos • AWS Lake Formation: facilita la gobernanza
La implementación de una estrategia de gobernanza exitosa continúa presentando un conjunto único y la auditoría de las acciones realizadas con
de desafíos. A las organizaciones les lleva mucho tiempo y les representa un desafío proporcionar los datos en su lago de datos en Amazon S3
a los consumidores internos o externos sus datos con el nivel adecuado de acceso a conjuntos de • Amazon DataZone: un servicio de
datos específicos. A menudo se dedican a tareas complejas, como scripts manuales o investigación administración de datos para catalogar,
de clústeres de datos individuales, para averiguar qué consumidores tienen acceso a qué datos. descubrir, compartir y gobernar datos
El trabajo manual también puede generar problemas costosos de calidad de datos en diferentes
equipos y departamentos. Sin herramientas de gobernanza centralizadas, los datos se bloquean
en silos, lo que significa que no podrá acceder y analizar todos los datos que pueda necesitar
para resolver problemas o identificar grandes áreas de oportunidad.
The Best Offense Is a Great Defense, TechCrunch Brand Studio, patrocinado por AWS, 2022
17
7
8
The Economic Impact of Data Innovation 2023, Splunk, 2022
G O B E R N A DA
AWS brinda un exhaustivo conjunto de recursos para ayudarlo a controlar y garantizar que los
modelos de IA y ML se crean de manera responsable, con prácticas de datos que reducen el sesgo
y protegen la privacidad de los datos. Esto incluye capacidades diseñadas para un fin específico
como Amazon SageMaker Clarify, herramientas de transparencia como tarjetas de servicio de
IA de AWS, tarjetas de modelos de Amazon SageMaker y, por supuesto, un curso de Machine
Learning University (MLU) sobre imparcialidad y sesgo. Los científicos de datos pueden utilizar
controles de gobernanza en SageMaker para obtener visibilidad integral de los modelos de ML,
incluido el entrenamiento, el historial de versiones y el rendimiento del modelo, todo ello en un
único lugar. Los modelos de base de Amazon Titan, que puede utilizar para crear aplicaciones de
IA generativa, están diseñados para detectar y eliminar contenido dañino en los datos, rechazar
contenido inapropiado en la entrada del usuario y filtrar salidas de modelos que contengan
contenido inapropiado, como incitación al odio, blasfemias y violencia.
18
HIST O R I A D E U N C LIE N T E
Al simplificar la gobernanza,
OneFootball experimentó
un aumento del 40 % en la
utilización de su plataforma
de análisis
OneFootball ha crecido con rapidez hasta convertirse en una de las
plataformas de medios digitales más populares del mundo para los
entusiastas del fútbol. Para utilizar mejor los datos en beneficio de la
empresa y de los 70 millones de fanáticos del “juego más hermoso”,
OneFootball creó una solución más ágil en AWS en tan solo unos
días. Desde que integró los datos desde sus bases de datos backend
en su lago de datos basados en la nube, OneFootball ha simplificado
de forma radical la ingesta de datos y ha eliminado por completo las
cargas de trabajo de ETL heredadas. Un hermoso juego, ciertamente.
Pinterest utiliza la
gobernanza para colocar a
los clientes en primer lugar
Un sistema de control de acceso escalable y automatizado detallado (FGAC)
creado utilizando Amazon S3 aseguró que los crecientes datos de Pinterest
no superarían los controles existentes de la empresa. FGAC controla el acceso
a los datos y se basa en diversos criterios que ofrecen opciones como el control
de acceso basado en roles con seguridad para conjuntos de datos a escala de
petabytes. También permitió a los creadores y a las empresas de la plataforma
identificarse a sí mismos como miembros de un grupo poco representado y, al
mismo tiempo, garantizar que la información confidencial no se utilizaría para
ningún otro propósito, como la publicidad.
• Obtener información con mayor rapidez: ofrezca el nivel adecuado de acceso a sus recursos
en todo momento con la certeza de que sus datos están protegidos. Al crear seguridad en AWS
se tiene en cuenta el rendimiento, por lo que se obtiene la máxima protección y gobernanza AWS Lake Formation
de los datos sin que ello ralentice su uso.
Cree un lago de datos seguro
• Reducir del tiempo de inactividad: seguridad en la nube más sólida y moderna que ayuda en días con un control de acceso
a mantener su empresa en movimiento, por lo que no tiene que dejar de analizar datos para detallado.
realizar un proceso de seguridad discreto; se puede integrar en cada paso del camino.
• Mantener su presupuesto: AWS mantiene la seguridad rentable y escala con las necesidades
cambiantes de sus riesgos y requisitos de seguridad, protegiendo las inversiones de su organización
y su compromiso con las iniciativas de datos. Regiones multi-AZ
• Mantener su enfoque: desde la infraestructura hasta los servicios, AWS es seguro porque Garantice conmutaciones por error
considera la seguridad en cada paso del camino, para que usted pueda dedicar más tiempo sin problemas si se interrumpe una
a transformar los datos en mejores decisiones que impulsen los resultados empresariales zona de disponibilidad (AZ).
y menos tiempo a preocuparse por la seguridad y la gobernanza.
21
C O N C L U SIÓ N
Las organizaciones impulsadas por datos buscan la verdad tratando los datos no como propiedad exclusiva
de departamentos en silos, sino como un activo de la organización para uso de todos. Es posible hacer una
estrategia de datos moderna para su organización, sin importar el tamaño, la ubicación o los requisitos
empresariales. AWS proporciona el conjunto más completo de servicios en todo el recorrido integral de los
datos para todas las cargas de trabajo, todos los tipos de datos y todos los resultados deseados.
Obtenga más información sobre por qué AWS es el mejor lugar para liberar valor de sus datos y convertir
la información en tiempo real en una innovación significativa. Explore cómo podemos ayudar a sus equipos
con infraestructura, herramientas y soporte de implementación a través de la red de socios y servicios
profesionales líderes en el mundo. Cuando se trata de datos, los clientes de AWS saben cómo hacerlo mejor.
Obtenga más información sobre cómo reinventar su organización para que esté
impulsada por datos ›
© 2023, Amazon Web Services, Inc. o sus empresas afiliadas. Todos los derechos reservados.
22