0% encontró este documento útil (0 votos)
134 vistas22 páginas

La Guía Definitiva para Desarrollar Una Estrategia de Datos Integral

Cargado por

diegodunham11
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
134 vistas22 páginas

La Guía Definitiva para Desarrollar Una Estrategia de Datos Integral

Cargado por

diegodunham11
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

A W S PA R A LO S DATO S

La guía definitiva
para desarrollar
una estrategia
de datos integral
Tres atributos clave para ayudar a su organización
a obtener más valor de los datos
Índice
Los datos son la luz que lo guían a una innovación significativa .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

Desafíos y consideraciones clave . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

Tres atributos clave que pueden ayudar a su organización a obtener más valor de los datos .. . 5

Exhaustiva . ..... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

Integrada ........ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

Gobernada . ..... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

Uso más estratégico de la seguridad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

2
I N T R O D U CCIÓ N

Los datos son la luz que ¿Existe una estrategia de datos comprobada?
La respuesta es “Sí”.
lo guían a una innovación La buena noticia es que no tiene que reinventar la rueda. Las organizaciones
ya están aprovechando los beneficios de una estrategia de datos integral
significativa basada en Amazon Web Services (AWS). Por ejemplo, AstraZeneca integra
y escala sus capacidades de datos e inteligencia artificial (IA) en toda la
Ahora más que nunca, los datos están en el centro de cada aplicación, proceso empresa con el fin de innovar más rápido y mejorar los resultados de los
y decisión empresarial. Es la génesis de la invención moderna, y en el panorama pacientes. Con los servicios de datos de AWS, ahora pueden ejecutar más de
complicado y cambiante de hoy en día, la forma en que pone a trabajar los datos 51 mil millones de pruebas estadísticas en menos de 30 horas, lo que facilita
de su organización puede ser la clave para acelerar la innovación y lograr los la entrega de información genómica para proyectos de descubrimiento de
objetivos de su organización. Hay mucho en juego. Según Forrester Research, medicamentos. BMW Group y muchos otros fabricantes utilizan los datos para
las organizaciones que cuentan con un sistema para promover la información optimizar sus cadenas de suministros y mejorar la capacidad de producción.
controlada por datos tienen un 140 % más de probabilidades de crear una ventaja Organizaciones como LG AI Research están sacando partido de los datos
competitiva sostenible y un 78 % más de probabilidades de impulsar un entorno para desarrollar aplicaciones de IA generativa que transformen los procesos
de crecimiento de los ingresos.1 empresariales y amplíen el acceso a la IA en diferentes sectores, como la moda,
la fabricación, la investigación, la educación y las finanzas.
Con una necesidad urgente de capacitar a toda la organización a fin de usar
los datos para tomar decisiones mejores y más rápidas que impulsen nuevas Si bien los logros son ilimitados, el desafío central es que muchas organizaciones
ideas e inciten la agilidad empresarial, los líderes están aceptando una verdad tienen un tesoro escondido de datos, pero no saben cómo obtener valor de ellos.
fundamental: el viaje hacia la innovación empieza por los datos, y convertirse En este libro electrónico, aprenderá los aspectos básicos de la creación de una
con éxito en una organización impulsada por datos comienza a partir de la estrategia de datos integral con el fin de mantenerse al día con sus necesidades
implementación de una estrategia de datos integral. de datos ahora y en el futuro, lo que permite una ventaja sostenible que proviene
de desbloquear el valor de sus datos.
1
Creating a data-driven culture, CIO.com, marzo de 2022

3
C Ó M O C O N V E R T IR SE E N U N A O R G A N I Z A CIÓ N B A S A DA E N DAT O S

Desafíos y consideraciones clave


Se están generando y almacenando más datos que nunca La adopción del análisis y el machine learning aún se ve
Las herramientas en las instalaciones y los almacenes de datos heredados no dificultada por la falta de habilidades e inercia
pueden satisfacer las demandas actuales, las organizaciones necesitan nuevos Muchas empresas tienen dificultad para progresar con el análisis de escala y las
almacenes de datos que puedan escalarse y crecer a la par de los cambios, ya herramientas del ML. Gartner reveló que las organizaciones que invierten en IA
sea a partir de los gigabytes y terabytes con los que se trabaja en la actualidad trasladaron solo al 54 % de sus pilotos de la prueba de concepto de IA a producción.3
o de los petabytes y exabytes previstos para el futuro. Una continua falta de datos y habilidades del ML y la cantidad o calidad de los datos
para capacitar son algunos de los problemas que dificultan el progreso en esta
Los datos guardados en silos a lo largo de varias fuentes importante área. Aun así, crece la necesidad de ayudar a los usuarios de las empresas
generan ineficiencias en la productividad y los costos para aprovechar la toma de decisiones impulsada por los datos (DDDM).

Las organizaciones modernas necesitan acceder y analizar de forma sencilla


diversos tipos de datos, como archivos de registro, secuencias de clics, voz
Tratar de mantener la gobernanza de datos es un trabajo
y video. Sin embargo, esta amplia variedad de tipos de datos por lo general de tiempo completo
se almacena en silos a través de diversos almacenes de datos. Para extraer Con las arquitecturas de datos tradicionales se requieren procedimientos de
información, las organizaciones deben romper estos silos y así unificar todo administración complicados y arriesgados porque se accede a los datos desde
tipo de datos. Esta importante optimización de costos y operaciones está muchos lugares. Otorgar, rastrear, auditar y eliminar el acceso de los empleados,
transformando la infraestructura de una fuente de complejidad y gasto y al mismo tiempo cumplir con un número creciente de regulaciones, es un
a un motor de creación de valor. trabajo de tiempo completo. La automatización de estas tareas obligatorias
de gobernanza de los datos libera a los equipos modernos y les permite volver
El estado actual de la toma de decisiones es insostenible a centrarse en la innovación.

Gartner informa que el 65 % de las decisiones que se toman hoy son más
complejas (involucran a más partes interesadas u opciones) que hace cinco Los datos son cada vez más difíciles de proteger
años.2 Para agilizar y mejorar la toma de decisiones, las organizaciones Hubo una época en que los equipos de TI elegían entre desarrollar arquitecturas
necesitan la capacidad de realizar operaciones de análisis y machine learning rápidas o seguras. Ahora, necesitan de ambos aspectos. Los ataques de seguridad
(ML) de una manera ágil y rentable, utilizando herramientas y rendimiento aumentaron un 31 % de 2020 a 2021, según el informe State of Cybersecurity
óptimos para escalar en cada caso de uso. Las organizaciones ya no pueden Resilience 2021 de Accenture, en cuanto el promedio de ataques por organización
perder tiempo valioso implementando y configurando de nuevo y en forma aumentó de 206 a 270 de un año a otro.4 Pero ¿cómo pueden las organizaciones
constante la infraestructura para escalar el rendimiento y la capacidad. maximizar la privacidad y la seguridad?

2
How to Make Better Business Decisions, Gartner, octubre de 2021
3
Half of AI Models Never Make It To Production: Gartner, EnterpriseAI, agosto de 2022 4
4
State of Cybersecurity Resilience 2021: How aligning security and the business creates cyber resilience, Accenture, 2021
C Ó M O C O N V E R T IR SE E N U N A O R G A N I Z A CIÓ N B A S A DA E N DAT O S

Tres atributos clave que pueden Exhaustiva

ayudar a su organización a obtener


más valor de los datos Integrada

Según una encuesta de PwC a más de mil ejecutivos sénior, las organizaciones que se basan en
gran medida en datos tienen tres veces más probabilidades de informar mejoras significativas
en la toma de decisiones en comparación con aquellas que dependen menos de los datos.5
Gobernada
AWS puede ayudar a su organización a implementar una estrategia integral que facilite
la administración de datos en cada paso del trayecto, desde la ingesta, el almacenamiento
y la consulta de datos hasta el análisis, la visualización y la ejecución de modelos del ML.
Independientemente de los desafíos de su empresa, su estrategia de datos debe ser:

1. Exhaustiva: equipada con las herramientas adecuadas, con una relación óptima entre
precio y rendimiento para cualquier tipo de usuario, caso de uso y tipo de datos
2. Integrada: con la capacidad de integrar datos almacenados y analizados en diferentes
herramientas y sistemas para poder obtener una mejor comprensión de su empresa
y predecir qué ocurrirá
3. Gobernada: con políticas de gobernanza de todos sus datos a fin de permitir el acceso a
estos de manera segura cuando y donde lo necesiten sus usuarios para acelerar la innovación

Una mentalidad impulsada por los datos también puede requerir un cambio cultural más
amplio en el que ambos objetivos y decisiones estén respaldados por la estrategia de datos.

Siga el enlace a continuación con el fin de explorar por qué los datos juegan un rol vital para
permitir este cambio cultural. Y descubra por qué cada vez más empresas aprovechan las
capacidades impulsadas por datos con el objetivo de automatizar un conjunto de casos de uso
críticos para la empresa.

Lea el libro electrónico 5 Key Elements of a Data-Driven Culture ›


Farrell, M., Data and Intuition: Good Decisions Need Both, Harvard Business Publishing, enero de 2023
5
5
1
Exhaustiva
Equipada con las herramientas adecuadas, con una relación óptima entre
precio y rendimiento para cualquier tipo de usuario, caso de uso y tipo de datos

Las empresas necesitan construir estrategias de datos preparadas para el futuro


que puedan cumplir con sus necesidades hoy y mañana. Toma más que solo una
herramienta de lago de datos, de almacenamiento de datos o de inteligencia
empresarial (BI) para aprovechar los datos de manera eficaz. Requiere una
estrategia de datos integral con un conjunto completo de herramientas que tenga
en cuenta la escala y la variedad de datos, además de los distintos propósitos para
los que quiera usarlos. De hecho, el 94 % de los miles de clientes principales de
AWS usan más de 10 servicios de bases de datos y análisis de AWS.

El desarrollo con un proveedor de nube que innova con el fin de brindarle


en forma permanente todas las herramientas de datos que necesitará y más
con el rendimiento de precio adecuado para su caso de uso garantiza que
tenga una estrategia de datos que crezca con usted. AWS tiene el conjunto
de capacidades de datos más amplio y profundo para admitir cualquier carga
de trabajo o caso de uso de datos. Desde almacenamiento de datos a análisis,
machine learning y herramientas y soluciones de usuario final, AWS brinda
la capacidad correcta para abordar su caso de uso, de modo que no tenga
que comprometer el rendimiento, el costo o los resultados. AWS acelera de
forma continua su ritmo de innovación, por lo que nunca superará a AWS
para sus necesidades de datos.

6
E X H A U ST I VA

Escalamiento de aplicaciones basadas en datos


Cree aplicaciones preparadas con vista al futuro en una infraestructura de datos moderna con el mejor
precio y rendimiento para su caso de uso a escala. Las bases de datos de AWS incluyen Amazon Aurora,
que ofrece el rendimiento y la disponibilidad de las bases de datos de grado empresarial a una décima
parte del costo. Más de cien mil clientes de AWS utilizan Amazon Aurora para sus bases de datos Sugerencia de estrategia de datos:
relacionales. AWS ofrece ocho motores de base de datos personalizadas para casos de uso, como gráficos,
Logre una estrategia de datos rentable
streaming y documentos, cada uno diseñado de manera única con el fin de brindar un rendimiento óptimo
sin sacrificar el rendimiento. Permita que
orientado a sus aplicaciones, transformando la economía de la propiedad de la base de datos.
su organización maximice sus capacidades
actuales mediante la optimización de costos.
Impulso de datos y almacenamientos de datos
Las organizaciones utilizan lagos de datos y almacenamientos de datos con el objetivo de unificar Samsung
conjuntos de datos y aplicar análisis y ML para ayudar en la toma de decisiones y crear nuevas Samsung ahorró un 44 % en costos operativos
experiencias de clientes impulsadas por datos. mensuales y un 22 % adicional en tarifas de
mantenimiento al migrar a Amazon Aurora
Durante años, AWS ha estado ayudando a cientos de miles de clientes a crear una base sólida
PostgreSQL.
para lagos de datos con servicios como Amazon Simple Storage Service (Amazon S3), AWS Glue
y AWS Lake Formation. Los clientes también confían en Amazon Redshift, un almacenamiento de
Carrier
datos rápido a escala de petabytes que ofrece un rendimiento de precios hasta cinco veces mejor
que otros almacenamientos de datos en la nube. Amazon Redshift lo ayuda a ingerir, combinar Carrier conectó su red de logística de la cadena
y ejecutar de manera segura análisis históricos, en tiempo real y predictivos, de todos sus datos de frío para ayudar a los clientes a optimizar
con solo unos pocos clics, con resultados de consultas súper rápidos. las operaciones de la cadena de frío, disminuir
su uso de energía y mejorar sus resultados con
una reducción de costos, demoras, pérdida
Análisis para todos los casos de uso de carga y desperdicio en tránsito.
La verdadera agilidad ayuda a las organizaciones a adaptarse con rapidez a las necesidades cambiantes
de las empresas. Para potenciar estas acciones rápidas, los servicios de análisis de AWS permiten a los United Airlines
equipos de su organización ingerir, combinar y ejecutar análisis históricos, en tiempo real y predictivos
United Airlines creó un aeropuerto inteligente
de todos sus datos. Esto incluye servicios para consultas SQL, análisis de registros, streaming y Apache
con más de 20 000 sensores que producen
Spark. Para consultas de macrodatos, Amazon EMR admite más marcos de macrodatos que cualquier
datos a fin de generar información en tiempo
otro proveedor y le permite obtener información hasta dos veces más rápido. Los clientes de AWS
real, optimizando las capacidades de los
logran un rendimiento más de tres veces superior con Apache Spark cuando ejecutan tiempos de
equipos terrestres, lo que resultó en un ahorro
ejecución compatibles y optimizados de AWS para Amazon EMR, AWS Glue y Amazon SageMaker.
de 120 millones USD en equipos que ya no se
requerían.
7
EXHAUSTIVA

Para tomar decisiones en tiempo real, necesitará servicios de streaming de datos como Amazon
Kinesis Data Streams (Amazon KDS), lo que le permite crear aplicaciones para datos de eventos

94 %
de alta frecuencia, como datos de secuencias de clics y obtener acceso a información en segundos.
Amazon Kinesis Data Firehose carga flujos de datos de manera simple y confiable en lagos de
datos, almacenes y servicios de análisis, sin necesidad de extracción, transformación y carga (ETL)
ni preparación de datos engorrosa.

Innovación más rápida con servicios que hacen el machine


learning y la IA más accesibles
Las organizaciones han estado utilizando el ML para agregar inteligencia a los procesos existentes,
automatizar tareas manuales que requieren mucho tiempo y acelerar la innovación mediante
el uso de datos. Ahora, gracias a la IA generativa, las organizaciones tienen la oportunidad de
reinventar las experiencias del cliente y las aplicaciones. Con AWS, tiene acceso al conjunto más
Con el conjunto de servicios de datos más
completo de servicios de IA y ML. Amazon Bedrock es la manera más sencilla de crear y escalar
amplio y profundo de la industria, el 94 % de
aplicaciones de IA generativa con modelos de base (FM) para crear nuevos contenidos e ideas,
los 1000 clientes principales de AWS utilizan,
incluidas conversaciones, historias e imágenes. Con Bedrock, puede utilizar sus propios datos
cada uno, más de 10 servicios de base de datos
para personalizar con facilidad y seguridad FM de AI21 Labs, Anthropic y Stability AI, además
y análisis de AWS.
de modelos de Amazon Titan mediante una API.

AWS también brinda un amplio rango de servicios que le permiten agregar capacidades de IA
como reconocimiento de imágenes, predicción y búsqueda inteligente a aplicaciones con una
simple llamada a la API. Si desea crear sus propios modelos de ML, Amazon SageMaker le brinda
todas las herramientas necesarias para crear, entrenar e implementar modelos de ML a escala.
Además, Amazon SageMaker JumpStart brinda FM no disponibles en Amazon Bedrock, como
Cohere y LightOn, además de modelos de código abierto, como FLAN-T5, GPT-J y Bloom.

8
EXHAUSTIVA Escale la toma de decisiones basadas
en datos en toda su organización
• Amazon QuickSight: satisfaga las diversas
Habilitación de información de datos en toda la organización
necesidades analíticas desde la misma fuente
Ya no son solo las personas expertas en datos las que pueden extraer con rapidez información de verdad a través de paneles interactivos
valiosa y relevante de los datos para ayudar a informar la toma de decisiones. Las soluciones de modernos, informes paginados, análisis
BI basadas en ML, como Amazon QuickSight, permiten una fácil conectividad con los orígenes integrados y consultas en lenguaje natural
de datos. Los analistas de empresas pueden utilizar estos datos para mostrar nuevas tendencias • Amazon SageMaker Canvas: interfaz sin
e información predictiva en visualizaciones y tableros de BI interactivos. código de AWS que permite a los analistas
de empresas generar predicciones precisas
Amazon QuickSight Q usa ML, lo que permite a los usuarios consultar sus datos en un lenguaje
de ML sin experiencia previa
sencillo sin escribir una sola línea de código. Los usuarios empresariales pueden incluso
cuestionar los “por qué” para comprender mejor los factores que afectan las tendencias de • Amazon DataZone: simplifica el acceso
datos. También pueden prever métricas con instrucciones como “Pronóstico de ventas para los gobernado a los datos para usuarios
próximos 12 meses” y, así, recibir una respuesta inmediata basada en la información de los datos de empresas
pasados y la estacionalidad. Una interfaz visual de seleccionar y hacer clic permite a los analistas • AWS Training and Certification: más
de empresas generar predicciones precisas de ML sin experiencia previa. Con solo unos pocos de 150 cursos de desarrollo profesional
clics, los analistas pueden importar datos de varias fuentes, preparar datos de forma automática, relacionados con datos, análisis y ML
y crear y analizar modelos de ML. • Amazon Bedrock: la forma más sencilla de
crear y escalar aplicaciones de IA generativa
Impulso del dominio de los datos con FM
Tener empleados que puedan usar los datos de manera efectiva ayudará a su organización
a lograr sus objetivos de datos. Invierta en educar y mejorar las habilidades de su personal
en cuanto a datos, análisis y ML con la formación de AWS.

9
HIST O R I A D E U N C LIE N T E

ADP toma 312 billones


de decisiones al mes
con procesos analíticos
ADP ayuda a más de 900 000 empresas a administrar los 70 millones de
personas a través de su proceso de personal y nómina. Esa administración
genera una gran cantidad de datos. De hecho, ADP procesa más de
2,5 petabytes de datos con más de 25 mil millones de puntos de datos
individuales representados. ADP utiliza Amazon Redshift y Amazon
Neptune para realizar aspectos de su procesamiento de datos general.
Estos servicios de datos de AWS ayudan a las empresas a medir, comparar,
predecir y aplicar información sobre su personal. Con los servicios de
AWS, ADP también permite a las organizaciones crear paneles de equidad
salarial, lo que ayuda a más de dos tercios de las empresas a mostrar
mejoras en la equidad salarial.

“Ahora es el momento de utilizar los datos para


ayudar a las personas a entender qué acciones
podemos tomar para crear un entorno de trabajo
más diverso, más equitativo y más inclusivo y para
construir el futuro que todos queremos crear”.

Jack Berkowitz, CDO, ADP

Siga leyendo la experiencia de ADP ›

10
HIST O R I A D E U N C LIE N T E

BMW Group democratiza


el uso de datos a escala
BMW Group se mudó a un lago de datos centralizado basado en
AWS por su agilidad, flexibilidad y capacidad para procesar terabytes
de datos de telemetría de millones de vehículos a diario. Los datos
anónimos de los sensores de vehículos y otras fuentes en toda la
empresa ahora son de fácil acceso para los equipos internos que crean
aplicaciones internas y orientadas al cliente. La creación de un catálogo
de datos legible por humanos y la visualización clara de los recursos
de datos resultaron esenciales, lo que impulsó la productividad de los
analistas de datos, los científicos de datos y los ingenieros.

“Recién estamos comenzando nuestro camino con


AWS; esperamos beneficiar a nuestra empresa para
que pueda desarrollar la estrategia adecuada y, de
esa manera, impulsar la innovación hacia el futuro”.

Kai Demtröder, VP of Data Transformation, Artificial Intelligence, Data,


& DevOps Platforms, BMW Group

Descubra cómo las organizaciones líderes están


capturando los beneficios de una estrategia integral
creada en AWS ›

11
2
Integrada
Eliminación de los silos para poner los datos en uso de forma efectiva

Las oportunidades de transformar su empresa con datos existen a lo largo


de toda la cadena de valor. Pero esa transformación requiere que usted vea la
imagen completa de su cliente y empresa. Con los datos repartidos entre varios
departamentos, servicios, bases de datos en las instalaciones y aplicaciones
de terceros, debe poder integrar con facilidad los datos entre silos para obtener
la mejor información. Las empresas tienen varios enfoques sobre cómo están
unificando los datos (malla de datos, lake house, tejido de datos, etc.), pero por
lo general involucra un lago de datos como elemento fundamental. Los lagos
de datos le permiten recopilar, almacenar, organizar y procesar datos valiosos
de sus silos de datos y ponerlos a disposición de las herramientas de análisis,
visualización y ML de manera controlada.

12
I N T EG R A DA Conéctese con cientos de orígenes
Sin operaciones ETL de datos
• Amazon AppFlow: integre lagos de datos
Muchas organizaciones tienen varios lagos de datos además de almacenamientos de datos,
y almacenamientos de datos con más
herramientas de análisis, herramientas de ML y aplicaciones de software como servicio (SaaS).
de 50 fuentes de datos
La integración de datos entre silos requiere canalizaciones de ETL complejas, que pueden llevar
horas, si no días. Eso no es lo suficientemente rápido para la toma de decisiones moderna. Las • AWS Data Exchange: acceda a más
organizaciones deben adoptar tecnologías que automaticen o eliminen ETL cuando sea posible. de 350 proveedores de terceros y más
de 3500 productos de datos públicos
AWS está invirtiendo en un futuro sin ETL, lo que permite a las organizaciones integrar de forma
• Amazon SageMaker Data Wrangler: cree
automática todos sus datos. Esto incluye llevar ML al origen de datos con la integración de
modelos de ML con más de 40 orígenes
SageMaker en Amazon Redshift, Amazon Aurora, Amazon Athena y Amazon Neptune, integrando
de datos con un solo clic
Amazon Aurora y Amazon Redshift para análisis en tiempo real y proporcionando una integración
directa entre Amazon S3 y Amazon Redshift en lo que respecta a flujos de datos en tiempo
real. Además, puede ejecutar consultas en datos almacenados en bases de datos operativas,
almacenamientos de datos y lagos de datos con el fin de proporcionar información a través de
múltiples orígenes de datos sin movimiento de datos utilizando Amazon Athena y Amazon Redshift.

Análisis de todos sus datos y de datos de terceros


Sugerencia de estrategia de datos:
Para desglosar los silos de datos, no puede tener conexiones solo con algunos de sus orígenes
de datos; debe poder conectarse sin problemas a todas ellos, ya sea que vivan en AWS o en Perseguir sin ETL
aplicaciones externas de terceros, en las instalaciones o incluso en otro entorno de nube.
Evite crear y mantener canalizaciones de
No importa dónde vivan, con AWS, puede integrar de forma automática cientos de orígenes
datos complejas para realizar operaciones
de datos a través de AWS y terceros.
de ETL. En su lugar, Amazon Aurora ahora
Cada vez más, las organizaciones también están aprovechando los datos de terceros para es compatible con la integración sin ETL
profundizar la información al unir estos datos de terceros con sus propios datos. AWS Data con Amazon Redshift, a fin de habilitar el
Exchange permite a los clientes de AWS acceder a datos de terceros a través de archivos, análisis y el ML casi en tiempo real. Los datos
tablas y API de más de 300 proveedores de datos y más de 3500 productos de datos, todo transaccionales escritos en Amazon Aurora
desde un solo lugar. También se utilizan datos de terceros de socios y clientes, lo que aumenta están disponibles en Amazon Redshift casi de
la necesidad de políticas de gobernanza integrales para proteger los datos. Las salas limpias inmediato. Analice datos de varios clústeres
de datos, entornos protegidos donde varias partes pueden analizar datos combinados sin de bases de datos de Aurora en la misma
exponer nunca los conjuntos de datos sin procesar, han surgido como una solución. AWS Clean instancia nueva o existente de Amazon
Rooms ayuda a las empresas y sus socios empresariales a analizar y colaborar de forma segura Redshift y obtenga información holística
en sus conjuntos de datos, sin compartir ni revelar los datos subyacentes. en muchas aplicaciones.

13
HIST O R I A D E U N C LIE N T E

Cómo la entrega de
datos permite a Goldman
Sachs trabajar de manera
más inteligente
Goldman Sachs ha visto aumentar de manera exponencial la demanda
de datos del mercado financiero, por lo general duplicándose año
tras año. AWS Data Exchange es un servicio administrado que permite
centralizar, optimizar y automatizar los procesos de datos siempre
que sea posible. La migración de las fuentes de datos de mercados
existentes a AWS Data Exchange puede mejorar la eficiencia general
del consumo de datos de terceros, lo que permite dedicar más tiempo
al análisis de valor agregado de los datos y menos a analizar los datos
a fin de prepararlos para su uso. La entrega de datos sin fricción
a través de AWS Data Exchange es fundamental a fin de preparar
la organización para el futuro.

“AWS Data Exchange es un componente clave de


la estrategia de nube financiera de Goldman Sachs
porque reduce la fricción de datos financieros de
proveedores de terceros nuevos y existentes, y nos
permite centrarnos en entregar nuestros servicios
principales y análisis de datos diferenciados para
brindar un mejor servicio a nuestros clientes”.

Marco Argenti, Co-CIO, Goldman Sachs

14
HIST O R I A D E U N C LIE N T E

ENGIE acelera
su transición a cero
emisiones de carbono
Una empresa global de servicios públicos en el proceso de una
transición a cero emisiones de carbono, ENGIE construyó su lago
de datos Common Data Hub en AWS. ENGIE recibió el apoyo
de AWS Professional Services en el diseño e implementación de
la solución y la formación de un equipo de servicio interno para
monitorear la plataforma. Con más de mil proyectos en todo el
mundo actualmente en el Common Data Hub, esta solución cohesiva
elimina los silos, dando a todos los departamentos acceso igualitario
a un marco de datos común.

“Estábamos convencidos de que AWS era una buena


solución por muchas razones, incluido el modelo de
costos, y, en especial, en términos de almacenamiento
de datos”.

Gregory Wolowiec, Technology Team Leader, programas de datos de ENGIE

Explore cómo los clientes de AWS integraron


sus datos, eliminando los silos de datos y creando
soluciones transformadoras para sus organizaciones ›

15
3
Gobernada
Libere a sus equipos para que se muevan más rápido con el acceso a datos
gobernados a lo largo del ciclo de vida de los datos

Más allá de la exhaustividad y la integración, es igualmente importante


garantizar que los usuarios puedan acceder a los datos donde y cuando los
necesiten con el nivel de control adecuado. Con la estrategia de gobernanza
de datos adecuada, puede moverse más rápido para capacitar a los usuarios
con el acceso a los datos que necesitan, cuando los necesitan.

A medida que más datos migran a la nube, impulsados por la escala casi infinita
y la potencia de la nube, es imperativo que los modelos de gobernanza de datos
de las empresas evolucionen juntos. Los líderes empresariales y de TI necesitan
políticas actualizadas para proteger los datos a medida que avanzan y retroceden
entre diferentes repositorios y para adaptarse a las cambiantes normas de
privacidad y seguridad de datos sobre dónde se pueden almacenar los datos.5

“La clave para una gobernanza es descifrar cómo definir el


acceso y, luego, apartarse del camino. Con ello me refiero a
crear procesos de excepción en lugar de adoptar un enfoque
mediante el que, cada vez que se necesiten datos, se tengan
que solicitar a alguien en una organización central”.6

Rahul Pathak, VP for Analytics, AWS

6
Wexler, J., A unified approach to data governance, CIO, agosto de 2021
16
G O B E R N A DA Gobernanza holística con AWS
Simplificación de los permisos de acceso a datos • AWS Lake Formation: facilita la gobernanza
La implementación de una estrategia de gobernanza exitosa continúa presentando un conjunto único y la auditoría de las acciones realizadas con
de desafíos. A las organizaciones les lleva mucho tiempo y les representa un desafío proporcionar los datos en su lago de datos en Amazon S3
a los consumidores internos o externos sus datos con el nivel adecuado de acceso a conjuntos de • Amazon DataZone: un servicio de
datos específicos. A menudo se dedican a tareas complejas, como scripts manuales o investigación administración de datos para catalogar,
de clústeres de datos individuales, para averiguar qué consumidores tienen acceso a qué datos. descubrir, compartir y gobernar datos

El trabajo manual también puede generar problemas costosos de calidad de datos en diferentes
equipos y departamentos. Sin herramientas de gobernanza centralizadas, los datos se bloquean
en silos, lo que significa que no podrá acceder y analizar todos los datos que pueda necesitar
para resolver problemas o identificar grandes áreas de oportunidad.

Desarrollo de una estrategia de gobernanza de datos


Una nueva encuesta de AWS/MIT de más de 350 profesionales de datos muestra que la
gobernanza de datos es la prioridad principal de los directores de datos (CDO), con más del
50 % de los CDO que señalan que “establecer una gobernanza de datos clara y efectiva” es
Sugerencia de estrategia de datos:
su principal responsabilidad. La gobernanza también es un área en la que los CDO dedican
gran parte de su tiempo, ya que más del 66 % de los encuestados dijeron que las iniciativas Un informe de Splunk sobre los beneficios
de gobernanza de datos son un enfoque principal.7 económicos de las prácticas de datos
desarrolladas refuerza la importancia del
Sin un abordaje de gobernanza que apoye la innovación, a las organizaciones les resultará difícil acceso. Al enfocarse en aspectos como la
basarse en datos y, en última instancia, seguir siendo competitivas. Después de todo, cuanto más clasificación y el intercambio de datos entre
tiempo dedican los trabajadores a enfrentar los datos, menos tiempo dedican a innovar con ellos. áreas empresariales, los “líderes en innovación
de datos” disfrutan de una mayor lealtad a
AWS está invirtiendo en el camino de los datos para habilitar la gobernanza de datos integral
la marca y una mayor satisfacción del cliente
con menos esfuerzo. AWS Lake Formation facilita la gobernanza y la auditoría de las acciones
y ponen en mejor funcionamiento sus datos.
realizadas con los datos en su lago de datos en Amazon S3 y AWS Lake Formation también
Los líderes de datos tienen “4,6 veces más
se puede utilizar para gobernar el uso compartido de datos en Amazon Redshift. Amazon
probabilidades de impulsar más del 20 % de
DataZone es un nuevo servicio de administración de datos para catalogar, descubrir, compartir
sus ingresos de productos y servicios nuevos
y gobernar datos con el fin de que todos en la organización puedan actuar sobre los datos.
e innovadores” que los principiantes en datos.8
Y para sus modelos del ML, Amazon SageMaker tiene características que lo ayudan a gobernar
y auditar el ciclo de desarrollo integral del ML.

The Best Offense Is a Great Defense, TechCrunch Brand Studio, patrocinado por AWS, 2022
17
7

8
The Economic Impact of Data Innovation 2023, Splunk, 2022
G O B E R N A DA

Uso responsable del machine learning y la IA


La IA y el ML son algunas de las tecnologías más transformadoras que encontraremos en nuestra
generación, capaces de afrontar problemas empresariales y sociales, mejorar la experiencia del cliente
y estimular la innovación. Debido al uso extendido y en crecimiento de la IA, es fundamental que la
tecnología se desarrolle de manera responsable. Si bien la mayoría de las empresas han comenzado
Amazon Titan
su camino hacia la IA responsable, la mayoría (el 95 %) tiene dificultades para poner en funcionamiento
todos los elementos clave de la IA responsable, incluidos la imparcialidad, la capacidad de explicación, Innove de manera responsable con modelos
la solidez, la seguridad y la privacidad, la transparencia y la gobernanza. Seguir los pasos para llevar de base de alto rendimiento. Los modelos de
la IA responsable de la teoría a la práctica es fundamental, y el proceso comienza por la educación base de Titan están diseñados para detectar
de la siguiente generación de líderes de ML y el avance de la ciencia tras la IA responsable, realizando y eliminar contenido dañino en los datos,
un trabajo codo con codo junto a socios del mundo académico, de industrias y del gobierno. rechazar contenido inapropiado en la entrada
del usuario y filtrar salidas de modelos que
La IA generativa también plantea nuevos desafíos respecto a la definición, medida y mitigación de contengan contenido inapropiado, como
problemas referentes a la imparcialidad, la toxicidad y la propiedad intelectual, entre otros aspectos. incitación al odio, blasfemias y violencia.
En AWS, tenemos un compromiso con la creación de modelos de base con la IA responsable en
mente durante cada fase del proceso de desarrollo exhaustivo: desde cómo adquirimos los datos
de entrenamiento hasta la protección contra sesgos en las indicaciones y resultados del usuario.
Estamos trabajando para desarrollar nuevos enfoques y soluciones para identificar y reducir el
sesgo, abordar inquietudes sobre privacidad y seguir iterando para brindar medidas de protección
adecuadas y generar confianza por parte de nuestros clientes y usuarios finales.

AWS brinda un exhaustivo conjunto de recursos para ayudarlo a controlar y garantizar que los
modelos de IA y ML se crean de manera responsable, con prácticas de datos que reducen el sesgo
y protegen la privacidad de los datos. Esto incluye capacidades diseñadas para un fin específico
como Amazon SageMaker Clarify, herramientas de transparencia como tarjetas de servicio de
IA de AWS, tarjetas de modelos de Amazon SageMaker y, por supuesto, un curso de Machine
Learning University (MLU) sobre imparcialidad y sesgo. Los científicos de datos pueden utilizar
controles de gobernanza en SageMaker para obtener visibilidad integral de los modelos de ML,
incluido el entrenamiento, el historial de versiones y el rendimiento del modelo, todo ello en un
único lugar. Los modelos de base de Amazon Titan, que puede utilizar para crear aplicaciones de
IA generativa, están diseñados para detectar y eliminar contenido dañino en los datos, rechazar
contenido inapropiado en la entrada del usuario y filtrar salidas de modelos que contengan
contenido inapropiado, como incitación al odio, blasfemias y violencia.

18
HIST O R I A D E U N C LIE N T E

Al simplificar la gobernanza,
OneFootball experimentó
un aumento del 40 % en la
utilización de su plataforma
de análisis
OneFootball ha crecido con rapidez hasta convertirse en una de las
plataformas de medios digitales más populares del mundo para los
entusiastas del fútbol. Para utilizar mejor los datos en beneficio de la
empresa y de los 70 millones de fanáticos del “juego más hermoso”,
OneFootball creó una solución más ágil en AWS en tan solo unos
días. Desde que integró los datos desde sus bases de datos backend
en su lago de datos basados en la nube, OneFootball ha simplificado
de forma radical la ingesta de datos y ha eliminado por completo las
cargas de trabajo de ETL heredadas. Un hermoso juego, ciertamente.

Con AWS Lake Formation, OneFootball podría simplificar la administración


y la gobernanza de la seguridad a escala, de modo que pudieran hacer que
los datos fueran más accesibles en toda la empresa. Esto finalmente ayudó
a que el equipo vea un crecimiento importante en los usuarios de análisis
activos semanales y otros indicadores clave de rendimiento internos, lo que
aumentó el uso de la plataforma de análisis en un 40 %.

“Ahora podemos dedicar más tiempo a comprender


los problemas empresariales en lugar de mantener
diferentes tipos de extracciones de bases de datos.
Ver a más y más personas en toda la organización hacer
uso del análisis a diario es un gran logro. Tener todos
los orígenes de datos relevantes integrados de manera
confiable era un requisito previo”.
19
Stephan Durry, Head of Data & Insights, OneFootball
HIST O R I A D E U N C LIE N T E

Pinterest utiliza la
gobernanza para colocar a
los clientes en primer lugar
Un sistema de control de acceso escalable y automatizado detallado (FGAC)
creado utilizando Amazon S3 aseguró que los crecientes datos de Pinterest
no superarían los controles existentes de la empresa. FGAC controla el acceso
a los datos y se basa en diversos criterios que ofrecen opciones como el control
de acceso basado en roles con seguridad para conjuntos de datos a escala de
petabytes. También permitió a los creadores y a las empresas de la plataforma
identificarse a sí mismos como miembros de un grupo poco representado y, al
mismo tiempo, garantizar que la información confidencial no se utilizaría para
ningún otro propósito, como la publicidad.

“Los impactos orientados al cliente de los esfuerzos


de gobernanza de Pinterest incluyen el uso de datos de
identificación propia de una “manera muy controlada”
con el fin de apoyar a las empresas que son propiedad de
personas de raza negra para el Juneteenth. Los creadores
también pueden agregar insignias a sus perfiles, lo que
permite que el contenido del creador aparezca en espacios
temáticos en Pinterest, para mostrar que las empresas son
propiedad de alguien que se identifica con un grupo poco
representado”.

David Chaiken, Chief Architect, Pinterest

Descubra cómo los clientes de AWS han empoderado


a sus empleados con las estrategias de gobernanza
adecuadas ›
20
Uso más estratégico de la seguridad Una historia de fiabilidad
y seguridad inigualables
AWS ha priorizado la seguridad desde el día uno, con una infraestructura protegida, de alto
rendimiento, resistente y eficiente de forma continua para sus cargas de trabajo y aplicaciones.
Los expertos en seguridad de primera clase que supervisan la infraestructura de AWS también Amazon S3
crean y mantienen una amplia selección de servicios de seguridad innovadores, que puede
Almacene y recupere cualquier
ayudar a simplificar las complejidades de sus propios requisitos normativos y de seguridad.
volumen de datos con la mejor
Los servicios y soluciones de seguridad de AWS pueden permitir una variedad de importantes ventajas: seguridad.

• Obtener información con mayor rapidez: ofrezca el nivel adecuado de acceso a sus recursos
en todo momento con la certeza de que sus datos están protegidos. Al crear seguridad en AWS
se tiene en cuenta el rendimiento, por lo que se obtiene la máxima protección y gobernanza AWS Lake Formation
de los datos sin que ello ralentice su uso.
Cree un lago de datos seguro
• Reducir del tiempo de inactividad: seguridad en la nube más sólida y moderna que ayuda en días con un control de acceso
a mantener su empresa en movimiento, por lo que no tiene que dejar de analizar datos para detallado.
realizar un proceso de seguridad discreto; se puede integrar en cada paso del camino.
• Mantener su presupuesto: AWS mantiene la seguridad rentable y escala con las necesidades
cambiantes de sus riesgos y requisitos de seguridad, protegiendo las inversiones de su organización
y su compromiso con las iniciativas de datos. Regiones multi-AZ
• Mantener su enfoque: desde la infraestructura hasta los servicios, AWS es seguro porque Garantice conmutaciones por error
considera la seguridad en cada paso del camino, para que usted pueda dedicar más tiempo sin problemas si se interrumpe una
a transformar los datos en mejores decisiones que impulsen los resultados empresariales zona de disponibilidad (AZ).
y menos tiempo a preocuparse por la seguridad y la gobernanza.

21
C O N C L U SIÓ N

La próxima ola de innovación estará


impulsada por datos
Los líderes y demás encargados de tomar decisiones que se quieran unir a esa ola de reinvención deben
ser tenaces para llegar a la verdad. También necesitan las herramientas esenciales para mantenerse lo
suficientemente ágiles como para cambiar de dirección cuando sea necesario para reaccionar ante nuevas
oportunidades. En pocas palabras, eso significa volverse impulsado por los datos.

Las organizaciones impulsadas por datos buscan la verdad tratando los datos no como propiedad exclusiva
de departamentos en silos, sino como un activo de la organización para uso de todos. Es posible hacer una
estrategia de datos moderna para su organización, sin importar el tamaño, la ubicación o los requisitos
empresariales. AWS proporciona el conjunto más completo de servicios en todo el recorrido integral de los
datos para todas las cargas de trabajo, todos los tipos de datos y todos los resultados deseados.

Obtenga más información sobre por qué AWS es el mejor lugar para liberar valor de sus datos y convertir
la información en tiempo real en una innovación significativa. Explore cómo podemos ayudar a sus equipos
con infraestructura, herramientas y soporte de implementación a través de la red de socios y servicios
profesionales líderes en el mundo. Cuando se trata de datos, los clientes de AWS saben cómo hacerlo mejor.

Descubra los principales casos de uso de datos para maximizar


el valor empresarial
En el libro electrónico Maximizing Business Value with Data: 6 Data-Driven Use Cases for Leaders,
explore los casos de uso de clientes de AWS y aprenda cómo puede aprovechar los datos para mejorar
las experiencias de los clientes, optimizar y reinventar las cadenas de suministro, mejorar la toma de
decisiones, preparar aplicaciones con vistas al futuro y más.

Obtenga más información sobre cómo reinventar su organización para que esté
impulsada por datos ›

© 2023, Amazon Web Services, Inc. o sus empresas afiliadas. Todos los derechos reservados.
22

También podría gustarte