Big Data en Marketing y Negocios
Big Data en Marketing y Negocios
4P del marketing en un momento como el actual, donde la experiencia del cliente, la tecnología, la neu-
Los diferentes capítulos del libro, agrupados a partir de este nuevo esquema, son desarrollados por
MARKETING APLICADO
académicos y por profesionales referentes del marketing. Incluyen casos aplicados reales que pueden
CASOS LATINOAMERICANOS
servir tanto para las empresas como para la enseñanza del marketing en Latinoamérica.
Cabe destacar el carácter práctico del presente libro, trascendiendo una mera transmisión de teorías,
definiciones y conceptos; pasando de la dimensión del “qué” a la realidad del “cómo”. Aproximación que
le da a esta publicación un carácter único y pionero en el marco de la literatura latinoamericana espe-
cializada en la gestión de marketing.
Desde ESIC hacemos una entusiasta invitación a la lectura de la presente obra y a la reflexión crítica del
contenido de sus capítulos. Con la seguridad que en sus páginas el lector encontrará una eficiente guía
para un entendimiento completo y global de los conceptos más importantes del marketing actual, a
partir de la interesante y atractiva casuística latinoamericana que se presenta, y a la vez, invitamos a sus
autores a seguir investigando y transmitiendo su conocimiento como valor a la sociedad.
9 786073 251655
Capítulo 18
372
373
3. El lector advierte que el big data será cada día más importante y que
todas las empresas tienen que considerar implementarlo.
374
1. Introducción
2. Fundamentos teóricos
5. Guía de implementación
6. Recursos útiles
375
1. Introducción
El concepto big data (la gestión de grandes bases de información) ha incursionado
con fuerza en la economía global. De hecho, en más de un sector se ha convertido
en una prioridad, ya que tiene el potencial de cambiar profundamente el ambiente
competitivo de las organizaciones. El big data está demostrando, cada vez más, que
presenta soluciones innovadoras y transforma procesos, organizaciones, industrias
e, inclusive, la sociedad en su conjunto (Sharda, Delen y Turban, 2018).
En este capítulo conoceremos de qué hablamos cuando nos referimos a este
concepto (comparándolo con el sistema de inteligencia de negocios utilizado en
los últimos años). Luego, se desarrollará un caso: el de la plataforma de streaming
Netflix, que usa big data de una manera muy amplia. Esto le ha permitido superar
en poco tiempo a empresas líderes de la industria cinematográfica con más de 50
años de trayectoria.
Además, conoceremos en síntesis un par de ejemplos de la región que hacen
uso intensivo de big data. El primero es el de la embotelladora mexicana Arca Con-
tinental, y, el otro, el de una universidad peruana. Cerraremos este capítulo con las
perspectivas que se le depara a esta herramienta la cual, como adelantamos, ha
revolucionado el mundo de los negocios y, por ende, el del marketing.
2. Fundamentos teóricos
Big data es una herramienta y un fenómeno actual por el cual las organizaciones
reciben una cantidad enorme de información. Esta es de diversos tipos, estructura-
376
Según Sharda et al. (2018), la gran cantidad de datos que se tienen actualmente
se originan de varias fuentes:
377
La información que genera el big data es más reveladora que las muestras esta-
dísticas tradicionales que se utilizaban anteriormente, ya que presenta nuevo co-
nocimiento que antes no se podía obtener. Un ejemplo puede ser el uso de big
data para combatir el crimen organizado mediante miles de cámaras en toda una
ciudad, lo cual reduce sustancialmente la delincuencia (Laudon y Laudon, 2017).
Gracias a esta herramienta podemos decir que el paradigma del análisis de la
información ha cambiado drásticamente. Anteriormente, la forma más actualizada
de hacerlo era mediante un sistema de inteligencia de negocios que constaba de
una base de datos especializada (Data Warehouse) y que tenía toda la información
requerida (información interna y externa, que ya estandarizada ha pasado por un
proceso de extracción, transformación y carga, en forma histórica), y una serie
de herramientas de inteligencia de negocios para el análisis (por ejemplo, una
red neuronal).
Con Data Warehouse se realizaba el análisis, con cierta demora, de una canti-
dad de data mucho menor que la actual. Actualmente, con big data la información
se va analizando mientras va llegando, lo que facilita la toma de decisiones inme-
diatas. Esta inmediatez hace aprovechables los nuevos conocimientos (insights) y
advierte de nuevos patrones sobre los cuales hay que actuar de forma inmediata.
378
El sistema de big data tiene como principales componentes a Hadoop, con sus dos
subcomponentes, el Hadoop Distributed File System (HDFS) y el MapReduce, y
luego a la base de datos no relacional, NoSQL (u otras bases de datos no relacio-
nales más modernas).
Hadoop es un esquema de software de código abierto usado para almacenar
y procesar enormes bases de datos. Este sistema se establece formando grandes
grupos de computadoras no especializadas; se asume que pueden haber fallas en
el hardware (aunque de fácil solución). El origen de Hadoop se remonta al siste-
ma de Google File System, el cual pretendía solucionar el problema de grandes
necesidades de almacenamiento de información, para lo cual se trabajaba con
hardware de bajo costo y tolerante a las fallas (Lemahieu et al., 2018).
Respecto al Hadoop Distributed File System (HDFS), primer componente de
Hadoop, Lemahieu et al. (2018) mencionan que permite el almacenamiento
de grandes volúmenes de data en un gran conjunto de computadores estándar, y
asumen que se presentarán fallas. El sistema permite a los usuarios conectarse a los
nodos (en los cuales los archivos han sido distribuidos) para obtener y grabar más
información como si fuera un solo sistema.
El MapReduce, el otro componente importante de Hadoop, es un nuevo para-
digma de programación. MapReduce permite escribir programas que son automá-
ticamente trabajados en paralelo y posibilita que sean ejecutados en un gran grupo
de diferentes computadoras estándar. Fue inicialmente establecido por Google y
luego implementado por Apache Hadoop. Aparte de su alta funcionalidad para
mapear y reducir información, su otra gran ventaja es la escalabilidad (posibilidad
de crecer rápidamente), y la tolerancia a las fallas.
Las bases de datos NoSQL son bases de datos no relacionales y permiten al-
macenar y recobrar información por medios diferentes al clásico mecanismo re-
lacional, de tipo tabular. Este tipo de base de datos se usa específicamente en big
data, en aplicaciones de web en tiempo real y en todo tipo de aplicaciones que se
implementen en la nube (cloud computing).
Entre las ventajas de las bases NoSQL podemos decir que tienen un diseño
simple, permiten el escalamiento mediante clusters de computación horizontales
(lo cual es una limitación en las bases de datos relacionales) y cuentan con un
buen control de disponibilidad y flexibilidad. No se logra una consistencia tan
379
buena como en las bases de datos relacionales, pero se tiene una consistencia
eventual. Adicionalmente, trabaja muy bien con data no estructurada y con bases
de datos muy grandes. Se podría decir que cuando es necesario trabajar con gran-
des volúmenes y estructuras flexibles de la data, se requiere tener escalabilidad
(posibilidad de crecer rápidamente) y gran disponibilidad; la alternativa idónea es
una base de datos no relacional como NoSQL (Sharda et al., 2018, & Lemahieu
et al., 2018).
380
Inteligencia
de negocios
DSS
Materiales aplicaciones
Réplicas del usuario
Inventario,
transacciones Reportes
OLAP
Contabilidad, Presentaciones
transacciones dashboard
Herramientas de
ERP búsqueda OLAP
Análisis
Intranet, predictivos
extranet, EDI
Minería
Sistema operativo / Data de datos
Acceso
a la data
Fuente: Sharda, Denle y Turban, 2018
381
Data operacional
Data de la web
382
383
Mediante big data, Netflix puede obtener la siguiente información del cliente: con-
tenido visto o descartado; características de la reproducción de la película (ve-
locidad, adelantamiento, retrocesos, pausas, etc.); intensidad en la reproducción
(frecuencia y número de horas vistas por sesión); puntaje que el observador le da
al contenido; equipo usado por el usuario para ver la película o show; búsquedas,
localización geográfica, hora del día, seguimiento de recomendaciones; calidad de
reproducción que obtiene el cliente en su zona; rating que das a lo observado
(más de cuatro millones al día); búsquedas (más de 3 millones al día); y, comporta-
miento de navegación y búsqueda (Fernandez-Manzano et al., 2016).
Analiza también las características técnicas de la navegación para determinar
la capacidad y velocidad de transmisión y cómo afecta el consumo del usuario;
estimar cómo se pueden crear experiencias personalizadas; y, determinar cómo se
puede mejorar el envío de contenido, teniendo en cuenta la capacidad de los
servidores. De esta manera, Netflix relaciona todo lo que conoce sobre el cliente y
el ratio de uso del servicio.
La data que los clientes envían activamente (calificando contenidos, llenando for-
mas cuando recién se inscriben, el hecho de que se conecten miembros especí-
ficos del hogar) es información que se puede comparar con otra generada por
el uso del cliente de manera involuntaria (qué es visto, qué es descartado, a qué
hora es visto, qué tan a menudo y en qué aparato). Todo eso ayuda a explicar las
motivaciones del cliente. Netflix tiene clasificados a sus clientes en 2 000 clusters de
segmentos específicos (Bulygo, 2019).
El catálogo de Netflix está basado en una serie de algoritmos que, con la infor-
mación obtenida de todos sus usuarios en línea, trata de facilitar las decisiones de
estos al escoger las películas y shows.
El algoritmo de recomendaciones lo desarrolla Netflix con 800 programadores
de manera que funcione con mucha eficiencia, para lo cual lo adapta constante-
mente, teniendo en cuenta los gustos y el comportamiento de los clientes, y los
cambios en los productos.
384
Netflix utiliza especialistas con habilidades analíticas para las áreas específicas: per-
sonalización analítica, comunicaciones de marketing analítica, segmentación de
contenido analítico, analítica de acuerdo con el equipo usado por el usuario, y
muchos más.
Si bien utiliza la analítica para cada aspecto del negocio, lo más relevante de
Netflix es que predice qué disfrutará más el consumidor. La compañía tiene más
de 100 millones de usuarios que se siguen incrementando y recibe una cantidad muy
amplia de información de ellos que tiene que analizar para mejorar la experiencia
del usuario, produciendo temas específicos y haciéndole recomendaciones a sus
clientes. De hecho, Netflix conoce más de sus usuarios de lo que uno estima, pues
el sistema de predicción mediante algoritmos sabe con anticipación qué le gustaría
ver al cliente (Marr, 2015; Rohan, 2018).
385
Netflix ha sido capaz de tomar correctas decisiones para escoger los géneros de
películas, directores y actores que el consumidor quiere ver para cada proyecto,
basándose en la información que obtiene en su servicio. En comparación con los
estudios de cine, que se fundamentan mucho en notas y consejo de expertos, ellos
utilizan toda la data obtenida en su servicio de streaming para escoger qué producir
y a qué segmentos dirigirles esa producción (Million, 2019).
Las grandes productoras de películas no pueden utilizar esta técnica, y se basan
en la gran producción que podría llegar a todo el mercado con buenos resultados,
y así se convierta en un éxito. Netflix, por el contrario, no tiene que tratar de que
cada producción sea un éxito, sino que sea un éxito en unos segmentos específicos
del mercado. Netflix juega a obtener producciones que sean exitosas solamente
en unos cuantos segmentos de los 2 000 que maneja, mientras que las grandes
productoras de películas tienen que lograr un superéxito para todo el mercado.
Las grandes productoras juegan con el marketing masificado, mientras que Netflix
puede jugar al marketing de segmentación (Landgraf, 2018).
Arca Continental
La industria de big data ha generado en Latinoamérica cerca de US$ 3 mil millones
de ingresos en el 2017 y se espera que llegue a los US$ 9 mil millones para el 2023,
obteniendo tasas de crecimiento anuales del 19 %. Dentro de los países que más han
estado utilizando big data en la región están Brasil (47 %), México (27 %), Colombia
(8 %), Chile (7 %), Argentina (6 %), y Perú (3 %). Elementos que están contribuyendo al
uso de big data son la mayor concepción de empresas que usan su data para obtener
mejores resultados, la búsqueda de mayor productividad, conseguir mayor lealtad del
3
386
cliente, la aparición del Internet de las cosas, entre otras. Empresas proveedoras de
tecnologías de big data, que están jugando un rol decisivo en Latinoamérica, son IBM,
Oracle, Microsoft, SAP y SAS (Frost y Sullivan, 2018).
Arca Continental es la segunda embotelladora más grande de Coca Cola en Lati-
noamérica y la tercera en el mundo. Está localizada en México. Tiene ventas por US$
7,300 millones. Vende bebidas gaseosas, agua embotellada, agua con gas embotella-
da y bocaditos embolsados, y atiende los siguientes países: México, Perú, Argentina,
Ecuador y el sur de Estados Unidos.
La empresa está en un negocio muy competitivo, atendiendo a 900 000 clientes,
en áreas muy diferentes en cuanto a ingresos económicos, densidades de población,
gustos, clima y características de marketing, y decidieron utilizar la inteligencia de ne-
gocios, big data analytics en este caso, dado la cantidad de data interna que tenían y
la data externa adicional que podían conseguir, para lograr un buen crecimiento (Arca
Continental, 2016). La solución planteaba utilizar la data de los tres últimos años, data
interna y externa, trabajando con la regresión múltiple, como herramienta de minería
de datos, y teniendo a todo el sistema de big data implantado en el sistema Azure, la
nube de Microsoft (Cloud Computing).
Con el sistema de big data analytics analizaron la información con 200 regresio-
nes múltiples de unas 100 variables cada una, con información demográfica, clima,
empleos, eventos deportivos, precios de la competencia y días feriados. Se pudieron
explicar aspectos de incrementos de ventas en periodos específicos, razones por los
cambios en las ventas y muchas variables más.
Netflix es una empresa global que atiende a 140 millones de clientes en 190 países,
personalizando el contenido para cada territorio que atiende, sin negar las diferen-
cias culturales y atendiendo a cada uno de acuerdo con las preferencias que tiene.
Por esa razón es que manda producir las películas en 21 países además de E.U.A.,
traduciéndolas y poniéndoles subtítulos en muchos idiomas (The Economist,
2018). Netflix también usa publicidad segmentada y recomendaciones para reducir
el presupuesto de su campaña promocional, llegando a los clientes más valorados
y relevantes en un solo momento.
387
Universidad peruana
Uno de los grandes problemas que tienen las universidades actualmente es la baja
retención de los estudiantes durante todo el periodo de estudios (5 a 6 años, desde
que ingresan), llegando en muchos casos a retener solo el 50 % de los que ingresaron
inicialmente. La retención de los estudiantes ha llegado a ser un objetivo prioritario
en las universidades a nivel mundial y en nuestro país. Los resultados de esa baja
retención producen malos resultados financieros, baja proporción de estudiantes
graduados y una deficiente reputación de la institución a los ojos de los accionistas y
todas las partes relacionadas con la institución.
En el área de marketing existe desde hace mucho tiempo los estudios para retener
a los clientes, los cuales son muy importantes de definir en algunos tipos específicos
de negocios, y un ejemplo sería el de las líneas telefónicas para los celulares inteligen-
tes (Movistar, Claro, Entel y otras).
Este es el caso de una universidad peruana de renombre, que prefiere mantenerse
anónima, sobre cómo hace para predecir qué estudiantes son los que no culminaran
sus estudios, y las razones por las cuales ocurrirá ello. La universidad analiza toda la
data (estructurada y no estructurada) que recibe de los postulantes al momento de
presentarse a la universidad, y los relaciona con los resultados que se obtienen luego
de los seis años de estudios, es decir, si completan la carrera o si se retiran de la uni-
versidad por algún motivo.
Se trabaja con 10 variables independientes que se obtienen cuando el estudiante
está postulando a la universidad. Como variable dependiente se tiene a la posición del
estudiante. Esta variable fue definida categóricamente con cuatro alternativas: terminó
la carrera universitaria, se retiró voluntariamente porque quiso irse a estudiar a otra
institución, se retiró por muy malas notas, y fue retirado por la universidad por notas
muy malas.
La información se analiza con herramientas de anlytics, la minería de datos, uti-
lizando específicamente, la regresión múltiple, árboles de clasificación, redes neuro-
nales y la regresión logística, y se llega a tener una precisión del 75 %, lo que ayuda
a dar cursos de preparación para las materias en las cuales no traen una preparación
adecuada, apoyo psicológico para los que tienen posibles problemas por motivos
varios, y también apoyo financiero para quienes lo requieran.
El error de tratar de pasar directamente a un sistema de big data, sin mayores aná-
lisis, desde un sistema típico de inteligencia de negocios con una Data Warehouse
relacional sería el siguiente: primero, creer que porque una organización tiene ac-
tualmente una millonada de datos que le llegan frecuentemente, tiene que pasar
a un sistema de big data, cuando su sistema de inteligencia de negocios con una
388
El concepto de big data se actualiza casi cada mes y viene tratando de subsanar
todas las deficiencias que tiene comparado con los sistemas de inteligencia de
negocios con Data Warehouse relacionales. Se han ido desarrollando nuevas tec-
nologías big data, para sobreponerse a las limitaciones de sus componentes, el
Hadoop Distributed File System y el Hadoop Map reduce, derivados de la base
de datos no relacional del NoSQL. Se han creado tecnologías como el HBase, Pig,
Hive, Spark, Flink, Ignite y H20 (que superan a la base de datos NoSQL), las cuales
logran buenos avances, pero todavía requieren de algo más (Lemahieu et al., 2018).
El sistema de big data viene evolucionado rápidamente para solucionar las li-
mitaciones que tiene actualmente y promete superarlas en un periodo no muy
lejano, trabajando conjuntamente con el concepto de la Data Warehouse y su base
de datos relacional para data estructurada, pero siempre cambiando el paradig-
ma de analizar la información inmediatamente al momento de su llegada (stream
analytics), y no como antes, que consistía en primero guardar la información en la
Data Warehouse y posteriormente empezar el proceso de análisis.
5. Guía de implementación
Se proponen, a continuación, algunas recomendaciones clave para la implementa-
ción de una adecuada y eficiente estrategia de big data:
389
390
6. Recursos útiles
• ¿Qué es Big Data? - IBM Developer
[Link]
• ¿Qué son los Big Data? - Amazon Web Services
[Link]
• Big data is better data - TED Talk - Kenneth Cukier
[Link]
• How Netflix Uses Analytics To Select Movies, Create Content, and Make
Multimillion Dollar Decisions - Zach Bulygo
[Link]
• Fighting Coronavirus with Big Data - Harvard Business Review - Julie Shah y
Neel Shah [Link]
391
Referencias bibliográficas
Arca Continental (2016). Big Data boosts business for beverage company. Recuperado
de [Link]
-company
Bulygo, Z. (2019). How Netflix uses analytics to select movies, create content, and make
multimillion dollar decisions. Recuperado de [Link]
uses-analytics/
Davenport, T. y Harris, J. (2017). Competing on Analytics. The New Science of Winning.
Boston: Harvard Business School Press. Updated edition.
Fernandez-Manzano, E.P., Neira, E. y Clares-Gavilán, J. (2016). Data Management in
Audiovisual Business: Netflix as a Case Study. El profesional de la Información, (25),
pp. 568-576.
Frost and Sullivan (2018). Brazil and Mexico stand as front-runners in the Latin American
Big Data Market, says Frost & Sullivan. Recuperado de [Link]
press-releases/brazil-and-mexico-stand-front-runners-latin-american-big-data-market-
says-frost-sullivan/
Landgraf, J. (2018). Netflix uses data to drive creativity, and it is terrifying Holliwood. Strea-
ming Media, June 2018. Recuperado de [Link]
Editorial/Featured-Articles/Netflix-Uses-Data-to-Drive-Creativity-and-It-Terrifies-Ho-
[Link]
Laudon, K. y Laudon, J. (2017). Management Information Systems, Fifteenth edition.
Boston: Prentice Hall.
Lemahieu, W., Vanden Broucke, S., y Baesens, B. (2018). Principles of Database Mana-
gement. Great Britain: Cambridge University Press.
Madrigal, A. (2014). How Netflix reverse-engineered Hollywod. Recuperado de https://
[Link]/technology/archive/2014/01/how-netflix-reverse-engineered-ho-
llywood/282679/
Marr, B. (2015). Big Data: How Netflix uses it to drive business success. However although
Big Data is used across every aspect of the Netflix business. Recuperado de [Link]
[Link]/big-data-how-netflix-uses-it-drive-business-success/
Million, M. (2019). Customer segmentation in the age of Big Data. Recuperado de
[Link]
[Link]
Rohan (2018). Deciphering the unstoppable Netflix and the role of Big Data. Recupe-
rado de [Link]
[Link]
Sharda, R., Delen, D. & Turban, E. (2018). Business Intelligence, Analytics and Data
Science: A Managerial Perspective. New York: Pearson.
The tech giant everyone is watching, and The televisión will be revolutionised (30 de
junio de 2018) The Economist, p. 11. Recuperado de [Link]
tent/uploads/2018/07/The_Economist_USA_-_June_30_2018.pdf
392