Tema 1
Big Data y Analytics
Tema 1. Big data y analytics y
el internet de las cosas
Índice
Esquema
Ideas clave
1.1. Introducción y objetivos
1.2. Aproximación a los sistemas big data
1.3. Oportunidades y retos de los sistemas big data en
escenarios IoT
1.4. Referencias bibliográficas
A fondo
Paisaje de las tecnologías de datos e inteligencia artificial
Tutorial de big data para principiantes
Internet of Things and Big Data. Better Together
Test
Esquema
Big Data y Analytics 3
Tema 1. Esquema
© Universidad Internacional de La Rioja (UNIR)
Ideas clave
1.1. Introducción y objetivos
Hablar de las nuevas tecnologías, la evolución de las comunicaciones, la adopción
en nuestro día a día del uso de dispositivos móviles, el cada vez más extendido uso
de dispositivos inteligentes o la explosión de los sistemas IoT (internet de las
cosas, de sus siglas en inglés Internet of the Things) ha dejado de ser algo
novedoso para pasar a formar parte de nuestras vidas cotidianas. No en vano,
estamos inmersos en un fenómeno de aceleración tecnológica y digitalización sin
precedentes. Este fenómeno ha dado lugar a la generación de volúmenes de
información difícilmente manejables por los sistemas tradicionales, de ahí que el
paradigma del big data haya irrumpido con fuerza, más como una necesidad que
como una alternativa. Como cabe esperar, empresas de todos los sectores están
inmersas de lleno en esta vorágine de digitalización, cambios, evolución y, en
definitiva, proceso de profunda transformación.
A lo largo del presente se introduce el paradigma del big data, definiéndolo,
identificando los problemas que trata de resolver, enfatizando los retos a los que se
enfrenta, reconociendo las oportunidades que presenta y mencionando algunas de
las tecnologías que están involucradas en él. Tras el planteamiento general, el tema
se centra en el contexto de interés del máster y esta asignatura, identificando
algunos de los retos a los que los sistemas de big data se enfrentan dentro de él.
De forma más concreta, el presente tema busca la consecución de los siguientes
objetivos:
▸ Entender el significado del término big data, así como identificar los problemas,
retos, oportunidades y tecnologías que están incluidas en él.
▸ Identificar las oportunidades que la evolución tecnológica y la explosión de los datos
presentan para la mejora de los entornos empresariales y, más concretamente, en
entornos que hacen uso de sistemas IoT.
Big Data y Analytics 4
Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave
▸ Entender los sistemas big data como pieza fundamental en los procesos de
digitalización.
▸ Identificar y entender los retos que el big data debe afrontar para hacer un uso
eficiente de los entornos IoT.
Big Data y Analytics 5
Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave
1.2. Aproximación a los sistemas big data
Durante los últimos años la tecnología ha evolucionado a un ritmo muy rápido
provocando, entre otros efectos, que los volúmenes de información que manejamos
hayan crecido exponencialmente (Deloitte Insights, IoT applications: From sensing to
doing, 2016). Sirva como ejemplo la estimación recogida en la figura 1, en la que se
estima que el volumen de datos/información generados, copiados y consumidos en
2025 será de 175 zettabytes, aumentando de forma exponencial a los 612 en 2030 y
los 2 142 en 2035.
Además, es importante señalar que la información generada es acumulativa, siendo
mucho menor el porcentaje de información que se elimina que la nueva generada, en
parte gracias al abaratamiento que el almacenamiento de la información ha
experimentado.
Es aquí donde aparece y se instala el big data como paradigma que
trata de resolver los problemas que supone el manejo de estos
volúmenes tan elevados de información.
Los datos por sí mismos y la resolución de los problemas que plantea su manejo dan
lugar a una serie de retos y múltiples oportunidades a los que el big data trata de dar
respuesta. En definitiva, el objetivo último de un sistema big data concreto será hacer
u n uso eficiente y efectivo de los datos, de forma que podamos tomar mejores
decisiones y de ahí que estos jueguen un importante papel en los sistemas de
soporte de decisiones guiados por datos (DSS, data-driven Decision Support
Systems) (Poleto et al., 2015).
Big Data y Analytics 6
Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave
Figura 1. Cantidad real y prevista de datos generados en todo el mundo (en zettabytes). Fuente: Statista
Digital Economy Compass, 2019.
El primer problema al que se enfrentan los sistemas big data se presenta con el uso
de las infraestructuras de datos tradicionales. La solución tradicional a los
problemas de escalado, cuando se requieren más recursos de almacenamiento o
procesamiento, se lleva a cabo mediante el escalado vertical (scale up). Esta
aproximación consiste en aumentar el tamaño del servidor o máquina que nos presta
el servicio.
Sin embargo, a pesar de las ventajas que presenta al trabajar con sistemas en
producción, este crecimiento es limitado, puede ser caro y, además, aumenta el
riesgo de no disponibilidad antes fallos. Tratando de solventar estos problemas, los
sistemas big data suelen hacer uso del escalamiento horizontal (scale out),
fomentando el uso de soluciones en clúster. Esta solución, la cual puede combinarse
con el escalado vertical, presenta múltiples ventajas como su potencial de
crecimiento, el uso de dispositivos más baratos, la alta disponibilidad, el balanceo de
Big Data y Analytics 7
Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave
carga o el mejor comportamiento ante fallos en los nodos. Sin embargo, su
configuración y mantenimiento es más complejo.
Figura 2. Escalamiento vertical vs. escalamiento horizontal: en el primero se aumenta el tamaño del
servidor frente al aumento de los nodos en el segundo.
Por otro lado, el crecimiento de los datos ha sido producido (y fomentado) por la
aparición de múltiples estándares de comunicación, almacenamiento y gestión de
datos e información, así como de infinidad de proveedores de soluciones para la
recogida, manejo y análisis de datos. Aparece entonces el primer reto que afrontan
los sistemas big data: la estandarización (Al-Qaseemi et al., 2016). La gestión de
información proveniente de diferentes fuentes heterogéneas es actualmente tediosa
y costosa: por ejemplo, si se utiliza un sensor de temperatura de un fabricante y un
sistema de iluminación inteligente de otro, la integración de la información de ambos
requerirá trabajar con dos sistemas diferentes para recibir su información y
manejarlos.
De forma más concreta, algunas de las fuentes de datos que nutren a los sistemas
big data pueden ser sensores, wearables, vehículos, maquinaria, cámaras, bases de
datos, fuentes públicas de datos, observaciones, personas, animales, dispositivos
energéticos y un largo etcétera. Es importante resaltar en este punto la importancia
que los sistemas IoT tienen a la hora de nutrir sistemas big data de muy diversa
índole.
Big Data y Analytics 8
Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave
Esta heterogeneidad no solo viene dada por el tipo de persona, dispositivo o software
que nos esté proporcionando la información, sino en qué forma se facilite esta. Así,
podemos clasificar los conjuntos de datos por la estructura en la que estos se
encuentran o son proporcionados. En este punto, podemos identificar tres tipos de
datos (Holden, 2020):
▸ Datos estructurados: los datos estructurados son aquellos que se adhieren a un
modelo de datos predefinido y, por lo tanto, son fáciles de analizar. Los datos
estructurados se ajustan a un formato tabular con relación entre las diferentes filas y
columnas. Los ejemplos más comunes de datos estructurados son archivos de
Excel o las bases de datos relacionales SQL.
▸ Datos no estructurados: los datos no estructurados son información que no está
organizada de una manera predefinida o que no sigue un modelo para tal fin. La
información no estructurada suele contener texto, pero también puede contener
datos como fechas, números y hechos. Los ejemplos comunes de datos no
estructurados incluyen archivos de audio, vídeo o en gran parte las bases de
datos NoSQL (not only SQL). La capacidad de almacenar y procesar datos no
estructurados ha crecido enormemente en los últimos años gracias a las nuevas
tecnologías y herramientas que permiten manejar este tipo de datos (por ejemplo,
MongoDB para almacenar documentos). La capacidad de analizar datos no
estructurados es especialmente relevante en el contexto de big data, ya que una
gran parte de los datos en las organizaciones no están estructurados (imágenes,
vídeos o documentos). La capacidad de extraer valor de los datos no estructurados
es uno de los principales impulsores del rápido crecimiento de big data.
Big Data y Analytics 9
Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave
▸ Datos semiestructurados: los datos semiestructurados son una forma de datos
estructurados que no se ajusta a la estructura formal de los modelos de datos
asociados con bases de datos relacionales u otras formas de tablas de datos, pero
que contienen etiquetas u otros marcadores para separar elementos semánticos y
hacer cumplir las jerarquías de registros y campos (estructura autodescriptiva).
Algunos ejemplos de datos semiestructurados incluyen los formatos CSV, JSON y
XML . Este tipo de datos son más fáciles de analizar que los datos no estructurados,
existiendo muchas soluciones y herramientas con la capacidad de leer y procesar
CSV, JSON o XML.
• Nota: Un CSV, a pesar de representar una tabla, de por sí no es capaz de
representar datos jerárquicos o relacionales, al menos no gracias a su formato. Se
han de emplear varios archivos CSV y claves externas en varios archivos para
representar estas relaciones. De ahí que se consideren semiestructurados.
▸ Metainformación: aunque no se considere como una estructura de datos como tal,
la metainformación es uno de los elementos más importantes para el análisis de
datos. Podemos considerar que los metadatos son datos sobre datos,
proporcionando información adicional sobre un conjunto específico de datos. En un
conjunto de fotografías, por ejemplo, los metadatos podrían describir cuándo y dónde
se tomaron las fotografías. De este modo, los metadatos proporcionan campos para
fechas y ubicaciones que, por sí mismos, pueden considerarse datos estructurados.
Big Data y Analytics 10
Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave
Además de todo lo anterior, el big data no solo está relacionado con la cantidad de
datos, su formato o su heterogeneidad. Los sistemas big data van más allá y se
caracterizan de forma más completa por los retos que tratan de resolver, los cuales
se conocen como las «V» del big data. Esta aproximación comenzó con tres «V»,
siguió con cinco y pueden encontrarse referencias en las que se identifican hasta
diecisiete (Arockia Panimalar, A. et al., 2017). En este texto presentamos la
versión de las siete «V» del big data, tal y como muestra la figura 3 y se describe a
continuación:
Figura 3. Las 7 «V» del Big Data. Fuente: Elaboración propia.
▸ Volumen: es el más obvio y se refiere a la gran cantidad de datos que han de
Big Data y Analytics 11
Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave
manejar los sistemas big data.
▸ Velocidad: se refiere a la capacidad de recopilar, procesar y acceder a los datos en
el menor tiempo posible. Por ejemplo, los sistemas de monitorización en tiempo real
son críticos en este sentido.
▸ Variedad: este reto está relacionado con la heterogeneidad de fuentes y formatos.
Los sistemas big data deben resolver este reto de forma transparente y eficiente. Un
ejemplo podría ser un sistema de monitorización de cultivos en el que dispongamos
de información sobre los tratamientos aplicados desde una base de datos,
información de sensores ambientales en formato semiestructurado e información no
estructurada como podría ser la toma de imágenes de dicho cultivo.
▸ Veracidad: la veracidad está relacionada con la fiabilidad y precisión de los datos
recogidos. Disponer de fuentes fiables (como podrían considerarse las fuentes
oficiales de datos) y que faciliten información precisa permitirá a nuestro sistema
alejarse de las imprecisiones que generan los datos de mala calidad.
▸ Variabilidad: la variabilidad (no debe confundirse con la variedad) se refiere al
carácter cambiante de los datos, centrándose, principalmente, en entender el
significado de los datos. Sirva como ejemplo el vino que se elabora en una bodega:
un vino elaborado con la misma proporción de cada tipo de uva año tras año
manteniendo las condiciones ambientales de la bodega y, sin embargo, presentar
variabilidad entre añadas al tener diferentes matices en el sabor entre ellas.
▸ Visualización: la visualización se ha convertido en uno de los aspectos clave de los
sistemas big data actuales. El uso de infografías, gráficas, dashboards u otros
recursos para mostrar la información extraída de datos complejos ha demostrado ser
mucho más efectiva que la transmisión de los datos en crudo.
▸ Valor: el objetivo último de todo sistema big data es proporcionar valor añadido tras
el análisis de los datos. No solamente debemos disponer de cantidades ingentes de
información, sino que debemos ser capaces de procesarla, organizarla y analizarla
Big Data y Analytics 12
Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave
para su comprensión sea fácil y mejore el proceso de toma de decisiones.
Un análisis preciso y rápido de los datos requiere de técnicas complejas de
Inteligencia artificial (Artificial Intelligence) y, dentro de esta, de Aprendizaje
automático (Machine Learning). La integración de este tipo de técnicas permite
acelerar el proceso de análisis y, sobre todo, la posibilidad de trabajar con grandes
volúmenes de datos que no podrían ser manejados con los sistemas tradicionales.
L a s redes neuronales para el reconocimiento de imágenes, los sistemas de
recomendación de productos a los clientes o la aplicación de técnicas de clustering
para clasificar al público objetivo en una campaña de marketing son algunos de los
múltiples ejemplos que pueden encontrarse de su aplicación.
A tenor de lo expuesto anteriormente, puede concluirse que los ámbitos en los que
puede aplicarse el big data son innumerables, algunos de los cuales son los
siguientes:
▸ Retail: el auge del e-commerce ha hecho que las empresas de retail tengan en el
big data a su gran aliado. Gracias a los recursos que ofrece, son capaces de
desarrollar estrategias centradas en el usuario (customer centric), optimizar los
precios y optimizar la producción.
▸ Logística y transporte: la logística y el transporte conforman uno de los primeros
ámbitos que se beneficiaron de los sistemas big data. Así, la trazabilidad de flotas, la
optimización de rutas, la predicción de demanda para la gestión de almacenes o la
monitorización del estado de los vehículos en tiempo real son algunos de los
Big Data y Analytics 13
Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave
problemas que se han visto más beneficiados.
▸ Banca: a pesar de ser uno de los sectores más tradicionales y reticentes a los
cambios (debido, como cabe esperar, a las grandes medidas de seguridad), la banca
también ha sucumbido a la implantación y utilización de sistemas big data. Por
ejemplo, la aparición de las Fintech basa gran parte de su valor añadido en la
resolución de problemas de nicho mediante la aplicación de big data. Por otra parte,
los propios bancos son capaces de mejorar sus previsiones de rentabilidad y riesgos
mediante un uso intensivo de datos y algoritmos.
▸ Marketing: la revolución digital y, sobre todo, la aparición de las redes sociales y los
motores de búsqueda en Internet han cambiado el mundo del marketing de tal forma
que no puede entenderse sin que sea asociado al big data. La gran cantidad de
información que generamos facilita que recibamos un marketing más personalizado
que, como cabe esperar, intenta maximizar el número de conversiones.
▸ Salud: al igual que los ejemplos anteriores, los sistemas sanitarios se han visto
beneficiados por el paradigma del big data. Además de por la mejora que pueda
haber en los sistemas de detección de enfermedades, gracias al uso de una
cantidad mayor de datos y las mejoras computacionales y algorítmicas, la
digitalización del sistema sanitario y su gestión como un sistema big data permite
que nuestro expediente médico esté disponible en cualquier consulta o que podamos
Big Data y Analytics 14
Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave
disfrutar de la comodidad que ofrece la receta electrónica.
▸ Educación: la educación no permanece impasible a la revolución de los datos (y
sirva como ejemplo de digitalización y gestión bajo premisas big data la propia
UNIR). Gracias a los sistemas big data, se ha conseguido mejorar los servicios a los
estudiantes, facilitar el trabajo remoto, así como permitir una mejor categorización de
los estudiantes o adaptación de los planes de estudio.
▸ Gobierno electrónico: la implantación de los sistemas de gobierno electrónico ( e-
government) ha requerido solucionar muchos de los retos que proponen los sistemas
big data. Por ejemplo, el desarrollo de un registro electrónico de documentos
requiere la aplicación de medidas de seguridad y almacenamiento y gestión de datos
que los sistemas big data facilitan.
▸ Seguros: el sector de las aseguradoras también ha dado un giro relativamente
importante gracias al big data. Parece obvio que gracias a la posibilidad de gestionar
más cantidad de información el cálculo de riesgos resultará más preciso y, además,
muchas aseguradoras están incluyendo información de sus clientes a través de
dispositivos inteligentes, como pueden ser los smartwatches, para recoger datos que
les permitan identificar sus hábitos y ser aún más precisos.
▸ Agricultura y ganadería: la agricultura y la ganadería están experimentando un
gran cambio gracias al IoT. La monitorización de cultivos en tiempo real o la
Big Data y Analytics 15
Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave
utilización de sensores que recogen datos sobre el estado de salud del ganado han
permitido que se haga un uso más eficiente de los recursos, que se pueda
reaccionar de forma rápida ante situaciones de riesgo o que se puedan analizar
datos históricos que nos permitan predecir la producción y la demanda.
▸ Industria 4.0: la combinación del big data con el IoT juega un rol fundamental en
algunos las áreas más relevantes de la industria 4.0 como, por ejemplo, en
fabricación inteligente, en la que los datos de los sensores de la maquinaria de
producción se analizan para predecir cuándo se necesitarán operaciones de
mantenimiento y reparación. Mediante su aplicación, los fabricantes mejoran la
eficiencia de la producción, analizan datos en tiempo real, optimizan el
mantenimiento predictivo y automatizan la gestión de la producción (Bordeleau et al.,
2018).
De la breve descripción de algunos de los ámbitos que se benefician del big data,
pueden identificarse, entre muchas otras, las siguientes oportunidades:
▸ Mejora en la monitorización de procesos.
▸ Optimización de campañas de marketing.
▸ Mejora de las ventas.
▸ Mejora de la satisfacción y la experiencia del cliente.
▸ Mejora de la gestión logística y de almacén.
Big Data y Analytics 16
Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave
▸ Identificación de productos, tendencias y ventajas competitivas.
▸ Ahorro de costes.
▸ Mejora del proceso de toma de decisiones (más rápida y con más criterios).
▸ Aumento de la capacidad de pronosticar la demanda con mayor precisión.
▸ Resolución de problemas de redes de distribución más complejos.
▸ Mejora de la eficiencia de la planificación.
▸ Mejora de la planificación de los recursos humanos.
▸ Colaboración en la cadena de suministro.
▸ Monitorización de vehículos y maquinaria.
Llegados a este punto es fácil intuir que muchos de los ámbitos de actuación y de las
oportunidades descritas anteriormente requieren de la información que tanto
dispositivos conectados como sensores proveen. La siguiente sección se centra en
este aspecto, destacando los retos más importantes de los sistemas big data en
escenarios IoT.
Puedes acceder al vídeo El ciclo de vida de los datos para profundizar en este tema.
Big Data y Analytics 17
Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave
Accede al vídeo:
https://unir.cloud.panopto.eu/Panopto/Pages/Embed.aspx?id=4bcfe28a-5cb5-
42a9-b860-adb000639486
Big Data y Analytics 18
Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave
1.3. Oportunidades y retos de los sistemas big data
en escenarios IoT
Tal y como se ha avanzado en la sección anterior, los sistemas IoT pueden
entenderse como una de las fuentes de información más importantes que
alimentan los sistemas big data. Sin embargo, es importante destacar que IoT y
big data son paradigmas diferentes pero complementarios. De igual modo, hemos
visto que los casos de uso del IoT abarcan una amplia gama de usos y sectores,
desde la agricultura hasta los dispositivos inteligentes y la maquinaria. Los sensores
se utilizan para la gestión de activos, el seguimiento de flotas, la supervisión remota
de la salud, etc.
Las herramientas creadas para gestionar los sistemas big data y realizar el pertinente
análisis de datos son claves para controlar la afluencia de datos procedentes de los
dispositivos IoT. Los desarrolladores centrados en el IoT están creando
arquitecturas, plataformas, sistemas y aplicaciones que las empresas y
organizaciones pueden utilizar para gestionar sus dispositivos IoT y los datos
generados.
Enfatizando en que ambos sistemas son diferentes, pero
complementarios, debemos entender que, aunque ambos se refieren a
la recopilación de grandes conjuntos de datos, el IoT trata de realizar
de forma simultánea el análisis de estos, de forma que pueda
apoyarse la toma de decisiones en tiempo real.
Un ejemplo práctico sería el de los vehículos autónomos, los cuales no pueden dejar
para otro momento la toma de decisiones en función de los datos recopilados por los
sensores. No obstante, este no es el único propósito pues, como es lógico, la
información recopilada por los dispositivos IoT puede ser analizada a posteriori.
Big Data y Analytics 19
Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave
Gran parte de los sistemas IoT están integrados en entornos de computación en la
nube o cloud computing. Gracias a este paradigma de computación somos
capaces de recopilar información concreta para convertirla en ubicua y accesible de
forma remota. Sin embargo, para dotar de agilidad a esta toma de decisiones,
muchos dispositivos IoT trabajan en entornos de computación en el borde o edge
computing. En este caso, los dispositivos, o su entorno más cercano, disponen de
capacidad de procesamiento que será clave para tomar determinadas decisiones en
las que la latencia es clave como, por ejemplo, el lanzamiento de una alerta de
seguridad en una línea de producción industrial ante el reconocimiento de una
situación de riesgo medida a partir de sensores y cámaras termográficas.
Más allá del análisis de información en tiempo real o de datos históricos, los
sistemas big data se apoyan en la información proporcionada por los sistemas
IoT para el desarrollo de modelos de análisis preventivo, predictivo y
correctivo. Desde un punto de vista industrial, las empresas dispondrán de
información de rendimiento de sus activos, así como de las alertas de servicio que se
hayan podido generar. Dicha información facilita una gestión proactiva de estos
activos, mejorando su disponibilidad, rendimiento, tiempo de vida y eficiencia
mediante, por ejemplo, el almacenamiento correcto de stock de piezas de
mantenimiento, la programación de revisiones en tiempo y forma, así como la
monitorización de elementos críticos en tiempo real.
La generación de datos por parte de sistemas IoT no es algo novedoso. Sin
embargo, hasta la irrupción de los sistemas big data, muchos de estos datos
quedaban almacenados en los propios dispositivos o máquinas, data lakes o silos sin
que se sacase partido de ellos, debido a que no se disponía de herramientas que
permitiesen su análisis. Los sistemas big data solucionan entonces el problema real:
la extracción de valor a partir de datos ya existentes.
Además, los sistemas IoT no buscan la aplicación de big data para solucionar
Big Data y Analytics 20
Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave
solamente problemas aislados, sino que se enfoca en lograr una verdadera
inteligencia empresarial mediante la recopilación, el análisis y el intercambio de
datos en todos los ámbitos empresariales, no solamente en la fabricación
(Bordeleau et al., 2018). De este modo tratan de buscar sistemas de producción más
eficientes, respuestas más apropiadas a las necesidades comerciales de cada
momento o reaccionar a tiempo ante un imprevisto en la cadena de suministro
(Schundelfrei, 2019).
Uno de los principales objetivos es optimizar y automatizar la producción mediante el
apoyo en la sensorización. Es decir, que los sensores integrados en maquinaria,
vehículos, edificios, objetos y personas, los componentes y los trabajos en curso
transmitan datos en tiempo real a los sistemas de información puestos en marcha.
A su vez, los sistemas IoT se beneficiarán de la aplicación de algoritmos de
inteligencia artificial y, más concretamente, aprendizaje automático con el objeto de
analizar y obtener información a partir de los datos recopilados y ajustar los procesos
manual o automáticamente según sea necesario.
Sin que los ejemplos tengan que ser entendidos como una lista cerrada, el big data
da soporte a los entornos IoT en los siguientes casos:
▸ Descubrimiento de variables ocultas. Es bastante habitual que aparezcan
variables ocultas tanto en los procesos de producción como en cualquier otro. La
aplicación de técnicas big data permite identificarlas de modo que se eviten los
cuellos de botella que causan retrasos en la producción.
▸ Mejora del rendimiento en tiempo real. El procesamiento de la información en
tiempo real es clave en multitud de procesos. Con ello se consigue la optimización
Big Data y Analytics 21
Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave
de la cadena de suministro, de la producción, del rendimiento de maquinaria, de los
precios, la predicción de fallos, el desarrollo de productos o el diseño de fábricas
inteligentes, entre muchos otros casos de uso.
▸ Sistemas de autoservicio. La adopción de análisis de autoservicio en ingeniería
puede ayudar a consolidar grandes cantidades de macrodatos de las plantas de
producción. Por ejemplo, Intel tiene equipos en su fábrica inteligente que envían
datos a un sistema de autoservicio que procesa y analiza los datos en tiempo real,
encontrando patrones, detectando fallos y creando visualizaciones para la gerencia
(Sachdev, 2020).
▸ Mantenimiento predictivo. Es un ejemplo de uso de los datos para la toma de
decisiones. La información permite priorizan los cambios y las acciones que se
deben tomar para evitar tiempos de inactividad no programados o el mal
funcionamiento del equipo. El análisis de datos recopilados por dispositivos IoT
entornos industriales es sinónimo de mantenimiento predictivo (Sachdev, 2020).
▸ Automatización de la gestión de la producción. Esto implica reducir la cantidad
de aportaciones y acciones humanas necesarias en la producción. Su aplicación
hace uso del análisis de datos históricos del proceso de producción, combinándolos
con información en tiempo real de ese proceso en particular y automatizando los
cambios físicos en los equipos mediante actuadores y robótica avanzada que están
Big Data y Analytics 22
Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave
conectados al software de control. El software de control toma inferencias hechas a
partir del análisis de big data y envía comandos específicos a estos actuadores y
robots que alterarán físicamente la configuración del equipo y la maquinaria sin
ninguna intervención humana (Sachdev, 2020).
▸ Mejora del proceso logístico. No solo a nivel intraempresarial, sino gracias a la
integración con datos de terceros, como pueden ser repartidores, proveedores, etc.
A lo largo de los siguientes temas profundizaremos en gran parte de los
componentes que forman parte de los sistemas big data, como son la recogida de
datos, las arquitecturas en la nube que facilitan este proceso, las técnicas de
inteligencia artificial que pueden aplicarse, las herramientas de visualización más
extendidas, así como otros aspectos relacionados con la inteligencia empresarial o el
marco legal.
En el vídeo Plataforma para el tratamiento de datos IoT en smart territories, se
explica un ejemplo de plataforma.
Big Data y Analytics 23
Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave
Plataforma para el tratamiento de datos IoT en smart territories
Accede al vídeo:
https://unir.cloud.panopto.eu/Panopto/Pages/Embed.aspx?id=415e2acb-16f7-
40cc-9c4a-ada400ccbf06
Big Data y Analytics 24
Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave
1.4. Referencias bibliográficas
Al-Qaseemi, S. A., Almulhim, H. A., Almulhim, M. F. y Chaudhry, S. R. (2016). IoT
architecture challenges and issues: Lack of standardization. 2016 Future
Technologies Conference (FTC), 731-738.
Arockia Panimalar, S., Varnekha Shree, S. y Veneshia Kathrine, A. (2017). The 17
V’s of big data. International Research Journal of Engineering and Technology, 4 (9),
329-333.
Bordeleau, F.-E., Mosconi, E. y Santa-Eulalia, L. A. (2018). Business Intelligence in
Industry 4.0: State of the art and research opportunities. Proceedings of the 51st
Hawaii International Conference on System Sciences.
Holden, P. (2020). Defining Structured, Semi-Structured, and Unstructured Data.
https://www.convergeone.com/blog/defining-unstructured-data
IoT applications: From sensing to doing (2016). Deloitte Insights.
https://www2.deloitte.com/us/en/insights/focus/tech-trends/2016/internet-of-things-iot-
applications-sensing-to-doing.html
Poleto, T., de Carvalho, V. D. H. y Costa, A. P. C. S. (2015). The roles of big data in
the decision-support process: An empirical investigation. International conference on
decision support system technology, 10-21.
Sachdev, M. (2020). The Role of Big Data Analytics in Industry 4.0.
https://blog.rgbsi.com/big-data-analytics-in-industry-4.0
Schundelfrei, M. (2019). Big Data Challenges of Industry 4.0. Datanami.
https://www.datanami.com/2019/04/25/big-data-challenges-of-industry-4-0/
Big Data y Analytics 25
Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
A fondo
Paisaje de las tecnologías de datos e inteligencia
artificial
Matt Truck. [Página web]. https://mattturck.com/data2020/
Matt Truck presenta en su página web un completo paisaje, actualizado año tras año,
de las tecnologías incluidas en los sistemas big data, así como de las técnicas de
inteligencia artificial más demandadas. Este recurso nos da una idea de la amplitud
de este ecosistema y nos sirve como referencia para la búsqueda y ubicación de
soluciones comerciales (o de uso libre) concretas.
Big Data y Analytics 26
Tema 1. A fondo
© Universidad Internacional de La Rioja (UNIR)
A fondo
Tutorial de big data para principiantes
Edureka! (25 de abril de 2017). Big Data Tutorial For Beginners [Vídeo]. Youtube.
https://www.youtube.com/watch?v=zez2Tv-bcXY
Edureka! presenta en este vídeo una amplia introducción a los sistemas big data,
incluyendo ejemplos muy ilustrativos y una pequeña introducción al ampliamente
extendido framework Hadoop.
Big Data y Analytics 27
Tema 1. A fondo
© Universidad Internacional de La Rioja (UNIR)
A fondo
Internet of Things and Big Data. Better Together
Verma, A. Internet of Things and Big Data. Better Together [Blog post]. Whizlabs.
https://www.whizlabs.com/blog/iot-and-big-data/
Este artículo de Amit Verma da idea de cómo se complementan los sistemas IoT y
los sistemas big data. Debemos ser conscientes que de que ambos se necesitan
mutuamente para extraer el máximo partido a los datos recopilados.
Big Data y Analytics 28
Tema 1. A fondo
© Universidad Internacional de La Rioja (UNIR)
Test
1. El crecimiento del volumen de datos en los próximos años no será relevante, por
lo que los sistemas tradicionales pueden gestionar su recolección, análisis y
procesamiento sin problemas.
A. Verdadero.
B. Falso.
2. ¿Qué sistema de escalamiento será el más apropiado para ampliar la capacidad
de procesamiento y almacenamiento de datos en tu empresa?
A. Escalamiento vertical.
B. Escalamiento horizontal.
C. Una combinación de escalamiento vertical y horizontal.
D. Cualquiera de la anteriores dependiendo del problema concreto y la
disponibilidad de recursos.
3. Los ficheros JSON son un ejemplo de datos:
A. Datos estructurados.
B. Datos no estructurados.
C. Datos semiestructurados.
D. Ninguna de las anteriores.
4. Una hoja de Excel es un ejemplo de:
A. Datos estructurados.
B. Datos no estructurados.
C. Datos semiestructurados.
D. Ninguna de las anteriores.
Big Data y Analytics 29
Tema 1. Test
© Universidad Internacional de La Rioja (UNIR)
Test
5. La recogida de imágenes a través de drones nos facilita:
A. Datos estructurados.
B. Datos no estructurados.
C. Datos semiestructurados.
D. Ninguna de las anteriores.
6. Señala todos los términos que forman parte de las «V» del big data:
A. Velocidad.
B. Variabilidad.
C. Viscosidad.
D. Valor.
7. Las técnicas de inteligencia artificial son un elemento clave a la hora de realizar
análisis complejos en sistemas big data:
A. Verdadero.
B. Falso.
8. El sector de las aseguradoras se beneficia de la aplicación de big data gracias a:
A. La capacidad para analizar datos de más clientes.
B. Conocer mejor a los clientes gracias a la mejor gestión de sus perfiles.
C. La integración de nuevas tecnologías como los wearables que le permiten
recoger datos de sus clientes que permiten identificar sus hábitos.
D. Todas las respuestas anteriores son correctas.
Big Data y Analytics 30
Tema 1. Test
© Universidad Internacional de La Rioja (UNIR)
Test
9. ¿En qué áreas podemos mejorar el rendimiento de nuestros sistemas gracias a la
utilización de datos prevenientes de sistemas IoT?
A. Mantenimiento predictivo.
B. Gestión de la producción.
C. Gestión de almacén.
D. Todas las respuestas son correctas.
10. En muchas ocasiones ya se disponía de datos producidos por maquinaria u
otros dispositivos IoT, pero no eran analizados de forma masiva, ya que estaban
aislados en los propios dispositivos, en las máquinas o en diferentes silos. La
irrupción de big data ha facilitado el análisis de estos datos tanto de forma
independiente como en combinación con otros.
A. Verdadero.
B. Falso.
Big Data y Analytics 31
Tema 1. Test
© Universidad Internacional de La Rioja (UNIR)