0% encontró este documento útil (0 votos)
38 vistas31 páginas

Tema 1 BDA

Cargado por

Andres Sanchez
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
38 vistas31 páginas

Tema 1 BDA

Cargado por

Andres Sanchez
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Tema 1

Big Data y Analytics

Tema 1. Big data y analytics y


el internet de las cosas
Índice
Esquema

Ideas clave

1.1. Introducción y objetivos

1.2. Aproximación a los sistemas big data

1.3. Oportunidades y retos de los sistemas big data en


escenarios IoT

1.4. Referencias bibliográficas

A fondo

Paisaje de las tecnologías de datos e inteligencia artificial

Tutorial de big data para principiantes

Internet of Things and Big Data. Better Together

Test
Esquema

Big Data y Analytics 3


Tema 1. Esquema
© Universidad Internacional de La Rioja (UNIR)
Ideas clave

1.1. Introducción y objetivos

Hablar de las nuevas tecnologías, la evolución de las comunicaciones, la adopción

en nuestro día a día del uso de dispositivos móviles, el cada vez más extendido uso

de dispositivos inteligentes o la explosión de los sistemas IoT (internet de las

cosas, de sus siglas en inglés Internet of the Things) ha dejado de ser algo

novedoso para pasar a formar parte de nuestras vidas cotidianas. No en vano,

estamos inmersos en un fenómeno de aceleración tecnológica y digitalización sin

precedentes. Este fenómeno ha dado lugar a la generación de volúmenes de

información difícilmente manejables por los sistemas tradicionales, de ahí que el

paradigma del big data haya irrumpido con fuerza, más como una necesidad que

como una alternativa. Como cabe esperar, empresas de todos los sectores están

inmersas de lleno en esta vorágine de digitalización, cambios, evolución y, en

definitiva, proceso de profunda transformación.

A lo largo del presente se introduce el paradigma del big data, definiéndolo,

identificando los problemas que trata de resolver, enfatizando los retos a los que se

enfrenta, reconociendo las oportunidades que presenta y mencionando algunas de

las tecnologías que están involucradas en él. Tras el planteamiento general, el tema

se centra en el contexto de interés del máster y esta asignatura, identificando

algunos de los retos a los que los sistemas de big data se enfrentan dentro de él.

De forma más concreta, el presente tema busca la consecución de los siguientes

objetivos:

▸ Entender el significado del término big data, así como identificar los problemas,

retos, oportunidades y tecnologías que están incluidas en él.

▸ Identificar las oportunidades que la evolución tecnológica y la explosión de los datos

presentan para la mejora de los entornos empresariales y, más concretamente, en


entornos que hacen uso de sistemas IoT.

Big Data y Analytics 4


Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave

▸ Entender los sistemas big data como pieza fundamental en los procesos de

digitalización.

▸ Identificar y entender los retos que el big data debe afrontar para hacer un uso

eficiente de los entornos IoT.

Big Data y Analytics 5


Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave

1.2. Aproximación a los sistemas big data

Durante los últimos años la tecnología ha evolucionado a un ritmo muy rápido

provocando, entre otros efectos, que los volúmenes de información que manejamos

hayan crecido exponencialmente (Deloitte Insights, IoT applications: From sensing to

doing, 2016). Sirva como ejemplo la estimación recogida en la figura 1, en la que se

estima que el volumen de datos/información generados, copiados y consumidos en

2025 será de 175 zettabytes, aumentando de forma exponencial a los 612 en 2030 y

los 2 142 en 2035.

Además, es importante señalar que la información generada es acumulativa, siendo

mucho menor el porcentaje de información que se elimina que la nueva generada, en

parte gracias al abaratamiento que el almacenamiento de la información ha

experimentado.

Es aquí donde aparece y se instala el big data como paradigma que

trata de resolver los problemas que supone el manejo de estos


volúmenes tan elevados de información.

Los datos por sí mismos y la resolución de los problemas que plantea su manejo dan

lugar a una serie de retos y múltiples oportunidades a los que el big data trata de dar

respuesta. En definitiva, el objetivo último de un sistema big data concreto será hacer

u n uso eficiente y efectivo de los datos, de forma que podamos tomar mejores

decisiones y de ahí que estos jueguen un importante papel en los sistemas de

soporte de decisiones guiados por datos (DSS, data-driven Decision Support

Systems) (Poleto et al., 2015).

Big Data y Analytics 6


Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave

Figura 1. Cantidad real y prevista de datos generados en todo el mundo (en zettabytes). Fuente: Statista

Digital Economy Compass, 2019.

El primer problema al que se enfrentan los sistemas big data se presenta con el uso

de las infraestructuras de datos tradicionales. La solución tradicional a los

problemas de escalado, cuando se requieren más recursos de almacenamiento o

procesamiento, se lleva a cabo mediante el escalado vertical (scale up). Esta

aproximación consiste en aumentar el tamaño del servidor o máquina que nos presta

el servicio.

Sin embargo, a pesar de las ventajas que presenta al trabajar con sistemas en

producción, este crecimiento es limitado, puede ser caro y, además, aumenta el

riesgo de no disponibilidad antes fallos. Tratando de solventar estos problemas, los

sistemas big data suelen hacer uso del escalamiento horizontal (scale out),
fomentando el uso de soluciones en clúster. Esta solución, la cual puede combinarse

con el escalado vertical, presenta múltiples ventajas como su potencial de

crecimiento, el uso de dispositivos más baratos, la alta disponibilidad, el balanceo de

Big Data y Analytics 7


Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave

carga o el mejor comportamiento ante fallos en los nodos. Sin embargo, su

configuración y mantenimiento es más complejo.

Figura 2. Escalamiento vertical vs. escalamiento horizontal: en el primero se aumenta el tamaño del

servidor frente al aumento de los nodos en el segundo.

Por otro lado, el crecimiento de los datos ha sido producido (y fomentado) por la

aparición de múltiples estándares de comunicación, almacenamiento y gestión de

datos e información, así como de infinidad de proveedores de soluciones para la

recogida, manejo y análisis de datos. Aparece entonces el primer reto que afrontan

los sistemas big data: la estandarización (Al-Qaseemi et al., 2016). La gestión de

información proveniente de diferentes fuentes heterogéneas es actualmente tediosa

y costosa: por ejemplo, si se utiliza un sensor de temperatura de un fabricante y un

sistema de iluminación inteligente de otro, la integración de la información de ambos

requerirá trabajar con dos sistemas diferentes para recibir su información y

manejarlos.

De forma más concreta, algunas de las fuentes de datos que nutren a los sistemas

big data pueden ser sensores, wearables, vehículos, maquinaria, cámaras, bases de
datos, fuentes públicas de datos, observaciones, personas, animales, dispositivos

energéticos y un largo etcétera. Es importante resaltar en este punto la importancia

que los sistemas IoT tienen a la hora de nutrir sistemas big data de muy diversa

índole.

Big Data y Analytics 8


Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave

Esta heterogeneidad no solo viene dada por el tipo de persona, dispositivo o software

que nos esté proporcionando la información, sino en qué forma se facilite esta. Así,

podemos clasificar los conjuntos de datos por la estructura en la que estos se

encuentran o son proporcionados. En este punto, podemos identificar tres tipos de

datos (Holden, 2020):

▸ Datos estructurados: los datos estructurados son aquellos que se adhieren a un

modelo de datos predefinido y, por lo tanto, son fáciles de analizar. Los datos
estructurados se ajustan a un formato tabular con relación entre las diferentes filas y
columnas. Los ejemplos más comunes de datos estructurados son archivos de
Excel o las bases de datos relacionales SQL.

▸ Datos no estructurados: los datos no estructurados son información que no está

organizada de una manera predefinida o que no sigue un modelo para tal fin. La
información no estructurada suele contener texto, pero también puede contener

datos como fechas, números y hechos. Los ejemplos comunes de datos no


estructurados incluyen archivos de audio, vídeo o en gran parte las bases de
datos NoSQL (not only SQL). La capacidad de almacenar y procesar datos no
estructurados ha crecido enormemente en los últimos años gracias a las nuevas
tecnologías y herramientas que permiten manejar este tipo de datos (por ejemplo,
MongoDB para almacenar documentos). La capacidad de analizar datos no

estructurados es especialmente relevante en el contexto de big data, ya que una


gran parte de los datos en las organizaciones no están estructurados (imágenes,
vídeos o documentos). La capacidad de extraer valor de los datos no estructurados
es uno de los principales impulsores del rápido crecimiento de big data.

Big Data y Analytics 9


Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave

▸ Datos semiestructurados: los datos semiestructurados son una forma de datos

estructurados que no se ajusta a la estructura formal de los modelos de datos


asociados con bases de datos relacionales u otras formas de tablas de datos, pero

que contienen etiquetas u otros marcadores para separar elementos semánticos y


hacer cumplir las jerarquías de registros y campos (estructura autodescriptiva).
Algunos ejemplos de datos semiestructurados incluyen los formatos CSV, JSON y
XML . Este tipo de datos son más fáciles de analizar que los datos no estructurados,
existiendo muchas soluciones y herramientas con la capacidad de leer y procesar

CSV, JSON o XML.

• Nota: Un CSV, a pesar de representar una tabla, de por sí no es capaz de

representar datos jerárquicos o relacionales, al menos no gracias a su formato. Se


han de emplear varios archivos CSV y claves externas en varios archivos para

representar estas relaciones. De ahí que se consideren semiestructurados.

▸ Metainformación: aunque no se considere como una estructura de datos como tal,

la metainformación es uno de los elementos más importantes para el análisis de


datos. Podemos considerar que los metadatos son datos sobre datos,

proporcionando información adicional sobre un conjunto específico de datos. En un


conjunto de fotografías, por ejemplo, los metadatos podrían describir cuándo y dónde
se tomaron las fotografías. De este modo, los metadatos proporcionan campos para
fechas y ubicaciones que, por sí mismos, pueden considerarse datos estructurados.

Big Data y Analytics 10


Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave

Además de todo lo anterior, el big data no solo está relacionado con la cantidad de

datos, su formato o su heterogeneidad. Los sistemas big data van más allá y se

caracterizan de forma más completa por los retos que tratan de resolver, los cuales

se conocen como las «V» del big data. Esta aproximación comenzó con tres «V»,

siguió con cinco y pueden encontrarse referencias en las que se identifican hasta

diecisiete (Arockia Panimalar, A. et al., 2017). En este texto presentamos la

versión de las siete «V» del big data, tal y como muestra la figura 3 y se describe a

continuación:

Figura 3. Las 7 «V» del Big Data. Fuente: Elaboración propia.

▸ Volumen: es el más obvio y se refiere a la gran cantidad de datos que han de

Big Data y Analytics 11


Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave

manejar los sistemas big data.

▸ Velocidad: se refiere a la capacidad de recopilar, procesar y acceder a los datos en

el menor tiempo posible. Por ejemplo, los sistemas de monitorización en tiempo real
son críticos en este sentido.

▸ Variedad: este reto está relacionado con la heterogeneidad de fuentes y formatos.

Los sistemas big data deben resolver este reto de forma transparente y eficiente. Un
ejemplo podría ser un sistema de monitorización de cultivos en el que dispongamos
de información sobre los tratamientos aplicados desde una base de datos,

información de sensores ambientales en formato semiestructurado e información no


estructurada como podría ser la toma de imágenes de dicho cultivo.

▸ Veracidad: la veracidad está relacionada con la fiabilidad y precisión de los datos

recogidos. Disponer de fuentes fiables (como podrían considerarse las fuentes


oficiales de datos) y que faciliten información precisa permitirá a nuestro sistema
alejarse de las imprecisiones que generan los datos de mala calidad.

▸ Variabilidad: la variabilidad (no debe confundirse con la variedad) se refiere al

carácter cambiante de los datos, centrándose, principalmente, en entender el

significado de los datos. Sirva como ejemplo el vino que se elabora en una bodega:
un vino elaborado con la misma proporción de cada tipo de uva año tras año
manteniendo las condiciones ambientales de la bodega y, sin embargo, presentar
variabilidad entre añadas al tener diferentes matices en el sabor entre ellas.

▸ Visualización: la visualización se ha convertido en uno de los aspectos clave de los

sistemas big data actuales. El uso de infografías, gráficas, dashboards u otros


recursos para mostrar la información extraída de datos complejos ha demostrado ser

mucho más efectiva que la transmisión de los datos en crudo.

▸ Valor: el objetivo último de todo sistema big data es proporcionar valor añadido tras

el análisis de los datos. No solamente debemos disponer de cantidades ingentes de


información, sino que debemos ser capaces de procesarla, organizarla y analizarla

Big Data y Analytics 12


Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave

para su comprensión sea fácil y mejore el proceso de toma de decisiones.

Un análisis preciso y rápido de los datos requiere de técnicas complejas de

Inteligencia artificial (Artificial Intelligence) y, dentro de esta, de Aprendizaje

automático (Machine Learning). La integración de este tipo de técnicas permite

acelerar el proceso de análisis y, sobre todo, la posibilidad de trabajar con grandes

volúmenes de datos que no podrían ser manejados con los sistemas tradicionales.

L a s redes neuronales para el reconocimiento de imágenes, los sistemas de

recomendación de productos a los clientes o la aplicación de técnicas de clustering

para clasificar al público objetivo en una campaña de marketing son algunos de los

múltiples ejemplos que pueden encontrarse de su aplicación.

A tenor de lo expuesto anteriormente, puede concluirse que los ámbitos en los que

puede aplicarse el big data son innumerables, algunos de los cuales son los

siguientes:

▸ Retail: el auge del e-commerce ha hecho que las empresas de retail tengan en el

big data a su gran aliado. Gracias a los recursos que ofrece, son capaces de
desarrollar estrategias centradas en el usuario (customer centric), optimizar los

precios y optimizar la producción.

▸ Logística y transporte: la logística y el transporte conforman uno de los primeros

ámbitos que se beneficiaron de los sistemas big data. Así, la trazabilidad de flotas, la
optimización de rutas, la predicción de demanda para la gestión de almacenes o la

monitorización del estado de los vehículos en tiempo real son algunos de los

Big Data y Analytics 13


Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave

problemas que se han visto más beneficiados.

▸ Banca: a pesar de ser uno de los sectores más tradicionales y reticentes a los

cambios (debido, como cabe esperar, a las grandes medidas de seguridad), la banca

también ha sucumbido a la implantación y utilización de sistemas big data. Por


ejemplo, la aparición de las Fintech basa gran parte de su valor añadido en la
resolución de problemas de nicho mediante la aplicación de big data. Por otra parte,
los propios bancos son capaces de mejorar sus previsiones de rentabilidad y riesgos
mediante un uso intensivo de datos y algoritmos.

▸ Marketing: la revolución digital y, sobre todo, la aparición de las redes sociales y los

motores de búsqueda en Internet han cambiado el mundo del marketing de tal forma
que no puede entenderse sin que sea asociado al big data. La gran cantidad de
información que generamos facilita que recibamos un marketing más personalizado

que, como cabe esperar, intenta maximizar el número de conversiones.

▸ Salud: al igual que los ejemplos anteriores, los sistemas sanitarios se han visto

beneficiados por el paradigma del big data. Además de por la mejora que pueda
haber en los sistemas de detección de enfermedades, gracias al uso de una

cantidad mayor de datos y las mejoras computacionales y algorítmicas, la


digitalización del sistema sanitario y su gestión como un sistema big data permite
que nuestro expediente médico esté disponible en cualquier consulta o que podamos

Big Data y Analytics 14


Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave

disfrutar de la comodidad que ofrece la receta electrónica.

▸ Educación: la educación no permanece impasible a la revolución de los datos (y

sirva como ejemplo de digitalización y gestión bajo premisas big data la propia
UNIR). Gracias a los sistemas big data, se ha conseguido mejorar los servicios a los
estudiantes, facilitar el trabajo remoto, así como permitir una mejor categorización de
los estudiantes o adaptación de los planes de estudio.

▸ Gobierno electrónico: la implantación de los sistemas de gobierno electrónico ( e-

government) ha requerido solucionar muchos de los retos que proponen los sistemas
big data. Por ejemplo, el desarrollo de un registro electrónico de documentos
requiere la aplicación de medidas de seguridad y almacenamiento y gestión de datos
que los sistemas big data facilitan.

▸ Seguros: el sector de las aseguradoras también ha dado un giro relativamente

importante gracias al big data. Parece obvio que gracias a la posibilidad de gestionar
más cantidad de información el cálculo de riesgos resultará más preciso y, además,

muchas aseguradoras están incluyendo información de sus clientes a través de


dispositivos inteligentes, como pueden ser los smartwatches, para recoger datos que
les permitan identificar sus hábitos y ser aún más precisos.

▸ Agricultura y ganadería: la agricultura y la ganadería están experimentando un

gran cambio gracias al IoT. La monitorización de cultivos en tiempo real o la

Big Data y Analytics 15


Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave

utilización de sensores que recogen datos sobre el estado de salud del ganado han
permitido que se haga un uso más eficiente de los recursos, que se pueda
reaccionar de forma rápida ante situaciones de riesgo o que se puedan analizar
datos históricos que nos permitan predecir la producción y la demanda.

▸ Industria 4.0: la combinación del big data con el IoT juega un rol fundamental en

algunos las áreas más relevantes de la industria 4.0 como, por ejemplo, en
fabricación inteligente, en la que los datos de los sensores de la maquinaria de
producción se analizan para predecir cuándo se necesitarán operaciones de

mantenimiento y reparación. Mediante su aplicación, los fabricantes mejoran la


eficiencia de la producción, analizan datos en tiempo real, optimizan el
mantenimiento predictivo y automatizan la gestión de la producción (Bordeleau et al.,
2018).

De la breve descripción de algunos de los ámbitos que se benefician del big data,

pueden identificarse, entre muchas otras, las siguientes oportunidades:

▸ Mejora en la monitorización de procesos.

▸ Optimización de campañas de marketing.

▸ Mejora de las ventas.

▸ Mejora de la satisfacción y la experiencia del cliente.

▸ Mejora de la gestión logística y de almacén.

Big Data y Analytics 16


Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave

▸ Identificación de productos, tendencias y ventajas competitivas.

▸ Ahorro de costes.

▸ Mejora del proceso de toma de decisiones (más rápida y con más criterios).

▸ Aumento de la capacidad de pronosticar la demanda con mayor precisión.

▸ Resolución de problemas de redes de distribución más complejos.

▸ Mejora de la eficiencia de la planificación.

▸ Mejora de la planificación de los recursos humanos.

▸ Colaboración en la cadena de suministro.

▸ Monitorización de vehículos y maquinaria.

Llegados a este punto es fácil intuir que muchos de los ámbitos de actuación y de las

oportunidades descritas anteriormente requieren de la información que tanto

dispositivos conectados como sensores proveen. La siguiente sección se centra en

este aspecto, destacando los retos más importantes de los sistemas big data en

escenarios IoT.

Puedes acceder al vídeo El ciclo de vida de los datos para profundizar en este tema.

Big Data y Analytics 17


Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave

Accede al vídeo:

https://unir.cloud.panopto.eu/Panopto/Pages/Embed.aspx?id=4bcfe28a-5cb5-
42a9-b860-adb000639486

Big Data y Analytics 18


Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave

1.3. Oportunidades y retos de los sistemas big data


en escenarios IoT

Tal y como se ha avanzado en la sección anterior, los sistemas IoT pueden

entenderse como una de las fuentes de información más importantes que

alimentan los sistemas big data. Sin embargo, es importante destacar que IoT y

big data son paradigmas diferentes pero complementarios. De igual modo, hemos

visto que los casos de uso del IoT abarcan una amplia gama de usos y sectores,

desde la agricultura hasta los dispositivos inteligentes y la maquinaria. Los sensores

se utilizan para la gestión de activos, el seguimiento de flotas, la supervisión remota

de la salud, etc.

Las herramientas creadas para gestionar los sistemas big data y realizar el pertinente

análisis de datos son claves para controlar la afluencia de datos procedentes de los

dispositivos IoT. Los desarrolladores centrados en el IoT están creando

arquitecturas, plataformas, sistemas y aplicaciones que las empresas y

organizaciones pueden utilizar para gestionar sus dispositivos IoT y los datos

generados.

Enfatizando en que ambos sistemas son diferentes, pero

complementarios, debemos entender que, aunque ambos se refieren a

la recopilación de grandes conjuntos de datos, el IoT trata de realizar

de forma simultánea el análisis de estos, de forma que pueda

apoyarse la toma de decisiones en tiempo real.

Un ejemplo práctico sería el de los vehículos autónomos, los cuales no pueden dejar

para otro momento la toma de decisiones en función de los datos recopilados por los

sensores. No obstante, este no es el único propósito pues, como es lógico, la

información recopilada por los dispositivos IoT puede ser analizada a posteriori.

Big Data y Analytics 19


Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave

Gran parte de los sistemas IoT están integrados en entornos de computación en la

nube o cloud computing. Gracias a este paradigma de computación somos

capaces de recopilar información concreta para convertirla en ubicua y accesible de

forma remota. Sin embargo, para dotar de agilidad a esta toma de decisiones,

muchos dispositivos IoT trabajan en entornos de computación en el borde o edge

computing. En este caso, los dispositivos, o su entorno más cercano, disponen de

capacidad de procesamiento que será clave para tomar determinadas decisiones en

las que la latencia es clave como, por ejemplo, el lanzamiento de una alerta de

seguridad en una línea de producción industrial ante el reconocimiento de una

situación de riesgo medida a partir de sensores y cámaras termográficas.

Más allá del análisis de información en tiempo real o de datos históricos, los

sistemas big data se apoyan en la información proporcionada por los sistemas

IoT para el desarrollo de modelos de análisis preventivo, predictivo y

correctivo. Desde un punto de vista industrial, las empresas dispondrán de

información de rendimiento de sus activos, así como de las alertas de servicio que se
hayan podido generar. Dicha información facilita una gestión proactiva de estos

activos, mejorando su disponibilidad, rendimiento, tiempo de vida y eficiencia

mediante, por ejemplo, el almacenamiento correcto de stock de piezas de

mantenimiento, la programación de revisiones en tiempo y forma, así como la

monitorización de elementos críticos en tiempo real.

La generación de datos por parte de sistemas IoT no es algo novedoso. Sin

embargo, hasta la irrupción de los sistemas big data, muchos de estos datos

quedaban almacenados en los propios dispositivos o máquinas, data lakes o silos sin

que se sacase partido de ellos, debido a que no se disponía de herramientas que

permitiesen su análisis. Los sistemas big data solucionan entonces el problema real:

la extracción de valor a partir de datos ya existentes.

Además, los sistemas IoT no buscan la aplicación de big data para solucionar

Big Data y Analytics 20


Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave

solamente problemas aislados, sino que se enfoca en lograr una verdadera

inteligencia empresarial mediante la recopilación, el análisis y el intercambio de

datos en todos los ámbitos empresariales, no solamente en la fabricación

(Bordeleau et al., 2018). De este modo tratan de buscar sistemas de producción más

eficientes, respuestas más apropiadas a las necesidades comerciales de cada

momento o reaccionar a tiempo ante un imprevisto en la cadena de suministro

(Schundelfrei, 2019).

Uno de los principales objetivos es optimizar y automatizar la producción mediante el

apoyo en la sensorización. Es decir, que los sensores integrados en maquinaria,

vehículos, edificios, objetos y personas, los componentes y los trabajos en curso

transmitan datos en tiempo real a los sistemas de información puestos en marcha.

A su vez, los sistemas IoT se beneficiarán de la aplicación de algoritmos de

inteligencia artificial y, más concretamente, aprendizaje automático con el objeto de

analizar y obtener información a partir de los datos recopilados y ajustar los procesos

manual o automáticamente según sea necesario.

Sin que los ejemplos tengan que ser entendidos como una lista cerrada, el big data

da soporte a los entornos IoT en los siguientes casos:

▸ Descubrimiento de variables ocultas. Es bastante habitual que aparezcan

variables ocultas tanto en los procesos de producción como en cualquier otro. La

aplicación de técnicas big data permite identificarlas de modo que se eviten los
cuellos de botella que causan retrasos en la producción.

▸ Mejora del rendimiento en tiempo real. El procesamiento de la información en

tiempo real es clave en multitud de procesos. Con ello se consigue la optimización

Big Data y Analytics 21


Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave

de la cadena de suministro, de la producción, del rendimiento de maquinaria, de los


precios, la predicción de fallos, el desarrollo de productos o el diseño de fábricas

inteligentes, entre muchos otros casos de uso.

▸ Sistemas de autoservicio. La adopción de análisis de autoservicio en ingeniería

puede ayudar a consolidar grandes cantidades de macrodatos de las plantas de


producción. Por ejemplo, Intel tiene equipos en su fábrica inteligente que envían

datos a un sistema de autoservicio que procesa y analiza los datos en tiempo real,
encontrando patrones, detectando fallos y creando visualizaciones para la gerencia
(Sachdev, 2020).

▸ Mantenimiento predictivo. Es un ejemplo de uso de los datos para la toma de

decisiones. La información permite priorizan los cambios y las acciones que se


deben tomar para evitar tiempos de inactividad no programados o el mal
funcionamiento del equipo. El análisis de datos recopilados por dispositivos IoT
entornos industriales es sinónimo de mantenimiento predictivo (Sachdev, 2020).

▸ Automatización de la gestión de la producción. Esto implica reducir la cantidad

de aportaciones y acciones humanas necesarias en la producción. Su aplicación


hace uso del análisis de datos históricos del proceso de producción, combinándolos
con información en tiempo real de ese proceso en particular y automatizando los

cambios físicos en los equipos mediante actuadores y robótica avanzada que están

Big Data y Analytics 22


Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave

conectados al software de control. El software de control toma inferencias hechas a


partir del análisis de big data y envía comandos específicos a estos actuadores y

robots que alterarán físicamente la configuración del equipo y la maquinaria sin


ninguna intervención humana (Sachdev, 2020).

▸ Mejora del proceso logístico. No solo a nivel intraempresarial, sino gracias a la

integración con datos de terceros, como pueden ser repartidores, proveedores, etc.

A lo largo de los siguientes temas profundizaremos en gran parte de los

componentes que forman parte de los sistemas big data, como son la recogida de

datos, las arquitecturas en la nube que facilitan este proceso, las técnicas de

inteligencia artificial que pueden aplicarse, las herramientas de visualización más

extendidas, así como otros aspectos relacionados con la inteligencia empresarial o el

marco legal.

En el vídeo Plataforma para el tratamiento de datos IoT en smart territories, se


explica un ejemplo de plataforma.

Big Data y Analytics 23


Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave

Plataforma para el tratamiento de datos IoT en smart territories

Accede al vídeo:
https://unir.cloud.panopto.eu/Panopto/Pages/Embed.aspx?id=415e2acb-16f7-

40cc-9c4a-ada400ccbf06

Big Data y Analytics 24


Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
Ideas clave

1.4. Referencias bibliográficas

Al-Qaseemi, S. A., Almulhim, H. A., Almulhim, M. F. y Chaudhry, S. R. (2016). IoT

architecture challenges and issues: Lack of standardization. 2016 Future

Technologies Conference (FTC), 731-738.

Arockia Panimalar, S., Varnekha Shree, S. y Veneshia Kathrine, A. (2017). The 17

V’s of big data. International Research Journal of Engineering and Technology, 4 (9),

329-333.

Bordeleau, F.-E., Mosconi, E. y Santa-Eulalia, L. A. (2018). Business Intelligence in

Industry 4.0: State of the art and research opportunities. Proceedings of the 51st

Hawaii International Conference on System Sciences.

Holden, P. (2020). Defining Structured, Semi-Structured, and Unstructured Data.


https://www.convergeone.com/blog/defining-unstructured-data

IoT applications: From sensing to doing (2016). Deloitte Insights.


https://www2.deloitte.com/us/en/insights/focus/tech-trends/2016/internet-of-things-iot-

applications-sensing-to-doing.html

Poleto, T., de Carvalho, V. D. H. y Costa, A. P. C. S. (2015). The roles of big data in

the decision-support process: An empirical investigation. International conference on

decision support system technology, 10-21.

Sachdev, M. (2020). The Role of Big Data Analytics in Industry 4.0.


https://blog.rgbsi.com/big-data-analytics-in-industry-4.0

Schundelfrei, M. (2019). Big Data Challenges of Industry 4.0. Datanami.

https://www.datanami.com/2019/04/25/big-data-challenges-of-industry-4-0/

Big Data y Analytics 25


Tema 1. Ideas clave
© Universidad Internacional de La Rioja (UNIR)
A fondo

Paisaje de las tecnologías de datos e inteligencia


artificial

Matt Truck. [Página web]. https://mattturck.com/data2020/

Matt Truck presenta en su página web un completo paisaje, actualizado año tras año,

de las tecnologías incluidas en los sistemas big data, así como de las técnicas de

inteligencia artificial más demandadas. Este recurso nos da una idea de la amplitud

de este ecosistema y nos sirve como referencia para la búsqueda y ubicación de

soluciones comerciales (o de uso libre) concretas.

Big Data y Analytics 26


Tema 1. A fondo
© Universidad Internacional de La Rioja (UNIR)
A fondo

Tutorial de big data para principiantes

Edureka! (25 de abril de 2017). Big Data Tutorial For Beginners [Vídeo]. Youtube.
https://www.youtube.com/watch?v=zez2Tv-bcXY

Edureka! presenta en este vídeo una amplia introducción a los sistemas big data,

incluyendo ejemplos muy ilustrativos y una pequeña introducción al ampliamente

extendido framework Hadoop.

Big Data y Analytics 27


Tema 1. A fondo
© Universidad Internacional de La Rioja (UNIR)
A fondo

Internet of Things and Big Data. Better Together

Verma, A. Internet of Things and Big Data. Better Together [Blog post]. Whizlabs.
https://www.whizlabs.com/blog/iot-and-big-data/

Este artículo de Amit Verma da idea de cómo se complementan los sistemas IoT y

los sistemas big data. Debemos ser conscientes que de que ambos se necesitan

mutuamente para extraer el máximo partido a los datos recopilados.

Big Data y Analytics 28


Tema 1. A fondo
© Universidad Internacional de La Rioja (UNIR)
Test

1. El crecimiento del volumen de datos en los próximos años no será relevante, por

lo que los sistemas tradicionales pueden gestionar su recolección, análisis y

procesamiento sin problemas.

A. Verdadero.

B. Falso.

2. ¿Qué sistema de escalamiento será el más apropiado para ampliar la capacidad

de procesamiento y almacenamiento de datos en tu empresa?

A. Escalamiento vertical.

B. Escalamiento horizontal.

C. Una combinación de escalamiento vertical y horizontal.

D. Cualquiera de la anteriores dependiendo del problema concreto y la

disponibilidad de recursos.

3. Los ficheros JSON son un ejemplo de datos:

A. Datos estructurados.

B. Datos no estructurados.

C. Datos semiestructurados.

D. Ninguna de las anteriores.

4. Una hoja de Excel es un ejemplo de:

A. Datos estructurados.

B. Datos no estructurados.

C. Datos semiestructurados.

D. Ninguna de las anteriores.

Big Data y Analytics 29


Tema 1. Test
© Universidad Internacional de La Rioja (UNIR)
Test

5. La recogida de imágenes a través de drones nos facilita:

A. Datos estructurados.

B. Datos no estructurados.

C. Datos semiestructurados.

D. Ninguna de las anteriores.

6. Señala todos los términos que forman parte de las «V» del big data:

A. Velocidad.

B. Variabilidad.

C. Viscosidad.

D. Valor.

7. Las técnicas de inteligencia artificial son un elemento clave a la hora de realizar

análisis complejos en sistemas big data:

A. Verdadero.

B. Falso.

8. El sector de las aseguradoras se beneficia de la aplicación de big data gracias a:

A. La capacidad para analizar datos de más clientes.

B. Conocer mejor a los clientes gracias a la mejor gestión de sus perfiles.

C. La integración de nuevas tecnologías como los wearables que le permiten

recoger datos de sus clientes que permiten identificar sus hábitos.

D. Todas las respuestas anteriores son correctas.

Big Data y Analytics 30


Tema 1. Test
© Universidad Internacional de La Rioja (UNIR)
Test

9. ¿En qué áreas podemos mejorar el rendimiento de nuestros sistemas gracias a la

utilización de datos prevenientes de sistemas IoT?

A. Mantenimiento predictivo.

B. Gestión de la producción.

C. Gestión de almacén.

D. Todas las respuestas son correctas.

10. En muchas ocasiones ya se disponía de datos producidos por maquinaria u

otros dispositivos IoT, pero no eran analizados de forma masiva, ya que estaban

aislados en los propios dispositivos, en las máquinas o en diferentes silos. La

irrupción de big data ha facilitado el análisis de estos datos tanto de forma

independiente como en combinación con otros.

A. Verdadero.

B. Falso.

Big Data y Analytics 31


Tema 1. Test
© Universidad Internacional de La Rioja (UNIR)

También podría gustarte