0% encontró este documento útil (0 votos)
37 vistas6 páginas

Integración de IoT, Cloud y Big Data

Este documento discute la necesidad de integrar Internet de las Cosas (IoT), computación en la nube (cloud computing) y big data para definir un nuevo paradigma llamado CoT. La integración permitirá que IoT genere grandes cantidades de datos que puedan almacenarse y procesarse dinámicamente en la nube. Esto brindará escalabilidad y recursos virtuales ilimitados para soportar las aplicaciones basadas en dispositivos. A su vez, la nube se beneficiará de la capacidad de IoT para extender sus servicios de forma más distribuid

Cargado por

Andres Santmar
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
37 vistas6 páginas

Integración de IoT, Cloud y Big Data

Este documento discute la necesidad de integrar Internet de las Cosas (IoT), computación en la nube (cloud computing) y big data para definir un nuevo paradigma llamado CoT. La integración permitirá que IoT genere grandes cantidades de datos que puedan almacenarse y procesarse dinámicamente en la nube. Esto brindará escalabilidad y recursos virtuales ilimitados para soportar las aplicaciones basadas en dispositivos. A su vez, la nube se beneficiará de la capacidad de IoT para extender sus servicios de forma más distribuid

Cargado por

Andres Santmar
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Identificación de los aspectos a tener en cuenta para la

integración de IoT, Cloud Computing y Big Data


Maria A. Murazzo, Nelson R. Rodriguez, Diego Medel, Gustavo Fernandez
Departamento e Instituto de Informática, Facultad de Ciencias Exactas, Físicas y Naturales – UNSJ
Complejo Islas Malvinas (CUIM), San Juan, Argentina
marite@[Link], nelson@[Link], mdiego88@[Link],
[Link]@[Link]

Resumen Esta problemática plantea la necesidad de la


integración del Big Data, el Iot y el Cloud
El éxito del IoT (Internet of Things) radica en contar
Computing con el fin de definir un nuevo paradigma
con una infraestructura que provea ubicuidad, denominado CoT (Cloud of Things). Esta
fiabilidad, eficiencia, escalabilidad y capacidad de confluencia tecnológica permitirá que el IoT aporte
almacenamiento y cómputo. Con el objetivo de los medios para que el usuario interactúe mediante
lograr esto es que se considera que el cloud puede redes y dispositivos ubicuos. En este nuevo
paradigma, cloud permitirá el acceso a un pool de
ofrecer una infraestructura que permita soportar las
recursos virtualizados capaces de almacenar y
grandes cantidades de datos generados por los procesar bajo demanda la gran cantidad de datos
dispositivos de IoT y la capacidad de cómputo generada por las aplicaciones alojadas en los
necesaria para procesar esos datos de manera dispositivos, esto es el big data.
dinámica y global. De esta manera los usuarios no
deberán preocuparse por la escasez de recursos 2. Conceptos Previos
locales, sino centrarse en aprovechar la Los avances en computación móvil, redes
potencialidades de la aplicación. El presente trabajo inalámbricas, dispositivos móviles y sistemas
tiene por objetivo identificar algunos de los aspectos embebidos han dado lugar al paradigma de IoT el
a tener en cuenta en la integración del IoT, el cloud y cual consiste en una infraestructura de red global y
dinámica de nodos (things) interconectados,
el big data, así como las características de esta
inteligentes y auto configurables. IoT es un
convergencia. habilitador del ecosistema IoE (Internet of
Everything) que permite no solo que las personas se
Keywords: IoT, Cloud Computing, Big Data, interconecten y se comuniquen, sino que ahora
Hadoop. también lo hacen los procesos, los datos y los
objetos, convirtiéndose en sus cuatro pilares. Esta
1. Introducción interrelación permite transformar la información en
acciones que crean nuevas capacidades y
Debido a que la cantidad de dispositivos conectados
experiencias.
a Internet crece exponencialmente, el volumen de
los datos generado por las aplicaciones de usuario en La interacción entre los pilares de IoT establece
esos dispositivos aumenta cada día. En definitiva se tres tipos de conexiones: personas que se comunican
tienen cada vez mas dispositivos conectados a con personas (P2P), máquinas que se comunican con
Internet, tales como computadoras, teléfonos personas (M2P) y máquinas que se comunican con
móviles, sensores, cámaras de vigilancia, GPS, máquinas (M2M). Sin importar cual de estos tipos
consolas de videojuegos; cada uno de ellos corriendo de conexiones se usan, en todos los casos se trata de
aplicaciones tales como redes sociales, una convergencia de múltiples tecnologías para
georeferenciación, sistemas transaccionales, alertas, permitir intercambiar datos entre dispositivo
etc. y cada una de ellas generando datos en una conectado. Todo esto se realiza con base en
amplia gama de formatos (texto, gráficos, imágenes, tecnologías de sensores, RFID (Radio Frequency
videos, sonidos, etc). Identification), NFC (Near Field Communications) y
sistemas de geolocalización, que permitirán que los
El primer inconveniente que se presenta en estos
objetos cotidianos se conecten y se vuelvan
contextos es el almacenamiento local de los datos,
inteligentes, cambiando radicalmente la forma
debido a las restricciones físicas que poseen tales
realizan las tareas cotidianas [1].
escaso almacenamiento, capacidad de procesamiento
y memoria, unido a las restricciones de consumo de Actualmente, el 99% de los objetos que se
energía. encuentran en el mundo físico no están conectados
aún a Internet sin embargo se estima que para el año
2020 habrá 50 millones de objetos inteligentes
conectados a Internet, los cuales proporcionarán cual es una buena posibilidad para construir una
billones de gigabytes de datos que deben ser plataforma para las aplicaciones que necesitan una
almacenados, procesados y presentados en forma gran cantidad de recursos. Esta capacidad del cloud
eficiente y fácilmente interpretables. Se considera se debe principalmente a la habilidad de escalado
que el 90% de los datos existentes se han generado elástico de recursos en función de las necesidades de
en los últimos dos años, esto está dando lugar a la las aplicaciones y el presupuesto del usuario. Esta es
Era del Exa y Zetta Byte [2]. Este aumento en la una tecnología centrada en ofrecer cualquier recurso
cantidad de datos demanda nuevas estrategias que (bases de datos, red, procesador, etc.) y ofrecerlo
permitan su almacenamiento, procesamiento y como un servicio (AaaS, Anything as a Service) bajo
análisis de manera eficiente; esto conlleva un demanda, inclusive el cómputo [8].
cambio de paradigma en las arquitecturas de
cómputo, los algoritmos y los mecanismos de
procesamiento. 3. Características de la Integración
Frente a esta problemática se ha popularizado el IoT promete un mundo donde todo este conectado,
término Big Data [3], el cual se usa para describir para lograr esto es necesario: accesibilidad y
grandes conjuntos de datos, los cuales exhiben las conectividad ubicua, orquestación dinámica de
siguientes propiedades: variedad, volumen, dispositivos, óptima utilización de recursos y
velocidad, variabilidad, valor y complejidad; todas personalización de servicios. Para lograr que estos
ellas denotan a datos multidimensionales. Estas servicios sean prestados de manera eficiente y
propiedades hacen que los sistemas de cómputo efectiva es necesario asegurar altos niveles de
convencionales sean muchas veces inapropiadas disponibilidad y escalabilidad.
para lograr un procesamiento adecuado [4] [5]. Debido a que los dispositivos de IoT están
Es aquí donde la integración de la IoT con Cloud geográficamente distribuidos sobre plataformas
Computing permite que esta gran cantidad de datos heterogéneas y tienen limitadas capacidades de
puedan ser alojados en internet, favoreciendo que procesamiento, energía y almacenamiento, aspectos
recursos, servicios y datos estén disponibles para su tales como performance, seguridad, confiabilidad e
uso y para la prestación de servicios end-to-end para integridad no se pueden asegurar pues no existen
empresas y usuarios que accedan desde cualquier recursos necesarios. Esto lleva a la necesidad de
lugar, proporcionando la infraestructura virtual de integración con el cloud, el cual puede ofrecer sus
integración para dispositivos de almacenamiento, capacidades ilimitadas (esta es una sensación dada
herramientas de análisis, visualización y plataforma. por la virtualización de recursos) de almacenamiento
y poder de cómputo.
En este sentido, Cloud Computing, es un modelo
para permitir el acceso en red omnipresente, Por su parte, cloud se puede beneficiar del IoT al
conveniente y bajo demanda a un conjunto poder extender sus límites con las cosas del mundo
compartido de recursos informáticos configurables real, de forma más dinámica y distribuida, y entregar
tales como, redes, servidores, almacenamiento, un número masivo de servicios en tiempo real. El
aplicaciones y servicios que pueden ser rápidamente cloud actuará como una capa intermedia entre las
aprovisionados y liberados con un mínimo de aplicaciones y los dispositivos, ocultando las
gestión esfuerzo e interacción con el proveedor o funcionalidades y complejidades que poseen.
administrador de servicio [6]. Una infraestructura que integre cloud e IoT
Gracias a estas características una infraestructura permitirá [9]:
cloud permite contar con una cantidad de recursos  Almacenamiento: es posible alojar datos
computacionales virtualmente infinitos, estructurados y no estructurados en
administrados por terceros y accedidos bajo múltiples formatos y con las características
demanda pagando por el uso, de esta manera es del big data.
posible lograr calidad de servicio (QoS) garantizado  Cómputo: uno de los retos en ambientes
por parte del proveedor de la infraestructura cloud. IoT es la escalabilidad y el cloud lo puede
Según [7], cloud es un modelo de prestación de proveer mediante el uso de infraestructura
servicios informáticos cuya principal orientación es de altas prestaciones capaces de realizar
la escalabilidad. Esto es, que desde el punto de vista cómputo intensivo.
de los usuarios, los servicios son elásticos, o sea,  Comunicación: por lo general los
pueden crecer o recuperar su tamaño original de dispositivos de IoT usan una IP para
manera rápida y sencilla. Esta orientación permite identificarse, lo cual no es un esquema
que los usuarios que acceden a los servicios, global. Para solucionar esto cloud usa la
perciban que todo funciona de manera simple y georeferenciación, que permite identificar
rápida, dando como resultado una experiencia más cualquier objeto en cualquier lugar que
gratificante. este.
En función de esto, cloud se ha convertido en un
enorme repositorio de recursos computacionales, lo
 Nuevas habilidades: IoT se caracteriza por imposible el procesamiento con herramientas
la heterogeneidad de dispositivos, convencionales, para extraer información útil que
protocolos y tecnologías, esto genera permita realizar una toma de decisiones adecuada.
problemas de confiabilidad, Esta tarea se hace computacionalmente imposible,
interoperabilidad, escalabilidad, seguridad, por parte de algoritmos de cómputo tradicional. Por
disponibilidad y eficiencia que el cloud ello es que se debe migrando a entornos de cómputo
resuelve, además provee facilidad de intensivo para mejorar los tiempos de respuesta y
acceso, facilidad de uso y costos de aumentar la escalabilidad y la eficiencia. Para lograr
implementación reducidos. esto, es posible realizar una implementación que
Estas características serán capaces de proveer permita distribuir los datos y paralelizar el cómputo
procesamiento en tiempo real y aprovisionamiento [13].
de recursos dinámico para el big data, mediante la Los sistemas distribuidos, tales como cloud,
orquestación y administración de instancias proveen una infraestructura que favorece de manera
virtualizadas de recursos físicos. eficiente y escalable al análisis de grandes
volúmenes de datos, permitiendo procesar gran
cantidad de datos de forma distribuida.
4. Migración del cómputo al cloud Las características que ofrece el cloud permite
Como ya se analizo anteriormente, el principal migrar los algoritmos de cómputo para big data a
problema de IoT es el almacenamiento de los datos modelos basado en MapReduce sobre el cloud. En
generados por los dispositivos, es aquí donde cloud [14] se presenta un modelo para realizar
aparece como la infraestructura adecuada para alojar procedimientos de clasificación supervisada sobre
los datos y brindar la posibilidad de realizar un grandes cantidades de datos en una arquitectura
procesamiento de ellos con el objeto de obtener distribuida basada en MapReduce Hadoop. Para
información que le sirva al usuario para realizar una paralelizar la clasificación se usa ICP (InterIMAGE
toma de decisiones. Este procesamiento de datos Cloud Platform): Data Mining Package, una
requiere de algoritmos de cómputo intensivo que herramienta open source, basada en MapReduce,
permitan realizar una extracción de conocimiento de que implementa los cuatro clasificados de WEKA
manera eficiente y efectiva [10]. (Naïve Bayes Classifier, Decision Trees, Random
Entre los diversos modelos de programación, Forest y Support Vector Machines) como librerías de
MapReduce es el mas adecuado para el desarrollo de java.
algoritmos de cómputo sobre grandes volúmenes de Por otro lado, clustering es otra tarea muy
datos en el cloud debido a la tolerancia a fallos. importante que se realiza sobre grandes conjuntos de
MapReduce [11] es un modelo de programación datos. Con el incremento de los volúmenes de datos
paralela desarrollado y utilizado por Google para la tarea de clusterización se ha vuelto complicada
procesar grandes conjuntos de datos distribuidos a lo debido a que los dataset se han complejizado, los
largo de clusters de servidores, los cuales pueden ser algoritmos consumen mucho tiempo, el hardware
virtuales o físicos. usado para procesamiento se ha vuelto insuficiente,
Unas de las características de cloud es poder etc. Estos aspectos han llevado a proponer métodos
definir cluster virtuales, esto permite ejecutar para que se ejecuten los algoritmos de clustering en
aplicaciones MapReduce sobre el cloud (en realidad ambientes distribuidos(cloud). En [15] se propone el
sobre un cluster en el cloud) sin tener que lidiar con diseño de un framework para algoritmos de
la creación y mantenimientos de cluster físicos. clusterización, tal como k-means, en MapReduce.
La principal motivación del modelo de Las pruebas realizadas demuestran que estos
programación MapReduce es la delegación del algoritmos basados en MapReduce poseen un buen
cómputo intensivo en cluster físicos o virtuales comportamiento cuando el dataset es grande.
(Cluster as a Service) que, mediante un sistema de Otra herramienta muy usada cuando se trabaja
archivos distribuido, reparte la carga de trabajo, con grandes volúmenes de datos son las reglas de
optimizando tiempo y recursos. Asi mismo, facilita asociación, las cuales permiten encontrar relaciones
un patrón de desarrollo paralelo para simplificar la entre los datos. En esta categoría se encuentra el
implementación de algoritmos de cómputo intensivo Algoritmo Apriori, el cual ejecutarlo de manera
en entornos distribuidos. Este modelo puede dividir secuencial sobre dataset muy grandes es prohibitivo.
un espacio grande de problema en espacios En [16] se presenta una implementación del
pequeños y paralelizar la ejecución de tareas más Algoritmo Apriori en MapReduce, cuyo objetivo es
pequeñas en estos sub espacios [12]. bajar los tiempos de ejecución y los recursos
computaciones necesarios para el cómputo en
ambientes de big data. Los resultados que se
4.1. Cómputo del Big Data en el cloud obtuvieron con la ejecución de la implementación
Como se ha discutido, la cantidad de datos generado del algoritmo en forma paralela, fueron
por las aplicaciones de IoT seguirá creciendo y con
ello la diversidad y la complejidad. Esto hace
satisfactorias, sobre todo cuando el dataset era Para lograr acceder a implementar y operar
grande. Hadoop as a Service, Google posee la herramienta
Otra opción a la migración de algoritmos de Cloud Dataproc que es un administrados
cómputo intensivo al cloud es la que se presenta en desatendido para Hadoop que permite crear,
[17] donde se describe la implementación de un administrar y usar clusters, además de usar
entorno completo de forma distribuida, tal es el caso herramientas de cómputo, consulta y machine
de DistributedWekaSpark, que extiende las learning.
funcionalidades de Weka combinándolo con Spark Una de las formas de administrar el cluster es
de Hadoop, permitiendo a los usuarios fidelizados de mediante Google Cloud SDK que provee un
Weka usar la misma interface para trabajar en forma conjunto de herramientas entre las cuales se
local o distribuida. encuentra la linea de comando gcloud. El proceso de
instalación es simple, desde Ubuntu se debe escribir:
$ export CLOUD_SDK_REPO="cloud-sdk-$
4.2. Herramienta para el cómputo del Big (lsb_release -c -s)"
Data en el cloud $ echo "deb
[Link]
Como ya se analizó, una de las potencialidades del $CLOUD_SDK_REPO main" | sudo tee
cloud es definir cluster virtuales con el objeto de /etc/apt/[Link].d/google-cloud-
[Link]
migrar aplicaciones de cómputo intensivo. Para $ curl
implementar esta solución una herramienta que [Link]
puede ser usada en Hadoop. c/[Link] | sudo apt-key add -
$ sudo apt-get update && sudo apt-get
Hadoop [18] es una implementación open source install google-cloud-sdk
de MapReduce escrito en Java y propuesto por la $ gcloud init
Apache Foundation, que maneja la distribución de
datos en un conjunto de nodos de cómputo y usa Una ves iniciado gcloud, se puede interactuar
mecanismos eficientes para su análisis. Hadoop con el cluster Hadoop por linea de comando. Por
posee una arquitectura Master-Slave, usando para ejemplo para crear el cluster se debe escribir:
gcloud dataproc clusters create
almacenar los datos distribuidos Hadoop Distributed <cluster-name>.
File System (HDFS), creado a partir del Google File
System (GFS). Usando Cloud Dataproc se accede a Google
Compute Engine (permite configurar maquinas
En la actualidad, Hadoop es un ecosistema de
virtuales para cómputo intensivo mediante instancias
tecnologías que permite contar con herramientas que
de recursos físicos), Google Cloud Storage (sistema
implementan todos los algoritmos necesarios para
de almacenamiento de objetos) y Google Cloud
realizar un eficiente cómputo del big data. Entre
Virtual Network (interconexión de recursos mediante
ellas se pueden destacar Hive (un sistema de Data
Virtual Private Cloud).
Warehouse), Hbase (base de datos No SQL),
Mahout (machine learning mediante tres algoritmos
recomendación, clustering y clasificación), Pig (data 5. Caso Practico
analytic), entre otros. IoT tiene muchas áreas potenciales de aplicación,
Con el objetivo de usar al cloud como tales como industria, educación, agricultura,
infraestructura de cómputo y almacenamiento, se biología, agricultura, medicina, etc. Estas áreas
puede configurar un cluster Hadoop en el cloud de requieren aplicaciones de monitoreo, seguimiento y
Google, denominada Google Cloud Platform [19]. control de aspectos de la vida cotidiana. De todas las
En la figura 1 se pueden ver los componentes de la aplicaciones posibles una de las mas usadas en la
arquitectura de Google Cloud Platform. actualidad son las aplicaciones móviles. Este tipo de
aplicaciones, generan una plataforma para desplegar
contenidos rápidamente y con bajo costo. Sin
embargo hay que considerar que las exigencias y
requerimientos de los usuarios tanto a nivel
profesional como social han cambiado y se han
ampliado.
Las principales características que necesitan de
los servicios móviles actualmente son tres:
ubicuidad, disponibilidad y seguridad. Además hay
que considerar que las necesidades de los usuarios
cambian al ritmo de la tecnología por lo que ahora
se esta exigiendo de las aplicaciones localización,
Figura 1: Componentes de la arquitectura de Google Cloud
inmediatez y personalización. Todas estas
Platform características solo se pueden lograr usando una
infraestructura cloud, es por ello que este tipo de
aplicaciones se denominan Mobile Cloud
Computing [20], ejemplo de este tipo de
aplicaciones es BYOD (Bring your own device), que
ofrece a los usuarios un alto grado de flexibilidad en
sus tareas.
En este trabajo se presenta una aplicación
colaborativa que a través del uso de dispositivos
móviles, cuyo objetivo es permitir informar al
usuario de eventos sucedidos en la vía publica que
pueden llegar a entorpecer la circulación de los
habitantes del lugar.
Para lograr esto, la aplicación muestra el mapa
del sito y permite que ante un evento el usuario
pueda marcarlo en el mapa agregando comentarios y
Figura 2: Interacción de componentes
fotos. De esta forma los demás usuarios que cuenten
con esta aplicación cargada, recibirán una alerta
cuando se aproximen al lugar del evento. En la figura 3 se puede ver la pantalla de la
aplicación donde se a marcado un evento, al pulsar
Este sistema de alerta se logra de la siguiente
sobre un marcador concreto, la aplicación ofrecerá al
manera:
usuario el suceso ocurrido y compartida por los
1. Cada vez que un usuario informa de un evento demás usuarios que estén utilizando la aplicación.
el dispositivo se conecta con el cloud de Google
donde se almacena la latitud y la longitud del
evento, así como la demás información enviada
por el usuario.
2. Los eventos pueden ser informados por mas de
un usuario, por lo que cada uno de ellos tendrá
un conteo de usuarios que lo han informado, esto
permite dar grados de credibilidad a la
información.
3. En el cloud además de guardar los datos se
realizará un procesamiento de ellos con el objeto
de clusterizarlos a fin de agruparlos por
proximidad, esto permite que cada usuario reciba
alerta de eventos en un radio definido en función
de lo geolocalización.
El frontend de la aplicación se construyó con
Android Studio y permite la manipulación de las
Figura 3: Aplicación mostrando un evento marcado
APIś de Google Map.
Como base de datos para resguardar la
información del usuario, información compartida y Esta aplicación pretende mejorar la experiencia
además servicios que utilizará, se usó Google Cloud de los usuarios ofreciéndole la posibilidad de
Plataform que integra todos los servicios de cloud enterarse de problemas sucedidos en la vía publica
necesarios para construir el backend de la antes de encontrarse con ellos, de esta manera podrá
aplicación. elegir caminos alternativos, sin el inconveniente de
perdida de tiempo en su transporte
El framework y cliente Mobile Backend Starter
de Google permite desplegar la infraestructura
necesaria para usar desde la aplicación todas las 6. Conclusiones
ventajas de Google App Engine (GAE) y sus Los ambientes de cómputo distribuido permiten
servidores. hacer una distribución de los datos y una
En Google Cloud Plataform se a configurado un paralelización del cómputo, lo cual es muy
cluster Hadoop con Mahout con el objeto de realizar importante cuando se trabaja con grandes volúmenes
el cómputo en base a los algoritmos de machine de datos. Ademas, este es un aspecto critico sobre
learning que permita implementar la clusterización todo cuando las plataformas computacionales no
de los datos para dar las alertas. En la Figura 2, se proveen el hardware suficiente para realizar las
pueden ver las interacciones necesarias para la tareas en tiempo y forma, como es el caso de los
implementación. dispositivos de IoT.
El cloud computing es un paradigma que ha
cambiado la ubicación de las infraestructuras
informáticas hacia Internet. Con ello se consigue que [11] Malik, Sangwan. Mapreduce Algorithms
los usuarios no tengan que gestionar ni sus propios Optimizes the Potential of Big Data. International
servidores ni tampoco su software, ahorrando de este Journal of Computer Science and Mobile
modo energía, espacio físico y personal técnico. Computing, Vol.4 Issue.6, June – 2015.
Además, los sistemas cloud ofrecen un gran [12] Carrera, Geyer. Modeling the Performance of
rendimiento en términos de escalabilidad, MapReduce Applications for the Cloud. Latin
mantenibilidad y procesamiento masivo de datos en American Journal of Computing Faculty of Systems
entornos dinámicos y de necesidades cambiantes. Engineering National Polytechnic School Quito-
En función de esto y de todo lo analizado, no Ecuador, 2(2). 2015.
cabe dudas que la integración del Iot y el cloud con [13] Ambulkar, Borkar. Data mining in cloud
el objeto de realizar un adecuado almacenamiento y computing. In MPGI National Multi Conference (pp.
procesamiento de los datos, es una opción rentable, 7-8). 2012.
no solo desde el punto de vista económico sino
[14] Ayma, Ferreira, Happ, Oliveira, Feitosa, Costa,
también en lo que respecta a desempeño,
Gamba. Classification Algorithms for Big Data
escalabilidad, disponibilidad y calidad de los
Analysis, a Map Reduce Approach. The International
servicios ofrecidos.
Archives of Photogrammetry, Remote Sensing and
Spatial Information Sciences, 40(3), 17. 2015
7. Bibliografía [15] Jin, Kou, Liu, Guo. A common framework of
[1] Lee, I., & Lee, K. “The Internet of Things (IoT): partition-based clustering for large scale dataset
Applications, investments, and challenges for using sampling and its MapReduce implementation.
enterprises”. Business Horizons, 58(4), 431-440. Tehnički vjesnik, 23(1), 25-33. 2015.
2015. [16] Dasgupta. Study of various parallel
[2] Acín, Bird, Boccali, Cancio, Collier, Corney, implementations of association rule mining
Fuhrmann, Architectures and methodologies for algorithm. American Journal Of Advanced
future deployment of multi-site Zettabyte-Exascale Computing, 2(1). 2015
data handling platforms. In Journal of Physics: [17] Koliopoulos, Yiapanis, Tekiner, Nenadic,
Conference Series (Vol. 664, No. 4, p. 042009). IOP Keane. A Parallel Distributed Weka Framework for
Publishing. 2015. Big Data Mining using Spark. In Big Data (BigData
[3] Nyikes, Rajnai, Z. Big data, as part of the Congress), 2015 IEEE International Congress on
critical infrastructure. In Intelligent Systems and (pp. 9-16). IEEE. 2015.
Informatics (SISY), 2015 IEEE 13th International
[18] Hadoop. Welcome to Apache Hadoop.
Symposium on (pp. 217-222). IEEE. 2015.
[Link]
[4] Katal, A., Wazid, M., & Goudar, R. H. (2013,
August). Big data: issues, challenges, tools and [19] Google. Google Cloud Platform.
good practices. In Contemporary Computing (IC3), [Link]
2013 Sixth International Conference on (pp. 404- [20] Murazzo, Rodríguez. Mobile cloud computing.
409). IEEE. XII Workshop de Investigadores en Ciencias de la
[5] Chen, Mao, Liu, Y. (2014). Big data: a survey. Computación. 2010
Mobile Networks and Applications, 19(2), 171-209.
[6] Antonopoulos, Gillam. Cloud Computing;
Principles, Systems and Applications. Editorial
Springer Science & Business Media. 2010.
[7] Mell, Grance. The NIST definition of cloud
computing. NIST Special Publication 800 – 145.
2011.
[8] Chee, Franklin. Cloud computing: technologies
and strategies of the ubiquitous data center. CRC
Press. 2010.
[9] Babu, Lakshmi, Rao. A study on cloud based
Internet of Things: CloudIoT. In Communication
Technologies (GCCT), 2015 Global Conference on
(pp. 60-65). IEEE.
[10] Murazzo, Rodriguez, Guevara, Tinetti.
Identificación de Algoritmos de Cómputo Intensivo
para Big Data y su Implementación en Clouds.
XVIII Workshop de Investigadores en Ciencias de la
Computación. 2016.

También podría gustarte