Internet de las cosas y Big Data
Imagine un mundo donde todo lo que utilice podría capturar sus interacciones y
transmitir esa información a servidores en algún lugar de la web. Imagine que
tostadoras, lavadoras y secadoras, automóviles, refrigeradores, teléfonos, relojes
digitales, televisores, licuadoras, cafeteras, consolas de juegos, medidores
inteligentes, etc., registraron su uso, acciones y preferencias y alimentaron esa
información a sus servidores domésticos. Esta no es una idea inverosímil, ya que
ya hay más que unos pocos dispositivos (conjuntos de cajas de cable y satélite,
consolas de juegos) que ya se comportan así. Pero en nuestro futuro no
demasiado distanciado todos nuestros dispositivos accionados seguirán ese
modelo. Internet de las cosas (IoT) trata sobre los objetos físicos que llegan a
Internet por su cuenta. Mediante el uso de tecnologías como RFIDs, redes de
sensores, comunicaciones inalámbricas de corto alcance y objetos físicos de LAN
se convierten en dispositivos inteligentes que realizarían llamadas periódicas a sus
centros de datos, ya sea para informar sobre su estado o transmitir el último lote
de datos capturados localmente. Este modelo cambiará gradualmente la forma en
que vemos e interactuamos con las cosas físicas que nos rodean y ofrecerá
grandes nuevas oportunidades a fabricantes, distribuidores, proveedores de
servicios, minoristas y usuarios por igual.
Por ejemplo, no es difícil imaginar que en el futuro los dispositivos programarán
sus propias llamadas de servicio, adelantarán medidas en tiempo real para
corregir un problema o retransmitirán las entradas y los datos de uso de los
usuarios. Igualmente, la industria de seguros para accidentes de propiedad podría
utilizar la información recopilada por el IoT de un automóvil de una persona para
evaluar y poner en precio con mayor precisión una póliza en particular y evitar
reclamaciones fraudulentas examinando los datos proporcionados por los hábitos
de conducción de los titulares de pólizas (El seguro progresivo ha introducido un
dispositivo Snapshot que se conecta al puerto de diagnóstico de un automóvil y
realiza un seguimiento de la conducción de una persona). Utilizando la información
obtenida de los datos de Internet de las cosas, el diseño del producto podría
ayudarse examinando los patrones de interacción con el usuario, la logística de
gestión de suministros y distribución podría optimizarse revisando las tasas de
adopción - la rapidez con que un dispositivo va de fabricante a distribuidor,
minorista y finalmente conectarse a un servidor doméstico desde el domicilio de
los usuarios finales - y la entrega de atención médica podría hacerse más eficiente
y eficaz haciendo que los dispositivos portátiles comunes , como teléfonos
celulares o relojes digitales, herramientas de vigilancia de la salud que podrían
transmitir la información de signos vitales del portador. Bienvenido al mundo del
Internet de las Cosas.
Desafío de datosSe espera que para 2020 alrededor de 50 a 100 mil millones de
cosas estarán conectadas a Internet. Estos objetos inteligentes utilizarán
dispositivos de conectividad comunes para enlazar a Internet e intercambiar
mensajes con matrices de servidores dedicados, lo que podría generar un
asombroso 35 ZB/año de datos. Si se preguntaba, un zettabyte (ZB) de capacidad
de almacenamiento es de 10 a la potencia de 21 bytes. Sólo para obtener una
mejor perspectiva, a partir de 2009 se estimó que toda la red mundial contenía
cerca de 500 exabytes de datos, que es la mitad de un zettabyt. IoT producirá una
gran cantidad de datos. Los datos de IoT no serán en absoluto diferentes de los de
Big Data, que es heterogéneo, diferente, no estructurado y ruidoso. Pero más
notable será la tasa de crecimiento de los datos de IoT. Actualmente, la cantidad
de datos generados por las redes sociales, las transacciones, las entidades
públicas y corporativas se están escalando más rápido de lo que permiten los
recursos informáticos.
Agregue a ese desafío el volumen de datos que se espera que genere IoT y quede
claro que las soluciones tradicionales de almacenamiento y procesamiento de
datos difícilmente podrían aplicarse para ingerir, validar y analizar estos
volúmenes de datos. Los datos de IoT tendrán un carácter granular y tendrán
información sobre ubicaciones, temperaturas, patrones y comportamientos. En el
mundo de la IoT, el desafío será encontrar maneras de analizar y capitalizar esta
información de forma rápida y casi en tiempo real. No debería sorprender que las
organizaciones que son capaces de tomar decisiones empresariales utilizando
estos datos tengan una ventaja estratégica sobre su competencia. Pero como se
mencionó anteriormente para hacerlo requiere una infraestructura informática
robusta y eso no será barato. Los datos de IoT, como el de Big Data, no están
estructurados y aquí se encuentra uno de sus desafíos más importantes.
Para abordar este problema de manera eficaz, es importante que los fabricantes,
distribuidores, proveedores de servicios y minoristas acuerden un formato simple,
genérico y textual para crear y describir datos de IoT, similar al lenguaje de
marcado XML. Esta inversión en estandarización afectará a toda la canalización
de procesamiento de IoT/Big Data (adquisición de datos, extracción y limpieza,
integración y agregación y, finalmente, análisis), ya que algunas herramientas
existentes podrían utilizarse para limpiar y transformar estos datos de forma más
rápida y barata en el formato más adecuado para aplicaciones de análisis.
El desafío tecnológico debido a la tasa de crecimiento exponencial de los datos de
IoT, la necesidad de una infraestructura informática que pueda equilibrar el
rendimiento, la eficiencia energética y el costo se vuelve importante. Para escalar
correctamente los patrones de crecimiento de datos previstos por los
departamentos de TI de IoT deben prepararse para entornos informáticos a
hiperescala con miles de clústeres de equipos que pueden admitir marcos
escalables y predecibles que procesan grandes conjuntos de datos. Este nuevo
entorno informático se logra mejor en la nube, donde el uso compartido de
clústeres caros muy grandes se ha vuelto económico. Otra ventaja de la
computación en la nube es su arquitectura modular, donde el escalado horizontal
se puede lograr rápida y fácilmente. Un desafío central en el procesamiento de
datos de IoT son las limitaciones inherentes a los recursos informáticos
convencionales. En gran parte debido a las restricciones de potencia, las
velocidades de reloj del procesador se han estancado y, en su lugar, los
procesadores se están construyendo con un mayor número de núcleos. Como
resultado, los desarrolladores de aplicaciones ahora deben preocuparse por el
paralelismo dentro de un nodo, así como entre nodos. Dado que esta arquitectura
es muy diferente (más cachés de procesadores compartidos y memoria entre
núcleos), las técnicas para los algoritmos de procesamiento entre nodos no
funcionan para el paralelismo entre nodos. Como tal, los desarrolladores de
aplicaciones deben reevaluar la forma en que diseñan, compilan y procesan
aplicaciones de procesamiento de datos de campo.
Otro desafío tecnológico son los sistemas de E/S tradicionales que durante
décadas fueron diseñados y optimizados para un rendimiento de E/S secuencial
en lugar de acceso aleatorio. Pero con la llegada de las unidades de estado sólido
esta limitación de rendimiento está desapareciendo y las unidades de disco duro
están siendo reemplazadas por la nueva generación de sistemas de E/S que a su
vez requieren que los departamentos de TI reconsideren cómo diseñan e
implementan sistemas de bases de datos para el procesamiento de grandes
conjuntos de datos.
Dado que una infraestructura informática de IoT/Big Data requiere grandes
inversiones, es aún más importante que los departamentos de TI administren
mejor sus operaciones y recursos. Una optimización de aplicaciones impulsada
por el usuario no podrá cumplir los objetivos de rendimiento de los trabajos
intensivos en procesos de forma rentable. Esta arquitectura requiere un enfoque
de optimización holístico. Recuerde que a medida que los trabajos se vuelven más
grandes, los errores del sistema se vuelven más frecuentes.
Desafío de privacidad¿Deberían estar disponibles para el fabricante del aparato
los patrones de uso de un aparato, por ejemplo, cómo y cuándo usa su lavavajillas
o su elección de líquido de lavado? ¿Es legal que una consola de juegos transmita
la información de tu juego favorito al creador de la consola? ¿Y esa información
debe compartirse con el editor del juego? Y si pasó un semáforo en rojo y su
vehículo registró su percance, ¿es ético que su proveedor de seguros use esa
información para ajustar su prima y reevaluar su póliza? ¿Debería la compañía de
seguros pasar esa información a la agencia local de aplicación de la ley?
La privacidad y la seguridad de los datos no son temas nuevos y ciertamente no
son exclusivos de los datos generados por IoT. Lo que es diferente aquí es la
cuestión de la privacidad "contrato" entre la máquina y el ser humano. Hemos
llegado a aceptar que algunos de nuestros dispositivos inteligentes, como
computadoras o teléfonos, capturan nuestras interacciones con ellos, incluso la
propiedad de estos datos es una cuestión de conjeturas, pero nunca hemos tenido
que considerar un aparato o un vehículo con ese tipo de potencial.
Por lo tanto, la pregunta se convierte en quién es el propietario de los datos
generados por IoT y cuál es el uso aceptable o legal de estos datos. Para algunos
tipos de información ya hay legislación para limitar su uso y distribución, como la
información médica o financiera de una persona. Pero no existen recursos legales
para controlar el acceso a los datos generados por IoT. Con el tiempo, la
legislación se pondrá al día con la tecnología, pero por ahora sólo podemos
suponer que la información de IoT no se utilizará en perjuicio de los consumidores.