0% encontró este documento útil (0 votos)

34 vistas8 páginas

Big Data Tech

Cargado por

jagp

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

34 vistas8 páginas

Big Data Tech

Cargado por

jagp

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

Todas las grandes compañías se han apoyado en Big Data para llevar a cabo su

Transformación Digital”

En los últimos años han surgido multitud de nuevas tecnologías dentro del ecosistema Big
Data. El principal objetivo es disponer de herramientas lo bastante potentes para procesar y
almacenar grandes volúmenes de información.

El desarrollo y la evolución de la tecnología es vertiginoso, continuamente están apareciendo

nuevas tecnologías que mejoran a las anteriores y las dejan obsoletas.

A continuación, podemos ver cuáles son las tecnologías Big Data más relevantes hoy en día y
cómo podemos clasificarlas.

Mapa del ecosistema Big Data

Podemos clasificar las diferentes tecnologías del ecosistema Big Data en 7 categorías.

 Ingestion
Tecnologías orientadas a la recolección de los datos desde su origen, por ejemplo en
bases de datos tradicionales, o en flujos continuos a través de la red.
 Almacenamiento
Tecnologías capaces de guardar y gestionar grandes volúmenes de datos, en este grupo
estarían las bases de datos NoSQL.
 Gestión de recursos
Tecnologías diseñadas para planificación y asignación de los recursos del cluster, donde
realizaremos todo el procesamiento.
 Motores de procesamiento
El corazón de la tecnología Big Data, son capaces de realizar el cómputo de manera
distribuida, lo que significa repartir el trabajo entre varios nodos de computación y realizar
operaciones costosas en tiempos pequeños.
 Mensajería
Tecnologías que nos permiten el intercambio de datos entre los diferentes componentes
software de manera eficiente, en esta categoría se ubican todas las colas de mensajes.
 Bibliotecas de consulta
Multitud de bibliotecas orientadas a simplificar el acceso a los datos, generalmente se
basan en los motores de procesamiento para realizar las consultas de manera eficiente.
 Bibliotecas de Machine Learning
Tecnologías que implementan algoritmos para clasificar, predecir o perfilar. Se basan en
los motores de procesamiento paralelo de los que aprovechan su capacidad de realizar
cálculos complejos muy rápido.
Tecnologías Big Data
A continuación, podemos ver una breve descripción de las tecnologías Big Data más
importantes hoy en día.

 Flume
Flume es un servicio distribuido para recolectar de forma eficiente grandes volúmenes de
datos. Sigue una arquitectura flexible y tolerante a fallos basada en agentes. Permite
ingestar datos de multitud de orígenes como HTTP, Syslog, NetCat, Kafka o Avro.
 Sqoop
Sqoop es una herramienta diseñada para transferir de forma eficiente grandes paquetes de
datos entre Hadoop HDFS y bases de datos relacionales como MySQL, Oracle o
PostgreSQL.
 Kafka
Kafka es un sistema de mensajería distribuido de alto rendimiento, está diseñado para
manejar cientos de MB de mensajes por segundo, generados y consumidos por miles de
clientes y ordenados en “topics”. Es escalable gracias a que puede ejecutar a lo largo de un
cluster de nodos.
 RabbitMQ
Es un sistema de colas de mensajes muy extendido, soporta múltiples opciones de
configuración, clustering y alta disponibilidad. Además incluye un sistema de plugins por el
cual se puede extender su funcionalidad. Es posible obtener soporte comercial a través de
Pivotal, la compañía que lo soporta.
 Cassandra
Cassandra es una base de datos NoSQL linealmente escalable. Es distribuida y basada en
un modelo de almacenamiento de clave-valor y orientado a columnas. Es totalmente
descentralizada, siguiendo una arquitectura de anillo sin nodo maestro o punto único de
fallo.
 Hadoop HDFS
Se trata de un sistema distribuido de ficheros diseñado para funcionar sobre hardware
commodity. Está inspirado por un paper de Google y es una de las piezas más importantes
de Hadoop. Ofrece un alto rendimiento y soporta archivos de gran tamaño. Es tolerante a
fallos.
 MongoDB
MongoDB es una base de datos orientada a documento. Define un API propia para hacer
queries y framework para agregaciones complejas. Tiene soporte para replicación,
sharding e indexado. Es la más popular de las bases de datos orientadas a documentos.
 Elastic
Es un servidor de búsqueda de texto completo distribuido. Ofrece un API RESTful para
realizar consultas. Los tiempos de búsqueda son muy buenos, en gran medida gracias al
sistema de índices que tiene.
 Yarn
Yarn es uno de los componentes de Hadoop dedicado a la gestión de recursos. Es el
responsable de manejar los recursos de computación del cluster y planificar el trabajo de
los usuarios y las aplicaciones. También monitoriza el estado de los procesos. Ha sido
diseñado con una arquitectura maestro/esclavo.
 Mesos
Mesos es un sistema distribuido para la gestión de los recursos de un cluster desarrollado
por la Universidad de Berkeley. Ofrece un API única a las aplicaciones para la gestión y
planificación a lo largo del datacenter. Está preparado para soportar hasta 10.000 nodos.
 Hadoop MapReduce
Se trata de la implementación MapReduce Hadoop. Está diseñado para trabajar sobre
HDFS, procesando los datos en paralelo de acuerdo al paradigma Map/Reduce. Está
orientado al procesamiento de trabajos en batch y hace un uso intensivo del disco lo que
penaliza su rendimiento. Fue el primer framework importante de procesamiento distribuido
que surgió.
 Spark
Spark es un framework para procesamiento distribuido posterior a Hadoop, fue diseñado
desde cero pensando en sustituir el componente MapReduce. Soporta un conjunto mayor
de transformaciones que pueden ser ejecutadas en paralelo. Trabaja intensivamente en
memoria lo que lo hace hasta 100 veces más rápido que Hadoop MapReduce. Soporta
procesamiento en streaming.
 Storm
Storm es un motor de procesamiento distribuido orientado a eventos en tiempo real. El
proyecto fue impulsado por Twitter. Su diseño está orientado a procesar de forma muy
rápida los eventos recibidos, llegando a procesar más de 1 millón de registros por segundo
y nodo.
 Flink
Flink es un motor de procesamiento de reciente aparición. Orientado al procesamiento en
streaming y a obtener un alto rendimiento a una baja latencia. Ofrece un API rica de
transformaciones y cabe destacar su sistema de gestión de ventanas de eventos que
permite asegurar la recepción de eventos en el el orden correcto.
 Spark MLlib
Spark MLlib es un framework que incluye algoritmos de machine learning implementados
sobre Spark y aprovechando de esta manera las ventajas del cálculo distribuido y el trabajo
intensivo en memoria que nos ofrece Spark. Incluye algoritmos de clasificación, regresión y
clustering entre otros.
 FlinkML
FlinkML es la biblioteca de algoritmos de machine learning sobre el core de Flink. Es una
biblioteca muy nueva, que de momento incluye muy pocos algoritmos.
 Hive
Hive nació inicialmente como un subproyecto del proyecto Hadoop, nos ofrece un conjunto
de herramientas para leer, escribir y manejar datos sobre Hadoop con una sintaxis similar a
SQL. Incluye un driver JDBC.
 Pig
Pig es un proyecto complementario al proyecto Hadoop. Nos ofrece un lenguaje de
scripting de alto nivel para manejar datos que internamente se transforman en trabajos
map/reduce sobre Hadoop.
 Spark SQL
Spark SQL es el módulo incluido en Spark para trabajar con datos estructurados usando
una sintaxis de estilo SQL, pero aprovechando las ventajas de ejecutar sobre el core de
Spark. También nos ofrece un conector JDBC.
Big Data: ¿En qué consiste? Su importancia, desafíos
y gobernabilidad
Big Data es un término que describe el gran volumen de datos, tanto estructurados como no
estructurados, que inundan los negocios cada día. Pero no es la cantidad de datos lo que es
importante. Lo que importa con el Big Data es lo que las organizaciones hacen con los datos.
Big Data se puede analizar para obtener ideas que conduzcan a mejores decisiones y
movimientos de negocios estratégicos.

Índice de contenidos
 ¿Qué es Big Data?
 ¿Por qué el Big Data es tan importante?
 Desafíos de la calidad de datos en Big Data
 Cómo construir un plan de Data Governance en Big data
 5.Material complementario

1. ¿Qué es Big Data?

Cuando hablamos de Big Data nos referimos a conjuntos de datos o combinaciones de
conjuntos de datos cuyo tamaño (volumen), complejidad (variabilidad) y velocidad de
crecimiento (velocidad) dificultan su captura, gestión, procesamiento o análisis mediante
tecnologías y herramientas convencionales, tales como bases de datosrelacionales y
estadísticas convencionales o paquetes de visualización, dentro del tiempo necesario para que
sean útiles.

Aunque el tamaño utilizado para determinar si un conjunto de datos determinado se considera

Big Data no está firmemente definido y sigue cambiando con el tiempo, la mayoría de los
analistas y profesionales actualmente se refieren a conjuntos de datos que van desde 30-50
Terabytes a varios Petabytes.

La naturaleza compleja del Big Data se debe principalmente a la naturaleza no estructurada de

gran parte de los datos generados por las tecnologías modernas, como los web logs, la
identificación por radiofrecuencia (RFID), los sensores incorporados en dispositivos, la
maquinaria, los vehículos, las búsquedas en Internet, las redes sociales como Facebook,
computadoras portátiles, teléfonos inteligentes y otros teléfonos móviles, dispositivos GPS y
registros de centros de llamadas.

En la mayoría de los casos, con el fin de utilizar eficazmente el Big Data, debe combinarse con
datos estructurados(normalmente de una base de datos relacional) de una aplicación comercial
más convencional, como un ERP (Enterprise Resource Planning) o un CRM (Customer
Relationship Management).

2. ¿Por qué el Big Data es tan importante?

Lo que hace que Big Data sea tan útil para muchas empresas es el hecho de que proporciona
respuestas a muchas preguntas que las empresas ni siquiera sabían que tenían. En otras
palabras, proporciona un punto de referencia. Con una cantidad tan grande de información, los
datos pueden ser moldeados o probados de cualquier manera que la empresa considere
adecuada. Al hacerlo, las organizaciones son capaces de identificar los problemas de una
forma más comprensible.

La recopilación de grandes cantidades de datos y la búsqueda de tendencias dentro de los

datos permiten que las empresas se muevan mucho más rápidamente, sin problemas y de
manera eficiente. También les permite eliminar las áreas problemáticas antes de que los
problemas acaben con sus beneficios o su reputación.

El análisis de Big Data ayuda a las organizaciones a aprovechar sus datos y utilizarlos para
identificar nuevas oportunidades. Eso, a su vez, conduce a movimientos de negocios más
inteligentes, operaciones más eficientes, mayores ganancias y clientes más felices. Las
empresas con más éxito con Big Data consiguen valor de las siguientes formas:
 Reducción de coste. Las grandes tecnologías de datos, como Hadoop y el análisis basado
en la nube, aportan importantes ventajas en términos de costes cuando se trata de
almacenar grandes cantidades de datos, además de identificar maneras más eficientes de
hacer negocios.
 Más rápido, mejor toma de decisiones. Con la velocidad de Hadoop y la analítica en
memoria, combinada con la capacidad de analizar nuevas fuentes de datos, las empresas
pueden analizar la información inmediatamente y tomar decisiones basadas en lo que han
aprendido.
 Nuevos productos y servicios. Con la capacidad de medir las necesidades de los clientes y
la satisfacción a través de análisis viene el poder de dar a los clientes lo que quieren. Con
la analítica de Big Data, más empresas están creando nuevos productos para satisfacer las
necesidades de los clientes.

Por ejemplo:
 Turismo: Mantener felices a los clientes es clave para la industria del turismo, pero la
satisfacción del cliente puede ser difícil de medir, especialmente en el momento oportuno.
Resorts y casinos, por ejemplo, sólo tienen una pequeña oportunidad de dar la vuelta a una
mala experiencia de cliente. El análisis de Big data ofrece a estas empresas la capacidad
de recopilar datos de los clientes, aplicar análisis e identificar inmediatamente posibles
problemas antes de que sea demasiado tarde.
 Cuidado de la salud: El Big Data aparece en grandes cantidades en la industria sanitaria.
Los registros de pacientes, planes de salud, información de seguros y otros tipos de
información pueden ser difíciles de manejar, pero están llenos de información clave una
vez que se aplican las analíticas. Es por eso que la tecnología de análisis de datos es tan
importante para el cuidado de la salud. Al analizar grandes cantidades de información -
tanto estructurada como no estructurada - rápidamente, se pueden proporcionar
diagnósticos u opciones de tratamiento casi de inmediato.
 Administración: La administración se encuentra ante un gran desafío: mantener la calidad y
la productividad con unos presupuestos ajustados. Esto es particularmente problemático
con lo relacionado con la justicia. La tecnología agiliza las operaciones mientras que da a la
administración una visión más holística de la actividad.
 Retail: El servicio al cliente ha evolucionado en los últimos años, ya que los compradores
más inteligentes esperan que los minoristas comprendan exactamente lo que necesitan,
cuando lo necesitan. El Big Data ayuda a los minoristas a satisfacer esas demandas.
Armados con cantidades interminables de datos de programas de fidelización de clientes,
hábitos de compra y otras fuentes, los minoristas no sólo tienen una comprensión profunda
de sus clientes, sino que también pueden predecir tendencias, recomendar nuevos
productos y aumentar la rentabilidad.
 Empresas manufactureras: Estas despliegan sensores en sus productos para recibir datos
de telemetría. A veces esto se utiliza para ofrecer servicios de comunicaciones, seguridad y
navegación. Ésta telemetría también revela patrones de uso, tasas de fracaso y otras
oportunidades de mejora de productos que pueden reducir los costos de desarrollo y
montaje.
 Publicidad: La proliferación de teléfonos inteligentes y otros dispositivos GPS ofrece a los
anunciantes la oportunidad de dirigirse a los consumidores cuando están cerca de una
tienda, una cafetería o un restaurante. Esto abre nuevos ingresos para los proveedores de
servicios y ofrece a muchas empresas la oportunidad de conseguir nuevos prospectos.
 Otros ejemplos del uso efectivo de Big Data existen en las siguientes áreas:
 Uso de registros de logs de TI para mejorar la resolución de problemas de TI, así como
la detección de infracciones de seguridad, velocidad, eficacia y prevención de sucesos
futuros.
 Uso de la voluminosa información histórica de un Call Center de forma rápida, con el fin
de mejorar la interacción con el cliente y aumentar su satisfacción.
 Uso de contenido de medios sociales para mejorar y comprender más rápidamente el
sentimiento del cliente y mejorar los productos, los servicios y la interacción con el
cliente.
 Detección y prevención de fraudes en cualquier industria que procese transacciones
financieras online, tales como compras, actividades bancarias, inversiones, seguros y
atención médica.
 Uso de información de transacciones de mercados financieros para evaluar más
rápidamente el riesgo y tomar medidas correctivas.

3. Desafíos de la calidad de datos en Big Data

Las especiales características del Big Data hacen que su calidad de datos se enfrente a
múltiples desafíos. Se trata de las conocidas como 5 Vs: Volumen, Velocidad, Variedad,
Veracidad y Valor, que definen la problemática del Big Data.

Estas 5 características del big data provocan que las empresas tengan problemas para extraer
datos reales y de alta calidad, de conjuntos de datos tan masivos, cambiantes y complicados.
Hasta la llegada del Big Data, mediante ETL podíamos cargar la información estructurada que
teníamos almacenada en nuestro sistema ERP y CRM, por ejemplo. Pero ahora, podemos
cargar información adicional que ya no se encuentra dentro de los dominios de la empresa:
comentarios o likes en redes sociales, resultados de campañas de marketing, datos
estadísticos de terceros, etc. Todos estos datos nos ofrecen información que nos ayuda a
saber si nuestros productos o servicios están funcionando bien o por el contrario están
teniendo problemas.

Algunos desafíos a los que se enfrenta la calidad de datos de Big Data son:

1. Muchas fuentes y tipos de datos

Con tantas fuentes, tipos de datos y estructuras complejas, la dificultad de integración de datos
aumenta.

Las fuentes de datos de big data son muy amplias:

 Datos de internet y móviles.
 Datos de Internet de las Cosas.
 Datos sectoriales recopilados por empresas especializadas.
 Datos experimentales.
Y los tipos de datos también lo son:
 Tipos de datos no estructurados: documentos, vídeos, audios, etc.
 Tipos de datos semi-estructurados: software, hojas de cálculo, informes.
 Tipos de datos estructurados

Solo el 20% de información es estructurada y eso puede provocar muchos errores si no

acometemos un proyecto de calidad de datos.

2. Tremendo volumen de datos

Como ya hemos visto, el volumen de datos es enorme, y eso complica la ejecución de un
proceso de calidad de datos dentro de un tiempo razonable.
Es difícil recolectar, limpiar, integrar y obtener datos de alta calidad de forma rápida. Se
necesita mucho tiempo para transformar los tipos no estructurados en tipos estructurados y
procesar esos datos.

3. Mucha volatilidad
Los datos cambian rápidamente y eso hace que tengan una validez muy corta. Para
solucionarlo necesitamos un poder de procesamiento muy alto.
Si no lo hacemos bien, el procesamiento y análisis basado en estos datos puede producir
conclusiones erróneas, que pueden llevar a cometer errores en la toma de decisiones.

4. No existen estándares de calidad de datos unificados

En 1987 la Organización Internacional de Normalización (ISO) publicó las normas ISO 9000
para garantizar la calidad de productos y servicios. Sin embargo, el estudio de los estándares
de calidad de los datos no comenzó hasta los años noventa, y no fue hasta 2011 cuando ISO
publicó las normas de calidad de datos ISO 8000.
Estas normas necesitan madurar y perfeccionarse. Además, la investigación sobre la calidad
de datos de big data ha comenzado hace poco y no hay apenas resultados.
La calidad de datos de big data es clave, no solo para poder obtener ventajas competitivas sino
también impedir que incurramos en graves errores estratégicos y operacionales basándonos en
datos erróneos con consecuencias que pueden llegar a ser muy graves.

4. Cómo construir un plan de Data Governance en Big data

Gobernabilidad significa asegurarse de que los datos estén autorizados, organizados y con los
permisos de usuario necesarios en una base de datos, con el menor número posible de
errores, manteniendo al mismo tiempo la privacidad y la seguridad.
Esto no parece un equilibrio fácil de conseguir, sobre todo cuando la realidad de dónde y cómo
los datos se alojan y procesan está en constante movimiento.

A continuación, veremos algunos pasos recomendados al crear un plan de Data Governance

en Big Data.

1. Acceso y Autorización Granular a Datos

No se puede tener un gobierno de datos efectivo sin controles granulares.

Se pueden lograr estos controles granulares a través de las expresiones de control de acceso.
Estas expresiones usan agrupación y lógica booleana para controlar el acceso y autorización
de datos flexibles, con permisos basados en roles y configuraciones de visibilidad.

En el nivel más bajo, se protegen los datos confidenciales, ocultándolos, y en la parte superior,
se tienen contratos confidenciales para científicos de datos y analistas de BI. Esto se puede
hacer con capacidades de enmascaramiento de datos y diferentes vistas donde se bloquean
los datos en bruto tanto como sea posible y gradualmente se proporciona más acceso hasta
que, en la parte superior, se da a los administradores una mayor visibilidad.

Se pueden tener diferentes niveles de acceso, lo que da una seguridad más integrada.

2. Seguridad perimetral, protección de datos y autenticación integrada

La gobernabilidad no ocurre sin una seguridad en el punto final de la cadena. Es

importante construir un buen perímetro y colocar un cortafuegos alrededor de los datos,
integrados con los sistemas y estándares de autenticación existentes. Cuando se trata de
autenticación, es importante que las empresas se sincronicen con sistemas probados.

Con la autenticación, se trata de ver cómo integrarse con LDAP [Lightweight Directory Access
Protocol], Active Directory y otros servicios de directorio. También se puede dar soporte a
herramientas como Kerberos para soporte de autenticación. Pero lo importante es no crear una
infraestructura separada, sino integrarla en la estructura existente.

3. Encriptación y Tokenización de Datos

El siguiente paso después de proteger el perímetro y autenticar todo el acceso granular de
datos que se está otorgando es asegúrese de que los archivos y la información personalmente
identificable (PII) estén encriptados y tokenizados de extremo a extremo del pipeline de datos.

Una vez superado el perímetro y con acceso al sistema, proteger los datos de PII es
extremadamente importante. Es necesario encriptar esos datos de forma que,
independientemente de quién tenga acceso a él, puedan ejecutar los análisis que necesiten sin
exponer ninguno de esos datos.

4. Constante Auditoría y Análisis

La estrategia no funciona sin una auditoría. Ese nivel de visibilidad y responsabilidad en cada
paso del proceso es lo que permite a la TI "gobernar" los datos en lugar de simplemente
establecer políticas y controles de acceso y esperar lo mejor. También es cómo las empresas
pueden mantener sus estrategias actualizadas en un entorno en el que la forma en que vemos
los datos y las tecnologías que utilizamos para administrarlos y analizarlos están cambiando
cada día.

Estamos en la infancia de Big Data e IoT (Internet de Cosas), y es fundamental poder rastrear
el acceso y reconocer patrones en los datos.

La auditoría y el análisis pueden ser tan simples como el seguimiento de los archivos de
JavaScript Object Notation (JSON).

5. Una arquitectura de datos unificada

En última instancia, el responsable de TI que supervisar la estrategia de administración de

datos empresariales, debe pensar en los detalles del acceso granular, la autenticación, la
seguridad, el cifrado y la auditoría. Pero no debe detenerse ahí. Más bien debe pensar en
cómo cada uno de estos componentes se integra en su arquitectura de datos global. También
debe pensar en cómo esa infraestructura va a necesitar ser escalable y segura, desde la
recolección de datos y almacenamiento hasta BI, analítica y otros servicios de terceros. La
gobernanza de los datos es tanto acerca de repensar la estrategia y la ejecución como sobre la
propia tecnología.

Va más allá de un conjunto de reglas de seguridad. Esuna arquitectura única en la que se

crean estos roles y se sincronizan a través de toda la plataforma y todas las herramientas que
se aportan a ella.

5.Material complementario
Soluciones y recursos para Big Data
 Del bit al Big Data
 Big Data y Hadoop
 Del Big Data al éxito gracias a un Data Lake Inteligente
 VÍDEO: "La Calidad de Datos en el mundo Big Data"
 VÍDEO: "BIG DATA: ¿BIG GOVERNANCE?"
 Big Data a precio Low Cost
 1ª Parte - Informatica Big Data Edition
 2ª Parte - Informatica Big Data Edition
Guías
 La era de Big Data retail
 Los 11 elementos de una solución Big Data
 Big data y el futuro de las telecomunicaciones
 Proyectos en los que se justifica una inversión en big data: sector finanzas
 Big data seguros: el futuro está aquí
 Los Quarterbacks del BigData
 Big World, Big Data
 Qué significa Hadoop en el universo big data
 Del Bit... al Big Data
Artículos
 ¿Qué es Hadoop y cómo puede revolucionar el sector bancario?
 Cómo ayudan las herramientas Big Data a aumentar tu ventaja competitiva
 ¿Qué es Big Data Hadoop y para qué sirve?
 Spark vs Hadoop, ¿quién saldrá vencedor?
 ¿Qué es un sistema de gestión de datos de Big Data?
 La mejor forma de vender un proyecto de Big Data a tu CEO
 Conocer mejor el comportamiento del consumidor, una tarea pendiente
 Breve definición y utilidad de las aplicaciones de base de datos
 Big Data: el reto de gestionar datos estructurados y no estructurados
 Big Data vs técnicas de minería de datos

También podría gustarte

Wa0020.
Aún no hay calificaciones
Wa0020.
9 páginas
Herramientas Clave en el Ciclo de Big Data
Aún no hay calificaciones
Herramientas Clave en el Ciclo de Big Data
15 páginas
Herramientas Clave para Big Data
Aún no hay calificaciones
Herramientas Clave para Big Data
3 páginas
Metodología y Herramientas de Big Data
Aún no hay calificaciones
Metodología y Herramientas de Big Data
14 páginas
00 Presentación 2
Aún no hay calificaciones
00 Presentación 2
33 páginas
Comparativa de Tecnologías Big Data: Storm, Spark y Samza
Aún no hay calificaciones
Comparativa de Tecnologías Big Data: Storm, Spark y Samza
3 páginas
Actividad 3
Aún no hay calificaciones
Actividad 3
2 páginas
Big Data
Aún no hay calificaciones
Big Data
27 páginas
Resumen Tecnologias
Aún no hay calificaciones
Resumen Tecnologias
3 páginas
Herramientas Clave de Ciencia de Datos
Aún no hay calificaciones
Herramientas Clave de Ciencia de Datos
2 páginas
Actividad de Transferencia - Procesando Grandes Volúmenes de Datos
Aún no hay calificaciones
Actividad de Transferencia - Procesando Grandes Volúmenes de Datos
5 páginas
Big Data Aa1 Grupo N°1
Aún no hay calificaciones
Big Data Aa1 Grupo N°1
16 páginas
Actividad 4
Aún no hay calificaciones
Actividad 4
5 páginas
Big Data y Analytics - Tema 05 - Ingeniería de Procesado de Datos
Aún no hay calificaciones
Big Data y Analytics - Tema 05 - Ingeniería de Procesado de Datos
43 páginas
Herramientas Big Data: Guía Completa
Aún no hay calificaciones
Herramientas Big Data: Guía Completa
10 páginas
Resumen Curso Big Data
Aún no hay calificaciones
Resumen Curso Big Data
12 páginas
Herramientas Inteligencia Artificial
Aún no hay calificaciones
Herramientas Inteligencia Artificial
3 páginas
Big Data Grupo 7
Aún no hay calificaciones
Big Data Grupo 7
9 páginas
Evidencia 1 BIG DATA-2
Aún no hay calificaciones
Evidencia 1 BIG DATA-2
17 páginas
Big Data - AA1
Aún no hay calificaciones
Big Data - AA1
2 páginas
(14-1) Topicos en Base de Datos - Clase
Aún no hay calificaciones
(14-1) Topicos en Base de Datos - Clase
24 páginas
Herramientas y Éxitos en Big Data
Aún no hay calificaciones
Herramientas y Éxitos en Big Data
22 páginas
Herramientas Big Data: Python, Hadoop y Spark
Aún no hay calificaciones
Herramientas Big Data: Python, Hadoop y Spark
16 páginas
Big Data
Aún no hay calificaciones
Big Data
6 páginas
Arquitectura Big Data
Aún no hay calificaciones
Arquitectura Big Data
11 páginas
Big Data Aa1
Aún no hay calificaciones
Big Data Aa1
13 páginas
Curso de Datos
Aún no hay calificaciones
Curso de Datos
9 páginas
InteligenciaNegocios Ant B2 S
Aún no hay calificaciones
InteligenciaNegocios Ant B2 S
16 páginas
Clase3 pdf2
Aún no hay calificaciones
Clase3 pdf2
11 páginas
Trabajo EDI
Aún no hay calificaciones
Trabajo EDI
28 páginas
Las Herramientas de Big Data
Aún no hay calificaciones
Las Herramientas de Big Data
5 páginas
1.2.1 Ecosistema Hadoop
Aún no hay calificaciones
1.2.1 Ecosistema Hadoop
33 páginas
Presentación Meetup Python
Aún no hay calificaciones
Presentación Meetup Python
39 páginas
04 Arquitecturas Big Data
100% (1)
04 Arquitecturas Big Data
23 páginas
Aa1 Alvares Castillo Orosco Hurtado
Aún no hay calificaciones
Aa1 Alvares Castillo Orosco Hurtado
12 páginas
Intro BigData
Aún no hay calificaciones
Intro BigData
21 páginas
Investigación sobre Hadoop en Zacatepec
Aún no hay calificaciones
Investigación sobre Hadoop en Zacatepec
6 páginas
Ecosistema Hadoop y sus herramientas
Aún no hay calificaciones
Ecosistema Hadoop y sus herramientas
3 páginas
Clase 3 Qué Es El Big Data Alumnos-1
Aún no hay calificaciones
Clase 3 Qué Es El Big Data Alumnos-1
115 páginas
Tecnologias de Almacenamiento para Big Data - Eneb
Aún no hay calificaciones
Tecnologias de Almacenamiento para Big Data - Eneb
160 páginas
Amayo Ataypoma Blas Bustincio Carhuachagua
Aún no hay calificaciones
Amayo Ataypoma Blas Bustincio Carhuachagua
17 páginas
Tarea 3 - Luis Pimienta (Grupo - 202016911 - 1) - Avances
Aún no hay calificaciones
Tarea 3 - Luis Pimienta (Grupo - 202016911 - 1) - Avances
8 páginas
Big Data WorkShop
Aún no hay calificaciones
Big Data WorkShop
72 páginas
Guía de Herramientas en Ciencia de Datos y AI
Aún no hay calificaciones
Guía de Herramientas en Ciencia de Datos y AI
7 páginas
Introduccion A Hadoop UV ES
Aún no hay calificaciones
Introduccion A Hadoop UV ES
61 páginas
Herramientas de Tecnologias
Aún no hay calificaciones
Herramientas de Tecnologias
9 páginas
Herramientas de Distribución
Aún no hay calificaciones
Herramientas de Distribución
5 páginas
Estudio de Spark, Pig, Kafka y Hive para Hadoop
Aún no hay calificaciones
Estudio de Spark, Pig, Kafka y Hive para Hadoop
21 páginas
Conceptos Clave Big Data
Aún no hay calificaciones
Conceptos Clave Big Data
3 páginas
AA1. BIG DATA Aa1
Aún no hay calificaciones
AA1. BIG DATA Aa1
24 páginas
Big Data
Aún no hay calificaciones
Big Data
2 páginas
Fundamentos de Big Data y Hadoop
Aún no hay calificaciones
Fundamentos de Big Data y Hadoop
12 páginas
Arquitectura Big Data
Aún no hay calificaciones
Arquitectura Big Data
7 páginas
21 Motores de BASE DE DATOS MÁS UTILIZADAS POR LOS DESARROLLADORES-1
Aún no hay calificaciones
21 Motores de BASE DE DATOS MÁS UTILIZADAS POR LOS DESARROLLADORES-1
27 páginas
Tema 5 BDA
Aún no hay calificaciones
Tema 5 BDA
52 páginas
Evaluacion4 BigData
Aún no hay calificaciones
Evaluacion4 BigData
8 páginas
LEC2-NVL-1Anahi Citlali Diaz Reyes2
Aún no hay calificaciones
LEC2-NVL-1Anahi Citlali Diaz Reyes2
3 páginas
Herramienta Big Data con Apache Spark
Aún no hay calificaciones
Herramienta Big Data con Apache Spark
65 páginas
Definiciones de Multimedia y Cronología de La Multimedia
Aún no hay calificaciones
Definiciones de Multimedia y Cronología de La Multimedia
8 páginas
Atajos de Teclado en Excel
Aún no hay calificaciones
Atajos de Teclado en Excel
9 páginas
Hojas de Cálculo Más Usadas 2023
Aún no hay calificaciones
Hojas de Cálculo Más Usadas 2023
3 páginas
Cobas Infinity - Manual Operador
Aún no hay calificaciones
Cobas Infinity - Manual Operador
14 páginas
Códigos de Transacción y Tablas de SAP SD
Aún no hay calificaciones
Códigos de Transacción y Tablas de SAP SD
5 páginas
Cuadro Comparativo 2
Aún no hay calificaciones
Cuadro Comparativo 2
2 páginas
Impuestos Retenciones Totales: Martha Meneses Diaz La Riviera
Aún no hay calificaciones
Impuestos Retenciones Totales: Martha Meneses Diaz La Riviera
1 página
Inspeccion de Elementos de Proteccion Personal
Aún no hay calificaciones
Inspeccion de Elementos de Proteccion Personal
2 páginas
Lenguajes Imperativos - EQ3
Aún no hay calificaciones
Lenguajes Imperativos - EQ3
12 páginas
Adquisición de Datos para Análisis
Aún no hay calificaciones
Adquisición de Datos para Análisis
3 páginas
Guia de Instalacion PBX
Aún no hay calificaciones
Guia de Instalacion PBX
18 páginas
Saldos Iniciales en Exact Globe Next
Aún no hay calificaciones
Saldos Iniciales en Exact Globe Next
2 páginas
12.6.6 PT - Configuración de Direccionamiento IPv6
Aún no hay calificaciones
12.6.6 PT - Configuración de Direccionamiento IPv6
5 páginas
Procedimiento de Staffing VASS 2021
100% (1)
Procedimiento de Staffing VASS 2021
8 páginas
Lista de Cosas Productivas para Hacer en Casa Cuando Estás Aburrido
Aún no hay calificaciones
Lista de Cosas Productivas para Hacer en Casa Cuando Estás Aburrido
4 páginas
Cartilla Constancia
Aún no hay calificaciones
Cartilla Constancia
7 páginas
Ejercicios Básicos Excel 01 - Formatos de Fuente y Alineación
Aún no hay calificaciones
Ejercicios Básicos Excel 01 - Formatos de Fuente y Alineación
4 páginas
Tarea 2 Excel Básico
Aún no hay calificaciones
Tarea 2 Excel Básico
3 páginas
Facultad de Ingenieria UNAM - Ingenieria en Computacion - Plan 2023 - Fundamentos de Programacion
Aún no hay calificaciones
Facultad de Ingenieria UNAM - Ingenieria en Computacion - Plan 2023 - Fundamentos de Programacion
6 páginas
Software Facturación para Farmacias
Aún no hay calificaciones
Software Facturación para Farmacias
8 páginas
Analisis Del Caso Spotify
Aún no hay calificaciones
Analisis Del Caso Spotify
4 páginas
Volcado de Memoria RAM en Informática Forense
Aún no hay calificaciones
Volcado de Memoria RAM en Informática Forense
11 páginas
Guía de Actividades y Rúbrica de Evaluación - Fase 5 - Reto Final
Aún no hay calificaciones
Guía de Actividades y Rúbrica de Evaluación - Fase 5 - Reto Final
10 páginas
Leame
Aún no hay calificaciones
Leame
4 páginas
Manual de Aprendizaje de Dialogflow
Aún no hay calificaciones
Manual de Aprendizaje de Dialogflow
23 páginas
Margen, Artículos y Descuentos
Aún no hay calificaciones
Margen, Artículos y Descuentos
21 páginas
Directivas GPO
Aún no hay calificaciones
Directivas GPO
13 páginas
Devolución de Factura de Equipos Médicos
Aún no hay calificaciones
Devolución de Factura de Equipos Médicos
1 página
Guía BIOS: Habilitar TPM y Secure Boot
Aún no hay calificaciones
Guía BIOS: Habilitar TPM y Secure Boot
2 páginas
Topazio Torres TI M3 RecusosTecnologicos
Aún no hay calificaciones
Topazio Torres TI M3 RecusosTecnologicos
12 páginas