0% encontró este documento útil (0 votos)
21 vistas2 páginas

Comparativa de Herramientas Big Data

El documento compara herramientas de big data como Python, Apache Spark, Apache Storm y Elasticsearch, describiendo brevemente las características y funciones únicas de cada una.

Cargado por

72873749
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
21 vistas2 páginas

Comparativa de Herramientas Big Data

El documento compara herramientas de big data como Python, Apache Spark, Apache Storm y Elasticsearch, describiendo brevemente las características y funciones únicas de cada una.

Cargado por

72873749
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

1.

COMPARATIVA DE HERRAMIENTAS DE BIG DATA

a) Comparación técnica de las herramientas investigadas

Cuadro comparativo de las herramientas big data.

Uno de los objetivos del uso de las tecnologías Big Data es el de transformar los

datos en conocimiento útil para la empresa, y para ello se necesitan herramientas Big

Data que nos ayuden a analizar, procesar y almacenar todos los datos recogidos como

son Python, apache spark, apache storm, elasticserarch, y conoceremos sus diferencias y

lo que hace a cada uno único y sus funciones únicas de cada una de ellas.

PYTHON La diferencia de la herramienta Python con los demás


herramientas es que:
 Python es un lenguaje interpretado, lo que significa que
ejecuta directamente el código líneo por línea. Si existen
errores en el código del programa, su ejecución se
detiene.
 Los programadores no tienen que anunciar tipos de
variables cuando escriben códigos porque Python los
determina en el tiempo de ejecución.
 Python es más cercano a los idiomas humanos que otros
lenguajes de programación. (WAC, 2020)
APACHE SPARK Spark es un marco de código abierto centrado en las consultas

interactivas, machine Lear Ning y las cargas de trabajo en tiempo

real, además pueden ejecutar análisis en otros sistemas de

almacenamiento.

aprovecha YARN para compartir un clúster y un conjunto de

datos comunes como otros motores de Hadoop, lo que garantiza

niveles de servicio y respuesta consistentes. (WAC, 2020)


APACHE STORM Storm es extremadamente rápido y puede procesar más de un

millón de registros por segundo además que incluye: gestión de

servicios para el cliente en tiempo real, monetización de datos,

paneles operacionales o análisis de ciberseguridad y detección

de amenazas. (CLOUDERA, 2020)

ELASTICSEARCH Elasticsearch es un motor de búsqueda y se utiliza habitualmente para

análisis de registros, búsqueda de texto completo, inteligencia de

seguridad, análisis empresarial y casos de uso de inteligencia operativas.

Elasticsearch se especializa a diferencia de los otros más en búsqueda de

información. (WAC, 2020)

Referencias
CLOUDERA. (2020). CLOUDERA. Obtenido de

https://es.cloudera.com/products/open-source/apache-hadoop/apache-storm.html

WAC. (2020). amazon.com. Obtenido de https://aws.amazon.com/es/what-is/python/

También podría gustarte