Introducción a Apache Hive en Hadoop

Apache Hive es una herramienta que permite el almacenamiento, consulta y análisis de grandes cantidades de datos almacenados en HDFS. Funciona mediante una capa sobre HDFS que mapea los archivos a una base de datos relacional accesible a través de HQL, un lenguaje de consultas similar a SQL. Esto reduce la complejidad de programar en MapReduce y permite interactuar con datos estructurados y no estructurados en HDFS.

Cargado por

paolagarcia1107

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como TXT, PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

101 vistas1 página

Introducción a Apache Hive en Hadoop

Cargado por

paolagarcia1107

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como TXT, PDF, TXT o lee en línea desde Scribd

Buenas noches, mi nombre es Paola Guerrero y junto con mi compañera Carolina

Martinez vamos a explicar sobre Apache hive

APACHE HIVE
Es una infraestructura de almacenamiento de datos construida sobre Hadoop, para
proporcionar agrupación, consulta y análisis de datos, es decir, que aparte de que
podemos almacenar datos que se montan sobre Hadoop, tambien sirve para consultarlos
y analizarlos.
Funciona como si fuera el SQl convencional de una base de datos solamente que en
lugar de trabajar con los datos estructurados en tablas y tablas relacionadas con
columnas y filas trabaja es sobre archivos, no solamente de un solo tipo sino que
maneja archivos con diferentes extensiones.
Inicialmente fue desarrollado por facebook, aunque en la actualidad Apache hive es
utilizada y desarrollada por otras empresas como Netflix y Amazon que actualmente
mantiene una derivacion de Hive incluida en Amazon Elastic Mapredius en sus
servicios de Amazon Web Services.

Es una herramienta bastante util sobretodo si queremos desarrollar una interfaz de

usuario que pueda extraer datos desde HDFS. Basicamente es una capa por arriba de
HDFS que trabaja con los archivos que estan dentro del sistema de ficheros de
Hadoop

ARQUITECTURA
En la primera capa encontramos la interfaz de usuario, esta puede ser una
aplicación web, la línea de comandos de Hive o alguna otra aplicación adicional
dentro de esta capa de interfaz de usuario.

Tenemos tambien la capa MetaStor donde se almacenan los datos, realmente es un

mapeo de lo que hay en HDFS.

Hay dos formas de como trabajar en este metaestor

La primera es como se hizo en el ejemplo que vamos a presentar donde se hace uso de
apache derby que es una base de datos relacional de codigo abierto, en este caso se
hizo uso para hacer pruebas de como funciona Hive, pero lo correcto es configurar
una base de datos puede ser maisql, oracol o lo que mejor convenga para poder
acceder a este metaestor donde se crean estructuras como si fuera una base de datos
relacional con tablas con columnas y registros que realmente están mapeando hacia
lo que es HDFS.

La manera de mapear estos datos es a traves del lenguaje de consultas de HIVE que
se le conoce como HIVE ql o HQL proces engin, esto lo que realiza son procesos a
traves de Mapredius, nosotros configuramos yarn y estos procesos lo que hacen es ya
sea entregarle datos al HDFS o recuperar datos los cuales se entregan a la interfaz
de usuario, de esta manera entonces podemos interactuar con todo nuestro closter
hadoop y consultar miles de millones de registros, gigabaits o de archivos teniendo
en cuenta que no solamente son datos estructurados con un lenguaje sql.

Algunas de las ventajas que brinda Hive es que

Reduce la complejidad de la programación MapReduce al usar HQL como lenguaje de
consulta (dialecto de SQL).

Está orientado a aplicaciones de tipo DataWerhaus, con datos estáticos, poco

cambiantes y sin requisitos de tiempo de respuesta rápida.

Permite a los usuarios despreocuparse del formato y almacenamiento de los datos

También podría gustarte

Actividad 7. Investigación Hive
Aún no hay calificaciones
Actividad 7. Investigación Hive
26 páginas
Hive
Aún no hay calificaciones
Hive
6 páginas
Introducción a Apache Hive y su Arquitectura
Aún no hay calificaciones
Introducción a Apache Hive y su Arquitectura
12 páginas
Sesion 02 - Introduccion A BigData Parte II
Aún no hay calificaciones
Sesion 02 - Introduccion A BigData Parte II
25 páginas
60-Hive Presentación PDF
Aún no hay calificaciones
60-Hive Presentación PDF
9 páginas
Hive
Aún no hay calificaciones
Hive
57 páginas
03 Ecosistema Hadoop
Aún no hay calificaciones
03 Ecosistema Hadoop
35 páginas
08 Hive
Aún no hay calificaciones
08 Hive
15 páginas
Tema 7
Aún no hay calificaciones
Tema 7
32 páginas
Formación Senior en Hive y Hadoop
Aún no hay calificaciones
Formación Senior en Hive y Hadoop
28 páginas
Introducción a Sqoop en Hadoop
Aún no hay calificaciones
Introducción a Sqoop en Hadoop
2 páginas
Investigacion
Aún no hay calificaciones
Investigacion
7 páginas
Introduccion A Hadoop UV ES
Aún no hay calificaciones
Introduccion A Hadoop UV ES
61 páginas
Diferencias Entre HIVE y PIG
Aún no hay calificaciones
Diferencias Entre HIVE y PIG
2 páginas
Introducción a Big Data y Hadoop
Aún no hay calificaciones
Introducción a Big Data y Hadoop
5 páginas
Hadoop GustavoEcheverry
Aún no hay calificaciones
Hadoop GustavoEcheverry
8 páginas
Componentes Básicos de Una Solución de Big Data: Andrei Garzón Módulo II
Aún no hay calificaciones
Componentes Básicos de Una Solución de Big Data: Andrei Garzón Módulo II
15 páginas
Drill
Aún no hay calificaciones
Drill
50 páginas
Introducción a Hive en Big Data
Aún no hay calificaciones
Introducción a Hive en Big Data
39 páginas
Taller Big Data: Hive e Impala
Aún no hay calificaciones
Taller Big Data: Hive e Impala
10 páginas
Big Data Fundamentals - Ma Afq6e2s
Aún no hay calificaciones
Big Data Fundamentals - Ma Afq6e2s
6 páginas
Motores SQL: Hive e Impala
Aún no hay calificaciones
Motores SQL: Hive e Impala
35 páginas
Introducción a Hadoop
Aún no hay calificaciones
Introducción a Hadoop
4 páginas
Big Data: Procesamiento con Hadoop
Aún no hay calificaciones
Big Data: Procesamiento con Hadoop
66 páginas
Fundamentos de Apache Spark en Ciencia de Datos
Aún no hay calificaciones
Fundamentos de Apache Spark en Ciencia de Datos
23 páginas
Ecosistema Hadoop: Guía Completa
Aún no hay calificaciones
Ecosistema Hadoop: Guía Completa
22 páginas
Ecosistema Hadoop: Guía Completa 2019
0% (1)
Ecosistema Hadoop: Guía Completa 2019
22 páginas
Introducción a Apache Drill en Big Data
Aún no hay calificaciones
Introducción a Apache Drill en Big Data
9 páginas
Formación Cloudera y Ecosistema Hadoop
Aún no hay calificaciones
Formación Cloudera y Ecosistema Hadoop
95 páginas
Guía Completa de Hadoop y MapReduce
Aún no hay calificaciones
Guía Completa de Hadoop y MapReduce
31 páginas
00 Presentación 2
Aún no hay calificaciones
00 Presentación 2
33 páginas
(14-1) Topicos en Base de Datos - Clase
Aún no hay calificaciones
(14-1) Topicos en Base de Datos - Clase
24 páginas
Introducción a Apache Hive y su uso
Aún no hay calificaciones
Introducción a Apache Hive y su uso
19 páginas
Glosario de Terminos
Aún no hay calificaciones
Glosario de Terminos
3 páginas
Hadoop
Aún no hay calificaciones
Hadoop
15 páginas
Qué es HBase y su arquitectura
Aún no hay calificaciones
Qué es HBase y su arquitectura
2 páginas
Big Data Tecnicas Herramientas y Aplicac-4
Aún no hay calificaciones
Big Data Tecnicas Herramientas y Aplicac-4
9 páginas
Hadoop
Aún no hay calificaciones
Hadoop
20 páginas
Resumen Tecnologias
Aún no hay calificaciones
Resumen Tecnologias
3 páginas
Apache Spark
Aún no hay calificaciones
Apache Spark
2 páginas
BigData Tools
Aún no hay calificaciones
BigData Tools
10 páginas
Introduccion Hadoop
Aún no hay calificaciones
Introduccion Hadoop
44 páginas
Apache Spark vs Elasticsearch: Comparativa
Aún no hay calificaciones
Apache Spark vs Elasticsearch: Comparativa
16 páginas
Spark para Dummies
Aún no hay calificaciones
Spark para Dummies
6 páginas
Motores NOSQL Más Utilizados
Aún no hay calificaciones
Motores NOSQL Más Utilizados
4 páginas
Introducción a Apache Hadoop
Aún no hay calificaciones
Introducción a Apache Hadoop
1 página
Introducción a Big Data con Hadoop
Aún no hay calificaciones
Introducción a Big Data con Hadoop
36 páginas
Laboratorio GCP: Exploración de Datos Telco
Aún no hay calificaciones
Laboratorio GCP: Exploración de Datos Telco
16 páginas
Documento Sin Título
100% (4)
Documento Sin Título
8 páginas
Apache Hadoop
0% (1)
Apache Hadoop
14 páginas
Hadoop: Clave en Big Data y Análisis
Aún no hay calificaciones
Hadoop: Clave en Big Data y Análisis
39 páginas
M4 U1 Ecosistema Hadoop
Aún no hay calificaciones
M4 U1 Ecosistema Hadoop
29 páginas
Introducción a Batch Processing
Aún no hay calificaciones
Introducción a Batch Processing
457 páginas
1.2.1 Ecosistema Hadoop
Aún no hay calificaciones
1.2.1 Ecosistema Hadoop
33 páginas
Investigación sobre Hadoop en Zacatepec
Aún no hay calificaciones
Investigación sobre Hadoop en Zacatepec
6 páginas
Curso Big Data (Tema 1)
Aún no hay calificaciones
Curso Big Data (Tema 1)
32 páginas
Laboratorio de Apache Hive
Aún no hay calificaciones
Laboratorio de Apache Hive
9 páginas
Cuestionario Del Control Interno
100% (2)
Cuestionario Del Control Interno
4 páginas
Guia Laboratorio Etn601 - Ii-2022
Aún no hay calificaciones
Guia Laboratorio Etn601 - Ii-2022
64 páginas
Huecograbado
Aún no hay calificaciones
Huecograbado
4 páginas
Resumen de Maquinaria y Equipos Del Centro de Mantenimiento de Vehículos Tácticos Del Ejército Bolivariano 2
Aún no hay calificaciones
Resumen de Maquinaria y Equipos Del Centro de Mantenimiento de Vehículos Tácticos Del Ejército Bolivariano 2
16 páginas
Teoria
Aún no hay calificaciones
Teoria
16 páginas
Transformación Urbana en Medellín
Aún no hay calificaciones
Transformación Urbana en Medellín
5 páginas
Predicción Demanda Con Redes Neuronales
Aún no hay calificaciones
Predicción Demanda Con Redes Neuronales
22 páginas
Examen Final de Módulo Estrategia Financiera y Control de Gestión - Revisión Del Intento
Aún no hay calificaciones
Examen Final de Módulo Estrategia Financiera y Control de Gestión - Revisión Del Intento
4 páginas
Guía para El Desarrollo Del Componente Práctico y Rúbrica de Evaluación - Unidad 2 - Paso 2 - Componente Práctico - Práctica Profesional-2
Aún no hay calificaciones
Guía para El Desarrollo Del Componente Práctico y Rúbrica de Evaluación - Unidad 2 - Paso 2 - Componente Práctico - Práctica Profesional-2
7 páginas
Relevamiento Conciliaciones 2018
Aún no hay calificaciones
Relevamiento Conciliaciones 2018
18 páginas
Controladores SmartSolar MPPT de Victron
Aún no hay calificaciones
Controladores SmartSolar MPPT de Victron
2 páginas
Ejercicios Propuestos
100% (1)
Ejercicios Propuestos
6 páginas
Instructivo FL16C Cable Cafe
Aún no hay calificaciones
Instructivo FL16C Cable Cafe
2 páginas
Formato Guia de Despacho
Aún no hay calificaciones
Formato Guia de Despacho
4 páginas
Catalogo2020 PDF
Aún no hay calificaciones
Catalogo2020 PDF
21 páginas
Actividad de Aprendizaje 4 FORO
Aún no hay calificaciones
Actividad de Aprendizaje 4 FORO
2 páginas
Ejercicio Funciones
Aún no hay calificaciones
Ejercicio Funciones
32 páginas
Choquehuanca Mamani Josef Jimy
Aún no hay calificaciones
Choquehuanca Mamani Josef Jimy
13 páginas
Actividades de Trabajo 2023
Aún no hay calificaciones
Actividades de Trabajo 2023
5 páginas
Taller Aplicando El Diseño en Word
Aún no hay calificaciones
Taller Aplicando El Diseño en Word
2 páginas
Tema 1 Gestion Empresarial (1) (Solo Lectura)
Aún no hay calificaciones
Tema 1 Gestion Empresarial (1) (Solo Lectura)
16 páginas
Auto Comisorio
Aún no hay calificaciones
Auto Comisorio
10 páginas
Implementación de Licencias RAC 61-63-65
Aún no hay calificaciones
Implementación de Licencias RAC 61-63-65
7 páginas
Actividad de Construcción Aca Algebra Lineal
Aún no hay calificaciones
Actividad de Construcción Aca Algebra Lineal
8 páginas
Capitalismo Necropolítico en LatAm
Aún no hay calificaciones
Capitalismo Necropolítico en LatAm
8 páginas
PR-SST-001 - Procedimiento - Control Documental
Aún no hay calificaciones
PR-SST-001 - Procedimiento - Control Documental
9 páginas
Configuracion Adaptador SNMP Ups Marca Powersun
Aún no hay calificaciones
Configuracion Adaptador SNMP Ups Marca Powersun
15 páginas
Diario Oficial de La Federación/Edición Vespertina
Aún no hay calificaciones
Diario Oficial de La Federación/Edición Vespertina
288 páginas
Introducción a los Microprocesadores
Aún no hay calificaciones
Introducción a los Microprocesadores
50 páginas
Bases Teoricas para El Uso de Las TIC en
Aún no hay calificaciones
Bases Teoricas para El Uso de Las TIC en
22 páginas