Introducción a Apache Hive en Big Data

Este documento presenta una práctica sobre el uso de Apache Hive para el análisis de datos masivos. Explica cómo crear una tabla externa en Hive usando un archivo de datos, realizar consultas SQL en la tabla para extraer y analizar información, y eliminar la tabla al final. El objetivo es adquirir conocimientos básicos sobre el uso de Hive para proyectos de análisis de grandes volúmenes de datos.

Cargado por

Manuel Correa

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

50 vistas6 páginas

Introducción a Apache Hive en Big Data

Cargado por

Manuel Correa

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

INSTITUTO TECNOLOGICO DE HERMOSILLO

PRÁCTICA 7: HIVE

MATERIA: DATOS MASIVOS

DOCENTE: HINOJOSA PALAFOX EDUARDO ANTONIO

ALUMNO: CORREA MARTINEZ MANUEL FRANCISCO

GRUPO: S8A

Hermosillo, Son.
INTRODUCCIÓN
En esta práctica, se trabajará en el fascinante mundo de Apache Hive, una
herramienta de análisis de datos ampliamente utilizada en el ecosistema de Big
Data. Hive brinda una forma sencilla y familiar de trabajar con datos, utilizando un
lenguaje de consulta similar a SQL para realizar análisis y extracción de
información. La capacidad de Hive para procesar grandes volúmenes de datos de
manera eficiente y su compatibilidad con diferentes formatos y tipos de datos hacen
de esta herramienta una opción poderosa para el análisis y la exploración de datos
en entornos de Big Data.

Al finalizar esta práctica, se habrán adquirido los conocimientos básicos necesarios

para utilizar Apache Hive como una herramienta confiable y eficiente en proyectos
de análisis de datos.

DESARROLLO
Para dar inicio a la práctica es necesario tener corriendo la máquina virtual con
Cloudera, una vez esto esté listo, es necesario abrir una terminal en Cloudera para
verificar que este correctamente funcionando Hive, para ello ejecutamos el comando
$ hive como se muestra a continuación:

Al ejecutar el comando tardará tan solo uno segundos y después tiene que aparecer
la sentencia hive> esto indicará que podemos ejecutar sentencias en Hive, por lo
que deducimos que todo esta correctamente funcionando.

1
Lo siguiente es descargar el archivo que lleva por nombre “[Link]”, el cual
servirá para trabajar con esta práctica. Una vez descargado dicho archivo es
necesario ejecutar el siguiente comando:

$ hdfs dfs -put /home/cloudera/Downloads/[Link] /user/hadoop

Este comando se utiliza para copiar el archivo "[Link]" desde la ubicación local
"/home/cloudera/Downloads/[Link]" al directorio "/user/hadoop" en el sistema
de archivos Hadoop Distributed File System (HDFS). Una vez ejecutado se habrá
copiado el archivo al destino dicho, lo siguiente será comprobar que se haya
copiado correctamente, y esto es con la ayuda del comando siguiente:

$ hdfs dfs -ls /user/hadoop

El resultado será el siguiente, comprobando que se ha realizado correctamente la

copia del archivo.

Ahora se verifica que el archivo tenga el contenido que se espera, esto se observa
ejecutando el comando siguiente:

$ hdfs dfs -cat /user/hadoop/[Link]

Y el resultado será el siguiente, en donde se muestra el contenido de dicho archivo:

2
Después, se ejecuta nuevamente el comando hive para comenzar con la creación
de una tabla externa donde se tendrán tres atributos los cuales son un identificador
de tipo entero, un nombre de tipo cadena de caracteres, y el nombre del
departamento donde trabaja el empleado que también será una cadena de
caracteres.

El comando "CREATE EXTERNAL TABLE" en Hive se utiliza para crear una tabla
externa llamada "nombres" con tres columnas: "ID", "nombre" y "departamento".
Esta tabla será utilizada para estructurar y organizar los datos que se cargarán o
consultarán posteriormente en Hive.

Una vez ejecutada la creación de la tabla externa, Hive permite ejecutar las
consultas dando una sangría o bloque de ejecución, la sentencia se termina una vez
que se coloca ;

Ahora se realiza una consulta a la tabla nombres para verificar la creación de la

tabla con las instrucciones anteriores :

3
Ahora se pueden realizar consultas sencillas ya que los datos no solo son un
archivo hdfs si no que también son una tabla y se pueden consultar como si se
estuviera en una base datos relacional.

Por ejemplo se ejecutará el siguiente comando:

SELECT nombre FROM nombres WHERE ID>22

Y como se puede observar, se ejecuta de manera correcta el comando y arroja los

resultados correctos.

Ejemplo 2
En este caso se buscará el departamento al que corresponde la persona a través de
la consulta de su nombre:

A medida que la consulta sea más abstracta, Hive tardará más en ejecutarla, pero el
resultado será el correcto al finalizar la sentencia.

Ahora por último podemos realizar otra consulta, esta vez eliminando la tabla
nombres que se ha creado:

4
CONCLUSIÓN
He aprendido cómo crear tablas y bases de datos en Hive, importar datos desde
diversas fuentes y ejecutar consultas utilizando un lenguaje de consulta similar a
SQL. A través de estas consultas básicas, obteniendo información valiosa de los
datos.

OBSERVACIONES PERSONALES

Es importante destacar que esta ha sido solo una introducción al uso básico de
Hive. Hay muchas más características y funcionalidades que se pueden explorar y
dominar en futuras prácticas y proyectos. Hive es una herramienta versátil y en
constante evolución, y su dominio puede abrir nuevas puertas en el mundo del
análisis de datos en entornos de Big Data.

También podría gustarte

08 Hive
Aún no hay calificaciones
08 Hive
15 páginas
Laboratorio de Apache Hive
Aún no hay calificaciones
Laboratorio de Apache Hive
9 páginas
Introducción a Apache Hive y su uso
Aún no hay calificaciones
Introducción a Apache Hive y su uso
19 páginas
Big Data (III Unidad)
Aún no hay calificaciones
Big Data (III Unidad)
54 páginas
Componentes Básicos de Una Solución de Big Data: Andrei Garzón Módulo II
Aún no hay calificaciones
Componentes Básicos de Una Solución de Big Data: Andrei Garzón Módulo II
15 páginas
Ejercicios HIVE
Aún no hay calificaciones
Ejercicios HIVE
13 páginas
MCDMA - 04 Presentaciones - U2 - Opt
Aún no hay calificaciones
MCDMA - 04 Presentaciones - U2 - Opt
120 páginas
Hive
Aún no hay calificaciones
Hive
57 páginas
Laboratorio GCP: Exploración de Datos Telco
Aún no hay calificaciones
Laboratorio GCP: Exploración de Datos Telco
16 páginas
BigData Tools
Aún no hay calificaciones
BigData Tools
10 páginas
Información Cloudera
Aún no hay calificaciones
Información Cloudera
4 páginas
5 0 Cloudera
Aún no hay calificaciones
5 0 Cloudera
18 páginas
Actividad 7. Investigación Hive
Aún no hay calificaciones
Actividad 7. Investigación Hive
26 páginas
Introducción a Hive en Big Data
Aún no hay calificaciones
Introducción a Hive en Big Data
39 páginas
Lab Cloud Dataproc - Hadoop - Hive
Aún no hay calificaciones
Lab Cloud Dataproc - Hadoop - Hive
13 páginas
10 Cloudera Hue Impala
Aún no hay calificaciones
10 Cloudera Hue Impala
15 páginas
BigData Tools
Aún no hay calificaciones
BigData Tools
4 páginas
Guía: Instalar Hive en Windows 10
Aún no hay calificaciones
Guía: Instalar Hive en Windows 10
14 páginas
Importación de Datos con Sqoop en Hadoop
Aún no hay calificaciones
Importación de Datos con Sqoop en Hadoop
2 páginas
Tema 7
Aún no hay calificaciones
Tema 7
32 páginas
Hive
Aún no hay calificaciones
Hive
6 páginas
Introducción a HBase y su instalación
Aún no hay calificaciones
Introducción a HBase y su instalación
6 páginas
Introducción a Apache Hive y su Arquitectura
Aún no hay calificaciones
Introducción a Apache Hive y su Arquitectura
12 páginas
MapReduce y Pig Con Ubuntu
Aún no hay calificaciones
MapReduce y Pig Con Ubuntu
26 páginas
Comandos Esenciales de HDFS
Aún no hay calificaciones
Comandos Esenciales de HDFS
55 páginas
03 Ecosistema Hadoop
Aún no hay calificaciones
03 Ecosistema Hadoop
35 páginas
Taller Big Data: Hive e Impala
Aún no hay calificaciones
Taller Big Data: Hive e Impala
10 páginas
Introducción a Sqoop en Hadoop
Aún no hay calificaciones
Introducción a Sqoop en Hadoop
2 páginas
60-Hive Presentación PDF
Aún no hay calificaciones
60-Hive Presentación PDF
9 páginas
Actividad Big Data: Consultas con Hive e Impala
Aún no hay calificaciones
Actividad Big Data: Consultas con Hive e Impala
2 páginas
Hadoop
Aún no hay calificaciones
Hadoop
36 páginas
Sesion 02 - Introduccion A BigData Parte II
Aún no hay calificaciones
Sesion 02 - Introduccion A BigData Parte II
25 páginas
Formación Cloudera y Ecosistema Hadoop
Aún no hay calificaciones
Formación Cloudera y Ecosistema Hadoop
95 páginas
Introducción a Apache Hive en Hadoop
Aún no hay calificaciones
Introducción a Apache Hive en Hadoop
1 página
Hdfs
Aún no hay calificaciones
Hdfs
2 páginas
Big Data Fundamentals - Ma Afq6e2s
Aún no hay calificaciones
Big Data Fundamentals - Ma Afq6e2s
6 páginas
Integracion de Datos PDF
Aún no hay calificaciones
Integracion de Datos PDF
3 páginas
Manual Big Data
Aún no hay calificaciones
Manual Big Data
61 páginas
Guía de Uso de Kylin OLAP en Web
Aún no hay calificaciones
Guía de Uso de Kylin OLAP en Web
58 páginas
Motores SQL: Hive e Impala
Aún no hay calificaciones
Motores SQL: Hive e Impala
35 páginas
Preguntas Entrevista
Aún no hay calificaciones
Preguntas Entrevista
7 páginas
HBase
Aún no hay calificaciones
HBase
102 páginas
Estadistica Puce
Aún no hay calificaciones
Estadistica Puce
6 páginas
Sesiones Hadoop 2 3
Aún no hay calificaciones
Sesiones Hadoop 2 3
5 páginas
Manual m6 - U1 - Tecnologías - Almacenamiento - Big - Data - v2
Aún no hay calificaciones
Manual m6 - U1 - Tecnologías - Almacenamiento - Big - Data - v2
94 páginas
Vamos A Trabajar Con Hadoop
Aún no hay calificaciones
Vamos A Trabajar Con Hadoop
24 páginas
Practica Lab 02
Aún no hay calificaciones
Practica Lab 02
9 páginas
Buenas Practicas Hive e Impala v1.0
Aún no hay calificaciones
Buenas Practicas Hive e Impala v1.0
41 páginas
Clase 22-08-2023
Aún no hay calificaciones
Clase 22-08-2023
19 páginas
Taller de Sqoop: Ingesta de Datos en Hadoop
Aún no hay calificaciones
Taller de Sqoop: Ingesta de Datos en Hadoop
18 páginas
Interfaces Big Data: HUE, Cloudera y Ambari
Aún no hay calificaciones
Interfaces Big Data: HUE, Cloudera y Ambari
17 páginas
Si TBD A1.2
Aún no hay calificaciones
Si TBD A1.2
22 páginas
Investigacion
Aún no hay calificaciones
Investigacion
7 páginas
Diferencias Entre HIVE y PIG
Aún no hay calificaciones
Diferencias Entre HIVE y PIG
2 páginas
3.1.ejemplos Practica HIVE
Aún no hay calificaciones
3.1.ejemplos Practica HIVE
4 páginas
Reporte de Curso de Mongo DB Modulo1 Eber - Angel
Aún no hay calificaciones
Reporte de Curso de Mongo DB Modulo1 Eber - Angel
27 páginas
Creación de Tablas en SQL para iissi
Aún no hay calificaciones
Creación de Tablas en SQL para iissi
68 páginas
POA Area Ciencias Sociales
100% (5)
POA Area Ciencias Sociales
2 páginas
Pago IESS con Tarjeta de Crédito
Aún no hay calificaciones
Pago IESS con Tarjeta de Crédito
1 página
Brasil convoca embajadora venezolana
Aún no hay calificaciones
Brasil convoca embajadora venezolana
12 páginas
1.6 Regulacion de La Velocidad Del Motor
Aún no hay calificaciones
1.6 Regulacion de La Velocidad Del Motor
6 páginas
Historia 3 BGU 2T
Aún no hay calificaciones
Historia 3 BGU 2T
3 páginas
Evaluación para Decisiones Curriculares
Aún no hay calificaciones
Evaluación para Decisiones Curriculares
2 páginas
3a Instalaciones Sanitarias
Aún no hay calificaciones
3a Instalaciones Sanitarias
19 páginas
Gestión de Auditorías en CAM Colombia
Aún no hay calificaciones
Gestión de Auditorías en CAM Colombia
5 páginas
Estrategias de Lectura Académica
Aún no hay calificaciones
Estrategias de Lectura Académica
7 páginas
Proced. Construcción Cuarto Bombas
Aún no hay calificaciones
Proced. Construcción Cuarto Bombas
11 páginas
Sentencia sobre Bonificación Especial PNP
100% (1)
Sentencia sobre Bonificación Especial PNP
7 páginas
Test General Ce y Soluciones
100% (2)
Test General Ce y Soluciones
14 páginas
Frmto 201510-Prueba 7777777777
Aún no hay calificaciones
Frmto 201510-Prueba 7777777777
6 páginas
Certificado de Conformidad: Transformadores BLOX
Aún no hay calificaciones
Certificado de Conformidad: Transformadores BLOX
2 páginas
Caracterización de Alcaloides en Fármacos
100% (4)
Caracterización de Alcaloides en Fármacos
14 páginas
Xiv Comunicado Del Protocolo de Santa Pola Exigiendo Responsabilidades Ante La Devastación Que Asola España
Aún no hay calificaciones
Xiv Comunicado Del Protocolo de Santa Pola Exigiendo Responsabilidades Ante La Devastación Que Asola España
6 páginas
Memoria Descriptiva de Mantenimiento de Cunetas
Aún no hay calificaciones
Memoria Descriptiva de Mantenimiento de Cunetas
4 páginas
Preferencias Profesionales - Renovado
86% (7)
Preferencias Profesionales - Renovado
15 páginas
Seguridad en Operaciones de Carga Suspendida
Aún no hay calificaciones
Seguridad en Operaciones de Carga Suspendida
1 página
Aceites Esenciales - Mapa Conceptual
80% (5)
Aceites Esenciales - Mapa Conceptual
1 página
Guía para usar Word 2010 en Windows
Aún no hay calificaciones
Guía para usar Word 2010 en Windows
6 páginas
Método de Proyectos: Conceptos y Fases
Aún no hay calificaciones
Método de Proyectos: Conceptos y Fases
4 páginas
Informe de Transacciones Hotel "Tranquilandia"
Aún no hay calificaciones
Informe de Transacciones Hotel "Tranquilandia"
5 páginas
Cotizacion Fotografia Matrimonio
Aún no hay calificaciones
Cotizacion Fotografia Matrimonio
3 páginas
Modulo 2 TV
Aún no hay calificaciones
Modulo 2 TV
3 páginas
Contadores y Registros de Desplazamiento
Aún no hay calificaciones
Contadores y Registros de Desplazamiento
13 páginas
Al Fondo Hay Sitio
100% (1)
Al Fondo Hay Sitio
7 páginas
Programacion Con Java PDF
Aún no hay calificaciones
Programacion Con Java PDF
113 páginas
Desagregado Plan Urbano Sapallanga DEFINIDO ARQ. NINO
Aún no hay calificaciones
Desagregado Plan Urbano Sapallanga DEFINIDO ARQ. NINO
5 páginas
Ley de Tránsito y Educación Vial
Aún no hay calificaciones
Ley de Tránsito y Educación Vial
12 páginas