0% encontró este documento útil (0 votos)

63 vistas4 páginas

Consultas JOIN en Hive: Guía Completa

Este documento describe los diferentes tipos de consultas JOIN en Hive, incluyendo INNER JOIN, LEFT OUTER JOIN, RIGHT OUTER JOIN, FULL OUTER JOIN, LEFT SEMI JOIN y CROSS JOIN. Proporciona ejemplos de cada tipo de JOIN utilizando dos tablas de muestra de autores y libros.

Cargado por

Rafael Alonso David Peñalva

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

63 vistas4 páginas

Consultas JOIN en Hive: Guía Completa

Cargado por

Rafael Alonso David Peñalva

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

Big Data

Departamento de Ciencia de la Computación

Universidad Católica San Pablo
24 de Octubre de 2023

Consultas JOIN en Hive

Rafael Alonso David Peñalva
[Link]@[Link]

1. Introducción
1.1. ¿Qué es Hive?
Hive es una infraestructura de almacenamiento de datos basada en Apache Hadoop. Hadoop
proporciona capacidades masivas de expansión y tolerancia a fallos para el almacenamiento y
procesamiento de datos en hardware común.
Hive está diseñado para facilitar la resumen de datos, las consultas ad-hoc y el análisis de grandes
volúmenes de datos. Proporciona SQL, lo que permite a los usuarios realizar consultas ad-hoc,
resumen y análisis de datos fácilmente. Al mismo tiempo, el SQL de Hive ofrece a los usuarios
múltiples lugares para integrar su propia funcionalidad para realizar análisis personalizados, como
Funciones Definidas por el Usuario (UDFs)

1.2. Lo que Hive NO es

Hive no está diseñado para el procesamiento de transacciones en línea. Es mejor utilizarlo para
tareas tradicionales de almacenamiento de datos

1.3. Consultas JOIN en Hive

Las consultas JOIN en Hive, al igual que en otros sistemas basados en SQL, permiten combinar
registros de dos o más tablas en función de una o varias condiciones de coincidencia (generalmente
basadas en valores de columnas). Hive, como herramienta de consulta en el ecosistema Hadoop,
permite realizar JOIN en grandes volúmenes de datos distribuidos.

2. Sintaxis y Tipos de JOIN

Utilizaremos la sintaxis descrita en la documentación de Hive:

1 join_table :
2 table_reference [ INNER ] JOIN table_factor [ join_condition ]
3 | table_reference { LEFT | RIGHT | FULL } [ OUTER ] JOIN table_reference
join_condition
4 | table_reference LEFT SEMI JOIN table_reference join_condition
5 | table_reference CROSS JOIN table_reference [ join_condition ]

Tenemos los siguientes tipos de JOIN:

INNER JOIN

LEFT OUTER JOIN

RIGHT OUTER JOIN

Consultas JOIN en Hive

FULL OUTER JOIN

LEFT SEMI JOIN

CROSS JOIN

3. Ejemplos
Se definirán dos tablas para llevar a cabo los ejemplos:

autor_id nombre
1 García
2 Borges
3 Allende

Cuadro 1: Autores

libro_id titulo autor_id

1 Cien años de soledad 1
2 Ficciones 2
3 La casa de los espíritus 3
4 El Aleph 2
5 Eva Luna 3
6 Sobre héroes y tumbas NULL

Cuadro 2: Libros

3.1. INNER JOIN

Combina registros de ambas tablas donde la condición especificada en la expresión es verdadera.
Si la condición no se cumple para ciertos registros, estos registros no aparecerán en el resultado.

1 SELECT autores . nombre , libros . titulo

2 FROM autores
3 INNER JOIN libros ON autores . autor_id = libros . autor_id ;

El resultado de la consulta sería:

nombre titulo
García Cien años de soledad
Borges Ficciones
Allende La casa de los espíritus
Borges El Aleph
Allende Eva Luna

3.2. LEFT OUTER JOIN

Devuelve todos los registros de la tabla de la izquierda y los registros coincidentes de la tabla de
la derecha. Si no hay coincidencias en la tabla de la derecha, el resultado contendrá NULL en
las columnas de la derecha.

2
Consultas JOIN en Hive

1 SELECT autores . nombre , libros . titulo

2 FROM autores
3 LEFT OUTER JOIN libros ON autores . autor_id = libros . autor_id ;

El resultado de la consulta serían todos los autores y sus libros, incluso si no tienen un libro:

nombre titulo
García Cien años de soledad
Borges Ficciones
Allende La casa de los espíritus
Borges El Aleph
Allende Eva Luna

3.3. RIGHT OUTER JOIN

Es el inverso del LEFT JOIN. Devuelve todos los registros de la tabla de la derecha y los registros
coincidentes de la tabla de la izquierda. Si no hay coincidencias en la tabla de la izquierda, el
resultado contendrá NULL en las columnas de la izquierda.

1 SELECT autores . nombre , libros . titulo

2 FROM autores
3 RIGHT OUTER JOIN libros ON autores . autor_id = libros . autor_id ;

El resultado de la consulta serían todos los libros y sus autores, incluso si un libro no tiene un
autor definido:

nombre titulo
García Cien años de soledad
Borges Ficciones
Allende La casa de los espíritus
Borges El Aleph
Allende Eva Luna
NULL Sobre héroes y tumbas

3.4. FULL OUTER JOIN

Devuelve todos los registros cuando hay una coincidencia en una de las tablas. Es decir, devuelve
registros de ambas tablas, rellenando con NULL en los lados donde no hay coincidencia.

1 SELECT autores . nombre , libros . titulo

2 FROM autores
3 FULL OUTER JOIN libros ON autores . autor_id = libros . autor_id ;

El resultado de la consulta serían todos los autores y todos los libros, independientemente de si
hay una coincidencia:

3.5. LEFT SEMI JOIN

Devuelve registros de la tabla de la izquierda para los cuales existe al menos un registro en la
tabla de la derecha que cumple con la condición de JOIN. No devuelve ninguna columna de la
tabla de la derecha.

3
Consultas JOIN en Hive

nombre titulo
García Cien años de soledad
Borges Ficciones
Allende La casa de los espíritus
Borges El Aleph
Allende Eva Luna
NULL Sobre héroes y tumbas

1 SELECT autores . nombre

2 FROM autores
3 LEFT SEMI JOIN libros ON autores . autor_id = libros . autor_id ;

El resultado de la consulta serían los autores que al menos tienen un libro:

nombre
García
Borges
Allende

3.6. CROSS JOIN

Produce el producto cartesiano de las dos tablas; es decir, combina cada fila de la tabla de la
izquierda con cada fila de la tabla de la derecha.

1 SELECT autores . nombre , libros . titulo

2 FROM autores
3 CROSS JOIN libros ;

El resultado de la consulta sería (Solo mostrando las primeras filas para ahorrar espacio):

nombre titulo
García Cien años de soledad
García Ficciones
García La casa de los espíritus
... ...

Serían 18 filas en total (3 autores x 6 libros).

También podría gustarte

Consultas SQL: Subconsultas y Joins
Aún no hay calificaciones
Consultas SQL: Subconsultas y Joins
9 páginas
Usos Del Join
Aún no hay calificaciones
Usos Del Join
30 páginas
Ejemplos de Consultas Multitabla SQL
Aún no hay calificaciones
Ejemplos de Consultas Multitabla SQL
7 páginas
Bases de Datos Resumen Apunte 5 Multitabla
Aún no hay calificaciones
Bases de Datos Resumen Apunte 5 Multitabla
10 páginas
Consultas SQL en MySQL: Guía Práctica
Aún no hay calificaciones
Consultas SQL en MySQL: Guía Práctica
10 páginas
Uso de la cláusula JOIN en SQL
Aún no hay calificaciones
Uso de la cláusula JOIN en SQL
10 páginas
Guía Completa de JOINs en SQL
Aún no hay calificaciones
Guía Completa de JOINs en SQL
17 páginas
FBDdocs 2024-2025 - Reunión (Join)
Aún no hay calificaciones
FBDdocs 2024-2025 - Reunión (Join)
1 página
Subconsultas y Tipos de Joing PDF
Aún no hay calificaciones
Subconsultas y Tipos de Joing PDF
10 páginas
Tipos de JOINs en SQL y su uso
Aún no hay calificaciones
Tipos de JOINs en SQL y su uso
4 páginas
SQL
Aún no hay calificaciones
SQL
6 páginas
Introducción a SQL JOINs Básicos
Aún no hay calificaciones
Introducción a SQL JOINs Básicos
25 páginas
Principales Tipos de JOINS en SQL
Aún no hay calificaciones
Principales Tipos de JOINS en SQL
6 páginas
Tipos de JOIN en SQL: Guía Completa
Aún no hay calificaciones
Tipos de JOIN en SQL: Guía Completa
4 páginas
PostgreSQL: Trucos y Consultas Avanzadas
Aún no hay calificaciones
PostgreSQL: Trucos y Consultas Avanzadas
20 páginas
Join
Aún no hay calificaciones
Join
23 páginas
Tipos de JOIN en SQL y MySQL
Aún no hay calificaciones
Tipos de JOIN en SQL y MySQL
7 páginas
Consultas Multitabla en SQL
Aún no hay calificaciones
Consultas Multitabla en SQL
36 páginas
Investiga
Aún no hay calificaciones
Investiga
3 páginas
Tipos de JOIN
Aún no hay calificaciones
Tipos de JOIN
9 páginas
Tipos de JOIN en SQL: Guía Completa
Aún no hay calificaciones
Tipos de JOIN en SQL: Guía Completa
5 páginas
Tipos de JOIN en SQL: Guía Completa
Aún no hay calificaciones
Tipos de JOIN en SQL: Guía Completa
19 páginas
Guía de Sentencias JOIN en SQL
Aún no hay calificaciones
Guía de Sentencias JOIN en SQL
5 páginas
Consultas SQL: Tipos de JOIN y Ejemplos
Aún no hay calificaciones
Consultas SQL: Tipos de JOIN y Ejemplos
7 páginas
Qué Es Un JOIN
Aún no hay calificaciones
Qué Es Un JOIN
3 páginas
Tipos de SQL Joins y Ejemplos Prácticos
Aún no hay calificaciones
Tipos de SQL Joins y Ejemplos Prácticos
5 páginas
Tipos de JOIN en SQL: Guía Básica
Aún no hay calificaciones
Tipos de JOIN en SQL: Guía Básica
8 páginas
Joins
Aún no hay calificaciones
Joins
12 páginas
INNERSQL
Aún no hay calificaciones
INNERSQL
16 páginas
Ejemplo Joins
Aún no hay calificaciones
Ejemplo Joins
9 páginas
Tema 1 Avanzadas
Aún no hay calificaciones
Tema 1 Avanzadas
16 páginas
Consultas Avanzadas en Bases de Datos
Aún no hay calificaciones
Consultas Avanzadas en Bases de Datos
17 páginas
Joins en SQL: Guía Completa y Tipos
Aún no hay calificaciones
Joins en SQL: Guía Completa y Tipos
36 páginas
Joins Ejercicios
Aún no hay calificaciones
Joins Ejercicios
10 páginas
Cómo usar sentencias SQL JOIN
Aún no hay calificaciones
Cómo usar sentencias SQL JOIN
18 páginas
Guía de Consultas JOIN en SQL
Aún no hay calificaciones
Guía de Consultas JOIN en SQL
9 páginas
Tipos de JOIN en SQL: Guía Completa
Aún no hay calificaciones
Tipos de JOIN en SQL: Guía Completa
3 páginas
Tipos de SQL JOIN: Guía Completa
Aún no hay calificaciones
Tipos de SQL JOIN: Guía Completa
8 páginas
Guía de INNER JOIN y combinaciones SQL
Aún no hay calificaciones
Guía de INNER JOIN y combinaciones SQL
8 páginas
Tipos de Joins en SQL y Ejemplos
Aún no hay calificaciones
Tipos de Joins en SQL y Ejemplos
15 páginas
Destripando El Comando JOIN (SQL Basico)
Aún no hay calificaciones
Destripando El Comando JOIN (SQL Basico)
6 páginas
Guia6 - SQL Server 2012
Aún no hay calificaciones
Guia6 - SQL Server 2012
14 páginas
Uso de JOIN para Consultas SQL
Aún no hay calificaciones
Uso de JOIN para Consultas SQL
19 páginas
Tipos de JOINS en SQL: Guía Completa
Aún no hay calificaciones
Tipos de JOINS en SQL: Guía Completa
4 páginas
Tipos de Joins en SQL Server
Aún no hay calificaciones
Tipos de Joins en SQL Server
16 páginas
Consultas SQL: Joins y Composiciones
Aún no hay calificaciones
Consultas SQL: Joins y Composiciones
24 páginas
Joins y Group By en SQL
Aún no hay calificaciones
Joins y Group By en SQL
9 páginas
Tipos de JOIN en SQL y MySQL
Aún no hay calificaciones
Tipos de JOIN en SQL y MySQL
12 páginas
UD4.3 Subconsultas
Aún no hay calificaciones
UD4.3 Subconsultas
25 páginas
Trazabilidad en Modelos de Bases de Datos
Aún no hay calificaciones
Trazabilidad en Modelos de Bases de Datos
3 páginas
Tipos de Joins en Power Query
Aún no hay calificaciones
Tipos de Joins en Power Query
16 páginas
Tipos de JOIN en SQL Explicados
Aún no hay calificaciones
Tipos de JOIN en SQL Explicados
2 páginas
Optimización de INNER JOIN en SQL
Aún no hay calificaciones
Optimización de INNER JOIN en SQL
4 páginas
12.1 Combinacion Externa Completa
Aún no hay calificaciones
12.1 Combinacion Externa Completa
3 páginas
Tipos de JOIN en SQL: Guía Completa
Aún no hay calificaciones
Tipos de JOIN en SQL: Guía Completa
12 páginas
Tipos de JOIN en SQL y su Uso
Aún no hay calificaciones
Tipos de JOIN en SQL y su Uso
58 páginas
Explicacion Joins
Aún no hay calificaciones
Explicacion Joins
8 páginas
Subconsultas y JOINs en SQL
Aún no hay calificaciones
Subconsultas y JOINs en SQL
12 páginas
Un Ejemplo Simple de Normalización de Bases de Datos Relacionales (Hasta 3FN)
Aún no hay calificaciones
Un Ejemplo Simple de Normalización de Bases de Datos Relacionales (Hasta 3FN)
5 páginas
Creación y gestión de bases de datos SQL
Aún no hay calificaciones
Creación y gestión de bases de datos SQL
4 páginas
Cuadro Comparativo BD Relaciona y NO Relacional
Aún no hay calificaciones
Cuadro Comparativo BD Relaciona y NO Relacional
2 páginas
Ejercicios PL/SQL con Oracle DEPT
Aún no hay calificaciones
Ejercicios PL/SQL con Oracle DEPT
5 páginas
Rúbrica de Evaluación de Proyectos Base Datos
Aún no hay calificaciones
Rúbrica de Evaluación de Proyectos Base Datos
9 páginas
Administracion de Base de Datos - Semana 12
Aún no hay calificaciones
Administracion de Base de Datos - Semana 12
94 páginas
Modelo Relacional Biblioteca
Aún no hay calificaciones
Modelo Relacional Biblioteca
1 página
Introducción A Transact SQL
Aún no hay calificaciones
Introducción A Transact SQL
95 páginas
Manual Básico de ABAP para SAP R/3
100% (1)
Manual Básico de ABAP para SAP R/3
51 páginas
Consultas SQL: Uniones y JOINs
Aún no hay calificaciones
Consultas SQL: Uniones y JOINs
31 páginas
Fundamentos de Bases de Datos
Aún no hay calificaciones
Fundamentos de Bases de Datos
67 páginas
LDD en Bases de Datos: Comandos Esenciales
Aún no hay calificaciones
LDD en Bases de Datos: Comandos Esenciales
14 páginas
SAGE Driver ODBC V.15 - Estructura de Tablas PDF
Aún no hay calificaciones
SAGE Driver ODBC V.15 - Estructura de Tablas PDF
675 páginas
Copia de Albert Giuseppe Chirme Valdivia - Documento Sin Título
Aún no hay calificaciones
Copia de Albert Giuseppe Chirme Valdivia - Documento Sin Título
17 páginas
Construcción de guiones en SQL/PSM
Aún no hay calificaciones
Construcción de guiones en SQL/PSM
43 páginas
GA6-220501096-AA1-EV04 Elaboracion Base de Datos
Aún no hay calificaciones
GA6-220501096-AA1-EV04 Elaboracion Base de Datos
9 páginas
Seguridad en Hibernate con NetBeans
Aún no hay calificaciones
Seguridad en Hibernate con NetBeans
20 páginas
Base de Datos Universidad
Aún no hay calificaciones
Base de Datos Universidad
5 páginas
Laboratorios Resueltos PL/SQL
100% (1)
Laboratorios Resueltos PL/SQL
4 páginas
014 - Técnicas de Optimización de Consultas en SQL Server
Aún no hay calificaciones
014 - Técnicas de Optimización de Consultas en SQL Server
2 páginas
Guía de Estudio
Aún no hay calificaciones
Guía de Estudio
112 páginas
Trigger (Base de Datos)
Aún no hay calificaciones
Trigger (Base de Datos)
3 páginas
Modelos Conceptual y Lógico para El Proyecto Desarrollo de Software. GA4-220501095-AA1-EV02
100% (3)
Modelos Conceptual y Lógico para El Proyecto Desarrollo de Software. GA4-220501095-AA1-EV02
31 páginas
Tarea 2 BDD
Aún no hay calificaciones
Tarea 2 BDD
8 páginas
Procedimientos Almacenados SQL
Aún no hay calificaciones
Procedimientos Almacenados SQL
6 páginas
Excel: Gestión de Bases de Datos Avanzada
100% (1)
Excel: Gestión de Bases de Datos Avanzada
31 páginas
Guía sobre la Interfaz Statement en JDBC
Aún no hay calificaciones
Guía sobre la Interfaz Statement en JDBC
10 páginas
Proyecto SQL - TRABAJO FINAL Omar Alex Puma Hirpanocca
Aún no hay calificaciones
Proyecto SQL - TRABAJO FINAL Omar Alex Puma Hirpanocca
18 páginas
Investigacion Mysql PDF
Aún no hay calificaciones
Investigacion Mysql PDF
9 páginas
Seguridad y Privilegios en SGBD
Aún no hay calificaciones
Seguridad y Privilegios en SGBD
6 páginas