0% encontró este documento útil (0 votos)

84 vistas4 páginas

Introducción a Apache Sqoop en Hadoop

Sqoop es una herramienta diseñada para transferir datos entre Hadoop y servidores de bases de datos relacionales como MySQL y Oracle. Sqoop importa datos de bases de datos relacionales a HDFS y exporta datos desde HDFS a bases de datos relacionales. Se utiliza para mover grandes cantidades de datos entre sistemas de almacenamiento relacional y no relacional.

Cargado por

jhonny ps

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

84 vistas4 páginas

Introducción a Apache Sqoop en Hadoop

Cargado por

jhonny ps

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

Sqoop - Introduction

El sistema de gestión de aplicaciones tradicional, es decir, la interacción de aplicaciones

con base de datos relacional utilizando RDBMS, es una de las fuentes que generan datos
grandes. Tales datos grandes, generados por RDBMS, se almacenan en servidores de
base de datos relacional en la estructura de base de datos relacional.

Cuando los almacenes Big Data y los analizadores como MapReduce, Hive, HBase,
Cassandra, Pig, etc. del ecosistema Hadoop entraron en imagen, requirieron una
herramienta para interactuar con los servidores de bases de datos relacionales para
importar y exportar los Grandes Datos que residen en ellos. Aquí, Sqoop ocupa un lugar
en el ecosistema de Hadoop para proporcionar una interacción factible entre el servidor
de base de datos relacional y HDFS de Hadoop.

Sqoop: "SQL a Hadoop y Hadoop a SQL"

Sqoop es una herramienta diseñada para transferir datos entre Hadoop y servidores de
bases de datos relacionales. Se utiliza para importar datos de bases de datos relacionales
como MySQL, Oracle a Hadoop HDFS y exportar desde el sistema de archivos Hadoop
a bases de datos relacionales. Es proporcionado por Apache Software Foundation.

¿Cómo funciona Sqoop?

La siguiente imagen describe el flujo de trabajo de Sqoop.

Sqoop Import: La herramienta de importación importa tablas individuales de RDBMS a

HDFS. Cada fila de una tabla se trata como un registro en HDFS. Todos los registros se
almacenan como datos de texto en archivos de texto o como datos binarios en archivos
Avro y Secuencia.
Sqoop Export: La herramienta de exportación exporta un conjunto de archivos de HDFS
a un RDBMS. Los archivos dados como entrada a Sqoop contienen registros, que se
llaman como filas en la tabla. Éstos se leen y analizan en un conjunto de registros y se
delimitan con el delimitador especificado por el usuario.
Como Sqoop es un subproyecto de Hadoop, sólo puede funcionar en el sistema
operativo Linux. Siga los pasos que se indican a continuación para instalar Sqoop en su
sistema.

Paso 1: Verificación de la instalación de JAVA

Necesitas tener Java instalado en tu sistema antes de instalar Sqoop. Vamos a verificar
la instalación de Java con el siguiente comando:

$ java –version

Si Java ya está instalado en su sistema, puede ver la siguiente respuesta:

java version "1.7.0_71"

Java(TM) SE Runtime Environment (build 1.7.0_71-b13)
Java HotSpot(TM) Client VM (build 25.0-b02, mixed mode)

Si Java no está instalado en su sistema, siga los pasos que se indican a continuación.

Instalación de Java Siga los sencillos pasos que se indican a continuación para instalar Java en
su sistema.

Paso 1
A continuación, se descargará jdk-7u71-linux-x64.tar.gz en su sistema.

Paso 2

Generalmente, puede encontrar el archivo Java descargado en la carpeta Descargas.

Compruébelo y extraiga el archivo jdk-7u71-linux-x64.gz utilizando los siguientes
comandos.

$ cd Downloads/
$ ls
jdk-7u71-linux-x64.gz
$ tar zxf jdk-7u71-linux-x64.gz
$ ls
jdk1.7.0_71 jdk-7u71-linux-x64.gz
Step 3

Para poner Java a disposición de todos los usuarios, debes moverlo a la ubicación "/
usr / local /". Abra raíz y escriba los siguientes comandos.

$ su
password:

# mv jdk1.7.0_71 /usr/local/java
# exitStep IV:
Step 4

Para configurar las variables PATH y JAVA_HOME, agregue los siguientes comandos
al archivo ~ / .bashrc.

export JAVA_HOME=/usr/local/java
export PATH=$PATH:$JAVA_HOME/bin

A continuación, aplique todos los cambios en el sistema en ejecución actual.

$ source ~/.bashrc
Step 5

Utilice los siguientes comandos para configurar alternativas de Java:

# alternatives --install /usr/bin/java java usr/local/java/bin/java 2

# alternatives --install /usr/bin/javac javac usr/local/java/bin/javac
2
# alternatives --install /usr/bin/jar jar usr/local/java/bin/jar 2

# alternatives --set java usr/local/java/bin/java

# alternatives --set javac usr/local/java/bin/javac
# alternatives --set jar usr/local/java/bin/jar

Ahora verifique la instalación usando el comando java -version desde el terminal como
se explicó anteriormente.

Step 2: Verificación de la instalación de Hadoop

Hadoop debe instalarse en su sistema antes de instalar Sqoop. Vamos a verificar la
instalación de Hadoop utilizando el siguiente comando:

$ hadoop version

Si Hadoop ya está instalado en su sistema, obtendrá la siguiente respuesta:

Hadoop 2.4.1
--
Subversion https://svn.apache.org/repos/asf/hadoop/common -r 1529768
Compiled by hortonmu on 2013-10-07T06:28Z
Compiled with protoc 2.5.0
From source with checksum 79e53ce7994d1628b240f09af91e1af4

Si Hadoop no está instalado en su sistema, proceda con los siguientes pasos:

Descargando HadoopDownload y extraiga Hadoop 2.4.1 de Apache Software Foundation

usando los siguientes comandos.
$ su
password:

# cd /usr/local
# wget http://apache.claz.org/hadoop/common/hadoop-2.4.1/
hadoop-2.4.1.tar.gz
# tar xzf hadoop-2.4.1.tar.gz
# mv hadoop-2.4.1/* to hadoop/
# exit

También podría gustarte

Guía de Instalación y Uso de Hadoop
Aún no hay calificaciones
Guía de Instalación y Uso de Hadoop
18 páginas
Guía de Sqoop para Bases de Datos
Aún no hay calificaciones
Guía de Sqoop para Bases de Datos
8 páginas
Hadoop Taller PDF
Aún no hay calificaciones
Hadoop Taller PDF
48 páginas
Guía de Instalación de Hadoop en Debian
Aún no hay calificaciones
Guía de Instalación de Hadoop en Debian
4 páginas
Configuración de JAVA_HOME en Hadoop
Aún no hay calificaciones
Configuración de JAVA_HOME en Hadoop
11 páginas
Instalación de Spatial
Aún no hay calificaciones
Instalación de Spatial
52 páginas
Integración de Sqoop con Cloudera
Aún no hay calificaciones
Integración de Sqoop con Cloudera
9 páginas
Introduccion Hadoop
Aún no hay calificaciones
Introduccion Hadoop
44 páginas
Ecosistema Hadoop: Guía Completa
Aún no hay calificaciones
Ecosistema Hadoop: Guía Completa
22 páginas
Introducción a Big Data con Hadoop
Aún no hay calificaciones
Introducción a Big Data con Hadoop
36 páginas
Installing Hadoop
Aún no hay calificaciones
Installing Hadoop
14 páginas
Big Data Fundamentals - Ma Afq6e2s
Aún no hay calificaciones
Big Data Fundamentals - Ma Afq6e2s
6 páginas
Apache Hadoop
0% (1)
Apache Hadoop
14 páginas
Actividad 2 - Nicole Castro
Aún no hay calificaciones
Actividad 2 - Nicole Castro
16 páginas
Hadoop: Clave en Big Data y Análisis
Aún no hay calificaciones
Hadoop: Clave en Big Data y Análisis
39 páginas
Instalacion Hadoop Centos 7
Aún no hay calificaciones
Instalacion Hadoop Centos 7
7 páginas
Ecosistema Hadoop: Guía Completa 2019
0% (1)
Ecosistema Hadoop: Guía Completa 2019
22 páginas
Introducción a Hadoop y Big Data
Aún no hay calificaciones
Introducción a Hadoop y Big Data
13 páginas
Guía de comandos para Apache Sqoop
Aún no hay calificaciones
Guía de comandos para Apache Sqoop
10 páginas
Tutorial Hadoop
Aún no hay calificaciones
Tutorial Hadoop
40 páginas
1.2.1 Ecosistema Hadoop
Aún no hay calificaciones
1.2.1 Ecosistema Hadoop
33 páginas
Taller de Sqoop: Ingesta de Datos en Hadoop
Aún no hay calificaciones
Taller de Sqoop: Ingesta de Datos en Hadoop
18 páginas
Mineria de Datos - DataWarehouse Sesion 3
Aún no hay calificaciones
Mineria de Datos - DataWarehouse Sesion 3
43 páginas
Introducción a Apache Sqoop
Aún no hay calificaciones
Introducción a Apache Sqoop
12 páginas
Instalación y Configuración de Hadoop
Aún no hay calificaciones
Instalación y Configuración de Hadoop
9 páginas
Clase 3 Creacion VM - Instalacion Hadoop
Aún no hay calificaciones
Clase 3 Creacion VM - Instalacion Hadoop
52 páginas
Big Data: Procesamiento con Hadoop
Aún no hay calificaciones
Big Data: Procesamiento con Hadoop
66 páginas
Hadoop
Aún no hay calificaciones
Hadoop
36 páginas
Investigacion
Aún no hay calificaciones
Investigacion
7 páginas
(14-1) Topicos en Base de Datos - Clase
Aún no hay calificaciones
(14-1) Topicos en Base de Datos - Clase
24 páginas
Laboratorio 02 - Ingestas en HDFS y Ejercicios HIVE
Aún no hay calificaciones
Laboratorio 02 - Ingestas en HDFS y Ejercicios HIVE
29 páginas
Guía de Instalación de HBase
Aún no hay calificaciones
Guía de Instalación de HBase
11 páginas
Manual de Instalación y Configuración Hadoop
Aún no hay calificaciones
Manual de Instalación y Configuración Hadoop
13 páginas
Instalacion Hadoop
Aún no hay calificaciones
Instalacion Hadoop
10 páginas
Introducción a Hadoop y su Ecosistema
Aún no hay calificaciones
Introducción a Hadoop y su Ecosistema
18 páginas
TallerUnidad3 BigData
Aún no hay calificaciones
TallerUnidad3 BigData
14 páginas
Spark para Dummies
Aún no hay calificaciones
Spark para Dummies
6 páginas
Introducción a Apache Hadoop
Aún no hay calificaciones
Introducción a Apache Hadoop
1 página
Instalacion Hadoop Maquina Virtual Version VERSION - 1 - 0
Aún no hay calificaciones
Instalacion Hadoop Maquina Virtual Version VERSION - 1 - 0
13 páginas
Instalación y Uso de HDFS en Hadoop
Aún no hay calificaciones
Instalación y Uso de HDFS en Hadoop
4 páginas
Investigación sobre Hadoop en Zacatepec
Aún no hay calificaciones
Investigación sobre Hadoop en Zacatepec
6 páginas
Guía Completa de Hadoop y MapReduce
Aún no hay calificaciones
Guía Completa de Hadoop y MapReduce
31 páginas
S203. Sqoop
Aún no hay calificaciones
S203. Sqoop
21 páginas
Curso Big Data (Tema 1)
Aún no hay calificaciones
Curso Big Data (Tema 1)
32 páginas
Instructivo de Instalación
Aún no hay calificaciones
Instructivo de Instalación
39 páginas
Instalación de R y Hadoop en Linux
Aún no hay calificaciones
Instalación de R y Hadoop en Linux
10 páginas
Batch Processing PDF
Aún no hay calificaciones
Batch Processing PDF
49 páginas
M4 U1 Ecosistema Hadoop
Aún no hay calificaciones
M4 U1 Ecosistema Hadoop
29 páginas
Introducción al Ecosistema Hadoop
Aún no hay calificaciones
Introducción al Ecosistema Hadoop
14 páginas
Laboratorio GCP: Exploración de Datos Telco
Aún no hay calificaciones
Laboratorio GCP: Exploración de Datos Telco
16 páginas
03 Ecosistema Hadoop
Aún no hay calificaciones
03 Ecosistema Hadoop
35 páginas
Ecosistema Hadoop
Aún no hay calificaciones
Ecosistema Hadoop
38 páginas
Procesamiento Distribuido con Hadoop
Aún no hay calificaciones
Procesamiento Distribuido con Hadoop
27 páginas
Instalación de DBs NoSQL Clave-Valor
Aún no hay calificaciones
Instalación de DBs NoSQL Clave-Valor
27 páginas
Introduccion A Hadoop UV ES
Aún no hay calificaciones
Introduccion A Hadoop UV ES
61 páginas
Instructivo Clúster Hadoop
Aún no hay calificaciones
Instructivo Clúster Hadoop
55 páginas
Lectura Sesión de Aprendizaje N°02 Unidad 08
Aún no hay calificaciones
Lectura Sesión de Aprendizaje N°02 Unidad 08
5 páginas
Vivienda Social Sostenible en Bambú
Aún no hay calificaciones
Vivienda Social Sostenible en Bambú
20 páginas
Manual de RD Words.
Aún no hay calificaciones
Manual de RD Words.
88 páginas
Informe Intermedio Cesim Challenge
Aún no hay calificaciones
Informe Intermedio Cesim Challenge
24 páginas
Reiteración PDF
0% (1)
Reiteración PDF
9 páginas
Ensayo de Grupo N°08
Aún no hay calificaciones
Ensayo de Grupo N°08
24 páginas
La Primera Discusión Celestial
Aún no hay calificaciones
La Primera Discusión Celestial
3 páginas
Biografia de Joana Marcus
Aún no hay calificaciones
Biografia de Joana Marcus
4 páginas
Curso Básico Poliformas
100% (1)
Curso Básico Poliformas
4 páginas
Plan de Prácticas en Enfermería Pediátrica
Aún no hay calificaciones
Plan de Prácticas en Enfermería Pediátrica
36 páginas
Sesion Comunicacion-Reconocemos El Articulo en Un Texto
Aún no hay calificaciones
Sesion Comunicacion-Reconocemos El Articulo en Un Texto
6 páginas
Lootings: Recurrent Episodes of The Argentine Society, Period 1930-2013
Aún no hay calificaciones
Lootings: Recurrent Episodes of The Argentine Society, Period 1930-2013
18 páginas
ARTRITIS
Aún no hay calificaciones
ARTRITIS
4 páginas
Posmodernismo en Europa
Aún no hay calificaciones
Posmodernismo en Europa
8 páginas
Plan de Gestión de Riesgos en SPS
Aún no hay calificaciones
Plan de Gestión de Riesgos en SPS
200 páginas
S12 Ficha de Trabajo 1 League of Legends
Aún no hay calificaciones
S12 Ficha de Trabajo 1 League of Legends
7 páginas
Impacto del Automóvil en la Comunidad
Aún no hay calificaciones
Impacto del Automóvil en la Comunidad
3 páginas
Tarea 3 Derecho Inmobiliario
Aún no hay calificaciones
Tarea 3 Derecho Inmobiliario
5 páginas
Balotario de Preguntas - Geometría - Pre
Aún no hay calificaciones
Balotario de Preguntas - Geometría - Pre
4 páginas
Culturas Antiguas - Tomo 1
Aún no hay calificaciones
Culturas Antiguas - Tomo 1
26 páginas
Sistema de Clasificación APG III
100% (1)
Sistema de Clasificación APG III
39 páginas
Reforma del Reglamento Ambiental 754
Aún no hay calificaciones
Reforma del Reglamento Ambiental 754
30 páginas
Fundamentos de Las TIC
Aún no hay calificaciones
Fundamentos de Las TIC
12 páginas
TCC y Lesión del Hemisferio Derecho
100% (1)
TCC y Lesión del Hemisferio Derecho
41 páginas
Syllabus Simulacion Curso I
Aún no hay calificaciones
Syllabus Simulacion Curso I
9 páginas
Desempleo y AI en Colombia: Análisis Estudiantil
Aún no hay calificaciones
Desempleo y AI en Colombia: Análisis Estudiantil
1 página
Talleres
50% (2)
Talleres
32 páginas
Simulación: Lenguajes y Simuladores
Aún no hay calificaciones
Simulación: Lenguajes y Simuladores
4 páginas
Problemas de Parabólico 2
Aún no hay calificaciones
Problemas de Parabólico 2
2 páginas
Bloques Logicos
Aún no hay calificaciones
Bloques Logicos
12 páginas