0% ont trouvé ce document utile (0 vote)

528 vues50 pages

TP Hadoop

Ce document décrit les étapes pour installer et configurer un cluster Hadoop à nœud unique et multi-nœuds. Il présente également l'exécution d'un programme MapReduce sur ces clusters.

Transféré par

Mohamed

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

528 vues50 pages

TP Hadoop

Ce document décrit les étapes pour installer et configurer un cluster Hadoop à nœud unique et multi-nœuds. Il présente également l'exécution d'un programme MapReduce sur ces clusters.

Transféré par

Mohamed

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Tp Hadoop

NOM : ZIANE NOM : BERRISSOUL

PRENOM : HICHAM PRENOM : SAAD

1
Table des matières

1-Installation et configuration d'un noeud unique d'Apache Hadoop 3.3.1………………….………….….3

2-Exécution d'un programme Map/Reduce dans un cluster à nœud unique……………………….……..24

3-Configuration d'un cluster multi-noeuds d'Apache Hadoop……………………………………………….…...32

4-Exécution d'un programme Map/Reduce dans un cluster multi-nœuds……………………………..…..47

2
1) Installation et configuration d'un noeud unique d'Apache Hadoop
3.3.1 :

Etape 1 : Création d'un utilisateur hdziane

3
Etape 1-2 : Avoir les fichiers nécessaires pour le Tp

Etape 2 : Mise en place de la clé ssh

Installez le paquet nécessaire pour ssh

4
.

Mettre en place la clé ssh pour son propre compte

5
Copiez la clé publique sur le serveur localhost

Teste de la connexion à localhost

6
Etape 3 : Installation de JAVA 8

Création du répertoire /opt /java.

Extraction de l'archive

7
.

8
9
Utilisation de la commande update-alternatives pour dire au système où java et ses
exécutables sont installés et mise à jour de javac alternatives

Installation de l’éditeur de texte vim

10
.
.
.

Mise en place de manière permanente les variables d'environnement JAVA pour

tous les utilisateurs
Dans le ficher /etc/profile on effectue les changements suivants :

11
Recharger le fichier profile (en tant que root et avec
l’utilisateur hdziane)

Mise en place de manière permanente les variables d'environnement JAVA

Pour cela on édit le fichier .bashrc comme suit :

12
Test de la mise en place des variables d'environnement dans le terminal hadoop

Etape 4 : Installation d'Apache Hadoop 3.3.1

hdziane@hicham:~/Documents$ tar -zxvf hadoop-3.3.1.tar.gz
.
.
.
.
.

13
Création des répertoire de stockage de données de hadoop:

14
Etape 5 : Configuration d'Apache Hadoop 3.3.1

Mise en place des variables d'environnements

On modifie le fichier .bashrc en ajoutant les lignes suivantes à la fin du fichier comme ci-dessous

On recharge le fichier ~/.bashrc en utilisant la fonction source

15
Après on modifie la variable d’environnement JAVA_HOME dans le fichier
/usr/local/hadoop/etc/hadoop/hadoop-env.sh

Création du répertoire des fichiers temporaires de hadoop

Modification des fichiers de configuration de Hadoop

hdziane@hicham:~$ cd /usr/local/hadoop/etc/hadoop/
Après on effectue les changements suivants :

16
Dans le fichier core-site.xml :

17
Dans le fichier hdfs-site.xml:

18
Dans le fichier mapred-site.xml :

19
Dans le fichier yarn-site.xml :

Formatage du Namenode

.
.

20
.
.

Maintenant on démarre le cluster à nœud unique

21
On vérifie si tous les composants du cluster fonctionnent à l’aide de la commande
jps

Accéder aux interfaces graphiques de Hadoop via le navigateur

accéder l’interface du NameNode:

22
Accéder l’interface du ResourceManager :

23
2) Exécution d'un programme Map/Reduce dans un cluster à noeud
unique :

24
Création des répertoires code et org ainsi que l’extraction des fichiers java depuis
le fichier code_java.zip ainsi la compilation des fichiers java

On déplace les .class dans le répertoire org/hadoop/wordcount/

Génération du fichier .jar

25
.
.
.
.
.
.
.
.
.
.
.

26
hdziane@hicham:~$ cd /usr/local/hadoop/
hdziane@hicham:/usr/local/hadoop$ bin/hdfs dfs -put /home/hdziane/Documents/poeme.txt /

hdziane@hicham:/usr/local/hadoop$ bin/hdfs dfs -ls /

hdziane@hicham:~$ cd /home/hdziane/Documents/code/

27
hdziane@hicham:~/Documents/code$ hadoop jar wcount.jar org.hadoop.wordcount.WCount /poeme.txt /results

28
29
hdziane@hicham:~$:~/Documents/code$ hadoop fs -ls /results
hdziane@hicham:~$:~/Documents/code$ hadoop fs -cat /results/part-r-00000

30
En fin on arrête tous les daemons en cours d'exécution sur votre la machine virtuelle
A travers les deux scripts stop-dfs.sh et stop-yarn.sh

31
3) Configuration d'un cluster multi-noeuds d'Apache Hadoop
Ajout du nouveau hostname de la machine master

Ajout des IP fixes des différentes machines du cluster

Configuration de manière permanente l'adresse IP fixe de la machine hadoopmaster

32
Suppression des fichiers du répertoire de stockage de données créer par l'installation single node
de Hadoop

Modification des fichiers de configuration de hadoop

Modification du fichier core-site.xml

33
Modification du fichier hdfs-site.xml

Modification du fichier mapred-site.xml

34
Modification du fichier yarn-site.xml

Création du fichier masters

35
Modification du fichier workers

Clonage de la machine hadoopmaster

Modification à faire dans les machines slave1 et slave2

Configuration d'adresse IP fixe et de hostname

36
Suppression des fichiers du répertoire de stockage de données créer par l'installation
single node de Hadoop

Slave 1

Slave 2

37
Connexion entre les machines du cluster

Testez la connexion entre les machines du cluster en effectuant des pings entre les différentes
machines

38
Copiez la clé ssh pour configurer un accès ssh sans mot de passe entre les machines du cluster

hdsaad@hadoopmaster:~$ ssh-copy-id -i /home/hdsaad/.ssh/id_rsa.pub

hdsaad@slave1

39
hdsaad@hadoopmaster:~$ ssh-copy-id -i /home/hdsaad/.ssh/id_rsa.pub
hdsaad@slave2

Testez la connexion ssh entre les différentes machines du cluster

Test de la connexion du master au slave2

40
Test de la connexion du slave2 au master

Modification du fichier hdfs-site.xml de la machine virtuelle slave1 et slave2

Slave1

41
Slave2

Formatage du namenode dans hadoopmaster

42
Démarrage du cluster

start-dfs.sh et start-yarn.sh

la commande jps

Master

43
Slave1

Slave2

44
Accéder aux services de Hadoop via le navigateur

live nodes

45
L’interface du Ressource manager

46
4) Exécution d'un programme Map/Reduce dans un cluster multi-
nœuds

Vérifier le bon fonctionnement de tous les noeuds du cluster

47
Exécution du programme Map/Reduce

48
hdsaad@hadoopmaster:~/Documents/code$
hadoop jar wcount.jar org.hadoop.wordcount.WCount /poeme.txt /results

hdsaad@hadoopmaster:~/Documents/code$ hadoop fs -ls /results

49
hdsaad@hadoopmaster:~/Documents/code$ hadoop fs -cat /results/part-r-00000

arrêter tous les daemons en cours d'exécution avec stop-dfs.sh et stop-yarn.sh .

Vous aimerez peut-être aussi

TP Big Data : Hadoop et MapReduce
Pas encore d'évaluation
TP Big Data : Hadoop et MapReduce
15 pages
Installation Apache Hadoop et MapReduce
Pas encore d'évaluation
Installation Apache Hadoop et MapReduce
20 pages
TP N°1 - Installation Via Paquets
100% (1)
TP N°1 - Installation Via Paquets
6 pages
Introduction à Apache Hadoop et ses Concepts Clés
Pas encore d'évaluation
Introduction à Apache Hadoop et ses Concepts Clés
27 pages
Installation de Hadoop sur Linux
100% (1)
Installation de Hadoop sur Linux
10 pages
Apache Hadoop Installation On Ubuntu (Multi-Node Cluster) .
Pas encore d'évaluation
Apache Hadoop Installation On Ubuntu (Multi-Node Cluster) .
11 pages
Guide d'Installation Hadoop
Pas encore d'évaluation
Guide d'Installation Hadoop
13 pages
Installation et configuration de Hadoop
Pas encore d'évaluation
Installation et configuration de Hadoop
11 pages
Initiation à Hadoop et MapReduce en L2IRS
100% (1)
Initiation à Hadoop et MapReduce en L2IRS
7 pages
MapReduce avec Hadoop et Python
Pas encore d'évaluation
MapReduce avec Hadoop et Python
5 pages
Commandes Hadoop
Pas encore d'évaluation
Commandes Hadoop
10 pages
TP1 Spark
Pas encore d'évaluation
TP1 Spark
2 pages
Commandes Hadoop
Pas encore d'évaluation
Commandes Hadoop
5 pages
Initier Hadoop pour Big Data
Pas encore d'évaluation
Initier Hadoop pour Big Data
7 pages
TP2 Big Data Env Docker
Pas encore d'évaluation
TP2 Big Data Env Docker
3 pages
TP PIG Hadoop
Pas encore d'évaluation
TP PIG Hadoop
3 pages
Hadoop
Pas encore d'évaluation
Hadoop
89 pages
TP4 HBase: Manipulation et Stockage NOSQL
Pas encore d'évaluation
TP4 HBase: Manipulation et Stockage NOSQL
18 pages
TP Big Data : Compteur de Mots Hadoop
Pas encore d'évaluation
TP Big Data : Compteur de Mots Hadoop
8 pages
tp1 BigData
Pas encore d'évaluation
tp1 BigData
9 pages
Installation de Hadoop sur Ubuntu 16.04
100% (1)
Installation de Hadoop sur Ubuntu 16.04
2 pages
Introduction au Big Data et MapReduce
Pas encore d'évaluation
Introduction au Big Data et MapReduce
47 pages
TP2 Hadoop 22 23
Pas encore d'évaluation
TP2 Hadoop 22 23
3 pages
Application2 - Initiation Spark PDF
Pas encore d'évaluation
Application2 - Initiation Spark PDF
7 pages
Introduction à Hadoop et Big Data
Pas encore d'évaluation
Introduction à Hadoop et Big Data
56 pages
Cours 03 MapReduce
Pas encore d'évaluation
Cours 03 MapReduce
36 pages
HBase : Guide Pratique et Manipulation NoSQL
Pas encore d'évaluation
HBase : Guide Pratique et Manipulation NoSQL
7 pages
Tp3 - TP Sqoop
Pas encore d'évaluation
Tp3 - TP Sqoop
7 pages
TP Hadoop: MapReduce et YARN en Java
100% (1)
TP Hadoop: MapReduce et YARN en Java
5 pages
Big Data Analytics Sqoop - CDH 4.7
Pas encore d'évaluation
Big Data Analytics Sqoop - CDH 4.7
11 pages
Cours-4 - Interrogation Big Data-Hive
Pas encore d'évaluation
Cours-4 - Interrogation Big Data-Hive
8 pages
Spark et Hadoop : Architectures Big Data
Pas encore d'évaluation
Spark et Hadoop : Architectures Big Data
43 pages
HDFS MapReduce
Pas encore d'évaluation
HDFS MapReduce
3 pages
Guide pratique sur Docker pour débutants
100% (1)
Guide pratique sur Docker pour débutants
3 pages
Big Data Chap 5 - NoSQL
Pas encore d'évaluation
Big Data Chap 5 - NoSQL
36 pages
Sqoop Rapport
Pas encore d'évaluation
Sqoop Rapport
35 pages
Introduction à Hadoop et Big Data
Pas encore d'évaluation
Introduction à Hadoop et Big Data
62 pages
Tp1: Installation de L'Apache Spark: Lebutdecetp
100% (1)
Tp1: Installation de L'Apache Spark: Lebutdecetp
4 pages
Cluster Hadoop - Docker Portainee
Pas encore d'évaluation
Cluster Hadoop - Docker Portainee
33 pages
Introduction à Hadoop et MapReduce
Pas encore d'évaluation
Introduction à Hadoop et MapReduce
58 pages
TP Hadoop: Manipulation HDFS CLI & Java
Pas encore d'évaluation
TP Hadoop: Manipulation HDFS CLI & Java
3 pages
TP Bigdata ApacheSparkRDD
Pas encore d'évaluation
TP Bigdata ApacheSparkRDD
3 pages
Introduction à Spark et Scala avec Docker
Pas encore d'évaluation
Introduction à Spark et Scala avec Docker
6 pages
Installation Cloudera HDFS
Pas encore d'évaluation
Installation Cloudera HDFS
5 pages
Introduction à Hadoop et MapReduce
Pas encore d'évaluation
Introduction à Hadoop et MapReduce
58 pages
Introduction à Hadoop et MapReduce
Pas encore d'évaluation
Introduction à Hadoop et MapReduce
65 pages
Big Data Chap 2 - Principes Hadoop
Pas encore d'évaluation
Big Data Chap 2 - Principes Hadoop
51 pages
Introduction à HBase et Hadoop
Pas encore d'évaluation
Introduction à HBase et Hadoop
21 pages
Importer et exporter avec Sqoop
Pas encore d'évaluation
Importer et exporter avec Sqoop
4 pages
Introduction à MapReduce en MongoDB
100% (2)
Introduction à MapReduce en MongoDB
3 pages
QCM et exercices sur Hadoop et MapReduce
Pas encore d'évaluation
QCM et exercices sur Hadoop et MapReduce
3 pages
Initiation à Hadoop et MapReduce
100% (4)
Initiation à Hadoop et MapReduce
5 pages
Introduction au Big Data et ses enjeux
Pas encore d'évaluation
Introduction au Big Data et ses enjeux
45 pages
HDFS Boufares TP2
Pas encore d'évaluation
HDFS Boufares TP2
8 pages
Introduction à Apache Hadoop
Pas encore d'évaluation
Introduction à Apache Hadoop
38 pages
Programmation HDFS avec Eclipse
Pas encore d'évaluation
Programmation HDFS avec Eclipse
4 pages
Introduction à Apache Pig et Big Data
Pas encore d'évaluation
Introduction à Apache Pig et Big Data
32 pages
Installation de Hadoop en mode standalone
Pas encore d'évaluation
Installation de Hadoop en mode standalone
7 pages
Installer et configurer Hadoop sur Ubuntu
Pas encore d'évaluation
Installer et configurer Hadoop sur Ubuntu
11 pages
TP2 - BD
0% (1)
TP2 - BD
8 pages
Fiches Equipements Culturels Conakry
Pas encore d'évaluation
Fiches Equipements Culturels Conakry
8 pages
Chapitre 1 GRH
Pas encore d'évaluation
Chapitre 1 GRH
5 pages
Performances du Vision Transformer
Pas encore d'évaluation
Performances du Vision Transformer
35 pages
Cartouches et formats en dessin technique
Pas encore d'évaluation
Cartouches et formats en dessin technique
18 pages
Qualités Clés d'un Entrepreneur Performant
Pas encore d'évaluation
Qualités Clés d'un Entrepreneur Performant
32 pages
Resonance Parametrique Du Pendule Simple
Pas encore d'évaluation
Resonance Parametrique Du Pendule Simple
6 pages
Gestion Des Carrières
Pas encore d'évaluation
Gestion Des Carrières
4 pages
Speedtec180c 200c 215
Pas encore d'évaluation
Speedtec180c 200c 215
1 page
Floristique TP 04
Pas encore d'évaluation
Floristique TP 04
15 pages
Exercices de Linguistique
Pas encore d'évaluation
Exercices de Linguistique
2 pages
Composants Arduino et Développement
Pas encore d'évaluation
Composants Arduino et Développement
52 pages
09nu03 PR
Pas encore d'évaluation
09nu03 PR
1 page
Vulnérabilité sociale au Cameroun
Pas encore d'évaluation
Vulnérabilité sociale au Cameroun
2 pages
Formation en Couture par Apprentissage
Pas encore d'évaluation
Formation en Couture par Apprentissage
54 pages
Article Quaite Construction GTB Approche Peda 2014
Pas encore d'évaluation
Article Quaite Construction GTB Approche Peda 2014
6 pages
Solutions Minières Durables et Innovantes
Pas encore d'évaluation
Solutions Minières Durables et Innovantes
12 pages
Vente en L'état Futur D'achèvenement
Pas encore d'évaluation
Vente en L'état Futur D'achèvenement
12 pages
TD1 Geometrie Dans L Espace 4
Pas encore d'évaluation
TD1 Geometrie Dans L Espace 4
1 page
Machines Asynchrones : Principe et Types
Pas encore d'évaluation
Machines Asynchrones : Principe et Types
11 pages
Entraînement Natation: Filières Énergétiques
Pas encore d'évaluation
Entraînement Natation: Filières Énergétiques
16 pages
Corrigé Type Examen de Remplacement Etat de L'art
100% (2)
Corrigé Type Examen de Remplacement Etat de L'art
2 pages
Fiche Revision Intro Au Droit
Pas encore d'évaluation
Fiche Revision Intro Au Droit
7 pages
Comportement Ballast Voies Ferrées
100% (5)
Comportement Ballast Voies Ferrées
219 pages
Réussite et Richesse : Clés Essentielles
100% (1)
Réussite et Richesse : Clés Essentielles
3 pages
TD 4
Pas encore d'évaluation
TD 4
7 pages
Examen de Physique-Chimie 3AC 2023-2024
Pas encore d'évaluation
Examen de Physique-Chimie 3AC 2023-2024
3 pages
Examen Microcontrôleur PIC16F84A 2017
Pas encore d'évaluation
Examen Microcontrôleur PIC16F84A 2017
4 pages
Introduction aux chaînes en Python
Pas encore d'évaluation
Introduction aux chaînes en Python
34 pages
Manuel Hasp
Pas encore d'évaluation
Manuel Hasp
309 pages
Évolution Motrice et Développement Psychomoteur des Enfants
Pas encore d'évaluation
Évolution Motrice et Développement Psychomoteur des Enfants
7 pages

TP Hadoop

Transféré par

TP Hadoop

Transféré par

Tp Hadoop

NOM : ZIANE NOM : BERRISSOUL

PRENOM : HICHAM PRENOM : SAAD

1-Installation et configuration d'un noeud unique d'Apache Hadoop 3.3.1………………….………….….3

2-Exécution d'un programme Map/Reduce dans un cluster à nœud unique……………………….……..24

3-Configuration d'un cluster multi-noeuds d'Apache Hadoop……………………………………………….…...32

4-Exécution d'un programme Map/Reduce dans un cluster multi-nœuds……………………………..…..47

Etape 1 : Création d'un utilisateur hdziane

Etape 2 : Mise en place de la clé ssh

Mettre en place la clé ssh pour son propre compte

Teste de la connexion à localhost

Création du répertoire /opt /java.

Installation de l’éditeur de texte vim

Mise en place de manière permanente les variables d'environnement JAVA pour

Mise en place de manière permanente les variables d'environnement JAVA

Etape 4 : Installation d'Apache Hadoop 3.3.1

Mise en place des variables d'environnements

On recharge le fichier ~/.bashrc en utilisant la fonction source

Création du répertoire des fichiers temporaires de hadoop

Modification des fichiers de configuration de Hadoop

Maintenant on démarre le cluster à nœud unique

Accéder aux interfaces graphiques de Hadoop via le navigateur

accéder l’interface du NameNode:

On déplace les .class dans le répertoire org/hadoop/wordcount/

Génération du fichier .jar

hdziane@hicham:/usr/local/hadoop$ bin/hdfs dfs -ls /

Ajout des IP fixes des différentes machines du cluster

Configuration de manière permanente l'adresse IP fixe de la machine hadoopmaster

Modification des fichiers de configuration de hadoop

Modification du fichier core-site.xml

Modification du fichier mapred-site.xml

Création du fichier masters

Clonage de la machine hadoopmaster

Modification à faire dans les machines slave1 et slave2

*Configuration d'adresse IP fixe et de hostname*

hdsaad@hadoopmaster:~$ ssh-copy-id -i /home/hdsaad/.ssh/id_rsa.pub

Testez la connexion ssh entre les différentes machines du cluster

Test de la connexion du master au slave2

Modification du fichier hdfs-site.xml de la machine virtuelle slave1 et slave2

Formatage du namenode dans hadoopmaster

Vérifier le bon fonctionnement de tous les noeuds du cluster

hdsaad@hadoopmaster:~/Documents/code$ hadoop fs -ls /results

arrêter tous les daemons en cours d'exécution avec stop-dfs.sh et stop-yarn.sh .

Vous aimerez peut-être aussi

Configuration d'adresse IP fixe et de hostname