0% ont trouvé ce document utile (0 vote)

123 vues6 pages

TP 1 Hadoop

TP 1 HADOOP

Transféré par

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

123 vues6 pages

TP 1 Hadoop

TP 1 HADOOP

Transféré par

masrour

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Faculté des Sciences El Jadida Prof H.

EL FAIK

TP-1 HADOOP

1. Installation de Hadoop

Etape 1 : Installer le kit de développement Java

• Installer java jdk 8

sudo apt update && sudo apt install openjdk-8-jdk

• Vérifier la version java par la commande : java -version

• Installer SSH :
L'installation de SSH (Secure Shell) est essentielle pour Hadoop car elle permet une
communication sécurisée entre les nœuds du cluster Hadoop.
Cela garantit l'intégrité et la confidentialité des données et permet un traitement distribué
efficace des données dans le cluster.
sudo apt install ssh
• Créer l'utilisateur Hadoop :
Tous les composants Hadoop fonctionnera sous l'identité de l'utilisateur que vous aurez
créé pour Apache Hadoop, et cet utilisateur sera également utilisé pour se connecter à
l'interface web de Hadoop.

Exécutez la commande pour créer l'utilisateur et définir le mot de passe :

sudo adduser Hadoop

Switch user: su – Hadoop

• Configurer SSH :
Maintenant, configurez l'accès SSH sans mot de passe pour l'utilisateur Hadoop
nouvellement créé. Générez d'abord une paire de clés SSH : ssh-keygen -t rsa

• Définir les autorisations :

Copiez la clé publique générée dans le fichier de clés autorisées et définissez les
autorisations appropriées :
cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
chmod 640 ~/.ssh/authorized_keys

• SSH vers localhost

ssh localhost

Il vous sera demandé d'authentifier les hôtes en ajoutant des clés RSA aux hôtes connus.
Tapez yes et appuyez sur Enter pour authentifier l'hôte local.

1
Faculté des Sciences El Jadida Prof H. EL FAIK

• Installer Hadoop 3.3.6 par la commande :

wget https://dlcdn.apache.org/hadoop/common/hadoop-3.3.6/hadoop-3.3.6.tar.gz

Une fois le fichier téléchargé, vous pouvez le décompresser dans un dossier en utilisant la
commande :
tar -xvzf hadoop-3.3.6.tar.gz

Renommez le dossier extrait pour supprimer les informations relatives à la version. Cette
étape est facultative, mais si vous ne souhaitez pas renommer le dossier, ajustez les
chemins de configuration restants.

mv hadoop-3.3.6 hadoop

• Ouvrez le fichier « .bashrc » dans l'éditeur de texte par la commande : nano ~/.bashrc et
collez les commandes suivantes à la fin du fichier :

export JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64
export HADOOP_HOME=/home/hadoop/hadoop
export HADOOP_INSTALL=$HADOOP_HOME
export HADOOP_MAPRED_HOME=$HADOOP_HOME
export HADOOP_COMMON_HOME=$HADOOP_HOME
export HADOOP_HDFS_HOME=$HADOOP_HOME
export HADOOP_YARN_HOME=$HADOOP_HOME
export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native
export PATH=$PATH:$HADOOP_HOME/sbin:$HADOOP_HOME/bin
export HADOOP_OPTS="-Djava.library.path=$HADOOP_HOME/lib/native"

• Charger la configuration ci-dessus dans l'environnement actuel en utilisant la commande :

source ~/.bashrc

2. Configuration de l'installation de Hadoop

Etape 1 :
Après installation de Hadoop et si ce n'est pas encore fait, modifier les fichiers de
configuration suivants : hadoop-env.sh par la commande :

nano $HADOOP_HOME/etc/hadoop/hadoop-env.sh

# set to the root of your Java installation

JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64

2
Faculté des Sciences El Jadida Prof H. EL FAIK

Etape 2 :
Vous devez créer les répertoires namenode et datanode dans le répertoire personnel de l'utilisateur
Hadoop. Exécutez la commande suivante pour créer les deux répertoires :

cd hadoop/

Après èxècutèr la commandè : mkdir -p ~/hadoopdata/hdfs/{namènodè,datanodè}

Etape 3 :
Par dèfaut Hadoop èst installè èn modè StandAlonè, cè qui signifiè qu'un sèul èt uniquè
procèssus MapRèducè pèut ètrè lancè. Il faut donc modifièr lè fichièr dè configuration "corè-
sitè.xml" pour travaillèr èn modè Psèudo-Distributèd.

 Editèr lè fichièr corè-sitè.xml èt lè mèttrè a jour avèc lè nom d'hotè dè votrè systèmè :

nano $HADOOP_HOME/etc/hadoop/core-site.xml
Apportez les modifications suivantes :

<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://localhost:9000</value>
</property>
</configuration>

 Editer le fichier hdfs-site.xml :

nano $HADOOP_HOME/etc/hadoop/hdfs-site.xml

Apportez les modifications suivantes :

<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
<property>
<name>dfs.namenode.name.dir</name>
<value>file:///home/hadoop/hadoopdata/hdfs/namenode</value>
</property>
<property>
3
Faculté des Sciences El Jadida Prof H. EL FAIK

<name>dfs.datanode.data.dir</name>
<value>file:///home/hadoop/hadoopdata/hdfs/datanode</value>
</property>
</configuration>

 Editer le fichier mapred-site.xml :

nano $HADOOP_HOME/etc/hadoop/mapred-site.xml

Apportez les modifications suivantes :

<configuration>
<property>
<name>yarn.app.mapreduce.am.env</name>
<value>HADOOP_MAPRED_HOME=$HADOOP_HOME/home/hadoop/hadoop/bin/hadoop</value>
</property>
<property>
<name>mapreduce.map.env</name>
<value>HADOOP_MAPRED_HOME=$HADOOP_HOME/home/hadoop/hadoop/bin/hadoop</value>
</property>
<property>
<name>mapreduce.reduce.env</name>
<value>HADOOP_MAPRED_HOME=$HADOOP_HOME/home/hadoop/hadoop/bin/hadoop</value>
</property>
</configuration>

 Editer le fichier yarn-site.xml :

nano $HADOOP_HOME/etc/hadoop/yarn-site.xml

Apportez les modifications suivantes :

<configuration>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
</configuration>

Etape 4 :
Démarrer le cluster Hadoop :

Avant de démarrer le cluster Hadoop. Vous devrez formater le Namenode en tant qu'utilisateur
Hadoop. Exécutez la commande suivante pour formater le Namenode Hadoop :
hdfs namenode -format

4
Faculté des Sciences El Jadida Prof H. EL FAIK

Une fois que le répertoire namenode est formaté avec succès avec le système de fichiers hdfs,
vous verrez le message "Storage directory /home/hadoop/hadoopdata/hdfs/namenode has been
successfully formatted"

Démarrez ensuite le cluster Hadoop à l'aide de la commande suivante :

start-all.sh

Vous pouvez maintenant vérifier l'état de tous les services Hadoop à l'aide de la commande jps :
jps

Étape 5 :

Pour accéder au Namenode, ouvrez votre navigateur web et visitez l'URL http://localhost:9870.
Vous devriez voir l'écran suivant :

Pour accéder à Resource Manage, ouvrez votre navigateur web et visitez l'URL
http://localhost:8088. L'écran suivant devrait s'afficher :

5
Faculté des Sciences El Jadida Prof H. EL FAIK

Fin !

Vous aimerez peut-être aussi

Installer et configurer Hadoop sur Ubuntu
Pas encore d'évaluation
Installer et configurer Hadoop sur Ubuntu
11 pages
Hadoop 3.3.6 On Ubuntu 22.04 LTS 1
Pas encore d'évaluation
Hadoop 3.3.6 On Ubuntu 22.04 LTS 1
13 pages
Installation et Configuration de Hadoop
Pas encore d'évaluation
Installation et Configuration de Hadoop
17 pages
TP Hadoop
Pas encore d'évaluation
TP Hadoop
50 pages
Installation de Hadoop en mode standalone
Pas encore d'évaluation
Installation de Hadoop en mode standalone
7 pages
Procedure D'installation de Hadoop
Pas encore d'évaluation
Procedure D'installation de Hadoop
13 pages
Installation de Hadoop sur Ubuntu 18.04
100% (1)
Installation de Hadoop sur Ubuntu 18.04
13 pages
Jour1 Configuration Hadoop (4th Copy)
Pas encore d'évaluation
Jour1 Configuration Hadoop (4th Copy)
9 pages
TP2 - BD
0% (1)
TP2 - BD
8 pages
Installation et Configuration de Hadoop
Pas encore d'évaluation
Installation et Configuration de Hadoop
9 pages
Installation de Hadoop sur Linux
100% (1)
Installation de Hadoop sur Linux
10 pages
Guide d'Installation Hadoop sous Linux
Pas encore d'évaluation
Guide d'Installation Hadoop sous Linux
17 pages
TP N°1 - Installation Via Paquets
100% (1)
TP N°1 - Installation Via Paquets
6 pages
Installation de Hadoop sur Ubuntu 14.10
Pas encore d'évaluation
Installation de Hadoop sur Ubuntu 14.10
10 pages
Installation de Hadoop sur Linux
Pas encore d'évaluation
Installation de Hadoop sur Linux
7 pages
Tp1 Big Data
Pas encore d'évaluation
Tp1 Big Data
10 pages
Hadoop Install
Pas encore d'évaluation
Hadoop Install
6 pages
TP 2 Procéduredinstallation de Hadoop 240927 201419
Pas encore d'évaluation
TP 2 Procéduredinstallation de Hadoop 240927 201419
14 pages
Installer Hadoop sur Debian en 5 étapes
Pas encore d'évaluation
Installer Hadoop sur Debian en 5 étapes
16 pages
Atelier3.1-KafkaLocal Said Ali Abdi
Pas encore d'évaluation
Atelier3.1-KafkaLocal Said Ali Abdi
12 pages
Installation et configuration de Hadoop
Pas encore d'évaluation
Installation et configuration de Hadoop
11 pages
Installation Hadoop 2 sur Ubuntu 16.04
Pas encore d'évaluation
Installation Hadoop 2 sur Ubuntu 16.04
13 pages
Guide d'installation Hadoop sur Linux
Pas encore d'évaluation
Guide d'installation Hadoop sur Linux
5 pages
Installation de Hadoop et Spark sur Windows
Pas encore d'évaluation
Installation de Hadoop et Spark sur Windows
5 pages
Guide d'installation Hadoop et HBase
Pas encore d'évaluation
Guide d'installation Hadoop et HBase
16 pages
Atelier 2 Big Data
Pas encore d'évaluation
Atelier 2 Big Data
14 pages
Lecture2 Bis
Pas encore d'évaluation
Lecture2 Bis
41 pages
Atelier Big Data : Traitement Batch avec Hadoop
Pas encore d'évaluation
Atelier Big Data : Traitement Batch avec Hadoop
11 pages
Chapitre - 5 Big Data
Pas encore d'évaluation
Chapitre - 5 Big Data
25 pages
TP Big Data : Hadoop et MapReduce
Pas encore d'évaluation
TP Big Data : Hadoop et MapReduce
15 pages
Installation et Configuration de Hadoop
Pas encore d'évaluation
Installation et Configuration de Hadoop
7 pages
Projet Big Data
Pas encore d'évaluation
Projet Big Data
19 pages
TP 1 Hadoop
Pas encore d'évaluation
TP 1 Hadoop
16 pages
Rapport de Projet Big Data
Pas encore d'évaluation
Rapport de Projet Big Data
25 pages
Installation de Hadoop sur Ubuntu
Pas encore d'évaluation
Installation de Hadoop sur Ubuntu
11 pages
Big Data tp1
Pas encore d'évaluation
Big Data tp1
6 pages
Guide d'Installation Hadoop
Pas encore d'évaluation
Guide d'Installation Hadoop
13 pages
Atelier 3 1
Pas encore d'évaluation
Atelier 3 1
20 pages
Installation de Hadoop sur Ubuntu 16.04
Pas encore d'évaluation
Installation de Hadoop sur Ubuntu 16.04
11 pages
Manipulation Shell Hadoop avec Docker
Pas encore d'évaluation
Manipulation Shell Hadoop avec Docker
6 pages
Apache Hadoop Installation On Ubuntu (Multi-Node Cluster) .
Pas encore d'évaluation
Apache Hadoop Installation On Ubuntu (Multi-Node Cluster) .
11 pages
Guide Complet Recommandation Hadoop
Pas encore d'évaluation
Guide Complet Recommandation Hadoop
40 pages
Initier Hadoop pour Big Data
Pas encore d'évaluation
Initier Hadoop pour Big Data
7 pages
Atelier - 3.1 (Apache Hadoop - UNIX - Distributed)
Pas encore d'évaluation
Atelier - 3.1 (Apache Hadoop - UNIX - Distributed)
29 pages
Installation et Configuration de Sqoop
Pas encore d'évaluation
Installation et Configuration de Sqoop
8 pages
Installation Hadoop
Pas encore d'évaluation
Installation Hadoop
22 pages
Atelier3-KafkaLocal Said Ali Abdi
Pas encore d'évaluation
Atelier3-KafkaLocal Said Ali Abdi
24 pages
Introduction à Hadoop et MapReduce
Pas encore d'évaluation
Introduction à Hadoop et MapReduce
10 pages
Introduction à Apache Hadoop et ses Concepts Clés
Pas encore d'évaluation
Introduction à Apache Hadoop et ses Concepts Clés
27 pages
Le Cluster Hadoop
Pas encore d'évaluation
Le Cluster Hadoop
8 pages
TP1 Installation de Hadoop Sous WSL
Pas encore d'évaluation
TP1 Installation de Hadoop Sous WSL
3 pages
Installation de Hadoop sur Windows
Pas encore d'évaluation
Installation de Hadoop sur Windows
18 pages
Guide d'installation de Hadoop et Docker
Pas encore d'évaluation
Guide d'installation de Hadoop et Docker
83 pages
Mickaelbaron-Hadoopinstallation Part2
Pas encore d'évaluation
Mickaelbaron-Hadoopinstallation Part2
2 pages
Mickaelbaron-Hadoopinstallation Part3
Pas encore d'évaluation
Mickaelbaron-Hadoopinstallation Part3
2 pages
TP1: Installation D'un Cluster Hadoop Avec Docker
Pas encore d'évaluation
TP1: Installation D'un Cluster Hadoop Avec Docker
4 pages
Installation Apache Hadoop et MapReduce
Pas encore d'évaluation
Installation Apache Hadoop et MapReduce
20 pages
Big Data Analytics
Pas encore d'évaluation
Big Data Analytics
31 pages
jv16 HTML
Pas encore d'évaluation
jv16 HTML
9 pages
Cours Vuejs Bases
Pas encore d'évaluation
Cours Vuejs Bases
3 pages
Exposé Sur Android
Pas encore d'évaluation
Exposé Sur Android
9 pages
Voies d'exécution et procédures simplifiées
Pas encore d'évaluation
Voies d'exécution et procédures simplifiées
37 pages
Liste Logiciels-VF2024-2025 by Raouf
Pas encore d'évaluation
Liste Logiciels-VF2024-2025 by Raouf
2 pages
Terminologie et modèles des réseaux informatiques
Pas encore d'évaluation
Terminologie et modèles des réseaux informatiques
4 pages
Ansibleuvrage
Pas encore d'évaluation
Ansibleuvrage
159 pages
Penetration Test reportLessHacking1
Pas encore d'évaluation
Penetration Test reportLessHacking1
13 pages
Module 2 - HTML (
Pas encore d'évaluation
Module 2 - HTML (
19 pages
Programmation Web 2 Seances1-2
Pas encore d'évaluation
Programmation Web 2 Seances1-2
110 pages
Eyrolles Tailwind CSS
Pas encore d'évaluation
Eyrolles Tailwind CSS
120 pages
Developpement Mobile Android Kotlin Presentation
Pas encore d'évaluation
Developpement Mobile Android Kotlin Presentation
24 pages
CV Myriam Chine
Pas encore d'évaluation
CV Myriam Chine
1 page
Protocoles Réseau Essentiels
Pas encore d'évaluation
Protocoles Réseau Essentiels
2 pages
Réseaux Organisés Autour de Serveurs
Pas encore d'évaluation
Réseaux Organisés Autour de Serveurs
4 pages
Alternatives à Adobe Acrobat PDF
Pas encore d'évaluation
Alternatives à Adobe Acrobat PDF
1 page
Cours Java FX
100% (1)
Cours Java FX
126 pages
Guide Bootstrap pour Sites Web Statics
Pas encore d'évaluation
Guide Bootstrap pour Sites Web Statics
105 pages
Rapport de Stage
Pas encore d'évaluation
Rapport de Stage
25 pages
Outils de gestion de versions : Git et GitLab
Pas encore d'évaluation
Outils de gestion de versions : Git et GitLab
5 pages
Rapport de Pfe 2021/2022 - Yesssssssssssss
Pas encore d'évaluation
Rapport de Pfe 2021/2022 - Yesssssssssssss
35 pages
Labo 3
Pas encore d'évaluation
Labo 3
12 pages
TP HTML S4
Pas encore d'évaluation
TP HTML S4
11 pages
Pfe 1
Pas encore d'évaluation
Pfe 1
27 pages
Mon Memoire
Pas encore d'évaluation
Mon Memoire
45 pages
Corr Exam
Pas encore d'évaluation
Corr Exam
7 pages
TP 5
Pas encore d'évaluation
TP 5
8 pages
Créer un site web avec WordPress
Pas encore d'évaluation
Créer un site web avec WordPress
52 pages
Usages de base d'OpenSSL en sécurité
Pas encore d'évaluation
Usages de base d'OpenSSL en sécurité
2 pages
Chapitre 1 Les Objets JavaScript
100% (1)
Chapitre 1 Les Objets JavaScript
9 pages