0% ont trouvé ce document utile (0 vote)

323 vues13 pages

Guide d'Installation Hadoop

Ce document décrit les étapes pour installer et configurer Apache Hadoop sur une machine Windows. Il explique comment télécharger et installer Java et Hadoop, configurer les variables d'environnement, modifier les fichiers de configuration d'Hadoop et tester l'installation.

Transféré par

mohcinechekkour

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats DOCX, PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

323 vues13 pages

Guide d'Installation Hadoop

Transféré par

mohcinechekkour

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats DOCX, PDF, TXT ou lisez en ligne sur Scribd

TP 1

Installation et configuration d’Apache Hadoop

Objectif :

Afin de réaliser ce TP on doit suivre les étapes suivantes :

Etape 1 (téléchargement et installation)

 Télécharger et installer java

 Télécharger et installer hadoop

Etape 2 (paramétrage des variables d’environnement)

 Java_Home
 Hadoop_Home

Etape 3 (configuration d’Hadoop)

 Modifier 5 fichiers
 Copier le fichier winutils

Etape 4 (Tester Hadoop)

 Tester les commandes de démarrage

 Tester les commandes d’arrêt

I. Etape 1 (téléchargement et installation)

Hadoop

Pour télécharger Hadoop visitez le site web mentionné sur la figure et cliquer sur download

Vous pouvez remarquer un dossier compresser est encours de téléchargement

Extraire le dossier dans C et nommé le Hadoop comme suit

1
Télécharger sur google un dossier nommée winutils Hadoop 2.6

Cliquer sur le deuxième lien

Le téléchargement sera lancé

Java

Pour télécharger java il faut vérifier tout d’abord qu’il n’existe plus dans votre machine pour ce faire
démarrer l’invite de commande (cmd) comme suit :

En tapant sur la barre de recherche cmd et en cliquant avec le bouton droit sur Exécuter en tant
qu’Administrateur

Une nouvelle fenêtre qui s’affiche devant vous :

2
Tapez la commande java -version

Vous pouvez remarquer que java n’est pas reconnu

Maintenant on doit télécharger java

Visitez le site web suivant :

Lancer le téléchargement en cliquant sur ce bouton

Après cliquer donwload

Il vous demande de créer un compte

Remplir les champs nécessaires

3
Valider le compte et lancer le téléchargement

Lancer l’installation de java

Cliquer sur change pour changer l’emplacement d’enregistrement

Modifier le comme suit

La même chose ici vous devez changer l’emplacement de l’installation de dossier jre comme suit

4
Créer un nouveau dossier et nommée le jre1.8.0_202

Suivant –suivant--- et close

Vérifier maintenant que l’installation de java est bien réussie

II. Etape 2 (paramétrage des variables d’environnement)

On passera à la configuration d'une variable d'environnement

Pour Java

Tapez variables dans la barre de recherche

5
Cliquer sur variables d’environnement puis sur nouvelle

Ajouter le nom de la variable et le chemin comme la figure

Cliquer sur path puis modifier

6
Ajouter deux le chemin vers les bin de jdk

Pour Hadoop

Refaire la même chose pour Hadoop

Dans les variables d’environnement ajouter un chemin pour Hadoop

Modifier le path et ajouter un chemin vers le bin et sbin

7
Etape 3 (configuration d’Hadoop)

copier le contenu du dossier winutils Hadoop 2.6

Coller le dans Hadoop\bin comme suit

Entrer dans le chemin suivant

C:\hadoop\etc\hadoop

On doit éditer et modifier 5 fichiers :

Core [Link]

Apporter les modifications suivantes

Le deuxième fichier est hdfs [Link]

Apporter les modifications suivantes

8
Le 3ème fichier est yarn [Link]

Apporter les modifications suivantes

Le 4ème fichier est yarn [Link]

Apporter les modifications suivantes

Le 5ème fichier est hadoop-env

Apporter les modifications suivantes

9
Etape 4 (Tester Hadoop)

Avant de commencer vérifier que Hadoop a été bien installer pour ce faire taper la commende
Hadoop –version

On va lancer la commande de formatage hdfs namenode -format

On peut remarquer la création du dossier namenode

Dans le namenode on peut trouver les deux fichier fsimage et edits

On peut démarrer le namenode et le datanode avec la commande start-dfs

10
On peut remarquer le démarrage de deux fenêtres namenode et datanode

On peut remarquer la création du dossier datanode

Dans le dataenode on trouve un fichier version qui vient du namenode

Démarrer maintenant yarn

Avec la commande start-yarn

et on peut remarquer l’exécution du nodemanager et resourcemanager

11
Vérifier le démarrage des ressources de notre cluster avec la commande jps

Exécuter maintenant la commande stop-dfs

On remarque que deux fenêtres qui sont fermé le namenode et le datanode

Exécuter la commande stop-yarn

On remarque que deux fenêtres qui sont fermé le resourcemanager et le datamanager

Avec la commande start-all vous pouvez démarrer tous les composants

On peut voir maintenant le web en tapant [Link]

C’est lien vers resourcemanager dans lequel on trouve toute les tache programmé

Avec le deuxième lien on peut voir des informations sur le cluster et datanode

12
Dans les utilities – browse the file system on va créer des fichier et des base de données

Finalement

Avec la commande stop-all vous pouvez fermer tous les composants

Vous aimerez peut-être aussi

Initier Hadoop pour Big Data
Pas encore d'évaluation
Initier Hadoop pour Big Data
7 pages
Installation de Hadoop sur Linux
100% (1)
Installation de Hadoop sur Linux
10 pages
Introduction à Apache Hadoop et ses Concepts Clés
Pas encore d'évaluation
Introduction à Apache Hadoop et ses Concepts Clés
27 pages
TP1 Polytech
Pas encore d'évaluation
TP1 Polytech
11 pages
TP Hadoop
Pas encore d'évaluation
TP Hadoop
50 pages
TP Big Data : Hadoop et MapReduce
Pas encore d'évaluation
TP Big Data : Hadoop et MapReduce
15 pages
TP N°1 - Installation Via Paquets
100% (1)
TP N°1 - Installation Via Paquets
6 pages
TP Big Data : Compteur de Mots Hadoop
Pas encore d'évaluation
TP Big Data : Compteur de Mots Hadoop
8 pages
Commandes Hadoop
Pas encore d'évaluation
Commandes Hadoop
5 pages
tp1 IRS
100% (1)
tp1 IRS
7 pages
Installation Apache Hadoop et MapReduce
Pas encore d'évaluation
Installation Apache Hadoop et MapReduce
20 pages
TP2 Big Data Env Docker
Pas encore d'évaluation
TP2 Big Data Env Docker
3 pages
TP2 Hadoop 22 23
Pas encore d'évaluation
TP2 Hadoop 22 23
3 pages
Traitement Du Big Data: TP3 Le Modèle de Programmation Map Reduce
Pas encore d'évaluation
Traitement Du Big Data: TP3 Le Modèle de Programmation Map Reduce
25 pages
Tp1: Installation de L'Apache Spark: Lebutdecetp
100% (1)
Tp1: Installation de L'Apache Spark: Lebutdecetp
4 pages
Chapitre 2
Pas encore d'évaluation
Chapitre 2
32 pages
Importer et exporter avec Sqoop
Pas encore d'évaluation
Importer et exporter avec Sqoop
4 pages
TP1 Spark
Pas encore d'évaluation
TP1 Spark
2 pages
TP MapReduce Python
Pas encore d'évaluation
TP MapReduce Python
5 pages
TP Bigdata ApacheSparkRDD
Pas encore d'évaluation
TP Bigdata ApacheSparkRDD
3 pages
Cours 3 Architecture - Big Data Map Reduce
Pas encore d'évaluation
Cours 3 Architecture - Big Data Map Reduce
59 pages
Installation Cloudera HDFS
Pas encore d'évaluation
Installation Cloudera HDFS
5 pages
HDFS Boufares TP2
Pas encore d'évaluation
HDFS Boufares TP2
8 pages
TP PIG Hadoop
Pas encore d'évaluation
TP PIG Hadoop
3 pages
Introduction au Big Data et MapReduce
Pas encore d'évaluation
Introduction au Big Data et MapReduce
47 pages
TP3 Big Data : Manipulations Cloudera
100% (1)
TP3 Big Data : Manipulations Cloudera
6 pages
HDFS MapReduce
Pas encore d'évaluation
HDFS MapReduce
3 pages
CH 2 Hadoop
Pas encore d'évaluation
CH 2 Hadoop
56 pages
Introduction à Spark et Scala avec Docker
Pas encore d'évaluation
Introduction à Spark et Scala avec Docker
6 pages
Programmation HDFS avec Eclipse
Pas encore d'évaluation
Programmation HDFS avec Eclipse
4 pages
Application2 - Initiation Spark PDF
Pas encore d'évaluation
Application2 - Initiation Spark PDF
7 pages
Introduction à Hadoop et MapReduce
Pas encore d'évaluation
Introduction à Hadoop et MapReduce
65 pages
TP Hadoop: Manipulation HDFS CLI & Java
Pas encore d'évaluation
TP Hadoop: Manipulation HDFS CLI & Java
3 pages
Big Data Analytics Sqoop - CDH 4.7
Pas encore d'évaluation
Big Data Analytics Sqoop - CDH 4.7
11 pages
Apache Hadoop Installation On Ubuntu (Multi-Node Cluster) .
Pas encore d'évaluation
Apache Hadoop Installation On Ubuntu (Multi-Node Cluster) .
11 pages
Spark et Hadoop : Architectures Big Data
Pas encore d'évaluation
Spark et Hadoop : Architectures Big Data
43 pages
tp1 BigData
Pas encore d'évaluation
tp1 BigData
9 pages
QCM Sur Apache Spark11
Pas encore d'évaluation
QCM Sur Apache Spark11
4 pages
Guide Nifi Cours
100% (1)
Guide Nifi Cours
3 pages
Hadoop
Pas encore d'évaluation
Hadoop
89 pages
Tutoriel Complet sur Apache Spark : Chargement, Manipulation et Sauvegarde de Données
100% (1)
Tutoriel Complet sur Apache Spark : Chargement, Manipulation et Sauvegarde de Données
9 pages
Partie 01 - Cours Hadoop
Pas encore d'évaluation
Partie 01 - Cours Hadoop
61 pages
TP Hadoop: MapReduce et YARN en Java
100% (1)
TP Hadoop: MapReduce et YARN en Java
5 pages
Spark et Critique de MapReduce
Pas encore d'évaluation
Spark et Critique de MapReduce
14 pages
Cluster Hadoop - Docker Portainee
Pas encore d'évaluation
Cluster Hadoop - Docker Portainee
33 pages
Tp1 Big Data
Pas encore d'évaluation
Tp1 Big Data
8 pages
Tp3 - TP Sqoop
Pas encore d'évaluation
Tp3 - TP Sqoop
7 pages
TP N°2 - Exemple Word Count Avec Hadoop
Pas encore d'évaluation
TP N°2 - Exemple Word Count Avec Hadoop
12 pages
(Big Data Analytics) CHAP4 - Spark Streaming
Pas encore d'évaluation
(Big Data Analytics) CHAP4 - Spark Streaming
29 pages
Introduction à Apache Hadoop
Pas encore d'évaluation
Introduction à Apache Hadoop
38 pages
Big Data
Pas encore d'évaluation
Big Data
16 pages
Design Patterns Hadoop pour Big Data
100% (1)
Design Patterns Hadoop pour Big Data
6 pages
Introduction à Apache Spark et RDD
Pas encore d'évaluation
Introduction à Apache Spark et RDD
63 pages
Introduction à Apache Spark
Pas encore d'évaluation
Introduction à Apache Spark
4 pages
Big Data Chap 2 - Principes Hadoop
Pas encore d'évaluation
Big Data Chap 2 - Principes Hadoop
51 pages
Introduction au Big Data et ses enjeux
Pas encore d'évaluation
Introduction au Big Data et ses enjeux
45 pages
Tp1 Big Data
Pas encore d'évaluation
Tp1 Big Data
10 pages
Chapitre - 5 Big Data
Pas encore d'évaluation
Chapitre - 5 Big Data
25 pages
Guide Dinstallation de Hadoop Sous Windows
Pas encore d'évaluation
Guide Dinstallation de Hadoop Sous Windows
7 pages
TP1 Hadoop
Pas encore d'évaluation
TP1 Hadoop
7 pages
Introduction Aux Tableaux Croises Dynamiques
Pas encore d'évaluation
Introduction Aux Tableaux Croises Dynamiques
8 pages
Comptabilité : Examen et Exercices
Pas encore d'évaluation
Comptabilité : Examen et Exercices
3 pages
Epreuve Examen Statistique 1MGT
Pas encore d'évaluation
Epreuve Examen Statistique 1MGT
2 pages
Compta de Ste À Imprimer
Pas encore d'évaluation
Compta de Ste À Imprimer
37 pages
Facture Auto-Entrepreneur Hafida El Harkati
Pas encore d'évaluation
Facture Auto-Entrepreneur Hafida El Harkati
1 page
Analyse de Coûts PIRAX
Pas encore d'évaluation
Analyse de Coûts PIRAX
1 page
Examen IFRS
Pas encore d'évaluation
Examen IFRS
1 page
Etude de Cas MK DIGIT
Pas encore d'évaluation
Etude de Cas MK DIGIT
1 page
Emploi FP 08 01 2024
Pas encore d'évaluation
Emploi FP 08 01 2024
10 pages
Test Consolidation
Pas encore d'évaluation
Test Consolidation
5 pages
Gestion des Charges et Produits à Payer et Constater
Pas encore d'évaluation
Gestion des Charges et Produits à Payer et Constater
4 pages
Etude de Cas ESG
Pas encore d'évaluation
Etude de Cas ESG
1 page
Proposition Affectation de Modules
Pas encore d'évaluation
Proposition Affectation de Modules
23 pages
Examen Pilotage de Performance Finance Et RH..
Pas encore d'évaluation
Examen Pilotage de Performance Finance Et RH..
1 page
Initiation en Finance Formation
Pas encore d'évaluation
Initiation en Finance Formation
6 pages
Eff 2018 - 2011
Pas encore d'évaluation
Eff 2018 - 2011
133 pages
Etude de Cas BENHAMMOU
Pas encore d'évaluation
Etude de Cas BENHAMMOU
1 page
Normes IFRS : Principes et Applications
Pas encore d'évaluation
Normes IFRS : Principes et Applications
57 pages
Diagnostic financier ISGI Marrakech
Pas encore d'évaluation
Diagnostic financier ISGI Marrakech
70 pages
CC N 1 Fiscalite V2 TSCF
Pas encore d'évaluation
CC N 1 Fiscalite V2 TSCF
1 page
Diagnostic Financier: Concepts et Analyses
Pas encore d'évaluation
Diagnostic Financier: Concepts et Analyses
18 pages
Contrôle Continu N2 en Fiscalité
Pas encore d'évaluation
Contrôle Continu N2 en Fiscalité
1 page
Bilan Fonctionnel Sarhani 2020
Pas encore d'évaluation
Bilan Fonctionnel Sarhani 2020
20 pages
Etude de Cas Résultat Fiscal
Pas encore d'évaluation
Etude de Cas Résultat Fiscal
1 page
Esg Sarhani 2017
Pas encore d'évaluation
Esg Sarhani 2017
47 pages
04 - Codage Numérique Et Architecture Des Ordinateurs - ESTG
Pas encore d'évaluation
04 - Codage Numérique Et Architecture Des Ordinateurs - ESTG
36 pages
Esperanza
Pas encore d'évaluation
Esperanza
35 pages
Introduction aux Réseaux Informatiques
Pas encore d'évaluation
Introduction aux Réseaux Informatiques
18 pages
C14.3 Synchronisation Moniteurs
Pas encore d'évaluation
C14.3 Synchronisation Moniteurs
33 pages
Correction TD Info Seco L1
Pas encore d'évaluation
Correction TD Info Seco L1
5 pages
CH 4 - TCP - UDP
Pas encore d'évaluation
CH 4 - TCP - UDP
53 pages
Presentation de Docker
Pas encore d'évaluation
Presentation de Docker
8 pages
T6.1 Diagnose FR
Pas encore d'évaluation
T6.1 Diagnose FR
18 pages
Examendsp 2023
Pas encore d'évaluation
Examendsp 2023
2 pages
Préparez Windows avec DiskPart
Pas encore d'évaluation
Préparez Windows avec DiskPart
5 pages
Lecon Gestion
Pas encore d'évaluation
Lecon Gestion
5 pages
Architecture MIPS et Instruction Set
Pas encore d'évaluation
Architecture MIPS et Instruction Set
25 pages
Emul 8086
Pas encore d'évaluation
Emul 8086
24 pages
Techniques de Programmation - Rappel
Pas encore d'évaluation
Techniques de Programmation - Rappel
13 pages
Guide de la documentation Azure AD
Pas encore d'évaluation
Guide de la documentation Azure AD
4 pages
Red Hat Enterprise Linux-7-System Administrators Guide-fr-FR PDF
Pas encore d'évaluation
Red Hat Enterprise Linux-7-System Administrators Guide-fr-FR PDF
595 pages
Algorithmes d'ordonnancement expliqués
Pas encore d'évaluation
Algorithmes d'ordonnancement expliqués
2 pages
Cour 1 - Virtualisation
100% (1)
Cour 1 - Virtualisation
24 pages
Avantages du routeur Cisco comme relais
Pas encore d'évaluation
Avantages du routeur Cisco comme relais
12 pages
Téléchargement PHP Storm 2016 Windows
Pas encore d'évaluation
Téléchargement PHP Storm 2016 Windows
4 pages
Exercice Système D'exploitation 1
Pas encore d'évaluation
Exercice Système D'exploitation 1
3 pages
Guide Complet des Types de RAID
Pas encore d'évaluation
Guide Complet des Types de RAID
6 pages
Erreurs Courantes
Pas encore d'évaluation
Erreurs Courantes
1 page
Rapport Après Réparation Des Machines de
Pas encore d'évaluation
Rapport Après Réparation Des Machines de
2 pages
Sophos Firewall Ds FR
Pas encore d'évaluation
Sophos Firewall Ds FR
2 pages
Mock Test Sur Hadoop
Pas encore d'évaluation
Mock Test Sur Hadoop
7 pages
Acm 2023-2024 24 09 24
Pas encore d'évaluation
Acm 2023-2024 24 09 24
32 pages
Cours sur les Réseaux Informatiques
Pas encore d'évaluation
Cours sur les Réseaux Informatiques
54 pages
Formation CCNA pour Pros IT
Pas encore d'évaluation
Formation CCNA pour Pros IT
2 pages
TD1-TP1 Raspberry Pi3 B+
Pas encore d'évaluation
TD1-TP1 Raspberry Pi3 B+
10 pages