0% ont trouvé ce document utile (0 vote)

10 vues10 pages

TP Bigdata ModouFall

Ce document présente un TP sur le traitement Batch avec Hadoop, HDFS et MapReduce, en se concentrant sur la mise en place d'un mini-cluster composé de trois machines dans des conteneurs Docker. Il décrit les étapes d'installation de Docker, de création des conteneurs, ainsi que les manipulations de fichiers dans HDFS et la création d'un job MapReduce en Java. Enfin, il fournit des exemples de code pour les classes Mapper et Reducer, ainsi que des instructions pour tester et exécuter le job MapReduce.

Transféré par

elmodoucalculator

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

10 vues10 pages

TP Bigdata ModouFall

Transféré par

elmodoucalculator

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Département Génie Informatique / École Supérieure Polytechnique /

UCAD

Big Data

TP N° 1 : Le traitement Batch avec

Hadoop, HDFS et MapReduce

Préparé par : Professeur :

Modou Fall Mr Ba
Premiere partie : Mise en place de l’environnement Hadoop

Travail 📝 à réaliser:
Le but de cette première partie est de définir un mini-cluster composé de 3 machines qui sont
hébergées chacune dans un conteneur docker : une machine Master et deux machines
Slave. Ces machines seront reliées par un réseau que nous appellerons Hadoop qui
va leur permettre de communiquer
1. Installation de docker
● Rendez vous sur https://hub.docker.com/
● Telecharger Docker et installez-le suivant votre SE
● une fois Docker installé nous pouvons les commandes de
docker 2. Chargement de l’image liliasfaxi/spark-hadoop:hv-2.7.2

3. Création des containers

Comme expliqué, nous visons la création d'un mini-cluster, contenant un
master qui sera notre namenode et deux slaves qui représenteront nos data
nodes. Pour se faire, suivez les étapes suivantes
❖ Créer un réseau qui permettra de relier les trois conteneurs:

❖ Créer et lancer les trois containers

4. Entrer le container Master pour commencer à l'utiliser.

Deuxième partie : Premiers pas avec Hadoop

A. Manipulation des fichiers

● Créer un répertoire dans HDFS, appelé input. Pour cela, taper:

● Nous allons utiliser le fichier purchases.txt comme entrée pour le

traitement MapReduce.

B. Interfaces web pour Hadoop

Haddop nous présente plusieurs interfaces
Avec l’adresse : http://localhost:50070
Avec l’adresse : http://localhost:8088

Troisième partie : Mapreduce avec java

Le but de cette troisième partie est de créer un job map reduce sur notre cluster de containers.
Un job mapreduce se compose principalement de deux types de programmes: - mappers :
permettent d'extraire les données nécessaires sous forme de clef/valeur, pour pouvoir ensuite
les trier selon la clef- reducers : prennent un ensemble de données triées selon leur clef, et
effectuent le traitement nécessaire sur ces données (somme, moyenne, total... )

Total Vente :
Nous allons tester un programme de Mapreduce grâce à un exemple simple 🙂
● L'étape de mapping, qui permet de découper le texte en mots et de délivrer en sortie
un flux textuel, ou chaque ligne contient le magasin trouvé et le prix du produit vendu
● L'etape du reducing, qui permet de faire la somme des prix des produits pour chaque
magasin

A. Creation d’un projet intel ji

● Ouvrir le fichier pom. Xml, et ajouter les dépendances suivantes pour hadoop, hdfs et
mapreduce
<dependencies>
<dependency>
<groupId>org.apache.hadoop</groupId>
<artifactId>hadoop-common</artifactId>
<version>2.7.2</version>
</dependency>

<dependency>
<groupId>org.apache.hadoop</groupId>
<artifactId>hadoop-mapreduce-client-core</artifactId>
<version>2.7.2</version>
</dependency>

<dependency>
<groupId>org.apache.hadoop</groupId>
<artifactId>hadoop-hdfs</artifactId>
<version>2.7.2</version>
</dependency>
<dependency>
<groupId>org.apache.hadoop</groupId>
<artifactId>hadoop-mapreduce-client-common</artifactId>
<version>2.7.2</version>
</dependency>
<dependency>
<groupId>com.sun.jersey</groupId>
<artifactId>jersey-core</artifactId>
<version>1.9</version>
</dependency>
</dependencies>
● TokenizerMapper
package hadoop.mapreduce.mfdev;

import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Mapper;

import java.io.IOException;
import java.util.StringTokenizer;

public class TokenizerMapper

extends Mapper<Object, Text, Text, IntWritable>{

private final static IntWritable one = new IntWritable(1);

private Text word = new Text();

public void map(Object key, Text value, Mapper.Context context

) throws IOException, InterruptedException {
// StringTokenizer itr = new StringTokenizer(value.toString());
String[] line = value.toString().split(" ");
word.set(line[2]);
one.set((int) Float.parseFloat(line[4]));
context.write(word, one);
}
}
● IntSumReducer
package hadoop.mapreduce.mfdev;

import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Reducer;

import java.io.IOException;

public class IntSumReducer

extends Reducer<Text,IntWritable,Text,IntWritable> {

private IntWritable result = new IntWritable();

public void reduce(Text key, Iterable<IntWritable> values,

Context context
) throws IOException, InterruptedException {
int sum = 0;
for (IntWritable val : values) {
// System.out.println("value: "+val.get());
sum += val.get();
}
System.out.println(key.toString()+" : "+sum);
result.set(sum);
context.write(key, result);
}
}
● TotalSummer
package hadoop.mapreduce.mfdev;

import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Reducer;

import java.io.IOException;

public class IntSumReducer

extends Reducer<Text,IntWritable,Text,IntWritable> {

private IntWritable result = new IntWritable();

public void reduce(Text key, Iterable<IntWritable> values,

● Tester Mapreduce en Local En sortie nous avons les résultats suivants 👉

● Lancer le cluster mapreduce 🏌:

● Générer le fichier jar
● copier le fichier jar dans hadoop-master

● Revenir au shell du conteneur master, et lancer le job map reduce

Vous aimerez peut-être aussi

HDFS Boufares TP2
Pas encore d'évaluation
HDFS Boufares TP2
8 pages
Atelier Big Data : Traitement Batch avec Hadoop
Pas encore d'évaluation
Atelier Big Data : Traitement Batch avec Hadoop
11 pages
TP Hadoop Et Map
Pas encore d'évaluation
TP Hadoop Et Map
4 pages
Initiation à Hadoop et Map-Reduce
Pas encore d'évaluation
Initiation à Hadoop et Map-Reduce
10 pages
TP Hadoop: Déploiement et MapReduce
Pas encore d'évaluation
TP Hadoop: Déploiement et MapReduce
10 pages
TP 1 Hadoop
Pas encore d'évaluation
TP 1 Hadoop
16 pages
TP MapReduce
Pas encore d'évaluation
TP MapReduce
5 pages
ABL Cloud
100% (1)
ABL Cloud
9 pages
tp1 Initiationahadoopetmapreduce 140428050032 Phpapp02
Pas encore d'évaluation
tp1 Initiationahadoopetmapreduce 140428050032 Phpapp02
10 pages
TP2 Mapreduce
Pas encore d'évaluation
TP2 Mapreduce
12 pages
TP1 Big Data
Pas encore d'évaluation
TP1 Big Data
11 pages
TP Big Data : Hadoop et MapReduce
Pas encore d'évaluation
TP Big Data : Hadoop et MapReduce
15 pages
Initiation à Hadoop et MapReduce
100% (4)
Initiation à Hadoop et MapReduce
5 pages
tp1 Initiationahadoopetmapreduce 140428050032 Phpapp02
100% (1)
tp1 Initiationahadoopetmapreduce 140428050032 Phpapp02
9 pages
tp1 IRS
100% (1)
tp1 IRS
7 pages
Tp1 Initiationahadoopetmapreduce 140428050032 Phpapp02
Pas encore d'évaluation
Tp1 Initiationahadoopetmapreduce 140428050032 Phpapp02
8 pages
Compte Rendu TP 1 Big Data PDF Free
Pas encore d'évaluation
Compte Rendu TP 1 Big Data PDF Free
6 pages
Compte Rendu TP 1 Big Data
Pas encore d'évaluation
Compte Rendu TP 1 Big Data
6 pages
Atelier 2-Mapreduce
Pas encore d'évaluation
Atelier 2-Mapreduce
3 pages
TP1 BigDataAnalytics Initiation Hadoop
Pas encore d'évaluation
TP1 BigDataAnalytics Initiation Hadoop
9 pages
TP MapReduce Python
Pas encore d'évaluation
TP MapReduce Python
5 pages
Compte-Rendu TP2 Big Data
Pas encore d'évaluation
Compte-Rendu TP2 Big Data
14 pages
Ventes Totales par Produit et Région
100% (1)
Ventes Totales par Produit et Région
5 pages
Lab 3
Pas encore d'évaluation
Lab 3
15 pages
TP1 MR - Initiation
Pas encore d'évaluation
TP1 MR - Initiation
4 pages
TP Map Reduce
Pas encore d'évaluation
TP Map Reduce
13 pages
TP3 - BD - 2024
Pas encore d'évaluation
TP3 - BD - 2024
5 pages
Hadoop TP MSBG
Pas encore d'évaluation
Hadoop TP MSBG
7 pages
Rapport de Projet Big Data
Pas encore d'évaluation
Rapport de Projet Big Data
25 pages
TP N°2 - Exemple Word Count Avec Hadoop
Pas encore d'évaluation
TP N°2 - Exemple Word Count Avec Hadoop
12 pages
TP Hadoop: MapReduce et Python
Pas encore d'évaluation
TP Hadoop: MapReduce et Python
5 pages
Big Data Tps
Pas encore d'évaluation
Big Data Tps
28 pages
CBD TP
Pas encore d'évaluation
CBD TP
6 pages
Bigdata3 - MR
Pas encore d'évaluation
Bigdata3 - MR
34 pages
TP3 - MapReduce Dans YARN ID2 2022-2023
Pas encore d'évaluation
TP3 - MapReduce Dans YARN ID2 2022-2023
9 pages
Programmation Hadoop : Guide du Driver Java
100% (1)
Programmation Hadoop : Guide du Driver Java
11 pages
TP5Bigdata INDIA 2023 2024
Pas encore d'évaluation
TP5Bigdata INDIA 2023 2024
5 pages
Big Data et Hadoop : Guide Essentiel
Pas encore d'évaluation
Big Data et Hadoop : Guide Essentiel
8 pages
Abdbig m2 Mind
Pas encore d'évaluation
Abdbig m2 Mind
5 pages
TP Hadoop: MapReduce et YARN en Java
100% (1)
TP Hadoop: MapReduce et YARN en Java
5 pages
Chap 5
Pas encore d'évaluation
Chap 5
28 pages
Chapitre 1&chapitre 2
Pas encore d'évaluation
Chapitre 1&chapitre 2
5 pages
Sparks Tre Ming
Pas encore d'évaluation
Sparks Tre Ming
13 pages
TP1: Installation D'un Cluster Hadoop Avec Docker
Pas encore d'évaluation
TP1: Installation D'un Cluster Hadoop Avec Docker
4 pages
Programmation Hadoop WordCount
Pas encore d'évaluation
Programmation Hadoop WordCount
18 pages
Initiation à Hadoop et MapReduce
Pas encore d'évaluation
Initiation à Hadoop et MapReduce
5 pages
Chap 8
Pas encore d'évaluation
Chap 8
15 pages
Hadoop MapReduce - Apache Sqoop
Pas encore d'évaluation
Hadoop MapReduce - Apache Sqoop
83 pages
Chap 7
Pas encore d'évaluation
Chap 7
25 pages
tp2 Spark
Pas encore d'évaluation
tp2 Spark
17 pages
Atelier Framework Big Data PDF
Pas encore d'évaluation
Atelier Framework Big Data PDF
21 pages
Chapitre2 Hadoop MapReduce
Pas encore d'évaluation
Chapitre2 Hadoop MapReduce
28 pages
HDFS MapReduce
Pas encore d'évaluation
HDFS MapReduce
3 pages
Hadoop: Architecture et Outils
Pas encore d'évaluation
Hadoop: Architecture et Outils
58 pages
Traitement Du Big Data: TP3 Le Modèle de Programmation Map Reduce
Pas encore d'évaluation
Traitement Du Big Data: TP3 Le Modèle de Programmation Map Reduce
25 pages
CBG Cours1
Pas encore d'évaluation
CBG Cours1
36 pages
Installation et Configuration de Hadoop
Pas encore d'évaluation
Installation et Configuration de Hadoop
17 pages
Examen Big Data
Pas encore d'évaluation
Examen Big Data
3 pages
Presentation Générale
Pas encore d'évaluation
Presentation Générale
13 pages
Implémentation Technique de La Sécurité
Pas encore d'évaluation
Implémentation Technique de La Sécurité
6 pages
Soutenance - Kanoute
Pas encore d'évaluation
Soutenance - Kanoute
37 pages
Présentation Des APIs OpenLayers
Pas encore d'évaluation
Présentation Des APIs OpenLayers
7 pages
TP GDP
Pas encore d'évaluation
TP GDP
3 pages
Demande de Téléphone Et Nouvelle Ligne
Pas encore d'évaluation
Demande de Téléphone Et Nouvelle Ligne
1 page
Dietriech Stmo 300 Installation Chauffe Eau Solaire
Pas encore d'évaluation
Dietriech Stmo 300 Installation Chauffe Eau Solaire
32 pages
Guelmim-Ao 2023 Bpde
Pas encore d'évaluation
Guelmim-Ao 2023 Bpde
4 pages
Examen Génie Civil: Béton Précontraint
Pas encore d'évaluation
Examen Génie Civil: Béton Précontraint
3 pages
Construction Logements Villeneuve 92
Pas encore d'évaluation
Construction Logements Villeneuve 92
41 pages
Qualités essentielles de l'architecture urbaine
Pas encore d'évaluation
Qualités essentielles de l'architecture urbaine
3 pages
03 - Analyse Structures Existantes - 2015 PDF
Pas encore d'évaluation
03 - Analyse Structures Existantes - 2015 PDF
69 pages
Exposé-Les Ouvrages de Soutènement
Pas encore d'évaluation
Exposé-Les Ouvrages de Soutènement
22 pages
Choix Lots Référentiel RE2020
Pas encore d'évaluation
Choix Lots Référentiel RE2020
8 pages
Art Baroque Et Art Classique
Pas encore d'évaluation
Art Baroque Et Art Classique
2 pages
Installation Armoire Réfrigérée
Pas encore d'évaluation
Installation Armoire Réfrigérée
22 pages
Construire Et Emouvoir
Pas encore d'évaluation
Construire Et Emouvoir
16 pages
Patrimoine colonial et développement
Pas encore d'évaluation
Patrimoine colonial et développement
10 pages
Topo 2
Pas encore d'évaluation
Topo 2
13 pages
DDC Poteau
Pas encore d'évaluation
DDC Poteau
3 pages
Villa Bianchi Une Oeuvre Emblematique de Mario Botta
Pas encore d'évaluation
Villa Bianchi Une Oeuvre Emblematique de Mario Botta
10 pages
Le Confort Thermique
Pas encore d'évaluation
Le Confort Thermique
61 pages
Fiche Pathologie Batiment A1 AQC
Pas encore d'évaluation
Fiche Pathologie Batiment A1 AQC
2 pages
2004-Signe Suspect - Cornwell, Patricia
Pas encore d'évaluation
2004-Signe Suspect - Cornwell, Patricia
435 pages
Solutions Plancher FB GROUPE : Leader Européen
Pas encore d'évaluation
Solutions Plancher FB GROUPE : Leader Européen
32 pages
Gamme de Coffrages Bois-Ciment Ebuilt
Pas encore d'évaluation
Gamme de Coffrages Bois-Ciment Ebuilt
8 pages
Inspection des Lieux de Travail HSE
100% (2)
Inspection des Lieux de Travail HSE
2 pages
Le Lexique de La Maison Japonaise
Pas encore d'évaluation
Le Lexique de La Maison Japonaise
3 pages
Suspentes Integra2 pour isolation combles
Pas encore d'évaluation
Suspentes Integra2 pour isolation combles
2 pages
Introduction À L - Anatomie de La Tête Et Du Cou
Pas encore d'évaluation
Introduction À L - Anatomie de La Tête Et Du Cou
6 pages
Warhammer - Plans de Jeu - V1
Pas encore d'évaluation
Warhammer - Plans de Jeu - V1
27 pages
Analyse du site pour médiathèque à Blida
Pas encore d'évaluation
Analyse du site pour médiathèque à Blida
7 pages
REPAIR - Brochure Réparer - FR
Pas encore d'évaluation
REPAIR - Brochure Réparer - FR
17 pages
DPGF Lot 07 Cloisons Doublages Faux Plafonds
Pas encore d'évaluation
DPGF Lot 07 Cloisons Doublages Faux Plafonds
2 pages
Calculs de Béton Armé - Application de L - Eurocode 2 - Formation 2011
Pas encore d'évaluation
Calculs de Béton Armé - Application de L - Eurocode 2 - Formation 2011
125 pages
Exercice Economie de La Construction Actualise 2
Pas encore d'évaluation
Exercice Economie de La Construction Actualise 2
1 page