0% ont trouvé ce document utile (0 vote)

21 vues9 pages

tp5MOUJANE BASMA

Ce TP présente le fonctionnement de l'architecture MapReduce à travers des exemples pratiques, notamment le programme WordCount et le calcul des ventes par magasin. Les étudiants apprennent à déployer des jobs MapReduce localement et sur un cluster Hadoop, en utilisant des outils comme Docker et Maven. Le TP conclut sur l'importance de tester les jobs localement et d'explorer les outils de monitoring des jobs.

Transféré par

basma.moujane

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats DOCX, PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

21 vues9 pages

tp5MOUJANE BASMA

Transféré par

basma.moujane

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats DOCX, PDF, TXT ou lisez en ligne sur Scribd

TP 5 : MapReduce – WordCount et Total des Ventes par Ma

gasin

Réalisé par : Encadré par :

Moujane Basma NAJAH SAID

1. Introduction

Ce TP vise à :

 Comprendre le fonctionnement de l’architecture MapReduce.

 Mettre en œuvre un programme simple de type WordCount, considéré comme l’« Hello
World » des systèmes distribués.

 Déployer un job MapReduce localement, puis sur un cluster Hadoop.

 Implémenter une application pratique de MapReduce pour calculer le total des ventes par
magasin à partir d’un fichier de transactions.

2. Environnement de travail

vs code

Java: JDK 1.8

Hadoop: Version 2.7.2

Cluster: Docker avec 1 master et 2 slaves

3. Implémentation du WordCount

3.1 Code MapReduce( que vous avez donné)

4. Exécution en local

4.1 Préparation des données

Fichier d'entrée file.txt:

4.2 Résultats obtenus

5. Exécution sur le cluster Hadoop

5.1. Premier lancement de Docker

Assurez-vous que votre environnement Docker est démarré :

5.2. Génération du fichier JAR avec Maven

5.3. Copie du JAR vers le conteneur Hadoop

Copiez le fichier JAR depuis votre machine locale vers le conteneur hadoop-master :

5.4. Exécution du job sur le cluster

Connectez-vous au conteneur hadoop-master et lancez le job :

5.5. Vérification des résultats

Consulter les fichiers de sortie :

6. Application: Ventes par magasin

6.1 code
MAPPER:

REDUSER:

CLASSE POUR L4EXECUTION:

Copie du fichier purchases.txt vers HDFS et vérification du contenu du répertoire /new_input"

lancer le job sur le cluster

6.2 Résultats (hdfs dsf -cat /new_output/part-r-00000)

Conclusion
Ce TP a permis de découvrir et d’appliquer le modèle de programmation MapReduce à travers deux
cas :

 Un exemple simple de WordCount, pour comprendre le principe de base.

 Une application réelle de traitement de données de vente, utile dans un contexte

professionnel.

Nous avons également appris à tester nos jobs localement avant de les exécuter sur un cluster
Hadoop distribué, tout en explorant les outils de monitoring des jobs et des nœuds.

Vous aimerez peut-être aussi

TP2 Mapreduce
Pas encore d'évaluation
TP2 Mapreduce
12 pages
Compte Rendu TP 1 Big Data
Pas encore d'évaluation
Compte Rendu TP 1 Big Data
6 pages
Compte Rendu TP 1 Big Data PDF Free
Pas encore d'évaluation
Compte Rendu TP 1 Big Data PDF Free
6 pages
ABL Cloud
100% (1)
ABL Cloud
9 pages
TP Hadoop Et Map
Pas encore d'évaluation
TP Hadoop Et Map
4 pages
Tp1 Initiationahadoopetmapreduce 140428050032 Phpapp02
Pas encore d'évaluation
Tp1 Initiationahadoopetmapreduce 140428050032 Phpapp02
8 pages
Initiation à Hadoop et MapReduce en TP
100% (1)
Initiation à Hadoop et MapReduce en TP
9 pages
Introduction à Hadoop et Map Reduce
Pas encore d'évaluation
Introduction à Hadoop et Map Reduce
5 pages
tp1 Initiationahadoopetmapreduce 140428050032 Phpapp02
Pas encore d'évaluation
tp1 Initiationahadoopetmapreduce 140428050032 Phpapp02
10 pages
TP1 MR - Initiation
Pas encore d'évaluation
TP1 MR - Initiation
4 pages
Mbds Big Data Hadoop 2019 2020 TP 1
Pas encore d'évaluation
Mbds Big Data Hadoop 2019 2020 TP 1
17 pages
TP Hadoop: MapReduce et Python
Pas encore d'évaluation
TP Hadoop: MapReduce et Python
5 pages
Big Data Tps
Pas encore d'évaluation
Big Data Tps
28 pages
Traitement Batch avec Hadoop et MapReduce
Pas encore d'évaluation
Traitement Batch avec Hadoop et MapReduce
11 pages
TP Bigdata ModouFall
Pas encore d'évaluation
TP Bigdata ModouFall
10 pages
Guide pratique MapReduce avec Hadoop
Pas encore d'évaluation
Guide pratique MapReduce avec Hadoop
14 pages
Introduction à Hadoop et MapReduce
Pas encore d'évaluation
Introduction à Hadoop et MapReduce
9 pages
Atelier Big Data : Traitement Batch avec Hadoop
Pas encore d'évaluation
Atelier Big Data : Traitement Batch avec Hadoop
11 pages
Introduction à Map-Reduce et TP Hadoop
Pas encore d'évaluation
Introduction à Map-Reduce et TP Hadoop
7 pages
HDFS Boufares TP2
Pas encore d'évaluation
HDFS Boufares TP2
8 pages
Initiation à Hadoop et Map-Reduce
Pas encore d'évaluation
Initiation à Hadoop et Map-Reduce
10 pages
Ventes Totales par Produit et Région
100% (1)
Ventes Totales par Produit et Région
5 pages
Initiation à Hadoop et MapReduce
100% (4)
Initiation à Hadoop et MapReduce
5 pages
Programme WordCount avec MapReduce
Pas encore d'évaluation
Programme WordCount avec MapReduce
4 pages
TP N°2 - Exemple Word Count Avec Hadoop
Pas encore d'évaluation
TP N°2 - Exemple Word Count Avec Hadoop
12 pages
MapReduce avec Hadoop et Python
Pas encore d'évaluation
MapReduce avec Hadoop et Python
5 pages
Tp4 Hadoop-Programmation Map-Reduce: Partie 1: Wordcount en Java
Pas encore d'évaluation
Tp4 Hadoop-Programmation Map-Reduce: Partie 1: Wordcount en Java
3 pages
Introduction à Hadoop et MapReduce
Pas encore d'évaluation
Introduction à Hadoop et MapReduce
10 pages
TP3 - BD - 2024
Pas encore d'évaluation
TP3 - BD - 2024
5 pages
Atelier 2 Map Reduce
Pas encore d'évaluation
Atelier 2 Map Reduce
4 pages
Atelier 5 Word Count Avec MapReduce
Pas encore d'évaluation
Atelier 5 Word Count Avec MapReduce
22 pages
TP Hadoop: MapReduce et YARN en Java
100% (1)
TP Hadoop: MapReduce et YARN en Java
5 pages
TP2 MapReduce
Pas encore d'évaluation
TP2 MapReduce
7 pages
Report TP Hadoop Exemple
Pas encore d'évaluation
Report TP Hadoop Exemple
5 pages
Introduction à Hadoop et Big Data
Pas encore d'évaluation
Introduction à Hadoop et Big Data
56 pages
Projet - Hadoop (1) (1) Ssssssssssssssssssssssssssssssssssssss
Pas encore d'évaluation
Projet - Hadoop (1) (1) Ssssssssssssssssssssssssssssssssssssss
14 pages
TP2 Map Reduce
Pas encore d'évaluation
TP2 Map Reduce
2 pages
Initiation à Hadoop et MapReduce
Pas encore d'évaluation
Initiation à Hadoop et MapReduce
5 pages
TP3 Map Reduce
Pas encore d'évaluation
TP3 Map Reduce
25 pages
TP Big Data : Hadoop et MapReduce
Pas encore d'évaluation
TP Big Data : Hadoop et MapReduce
15 pages
Lab 3
Pas encore d'évaluation
Lab 3
15 pages
TP 1 Hadoop
Pas encore d'évaluation
TP 1 Hadoop
16 pages
Examen Big Data
Pas encore d'évaluation
Examen Big Data
3 pages
Initiation à Hadoop et MapReduce en L2IRS
100% (1)
Initiation à Hadoop et MapReduce en L2IRS
7 pages
Manipulation de Hadoop : HDFS et MapReduce
Pas encore d'évaluation
Manipulation de Hadoop : HDFS et MapReduce
5 pages
Introduction à MapReduce et Big Data
Pas encore d'évaluation
Introduction à MapReduce et Big Data
65 pages
Travaux Pratique N 1 - 3
Pas encore d'évaluation
Travaux Pratique N 1 - 3
4 pages
Atelier3 Map Reduce Sur La Plate Forme Cloudera
Pas encore d'évaluation
Atelier3 Map Reduce Sur La Plate Forme Cloudera
9 pages
Rapport de Proje BIGDATA
Pas encore d'évaluation
Rapport de Proje BIGDATA
15 pages
Introduction à MapReduce et Hadoop
Pas encore d'évaluation
Introduction à MapReduce et Hadoop
9 pages
TP Map Red
Pas encore d'évaluation
TP Map Red
3 pages
Cours 3-Pages-2
Pas encore d'évaluation
Cours 3-Pages-2
18 pages
Introduction à Hadoop MapReduce
Pas encore d'évaluation
Introduction à Hadoop MapReduce
28 pages
TP3 - MapReduce Dans YARN ID2 2022-2023
Pas encore d'évaluation
TP3 - MapReduce Dans YARN ID2 2022-2023
9 pages
Abderrahman Eladlani - TPs - Hadoop
Pas encore d'évaluation
Abderrahman Eladlani - TPs - Hadoop
1 page
Introduction au Big Data et MapReduce
Pas encore d'évaluation
Introduction au Big Data et MapReduce
47 pages
TP2 - Hadoop MapReduce 2023
Pas encore d'évaluation
TP2 - Hadoop MapReduce 2023
11 pages
Introduction à Hadoop et MapReduce
Pas encore d'évaluation
Introduction à Hadoop et MapReduce
58 pages