MapReduce MiniProjet

MapReduce est un modèle de programmation développé par Google pour le traitement parallèle de grandes quantités de données sur des clusters d'ordinateurs. Il fonctionne en plusieurs étapes, notamment le mappage, la combinaison, le partitionnement, le tri et le regroupement des données, avec des composants clés tels que JobTracker et TaskTracker pour gérer les tâches. En cas de défaillance du JobTracker, l'exécution des travaux MapReduce est interrompue, mais le système de fichiers HDFS reste opérationnel.

Transféré par

chaymae.rami.d24

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

17 vues12 pages

MapReduce MiniProjet

Transféré par

chaymae.rami.d24

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

MapReduce

Plan
Introduction
Définition
Comment fonctionne Hadoop
MapReduce ?
Introduction
Définition

MapReduce est un modèle de programmation , créé par Google , massivement

parallèle adapté au traitement de très grandes quantités de données. Les
programmes adoptant ce modèle sont automatiquement parallélisés et exécutés
sur des clusters d'ordinateurs.
JobTracker : Client
▪ Il reçoit les demandes d'exécution du client.
▪ Il communique avec le NameNode pour déterminer
l'emplacement des données.
▪ Il divise le travail sur des blocs, s’exécutant sur les différents
noeuds.
▪ Lorsque le JobTracker est en panne, le HDFS sera toujours JobTracker
fonctionnel mais l'exécution MapReduce ne pourra pas être
lancée et les travaux MapReduce existants seront arrêtés.

TaskTracker :
▪ Il s’exécute sur chacun des nœuds . TaskTracker TaskTracker TaskTracker
▪ Lorsqu'un TaskTracker ne répond plus, le JobTracker
attribue la tâche à un autre nœud.
Comment fonctionne Hadoop MapReduce ?
✓ Map stage :
Input Format

Input Split

KV11 KV21 …. KVn1 KV21 KV22 …. KV2m KVn1 KVn2 …. KVnm RecordReader

Mapper Mapper Mapper

{ Waled , 1 }

{ Mervat , 1 }
✓ Combine stage :
Mapper Mapper Mapper Mapper

Value1 a 1 b 1 c 1 c 1 a 1 c 1 b 1 c 1
Key1 Value5 Combiner Combiner Combiner Combiner
Value7

a 1 b 1 c ( 1,1) a 1 c 1 b 1 c 1
✓ Partition stage :
Mapper Mapper Mapper Mapper
Le Partitionneur prend la sortie
du Combineur et effectue le
partitionnement. La clé sert à
a 1 b 1 c 1 c 1 a 1 c 1 b 1 c 1
dériver la partition.
Combiner Combiner Combiner Combiner
Le nombre de partitions est
similaire au nombre de tâches de
réduction.
a 1 b 1 c ( 1,1) a 1 c 1 b 1 c 1
Partitioner
✓ Shuffle and sort
stage :
Mapper Mapper Mapper Mapper

a 1 b 1 c 1 c 1 a 1 c 1 b 1 c 1
Combiner Combiner Combiner Combiner

a 1 b 1 c ( 1,1) a 1 c 1 b 1 c 1
Partitioner

Shuffle and sort

a 1 1 b 1 1 c 2 1 1
✓ Reducer stage :
Mapper Mapper Mapper Mapper

a 1 b 1 c 1 c 1 a 1 c 1 b 1 c 1
Combiner Combiner Combiner Combiner

a 1 b 1 c ( 1,1) a 1 c 1 b 1 c 1
Partitioner

Shuffle and sort

a 1 1 b 1 1 c 2 1 1

Reducer Reducer Reducer

X 2 Y 2 Z 4
Merci pour votre attention

Vous aimerez peut-être aussi

Introduction à MapReduce et Hadoop
Pas encore d'évaluation
Introduction à MapReduce et Hadoop
16 pages
Introduction à Hadoop et Big Data
Pas encore d'évaluation
Introduction à Hadoop et Big Data
37 pages
C2 MapReduce YARN
Pas encore d'évaluation
C2 MapReduce YARN
48 pages
Introduction à Hadoop et MapReduce
Pas encore d'évaluation
Introduction à Hadoop et MapReduce
6 pages
MapReduce : Programmation Distribuée et Tolérance aux Pannes
Pas encore d'évaluation
MapReduce : Programmation Distribuée et Tolérance aux Pannes
6 pages
Chap4 MapReduce
Pas encore d'évaluation
Chap4 MapReduce
17 pages
BigData MindMap
Pas encore d'évaluation
BigData MindMap
1 page
MapReduce et YARN : Concepts Clés
Pas encore d'évaluation
MapReduce et YARN : Concepts Clés
25 pages
Lab 3
Pas encore d'évaluation
Lab 3
15 pages
Introduction à Hadoop et Big Data
Pas encore d'évaluation
Introduction à Hadoop et Big Data
9 pages
(Big Data) CHAP3 - MapReduce
Pas encore d'évaluation
(Big Data) CHAP3 - MapReduce
29 pages
Architecture HDFS et MapReduce
Pas encore d'évaluation
Architecture HDFS et MapReduce
33 pages
Chap4 Mapreduce
Pas encore d'évaluation
Chap4 Mapreduce
35 pages
Map Reduce
Pas encore d'évaluation
Map Reduce
11 pages
Big Data: Marie NDIAYE
Pas encore d'évaluation
Big Data: Marie NDIAYE
11 pages
D3 Architecture Hadoop
Pas encore d'évaluation
D3 Architecture Hadoop
6 pages
YARN-MapReduce : Architecture et Fonctionnement
Pas encore d'évaluation
YARN-MapReduce : Architecture et Fonctionnement
20 pages
MapReduce dans l'Écosystème Hadoop
Pas encore d'évaluation
MapReduce dans l'Écosystème Hadoop
25 pages
Exposé MapReduce
Pas encore d'évaluation
Exposé MapReduce
30 pages
Introduction A Hadoop
Pas encore d'évaluation
Introduction A Hadoop
8 pages
Cours Hadoop
Pas encore d'évaluation
Cours Hadoop
56 pages
Cours Intro Hadoop v27022014 Erraki Haddad
Pas encore d'évaluation
Cours Intro Hadoop v27022014 Erraki Haddad
62 pages
CHAPITRE3 Fondements Big Data MR YARN 2024
Pas encore d'évaluation
CHAPITRE3 Fondements Big Data MR YARN 2024
24 pages
Big Data
Pas encore d'évaluation
Big Data
3 pages
Bigdata3 - MR
Pas encore d'évaluation
Bigdata3 - MR
34 pages
TD 4
Pas encore d'évaluation
TD 4
1 page
Introduction à Hadoop : Traitement et Stockage
Pas encore d'évaluation
Introduction à Hadoop : Traitement et Stockage
8 pages
Chapitre 1&chapitre 2
Pas encore d'évaluation
Chapitre 1&chapitre 2
5 pages
Hadoop MP Industrie 4
Pas encore d'évaluation
Hadoop MP Industrie 4
18 pages
Synthèse 1
Pas encore d'évaluation
Synthèse 1
2 pages
Fonctionnement Et Noeud MapReduce
Pas encore d'évaluation
Fonctionnement Et Noeud MapReduce
3 pages
Big Data Et Hadoop
Pas encore d'évaluation
Big Data Et Hadoop
1 page
Introduction à Hadoop et MapReduce
Pas encore d'évaluation
Introduction à Hadoop et MapReduce
58 pages
Introduction Aux Hadoop&MapReduce
Pas encore d'évaluation
Introduction Aux Hadoop&MapReduce
68 pages
Chapitre 1 Intoduction Au Big Data
Pas encore d'évaluation
Chapitre 1 Intoduction Au Big Data
63 pages
Introduction au Big Data et Hadoop
100% (1)
Introduction au Big Data et Hadoop
6 pages
Presentation Du Framework Hadoop
Pas encore d'évaluation
Presentation Du Framework Hadoop
9 pages
Introduction à Map-Reduce et Hadoop
Pas encore d'évaluation
Introduction à Map-Reduce et Hadoop
39 pages
Introduction à MapReduce avec Hadoop
Pas encore d'évaluation
Introduction à MapReduce avec Hadoop
16 pages
Hadoop: Architecture et Outils
Pas encore d'évaluation
Hadoop: Architecture et Outils
58 pages
Big Data : Stockage et Traitement Parallèle
Pas encore d'évaluation
Big Data : Stockage et Traitement Parallèle
69 pages
Hdfs Mapreduce
Pas encore d'évaluation
Hdfs Mapreduce
43 pages
Introduction à Hadoop et MapReduce
Pas encore d'évaluation
Introduction à Hadoop et MapReduce
53 pages
Chapitre2 Mapreduce Klai
Pas encore d'évaluation
Chapitre2 Mapreduce Klai
24 pages
Diapo3 Big Data
Pas encore d'évaluation
Diapo3 Big Data
37 pages
Big Data et Hadoop : Guide Essentiel
Pas encore d'évaluation
Big Data et Hadoop : Guide Essentiel
8 pages
CBG Cours1
Pas encore d'évaluation
CBG Cours1
36 pages
Cours 5 Map Reduce
Pas encore d'évaluation
Cours 5 Map Reduce
10 pages
Introduction à Apache Hadoop et ses Concepts Clés
Pas encore d'évaluation
Introduction à Apache Hadoop et ses Concepts Clés
27 pages
BIG DATA Resumé
Pas encore d'évaluation
BIG DATA Resumé
6 pages
Implementaion Du Big Data
Pas encore d'évaluation
Implementaion Du Big Data
12 pages
Chapitre 2
Pas encore d'évaluation
Chapitre 2
32 pages
Introduction à Hadoop et MapReduce
Pas encore d'évaluation
Introduction à Hadoop et MapReduce
10 pages
Chapitre 2 HADOOP
Pas encore d'évaluation
Chapitre 2 HADOOP
26 pages
HADOOP
Pas encore d'évaluation
HADOOP
11 pages
Chap 01a - MapReduce
Pas encore d'évaluation
Chap 01a - MapReduce
73 pages
Expose Bigdata
Pas encore d'évaluation
Expose Bigdata
33 pages
Bibidada Final
Pas encore d'évaluation
Bibidada Final
10 pages
Profil de Carrière: Management & Gestion
Pas encore d'évaluation
Profil de Carrière: Management & Gestion
1 page
Chapter I Introduction To Pointers
Pas encore d'évaluation
Chapter I Introduction To Pointers
37 pages
L2-Mise en Forme D'un Document Avec Microsoft Word
Pas encore d'évaluation
L2-Mise en Forme D'un Document Avec Microsoft Word
29 pages
Comment Créer Un Site Web Avec L'ia
Pas encore d'évaluation
Comment Créer Un Site Web Avec L'ia
8 pages
Voiture Comde Vocale
Pas encore d'évaluation
Voiture Comde Vocale
42 pages
Livre des Psaumes PDF à Télécharger
Pas encore d'évaluation
Livre des Psaumes PDF à Télécharger
223 pages
TP PL-SQL : Exercices INSIA
Pas encore d'évaluation
TP PL-SQL : Exercices INSIA
8 pages
Affiche Master II-BDCC 2024
Pas encore d'évaluation
Affiche Master II-BDCC 2024
1 page
Définitions et Concepts Informatiques
Pas encore d'évaluation
Définitions et Concepts Informatiques
4 pages
Texte
Pas encore d'évaluation
Texte
3 pages
DGT-300 Tension Function
Pas encore d'évaluation
DGT-300 Tension Function
14 pages
Comment Regarder + de 6000 Chaînes TV Du Monde Entier Gratuitement - Kulture ChroniK
100% (4)
Comment Regarder + de 6000 Chaînes TV Du Monde Entier Gratuitement - Kulture ChroniK
1 page
Bur Mana Tle STMG Synt05
Pas encore d'évaluation
Bur Mana Tle STMG Synt05
4 pages
Pfe Ult 4
Pas encore d'évaluation
Pfe Ult 4
71 pages
RAFANOMEZANTSOA Tanteliniaina Jaofera - CV
Pas encore d'évaluation
RAFANOMEZANTSOA Tanteliniaina Jaofera - CV
3 pages
Introduction au langage C++ et ses outils
Pas encore d'évaluation
Introduction au langage C++ et ses outils
37 pages
Utilisation des Timers PIC 16F avec Logipic
Pas encore d'évaluation
Utilisation des Timers PIC 16F avec Logipic
13 pages
TPBaseDeDonnee Douzan Bi Trazi Emmanuel
Pas encore d'évaluation
TPBaseDeDonnee Douzan Bi Trazi Emmanuel
10 pages
Eval Info
Pas encore d'évaluation
Eval Info
1 page
DEPARTEMENT ICMC - Guide - Rédaction - PFE - Version 2025
Pas encore d'évaluation
DEPARTEMENT ICMC - Guide - Rédaction - PFE - Version 2025
11 pages
Modèle de Déboursé Sec B2O
Pas encore d'évaluation
Modèle de Déboursé Sec B2O
13 pages
Étude Technique Réseau CEP Maroc
Pas encore d'évaluation
Étude Technique Réseau CEP Maroc
28 pages
Conception Et Réalisation D'une Application Web Pour Le Si de Gestion Du Conseil de Discipline Du Département Informatique
100% (1)
Conception Et Réalisation D'une Application Web Pour Le Si de Gestion Du Conseil de Discipline Du Département Informatique
52 pages
Questions Concours ENSA Informatique
Pas encore d'évaluation
Questions Concours ENSA Informatique
2 pages
Rapport Maint GAB Taiba
Pas encore d'évaluation
Rapport Maint GAB Taiba
5 pages
2 JSX Composant
Pas encore d'évaluation
2 JSX Composant
20 pages
Cours HTML CSS Debutants
Pas encore d'évaluation
Cours HTML CSS Debutants
4 pages
Examen BTS SIO Nouvelle-Calédonie 2020
Pas encore d'évaluation
Examen BTS SIO Nouvelle-Calédonie 2020
3 pages
Cours de Caisse Decentralisee
100% (4)
Cours de Caisse Decentralisee
31 pages
Solution BI pour Indicateurs DC
Pas encore d'évaluation
Solution BI pour Indicateurs DC
68 pages