0% ont trouvé ce document utile (0 vote)

125 vues3 pages

Examen Big Data

Le document décrit un examen pratique pour les étudiants en informatique, axé sur l'implémentation et l'exécution de programmes MapReduce dans un environnement Hadoop. Les étudiants doivent configurer un cluster Hadoop, exécuter des tâches de comptage de professions et répondre à des questions théoriques sur MapReduce. Des critères d'évaluation et des commandes annexes pour la configuration sont également fournis.

Transféré par

Molka Hamouda

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

125 vues3 pages

Examen Big Data

Transféré par

Molka Hamouda

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Ministère de l’Enseignement Enseignante :

Supérieur et de la Recherche Examen TP Takwa Ben Aïcha Gader

Scientifique, université de Année universitaire :

Monastir, ISIMA 2024/2025

Objectif

Tester la capacité des étudiants à implémenter et exécuter des programmes MapReduce pour
analyser un jeu de données.

Tâches à Réaliser

1. Configuration du Cluster Hadoop

a. Assurer vous que l’image Docker nécessaire pour Hadoop est déjà installée.

b. Créez un réseau Docker nommé hadoop_cluster.

c. Configurez les conteneurs comme suit :

o Nœud maître (namenode) :

▪ Nom : hadoop-master

▪ Ports exposés : 50070, 8088

o Nœuds esclaves (datanodes) :

▪ hadoop-slave1

▪ hadoop-slave2

▪ hadoop-slave3

o Connectez tous les conteneurs au réseau hadoop_cluster.

d. Copier le fichier donnees.txt dans HDFS dans un dossier /exam_mapreduce.

2. Implémentez les tâches MapReduce suivantes :

a. Tâche 1 : Comptage des professions

▪ Écrivez un programme MapReduce pour compter le nombre de personnes par profession.

Pour cela il faut créer et déplacer vers le Master les fichiers mapper.py et reducer.py.

▪ Exemples de sortie :
Ingénieur : 10
Étudiant : 15
Médecin : 5
1
c. Exécution et Validation :

▪ Testez la tâche MapReduce sur le fichier donnees.txt.

▪ Stockez les résultats dans HDFS dans les répertoires

/exam_mapreduce_output/tache1.
d. Vérifier les Job executes sur le système Hadoop par l’interface web : http://localhost:8088/
(capture d’écran)

e. Questions Théoriques :

a. Ex pliquez le rôle des fonctions map() et reduce() dans un programme

MapReduce.

b. Quels sont les avantages d'utiliser MapReduce pour traiter de grandes quantités de
données par rapport à un traitement classique ?

Critères d'Évaluation :

1. Configuration correcte du cluster Hadoop : 5 points.

2. Implémentation correcte des tâches MapReduce :5 points

3. Qualité des résultats et analyse : 2 points.

4. Clarté et présentation du rapport : 3 points.

Bonus (+3 points):

▪ Écrivez un programme MapReduce pour calculer le salaire moyen pour chaque profession.

▪ Ignorez les lignes où le salaire est 0.

▪ Exemples de sortie : Ingénieur : 65,000

Médecin : 75,000

Annexe (commandes) :

▪ Créer et lancer un conteneur Docker

➢ docker run -itd --net=<network_name> -p <host_port>:<container_port> --name

<container_name> --hostname <hostname> <image_name>

▪ Démarrer les services HDFS

➢ start-dfs.sh

▪ Modifier le facteur de réplication :

➢ hadoop fs -setrep -w <replication_factor> <file_path>

▪ Exécuter le script mapper.py sur le fichier donnees.txt (vérification)

2
➢ hdfs dfs -cat <HDFSFilePath> | python3 <MapperScript>

▪ Exécution du job MapReduce avec Hadoop Streaming

➢ hadoop jar /usr/local/hadoop/share/hadoop/tools/lib/hadoop-streaming-2.7.2.jar \

-files <MapperScript>,<ReducerScript> \

-mapper "python3 <MapperScript>" \

-reducer "python3 <ReducerScript>" \

-input <HDFSInputFilePath> \

-output <HDFSOutputDirectory>

Vous aimerez peut-être aussi

Configuration d'un Cluster Hadoop avec Docker
Pas encore d'évaluation
Configuration d'un Cluster Hadoop avec Docker
3 pages
TP3 - BD - 2024
Pas encore d'évaluation
TP3 - BD - 2024
5 pages
BigDATA M1 GSI Corrigé - Type
100% (2)
BigDATA M1 GSI Corrigé - Type
3 pages
TP Hadoop: MapReduce et Python
Pas encore d'évaluation
TP Hadoop: MapReduce et Python
5 pages
Big Data Tps
Pas encore d'évaluation
Big Data Tps
28 pages
Lab 3
Pas encore d'évaluation
Lab 3
15 pages
TD Big Data: Installation Hadoop & MapReduce
Pas encore d'évaluation
TD Big Data: Installation Hadoop & MapReduce
6 pages
Cours Big Data : Gestion et Outils 2021
Pas encore d'évaluation
Cours Big Data : Gestion et Outils 2021
14 pages
TP Hadoop Et Map
Pas encore d'évaluation
TP Hadoop Et Map
4 pages
Examen Big Data : MapReduce et HDFS
Pas encore d'évaluation
Examen Big Data : MapReduce et HDFS
4 pages
HDFS Boufares TP2
Pas encore d'évaluation
HDFS Boufares TP2
8 pages
TP Hadoop: MapReduce et YARN en Java
100% (1)
TP Hadoop: MapReduce et YARN en Java
5 pages
Exam Big Data
Pas encore d'évaluation
Exam Big Data
6 pages
Initiation à Hadoop et MapReduce
100% (4)
Initiation à Hadoop et MapReduce
5 pages
Exemple Examen BIG DATA Partie 1
Pas encore d'évaluation
Exemple Examen BIG DATA Partie 1
7 pages
Initiation à Hadoop et MapReduce
Pas encore d'évaluation
Initiation à Hadoop et MapReduce
5 pages
Initiation à Hadoop et MapReduce en L2IRS
100% (1)
Initiation à Hadoop et MapReduce en L2IRS
7 pages
Exécution de MapReduce avec Hadoop
Pas encore d'évaluation
Exécution de MapReduce avec Hadoop
5 pages
ABL Cloud
100% (1)
ABL Cloud
9 pages
Td1: Hadoop: Exercice 1
75% (4)
Td1: Hadoop: Exercice 1
3 pages
TP 1 Hadoop
Pas encore d'évaluation
TP 1 Hadoop
16 pages
tp1 Initiationahadoopetmapreduce 140428050032 Phpapp02
Pas encore d'évaluation
tp1 Initiationahadoopetmapreduce 140428050032 Phpapp02
10 pages
TP2 MapReduce 02 2024
Pas encore d'évaluation
TP2 MapReduce 02 2024
8 pages
Examen Big Data 3ème IM - Jan 2024
Pas encore d'évaluation
Examen Big Data 3ème IM - Jan 2024
2 pages
Big Data Et Architectures Associées: Examen de La Session Principale
Pas encore d'évaluation
Big Data Et Architectures Associées: Examen de La Session Principale
2 pages
tp3 Hadoop
Pas encore d'évaluation
tp3 Hadoop
12 pages
Introduction au Big Data et MapReduce
Pas encore d'évaluation
Introduction au Big Data et MapReduce
47 pages
Compte Rendu TP 1 Big Data
Pas encore d'évaluation
Compte Rendu TP 1 Big Data
6 pages
Compte Rendu TP 1 Big Data PDF Free
Pas encore d'évaluation
Compte Rendu TP 1 Big Data PDF Free
6 pages
Control Big Data N°4-AU22-23
100% (1)
Control Big Data N°4-AU22-23
3 pages
Initiation à Hadoop et MapReduce en TP
100% (1)
Initiation à Hadoop et MapReduce en TP
9 pages
Tp1 Initiationahadoopetmapreduce 140428050032 Phpapp02
Pas encore d'évaluation
Tp1 Initiationahadoopetmapreduce 140428050032 Phpapp02
8 pages
Initiation à Hadoop et Map-Reduce
Pas encore d'évaluation
Initiation à Hadoop et Map-Reduce
10 pages
TP Bigdata ModouFall
Pas encore d'évaluation
TP Bigdata ModouFall
10 pages
Introduction à Map-Reduce et TP Hadoop
Pas encore d'évaluation
Introduction à Map-Reduce et TP Hadoop
7 pages
TP2 Mapreduce
Pas encore d'évaluation
TP2 Mapreduce
12 pages
Exam BD1718 Fin
Pas encore d'évaluation
Exam BD1718 Fin
4 pages
Examen Big Data : Corrigé et Solutions
Pas encore d'évaluation
Examen Big Data : Corrigé et Solutions
4 pages
CBG Cours1
Pas encore d'évaluation
CBG Cours1
36 pages
Correction Examen Big Data 2024
Pas encore d'évaluation
Correction Examen Big Data 2024
3 pages
MapReduce et HDFS : Guide Pratique
Pas encore d'évaluation
MapReduce et HDFS : Guide Pratique
2 pages
Introduction à Hadoop et MapReduce
Pas encore d'évaluation
Introduction à Hadoop et MapReduce
9 pages
Guide pratique MapReduce avec Hadoop
Pas encore d'évaluation
Guide pratique MapReduce avec Hadoop
14 pages
Big Data et Hadoop : Guide Essentiel
Pas encore d'évaluation
Big Data et Hadoop : Guide Essentiel
8 pages
Application MapReduce pour Température
Pas encore d'évaluation
Application MapReduce pour Température
13 pages
TP Big Data : Hadoop et MapReduce
Pas encore d'évaluation
TP Big Data : Hadoop et MapReduce
15 pages
MapReduce avec Python pour WordCount
Pas encore d'évaluation
MapReduce avec Python pour WordCount
12 pages
TP3 Map Reduce
Pas encore d'évaluation
TP3 Map Reduce
25 pages
Introduction à Hadoop et Map Reduce
Pas encore d'évaluation
Introduction à Hadoop et Map Reduce
5 pages
TP Hadoop et MapReduce : Manipulation des données
Pas encore d'évaluation
TP Hadoop et MapReduce : Manipulation des données
10 pages
Bibidada Final
Pas encore d'évaluation
Bibidada Final
10 pages
Python MapReduce pour Big Data
Pas encore d'évaluation
Python MapReduce pour Big Data
3 pages
Introduction à Hadoop et Big Data
Pas encore d'évaluation
Introduction à Hadoop et Big Data
56 pages
Abdbig m2 Mind
Pas encore d'évaluation
Abdbig m2 Mind
5 pages
DS-2-Big Data Et Cloud
Pas encore d'évaluation
DS-2-Big Data Et Cloud
2 pages
Introduction à Hadoop et MapReduce
Pas encore d'évaluation
Introduction à Hadoop et MapReduce
10 pages
Introduction à Hadoop et MapReduce
Pas encore d'évaluation
Introduction à Hadoop et MapReduce
6 pages
Notes Diapo 4
Pas encore d'évaluation
Notes Diapo 4
4 pages
LCD m2 Fiil tp06
Pas encore d'évaluation
LCD m2 Fiil tp06
2 pages
Guide Pratique: Débuter avec Python
100% (9)
Guide Pratique: Débuter avec Python
212 pages
Découvrez Le Langage JavaScript - OpenClassrooms Eyrolles
75% (12)
Découvrez Le Langage JavaScript - OpenClassrooms Eyrolles
487 pages
Cours Complet PHP Et MySQL 2020 PDF
100% (11)
Cours Complet PHP Et MySQL 2020 PDF
686 pages
EXCEL 2024 - Le Guide Complet
93% (14)
EXCEL 2024 - Le Guide Complet
163 pages
EX ML Corrigé CII-3-SSIR A B
83% (6)
EX ML Corrigé CII-3-SSIR A B
4 pages
Réalisez Votre Site Web Avec HTML 5 Et CSS 3
100% (5)
Réalisez Votre Site Web Avec HTML 5 Et CSS 3
305 pages
Solutions QCM Concours Informatique
90% (10)
Solutions QCM Concours Informatique
12 pages
Programmation Avec Node Js Express Js Et Mongodb
100% (1)
Programmation Avec Node Js Express Js Et Mongodb
608 pages
304-Excel Expert Fonctions Simulations Bases de Donnees PDF
100% (5)
304-Excel Expert Fonctions Simulations Bases de Donnees PDF
628 pages
249 Outils IA
100% (4)
249 Outils IA
25 pages
Apprendre Le ML en Une Semaine PDF
94% (17)
Apprendre Le ML en Une Semaine PDF
100 pages
(PDF) Intelligence Artificielle en Pratique Avec Python - Hugues Bersini, Eyrolles, 2nd Ed., 2022-2023 - Wawacity - Foo
100% (5)
(PDF) Intelligence Artificielle en Pratique Avec Python - Hugues Bersini, Eyrolles, 2nd Ed., 2022-2023 - Wawacity - Foo
174 pages
SQL - Les Fondamentaux Du Langage (Avec Exercices Et Corrigés)
100% (4)
SQL - Les Fondamentaux Du Langage (Avec Exercices Et Corrigés)
303 pages
Cours Python Complet
90% (10)
Cours Python Complet
150 pages
00 Dunod Python 3 2ed
100% (7)
00 Dunod Python 3 2ed
303 pages
Cours Exercices Python
100% (2)
Cours Exercices Python
170 pages
Wiley Python Pour La Data Science
100% (4)
Wiley Python Pour La Data Science
387 pages
Bescherelle Anglais La Grammaire PDF
100% (20)
Bescherelle Anglais La Grammaire PDF
436 pages
Big Data Et Machine Learning Manuel Du Data Scientist by Pirmin Lemberger, Marc Batty, Médéric Morel, Jean-Luc Raffaëlli
100% (4)
Big Data Et Machine Learning Manuel Du Data Scientist by Pirmin Lemberger, Marc Batty, Médéric Morel, Jean-Luc Raffaëlli
237 pages
Exercices Corrigés Python
90% (10)
Exercices Corrigés Python
65 pages
100 Exercices Sur Excel - Pour Aller Plus Loin - (French Edition)
100% (7)
100 Exercices Sur Excel - Pour Aller Plus Loin - (French Edition)
257 pages
Formation Excel PDF (70 Pages Pour Compredndre Et Maitriser Excel) PDF
91% (33)
Formation Excel PDF (70 Pages Pour Compredndre Et Maitriser Excel) PDF
80 pages
Développement D'applications Mobiles Multiplateformes Avec Le Framework Flutter
100% (3)
Développement D'applications Mobiles Multiplateformes Avec Le Framework Flutter
648 pages
41 Fiches Pratiques Pour Maîtriser Les Fonctions Essentielles D - Excel - Benjamin ROCHEREAU
100% (10)
41 Fiches Pratiques Pour Maîtriser Les Fonctions Essentielles D - Excel - Benjamin ROCHEREAU
143 pages
VBA (Visual Basic Application) MS Excel
80% (15)
VBA (Visual Basic Application) MS Excel
267 pages
21 Eni Flutter Application Mobile Avec Dart
100% (6)
21 Eni Flutter Application Mobile Avec Dart
468 pages
Chapitre 1: Aux Bases de Données: Hamdi - [email protected] - TN
Pas encore d'évaluation
Chapitre 1: Aux Bases de Données: Hamdi - [email protected] - TN
50 pages
Chap 3
Pas encore d'évaluation
Chap 3
21 pages
Projet Robot Suiveur de Ligne Arduino
Pas encore d'évaluation
Projet Robot Suiveur de Ligne Arduino
6 pages
Examen 3
Pas encore d'évaluation
Examen 3
2 pages
Un Guide Complet Sur La Réplication SQL Server - Astera
Pas encore d'évaluation
Un Guide Complet Sur La Réplication SQL Server - Astera
10 pages
Exemple de connexion TM31
Pas encore d'évaluation
Exemple de connexion TM31
2 pages
Examen BDR Université Paris Dauphine
50% (2)
Examen BDR Université Paris Dauphine
9 pages
Étudiant en ingénierie systèmes embarqués
Pas encore d'évaluation
Étudiant en ingénierie systèmes embarqués
1 page
Droit pénal des entreprises au Maroc
Pas encore d'évaluation
Droit pénal des entreprises au Maroc
5 pages
Cours Angular Routing
Pas encore d'évaluation
Cours Angular Routing
65 pages
Modèles Entité-Association Université et Services
Pas encore d'évaluation
Modèles Entité-Association Université et Services
4 pages
Application Android : Gestion des Tâches
Pas encore d'évaluation
Application Android : Gestion des Tâches
2 pages
INFO 4, 5, 6eme CG - Copie
Pas encore d'évaluation
INFO 4, 5, 6eme CG - Copie
153 pages
8 Objet Image Cookie
Pas encore d'évaluation
8 Objet Image Cookie
35 pages
Déformée statique d'un treillis 204 éléments
Pas encore d'évaluation
Déformée statique d'un treillis 204 éléments
14 pages
SQL pour gestion du Tour de la Réconciliation
Pas encore d'évaluation
SQL pour gestion du Tour de la Réconciliation
2 pages
Tutorial TP Tournage Catia
Pas encore d'évaluation
Tutorial TP Tournage Catia
40 pages
Exercices Pratiques Linux pour Admins
Pas encore d'évaluation
Exercices Pratiques Linux pour Admins
2 pages
Plan de Cours - MAG50 - État de L'art Du Stockage de Données SAN - NAS
Pas encore d'évaluation
Plan de Cours - MAG50 - État de L'art Du Stockage de Données SAN - NAS
3 pages
Guide PROFIS Cheville 2.3 Hilti
Pas encore d'évaluation
Guide PROFIS Cheville 2.3 Hilti
50 pages
Guide CI/CD et Git pour DevOps
Pas encore d'évaluation
Guide CI/CD et Git pour DevOps
9 pages
Installation et utilisation d'AnyDesk
Pas encore d'évaluation
Installation et utilisation d'AnyDesk
8 pages
Architectures Big Data et Traitements
Pas encore d'évaluation
Architectures Big Data et Traitements
24 pages
Méthodes Numériques d'Interpolation en MATLAB
100% (14)
Méthodes Numériques d'Interpolation en MATLAB
29 pages
CCNA 1 v7 Examen Final Pratique
Pas encore d'évaluation
CCNA 1 v7 Examen Final Pratique
20 pages
Processus de Commande Simplifié
Pas encore d'évaluation
Processus de Commande Simplifié
1 page
Leçon 4.1 - Rédaction Et Amélioration de Textes Professionnels - MD
Pas encore d'évaluation
Leçon 4.1 - Rédaction Et Amélioration de Textes Professionnels - MD
8 pages
Am3440c v22 M PDF
Pas encore d'évaluation
Am3440c v22 M PDF
193 pages
Cana Anamnèse
Pas encore d'évaluation
Cana Anamnèse
1 page
Excel 2007 Exercices r2 Trier Filtrer
Pas encore d'évaluation
Excel 2007 Exercices r2 Trier Filtrer
13 pages
Introduction A La Programmation Native Android1
Pas encore d'évaluation
Introduction A La Programmation Native Android1
89 pages
Data Mining - Gestion de La Relation Client, Personnalisation de Sites Web (René Lefébure, Gilles Venturi)
Pas encore d'évaluation
Data Mining - Gestion de La Relation Client, Personnalisation de Sites Web (René Lefébure, Gilles Venturi)
370 pages
Lettre de Motivation
100% (2)
Lettre de Motivation
1 page
CC1 Groupe 2
Pas encore d'évaluation
CC1 Groupe 2
2 pages