0% ont trouvé ce document utile (0 vote)

360 vues6 pages

Exam Big Data

Transféré par

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

360 vues6 pages

Exam Big Data

Transféré par

Belhaj Maram

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Faculté des sciences de Tunis Session principal - Mai 2024

Examen Big Data

Partie I :

1. Qu'est-ce que le Big Data ? (encercler la bonne réponse ) (1 pts)

A. Des ensembles de données volumineux et complexes qui ne peuvent pas être

traités par des méthodes traditionnelles.

B. Un type de logiciel utilisé pour stocker et analyser de grandes quantités de

données.

C. Une approche marketing visant à cibler de larges groupes de consommateurs.

D. Un nouveau paradigme informatique qui permet de traiter et d'analyser des

données en temps réel.

2. Nommer les trois caractéristiques du BIG Data : (1.5 pts)

………………………….

…………………………

………………………….

3. Qu’est ce que le système doit assurer pour respecter les trois caractéristiques : (3 pts)

Le ……………………………. implique que le système doit être …………………..

La ……………………………..implique que le système doit être …………………..

La …………………………… implique que le système doit être …………………….

4.Un ingénieur au sein d'un grand établissement gère un composant crucial du système,
dédié à la collecte et au stockage des données.

Pour optimiser les performances de ce système, l'ingénieur a déployé une machine

performante dotée des caractéristiques suivantes :

Mémoire vive (RAM):

● Capacité: 16 Go
● Type de mémoire: DDR4

1
Faculté des sciences de Tunis Session principal - Mai 2024

● Vitesse: 3200 MHz ou plus

Disque dur:

● Type de disque: SSD

● Capacité: 512 Go ou plus
● Interface: NVMe PCIe 4.0

Suite à la mise en place de cette infrastructure, l'ingénieur fait face à un défi inattendu : la
quantité de données reçues a considérablement augmenté par rapport aux estimations
préliminaires.

Face à cet afflux de données, l'ingénieur envisage d'optimiser les performances de sa

machine en augmentant ses capacités en termes de processeur (CPU), de mémoire vive
(RAM) ...

a. Qu’appelle -t-on cette solution ? (0.5 pts)

………………………………………………………………………………………………

Quelques mois après la mise en place de la solution initiale, l'entreprise a connu une
croissance fulgurante, générant un afflux massif de données traitées à des vitesses sans
précédent.

Face à ce défi croissant, l'ingénieur a proposé d'augmenter les capacités de la machine

pour répondre aux exigences accrues. Cependant, sa proposition a été rejetée par la
direction, qui la jugeait inefficace, et lui a demandé de trouver une solution alternative plus
performante.

b. Proposez lui une solution : (1 pts)

………………………………………………………………………………………………………………………………………………
………………………………………………………………………………………………………………………………………………
………………………………………………

c. Qu’appelle-t-on cette solution? (0.5 pts)

……………………………………………………………………………………………………………

2
Faculté des sciences de Tunis Session principal - Mai 2024

Suite à la mise en place d'un système performant, l'ingénieur a opté pour l'installation de
Hadoop sur plusieurs machines afin de gérer son système Big Data. Ce système est
caractérisé par son hétérogénéité (différents systèmes d’exploitations)

d. Est ce qu’il peut installer Hadoop sur ce système ( cluster )? (0.5 pts)

………………………………………………………………………………………………………………

e. Proposez- lui une architecture d’un cluster composé de 4 machines en spécifiant le

rôle de chaque machine dans un système hadoop .( 2 pts)

………………………………………………………………………………………………………………

a. compléter la figure suivante par les couches de chaque version de Hadoop : (1 pts)

3
Faculté des sciences de Tunis Session principal - Mai 2024

b. Expliquer la limitation de la première version et la raison pour laquelle une nouvelle

couche a été ajoutée dans la deuxième version (des schémas explicatifs peuvent
être inclus si nécessaire).( 3 pts)

………………………………………………………………………………………………………………………………………………
……………………………………………………………………………..…………………………………………………………………
………………………………………………………………………………………………………………………………………………
…………..……………………………………………………………………………………………………………………………………
………………………………………………………………………………………..………………………………………………………
………………………………………………………………………………………………………………………………………………
……………………..…………………………………………………………………………………………………………………………
…………………………………………………………………………………………………..……………………………………………
………………………………………………………………………………………………………………………………………………
………………………………..………………………………………………………………………………………………………………
……………………………………………………………………………………………………………………………………………….

6. Les deux parties suivantes du code représentent les fonctions map et reduce utilisées
pour calculer le nombre d'occurrences de chaque mot dans une liste de phrases.. Veuillez
identifier que représente chaque partie, en vous basant sur la description de leur rôle dans
le calcul de la moyenne. (compléter par map_function ou reduce_function) (1 pts)

def ………………………..(key, values):

# Somme les occurrences du mot
return (key, sum(values))

def ……………………....(phrase):
# Sépare la phrase en mots
words = phrase.lower().split()
# Créer des couples (mot, 1) pour chaque mot
for word in words:
yield (word, 1)

4
Faculté des sciences de Tunis Session principal - Mai 2024

7. Qu’est ce qu’un environnement distribué? (0.5 pts)

………………………………………………………………………………………………………………………………………………
………………………………………………………………………………………………………………………………………………

8. Citer deux solutions techniques différentes pour créer un environnement distribué ou

on peut installer Hadoop et donc construire des cluster hadoop: (1 pts)

Solution 1 : ………………………………………..

Solutions 2 : ………………………………………..

Partie II : QCM (encercler les bonnes réponse ) (3.5 pts)

1. Lequel des solutions suivantes traduit les requêtes SQL en tâches MapReduce :
A. Hive
B. Hbase
C. Pig
D. Kafka

2. Quel est le composant principal de HDFS qui gère l'espace de stockage et l'accès aux
fichiers ?

A. JobTracker
B. TaskTracker
C. NameNode
D. DataNode

3. Quelle est la fonction principale du JobTracker dans Hadoop ?

A. Stocker les données du cluster Hadoop

B. Exécuter les tâches individuelles d'un job
C. Gérer et superviser l'exécution des jobs
D. Communiquer directement avec les clients utilisateurs

4. Quelle est la différence entre une tâche Map et une tâche Reduce dans le framework
MapReduce ?

A. Les tâches Map lisent les données et les écrivent, tandis que les tâches
Reduce ne lisent que les données.

5
Faculté des sciences de Tunis Session principal - Mai 2024

B. Les tâches Map traitent et transforment les données en une forme

intermédiaire, tandis que les tâches Reduce regroupent et agrègent les
résultats des tâches Map.
C. Les tâches Map s'exécutent sur le JobTracker, tandis que les tâches Reduce
s'exécutent sur les DataNodes.
D. Les tâches Map nécessitent une connexion internet, alors que les tâches
Reduce fonctionnent en mode hors ligne.

5. Quelle est la responsabilité principale d'un TaskTracker?

A. Déterminer le nombre de tâches nécessaires pour un job

B. Allouer des ressources aux tâches des jobs
C. Suivre l'état d'avancement du cluster
D. Soumettre des jobs Hadoop au JobTracker

6. Quels sont les deux composants principaux de YARN ?

A. ResourceManager et ApplicationMaster
B. JobTracker et TaskTracker
C. NameNode et DataNode
D. Client et NodeManager

7. Quelle est la responsabilité du ResourceManager dans YARN ?

A. Exécuter les tâches individuelles des jobs Hadoop

B. Gérer l'allocation des ressources de calcul aux applications
C. Stocker les métadonnées du système de fichiers HDFS
D. Soumettre des jobs Hadoop au cluster

Vous aimerez peut-être aussi

Correction Examen Big Data 2024
Pas encore d'évaluation
Correction Examen Big Data 2024
3 pages
Examen BDA Corrigé SR 2223
Pas encore d'évaluation
Examen BDA Corrigé SR 2223
4 pages
Ds Big Data Novembre 2023 Final
Pas encore d'évaluation
Ds Big Data Novembre 2023 Final
3 pages
Exam BD1718 Fin
Pas encore d'évaluation
Exam BD1718 Fin
4 pages
Exemple Examen BIG DATA Partie 1
Pas encore d'évaluation
Exemple Examen BIG DATA Partie 1
7 pages
Analyse Big Data avec Hadoop et MapReduce
100% (1)
Analyse Big Data avec Hadoop et MapReduce
6 pages
Examen Final
Pas encore d'évaluation
Examen Final
3 pages
Examen SP UE
0% (1)
Examen SP UE
4 pages
CTRL - BDSD - 2020-2021 Avec Corrigé
100% (1)
CTRL - BDSD - 2020-2021 Avec Corrigé
3 pages
50 Questions Sur Hadoop
Pas encore d'évaluation
50 Questions Sur Hadoop
8 pages
Test8 Azure 900
Pas encore d'évaluation
Test8 Azure 900
36 pages
TP1 Spark
Pas encore d'évaluation
TP1 Spark
2 pages
Examen Deep Learning - Ing-5-SSIR
Pas encore d'évaluation
Examen Deep Learning - Ing-5-SSIR
3 pages
Atelier 2
Pas encore d'évaluation
Atelier 2
3 pages
Answers-Sécurité Du Cloud19
Pas encore d'évaluation
Answers-Sécurité Du Cloud19
3 pages
SESSION 2 - BASE DE DONNEE NoSQL
Pas encore d'évaluation
SESSION 2 - BASE DE DONNEE NoSQL
20 pages
TP PIG Hadoop
Pas encore d'évaluation
TP PIG Hadoop
3 pages
DS Big Data2024
Pas encore d'évaluation
DS Big Data2024
4 pages
Exam Big Data Version Finale
Pas encore d'évaluation
Exam Big Data Version Finale
7 pages
Corrige Ds Big Data
Pas encore d'évaluation
Corrige Ds Big Data
4 pages
Spark : Analyse Big Data et RDD
Pas encore d'évaluation
Spark : Analyse Big Data et RDD
42 pages
Examen Nosql24
Pas encore d'évaluation
Examen Nosql24
6 pages
Examen SOA et Développement d'API
Pas encore d'évaluation
Examen SOA et Développement d'API
6 pages
Ventes Totales par Produit et Région
100% (1)
Ventes Totales par Produit et Région
5 pages
QCM Big Data : Testez vos connaissances
Pas encore d'évaluation
QCM Big Data : Testez vos connaissances
2 pages
Correction Examen
Pas encore d'évaluation
Correction Examen
5 pages
TP3 Hadoop Exercices
Pas encore d'évaluation
TP3 Hadoop Exercices
2 pages
DS Virt-Cloud
Pas encore d'évaluation
DS Virt-Cloud
2 pages
quiz-CloudComputing - 20232024-Questions Enregistrées Depuis Le Contexte Test Examen Cloud Computing.-20241224-0848
Pas encore d'évaluation
quiz-CloudComputing - 20232024-Questions Enregistrées Depuis Le Contexte Test Examen Cloud Computing.-20241224-0848
3 pages
C. Sr-Iov
Pas encore d'évaluation
C. Sr-Iov
10 pages
Spark-Td 1
Pas encore d'évaluation
Spark-Td 1
3 pages
Commandes Hadoop
Pas encore d'évaluation
Commandes Hadoop
10 pages
Examen Complexité Mai 2023
Pas encore d'évaluation
Examen Complexité Mai 2023
2 pages
DBA Examen-Control Juillet 2024
Pas encore d'évaluation
DBA Examen-Control Juillet 2024
4 pages
Exercices Sur La Cryptographie
Pas encore d'évaluation
Exercices Sur La Cryptographie
3 pages
Configuration DHCP et Routage Cisco
Pas encore d'évaluation
Configuration DHCP et Routage Cisco
5 pages
SECurite APPlicatif EXAMEN
Pas encore d'évaluation
SECurite APPlicatif EXAMEN
5 pages
Examen Admin Serv Unix 4arctic Rattrapage 2324
Pas encore d'évaluation
Examen Admin Serv Unix 4arctic Rattrapage 2324
6 pages
Examen Réseaux et Systèmes: Questions et Réponses
Pas encore d'évaluation
Examen Réseaux et Systèmes: Questions et Réponses
7 pages
QCM Chat
Pas encore d'évaluation
QCM Chat
12 pages
Questions sur la programmation et exceptions
Pas encore d'évaluation
Questions sur la programmation et exceptions
3 pages
Examen Administration Bases de Données
Pas encore d'évaluation
Examen Administration Bases de Données
5 pages
Titre PDF
Pas encore d'évaluation
Titre PDF
2 pages
Fonctionnalités essentielles de Samba et DNS
Pas encore d'évaluation
Fonctionnalités essentielles de Samba et DNS
10 pages
TP Réseaux: Serveurs et Sockets
Pas encore d'évaluation
TP Réseaux: Serveurs et Sockets
6 pages
Commandes Hadoop
Pas encore d'évaluation
Commandes Hadoop
5 pages
Exercices MapReduce
Pas encore d'évaluation
Exercices MapReduce
3 pages
Création et gestion de types de meubles
Pas encore d'évaluation
Création et gestion de types de meubles
9 pages
Docker Examen2122
Pas encore d'évaluation
Docker Examen2122
8 pages
TP Creation Tablespace
100% (2)
TP Creation Tablespace
2 pages
Correctionexamen1eresessionnfp2142008 2009 PDF Free
100% (1)
Correctionexamen1eresessionnfp2142008 2009 PDF Free
11 pages
TP 2 Sparql
Pas encore d'évaluation
TP 2 Sparql
4 pages
Examen SAR 23-24
Pas encore d'évaluation
Examen SAR 23-24
9 pages
IPNet Routing SR 2223
Pas encore d'évaluation
IPNet Routing SR 2223
4 pages
Examen GL Corrections 1
100% (1)
Examen GL Corrections 1
4 pages
Examen Réseaux 4TIC
Pas encore d'évaluation
Examen Réseaux 4TIC
7 pages
Introduction aux B-arbres et exercices pratiques
Pas encore d'évaluation
Introduction aux B-arbres et exercices pratiques
3 pages
TP3 Systèmes Répartis
100% (1)
TP3 Systèmes Répartis
6 pages
Questions sur le Cloud Computing et Virtualisation
100% (1)
Questions sur le Cloud Computing et Virtualisation
6 pages
Exam Bd1718 SR
Pas encore d'évaluation
Exam Bd1718 SR
5 pages
TD1 Graph Corr
Pas encore d'évaluation
TD1 Graph Corr
37 pages
Partie2 C 2
Pas encore d'évaluation
Partie2 C 2
34 pages
SL Chap2 Alg Bo
Pas encore d'évaluation
SL Chap2 Alg Bo
37 pages
Correction TD 1 Complet
Pas encore d'évaluation
Correction TD 1 Complet
3 pages
Cours ASD1 Chapitre 8
Pas encore d'évaluation
Cours ASD1 Chapitre 8
5 pages
SL Chap2 Alg Bo
Pas encore d'évaluation
SL Chap2 Alg Bo
37 pages
Introduction à la théorie des graphes
Pas encore d'évaluation
Introduction à la théorie des graphes
28 pages
Exam Ana2
Pas encore d'évaluation
Exam Ana2
1 page
Exam Ana
Pas encore d'évaluation
Exam Ana
1 page
Sécurité IoT et Défis V2V/V2X
Pas encore d'évaluation
Sécurité IoT et Défis V2V/V2X
82 pages
TD Complexité Correction
Pas encore d'évaluation
TD Complexité Correction
22 pages
Propagation des ondes électromagnétiques
Pas encore d'évaluation
Propagation des ondes électromagnétiques
32 pages
Exam Alg2-1
Pas encore d'évaluation
Exam Alg2-1
1 page
Corrigé - Révision Liste Chainée
100% (1)
Corrigé - Révision Liste Chainée
9 pages
Exercice Les Nombres de SIERPENSKI
Pas encore d'évaluation
Exercice Les Nombres de SIERPENSKI
10 pages
Fonctions Electroniques
Pas encore d'évaluation
Fonctions Electroniques
73 pages
Analyse de Synthèse en Biologie
Pas encore d'évaluation
Analyse de Synthèse en Biologie
3 pages
Devoir de Synthèse N°1 - Math - 1ère AS (2017-2018) MR Gharbi Taieb
Pas encore d'évaluation
Devoir de Synthèse N°1 - Math - 1ère AS (2017-2018) MR Gharbi Taieb
2 pages
Correction Du Devoir de Contrôle 3 Version 1
Pas encore d'évaluation
Correction Du Devoir de Contrôle 3 Version 1
3 pages
Hala Physique RLC
Pas encore d'évaluation
Hala Physique RLC
7 pages
Devoir de Synthèse N°1 - Math - 1ère AS (2019-2020) MR Dahem Ali
Pas encore d'évaluation
Devoir de Synthèse N°1 - Math - 1ère AS (2019-2020) MR Dahem Ali
2 pages
Correction DS3 Étude
Pas encore d'évaluation
Correction DS3 Étude
3 pages
TP Hadoop
Pas encore d'évaluation
TP Hadoop
50 pages
Langages de requêtes Hadoop expliqués
Pas encore d'évaluation
Langages de requêtes Hadoop expliqués
24 pages
Atelier HDFS
Pas encore d'évaluation
Atelier HDFS
6 pages
NOSQLcours
Pas encore d'évaluation
NOSQLcours
18 pages
BIG DATA - Niv III PP 1&2 - 023-024
Pas encore d'évaluation
BIG DATA - Niv III PP 1&2 - 023-024
15 pages
Langages Big Data : Scala, Python, R, Java, Go
Pas encore d'évaluation
Langages Big Data : Scala, Python, R, Java, Go
24 pages
Feuilletage 913
Pas encore d'évaluation
Feuilletage 913
30 pages
Exercises For PySpark
Pas encore d'évaluation
Exercises For PySpark
33 pages
Examen BigData SP 1617
Pas encore d'évaluation
Examen BigData SP 1617
6 pages
Programmation Hadoop : Guide du Driver Java
100% (1)
Programmation Hadoop : Guide du Driver Java
11 pages
Apprentissage Statistique et Big Data
100% (1)
Apprentissage Statistique et Big Data
156 pages
Fiche Matière GLSI S5+S6
Pas encore d'évaluation
Fiche Matière GLSI S5+S6
30 pages
Miniprojet BigData
Pas encore d'évaluation
Miniprojet BigData
9 pages
Introduction au Big Data et Hadoop
Pas encore d'évaluation
Introduction au Big Data et Hadoop
104 pages
Hadoop Spark Additional Infos 1
Pas encore d'évaluation
Hadoop Spark Additional Infos 1
14 pages
Chapitre 1 - Introduction Au Big Data
100% (1)
Chapitre 1 - Introduction Au Big Data
22 pages
Outils Big Data et Apache Pig
Pas encore d'évaluation
Outils Big Data et Apache Pig
132 pages
Optimind Winter Le Digital Dans L Assurance VF
Pas encore d'évaluation
Optimind Winter Le Digital Dans L Assurance VF
14 pages
TP 1 Hadoop
Pas encore d'évaluation
TP 1 Hadoop
6 pages
CTRL BDSD 2022-2023
Pas encore d'évaluation
CTRL BDSD 2022-2023
4 pages
Prédiction d'incidents sur Smart Grid
100% (1)
Prédiction d'incidents sur Smart Grid
67 pages
Semaine 1
Pas encore d'évaluation
Semaine 1
61 pages
Cours Ecosystème Big Data
Pas encore d'évaluation
Cours Ecosystème Big Data
151 pages
Ingestion de données avec Apache Flume
Pas encore d'évaluation
Ingestion de données avec Apache Flume
20 pages
Chapitre2 Hadoop MapReduce
Pas encore d'évaluation
Chapitre2 Hadoop MapReduce
28 pages
TP 2 Cluster Hadoop Avec Docker Compose
Pas encore d'évaluation
TP 2 Cluster Hadoop Avec Docker Compose
5 pages
Introduction aux Big Data
Pas encore d'évaluation
Introduction aux Big Data
10 pages
Technologies Big Data II - CH1
Pas encore d'évaluation
Technologies Big Data II - CH1
23 pages
Projet Big Data : Apache Ambari
Pas encore d'évaluation
Projet Big Data : Apache Ambari
9 pages