Examen - Big Data: 1 Exercice I: Hadoop Est Mort... Vive Hadoop ! (10pts)

Le document est un examen sur le Big Data, centré sur Hadoop et ses défis contemporains. Il aborde les raisons du déclin de Hadoop, notamment la montée du cloud et la concurrence avec d'autres technologies comme Apache Spark. L'examen comprend également des questions à choix multiples sur les caractéristiques techniques de Hadoop et d'autres outils Big Data.

Transféré par

no one

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

176 vues3 pages

Examen - Big Data: 1 Exercice I: Hadoop Est Mort... Vive Hadoop ! (10pts)

Transféré par

no one

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

AU : 2020-2021

Section : RT4

Examen - Big Data

Date : Juin 2021 Durée : 1h30 Nombre de pages : 1

Responsable du cours : Dr. Lilia Sfaxi Documents AUTORISÉS

1 Exercice I : Hadoop est mort... vive Hadoop ! [10pts]

Plusieurs spécialistes ont prévu depuis bien longtemps la chute de Hadoop comme plateforme
de stockage et de traitement Big Data, au profit d’autres technologies. Un article de Packt publié en
2018 et dramatiquement intitulé : "Why is Hadoop dying ?" commence comme suit :

“ Hadoop has been the definitive big data platform for some time. The name has practi-
cally been synonymous with the field. But while its ascent followed the trajectory of
what was referred to as the ‘big data revolution’, Hadoop now seems to be in danger.
The question is everywhere – is Hadoop dying out ? And if it is, why is it ? Is it be-
cause big data is no longer the buzzword it once was, or are there simply other ways of
working with big data that have become more useful ?
Why is Hadoop dying ?

1. Proposez (brièvement) votre propre réponse à cette question. [2pts]

”
L’article indique que, pourtant, Hadoop était à un moment essentiel à l’évolution du domaine
Big Data.

“ When Hadoop was open sourced in 2007, it opened the door to big data. It brought com-
pute to data, as against bringing data to compute. Organisations had the opportunity
to scale their data without having to worry too much about the cost. It obviously had
initial hiccups with security, the complexity of querying and querying speeds, but all
that was taken care off, in the long run. Still, although querying speeds remained quite
a pain, however that wasn’t the real reason behind Hadoop dying (slowly).
Why is Hadoop dying ?
”
2. Expliquer l’expression : It brought compute to data, as against bringing data to compute. [1pt]
3. Pourquoi dit-on que Hadoop avait des problèmes concernant la complexité du requêtage ?
Comment a-t-on ensuite remédié à cela ? [2pts]
L’article cite les raisons suivantes pour expliquer le déclin de Hadoop :
— As cloud grew, Hadoop started falling
— One person’s big data is another person’s small data
1
— Apache Hadoop vs Apache Spark
— Machine Learning in Hadoop is not straightforward
— Hadoop is not only Hadoop
4. Expliquer brièvement comment est-ce que chacun de ces aspects peuvent justifier les pro-
blèmes rencontrés en utilisant Hadoop. [5pts]

2 Exercice II : QCM [10pts]

Prière de répondre à ces questions en justifiant votre réponse. Toute o non justi est consi
fausse.
1. Comparé aux bases de données relationnelles, Hadoop HDFS .... :
(A) fournit une meilleure intégrité des données
(B) exécute les transactions ACID
(C) est adéquat pour des accès directs vers les données
(D) est plus performant pour réaliser des traitements par lot sur un grand volume de données
2. Dans une configuration de haute disponibilité du NameNode, si le noeud actif échoue, quel
noeud pourra prendre sa place ?
(A) Secondary Name Node
(B) Backup Node
(C) Standby NameNode
(D) Checkpoint Node
3. Le noeud responsable du checkpointing dans Hadoop (1) télécharge la FsImage et le EditLog
du NameNode, puis (2) les fusionne, ensuite (3) sauvegarde la FsImage modifiée ......
(A) Sur le disque
(B) Dans un Journal Node
(C) En la renvoyant au Name Node actif
4. Quel commentaire est faux à propos de Hadoop ?
(A) Hadoop fait partie du projet Apache
(B) Hadoop peut s’exécuter sur des machines banalisées (ordinaires)
(C) Hadoop est un projet Open-Source
(D) Hadoop peut exécuter tous les types de traitements Big Data
5. Quelle affirmation n’est pas correcte concernant Hadoop et Spark ?
(A) Les deux sont des plateformes de traitement de données
(B) Les deux sont des environnements de traitement distribué
(C) Les deux fournissent leurs propres systèmes de fichiers
(D) Les deux utilisent des APIs open-source pour faire le lien entre différents outils
6. Quelle caractéristique de Spark le rend plus performant que Hadoop Map Reduce ?
(A) Utilisation d’un moteur d’exécution de DAG (Direct Acyclic Graph) et le traitment en
mémoire
(B) Support des différents langages tels que Scala, Java, Python, etc.
(C) Les RDDs qui sont immuables et tolérants aux fautes
(D) Aucun des autres choix.
0
7. Quels gestionnaires de ressources est-ce que Spark supporte ?
(A) Standalone Cluster Manager
(B) MESOS
(C) YARN
(D) Toutes les réponses sont correctes.
8. La réplication des données dans Kafka peut résulter en une amélioration de la tolérance aux
fautes. Parmi les propositions suivantes, laquelle est un désavantage de la réplication ?
(A) Un état inconsistant
(B) La perte de données
(C) L’interblocage
(D) Les échecs partiels
9. Dans HBase, un HFile est créé pour chaque .... (indiquer la raison de ce choix dans votre
réponse)
(A) Famille de colonnes
(B) Groupe de colonnes
(C) Colonne
(D) Table
10. Un topic Kafka est configuré avec un facteur de réplication de 5. Deux noeuds du cluster ont
échoué. Les utilisateurs sont inquiets, car ils ont peur de perdre des messages. Comment leur
réponderiez-vous ?
(A) Ils ne doivent plus envoyer des messages jusqu’à ce que les deux serveurs soient restau-
rés.
(B) Ils peuvent continuer à envoyer des messages car la tolérance aux fautes accepte jusqu’à
4 serveurs en échec.
(C) Ils peuvent continuer à envoyer des messages car vous conservez un disque de backup
de tous les messages échangés.

♣ Bon travail

Vous aimerez peut-être aussi

Big Data QCM 1 PDF
Pas encore d'évaluation
Big Data QCM 1 PDF
7 pages
QCM Big Data : Testez vos connaissances
Pas encore d'évaluation
QCM Big Data : Testez vos connaissances
2 pages
DS Big Data2024
Pas encore d'évaluation
DS Big Data2024
4 pages
Ds Big Data Novembre 2023 Final
Pas encore d'évaluation
Ds Big Data Novembre 2023 Final
3 pages
TD2 (Chap3 4)
Pas encore d'évaluation
TD2 (Chap3 4)
6 pages
Exam Big Data Version Finale
Pas encore d'évaluation
Exam Big Data Version Finale
7 pages
Spark et Critique de MapReduce
Pas encore d'évaluation
Spark et Critique de MapReduce
14 pages
TP2 BIGdata
Pas encore d'évaluation
TP2 BIGdata
15 pages
CH 2 Hadoop
Pas encore d'évaluation
CH 2 Hadoop
56 pages
Introduction à HBase et Big Data
Pas encore d'évaluation
Introduction à HBase et Big Data
17 pages
Introduction à Apache Spark
Pas encore d'évaluation
Introduction à Apache Spark
4 pages
Big Data Analytics
Pas encore d'évaluation
Big Data Analytics
31 pages
(Big Data Analytics) CHAP4 - Spark Streaming
Pas encore d'évaluation
(Big Data Analytics) CHAP4 - Spark Streaming
29 pages
TP4 Spark MLlib
Pas encore d'évaluation
TP4 Spark MLlib
7 pages
Architecture Cloud et Big Data
Pas encore d'évaluation
Architecture Cloud et Big Data
70 pages
TP2 Big Data Env Docker
Pas encore d'évaluation
TP2 Big Data Env Docker
3 pages
Apache Spark Interview Questions and
Pas encore d'évaluation
Apache Spark Interview Questions and
19 pages
TP 01 - RDD
Pas encore d'évaluation
TP 01 - RDD
2 pages
Atelier 1 - RDD
0% (1)
Atelier 1 - RDD
1 page
Commandes HDFS et Gestion de Données
Pas encore d'évaluation
Commandes HDFS et Gestion de Données
3 pages
Kafka : Centralisez et Simplifiez vos Flux de Données Temps Réel
Pas encore d'évaluation
Kafka : Centralisez et Simplifiez vos Flux de Données Temps Réel
12 pages
TP Scala
Pas encore d'évaluation
TP Scala
2 pages
tp3 Scala
Pas encore d'évaluation
tp3 Scala
2 pages
Introduction à Spark Streaming
Pas encore d'évaluation
Introduction à Spark Streaming
44 pages
Chap4 MapReduce
Pas encore d'évaluation
Chap4 MapReduce
17 pages
Spark SQL: Architecture et Fonctionnalités
Pas encore d'évaluation
Spark SQL: Architecture et Fonctionnalités
42 pages
Titre PDF
Pas encore d'évaluation
Titre PDF
2 pages
TP Sparks QL
Pas encore d'évaluation
TP Sparks QL
19 pages
SGD TD2
Pas encore d'évaluation
SGD TD2
4 pages
HadoopMapReduce CD 2 1
Pas encore d'évaluation
HadoopMapReduce CD 2 1
72 pages
MapReduce : Programmation Distribuée et Tolérance aux Pannes
Pas encore d'évaluation
MapReduce : Programmation Distribuée et Tolérance aux Pannes
6 pages
Spark-Td 1
Pas encore d'évaluation
Spark-Td 1
3 pages
EPI BigData Partie4 Hadoop Sagar Samya
Pas encore d'évaluation
EPI BigData Partie4 Hadoop Sagar Samya
48 pages
Atelier 2
Pas encore d'évaluation
Atelier 2
3 pages
Big Data
Pas encore d'évaluation
Big Data
16 pages
Introduction à Hadoop et MapReduce
Pas encore d'évaluation
Introduction à Hadoop et MapReduce
65 pages
Séance 4 - Cours - Spark - ML - Partie 6
Pas encore d'évaluation
Séance 4 - Cours - Spark - ML - Partie 6
19 pages
HDFS Boufares TP2
Pas encore d'évaluation
HDFS Boufares TP2
8 pages
Guide Nifi Cours
100% (1)
Guide Nifi Cours
3 pages
(Big Data) CHAP5 - Hive
Pas encore d'évaluation
(Big Data) CHAP5 - Hive
18 pages
Design Patterns Hadoop pour Big Data
100% (1)
Design Patterns Hadoop pour Big Data
6 pages
Introduction à Hadoop et MapReduce
Pas encore d'évaluation
Introduction à Hadoop et MapReduce
53 pages
TP3 Big Data : Manipulations Cloudera
100% (1)
TP3 Big Data : Manipulations Cloudera
6 pages
Cours - Spark - Partie 3 Et 4
Pas encore d'évaluation
Cours - Spark - Partie 3 Et 4
46 pages
Introduction à PySpark pour le Big Data
Pas encore d'évaluation
Introduction à PySpark pour le Big Data
2 pages
(Big Data) CHAP3 - MapReduce
Pas encore d'évaluation
(Big Data) CHAP3 - MapReduce
29 pages
Spark : RDD et Transformations Optimisées
Pas encore d'évaluation
Spark : RDD et Transformations Optimisées
11 pages
QCM Apache Spark
Pas encore d'évaluation
QCM Apache Spark
6 pages
Corrige Ds Big Data
Pas encore d'évaluation
Corrige Ds Big Data
4 pages
TD Pyspark
Pas encore d'évaluation
TD Pyspark
2 pages
Chapitre 5-Système Hive Apache - Dec 2023
Pas encore d'évaluation
Chapitre 5-Système Hive Apache - Dec 2023
75 pages
Importer et exporter avec Sqoop
Pas encore d'évaluation
Importer et exporter avec Sqoop
4 pages
Chapitre 2
Pas encore d'évaluation
Chapitre 2
32 pages
Mbds Big Data Hadoop 2019 2020 TP 1
Pas encore d'évaluation
Mbds Big Data Hadoop 2019 2020 TP 1
17 pages
TP Bigdata ApacheSparkRDD
Pas encore d'évaluation
TP Bigdata ApacheSparkRDD
3 pages
Big Data 2 TP n1
Pas encore d'évaluation
Big Data 2 TP n1
11 pages
Installation Cloudera HDFS
Pas encore d'évaluation
Installation Cloudera HDFS
5 pages
Introduction à Apache Hive et Big Data
Pas encore d'évaluation
Introduction à Apache Hive et Big Data
28 pages
TP1 Polytech
Pas encore d'évaluation
TP1 Polytech
11 pages
Examen Big DATA
100% (2)
Examen Big DATA
4 pages
Modèle Booléen
Pas encore d'évaluation
Modèle Booléen
23 pages
Copie de FO-PFE-27 00 Convention de Stage D'été
Pas encore d'évaluation
Copie de FO-PFE-27 00 Convention de Stage D'été
3 pages
Chap1 Sonia
Pas encore d'évaluation
Chap1 Sonia
23 pages
1 Exercice I: Big Data Et Systèmes Embarqués (10pts)
Pas encore d'évaluation
1 Exercice I: Big Data Et Systèmes Embarqués (10pts)
3 pages
DS BigData 2021
Pas encore d'évaluation
DS BigData 2021
2 pages
TD 2, Management Et Leadership Ch4, Rt4, Iia4, Gl4
Pas encore d'évaluation
TD 2, Management Et Leadership Ch4, Rt4, Iia4, Gl4
1 page
Ds 7
Pas encore d'évaluation
Ds 7
3 pages
Alternatives à HDFS et S3 en Big Data
Pas encore d'évaluation
Alternatives à HDFS et S3 en Big Data
8 pages
BD 1
Pas encore d'évaluation
BD 1
17 pages
Cours 4.5. Tce 2024-2025
Pas encore d'évaluation
Cours 4.5. Tce 2024-2025
4 pages
Quiz Secourisme Volley
Pas encore d'évaluation
Quiz Secourisme Volley
3 pages
Corrigé16
Pas encore d'évaluation
Corrigé16
3 pages
Acupuncture SaAm Coréenne - Backup
Pas encore d'évaluation
Acupuncture SaAm Coréenne - Backup
14 pages
Initiatives Vertes de l'AIEM 2016
Pas encore d'évaluation
Initiatives Vertes de l'AIEM 2016
35 pages
Chess Results List
Pas encore d'évaluation
Chess Results List
4 pages
POO Projet 2
Pas encore d'évaluation
POO Projet 2
6 pages
Etapes Enregistrement Des Fournisseurs Dans Quantum Pour Les Soumissions
Pas encore d'évaluation
Etapes Enregistrement Des Fournisseurs Dans Quantum Pour Les Soumissions
43 pages
CV Ouidad Ammar
Pas encore d'évaluation
CV Ouidad Ammar
1 page
Mer Productions - Legfruits
Pas encore d'évaluation
Mer Productions - Legfruits
2 pages
Outils d'analyse stratégique en management
100% (1)
Outils d'analyse stratégique en management
39 pages
Statut Social Allianz
Pas encore d'évaluation
Statut Social Allianz
6 pages
Mycoflor 2014
Pas encore d'évaluation
Mycoflor 2014
16 pages
Expose Edi224
Pas encore d'évaluation
Expose Edi224
4 pages
LR6 Note - de - Calcul
Pas encore d'évaluation
LR6 Note - de - Calcul
5 pages
Questions pour le grand oral S.E.S.
Pas encore d'évaluation
Questions pour le grand oral S.E.S.
2 pages
DLS5 01 FR PDF
Pas encore d'évaluation
DLS5 01 FR PDF
2 pages
Upper Body Maison Romane Kov
Pas encore d'évaluation
Upper Body Maison Romane Kov
23 pages
L'enigme Du Don Sur Maurice Godelier
Pas encore d'évaluation
L'enigme Du Don Sur Maurice Godelier
6 pages
Fsjes Fes
Pas encore d'évaluation
Fsjes Fes
15 pages
CONTROLVENT Coffret Relayage
Pas encore d'évaluation
CONTROLVENT Coffret Relayage
6 pages
Best Corporation 2024 Preparation Classes
Pas encore d'évaluation
Best Corporation 2024 Preparation Classes
4 pages
Algorithmes d'Exclusion Mutuelle
Pas encore d'évaluation
Algorithmes d'Exclusion Mutuelle
36 pages
Releve C - 250807 - 103334
Pas encore d'évaluation
Releve C - 250807 - 103334
2 pages
Évaluation Des Préfixes Et Des Suffixes 3e Année
Pas encore d'évaluation
Évaluation Des Préfixes Et Des Suffixes 3e Année
3 pages
R1 04 Chap1 - Intro
Pas encore d'évaluation
R1 04 Chap1 - Intro
47 pages
Charte D
Pas encore d'évaluation
Charte D
4 pages
1 Un Coproprietaire Peut Il Demander La Resiliation Du Bail D Un Locataire 34482
Pas encore d'évaluation
1 Un Coproprietaire Peut Il Demander La Resiliation Du Bail D Un Locataire 34482
3 pages
Exo Coord Cart 2D
Pas encore d'évaluation
Exo Coord Cart 2D
1 page
Devoir-4-Modèle-3-CORR-2bac-SM - 25-PUB
100% (1)
Devoir-4-Modèle-3-CORR-2bac-SM - 25-PUB
8 pages