Examen Final

Le document est un examen final pour un cours de Big Data et Science de Données, comprenant des questions à choix multiples, des réponses courtes et des questions à développement. Les sujets abordés incluent les concepts clés du Big Data, les applications de la science des données, et les défis liés à la parallélisation des applications. Les étudiants doivent démontrer leur compréhension des outils, des paradigmes et des techniques utilisés dans le domaine.

Transféré par

Rahim Abba

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

450 vues3 pages

Examen Final

Transféré par

Rahim Abba

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

M1 IDO

Université Mohamed Boudiaf M’sila

M’sila, Le 15/01/2025
Faculté MI, Dépt Informatique
Durée : 90 Minutes

Examen Final
Big Data et Science de Données

Exercice 1 : (QCM) (7.5 points)

1. Quel concept est central dans le Big Data pour gérer des données provenant de plusieurs sources ?
a) Mémoire cache
b) Système distribué
c) Processeur multi-cœur
d) Mémoire locale
2. Parmi les types de données suivants, lequel est considéré comme non structuré ?
a) Fichier Excel
b) Base de données relationnelle
c) Image
d) d) Transaction SQL
3. Lequel des paradigmes suivants est utilisé dans le modèle Map-Reduce ?
a) SIMD
b) SPMD
c) NUMA
d) PCIe q
4. La véracité des données fait référence à :
a) La vitesse de traitement des données
b) La qualité et la fiabilité des données
c) La quantité de données générées
d) La diversité des formats de données
5. Les outils comme Hadoop et Spark sont principalement utilisés pour :
a) Gérer des threads dans un système d'exploitation
b) Faciliter le calcul distribué et le traitement des grandes quantités de données
c) Créer des images graphiques
d) Optimiser les disques durs

Exercice 2 : (7.5 points)

1. Expliquez brièvement ce que sont les 5 V du Big Data.

2. Donnez deux exemples concrets d'applications de la science des données dans le secteur de la santé.
3. Décrivez la différence entre un cluster et un cloud.
4. Quelle est la fonction principale d'un accélérateur matériel dans le calcul parallèle ?
5. En quoi le paradigme Map-Reduce permet-il de traiter de grandes quantités de données de manière efficace ?

Exercice 3 : (5 points)

1. Décrivez le schéma de parallélisation SPMD. Quels sont ses avantages et ses limites ?
2. Analysez les défis liés à la parallélisation des applications pour le traitement de plus gros problèmes.
Proposez des solutions pour optimiser ces traitements.

Bon courage
M1 IDO
Université Mohamed Boudiaf M’sila
M’sila, Le 15/01/2025
Faculté MI, Dépt Informatique
Durée : 90 Minutes

Exercice 1 : Questions à choix multiples (QCM) (7.5 points)

1. Quel concept est central dans le Big Data pour gérer des données provenant de plusieurs sources ? Réponse :
b) Système distribué
2. Parmi les types de données suivants, lequel est considéré comme non structuré ? Réponse : c) Image
3. Lequel des paradigmes suivants est utilisé dans le modèle Map-Reduce ? Réponse : b) SPMD
4. La véracité des données fait référence à : Réponse : b) La qualité et la fiabilité des données
5. Les outils comme Hadoop et Spark sont principalement utilisés pour : Réponse : b) Faciliter le calcul
distribué et le traitement des grandes quantités de données

Exercice 2 : Questions à réponse courte (7.5 points)

1. Expliquez brièvement ce que sont les 5 V du Big Data. Réponse : Les 5 V du Big Data sont :
o Volume : Grande quantité de données générées
o Vélocité : Vitesse à laquelle les données sont produites
o Variété : Différents types de données (structurées, semi-structurées, non structurées)
o Véracité : Qualité et fiabilité des données
o Valeur : Potentiel des données à fournir des informations exploitables
2. Donnez deux exemples concrets d'applications de la science des données dans le secteur de la santé. Réponse
:
o Médecine personnalisée : Analyse des dossiers médicaux pour adapter les traitements
o Prévision des épidémies : Anticipation de la propagation des maladies
3. Décrivez la différence entre un cluster et un cloud. Réponse :
o Un cluster est un ensemble de machines connectées par un réseau local et travaillant ensemble pour
exécuter des tâches spécifiques.
o Un cloud permet de louer des ressources informatiques à distance, sans garantie sur la proximité
physique des machines.
4. Quelle est la fonction principale d'un accélérateur matériel dans le calcul parallèle ? Réponse : Un
accélérateur matériel permet d'exécuter des calculs massivement parallèles, augmentant ainsi la vitesse de
traitement des données.
5. En quoi le paradigme Map-Reduce permet-il de traiter de grandes quantités de données de manière efficace ?
Réponse : Le paradigme Map-Reduce divise les tâches en sous-tâches (Map) qui peuvent être traitées en
parallèle, puis regroupe les résultats (Reduce), ce qui permet de traiter de grandes quantités de données de
manière distribuée.

Exercice 3 : Questions à développement (5 points)

1. (2.5 points) Décrivez le schéma de parallélisation SPMD. Quels sont ses avantages et ses limites ? Réponse :
o Le schéma SPMD (Single Program Multiple Data) consiste à exécuter un même programme en
parallèle sur plusieurs données. Chaque tâche exécute le même code mais sur des ensembles de
données différents.
o Avantages : Facile à mettre en œuvre, flexible pour différents types de données.
o Limites : Peut nécessiter des points de synchronisation explicites, et l'équilibrage des charges entre
les tâches peut être complexe.
2. (2.5 points) Analysez les défis liés à la parallélisation des applications pour le traitement de plus gros
problèmes. Proposez des solutions pour optimiser ces traitements. Réponse :
o Défis :
 Gestion des données distribuées
 Synchronisation des tâches
M1 IDO
Université Mohamed Boudiaf M’sila
M’sila, Le 15/01/2025
Faculté MI, Dépt Informatique
Durée : 90 Minutes
 Latence des communications entre machines
o Solutions :
 Utilisation d'architectures NUMA pour optimiser l'accès à la mémoire
 Application de protocoles de synchronisation adaptés, comme les barrières de
synchronisation
 Adoption de frameworks comme Hadoop pour simplifier le développement des applications
parallèles

Vous aimerez peut-être aussi

CTRL - BDSD - 2020-2021 Avec Corrigé
100% (1)
CTRL - BDSD - 2020-2021 Avec Corrigé
3 pages
Examen BDA Corrigé SR 2223
Pas encore d'évaluation
Examen BDA Corrigé SR 2223
4 pages
Exam BD1718 Fin
Pas encore d'évaluation
Exam BD1718 Fin
4 pages
Examen Nosql24
Pas encore d'évaluation
Examen Nosql24
6 pages
Correction Examen Big Data 2024
Pas encore d'évaluation
Correction Examen Big Data 2024
3 pages
Exam Big Data
Pas encore d'évaluation
Exam Big Data
6 pages
Chapitre1 Mapreduce
Pas encore d'évaluation
Chapitre1 Mapreduce
20 pages
50 Questions Sur Hadoop
Pas encore d'évaluation
50 Questions Sur Hadoop
8 pages
Ds Big Data Novembre 2023 Final
Pas encore d'évaluation
Ds Big Data Novembre 2023 Final
3 pages
DS Big Data2024
Pas encore d'évaluation
DS Big Data2024
4 pages
Exam Big Data Version Finale
Pas encore d'évaluation
Exam Big Data Version Finale
7 pages
Corrige Ds Big Data
Pas encore d'évaluation
Corrige Ds Big Data
4 pages
Atelier 2
Pas encore d'évaluation
Atelier 2
3 pages
Spark-Td 1
Pas encore d'évaluation
Spark-Td 1
3 pages
Spark : Analyse Big Data et RDD
Pas encore d'évaluation
Spark : Analyse Big Data et RDD
42 pages
Optimisation et Modélisation SAT
Pas encore d'évaluation
Optimisation et Modélisation SAT
2 pages
SGD TD1
Pas encore d'évaluation
SGD TD1
2 pages
Examen Deep Learning - Ing-5-SSIR
Pas encore d'évaluation
Examen Deep Learning - Ing-5-SSIR
3 pages
Ventes Totales par Produit et Région
100% (1)
Ventes Totales par Produit et Région
5 pages
Architecture Cloud et Big Data
Pas encore d'évaluation
Architecture Cloud et Big Data
70 pages
Introduction aux B-arbres et exercices pratiques
Pas encore d'évaluation
Introduction aux B-arbres et exercices pratiques
3 pages
QCM Big Data : Testez vos connaissances
Pas encore d'évaluation
QCM Big Data : Testez vos connaissances
2 pages
Atelier 1 - RDD
0% (1)
Atelier 1 - RDD
1 page
Questions Reponses Text Mining
Pas encore d'évaluation
Questions Reponses Text Mining
3 pages
Chap IIIfinal
Pas encore d'évaluation
Chap IIIfinal
52 pages
TD N°3 Systèmes Experts: Exercice 1
Pas encore d'évaluation
TD N°3 Systèmes Experts: Exercice 1
2 pages
Big Data QCM 1 PDF
Pas encore d'évaluation
Big Data QCM 1 PDF
7 pages
Modélisation de Graphe avec EMF
Pas encore d'évaluation
Modélisation de Graphe avec EMF
24 pages
TD Ocl
Pas encore d'évaluation
TD Ocl
2 pages
Examen SOA et Développement d'API
Pas encore d'évaluation
Examen SOA et Développement d'API
6 pages
Examen Business Intelligence 2021 2022
Pas encore d'évaluation
Examen Business Intelligence 2021 2022
1 page
TD1 EA Sol
Pas encore d'évaluation
TD1 EA Sol
3 pages
Spark : RDD et Transformations Optimisées
Pas encore d'évaluation
Spark : RDD et Transformations Optimisées
11 pages
Apache Tez Theorique
Pas encore d'évaluation
Apache Tez Theorique
3 pages
Introduction à Hadoop et HDFS
Pas encore d'évaluation
Introduction à Hadoop et HDFS
5 pages
OCP: Principe Ouvert/Fermé en SOLID
Pas encore d'évaluation
OCP: Principe Ouvert/Fermé en SOLID
44 pages
Analyse Big Data avec Hadoop et MapReduce
100% (1)
Analyse Big Data avec Hadoop et MapReduce
6 pages
Examen Complexité Mai 2023
Pas encore d'évaluation
Examen Complexité Mai 2023
2 pages
Test8 Azure 900
Pas encore d'évaluation
Test8 Azure 900
36 pages
Apprentissage Automatique
Pas encore d'évaluation
Apprentissage Automatique
22 pages
BDR Poly2 2010 PDF
Pas encore d'évaluation
BDR Poly2 2010 PDF
16 pages
TD3 Optimisation de Requêtes
100% (1)
TD3 Optimisation de Requêtes
3 pages
TD Classe
0% (1)
TD Classe
3 pages
Kafka
Pas encore d'évaluation
Kafka
52 pages
Notes de Cours de Big Data en L3 LMD INFORMATIQUE INDUSTRIELLE Version Longue Et Detaillees
Pas encore d'évaluation
Notes de Cours de Big Data en L3 LMD INFORMATIQUE INDUSTRIELLE Version Longue Et Detaillees
10 pages
Examen Ilc Bdda2020 2021
Pas encore d'évaluation
Examen Ilc Bdda2020 2021
2 pages
Examen M1 IDSM: Bases de Données Avancées
Pas encore d'évaluation
Examen M1 IDSM: Bases de Données Avancées
4 pages
Ae 2
Pas encore d'évaluation
Ae 2
4 pages
Interrogation et Opérations OLAP sur Cubes de Données
Pas encore d'évaluation
Interrogation et Opérations OLAP sur Cubes de Données
29 pages
TP 2 Sparql
Pas encore d'évaluation
TP 2 Sparql
4 pages
Modélisation Datawarehouse TV et Éducation
Pas encore d'évaluation
Modélisation Datawarehouse TV et Éducation
3 pages
TD Pyspark
Pas encore d'évaluation
TD Pyspark
2 pages
Chapitre 5-Système Hive Apache - Dec 2023
Pas encore d'évaluation
Chapitre 5-Système Hive Apache - Dec 2023
75 pages
Titre PDF
Pas encore d'évaluation
Titre PDF
2 pages
TP#4: Java Avancé - Collections & Gestion Des Exceptions
Pas encore d'évaluation
TP#4: Java Avancé - Collections & Gestion Des Exceptions
2 pages
Application Mobile Météo avec Jauge
Pas encore d'évaluation
Application Mobile Météo avec Jauge
1 page
QCM Chat
Pas encore d'évaluation
QCM Chat
12 pages
Exam Bd1718 SR
Pas encore d'évaluation
Exam Bd1718 SR
5 pages
Devoire Big Data
Pas encore d'évaluation
Devoire Big Data
15 pages
Td1: Hadoop: Exercice 1
75% (4)
Td1: Hadoop: Exercice 1
3 pages
Configuration des Transferts de Zone DNS
Pas encore d'évaluation
Configuration des Transferts de Zone DNS
1 page
Entrepre Cours3
Pas encore d'évaluation
Entrepre Cours3
6 pages
1 Construction D'arbre de Dã©cision 2 Arbre de Dã©cision Et Choix Des PDF
Pas encore d'évaluation
1 Construction D'arbre de Dã©cision 2 Arbre de Dã©cision Et Choix Des PDF
3 pages
Page de garde pour un business plan
Pas encore d'évaluation
Page de garde pour un business plan
3 pages
Configuration des zones DNS pratiques
Pas encore d'évaluation
Configuration des zones DNS pratiques
1 page
Entrepre Cours3
Pas encore d'évaluation
Entrepre Cours3
6 pages
TP 2 Clustering
Pas encore d'évaluation
TP 2 Clustering
2 pages
Corrige 2 3 PDF
Pas encore d'évaluation
Corrige 2 3 PDF
5 pages
Modèle Entité-Association en Bases de Données
100% (1)
Modèle Entité-Association en Bases de Données
47 pages
Réseaux et Télécommunications: Concepts clés
100% (6)
Réseaux et Télécommunications: Concepts clés
473 pages
Exercice SQL : Création de tables PDF
Pas encore d'évaluation
Exercice SQL : Création de tables PDF
9 pages
Chapter 1
Pas encore d'évaluation
Chapter 1
7 pages
TD 01 2016
100% (1)
TD 01 2016
2 pages
Supervision Feux Tricolores Parking
Pas encore d'évaluation
Supervision Feux Tricolores Parking
2 pages
TP2 PDF
100% (1)
TP2 PDF
5 pages
RT-S2-M6.2-Réseaux - Locaux-TP-Daghouj (1) - 2 PDF
Pas encore d'évaluation
RT-S2-M6.2-Réseaux - Locaux-TP-Daghouj (1) - 2 PDF
33 pages
Table Des Matieres
Pas encore d'évaluation
Table Des Matieres
20 pages
TpSimulateur02 PDF
Pas encore d'évaluation
TpSimulateur02 PDF
5 pages
Comparaison Hub/Switch et Interconnexion Réseaux
Pas encore d'évaluation
Comparaison Hub/Switch et Interconnexion Réseaux
2 pages
Belkhouche
Pas encore d'évaluation
Belkhouche
68 pages
Le Veinard 250906
Pas encore d'évaluation
Le Veinard 250906
16 pages
@lisons - Ensemble Le Kama-Sutra Du Tendre en 69 Extases
Pas encore d'évaluation
@lisons - Ensemble Le Kama-Sutra Du Tendre en 69 Extases
370 pages
E.T Le Texte Descriptif Balzac
Pas encore d'évaluation
E.T Le Texte Descriptif Balzac
2 pages
TD 1 Énoncé Développement Forme Juridique
Pas encore d'évaluation
TD 1 Énoncé Développement Forme Juridique
4 pages
6e s1 Biyem Assi HJ
Pas encore d'évaluation
6e s1 Biyem Assi HJ
2 pages
Mécanique Quantique - Cours
Pas encore d'évaluation
Mécanique Quantique - Cours
45 pages
Retour de produits Cycleon Valenciennes
Pas encore d'évaluation
Retour de produits Cycleon Valenciennes
1 page
Book V1
Pas encore d'évaluation
Book V1
14 pages
Objectifs de Développement Durable
Pas encore d'évaluation
Objectifs de Développement Durable
53 pages
Crai 0065-0536 1900 Num 44 1 16417
Pas encore d'évaluation
Crai 0065-0536 1900 Num 44 1 16417
6 pages
Les 12 Lois Universelles
Pas encore d'évaluation
Les 12 Lois Universelles
3 pages
Méthode Du Commentaire de Texte Exemple Texte de Camus
Pas encore d'évaluation
Méthode Du Commentaire de Texte Exemple Texte de Camus
6 pages
Structure et classification des acides aminés
100% (2)
Structure et classification des acides aminés
200 pages
Offre D'execution Piscine Divo
Pas encore d'évaluation
Offre D'execution Piscine Divo
7 pages
Fondations Profondes : Types et Techniques
100% (2)
Fondations Profondes : Types et Techniques
110 pages
Offre Emploi
Pas encore d'évaluation
Offre Emploi
2 pages
Techniques d'expression française L1
Pas encore d'évaluation
Techniques d'expression française L1
26 pages
Ayad Souad
Pas encore d'évaluation
Ayad Souad
24 pages
Chargé(e) de Clientèle Netflix France
Pas encore d'évaluation
Chargé(e) de Clientèle Netflix France
2 pages
Gastronomie Allemagne-Autriche : Spécialités
Pas encore d'évaluation
Gastronomie Allemagne-Autriche : Spécialités
1 page
Fiche de Prep Vers Les Maths PS S3 P5
Pas encore d'évaluation
Fiche de Prep Vers Les Maths PS S3 P5
2 pages
Analyse SWOT de Really Great Company
Pas encore d'évaluation
Analyse SWOT de Really Great Company
19 pages
Script
Pas encore d'évaluation
Script
1 page
2.PROGRAMME Condense Maths 1er Cycle
Pas encore d'évaluation
2.PROGRAMME Condense Maths 1er Cycle
22 pages
Les Formes de Prière Chrétienne
Pas encore d'évaluation
Les Formes de Prière Chrétienne
4 pages
Les Cinq Hypotheses de Krashen
Pas encore d'évaluation
Les Cinq Hypotheses de Krashen
3 pages
Block Note
Pas encore d'évaluation
Block Note
4 pages
Imecaoudene Schyrine 23007416 Séminaire
Pas encore d'évaluation
Imecaoudene Schyrine 23007416 Séminaire
6 pages
Lecture Linéaire - A La Musique - 2024-25
Pas encore d'évaluation
Lecture Linéaire - A La Musique - 2024-25
2 pages
Besoins Caloriques Chiens Chats Lapins
Pas encore d'évaluation
Besoins Caloriques Chiens Chats Lapins
2 pages