Voici les reponses aux questions QCM :
1- c) Volume massif de donnees .
2-source de Collection de donnnee big data:
a) Nos actions faites sur Internet,
b) Les journaux,
c) Nos images publiees en ligne,
d) Les enregistrements des cameras de surveillance,
e) Nos deplacements via le GPS des telephones mobiles,
g) Nos messages postes sur les sites de medias sociaux .
3-
b) Analyser l'attente de ses consommateurs,
c) Gerer les stocks,
d) Repondre aux besoins individuels,
e) Imaginer les produits de demain .
4- Elasticsearch:
c) Un outil de traitement de donnees .
exercice 2:
quelle est la difference entre les SGBDR et Big Data ?(brievement)
Les SGBDR (Systemes de Gestion de Bases de Donnees Relationnelles) et le Big
Data sont deux concepts differents.
Les SGBDR sont des systemes de gestion de bases de donnees qui permettent de
stocker, organiser et gerer des donnees structurees dans des tables avec des
relations entre eux.
Ils sont utilises pour stocker des donnees transactionnelles, telles que les
informations de commande, les donnees de facturation, etc.
Le Big Data, en revanche, fait reference a des ensembles de donnees massifs et
complexes qui ne peuvent pas etre traites efficacement par des systemes de
gestion de bases de donnees traditionnels.
Les donnees du Big Data sont souvent non structurees et peuvent provenir de
sources telles que les medias sociaux, les capteurs, les appareils mobiles, etc.
Les technologies Big Data, telles que Hadoop et Spark, sont concues pour
stocker, traiter et analyser ces donnees massives .
En resume, les SGBDR sont utilises pour stocker des donnees transactionnelles
structurees, tandis que le Big Data est utilise pour stocker et analyser des
donnees massives et complexes qui ne peuvent pas etre traitees efficacement par
des systemes de gestion de bases de donnees traditionnels.
exercice 3 :
citer 2 principaux causes de l'avenement du big data brievement
Le Big Data est apparu en raison de plusieurs facteurs:
notamment l'augmentation exponentielle du volume de donnees generees par les
entreprises et les particuliers, ainsi que la nécessite de stocker, de traiter
et d'analyser ces donnees massives
Les progres technologiques ont egalement joue un role important dans
l'avenement du Big Data, en permettant aux entreprises de stocker et de traiter
des quantites de donnees de plus en plus importantes à des couts de plus en plus
bas
exercice 4:
donner les composant d'une architecture big data(en brief)
Les sources de donnees
Le stockage de donnees
Le traitement par lots
L'ingestion de messages
Le traitement des flux
Le magasin de donnees analytiques
L'analyse et les rapports
exercice 5:
citer les different taches effectue par un eco system de big data
Collecte de donnees à partir de sources multiples et variees
Stockage de donnees massives et non structurees
Traitement de donnees en temps reel ou par lots
Analyse de donnees pour extraire des informations exploitables
Visualisation de donnees pour faciliter la comprehension
Securisation des donnees pour proteger la vie privee et la sécurité
Gestion de la qualité des donnees pour garantir leur exactitude et leur
coherence
exercice 6 :
Quelles caracteristiques doit avoir un outil d'analyse du Big Data ?
Scalabilite : Les outils d'analyse du Big Data doivent etre capables de traiter
des volumes massifs de donnees et de s'adapter a des environnements en constante
evolution.
Haute disponibilité : Les outils d'analyse du Big Data doivent etre disponibles
en permanence pour permettre aux utilisateurs d'acceder aux donnees et aux
resultats d'analyse a tout moment.
Traitement en temps reel : Les outils d'analyse du Big Data doivent etre
capables de traiter les donnees en temps reel pour permettre aux utilisateurs de
prendre des decisions en temps reel.
Simplicite d'utilisation : Les outils d'analyse du Big Data doivent etre simples
à utiliser pour permettre aux utilisateurs de travailler efficacement avec les
donnees.
Sécurité: Les outils d'analyse du Big Data doivent etre securises pour proteger
les donnees contre les menaces internes et externes.
Integration : Les outils d'analyse du Big Data doivent être capables de
s’intégrer facilement avec d’autres outils et technologies pour permettre
aux utilisateurs de travailler avec les données de manière transparente.
exercice 7:
que va m'apporter le big data concretement
Amelioration de l'efficacite operationnelle :
Le Big Data peut aider les entreprises a optimiser l'allocation des ressources
et à identifier les domaines des economies peuvent etre realisees.
Personnalisation de l'experience client : Le Big Data permet aux entreprises de
personnaliser l’expérience client en fonction des préférences et des
comportements des clients.
Detection de la fraude : Le Big Data peut aider les entreprises à détecter les
fraudes et les activités suspectes en temps réel.
Innovation : Le Big Data peut aider les entreprises à innover en identifiant de
nouvelles opportunités commerciales et en développant de nouveaux produits et
services.
Analyse predictive : Le Big Data peut aider les entreprises à prévoir les
tendances futures et à prendre des décisions éclairées en conséquence.
Amelioration de la qualité des soins de santé : Le Big Data peut aider les
professionnels de la santé à améliorer la qualité des soins en fournissant
des informations précieuses sur les patients et les traitements.
Optimisation de la chaine d'approvisionnement : Le Big Data peut aider les
entreprises à optimiser la chaîne d’approvisionnement en identifiant les
goulots d’étranglement et les inefficacités.
Amelioration de la sécurité : Le Big Data peut aider les entreprises Ã
améliorer la sécurité en détectant les menaces potentielles et en prenant
des mesures préventives.
exercice 8:
Expliquer brie¨vement les entitees de Big Data :
a/ Volume :
Il fait reference à la quantite massive de donnees generees et recueillies.
Le Big Data implique des ensembles de donnees de taille significative, bien au-
de la de ce que les systemes traditionnels peuvent gerer efficacement.
b/ Variete :
Cela represente la diversite des types de donnees. Les donnees peuvent etre
structurees (bases de donnees relationnelles), non structurees (texte, images,
videos), ou semi-structurees.
Le Big Data englobe une grande variete de formats et de sources de donnees.
c/ Velocite :
Il se refere à la vitesse a laquelle les donnees sont generees, collectees et
traitees.
Le Big Data implique souvent des flux de donnees en temps reel qui necessitent
une capacite d'analyse rapide pour prendre des decisions en temps opportun.
d/ Veracite :
Cela concerne la fiabilite et la qualité des donnees.
Les donnees massives peuvent etre sujettes à des erreurs, des incoherences ou
des duplications, ce qui rend important de garantir la veracite des informations
pour des analyses precises.
e/ Valeur :
Il s'agit de la capacite à extraire des informations significatives et
exploitables a partir des donnees massives.
La valeur des donnees depend de la capacité a les analyser et a en tirer des
insights qui peuvent conduire a des decisions strategiques ou à des
ameliorations operationnelles.*
exercice 9:
Expliquer pourquoi les donnees pilotent le traitement.
Donner un exemple:
Les donnees sont le carburant qui alimente le traitement.
Les donnees sont collectees, organisees, nettoyees, verifiees, analysees et
converties en formats lisibles tels que des graphiques, des documents de texte,
etc.
pour etre interpretees par les systemes informatiques et utilisees par les
employes à l'echelle de l'entreprise .
Les entreprises, grandes ou petites, doivent donc imperativement comprendre la
necessite du traitement des donnees.
Par exemple, une entreprise de vente au detail peut utiliser les donnees de ses
clients pour ameliorer son marketing.
En analysant les donnees d'achat, l'entreprise peut identifier les produits les
plus populaires et les tendances d'achat.
Elle peut ensuite utiliser ces informations pour adapter sa strategie de
marketing et proposer des offres personnalisees à ses clients .