0% ont trouvé ce document utile (0 vote)

112 vues5 pages

Big Data : Défis et Opportunités

Le Big Data désigne une grande quantité de données provenant de diverses sources, caractérisées par leur volume, vélocité et variété. Les entreprises peuvent accéder à des ensembles de données externes pour améliorer leur efficacité sans avoir à générer leurs propres données. Les défis du Big Data incluent le stockage, la sécurité et la gestion des données, tandis que des technologies comme l'Edge et le Fog Computing offrent des solutions pour le traitement et le stockage des données.

Transféré par

Chaima Ayari

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats DOCX, PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

112 vues5 pages

Big Data : Défis et Opportunités

Transféré par

Chaima Ayari

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats DOCX, PDF, TXT ou lisez en ligne sur Scribd

Module 3 : tout générer les données

3.1.1 Qu'est-ce que le Big Data ?

Définition du Big Data : Il désigne une grande quantité de données

provenant de diverses sources comme des capteurs, des sites web, des
objets connectés, etc.

Caractéristiques du Big Data :

 Volume : Une grande quantité de données nécessitant plus d'espace

de stockage.

 Vélocité (Velocity) : Une augmentation rapide du volume des

données.

 Variété : Des données générées dans différents formats (texte,

images, capteurs, etc.).

Exemples de données collectées par les capteurs :

 Maison connectée : 1 Go de données par semaine.

 Voiture autonome : 4 000 Go par jour.

 Secteur minier : 2,4 To par minute.

 Avion Airbus A380 : 1 Po (1 million de Go) de données par vol.

Défis du Big Data : Le stockage, l'analytique et la gestion des données.

Cependant, le Big Data offre des opportunités pour améliorer l'efficacité
des entreprises et la satisfaction client.

3.1.4 Ensembles de données volumineux

Accès aux données : Les entreprises n'ont pas toujours besoin de

générer elles-mêmes de grandes quantités de données (Big Data). De
nombreuses sources de données sont disponibles gratuitement.

Petites entreprises : Les petites entreprises n'ont pas toujours la

capacité d'avoir des capteurs ou une grande variété de données.
Cependant, elles peuvent utiliser des données existantes provenant de
sources publiques ou d'autres entreprises.

Leurres de la collecte de données : Il n'est pas nécessaire pour toutes

les entreprises de collecter leurs propres données pour bénéficier de
l'analyse du Big Data. L'accès à des ensembles de données externes peut
suffire pour tirer des insights précieux.

3.2 Où le Big Data est-il stocké ?

3.2.1 Quels sont les défis du Big Data ?

Croissance exponentielle des données : Le volume de données
générées quotidiennement est énorme (463 exaoctets). Cela pose des
défis de gestion et de stockage pour les entreprises, surtout avec des
données provenant de vidéos, messages, e-mails, images, etc.

Technologies de stockage traditionnelles : Les technologies

classiques et les entrepôts de données ne sont pas suffisamment adaptés
à la quantité croissante de données. Même les solutions cloud de géants
comme Amazon, Google, et Microsoft ont du mal à suivre cette croissance.

Sécurité des données : Avec l'énorme volume de données, la sécurité

devient un problème majeur. Il est crucial de protéger ces données contre
les pertes, les fuites ou les cyberattaques.

Gestion et répartition des données : Au-delà du stockage, il est

nécessaire de gérer et de sécuriser efficacement les données. La
réplication des données et la tolérance aux pannes sont nécessaires pour
éviter la perte de données importantes.

3.2.2 Où stocker le Big Data ?

Stockage sur serveurs dans des data centers : Le Big Data est
généralement stocké sur plusieurs serveurs dans des centres de données
pour assurer la sécurité, l'accessibilité et la redondance

Edge Computing :

 L'Edge computing permet de traiter et stocker les données plus près

de leur source, c'est-à-dire sur les appareils périphériques ou clients,
plutôt que sur des serveurs centralisés.

 Cela réduit la latence, économise de la bande passante et accélère

les communications, car les données sont traitées localement avant
d'être envoyées vers les serveurs pour des analyses approfondies.

 Les données prétraitées sont ensuite stockées à long terme ou

analysées dans le cloud.

Fog Computing : Ce modèle, lié à l'Edge computing, décrit comment des

appareils comme les capteurs ou les serveurs locaux peuvent être utilisés
pour prétraiter et analyser les données avant de les envoyer vers le cloud,
comme dans le cas des aéroports, restaurants ou immeubles connectés.

3.2.3 Le cloud et le cloud computing

Cloud :

 Le cloud désigne un ensemble de serveurs ou data centers

connectés où sont stockées et accessibles des données et services
via Internet.
 Les services de cloud sont fournis par des entreprises comme
Google, Microsoft, et Apple, avec des plateformes comme Google
Drive, iCloud, OneDrive, et Dropbox pour le stockage.

Avantages du cloud pour les particuliers :

 Stockage à distance des fichiers (images, vidéos, etc.), libérant de

l'espace sur les appareils locaux.

 Accès à des applications sans les télécharger.

 Accès aux données et applications depuis n'importe quel appareil, à

tout moment.

Inconvénients du cloud pour les particuliers :

 Les données peuvent être exposées à des risques de sécurité si le

fournisseur de cloud ne garantit pas une protection robuste.

Avantages du cloud pour les entreprises :

 Accessibilité des données depuis n'importe quel endroit.

 Rationalisation des opérations IT en payant uniquement pour les

services nécessaires.

 Réduction des besoins en équipements et maintenance sur site.

3.3 Contribuer à la croissance de l'entreprise grâce au Big Data

3.3.1 Pourquoi les entreprises analysent-elles les données ?

Objectifs de l'analyse des données :

 Comprendre l'impact des produits : L'analyse permet de mieux

comprendre l'usage des produits et services.

 Ajuster les méthodes et objectifs : Cela aide les entreprises à

améliorer leurs processus et à réagir plus rapidement aux besoins
des clients.

 Améliorer les produits : En analysant les données, les entreprises

peuvent proposer de meilleurs produits à leurs clients plus
rapidement.

Types de données traitées :

 Données transactionnelles : Capturées en temps réel, elles aident à

analyser les ventes, les stocks et la production quotidienne.

 Données analytiques : Utilisées pour les analyses stratégiques, elles

aident à prendre des décisions sur des actions à long terme comme
l'ouverture d'une nouvelle usine ou l'embauche de nouveaux
employés.

3.3.2 Sources d'informations

Sources de données diverses :

 Réseaux sociaux : Facebook, Instagram, WhatsApp, TikTok, etc.

 Pages web et moteurs de recherche : Données extraites de sites

HTTP.

 Archives publiques et privées : Données historiques.

Types de données :

 Données structurées : Organisées selon un format spécifique

(ex. : feuilles de calcul, formulaires). Elles sont souvent stockées
dans des formats comme CSV, JSON, ou XML pour assurer la
compatibilité entre différentes applications.

 Données non structurées : Générées de manière « libre » comme

des vidéos, tweets, ou pages web. Elles nécessitent des outils
spécifiques pour le traitement, comme le web scraping (extraction
de données à partir de pages web HTML) et l'utilisation d'APIs
RESTful pour récupérer des données depuis des services web (ex. :
Facebook, Google).

Traitement des données :

 Web scraping : Extraction automatique de données depuis des

pages web pour créer une base de données.

 API RESTful : Interface standardisée pour collecter

automatiquement des données en utilisant HTTP et JSON, facilitant
l'accès à de grands volumes de données générés en continu.

3.3.3 Visualisation des données

Data Mining : Le processus de data mining consiste à extraire des

informations utiles à partir de données brutes en identifiant des schémas
et relations cachées dans de grands ensembles de données.

Choix des graphiques : Le type de graphique à utiliser dépend de

plusieurs facteurs :

 Nombre de variables à afficher

 Nombre de points de données de chaque variable

 Les données sont-elles chronologiques

 Éléments nécessitant une comparaison

Types de graphiques populaires :

 Graphiques à courbes : Utilisés pour afficher des données

chronologiques ou des tendances.

 Graphiques à colonnes : Idéaux pour comparer différentes

catégories.

 Graphiques à barres : Efficaces pour comparer des valeurs entre

des catégories.

 Graphiques à secteurs : Utilisés pour représenter des proportions

ou des parts d'un tout.

 Nuages de points : Utilisés pour visualiser la relation entre deux

variables continues.

Vous aimerez peut-être aussi

Fondement Des Ordinateur FDO - VIII-1
Pas encore d'évaluation
Fondement Des Ordinateur FDO - VIII-1
22 pages
Introduction au Big Data et ses Enjeux
100% (1)
Introduction au Big Data et ses Enjeux
16 pages
Big Data
Pas encore d'évaluation
Big Data
21 pages
Big Data : Définition, Avantages et Défis
Pas encore d'évaluation
Big Data : Définition, Avantages et Défis
12 pages
Comprendre le Big Data et ses usages
100% (1)
Comprendre le Big Data et ses usages
15 pages
Introduction Au Big Data
Pas encore d'évaluation
Introduction Au Big Data
9 pages
Introduction au Big Data
100% (1)
Introduction au Big Data
15 pages
Culture Digitale: Big Data & Data Science
Pas encore d'évaluation
Culture Digitale: Big Data & Data Science
22 pages
Rapport BigData
Pas encore d'évaluation
Rapport BigData
12 pages
Big Data Et Data Mining
Pas encore d'évaluation
Big Data Et Data Mining
14 pages
C01
Pas encore d'évaluation
C01
16 pages
Big Data
Pas encore d'évaluation
Big Data
13 pages
BigData Part1 Introduction
Pas encore d'évaluation
BigData Part1 Introduction
17 pages
Big Data : Révolution des Données
Pas encore d'évaluation
Big Data : Révolution des Données
43 pages
Chapitre Big Data (GLO 642)
Pas encore d'évaluation
Chapitre Big Data (GLO 642)
57 pages
Big DATA MASTER 2 G - Nie Logiciel - R - Seau v1.0 R
Pas encore d'évaluation
Big DATA MASTER 2 G - Nie Logiciel - R - Seau v1.0 R
58 pages
Gestion des Données et Big Data
Pas encore d'évaluation
Gestion des Données et Big Data
4 pages
Support de Cours BIG DATA
Pas encore d'évaluation
Support de Cours BIG DATA
31 pages
Introduction au Big Data et Hadoop
Pas encore d'évaluation
Introduction au Big Data et Hadoop
43 pages
Big Data
100% (4)
Big Data
36 pages
Résumé CH1CH2
Pas encore d'évaluation
Résumé CH1CH2
8 pages
Cours Ecosystème Big Data
Pas encore d'évaluation
Cours Ecosystème Big Data
151 pages
HadoopMapReduce CD 2 1
Pas encore d'évaluation
HadoopMapReduce CD 2 1
72 pages
Big Data
Pas encore d'évaluation
Big Data
31 pages
Big Data Final
Pas encore d'évaluation
Big Data Final
7 pages
Chapitre I Big Data Et Ses Technologies
Pas encore d'évaluation
Chapitre I Big Data Et Ses Technologies
43 pages
Big Data
Pas encore d'évaluation
Big Data
2 pages
NoSQL Part1
Pas encore d'évaluation
NoSQL Part1
23 pages
Résumé-Big Data Et Cloud
Pas encore d'évaluation
Résumé-Big Data Et Cloud
7 pages
Chapitre 4: Management Strate4Gique Des Donnees: 1. L'analyse Des Données Et L'entreprise "Data Driven"
Pas encore d'évaluation
Chapitre 4: Management Strate4Gique Des Donnees: 1. L'analyse Des Données Et L'entreprise "Data Driven"
7 pages
Comprendre le Big Data et ses enjeux
Pas encore d'évaluation
Comprendre le Big Data et ses enjeux
58 pages
Big Data - Generalite
Pas encore d'évaluation
Big Data - Generalite
28 pages
Chapitre 1 - Le Big Data
Pas encore d'évaluation
Chapitre 1 - Le Big Data
33 pages
Lecture 1 Bis
Pas encore d'évaluation
Lecture 1 Bis
53 pages
I. Big Data - Introduction
Pas encore d'évaluation
I. Big Data - Introduction
29 pages
Chap1 Introduction
Pas encore d'évaluation
Chap1 Introduction
44 pages
NoSQL : Révolution du Big Data
Pas encore d'évaluation
NoSQL : Révolution du Big Data
20 pages
Coursbigdata Chap1 - Introduction À Big Data
Pas encore d'évaluation
Coursbigdata Chap1 - Introduction À Big Data
53 pages
Introduction au Big Data et OLAP/OLTP
Pas encore d'évaluation
Introduction au Big Data et OLAP/OLTP
58 pages
BIG DATA - Niv III PP 1&2 - 023-024
Pas encore d'évaluation
BIG DATA - Niv III PP 1&2 - 023-024
15 pages
Big Data Chap 1 - Introduction
Pas encore d'évaluation
Big Data Chap 1 - Introduction
33 pages
Les Entreprises N
Pas encore d'évaluation
Les Entreprises N
13 pages
Introduction Big Data-1
Pas encore d'évaluation
Introduction Big Data-1
55 pages
Tout Savoir Sur Le Big Data
Pas encore d'évaluation
Tout Savoir Sur Le Big Data
9 pages
Tout Savoir Sur Le Big Data
Pas encore d'évaluation
Tout Savoir Sur Le Big Data
9 pages
Cours 29
Pas encore d'évaluation
Cours 29
3 pages
PPT12
Pas encore d'évaluation
PPT12
14 pages
Panorama Du Big Data
Pas encore d'évaluation
Panorama Du Big Data
80 pages
Cours Big Data
Pas encore d'évaluation
Cours Big Data
148 pages
Big Data 2
Pas encore d'évaluation
Big Data 2
89 pages
Cours Big D
Pas encore d'évaluation
Cours Big D
81 pages
Big Data et Bases de Données NoSQL
Pas encore d'évaluation
Big Data et Bases de Données NoSQL
23 pages
Big Data
Pas encore d'évaluation
Big Data
48 pages
Big Data et Cloud: Faits, Intérêts, Défis
Pas encore d'évaluation
Big Data et Cloud: Faits, Intérêts, Défis
67 pages
Big Data - Part1
Pas encore d'évaluation
Big Data - Part1
30 pages
Notes BigData
Pas encore d'évaluation
Notes BigData
4 pages
Etude
Pas encore d'évaluation
Etude
2 pages
About SCCM
Pas encore d'évaluation
About SCCM
2 pages
Stricture Du Rapport
Pas encore d'évaluation
Stricture Du Rapport
2 pages
Dev Ops 2
Pas encore d'évaluation
Dev Ops 2
7 pages
Module 2iot
Pas encore d'évaluation
Module 2iot
8 pages
Configuration Du Serveur NFS Sur Ubuntu 22
100% (1)
Configuration Du Serveur NFS Sur Ubuntu 22
4 pages
Exercices Sandbox
Pas encore d'évaluation
Exercices Sandbox
22 pages
La Ferme Des Sapins de Noel French Edition - Laurie Gilmore
Pas encore d'évaluation
La Ferme Des Sapins de Noel French Edition - Laurie Gilmore
271 pages
Fonctions Avancées Excel 2019
100% (1)
Fonctions Avancées Excel 2019
31 pages
Admin SGBD Commandes
Pas encore d'évaluation
Admin SGBD Commandes
4 pages
Cours Microprocesseurs & Microcontrôleurs
100% (4)
Cours Microprocesseurs & Microcontrôleurs
105 pages
PR Doc - Enr 12 01
Pas encore d'évaluation
PR Doc - Enr 12 01
13 pages
Danhéré 15 30
Pas encore d'évaluation
Danhéré 15 30
16 pages
Application de Gestion pour Grossistes
Pas encore d'évaluation
Application de Gestion pour Grossistes
16 pages
Manuel Du Participant de l'EEIA 2025-1
Pas encore d'évaluation
Manuel Du Participant de l'EEIA 2025-1
19 pages
Rapport Finale
Pas encore d'évaluation
Rapport Finale
96 pages
Solution IoT pour Fuites de Gaz Domestiques
Pas encore d'évaluation
Solution IoT pour Fuites de Gaz Domestiques
140 pages
Cours de Python pour le Lycée
Pas encore d'évaluation
Cours de Python pour le Lycée
130 pages
Pizzicato Pro 3.6 Guide Complet de L'utilisateur
100% (1)
Pizzicato Pro 3.6 Guide Complet de L'utilisateur
996 pages
Level Up 5eme
Pas encore d'évaluation
Level Up 5eme
20 pages
Compétences en marketing et service client
Pas encore d'évaluation
Compétences en marketing et service client
4 pages
Mémoire Corrigé ASSANI Nourou-Deen
Pas encore d'évaluation
Mémoire Corrigé ASSANI Nourou-Deen
88 pages
L'ANZA
Pas encore d'évaluation
L'ANZA
21 pages
SSH Protocole
100% (1)
SSH Protocole
16 pages
Ce408 FR
Pas encore d'évaluation
Ce408 FR
40 pages
Microbit Decouverte Activite v3
100% (1)
Microbit Decouverte Activite v3
16 pages
Reférentiel de Formation CMA-MVT
0% (1)
Reférentiel de Formation CMA-MVT
126 pages
Formules Excel pour calculer primes et salaires
Pas encore d'évaluation
Formules Excel pour calculer primes et salaires
4 pages
CV Nadim Ben Abid Français Final Converti
Pas encore d'évaluation
CV Nadim Ben Abid Français Final Converti
2 pages
Guide Deploiement Inside BI
Pas encore d'évaluation
Guide Deploiement Inside BI
20 pages
Modes D'adressage
Pas encore d'évaluation
Modes D'adressage
23 pages
Agents IA Et Plateforme n8n
Pas encore d'évaluation
Agents IA Et Plateforme n8n
11 pages
Guide d'utilisation JDSU MTS 2000
Pas encore d'évaluation
Guide d'utilisation JDSU MTS 2000
11 pages
Câblage et équipements armoire électrique
Pas encore d'évaluation
Câblage et équipements armoire électrique
2 pages
Administration Des Réseaux Étendus
Pas encore d'évaluation
Administration Des Réseaux Étendus
3 pages
Quotidien N°4278-X - 034826
Pas encore d'évaluation
Quotidien N°4278-X - 034826
71 pages
Leviers de la transformation digitale au Maroc
Pas encore d'évaluation
Leviers de la transformation digitale au Maroc
12 pages