0% ont trouvé ce document utile (0 vote)

62 vues20 pages

Chapitre 1

Transféré par

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PPTX, PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

62 vues20 pages

Chapitre 1

Transféré par

Tareb Nesrine amira

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PPTX, PDF, TXT ou lisez en ligne sur Scribd

BIG DATA

CHAPITRE 1 : INTRODUCTION AU BIG DATA

M1 - SII (2022-2023)
Plan du cours
1) Introduction au Big Data

2) Fondements de l’environnement Hadoop

3) Les modèles de données : les architectures NoSQL

4) Acquisition de données

5) Exploitation des données

2
Qu’est ce que le BIG DATA

 Changement en volume

 Changement d’origine des données (origines variées)

 Changement de structure (semi-structurées, non-structurées)

 Capacités de stockage accrues (stockage dans le Cloud)

 Changement des traitements (batch, flux etc…)

 Evolution des usages (Avertissements, traitements des flux)

3
Qu’est ce que le BIG DATA

Le Big Data fait référence aux volumes de données dynamiques,

volumineux et disparates créés par des personnes, des outils et
des machines. Elle nécessite une technologie innovante et
évolutive pour collecter, héberger et analyser analytiquement la
grande quantité de données collectées afin d’obtenir des
informations en temps réel sur les clients, les risques, les
bénéfices, la performance et la gestion de la productivité d’une
entreprise. (Source : Le Cabinet d’Audit E&Y)

4
Les V du Big Data

5
La Volumétrie (Volume)

En 2021, en 1 minute
d’internet 3 787 915
giga bytes de données
transférées

6
Les V du Big Data

7
La vitesse (vélocité)

Augmentation des besoins de

traitement :

Comment conserver une bonne vitesse ?

Traitement Big Data

Origine Google

8
La vitesse (vélocité)

MapReduce

Traitement parallélisé en Batch

Traitement périodique

9
La valeur

 La maitrise des 3V génère de la valeur

o Valeur stratégique
o Valeur opérationnelle
o Nouvelles opportunités

10
La variété
Le Big Data
Mégadonnées

Structurées Semi-structurées Non-structurées

 Données de reconnaissances faciales

 Logs
 Données sociales
 Mobiles
 Capteurs (IoT : Internet des objets)
11
Les débuts du Big Data

Google

Début des années 2000

Indexation du web entier

Publications de congrès

12
- Le client contacte le maître
Les débuts du Big Data - Distribution des données
- Commodity hardware
Google File System

13
Les débuts du Big Data
Map = Traitement de chaque élément
MapReduce Reduce = Regroupement

14
Les débuts du Big Data

MapReduce a tout son intérêt dans le Big Data car il permet le passage
à l’échelle de traitements sur de gros volumes de données.

Cependant, il faut une infrastructure logicielle dédiée qui permette

d’exécuter le schéma MapReduce de manière distribuée sur un cluster
de machines.

Cette infrastructure c’est le framework Hadoop de la fondation

Apache.

15
Le projet Hadoop

Hadoop est un framework open source écrit en Java et fait partie des
projets de la fondation Apache depuis 2008. Il a été conçu pour
réaliser des traitements distribués sur des données massives.

• La version stable la plus récente est la version 3.3.1

• Hadoop est composé principalement :
 du modèle de programmation MapReduce
 du système de gestion de fichiers HDFS

16
L’écosystème Hadoop

17
L’écosystème Hadoop

18
L’écosystème Hadoop

19
Exemple d’application

Vous aimerez peut-être aussi

Ch1 Big Data
Pas encore d'évaluation
Ch1 Big Data
21 pages
Chapitre1: Introduction: Big Data
Pas encore d'évaluation
Chapitre1: Introduction: Big Data
31 pages
Introduction à Hadoop et Big Data
Pas encore d'évaluation
Introduction à Hadoop et Big Data
25 pages
Introduction au Big Data et ses enjeux
Pas encore d'évaluation
Introduction au Big Data et ses enjeux
20 pages
Lecture 1 Bis
Pas encore d'évaluation
Lecture 1 Bis
53 pages
Big Data
Pas encore d'évaluation
Big Data
31 pages
Introduction au Big Data et ses outils
Pas encore d'évaluation
Introduction au Big Data et ses outils
27 pages
Introduction au Big Data et Hadoop
Pas encore d'évaluation
Introduction au Big Data et Hadoop
174 pages
Introduction au Big Data et Hadoop
Pas encore d'évaluation
Introduction au Big Data et Hadoop
186 pages
Introduction A Big Data
100% (1)
Introduction A Big Data
48 pages
Formation Big Data avec Hadoop
100% (1)
Formation Big Data avec Hadoop
206 pages
Introduction au Big Data et Hadoop
Pas encore d'évaluation
Introduction au Big Data et Hadoop
27 pages
Cours Big Data
Pas encore d'évaluation
Cours Big Data
64 pages
Chapitre1 Mapreduce
Pas encore d'évaluation
Chapitre1 Mapreduce
20 pages
Introduction au Big Data et Hadoop
Pas encore d'évaluation
Introduction au Big Data et Hadoop
104 pages
Cours Big Data
Pas encore d'évaluation
Cours Big Data
64 pages
BigData AllPdfs
Pas encore d'évaluation
BigData AllPdfs
144 pages
Introduction aux enjeux des BIG DATA en France
Pas encore d'évaluation
Introduction aux enjeux des BIG DATA en France
24 pages
Big Data Chap 1 - Introduction
Pas encore d'évaluation
Big Data Chap 1 - Introduction
32 pages
Panorama Du Big Data
Pas encore d'évaluation
Panorama Du Big Data
80 pages
Introduction au Big Data et Hadoop
Pas encore d'évaluation
Introduction au Big Data et Hadoop
75 pages
Big Data Chap 1 - Introduction
Pas encore d'évaluation
Big Data Chap 1 - Introduction
33 pages
Big Data Et Data Mining
Pas encore d'évaluation
Big Data Et Data Mining
14 pages
Outils et Concepts du Big Data
Pas encore d'évaluation
Outils et Concepts du Big Data
43 pages
Chapitre 1 - Introduction Au Big Data
100% (1)
Chapitre 1 - Introduction Au Big Data
22 pages
Big Data and Machine Learning Course. Part No 1
Pas encore d'évaluation
Big Data and Machine Learning Course. Part No 1
96 pages
Chapitre 1 - Big Data
100% (2)
Chapitre 1 - Big Data
30 pages
Big Data
Pas encore d'évaluation
Big Data
48 pages
Gestion et Analyse des Big Data
Pas encore d'évaluation
Gestion et Analyse des Big Data
26 pages
BD 1
Pas encore d'évaluation
BD 1
17 pages
BD NOSQL Seance 1 - Introduction
Pas encore d'évaluation
BD NOSQL Seance 1 - Introduction
12 pages
Cours 1 Architecture - Big Data Fondements de BIG DATA
Pas encore d'évaluation
Cours 1 Architecture - Big Data Fondements de BIG DATA
49 pages
Coursbigdata Chap1 - Introduction À Big Data
Pas encore d'évaluation
Coursbigdata Chap1 - Introduction À Big Data
53 pages
Miniprojet BigData
Pas encore d'évaluation
Miniprojet BigData
9 pages
Cours Modelisation de Grand Volume de Donnees Big Data (M1-SIGL-2025)
Pas encore d'évaluation
Cours Modelisation de Grand Volume de Donnees Big Data (M1-SIGL-2025)
378 pages
BIG DATA - Niv III PP 1&2 - 023-024
Pas encore d'évaluation
BIG DATA - Niv III PP 1&2 - 023-024
15 pages
Rapport sur le Big Data et ses applications
Pas encore d'évaluation
Rapport sur le Big Data et ses applications
13 pages
Introduction au Big Data et ses enjeux
Pas encore d'évaluation
Introduction au Big Data et ses enjeux
23 pages
Introduction au Big Data et ses Défis
Pas encore d'évaluation
Introduction au Big Data et ses Défis
112 pages
Big Data - Generalite
Pas encore d'évaluation
Big Data - Generalite
28 pages
Big Data - Part1
Pas encore d'évaluation
Big Data - Part1
30 pages
Introduction au Big Data
100% (1)
Introduction au Big Data
15 pages
Introduction Au Big Data
Pas encore d'évaluation
Introduction Au Big Data
9 pages
Cours 1 Architecture - Big Data Fondements de BIG DATA
Pas encore d'évaluation
Cours 1 Architecture - Big Data Fondements de BIG DATA
49 pages
Rapport sur le Big Data et ses applications
Pas encore d'évaluation
Rapport sur le Big Data et ses applications
13 pages
Big Data en Entreprise
Pas encore d'évaluation
Big Data en Entreprise
67 pages
Introduction Au Big Data
100% (1)
Introduction Au Big Data
17 pages
Cours Ingénierie Des Données
100% (1)
Cours Ingénierie Des Données
69 pages
Introduction au Big Data et ses enjeux
Pas encore d'évaluation
Introduction au Big Data et ses enjeux
42 pages
Introduction au Big Data et Hadoop
Pas encore d'évaluation
Introduction au Big Data et Hadoop
37 pages
Culture Digitale: Big Data & Data Science
Pas encore d'évaluation
Culture Digitale: Big Data & Data Science
22 pages
Support de Cours BIG DATA
Pas encore d'évaluation
Support de Cours BIG DATA
31 pages
Chap01-Introduction Au Big Data
Pas encore d'évaluation
Chap01-Introduction Au Big Data
25 pages
Chapitre 3 BDA - 2023
Pas encore d'évaluation
Chapitre 3 BDA - 2023
28 pages
Introduction au Big Data et Hadoop
Pas encore d'évaluation
Introduction au Big Data et Hadoop
43 pages
Introduction au Big Data et OLAP/OLTP
Pas encore d'évaluation
Introduction au Big Data et OLAP/OLTP
58 pages
Préparation à la certification Big Data
Pas encore d'évaluation
Préparation à la certification Big Data
42 pages
Big Data
100% (1)
Big Data
88 pages
Introduction aux Big Data et défis clés
Pas encore d'évaluation
Introduction aux Big Data et défis clés
26 pages
Chapitre 4 P2
Pas encore d'évaluation
Chapitre 4 P2
27 pages
Test PDF
100% (2)
Test PDF
1 page
Administration Avancée des Bases de Données
Pas encore d'évaluation
Administration Avancée des Bases de Données
225 pages
Chapitre 1
Pas encore d'évaluation
Chapitre 1
3 pages
Gestion des utilisateurs et droits BDD
Pas encore d'évaluation
Gestion des utilisateurs et droits BDD
25 pages
DataMining 1 2
Pas encore d'évaluation
DataMining 1 2
80 pages
Administration Des Bases de Données
Pas encore d'évaluation
Administration Des Bases de Données
28 pages
Introduction aux Géodonnées et SIG
Pas encore d'évaluation
Introduction aux Géodonnées et SIG
16 pages
Table Space
Pas encore d'évaluation
Table Space
16 pages
SQL: Tables et Requêtes avec Intégrité Référentielle
Pas encore d'évaluation
SQL: Tables et Requêtes avec Intégrité Référentielle
2 pages
Indexation
Pas encore d'évaluation
Indexation
48 pages
Cours Complet Sur Les Principes Techniques Des Composants Clés Du Big Data
Pas encore d'évaluation
Cours Complet Sur Les Principes Techniques Des Composants Clés Du Big Data
6 pages
Introduction au Data Mining et ses Applications
Pas encore d'évaluation
Introduction au Data Mining et ses Applications
47 pages
QCM BDA Université Moulay Ismaïl S3
Pas encore d'évaluation
QCM BDA Université Moulay Ismaïl S3
5 pages
Atelier N°3 Requetes SQL
Pas encore d'évaluation
Atelier N°3 Requetes SQL
12 pages
Legi 059 0049
Pas encore d'évaluation
Legi 059 0049
12 pages
Sécurité des Bases de Données SQL 2019
Pas encore d'évaluation
Sécurité des Bases de Données SQL 2019
4 pages
DS SGBD SMI S5 2018-2019 Session Ordinaire
Pas encore d'évaluation
DS SGBD SMI S5 2018-2019 Session Ordinaire
2 pages
En Euros
Pas encore d'évaluation
En Euros
2 pages
Akpak
Pas encore d'évaluation
Akpak
4 pages
Guide complet sur SQL et types de données
Pas encore d'évaluation
Guide complet sur SQL et types de données
35 pages
Persistance JPA avec Spring Boot
Pas encore d'évaluation
Persistance JPA avec Spring Boot
10 pages
Base de Données Bac Info
Pas encore d'évaluation
Base de Données Bac Info
6 pages
Cours Langage SQL8
Pas encore d'évaluation
Cours Langage SQL8
23 pages
Waytolearnx2 Question Access Et Excel Avec Correction
Pas encore d'évaluation
Waytolearnx2 Question Access Et Excel Avec Correction
37 pages
Empaquetage d'une application Java en JAR et EXE
Pas encore d'évaluation
Empaquetage d'une application Java en JAR et EXE
29 pages
TP1
100% (1)
TP1
3 pages
Guide Veeam Backup pour Pros
Pas encore d'évaluation
Guide Veeam Backup pour Pros
42 pages
Requêtes SQL pour CINEBASE 2023
Pas encore d'évaluation
Requêtes SQL pour CINEBASE 2023
1 page
Gestion NTFS et scripts AD pour utilisateurs
Pas encore d'évaluation
Gestion NTFS et scripts AD pour utilisateurs
8 pages