0% ont trouvé ce document utile (0 vote)

136 vues23 pages

Introduction à Hadoop et HDFS

Transféré par

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

136 vues23 pages

Introduction à Hadoop et HDFS

Transféré par

diddy

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

1

REPUBLIQUE ALGERIENNE DEMOCRATIQUE ET POPULAIRE

MINISTERE DE L’ENSEIGNEMENT SUPERIEUR ET DE LA
RECHERCHE SCIENTIFIQUE

UNIVERSITE BADJI MOKHTAR ANNABA

FACULTE DES SCIENCES DE L’INGENIORAT
DEPARTEMENT INFORMATIQUE

HADOOP MAPREDUCE

Master : Gestion et Analyse des Données Massives (GADM)

2eme année

Dr. Klai Sihem

Avant propos. . .

Le Big Data est une science récente qui a surgie avec l’évolution et la varia-
tion des données et d’applications mises et échangées en ligne. Cette science
consiste à prendre en charge d’une manière efficace un volume important
des données hétérogènes en intégrant des techniques et outils nouveaux, vu
que la technologie disponible ne répond plus aux besoins.
Ce polycopié est un support pédagogique qui permet d’initier l’étudiant au
domaine des Big Data. Ce cours composé de plusieurs chapitres permet aux
étudiants de comprendre la problématique et la motivation du domaine, et
de maîtriser l’outil Hadoop avec le modèle MapReduce associé à ce domaine.

Chaque chapitre est élaboré pour répondre à un but pédagogique bien

précis, se matérialisant par des explications, définitions accompagnées
d’exemples et des illustrations par des figures suivies par des exercices,
des solutions envisageables ou des fiches de travaux pratiques bien guidés.

1. Le chapitre I met l’étudiant dans le contexte du Big Data, consiste à lui

donner des connaissances générales sur le domaine ;

2. Le chapitre II est consacré à l’étude de Hadoop, le framework qui per-

met le développement d’applications traitant les données massives. Ce
chapitre donne les notions les plus générales avec la procédure d’instal-
lation du logiciel ;

3. Le chapitre III détaille la partie qui s’occupe du stockage des données

"HDFS", avec la possibilité de la manipulation de ces données selon deux
manières différentes à savoir : les commandes et l’API JAVA ;

3
4 Avant propos. . .

4. Le chapitre IV étudie en détail la partie traitement des données massives

"MapReduce", le modèle qui permet de traiter des blocs de données sé-
parément et parallèlement dans des machines connectées. La modélisa-
tion selon le paradigme MapReduce est une étape importante avant le
développement des programmes ;

5. Le chapitre V détaille l’implémentation des programmes MapReduce

dans Hadoop. Dans le cadre de ce chapitre, nous étudions l’implémen-
tation des programmes en utilisant le langage Java. D’autres langages
peuvent être utilisés pour écrire des programmes mapreduce, mais cette
partie n’est pas traiteé dans ce cours.

L’élaboration de ce polycopié a été inspirée de plusieurs documents, j’ai pris

le soin de les citer dans la partie bibliographie, d’autres documents aussi ont
été cité afin d’apporter aux lecteurs plus de commandes et plus de détails sur
les parties traitées dans ce cours.
Terminologie. . .

JVM : Java virtuelle machine

HDFS : Hadoop Distributed File System
YARN : Yet Another Ressource Negociator
AM : Application Master
API java : Application Programming Interfaces java

5
Table des matières

Préface 3

Table des matières 6

Liste des figures 7

1 HDFS : Hadoop Distributed File System 1

1.1 Organisation des fichiers dans HDFS . . . . . . . . . . . . . . . . 2
1.2 Organisation des machines et Fonctionnement de HDFS . . . . . 3
1.3 Manipuler HDFS . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.3.1 Manipulation de HDFS via des commandes . . . . . . . . . . . . 5
1.3.2 Manipulation de HDFS via l’API Java . . . . . . . . . . . . . . . 6
1.4 Ecriture et Lecture des données dans HDFS . . . . . . . . . . . . 7
1.4.1 Ecriture d’un fichier de données dans HDFS . . . . . . . . . . . . 7
1.4.2 Lecture d’un fichier de données dans HDFS . . . . . . . . . . . . 8

A Annexes 11

Bibliographie 13

6
Liste des figures

1.1 Exemple de découpage d’un fichier en blocs 04 . . . . . . . . . . 2

1.2 Les blocs en HDFS 06 . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.3 Ecriture d’un fichier HDFS . . . . . . . . . . . . . . . . . . . . . . 8
1.4 Lecture d’un Fichier HDFS . . . . . . . . . . . . . . . . . . . . . . 9

7
HDFS : Hadoop Distributed File 1
System

Objectif Pédagogique

A la fin de ce chapitre, l’étudiant maîtrisera le fonctionnement de la partie

"stockage des données de Hadoop (HDFS)". Il connaîtra :
— La façon dont sont organisés les fichiers dans HDFS ;
— La façon dont sont organisées les machines ;
— la manipulation des données HDFS en utilisant les commandes ou via
des programmes java.

Pré-requis

L’étudiant doit avoir :

— Des connaissances sur le Système de Gestion des fichiers classiques ;
— Les bases du langage Java ;
— Installer Hadoop et maîtriser ses concepts.

1
CHAPITRE 1. HDFS : HADOOP DISTRIBUTED FILE SYSTEM

H DFS (Hadoop Distributed File System) est un système de fichiers distri-

bué, c’est la partie qui se charge du stockage et d’accès aux données.
Il permet le stockage distribué des fichiers de très grande taille.

1.1 Organisation des fichiers dans HDFS

Dans HDFS, les fichiers sont organisés de la façon suivante : 10

— Ils sont stockés sur un grand nombre de machines de manière à rendre
invisible la position exacte et l’accès d’un fichier ;
— Physiquement, les fichiers sont découpés en blocs de grande taille (jus-
qu’au 256Mo), par défaut elle est égale à 64 Mo mais elle est configu-
rable. La taille d’un bloc dans HDFS est nettement plus importante que
la taille d’un bloc sur les systèmes classiques. L’intérêt de fournir des
tailles plus grandes permet de réduire le temps d’accès à un bloc ;
— Selon la taille d’un fichier, il lui faudra un certain nombre de blocs. Sur
HDFS, le dernier bloc d’un fichier fait la taille restante. Les blocs sont
numérotés et chaque fichier sait quels blocs il occupe (voir la figure
1.1).

Figure 1.1 – Exemple de découpage d’un fichier en blocs 04

— Ces blocs sont ensuite répartis sur plusieurs machines, permettant de

traiter un même fichier en parallèle. Cela permet de ne pas se limiter

Page 2/14 Universite Badji Mokhtar Annaba Departement Informatique Dr S. KLAI

CHAPITRE 1. HDFS : HADOOP DISTRIBUTED FILE SYSTEM

par la capacité de stockage d’une seule machine et tirer parti de tout

l’espace disponible du cluster de machines ;
— Pour garantir une tolérance aux pannes, les blocs de chaque fichier sont
répliqués, de manière intelligente, sur plusieurs machines ;
— HDFS permet de voir tous les dossiers et fichiers de l’ensemble des
machines du cluster comme un seul arbre, comme s’ils étaient sur le
disque dur local.

1.2 Organisation des machines et Fonctionnement de HDFS

Le cluster HDFS est constitué de machines jouant différents rôles exclu-

sifs entre eux selon une architecture maître-esclave de stockage distribué des
données 1 :

1. Le NameNode (nœud maitre ou master node) : Dans un cluster Hadoop,

le NameNode est la machine ou le nœud qui gère l’espace de noms,
l’arborescence du système de fichiers et les métadonnées des fichiers et
des répertoires :
— Il centralise la localisation des blocs de données répartis dans le clus-
ter. Quand un client sollicite Hadoop pour récupérer un fichier, c’est
via le NameNode que l’information est extraite. Ce nœud va indiquer
au client quels sont les DataNodes qui contiennent les blocs ;
— Le NameNode reçoit régulièrement un rapport de bloc (Block report)
de tous les DataNodes dans le cluster afin de s’assurer que les Da-
taNodes fonctionnent correctement. Le rapport de bloc contient une
liste de tous les blocs d’un DataNode .
— En cas de de défaillance du DataNode , le NameNode choisit de
nouveaux DataNodes pour de nouvelles réplications de blocs de don-
nées, équilibre la charge d’utilisation des disques et gère également
le trafic de communication des DataNodes.
1. http://www.opentuto.com/fonctionnement-de-hdfs/

Page 3/14 Universite Badji Mokhtar Annaba Departement Informatique Dr S. KLAI

CHAPITRE 1. HDFS : HADOOP DISTRIBUTED FILE SYSTEM

2. Le Secondary NameNode effectue des tâches de maintenance pour le

compte du NameNode. Plus précisément, il met à jour le fichier "jour-
nalNode" à intervalles réguliers (par exemple une fois par heure).

3. Le DataNode : les datanodes contiennent des blocs, les mêmes blocs

sont dupliqués sur différents datanodes, par défaut trois fois mais, c’est
configurable. Cela assure :
— Une fiabilité des données en cas de panne d’un datanode ;
— Un accès parallèle par différents processus aux mêmes données.

La figure 1.2 illustre le fonctionnement de HDFS selon l’architecture maître-

esclave.
Explication du schéma :

Figure 1.2 – Les blocs en HDFS 06

1. Le cluster est composé d’une machine Namenode, une machine Secon-

dary Namenode et Trois machines DataNode ;

2. Le fichier "Monfichier.txt" est découpé en trois blocs (notés A,B,C) ;

3. Les datanodes contiennent des blocs (A,B,C). Les mêmes blocs sont du-
pliqués sur deux datanodes distincts ;

Page 4/14 Universite Badji Mokhtar Annaba Departement Informatique Dr S. KLAI

CHAPITRE 1. HDFS : HADOOP DISTRIBUTED FILE SYSTEM

4. Le NameNode contient les métadonnées c.à.d les informations sur les

blocs d’un fichier (référence bloc, son emplacement dans le DataNode,
...) ;

5. Le scondary NameNode contient une copie du contenu du NameNode.

1.3 Manipuler HDFS

Il ya deux possibilités pour manipuler HDFS :

— Soit directement depuis un terminal via les commandes ;
— Soit via l’API Java ;

1.3.1 Manipulation de HDFS via des commandes

Dans cette section, nous citons quelques commandes fournies par Ha-
doop, nous conseillons l’étudiant de consulter la documentation officielle de
Hadoop pour plus de commandes et de détail 2 . Les étudiants sont amenés
à les tester (c’est l’objet du TPN°3 en Annexes)

La commande hdfs dfs

La commande hdfs et ses options permet de gérer les fichiers et les dos-
siers :
hdfs dfs -ls [noms...] (pas d’option -l) : permet d’afficher le contenu d’un dossier.
hdfs dfs -cat nom : permet d’afficher le contenu d’un fichier.
hdfs dfs -mv ancien nouveau : permet de déplacer un fichier d’un répertoire à
un autre.
hdfs dfs -cp ancien nouveau : fait la copie d’un fichier.
hdfs dfs -mkdir nomdossier : permet de créer un dossier.
hdfs dfs -rm -f -r nomdossier : permet de supprimer un dossier.

2. Apache Hadoop//hadoop.apache.org/docs/r2.7.1/hadoop-project-dist/
hadoop-common/FileSystemShell.html

Page 5/14 Universite Badji Mokhtar Annaba Departement Informatique Dr S. KLAI

CHAPITRE 1. HDFS : HADOOP DISTRIBUTED FILE SYSTEM

Echange entre HDFS et le monde

Pour placer un fichier dans HDFS (du fichier source "fichiersrc" au fichier
destinataire "fichierdst"), deux commandes équivalentes :
hdfs dfs -copyFromLocal fichiersrc fichierdst
hdfs dfs -put fichiersrc [fichierdst]
Pour extraire un fichier de HDFS ("fichiersrc" au fichier destinataire "fi-
chierdst"), deux commandes possibles :
hdfs dfs -copyToLocal fichiersrc dst
hdfs dfs -get fichiersrc [fichierdst]

Exemple 1.1 hdfs dfs -mkdir madoc : création d’un dossier "madoc"
hdfs dfs -put poly.pdf madoc : place le fichier dans le dossier "madoc"
hdfs dfs -ls madoc : permet d’afficher le contenu du dossier "madoc"
hdfs dfs -get poly.pdf/mapreduce.pdf : permet de copier le fichier "poly.pdf" vers
le fichier "mapreduce.pdf"

1.3.2 Manipulation de HDFS via l’API Java

Hadoop propose une API Java complète pour accéder aux fichiers de
HDFS. Elle repose sur deux classes principales 10 :
— FileSystem représente l’arbre des fichiers (file system). Cette classe per-
met de copier des fichiers locaux vers HDFS (et inversement), renom-
mer, créer et supprimer des fichiers et des dossiers ;
— FileStatus gère les informations d’un fichier ou dossier tels que : récu-
pérer la taille avec getLen() .
Ces deux classes ont besoin de connaître la configuration du cluster HDFS, à
l’aide de la classe Configuration. D’autre part, les noms complets des fichiers
sont représentés par la classe Path.

Page 6/14 Universite Badji Mokhtar Annaba Departement Informatique Dr S. KLAI

CHAPITRE 1. HDFS : HADOOP DISTRIBUTED FILE SYSTEM

Exemple 1.2 Exemple de programme de manipulations sur un fichier : Il s’agit de renommer le

fichier "test.txt" en "monFichier.txt"

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.FileSystem;

import org.apache.hadoop.fs.FileStatus;

import org.apache.hadoop.fs.Path;

Configuration conf = new Configuration();

FileSystem fs = FileSystem.get(conf);

Path nomP = new Path("/user/projet", "test.txt");

FileStatus infos = fs.getFileStatus(nomP);

System.out.println(Long.toString(infos.getLen()));

fs.rename(nomP, new Path("/user/projet","monFichier.txt"));

1.4 Ecriture et Lecture des données dans HDFS

1.4.1 Ecriture d’un fichier de données dans HDFS

Si on souhaite écrire un fichier dans HDFS, on utilise un client Hadoop,

figure 1.3 04, 05, 09 :

1. Le client indique au name node qu’il souhaite écrire un bloc ;

2. Le name node indique le data node à contacter ;

3. Le client envoie le bloc au data node ;

4. Les data nodes répliquent les blocs entre eux ;

5. Le cycle se répète pour le bloc suivant.

Exemple 1.3 Exemple de programme qui montre comment créer un fichier HDFS "donnee.txt", il
contiendra le mot "MapReduce" :

Page 7/14 Universite Badji Mokhtar Annaba Departement Informatique Dr S. KLAI

CHAPITRE 1. HDFS : HADOOP DISTRIBUTED FILE SYSTEM

Figure 1.3 – Ecriture d’un fichier HDFS

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.FileSystem;

import org.apache.hadoop.fs.FileStatus;

import org.apache.hadoop.fs.Path;

public class HDFSwrite {

public static void main(String[] args) throws IOException {

Configuration conf = new Configuration();

FileSystem fs = FileSystem.get(conf);

Path nomP = new Path("donnee.txt");

if (! fs.exists(nomP)) {

FSDataOutputStream outStream = fs.create(nomP);

outStream.writeUTF("MapReduce ");

outStream.close();}

fs.close();}}

1.4.2 Lecture d’un fichier de données dans HDFS

Si on souhaite lire un fichier dans HDFS, figure 1.4 04, 05, 09 :

1. Le client indique au name node qu’il souhaite lire un fichier ;

Page 8/14 Universite Badji Mokhtar Annaba Departement Informatique Dr S. KLAI

CHAPITRE 1. HDFS : HADOOP DISTRIBUTED FILE SYSTEM

2. Le name node indique sa taille ainsi que les différents data nodes conte-
nant les blocs ;

3. Le client récupère chacun des blocs sur l’un des data nodes ;

4. Si le data node est indisponible, le client en contacte un autre.

Figure 1.4 – Lecture d’un Fichier HDFS

Page 9/14 Universite Badji Mokhtar Annaba Departement Informatique Dr S. KLAI

CHAPITRE 1. HDFS : HADOOP DISTRIBUTED FILE SYSTEM

Exemple 1.4 Exemple de programme qui permet de lire le fichier texte "donnee.txt" :

import java.io.*;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.FileSystem;

import org.apache.hadoop.fs.FileStatus;

import org.apache.hadoop.fs.Path;

public class HDFSread {

public static void main(String[] args) throws IOException {

Configuration conf = new Configuration();

FileSystem fs = FileSystem.get(conf);

Path nomP = new Path("donnee.txt");

FSDataInputStream inStream = fs.open(nomP);

InputStreamReader isr = new InputStreamReader(inStream);

BufferedReader br = new BufferedReader(isr);

String line = br.readLine();

System.out.println(line);

inStream.close();

fs.close();

}}

Page 10/14 Universite Badji Mokhtar Annaba Departement Informatique Dr S. KLAI

Annexes A

11
Bibliographie

[01]. site : Le big data, 2019. URL https://www.lebigdata.fr/

definition-big-data.

[02]. Stephane Vialle, CentraleSuplec. Big Data : Informatique pour les don-
nees et calculs massifs. 24 mai 2017 .

[03]. mohammed zuhair al taie. hadoop ecosystem : an integrated environ-

ment for big data. in big data, guest posts 2015. URL http://blog.
agroknow.com/?p=3810. (Cité page 7.)

[04]. site : Hadoop. 2016. URL http://www.opentuto.com/category/

web-2/big-data/hadoop/. (Cité pages 2, 7 et 8.)

[05]. amal abid. cours big data : Chapitre2 : Hadoop. 2017. URL https:
//fr.slideshare.net/AmalAbid1/cours-big-data-chap2. (Cité
pages 7 et 8.)

[06]. celine hudelot, regis behmo. realisez des cal-

culs distribue sur des donnees massives. 2019.
URL https://openclassrooms.com/fr/courses/
4297166-realisez-des-calculs-distribues-sur-des-donnees-massives.
(Cité pages 7 et 4.)

[07]. Benaouda, Sid Ahmed Amine, implantation du modele mapreduce dans

l’environnement distribue, 2015 . URL http://dspace.univ-tlemcen.
dz.

[08]. Tom White, Hadoop : The Definitive Guide, June 2009 : First Edition.

13
BIBLIOGRAPHIE

[09]. Srinath Perera, Thilina Gunarathne, Hadoop MapReduce Cookbook,

First published : February 2013. (Cité pages 7 et 8.)

[10]. Pierre Nerzic, Outils Hadoop pour le BigData, mars 2018. (Cité pages 2
et 6.)

[11]. marty hall. map reduce 2.0 (input and output).

2013. URL https://www.slideshare.net/martyhall/
hadoop-tutorial-mapreduce-part-4-input-and-output.

[12]. build projects, learn skills, get hired. hadoop mapreduce- java-based
processing framework for big data. URL https://www.dezyre.com/
hadoop-course/mapreduce.

[13]. URL https://hadoop.apache.org/docs/r2.4.1/api/org/

apache/hadoop/mapreduce/.

[14]. URL https://gist.github.com/kzk/712029/

9d0833aac03b23ec226e034d98f5871d9580724e.

[15]. Jeffrey Dean and Sanjay Ghemawat, MapReduce : Simplified Data Pro-
cessing on Large Clusters, 2004 .

[16]. Univ. Lille1- Licence info 3eme annee, Cours nÂ°1 : Introduction Ã la
programmation fonctionnelle, 2013-2014 .

[17] dataflair team. hadoop architecture in detail hdfs,yarn et ma-

preduce. 2019. URL https://data-flair.training/blogs/
hadoop-architecture/.

[18] vlad korolev. hadoop on windows with eclipse. 2008. URL http://
v-lad.org/Tutorials/Hadoop/.

[19]. Donald Miner and Adam Shook. MapReduce Design Patterns. OReilly,
2012.

[20]. Tom White. Hadoop : The Definitive Guide, 4th Edition. OReilly, 2015.

Page 14/14 Universite Badji Mokhtar Annaba Departement Informatique Dr S. KLAI

BIBLIOGRAPHIE 15

[21]. Hadoop Training. 2018. URL https://www.slideshare.net/

AnandMHadoop/session-19-mapreduce.

Vous aimerez peut-être aussi

(Big Data) CHAP2 - HDFS
Pas encore d'évaluation
(Big Data) CHAP2 - HDFS
15 pages
Introduction à Hadoop et MapReduce
Pas encore d'évaluation
Introduction à Hadoop et MapReduce
43 pages
Chapitre 2 HADOOP
Pas encore d'évaluation
Chapitre 2 HADOOP
26 pages
Introduction à Hadoop et HDFS
Pas encore d'évaluation
Introduction à Hadoop et HDFS
74 pages
Introduction Aux Hadoop&MapReduce
Pas encore d'évaluation
Introduction Aux Hadoop&MapReduce
68 pages
ch2 Hadoop 2025 All
Pas encore d'évaluation
ch2 Hadoop 2025 All
108 pages
Slides Big Data PDF
Pas encore d'évaluation
Slides Big Data PDF
45 pages
Bigdata 3
Pas encore d'évaluation
Bigdata 3
89 pages
D3 Architecture Hadoop
Pas encore d'évaluation
D3 Architecture Hadoop
6 pages
Introduction au Big Data et Hadoop
Pas encore d'évaluation
Introduction au Big Data et Hadoop
93 pages
Introduction à Apache Hadoop et HDFS
Pas encore d'évaluation
Introduction à Apache Hadoop et HDFS
42 pages
Chapitre 1 Intoduction Au Big Data
Pas encore d'évaluation
Chapitre 1 Intoduction Au Big Data
63 pages
Introduction au Big Data et Hadoop
Pas encore d'évaluation
Introduction au Big Data et Hadoop
3 pages
Fondements de l'environnement Hadoop
Pas encore d'évaluation
Fondements de l'environnement Hadoop
32 pages
Big Data et Hadoop : Guide Essentiel
Pas encore d'évaluation
Big Data et Hadoop : Guide Essentiel
8 pages
Installation de Hadoop sous Windows
Pas encore d'évaluation
Installation de Hadoop sous Windows
3 pages
Introduction à Hadoop et MapReduce
Pas encore d'évaluation
Introduction à Hadoop et MapReduce
24 pages
Ecosystème Hadoop Chapitre2
Pas encore d'évaluation
Ecosystème Hadoop Chapitre2
12 pages
Chapitre 2 Le Big Data Hadoop HDFS Et MapReduce
Pas encore d'évaluation
Chapitre 2 Le Big Data Hadoop HDFS Et MapReduce
131 pages
Introduction à Hadoop et Big Data
Pas encore d'évaluation
Introduction à Hadoop et Big Data
84 pages
Chapitre 2 - HDFS
Pas encore d'évaluation
Chapitre 2 - HDFS
23 pages
Introduction à l'écosystème Hadoop
Pas encore d'évaluation
Introduction à l'écosystème Hadoop
24 pages
Hadoop Hdfs and Yarn Mapreduce
Pas encore d'évaluation
Hadoop Hdfs and Yarn Mapreduce
63 pages
Cours 02 Intro Hadoop
Pas encore d'évaluation
Cours 02 Intro Hadoop
30 pages
Hadoop (Rihab Chaouch Et Alaa El Ghoul
Pas encore d'évaluation
Hadoop (Rihab Chaouch Et Alaa El Ghoul
17 pages
Introduction à Hadoop et Big Data
Pas encore d'évaluation
Introduction à Hadoop et Big Data
63 pages
Chapitre 2 Hadoop-Part1
100% (1)
Chapitre 2 Hadoop-Part1
26 pages
Introduction à Hadoop et Big Data
Pas encore d'évaluation
Introduction à Hadoop et Big Data
56 pages
Cours Big Data
Pas encore d'évaluation
Cours Big Data
59 pages
Lecture2 Bis
Pas encore d'évaluation
Lecture2 Bis
41 pages
Introduction au Big Data et Hadoop
Pas encore d'évaluation
Introduction au Big Data et Hadoop
16 pages
Chapitre2 Fondements Big Data Hdfs 2025
Pas encore d'évaluation
Chapitre2 Fondements Big Data Hdfs 2025
24 pages
Hadoop
Pas encore d'évaluation
Hadoop
21 pages
EPI BigData Partie4 Hadoop Sagar Samya
Pas encore d'évaluation
EPI BigData Partie4 Hadoop Sagar Samya
48 pages
Cours Pig
Pas encore d'évaluation
Cours Pig
93 pages
Bibidada Final
Pas encore d'évaluation
Bibidada Final
10 pages
Introduction à Hadoop et MapReduce
Pas encore d'évaluation
Introduction à Hadoop et MapReduce
37 pages
BIG DATA & NoSQL - Spark-Scala
Pas encore d'évaluation
BIG DATA & NoSQL - Spark-Scala
71 pages
Part2 Hadoop
Pas encore d'évaluation
Part2 Hadoop
37 pages
Introduction à Hadoop et Calcul Distribué
Pas encore d'évaluation
Introduction à Hadoop et Calcul Distribué
62 pages
Partie 01 - Cours Hadoop
Pas encore d'évaluation
Partie 01 - Cours Hadoop
61 pages
Introduction au Big Data et Hadoop
Pas encore d'évaluation
Introduction au Big Data et Hadoop
84 pages
BD 2
Pas encore d'évaluation
BD 2
62 pages
Big Data Chap 2 - Principes Hadoop
Pas encore d'évaluation
Big Data Chap 2 - Principes Hadoop
51 pages
Introduction à Hadoop et Big Data
Pas encore d'évaluation
Introduction à Hadoop et Big Data
19 pages
Introduction à Hadoop et Big Data
Pas encore d'évaluation
Introduction à Hadoop et Big Data
62 pages
Implementaion Du Big Data
Pas encore d'évaluation
Implementaion Du Big Data
12 pages
Introduction à Hadoop et MapReduce
Pas encore d'évaluation
Introduction à Hadoop et MapReduce
58 pages
Chapitre 2 - Fondement Du Big Data
Pas encore d'évaluation
Chapitre 2 - Fondement Du Big Data
37 pages
Big Data Analytics
Pas encore d'évaluation
Big Data Analytics
31 pages
Introduction à Hadoop et MapReduce
Pas encore d'évaluation
Introduction à Hadoop et MapReduce
53 pages
Introduction à Hadoop et Big Data
Pas encore d'évaluation
Introduction à Hadoop et Big Data
16 pages
Comprendre l'écosystème Hadoop Big Data
Pas encore d'évaluation
Comprendre l'écosystème Hadoop Big Data
22 pages
Cours Big Data2024
Pas encore d'évaluation
Cours Big Data2024
99 pages
Introduction aux principes du Big Data
Pas encore d'évaluation
Introduction aux principes du Big Data
77 pages
HDFS : Architecture et Fonctionnement
Pas encore d'évaluation
HDFS : Architecture et Fonctionnement
19 pages
Introduction à Hadoop pour Big Data
Pas encore d'évaluation
Introduction à Hadoop pour Big Data
94 pages
Installation et Configuration de Hadoop
100% (1)
Installation et Configuration de Hadoop
15 pages
De l'idée au projet : méthode efficace
Pas encore d'évaluation
De l'idée au projet : méthode efficace
1 page
Introduction à Hadoop MapReduce
Pas encore d'évaluation
Introduction à Hadoop MapReduce
28 pages
Chap4 Mapreduce
Pas encore d'évaluation
Chap4 Mapreduce
35 pages
Chapitre1 Mapreduce
Pas encore d'évaluation
Chapitre1 Mapreduce
20 pages
Veille Stratégique : Définition et Types
Pas encore d'évaluation
Veille Stratégique : Définition et Types
12 pages
Examen Final Langue Arabe 2 Eme Anne Cem
Pas encore d'évaluation
Examen Final Langue Arabe 2 Eme Anne Cem
1 page
Économie Numérique : Définition et Enjeux
Pas encore d'évaluation
Économie Numérique : Définition et Enjeux
6 pages
Méthodologie D'observation 1
Pas encore d'évaluation
Méthodologie D'observation 1
10 pages
Administration Avancée des Bases de Données
Pas encore d'évaluation
Administration Avancée des Bases de Données
225 pages
Inventaire Document
Pas encore d'évaluation
Inventaire Document
33 pages
D50102FR20 sg2
Pas encore d'évaluation
D50102FR20 sg2
492 pages
Notions clés sur l'information en entreprise
Pas encore d'évaluation
Notions clés sur l'information en entreprise
115 pages
Guide des Codes d'Erreur BIOS et Windows
Pas encore d'évaluation
Guide des Codes d'Erreur BIOS et Windows
152 pages
Cours Bases de Données Relationnelles Et Administration MySQL
Pas encore d'évaluation
Cours Bases de Données Relationnelles Et Administration MySQL
39 pages
Mon Cahier D - Informatique 3 - SC
Pas encore d'évaluation
Mon Cahier D - Informatique 3 - SC
5 pages
Cours de Modélisation de Bases de Données
100% (1)
Cours de Modélisation de Bases de Données
98 pages
Exposé Sur Mysql
Pas encore d'évaluation
Exposé Sur Mysql
5 pages
Comportement des consommateurs en supermarchés
Pas encore d'évaluation
Comportement des consommateurs en supermarchés
14 pages
Extrait Du Livre
Pas encore d'évaluation
Extrait Du Livre
6 pages
TM Compression 2020
Pas encore d'évaluation
TM Compression 2020
24 pages
Composants et Éditions de SQL Server 2012
Pas encore d'évaluation
Composants et Éditions de SQL Server 2012
8 pages
Architecture des bases de données Oracle
Pas encore d'évaluation
Architecture des bases de données Oracle
27 pages
SQLite Tout Savoir Sur Cette Base de Données Embarquée
Pas encore d'évaluation
SQLite Tout Savoir Sur Cette Base de Données Embarquée
5 pages
1 AAR Slides OracleX6
Pas encore d'évaluation
1 AAR Slides OracleX6
51 pages
Création et Utilité des Vues SQL
Pas encore d'évaluation
Création et Utilité des Vues SQL
11 pages
ch3 CRUD
Pas encore d'évaluation
ch3 CRUD
32 pages
Gammu et MySQL : Guide d'Utilisation
Pas encore d'évaluation
Gammu et MySQL : Guide d'Utilisation
7 pages
EXamEnBI 3LFIG
100% (4)
EXamEnBI 3LFIG
4 pages
Examen Blanc BD L2 2024 VF
Pas encore d'évaluation
Examen Blanc BD L2 2024 VF
2 pages
SQL Server Administration
100% (2)
SQL Server Administration
83 pages
Programmes Java pour la gestion de fichiers
Pas encore d'évaluation
Programmes Java pour la gestion de fichiers
3 pages
Notes de Cours de SGBD Via ACCESS
Pas encore d'évaluation
Notes de Cours de SGBD Via ACCESS
70 pages
Introduction aux Bases de Données et SGBD
Pas encore d'évaluation
Introduction aux Bases de Données et SGBD
52 pages
Guide Oracle pour Administrateurs
Pas encore d'évaluation
Guide Oracle pour Administrateurs
131 pages
TP Oracle : Gestion des utilisateurs et privilèges
Pas encore d'évaluation
TP Oracle : Gestion des utilisateurs et privilèges
3 pages
TP-MongoDB Jellali Abdeslem
Pas encore d'évaluation
TP-MongoDB Jellali Abdeslem
23 pages
Blocs de données dans STEP 7
Pas encore d'évaluation
Blocs de données dans STEP 7
11 pages