TP1 Initiation À Hadoop

Transféré par

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

22 vues4 pages

TP1 Initiation À Hadoop

Transféré par

almnvg22

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Yosra KASSIS

TP1: INITIATION A HADOOP

Objectif du TP: Premier pas avec Hadoop.

I. Présentation de Hadoop
Apache Hadoop est un framework open-source pour stocker et traiter les données
volumineuses sur un cluster. Il est utilisé par un grand nombre de contributeurs et utilisateurs.
Il a une licence Apache 2.0.

II. Installation
Ce TP est inspiré de la formation “Intro to Hadoop and MapReduce” fait par Cloudera
(Plateforme de BigData[Link] et publié sur Udacity (Plateforme de
eLearning[Link] Ils fournissent une machine virtuelle où Hadoop, ainsi
qu’un grand nombre d’outils de son écosystème, sont préinstallés.

Etapes d’installation
1. Télécharger la machine virtuelle à partir de l’adresse: [Link]
[Link]/courses/ud617/[Link]. C’est une machine
Linux, distribution CentOS.
2. Dé-zipper le fichier.
3. Télécharger et installer VirtualBox à partir de l’adresse:
[Link]
4. Créer une nouvelle machine virtuelle :
a. Créer une nouvelle machine virtuelle en cliquant sur le bouton ‘New’ :

b. Choisir un nom et mettre le type ‘Linux’ :

1
Yosra KASSIS

c. Cliquer sur ‘Next’.

d. Sélectionner la taille mémoire pour la machine virtuelle :

e. Cliquer sur ‘Next’.

f. Sélectionner ‘Use an existingvirtual hard drive file’, cliquer sur le bouton ‘browse’
et choisir l’image de la machine virtuelle déjà dé-zippée. Puis cliquer sur ‘create’.

g. Démarrer la machine virtuelle.

III. Premiers pas avec Hadoop

- Démarrer votre machine virtuelle et lancer un terminal sous le répertoire
~/udacity_training, vous trouverez deux sous-répertoires: code et data dans lesquels on

2
Yosra KASSIS

trouvera et on sauvegardera respectivement les codes de nos mappers et reducers, et les

données sources et résultat.
- Déplacez-vous sous le répertoire ~/udacity_training/data, et vérifier que le fichier
"[Link]"existe bien.
Toutes les commandes interagissant avec le système Hadoop commencent par hadoop fs.
Ensuite, les options rajoutées sont très largement inspirées des commandes Unix standard.
- Créer un répertoire dans HDFS, appelé myinput. Pour cela, taper:
Hadoop fs –mkdir myinput
- Pour copier le fichier [Link] dans HDFS sous le répertoire myinput, taper la
commande :
Hadoop fs –put [Link] myinput/
- Pour afficher le contenu du répertoire myinput, la commande est :
Hadoop fs –ls myinput

On obtiendra alors le résultat suivant :

Pour visualiser les dernières lignes du fichier, taper :

hadoop fs –tail myinput/[Link]

On obtient alors:

3
Yosra KASSIS

Dans le tableau suivant, nous résumons les commandes les plus utilisées dans Hadoop:

Activité [Link] les différentes fonctions citées ci-dessus pour:

- Créer un répertoire appelé myinput
- Copier le fichier [Link] dans le répertoire myinput
- Afficher les dernières lignes du fichier

Vous aimerez peut-être aussi

TP1 Hadoop-Initiation 2023
Pas encore d'évaluation
TP1 Hadoop-Initiation 2023
4 pages
Tp1 Initiationahadoopetmapreduce 140428050032 Phpapp02
Pas encore d'évaluation
Tp1 Initiationahadoopetmapreduce 140428050032 Phpapp02
8 pages
tp1 Initiationahadoopetmapreduce 140428050032 Phpapp02
100% (1)
tp1 Initiationahadoopetmapreduce 140428050032 Phpapp02
9 pages
TP1 BigDataAnalytics Initiation Hadoop
Pas encore d'évaluation
TP1 BigDataAnalytics Initiation Hadoop
9 pages
tp1 IRS
100% (1)
tp1 IRS
7 pages
Initiation à Hadoop et MapReduce
Pas encore d'évaluation
Initiation à Hadoop et MapReduce
5 pages
TP MapReduce
Pas encore d'évaluation
TP MapReduce
5 pages
TP1 Hadoop
Pas encore d'évaluation
TP1 Hadoop
7 pages
TP1 Hadoop
Pas encore d'évaluation
TP1 Hadoop
2 pages
TP1 Hadoop
Pas encore d'évaluation
TP1 Hadoop
4 pages
tp1 Initiationahadoopetmapreduce 140428050032 Phpapp02
Pas encore d'évaluation
tp1 Initiationahadoopetmapreduce 140428050032 Phpapp02
10 pages
ABL Cloud
100% (1)
ABL Cloud
9 pages
Atelier Big Data : Traitement Batch avec Hadoop
Pas encore d'évaluation
Atelier Big Data : Traitement Batch avec Hadoop
11 pages
1atelier 1 - Installation Hadoop - V23-24
Pas encore d'évaluation
1atelier 1 - Installation Hadoop - V23-24
11 pages
Rapport de Projet Big Data
Pas encore d'évaluation
Rapport de Projet Big Data
25 pages
TP1 Hadoop
Pas encore d'évaluation
TP1 Hadoop
10 pages
TP Hadoop Et Map
Pas encore d'évaluation
TP Hadoop Et Map
4 pages
TP Big Data : Hadoop et MapReduce
Pas encore d'évaluation
TP Big Data : Hadoop et MapReduce
15 pages
Initiation à Hadoop et Map-Reduce
Pas encore d'évaluation
Initiation à Hadoop et Map-Reduce
10 pages
Initiation à Hadoop et MapReduce
100% (4)
Initiation à Hadoop et MapReduce
5 pages
Tp1 Big Data
Pas encore d'évaluation
Tp1 Big Data
8 pages
TP1 Polytech
Pas encore d'évaluation
TP1 Polytech
11 pages
TP Hadoop: Déploiement et MapReduce
Pas encore d'évaluation
TP Hadoop: Déploiement et MapReduce
10 pages
TP 1 Hadoop
Pas encore d'évaluation
TP 1 Hadoop
16 pages
Installation et Configuration de Hadoop
Pas encore d'évaluation
Installation et Configuration de Hadoop
17 pages
Hadoop Install
Pas encore d'évaluation
Hadoop Install
6 pages
TP2 - BD
0% (1)
TP2 - BD
8 pages
TP BD Hadoop
Pas encore d'évaluation
TP BD Hadoop
7 pages
TP N°1 - Installation Via Paquets
100% (1)
TP N°1 - Installation Via Paquets
6 pages
TP1: Installation D'un Cluster Hadoop Avec Docker
Pas encore d'évaluation
TP1: Installation D'un Cluster Hadoop Avec Docker
4 pages
CBD TP
Pas encore d'évaluation
CBD TP
6 pages
TP BigData 01
Pas encore d'évaluation
TP BigData 01
3 pages
Initier Hadoop pour Big Data
Pas encore d'évaluation
Initier Hadoop pour Big Data
7 pages
TP1 - Installation Hadoop Sur VM Linux Part1
Pas encore d'évaluation
TP1 - Installation Hadoop Sur VM Linux Part1
5 pages
TP Hadoop
Pas encore d'évaluation
TP Hadoop
50 pages
TP 1 Hadoop
Pas encore d'évaluation
TP 1 Hadoop
6 pages
Hadoop MapReduce - Apache Sqoop
Pas encore d'évaluation
Hadoop MapReduce - Apache Sqoop
83 pages
TP3 - BD - 2024
Pas encore d'évaluation
TP3 - BD - 2024
5 pages
Compte Rendu tp1
Pas encore d'évaluation
Compte Rendu tp1
9 pages
Mbds Big Data Hadoop 2019 2020 TP 1
Pas encore d'évaluation
Mbds Big Data Hadoop 2019 2020 TP 1
17 pages
TP5Bigdata INDIA 2023 2024
Pas encore d'évaluation
TP5Bigdata INDIA 2023 2024
5 pages
Machine Virtuelle Hadoop Pour Les TP de BigData - EXPLICATIONS - PDC - Qemu
Pas encore d'évaluation
Machine Virtuelle Hadoop Pour Les TP de BigData - EXPLICATIONS - PDC - Qemu
3 pages
Installation de Hadoop sur Linux
100% (1)
Installation de Hadoop sur Linux
10 pages
TP Hadoop
100% (1)
TP Hadoop
15 pages
Guide d'Installation Hadoop
Pas encore d'évaluation
Guide d'Installation Hadoop
13 pages
DS-2-Big Data Et Cloud
Pas encore d'évaluation
DS-2-Big Data Et Cloud
2 pages
Big Data Tps
Pas encore d'évaluation
Big Data Tps
28 pages
Lab 01
Pas encore d'évaluation
Lab 01
10 pages
TP Map Red
Pas encore d'évaluation
TP Map Red
3 pages
Big Data tp1
Pas encore d'évaluation
Big Data tp1
6 pages
TP1 Partie 2
Pas encore d'évaluation
TP1 Partie 2
5 pages
Guide d'Installation Hadoop sous Linux
Pas encore d'évaluation
Guide d'Installation Hadoop sous Linux
17 pages
TP: Commandes Shell Hadoop avec Docker
Pas encore d'évaluation
TP: Commandes Shell Hadoop avec Docker
6 pages
TP 2 Procéduredinstallation de Hadoop 240927 201419
Pas encore d'évaluation
TP 2 Procéduredinstallation de Hadoop 240927 201419
14 pages
TP Bigdata ModouFall
Pas encore d'évaluation
TP Bigdata ModouFall
10 pages
Installation Hadoop 2 sur Ubuntu 16.04
Pas encore d'évaluation
Installation Hadoop 2 sur Ubuntu 16.04
13 pages
Manipulation de Hadoop : HDFS et MapReduce
Pas encore d'évaluation
Manipulation de Hadoop : HDFS et MapReduce
5 pages
TP MapReduce Python
Pas encore d'évaluation
TP MapReduce Python
5 pages
TP - BigData - 02 - مستندات Google
Pas encore d'évaluation
TP - BigData - 02 - مستندات Google
3 pages
Ambari
Pas encore d'évaluation
Ambari
27 pages
Big Data et Hadoop : Concepts clés
Pas encore d'évaluation
Big Data et Hadoop : Concepts clés
75 pages
Apprentissage Statistique et Big Data
100% (1)
Apprentissage Statistique et Big Data
156 pages
Introduction à PIG et Pig Latin
Pas encore d'évaluation
Introduction à PIG et Pig Latin
13 pages
Big Data
100% (1)
Big Data
88 pages
Sundaravel Selvaraj 1398025 202407111659 Resume
Pas encore d'évaluation
Sundaravel Selvaraj 1398025 202407111659 Resume
1 page
Outils et techniques du Big Data
Pas encore d'évaluation
Outils et techniques du Big Data
29 pages
Customer Churn Prediction in Telecom Using Machine
Pas encore d'évaluation
Customer Churn Prediction in Telecom Using Machine
25 pages
ch2 Hadoop 2025 All
Pas encore d'évaluation
ch2 Hadoop 2025 All
108 pages
Big Data & Spark - Scala
Pas encore d'évaluation
Big Data & Spark - Scala
105 pages
Atelier 2 Big Data
Pas encore d'évaluation
Atelier 2 Big Data
14 pages
TP 5
Pas encore d'évaluation
TP 5
25 pages
Analyse de Big Data avec Hive et HDFS
Pas encore d'évaluation
Analyse de Big Data avec Hive et HDFS
27 pages
1 Big Data Introduction
Pas encore d'évaluation
1 Big Data Introduction
66 pages
Introduction à Hadoop et Big Data
Pas encore d'évaluation
Introduction à Hadoop et Big Data
25 pages
Introduction à HBase et Hadoop
Pas encore d'évaluation
Introduction à HBase et Hadoop
21 pages
Cours Big Data
Pas encore d'évaluation
Cours Big Data
59 pages
Projet Big Data & IA 2024 : Guide Candidat
Pas encore d'évaluation
Projet Big Data & IA 2024 : Guide Candidat
8 pages
C1 Big Data Intro 2022
Pas encore d'évaluation
C1 Big Data Intro 2022
56 pages
Introduction à MapReduce et Hadoop
Pas encore d'évaluation
Introduction à MapReduce et Hadoop
9 pages
TP 1 Big Data Partie 1
Pas encore d'évaluation
TP 1 Big Data Partie 1
8 pages
Introduction à Hadoop pour Big Data
Pas encore d'évaluation
Introduction à Hadoop pour Big Data
61 pages
Introduction à Apache Hive et son architecture
Pas encore d'évaluation
Introduction à Apache Hive et son architecture
31 pages
Pig Hive Mahout Benali Mounir
Pas encore d'évaluation
Pig Hive Mahout Benali Mounir
30 pages
TP1 Big Data
Pas encore d'évaluation
TP1 Big Data
11 pages
3 Elfaddouli Bigdata Pig 2022
Pas encore d'évaluation
3 Elfaddouli Bigdata Pig 2022
21 pages
Cours Framework Big DATA - DR SEBRI
Pas encore d'évaluation
Cours Framework Big DATA - DR SEBRI
15 pages