0% ont trouvé ce document utile (0 vote)

30 vues3 pages

Formation Python Pour Le Big Data - Data Value

La formation présente les concepts et outils Python pour manipuler et visualiser de grands ensembles de données, notamment les librairies Dask, Xarray, Vaex, Spark et Holoviews.

Transféré par

Gael ODJO

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

30 vues3 pages

Formation Python Pour Le Big Data - Data Value

La formation présente les concepts et outils Python pour manipuler et visualiser de grands ensembles de données, notamment les librairies Dask, Xarray, Vaex, Spark et Holoviews.

Transféré par

Gael ODJO

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Formation Python pour le Big Data

Objectifs : Utiliser le langage Python pour manipuler et visualiser de grands ensembles de données (big
data) en exploitant ses nombreuses librairies scientiﬁques

Compétences visées : - Connaître les problématiques du Big Data

- Connaître les diﬀérentes librairies Python permettant de manipuler le Big Data
- Savoir manipuler de grands volumes de données
- Avoir des notions sur l’architecture Big Data

Durée : 5 jours (35 heures)

Public : Architectes, développeurs, data scientists, chefs de projet, ...

Pré-requis : Pour suivre ce stage dans de bonnes conditions, il est recommandé d'avoir suivi en amont la
formation Python – Bases et introduction aux librairies scientiﬁques

Méthode pédagogique : Pédagogie active mêlant exposés, exercices et applications pratiques dans le
logiciel Python.

Modalités d'évaluation : Un formulaire d'auto-évaluation proposé en amont de la formation nous

permettra d'évaluer votre niveau et de recueillir vos attentes. Ce même formulaire soumis en aval de la
formation fournira une appréciation de votre progression.
Des exercices pratiques seront proposés à la ﬁn de chaque séquence pédagogique pour l'évaluation des
acquis.
En ﬁn de formation, vous serez amené(e) à renseigner un questionnaire d'évaluation à chaud.
Une attestation de formation vous sera adressée à l'issue de la session.
Trois mois après votre formation, vous recevrez par email un formulaire d'évaluation à froid sur l'utilisation
des acquis de la formation.

Accessibilité : Vous souhaitez suivre notre formation Python pour le Big Data et êtes en situation de
handicap ? Merci de nous contacter aﬁn que nous puissions envisager les adaptations nécessaires et vous
garantir de bonnes conditions d'apprentissage

Tarif : 3000 € HT (-10% pour 2 inscrits, -20% dès 3 inscrits)

Nos prochaines sessions

Distance
du 13 au 17 novembre 2023
du 1 au 5 juillet 2024

Lyon
du 11 au 15 décembre 2023
du 22 au 26 avril 2024

Paris

Data Value - 41 rue de la Découverte - 31670 LABEGE

33(0)972 567 567 | [email protected] | https://www.datavalue.fr
du 4 au 8 décembre 2023
du 17 au 21 juin 2024

Toulouse
du 25 au 29 mars 2024

Programme :

– Concepts du Big Data

Cette introduction permet de vous initier à la problématique du Big Data

Volume, Vitesse, Véracité

Map Reduce
Architecture Big Data et Data Lake
Big Data et Cloud computing
Les outils du Big Data

– Introduction à la librairie Dask

Dask est une librairie qui permet de faire du calcul distribué sur plusieurs cœurs ou plusieurs machines
avec la possibilité d’utiliser un scheduler. Dask peut donc accélérer le calcul sur de larges volumes de
données.

Présentation de Dask
Exemple de calculs distribués
Dask et Numpy: comparaison de performances
Dask et Pandas

– Introduction à la librairie Xarray

Xarray est une librairie Python qui s’appuie sur Numpy et permet de manipuler de larges volumes de
données. Cette librairie est particulièrement eﬃcace pour des ﬁchiers netCDF et peut s’utiliser de concert
avec Dask

Présentation de Xarray
Exemples d’utilisation de Xarray
Mise en pratique avec un ﬁchier netCDF

– Introduction à la librairie Vaex

Vaex est une librairie qui ressemble beaucoup à pandas mais qui fait des calculs à la volée sans gaspiller
l’usage de la RAM. On peut dès lors traiter des données qui ont près de 1 milliard de lignes à la seconde.

Data Value - 41 rue de la Découverte - 31670 LABEGE

33(0)972 567 567 | [email protected] | https://www.datavalue.fr
Présentation de Vaex
Prise en main de Vaex avec des exemples
Comparaison entre Vaex et Pandas
Visualisation des données avec Vaex

– Introduction à Spark
Spark est un outil permettant le passage à l’échelle pour la gestion des données et le calcul distribué. Bien
que géré par Apache, Spark est en Open Source et peut s’utiliser avec plusieurs langages dont Python

Présentation de Spark
Architecture Apache Spark
Autres outils associés à Spark (Yarn, Mesos)
Resilient Distributed Dataset (RDD)
Présentation et Installation de PySpark

– Introduction à PySpark
Vous verrez grâce une mise en pratique sur une journée la prise en main de PySpark, comment lire et
gérer des données, comment appliquer des fonctions sur les données et comment appliquer une réduction
de dimension

– Visualisation des données massives avec Holoviews

Manipuler des gros volumes de données n’est pas toujours suﬃsants, on veut pouvoir aussi les visualiser.
La librairie Holoviews permet aussi bien de transformer des données massives que de les visualiser.

Présentation et prise en main d’Holoviews

Interactivité avec Holoviews

Date de dernière modiﬁcation : 9 septembre 2023

Data Value - 41 rue de la Découverte - 31670 LABEGE

33(0)972 567 567 | [email protected] | https://www.datavalue.fr

Vous aimerez peut-être aussi

Python Avance Pour Data Scientists bd060 - Aston
Pas encore d'évaluation
Python Avance Pour Data Scientists bd060 - Aston
2 pages
Syllabus Python Pour La Science
Pas encore d'évaluation
Syllabus Python Pour La Science
18 pages
Python Avancé pour Pros de la Data
Pas encore d'évaluation
Python Avancé pour Pros de la Data
2 pages
Programme Python Pour La Data Science
Pas encore d'évaluation
Programme Python Pour La Data Science
2 pages
Formation Big Data à Strasbourg
Pas encore d'évaluation
Formation Big Data à Strasbourg
3 pages
Formation Python Pour La Data Science - 6 - Aller Plus Loin
Pas encore d'évaluation
Formation Python Pour La Data Science - 6 - Aller Plus Loin
17 pages
164 Data Scientist FR FR Standard
Pas encore d'évaluation
164 Data Scientist FR FR Standard
22 pages
Python Avancé : Data et Visualisation
Pas encore d'évaluation
Python Avancé : Data et Visualisation
3 pages
Formation Python : Bases et Avancé
Pas encore d'évaluation
Formation Python : Bases et Avancé
12 pages
Science Des Données Et Analyse Des Big Data
Pas encore d'évaluation
Science Des Données Et Analyse Des Big Data
2 pages
09 Data Scientist Amended
Pas encore d'évaluation
09 Data Scientist Amended
15 pages
Formation Python pour l'analyse de données
Pas encore d'évaluation
Formation Python pour l'analyse de données
2 pages
Spark Java, Développer Des Applications Pour Le Big Data
Pas encore d'évaluation
Spark Java, Développer Des Applications Pour Le Big Data
2 pages
TP2 BIGdata
Pas encore d'évaluation
TP2 BIGdata
15 pages
Formation Python : Analyse de Données
Pas encore d'évaluation
Formation Python : Analyse de Données
4 pages
Formation Python pour Data Science
Pas encore d'évaluation
Formation Python pour Data Science
2 pages
Formation Python pour Data Science
Pas encore d'évaluation
Formation Python pour Data Science
2 pages
Formation intensive en data science
Pas encore d'évaluation
Formation intensive en data science
9 pages
Data Scientist
Pas encore d'évaluation
Data Scientist
15 pages
164 Data Scientist FR FR Standard
Pas encore d'évaluation
164 Data Scientist FR FR Standard
24 pages
Plan Module de Big Data en Cybersécurité
Pas encore d'évaluation
Plan Module de Big Data en Cybersécurité
3 pages
Orsys Big Data - Développer Des Applications Pour Le Big Data
Pas encore d'évaluation
Orsys Big Data - Développer Des Applications Pour Le Big Data
2 pages
Brochure - Big Data & Machine Learning - Job SkillZ
Pas encore d'évaluation
Brochure - Big Data & Machine Learning - Job SkillZ
5 pages
Formation Data Engineer par DataScientest
Pas encore d'évaluation
Formation Data Engineer par DataScientest
20 pages
Qui Suis-Je ?: Pr. Y Khourdifi, D I
Pas encore d'évaluation
Qui Suis-Je ?: Pr. Y Khourdifi, D I
20 pages
Maquette Pédagogique ANALYSE DE DONNEES
Pas encore d'évaluation
Maquette Pédagogique ANALYSE DE DONNEES
56 pages
MOOC Big Data: Informatique et Statistiques
Pas encore d'évaluation
MOOC Big Data: Informatique et Statistiques
4 pages
Programme Programmation Python (Préparation Des Pré-Requis Au Développement dIA)
Pas encore d'évaluation
Programme Programmation Python (Préparation Des Pré-Requis Au Développement dIA)
5 pages
Qlik View
Pas encore d'évaluation
Qlik View
19 pages
Apprentissage Python Avec IA
Pas encore d'évaluation
Apprentissage Python Avec IA
4 pages
Plandecours
Pas encore d'évaluation
Plandecours
2 pages
164 Data Scientist FR FR Standard
100% (1)
164 Data Scientist FR FR Standard
23 pages
Cours Big Data
Pas encore d'évaluation
Cours Big Data
112 pages
Data Scientist
Pas encore d'évaluation
Data Scientist
23 pages
Pre Traitement Donnees 24 Handout
Pas encore d'évaluation
Pre Traitement Donnees 24 Handout
103 pages
TP 01 - RDD
Pas encore d'évaluation
TP 01 - RDD
2 pages
Formation Big Data pour Analystes
Pas encore d'évaluation
Formation Big Data pour Analystes
8 pages
Fiche TP4
Pas encore d'évaluation
Fiche TP4
4 pages
Trafic de données avec Python Pandas
100% (1)
Trafic de données avec Python Pandas
11 pages
Paragraph
Pas encore d'évaluation
Paragraph
135 pages
Document Sans Titre
Pas encore d'évaluation
Document Sans Titre
2 pages
Hal Apprent Massif BGL 06 16
Pas encore d'évaluation
Hal Apprent Massif BGL 06 16
39 pages
Formation Data Analyst - Bac+3 - 4 - 10 Mois - CEFIM
Pas encore d'évaluation
Formation Data Analyst - Bac+3 - 4 - 10 Mois - CEFIM
14 pages
Roadmap Complète Pour Devenir Data Analyst: Objectif
Pas encore d'évaluation
Roadmap Complète Pour Devenir Data Analyst: Objectif
19 pages
Devenez Data Scientist en 9 Mois
Pas encore d'évaluation
Devenez Data Scientist en 9 Mois
31 pages
Introduction à Apache Spark et Big Data
Pas encore d'évaluation
Introduction à Apache Spark et Big Data
16 pages
Certification en Science des Données avec Python
Pas encore d'évaluation
Certification en Science des Données avec Python
3 pages
BBC 042
Pas encore d'évaluation
BBC 042
5 pages
11 Programme de Formation Data Analyst
Pas encore d'évaluation
11 Programme de Formation Data Analyst
12 pages
Introduction TP 1 Et 2
Pas encore d'évaluation
Introduction TP 1 Et 2
30 pages
Installation et Configuration Big Data
Pas encore d'évaluation
Installation et Configuration Big Data
23 pages
Python-Partie 6 Compressed
Pas encore d'évaluation
Python-Partie 6 Compressed
45 pages
M2i Formation - BIG-SPK - Spark Scala - Traitement Des Données
Pas encore d'évaluation
M2i Formation - BIG-SPK - Spark Scala - Traitement Des Données
4 pages
MPRA Paper 76653
Pas encore d'évaluation
MPRA Paper 76653
364 pages
Connaissances sur huiles de palme et coco
Pas encore d'évaluation
Connaissances sur huiles de palme et coco
122 pages
Turbine À Vapeur
Pas encore d'évaluation
Turbine À Vapeur
22 pages
Memoire Terminé
Pas encore d'évaluation
Memoire Terminé
61 pages
Ms GM Touil+Benlazar
Pas encore d'évaluation
Ms GM Touil+Benlazar
97 pages
Sagna Memoire 2023
Pas encore d'évaluation
Sagna Memoire 2023
44 pages
PLAN5
100% (1)
PLAN5
9 pages
Pales éoliennes en fibre de carbone
Pas encore d'évaluation
Pales éoliennes en fibre de carbone
2 pages
Guide Pratique Huile de Palme
Pas encore d'évaluation
Guide Pratique Huile de Palme
21 pages
Copie de Copie de Liste GASA SI3 2024-2025
Pas encore d'évaluation
Copie de Copie de Liste GASA SI3 2024-2025
1 page
2014 SamiRiahi
Pas encore d'évaluation
2014 SamiRiahi
61 pages
13
Pas encore d'évaluation
13
8 pages
Optimisation des turbines à gaz
Pas encore d'évaluation
Optimisation des turbines à gaz
7 pages
Micro-organismes en santé et médecine
Pas encore d'évaluation
Micro-organismes en santé et médecine
13 pages
Mort et personnages dans L'Affaire Bissi
50% (2)
Mort et personnages dans L'Affaire Bissi
4 pages
Devoir SI2 (Spécialité)
Pas encore d'évaluation
Devoir SI2 (Spécialité)
44 pages
Inconvénients Centrales: Avantages
Pas encore d'évaluation
Inconvénients Centrales: Avantages
4 pages
Démission parentale dans l'affaire Bissi
100% (2)
Démission parentale dans l'affaire Bissi
5 pages
Appli Quant
Pas encore d'évaluation
Appli Quant
6 pages
Électronique de puissance : convertisseurs et composants
Pas encore d'évaluation
Électronique de puissance : convertisseurs et composants
33 pages
Epreuve + Corrigé-Type - Devoir Surveillé Automatique-Asservissement - Juin 2021 - Tous Centres
Pas encore d'évaluation
Epreuve + Corrigé-Type - Devoir Surveillé Automatique-Asservissement - Juin 2021 - Tous Centres
10 pages
CT Devoirs Dessin 2022
Pas encore d'évaluation
CT Devoirs Dessin 2022
2 pages
Corrigé Microcontroleur (Arduino) GE2 2023
Pas encore d'évaluation
Corrigé Microcontroleur (Arduino) GE2 2023
3 pages
Cours Numérique Eln04
Pas encore d'évaluation
Cours Numérique Eln04
27 pages
Cours Ela04 Ge2
100% (1)
Cours Ela04 Ge2
33 pages
Le Loup de Wall Street : Ascension et Chute
Pas encore d'évaluation
Le Loup de Wall Street : Ascension et Chute
39 pages
Application ELN 04 SI2
Pas encore d'évaluation
Application ELN 04 SI2
3 pages
Chap 2 MDI
Pas encore d'évaluation
Chap 2 MDI
11 pages
Analyse des Mécanismes Mécaniques
Pas encore d'évaluation
Analyse des Mécanismes Mécaniques
16 pages
MUKOKO MASSAMBA Junias
Pas encore d'évaluation
MUKOKO MASSAMBA Junias
5 pages
Gestion Présences UVCI via B4A
Pas encore d'évaluation
Gestion Présences UVCI via B4A
1 page
Rapport
100% (1)
Rapport
36 pages
Algorithmique&Python Cours
Pas encore d'évaluation
Algorithmique&Python Cours
203 pages
EPREUVE Seconde Litteraire 2023 Éval4
Pas encore d'évaluation
EPREUVE Seconde Litteraire 2023 Éval4
2 pages
Cours 1
Pas encore d'évaluation
Cours 1
31 pages
Les Filieres de L Enseignement
Pas encore d'évaluation
Les Filieres de L Enseignement
11 pages
Cours d'initiation à LabVIEW
Pas encore d'évaluation
Cours d'initiation à LabVIEW
271 pages
Mezhoudi Yazid
Pas encore d'évaluation
Mezhoudi Yazid
95 pages
Chap 4 Les Réseaux Wimax
Pas encore d'évaluation
Chap 4 Les Réseaux Wimax
20 pages
TP1 Hyper-V Installation
Pas encore d'évaluation
TP1 Hyper-V Installation
11 pages
02 Manuel de TP GETC-01
Pas encore d'évaluation
02 Manuel de TP GETC-01
31 pages
Offres High-Tech: Ordinateurs, Tablettes, et Plus
Pas encore d'évaluation
Offres High-Tech: Ordinateurs, Tablettes, et Plus
28 pages
RUP Exposé
100% (1)
RUP Exposé
23 pages
Développeur Web Fullstack Expérimenté
Pas encore d'évaluation
Développeur Web Fullstack Expérimenté
1 page
Modele Rapport Audit Sécurité
Pas encore d'évaluation
Modele Rapport Audit Sécurité
21 pages
1 - IHM-Netbeans
Pas encore d'évaluation
1 - IHM-Netbeans
46 pages
MS Dos
Pas encore d'évaluation
MS Dos
36 pages
HDH StarterKit Projet Formulaire Demande Autorisation CNIL
Pas encore d'évaluation
HDH StarterKit Projet Formulaire Demande Autorisation CNIL
9 pages
Introduction à l'informatique et Windows
Pas encore d'évaluation
Introduction à l'informatique et Windows
14 pages
Optimisation de la Multiplication Matricielle
Pas encore d'évaluation
Optimisation de la Multiplication Matricielle
2 pages
Performances des réseaux mobiles 4G
Pas encore d'évaluation
Performances des réseaux mobiles 4G
79 pages
Interview Joel SANA (Amcharge Match Point) 2004-05
Pas encore d'évaluation
Interview Joel SANA (Amcharge Match Point) 2004-05
8 pages
Présentation Ghidra
Pas encore d'évaluation
Présentation Ghidra
6 pages
L2 Info
Pas encore d'évaluation
L2 Info
1 page
Epreuve de F3
100% (2)
Epreuve de F3
1 page
2ieme 06 Python Les Boucles
Pas encore d'évaluation
2ieme 06 Python Les Boucles
12 pages
Se Familiariser Avec SPAD Version7
Pas encore d'évaluation
Se Familiariser Avec SPAD Version7
1 page
Systèmes Experts en Logique des Prédicats
Pas encore d'évaluation
Systèmes Experts en Logique des Prédicats
27 pages
Annexes Asi
Pas encore d'évaluation
Annexes Asi
8 pages