0% ont trouvé ce document utile (0 vote)
18 vues51 pages

Python Pour La Data Science. (Numpy)

Ce document présente l'utilisation de Python pour la science des données, en se concentrant sur les bibliothèques essentielles comme Pandas, NumPy, Matplotlib et Seaborn. Il couvre l'installation, l'importation, et les fonctionnalités de ces bibliothèques pour la manipulation, l'analyse et la visualisation des données. Des exemples pratiques sur la création et l'indexation des tableaux NumPy ainsi que des opérations mathématiques sont également fournis.

Transféré par

Eric Ekissi
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
18 vues51 pages

Python Pour La Data Science. (Numpy)

Ce document présente l'utilisation de Python pour la science des données, en se concentrant sur les bibliothèques essentielles comme Pandas, NumPy, Matplotlib et Seaborn. Il couvre l'installation, l'importation, et les fonctionnalités de ces bibliothèques pour la manipulation, l'analyse et la visualisation des données. Des exemples pratiques sur la création et l'indexation des tableaux NumPy ainsi que des opérations mathématiques sont également fournis.

Transféré par

Eric Ekissi
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

PYTHON POUR LA SCIENCE

SCIENCE DES DONNÉES

Présenté Par :
BAKAYOKO Ibrahima
Enseignant-chercheur
UFR Mathématiques & Informatique
[Link]

Université Félix Houphouët-Boigny – Abidjan (Côte d’Ivoire)


Installation des bibliothèques
bibliothèques
Dans la section précédente, nous avons installé
Anaconda, nous n’avons pas besoin de télécharger de
bibliothèques, car il installe automatiquement toutes
les bibliothèques de science des données (data
science) les plus populaires, telles que Pandas,
Numpy, Matplotlib, Seaborn, etc.

[Link]
Importation des bibliothèques
• Ouvrez votre Jupyter Notebook.
• Pour importer une bibliothèque, nous utilisons le mot-clé import suivi du nom de la bibliothèque.
• Nous pouvons utiliser le mot-clé as pour utiliser des abréviations pour nos noms de
bibliothèques.
• Les abréviations courantes utilisées sont
• pd for pandas
• np pour numpy
• plt pour [Link]
• sns pour seaborn

[Link]
Bibliothèque Pandas pour la Data Science
• Pandas est une bibliothèque Python pour la manipulation et l'analyse de données.
• Elle permet d'explorer, de nettoyer et de traiter des données tabulaires.
• Elle offre deux façons de stocker les données ;
• les séries, qui sont des structures de données unidimensionnelles
• Data Frame, qui est une structure de données bidimensionnelle

DataFrame
Séries

[Link]
Bibliothèque NumPy pour Data Science
• NumPy est l'abréviation de Numerical Python.
• Il fournit une structure de données appelée tableau NumPy, qui est une grille de valeurs.
• Il fournit également une collection de fonctions mathématiques de haut niveau qui
peuvent être
exécutées sur des tableaux NumPy multidimensionnels.

[Link]
Panda vs Numpy
Numpy Panda

NumPy et Pandas sont deux bibliothèques Python pour la Data Science


Il est utilisé pour le calcul scientifique Il est utilisé pour la manipulation des données,
comme le stockage, l'exploration, le nettoyage et
le traitement des données.
Il fournit des tableaux NumPy qui peuvent être Il fournit deux structures de données;
multidimensionnels • Séries (unidimensionnelles)
• Cadres de données (bidimensionnels)
Nous utilisons Pandas pour la manipulation des données et NumPy pour les calculs mathématiques.
Puisque les séries Pandas et les Data Frames peuvent être considérées comme des
tableaux NumPy unidimensionnels et bidimensionnels respectivement, nous pouvons également leur
appliquer des fonctions mathématiques NumPy.

[Link]
Bibliothèque Matplotlib pour Data Science
• Matplotlib est une bibliothèque Python de visualisation, c'est-à-dire qu'elle est utilisée pour
tracer des graphiques.
• Le module pyplot à l'intérieur de Matplotlib fournit l'interface à la fonctionnalité de
traçage sous-jacente de Matplotlib.
• Matplotlib permet de créer un certain nombre de types de graphiques différents, tels que des
des histogrammes, des diagrammes de dispersion, des diagrammes de surface, des
camemberts, etc.

[Link]
Bibliothèque Seaborn pour Data Science
• Seaborn est une autre bibliothèque Python de visualisation construite au-dessus
de Matplotlib.
• Elle étend les fonctionnalités de Matplotlib et permet de créer une variété de
graphiques différents avec moins de syntaxe.

[Link]
Tableaux NumPy
C'est quoi les tableaux NumPy ?

Le tableau NumPy est une structure de données multidimensionnelle conçue pour


gérer facilement de grands ensembles de données.
• Un tableau NumPy est appelé ndarray.
• Nous pouvons trouver le nombre de dimensions d'un tableau NumPy en utilisant .ndim.

Tableaux NumPy et listes Python

• Les tableaux NumPy offrent plus de fonctionnalités intégrées que les listes
Python.
• Les tableaux NumPy permettent de travailler plus facilement avec d'énormes
ensembles de
données multidimensionnelles avec moins de syntaxe.
• Les tableaux NumPy sont également plus efficaces que les listes Python en
termes d'occupation de la mémoire et de vitesse.
[Link]
Création de tableaux NumPy (1/3)
Tableaux 1 dimension

• Un tableau NumPy à 1 dimension est un tableau où chaque élément du tableau


le plus extérieur est un tableau à 0 dimension (scalaire).
• Nous pouvons créer un tableau NumPy à l'aide de la fonction array() de la
bibliothèque NumPy.
• Nous pouvons créer un tableau NumPy en utilisant des listes ou des n-uplets Python.
• Pour créer un tableau NumPy à 1 dimension, nous fournissons une liste ou un n-uplet
Python à la fonctionarray().

[Link]
Création de tableaux NumPy (2/3)
Tableaux 2 dimensions

• Un tableau NumPy à 2 dimensions est un tableau où chaque élément du tableau le


plus extérieur est un tableau à 1 dimension.
• Pour créer un tableau NumPy à 2 dimensions, nous fournissons une liste ou un n-uplet
Python à la fonction array().

[Link]
Création de tableaux NumPy (3/3)
Tableaux 3 dimensions

• Un tableau NumPy à 3 dimensions est un tableau où chaque élément du tableau le plus


extérieur est un tableau à 2 dimensions.
• Pour créer un tableau NumPy à 3 dimensions, nous fournissons une liste ou un n-uplet Python à
la fonction array().

[Link]
Indexation des tableaux NumPy (1/8)
Tableaux NumPy 1-D

• L'indexation d'un tableau NumPy 1-D est identique à l'indexation d'une liste
Python 1-D.
• Indiquez l'index de l'élément à l'intérieur des crochets pour obtenir cet élément.

[Link]
Indexation des tableaux NumPy (2/8)
Tableaux NumPy 2-D

• Pour indexer un tableau NumPy2-D, nous fournissons 2 valeurs à l'intérieur des crochets ([ ]).
• La première valeur est l'index du tableau interne
• La deuxième valeur est l'index de l'élément à l'intérieur du tableau interne
• Dans l'exemple suivant, nous obtenons le premier élément du second tableau.

[Link]
Indexation des tableaux NumPy (3/8)
Tableaux NumPy 2-D

• La première dimension contient 2 tableaux.


• Si nous disons Tableau2D[1], nous obtenons le deuxième tableau

[Link]
Indexation des tableaux NumPy (4/8)
Tableaux NumPy 2-D

• La deuxième dimension contient 3 éléments.


• Si nous écrivons Tableau2D[1, 0], nous obtenons le premier élément du deuxième
tableau.

[Link]
Indexation des tableaux NumPy (5/8)
Tableaux NumPy 3-D
• Pour indexer un tableau NumPy 3-D, nous fournissons 3 valeurs à l'intérieur des
crochets ([ ]).
• La première valeur est l'index du tableau interne 2-D dans la première dimension.
• La deuxième valeur est l'index du tableau interne 1-D dans la deuxième dimension.
• La troisième valeur est l'indice de l'élément dans la troisième dimension.
• Dans l'exemple suivant, nous obtenons le premier élément du deuxième tableau du
premier tableau.

[Link]
Indexation des tableaux NumPy (6/8)
Tableaux NumPy 3-D

• La première dimension contient 2 tableaux.


• Si nous disons Tableau3D[0], nous obtenons le premier tableau.

[Link]
Indexation des tableaux NumPy (7/8)
Tableaux NumPy 3-D

• La première dimension contient 2 tableaux.


• Si nous disons Tableau3D[0], nous obtenons le premier tableau.

[Link]
Indexation des tableaux NumPy (8/8)
Tableaux NumPy 3-D

• La deuxième dimension contient à nouveau 2 tableaux.


• Si nous disons Tableau3D[0, 1], nous obtenons le deuxième tableau du premier
tableau.

[Link]
Forme du tableau
• Les tableaux NumPy ont un attribut shape qui renvoie un n-uplet.
• La première valeur du n-uplet donne le nombre de dimensions du tableau.
• La deuxième valeur du n-uplet donne le nombre d'éléments dans chaque
dimension.

[Link]
Itération sur des tableaux NumPy (1/8)
Tableaux NumPy 1-D

• Nous pouvons utiliser une boucle for pour itérer sur un tableau 1-D comme nous
le faisons pour une liste 1-D Python.

[Link]
Itération sur des tableaux NumPy (2/8)
Tableaux NumPy 2-D

• Nous pouvons utiliser une boucle for imbriquée pour itérer sur un tableau 2-D.
• La boucle for extérieure itère sur le tableau extérieur.
• La boucle for intérieure itère sur le tableau intérieur.

[Link]
Itération sur des tableaux NumPy (3/8)
Tableaux NumPy 2-D

• Nous utilisons une boucle for pour itérer sur le tableau extérieur.
• Nous imprimons tous les tableaux intérieurs.

[Link]
Itération sur des tableaux NumPy (4/8)
Tableaux NumPy 2-D

• Nous utilisons une autre boucle for imbriquée dans la boucle for externe pour itérer sur le
tableau interne.
• Nous affichons tous les éléments de chacun des tableaux internes.

[Link]
Itération sur des tableaux NumPy (5/8)
Tableaux NumPy 3-D

• Nous pouvons utiliser 3 boucles for imbriquées pour itérer sur un tableau 3D.
• La boucle for la plus extérieure itère sur les tableaux de la première dimension.
• La boucle for du milieu itère sur les tableaux de la deuxième dimension.
• La boucle for la plus intérieure itère sur tous les éléments de la troisième
dimension.

[Link]
Itération sur des tableaux NumPy (6/8)
Tableaux NumPy 3-D

• Le tableau le plus à l'extérieur contient 2 tableaux, tous deux en 2D.


• Nous utilisons une boucle for pour afficher ces tableaux 2-D.

[Link]
Itération sur des tableaux NumPy (7/8)
Tableaux NumPy 3-D

• Chacun des tableaux 2-D contient 2 tableaux dans la seconde dimension, chacun
d'entre eux étant 1-D.

• Nous utilisons une autre boucle for imbriquée dans la première boucle for pour imprimer
ces tableaux 1D.

[Link]
Itération sur des tableaux NumPy (8/8)
Tableaux NumPy 3-D

• Chacun des tableaux 1-D contient 3 éléments dans la troisième dimension.


• Nous utilisons une autre boucle for imbriquée dans les deux premières boucles for pour
imprimer ces éléments.

[Link]
Mathématiques pour Data Science
NumPy nous fournit une énorme collection de
fonctions de haut niveau pour les tableaux
multidimensionnels.
• Explorons certaines des fonctionnalités fournies par
NumPy.

[Link]
.zeros()
Pour créer un tableau NumPy pré-rempli de zéros, nous pouvons utiliser la fonction
NumPy intégrée .zeros().
.zeros() nous donne une liste pré-remplie de zéros flottants. Pour convertir cette liste en
liste d'entiers, nous utilisons la fonction .astype().

[Link]
.ones()
Pour créer un tableau NumPy pré-rempli de uns, nous pouvons utiliser la fonction
NumPy intégrée .ones().
.ones() nous donne une liste pré-remplie de flottants. Pour convertir cette liste en liste
d'entiers, nous utilisons la fonction .astype().

[Link]
.full()
• Pourcréer un tableau NumPypré-rempliavec un nombre spécifique, nous pouvonsutiliser la
[Link](), fonction intégrée de NumPy.
• Le premier argument de la fonction .full() est la taille du tableau
• Le deuxième argument de la fonction .full() est la valeur avec laquelle nous voulons
que notre liste soit pré-remplie au préalable.

[Link]
Opérations scalaires (1/5)
Addition
• Nous pouvons ajouter un scalaire à un tableau NumPy en utilisant simplement
l'opérateur (+).
• La quantité scalaire est ajoutée à chacun des éléments du tableau.
• Notez que l'ajout d'un scalaire à une liste Python entraînera une erreur

[Link]
Opérations scalaires (2/5)
Soustraction
• Nous pouvons soustraire un scalaire d'un tableau NumPy en utilisant simplement
l'opérateur (-).
• La quantité scalaire est soustraite de chacun des éléments du tableau.
• Notez que la soustraction d'un scalaire d'une liste Python entraînera une
erreur.

[Link]
Opérations scalaires (3/5)
Multiplication
• Nous pouvons multiplier un scalaire avec un tableau NumPy en utilisant simplement
l'opérateur (*).
• La quantité scalaire est multipliée avec chacun des éléments du tableau.
• Notez que la multiplication d'un scalaire avec une liste Python entraînera une
concaténation de listes.

[Link]
Opérations scalaires (4/5)
Division

Nous pouvons diviser un tableau NumPy par un scalaire en utilisant simplement


l'opérateur (/) pour la division des flottants ou l'opérateur (//) pour la division
des entiers.
• Chacun des éléments du tableau est divisé par le scalaire.
• Notez que la division d'une liste Python par un scalaire entraînera une erreur.

[Link]
Opérations scalaires (5/5)
Puissance
• Nous pouvons élever chaque élément d'un tableau NumPy à une puissance en utilisant
simplement l'opérateur (**).
• Notez que l'augmentation des éléments d'une liste Python à l'aide de
l'opérateur (**) entraînera une erreur.

[Link]
Transposée
• Nous pouvons prendre la transposée d'un tableau NumPy en mettant .T à la fin du
tableau.
• Notez que la transposée d'une liste Python entraînera une erreur.

[Link]
Opérations sur les éléments (1/4)
Addition
• Nous pouvons additionner les éléments de deux tableaux NumPy en utilisant simplement
l'opérateur (+).
• Chaque élément du premier tableau est ajouté à l'élément correspondant du
second tableau.
• Notez que l'addition de deux listes Python à l'aide de l'opérateur (+) n'est pas
possible. Au lieu de cela, les listes sont concaténées si nous utilisons l'opérateur
(+).

[Link]
Opérations sur les éléments (2/4)
Soustraction
• Nous pouvons soustraire les éléments de deux tableaux NumPy en utilisant
simplement l'opérateur (-).
• Chaque élément du premier tableau est soustrait à l'élément correspondant
du second tableau.
• Notez que la soustraction des éléments de deux listes Python à l'aide de
l'opérateur ( -) entraînera une erreur.

[Link]
Opérations sur les éléments (3/4)
Multiplication
• Nous pouvons multiplier les éléments de deux tableaux NumPy en utilisant simplement
l'opérateur (*).
• Chaque élément du premier tableau est multiplié par l'élément correspondant du
second tableau .
• Notez que la multiplication des éléments de deux listes Python à l'aide de
l'opérateur (*) entraînera une erreur.

[Link]
Opérations sur les éléments (4/4)
Division
• Nous pouvons diviser les éléments de deux tableaux NumPy en utilisant simplement
l'opérateur (/).
• Chaque élément du premier tableau est divisé par l'élément correspondant du
second tableau .
• Notez que la division des éléments de deux listes Python à l'aide de l'opérateur (/)
entraînera une erreur.

[Link]
Multiplication matricielle
Outre la multiplication par éléments, NumPy nous fournit également une fonction
intégrée pour calculer la multiplication matricielle de deux tableaux.
Nous utilisons la fonction .matmul() de la bibliothèque NumPy pour la
multiplication matricielle de deux tableaux.

[Link]
Statistiques (1/7)
.min()
•La fonction .min() nous donne la valeur minimale dans un tableau NumPy.
•Cette fonction peut également être appliquée sur des listes Python.

[Link]
Statistiques (2/7)
.max()
• La fonction .max() nous donne la valeur maximale dans un tableau NumPy.
• Cette fonction peut également être appliquée sur des listes Python.

[Link]
Statistiques (3/7)
.sum()
• La fonction .sum() nous donne la somme de toutes les valeurs d'un tableau
NumPy.
• Cette fonction peut également être appliquée sur des listes Python.

[Link]
Statistiques (4/7)
.mean()
• La fonction .mean() nous donne la moyenne de toutes les valeurs d'un tableau
NumPy.
• Cette fonction peut également être appliquée sur des listes Python.

[Link]
Statistiques (5/7)
.std()

• La fonction .std() nous donne l'écart type d'un tableau NumPy.


• Cette fonction peut également être appliquée sur des listes Python.

[Link]
Statistiques (6/7)
.median()
• La fonction .median() nous donne la médiane d'un tableau NumPy.
• Cette fonction peut également être appliquée sur des listes Python.

[Link]
Statistiques (7/7)
•Vous trouverez une liste détaillée des fonctions statistiques de
NumPy sur le lien :
[Link]

[Link]

Vous aimerez peut-être aussi