1) Qu'est-ce qu'un pré-traitement (pre-processing) ? (lpt) 1) Qu'est-ce qu'un pré-traitement (pre-processing) ?
(lpt)
Le prétraitement fait simplement référence à l'exécution d'une série d'opérations Le prétraitement fait simplement référence à l'exécution d'une série d'opérations
pour transformer ou modifier des données. C'est une transformation appliquée à pour transformer ou modifier des données. C'est une transformation appliquée à
nos données avant de les alimenter à l'algorithme. nos données avant de les alimenter à l'algorithme.
2) Dans une exploration des données quantitatives, quels sont les types d'anornalie de 2) Dans une exploration des données quantitatives, quels sont les types d'anornalie de
données qu'on doit vérifier ? (lpts) données qu'on doit vérifier ? (lpts)
3) Qu'est-ce qu'une distribution, donner deux exemples de distribution. (1pt) 3) Qu'est-ce qu'une distribution, donner deux exemples de distribution. (1pt)
4) Citez les trois paramètres définissant la normalité des données. (2pts) 4) Citez les trois paramètres définissant la normalité des données. (2pts)
5) Citez trois de transformation de données avant la phase d'analyse. (2pts) 5) Citez trois de transformation de données avant la phase d'analyse. (2pts)
E - extraction E - extraction
T - Transformation T - Transformation
L - chargement L - chargement
6) Qu'est-ce qu'un « one-hot encoding » ? (lpt) 6) Qu'est-ce qu'un « one-hot encoding » ? (lpt)
L'encodage one-hot ou encodage 1 parmi n consiste à encoder une variable à n L'encodage one-hot ou encodage 1 parmi n consiste à encoder une variable à n
états sur n bits dont un seul prend la valeur 1, le numéro du bit valant 1 étant le états sur n bits dont un seul prend la valeur 1, le numéro du bit valant 1 étant le
numéro de l'état pris par la variable numéro de l'état pris par la variable
7) Qu'est-ce qu'un quartile ? (lpts) 7) Qu'est-ce qu'un quartile ? (lpts)
un quartile est chacune des trois valeurs qui divisent les données triées en quatre un quartile est chacune des trois valeurs qui divisent les données triées en quatre
parts égales, de sorte que chaque partie représente 1/4 de l'échantillon de parts égales, de sorte que chaque partie représente 1/4 de l'échantillon de
population. population.
8) Que signifie le premier et le troisième quartile? (lpts) 8) Que signifie le premier et le troisième quartile? (lpts)
le 1er quartile est la donnée de la série qui sépare les 25 % inférieurs des données le 1er quartile est la donnée de la série qui sépare les 25 % inférieurs des données
(notation Q1) ; (notation Q1) ;
le 3e quartile est la donnée de la série qui sépare les 75 % le 3e quartile est la donnée de la série qui sépare les 75 %
9) Qu'est-ce qu'une régression linéaire ? (2pts) 9) Qu'est-ce qu'une régression linéaire ? (2pts)
La régression linéaire est un modèle qui permet de réaliser des prédictions. À partir d'un La régression linéaire est un modèle qui permet de réaliser des prédictions. À partir d'un
algorithme d'apprentissage supervisé, une relation linéaire établit la relation entre une algorithme d'apprentissage supervisé, une relation linéaire établit la relation entre une
variable expliquée et une variable explicative. variable expliquée et une variable explicative.
10) Qu'est-ce qu'une régression logistique, dans quel type de contexte le choix de son 10) Qu'est-ce qu'une régression logistique, dans quel type de contexte le choix de son
utilisation. (lpts) utilisation. (lpts)
la régression logistique ou modèle logit est un modèle de régression binomiale. la régression logistique ou modèle logit est un modèle de régression binomiale.
Comme pour tous les modèles de régression binomiale, il s'agit d'expliquer au Comme pour tous les modèles de régression binomiale, il s'agit d'expliquer au
mieux une variable binaire par des observations réelles nombreuses, grâce à un mieux une variable binaire par des observations réelles nombreuses, grâce à un
modèle mathématique modèle mathématique