0% ont trouvé ce document utile (0 vote)

101 vues4 pages

Regression Logistique Cours Complet

Transféré par

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

101 vues4 pages

Regression Logistique Cours Complet

Transféré par

Sene

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Cours complet : Régression logistique

1. Introduction
La régression logistique est un modèle statistique utilisé pour prédire la probabilité d'un événement
binaire (0/1, oui/non) en fonction de variables explicatives. Elle est utilisée dans la médecine, le
marketing, la finance, l'informatique, etc.

Exemples :

• Prédire si un patient est atteint d'une maladie.

• Prédire si un client va acheter un produit.
• Prédire si un email est spam ou non.

2. Fonction logistique (sigmoïde)

Pour une combinaison linéaire des variables :

$$ z = \beta_0 + \beta_1 x_1 + ... + \beta_p x_p $$

La fonction logistique est :

$$ P(Y=1|X) = \frac{1}{1 + e^{-z}} = \sigma(z) $$

• Valeurs entre 0 et 1.
• Transforme les log-odds en probabilité.

Logit :

$$ \text{logit}(P) = \ln\left(\frac{P}{1-P}\right) = z $$

3. Estimation des coefficients

Méthode du maximum de vraisemblance (MLE)

Pour n observations :

$$ L(\beta) = \prod_{i=1}^n P(Y=y_i|X=x_i; \beta) = \prod_{i=1}^n [\sigma(z_i)^{y_i} (1-\sigma(z_i))^{1-y_i}]

Maximisation du logarithme de vraisemblance :

$$ \ell(\beta) = \sum_{i=1}^n [ y_i \ln \sigma(z_i) + (1-y_i) \ln (1-\sigma(z_i)) ] $$

Algorithmes numériques : Newton-Raphson, Gradient descent.

1
4. Interprétation des coefficients
• βj : effet de xj sur le log-odds.
• eβj : odds ratio.

Exemple : β1 = 0.5 → e0.5 ≈ 1.65 . Chaque unité supplémentaire de x1 multiplie les chances par 1,65.

5. Hypothèses
1. Indépendance des observations.
2. Relation linéaire entre logit(P) et variables explicatives.
3. Absence de multicolinéarité élevée.
4. Taille d'échantillon suffisante.

6. Évaluation du modèle

Matrice de confusion

Prédit 1 Prédit 0

Réel 1 TP FN

Réel 0 FP TN

• Accuracy = (TP + TN)/n

• Precision = TP/(TP+FP)
• Recall = TP/(TP+FN)
• F1-score = 2*(Precision*Recall)/(Precision+Recall)

Courbe ROC et AUC

• ROC : TPR vs FPR

• AUC : 0.5 = hasard, 1 = parfait

Tests statistiques

• Wald test pour chaque coefficient : Z = β/SE(β) \~ N(0,1)

• Test global (likelihood ratio test)

7. Problèmes fréquents et solutions

Problème Solution

Multicolinéarité Retirer variables corrélées, PCA

Données déséquilibrées Sur-échantillonnage, sous-échantillonnage, SMOTE

2
Problème Solution

Valeurs extrêmes Standardisation ou transformation

Non-linéarité Ajouter polynômes ou transformations

8. Régression logistique multinomiale

Pour Y ∈ {1,2,...,K}, choisir une classe de référence :

$$ \log\frac{P(Y=k)}{P(Y=K)} = \beta_{0k} + \beta_{1k} x_1 + ... + \beta_{pk} x_p $$

Chaque classe a son vecteur de coefficients.

9. Exemples d'application

9.1 Médical : risque de diabète

• Variables : Âge, IMC

• Modèle : logit(P) = -7 + 0.05Âge + 0.1IMC
• Probabilité pour patient Âge=50, IMC=25 : P ≈ 0.12

9.2 Marketing : achat produit

• Variables : revenus, âge, temps sur site

• Coefficients : β_revenus=0.02, β_age=-0.01, β_temps=0.05
• Interprétation : plus le temps sur site augmente, plus la probabilité d'achat augmente.

9.3 Spam email

• Variables : nb_liens, nb_mots_spam, longueur_email

• Objectif : classifier email comme spam ou non
• Évaluation : ROC, précision, rappel

10. Implémentation Python

import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import confusion_matrix, roc_auc_score,
classification_report

data = pd.DataFrame({
'Age':[45,34,60,50,23],
'IMC':[28,22,30,25,20],
'Diabete':[1,0,1,0,0]

3
})
X = data[['Age','IMC']]
y = data['Diabete']
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.4,
random_state=42)
model = LogisticRegression()
model.fit(X_train, y_train)
y_pred = model.predict(X_test)
proba = model.predict_proba(X_test)[:,1]
print(confusion_matrix(y_test, y_pred))
print(roc_auc_score(y_test, proba))
print(classification_report(y_test, y_pred))

11. Points essentiels

1. Prédiction de probabilités.
2. Coefficients → log-odds, exponentiés → odds ratio.
3. Évaluation via matrice de confusion, ROC/AUC, précision, rappel.
4. Hypothèses : indépendance, linéarité, absence multicolinéarité.
5. Pour plus de classes → régression multinomiale.
6. Pratique : prétraitement, standardisation, gestion des déséquilibres.

Vous aimerez peut-être aussi

Regression Logistique Cours Complet
Pas encore d'évaluation
Regression Logistique Cours Complet
4 pages
Regression Logistique
Pas encore d'évaluation
Regression Logistique
14 pages
Introduction à la Régression Logistique
Pas encore d'évaluation
Introduction à la Régression Logistique
18 pages
Geno
Pas encore d'évaluation
Geno
4 pages
Machine Learning Regression Logistique
Pas encore d'évaluation
Machine Learning Regression Logistique
22 pages
Regression
Pas encore d'évaluation
Regression
20 pages
Régression Logistique en Biomédical
Pas encore d'évaluation
Régression Logistique en Biomédical
27 pages
Regression Logistique Explication
Pas encore d'évaluation
Regression Logistique Explication
11 pages
Seance 2 Rlog
Pas encore d'évaluation
Seance 2 Rlog
4 pages
Regression Logistique Pro
Pas encore d'évaluation
Regression Logistique Pro
14 pages
Classification binaire par régression logistique
Pas encore d'évaluation
Classification binaire par régression logistique
19 pages
Introduction à la régression logistique
Pas encore d'évaluation
Introduction à la régression logistique
15 pages
Introduction à la régression logistique
Pas encore d'évaluation
Introduction à la régression logistique
27 pages
Econométrie Des Variables Catégorielles
100% (2)
Econométrie Des Variables Catégorielles
164 pages
Apprentissage: Régression Logistique
Pas encore d'évaluation
Apprentissage: Régression Logistique
3 pages
GLM Poly Logistique Web PDF
Pas encore d'évaluation
GLM Poly Logistique Web PDF
140 pages
Régression Logistique : Guide Complet
Pas encore d'évaluation
Régression Logistique : Guide Complet
51 pages
Regression Logistique
Pas encore d'évaluation
Regression Logistique
4 pages
03 Classification
Pas encore d'évaluation
03 Classification
79 pages
Classification RegLog
Pas encore d'évaluation
Classification RegLog
19 pages
Modèles Linéaires et Régression
Pas encore d'évaluation
Modèles Linéaires et Régression
79 pages
TD Machine Regression Python
Pas encore d'évaluation
TD Machine Regression Python
3 pages
5 Régression Logistique Et Algorithmes de Classification
100% (1)
5 Régression Logistique Et Algorithmes de Classification
49 pages
TP1 Regression Logistique
Pas encore d'évaluation
TP1 Regression Logistique
5 pages
La Regression Lineaire
100% (1)
La Regression Lineaire
31 pages
Cours Bishop
Pas encore d'évaluation
Cours Bishop
10 pages
Classification RegressionLogistique
Pas encore d'évaluation
Classification RegressionLogistique
20 pages
Regression Logistique Theorie Et Applications
Pas encore d'évaluation
Regression Logistique Theorie Et Applications
89 pages
FORMATION Epi Info
Pas encore d'évaluation
FORMATION Epi Info
4 pages
Regression Logistique
Pas encore d'évaluation
Regression Logistique
138 pages
Régression Logistique
Pas encore d'évaluation
Régression Logistique
12 pages
TD Et Indications - Éléments de Réponse
Pas encore d'évaluation
TD Et Indications - Éléments de Réponse
10 pages
Modèles de Régression en Apprentissage Automatique
Pas encore d'évaluation
Modèles de Régression en Apprentissage Automatique
10 pages
Régression Logistique
Pas encore d'évaluation
Régression Logistique
17 pages
Tout Savoir Sur La Régression Logistique
Pas encore d'évaluation
Tout Savoir Sur La Régression Logistique
11 pages
TP2 - Apprentissage Supervisé (Heart Disease Dataset) : Objectifs Pédagogiques
Pas encore d'évaluation
TP2 - Apprentissage Supervisé (Heart Disease Dataset) : Objectifs Pédagogiques
6 pages
Perceptron et régression logistique en santé
Pas encore d'évaluation
Perceptron et régression logistique en santé
27 pages
Regression Logistique
Pas encore d'évaluation
Regression Logistique
138 pages
Régression Logistique et Modèles Linéaires
Pas encore d'évaluation
Régression Logistique et Modèles Linéaires
23 pages
Chap 3 REGLOG
Pas encore d'évaluation
Chap 3 REGLOG
21 pages
Introduction à la Régression Logistique
Pas encore d'évaluation
Introduction à la Régression Logistique
2 pages
Logistic Regression
Pas encore d'évaluation
Logistic Regression
23 pages
Modèles de régression et classification ML
Pas encore d'évaluation
Modèles de régression et classification ML
5 pages
Régression Linéaire Simple en Python
Pas encore d'évaluation
Régression Linéaire Simple en Python
11 pages
Regression Logistique Et Classification
Pas encore d'évaluation
Regression Logistique Et Classification
7 pages
Régression Linéaire : Concepts et Méthodes
Pas encore d'évaluation
Régression Linéaire : Concepts et Méthodes
13 pages
Introduction à la régression logistique
Pas encore d'évaluation
Introduction à la régression logistique
27 pages
Ai TP3 2024
Pas encore d'évaluation
Ai TP3 2024
6 pages
Régression Logistique en Santé
Pas encore d'évaluation
Régression Logistique en Santé
8 pages
Bleu Foncé Technologie Moderne Entreprise Informatique Présentation
Pas encore d'évaluation
Bleu Foncé Technologie Moderne Entreprise Informatique Présentation
28 pages
05-Modeles Generalises Mixtes
Pas encore d'évaluation
05-Modeles Generalises Mixtes
25 pages
Régression Linéaire et Descente de Gradient
Pas encore d'évaluation
Régression Linéaire et Descente de Gradient
43 pages
Introduction à l'apprentissage supervisé
Pas encore d'évaluation
Introduction à l'apprentissage supervisé
4 pages
Régression Logistique Simplifiée
Pas encore d'évaluation
Régression Logistique Simplifiée
9 pages
Régression Logistique Binaire: Concepts et Utilisation
Pas encore d'évaluation
Régression Logistique Binaire: Concepts et Utilisation
15 pages
Régression Linéaire et Logistique en Deep Learning
Pas encore d'évaluation
Régression Linéaire et Logistique en Deep Learning
90 pages
Apprentissage Supervisé et Régression
Pas encore d'évaluation
Apprentissage Supervisé et Régression
20 pages
Exercices de Graphes et Modélisation
Pas encore d'évaluation
Exercices de Graphes et Modélisation
36 pages
Exercices sur les fonctions logiques de base
Pas encore d'évaluation
Exercices sur les fonctions logiques de base
4 pages
Cours Analyse Des Données Marketing
Pas encore d'évaluation
Cours Analyse Des Données Marketing
92 pages
Corrigé CC D'architecture Et Programmation en Assembleur B2 A
Pas encore d'évaluation
Corrigé CC D'architecture Et Programmation en Assembleur B2 A
5 pages
Conception de filtres FIR linéaires
Pas encore d'évaluation
Conception de filtres FIR linéaires
24 pages
Moindres Carrés: Ajustement Optimal
Pas encore d'évaluation
Moindres Carrés: Ajustement Optimal
2 pages
Exercices d'Algorithmique Avancée
Pas encore d'évaluation
Exercices d'Algorithmique Avancée
1 page
Modes de chiffrement en cryptographie
Pas encore d'évaluation
Modes de chiffrement en cryptographie
22 pages
Gestion des transactions en cours
Pas encore d'évaluation
Gestion des transactions en cours
31 pages
Signatures Numériques et Blockchain
Pas encore d'évaluation
Signatures Numériques et Blockchain
46 pages
Analyse de Sensibilité en Programmation Linéaire
100% (1)
Analyse de Sensibilité en Programmation Linéaire
4 pages
Algorithme de Viterbi : Implémentation et Applications
Pas encore d'évaluation
Algorithme de Viterbi : Implémentation et Applications
7 pages
Examen sur les Réseaux de Neurones RNN
Pas encore d'évaluation
Examen sur les Réseaux de Neurones RNN
4 pages
QUA192-semaine 2 RSERRA
100% (2)
QUA192-semaine 2 RSERRA
58 pages
2018 Examen Et Solution Probabilité Mai 2018.pdf Version 1-4
Pas encore d'évaluation
2018 Examen Et Solution Probabilité Mai 2018.pdf Version 1-4
5 pages
Interpolation et Extrapolation Polynomiale
Pas encore d'évaluation
Interpolation et Extrapolation Polynomiale
15 pages
Revision
Pas encore d'évaluation
Revision
3 pages
Machine Learning - Step-by-Step Guide To Implement Machine Learning Algorithms With Python (PDFDrive)
100% (1)
Machine Learning - Step-by-Step Guide To Implement Machine Learning Algorithms With Python (PDFDrive)
103 pages
Programmation Non Linéaire
100% (1)
Programmation Non Linéaire
251 pages
Modèles d'Équations Structurelles Latentes
Pas encore d'évaluation
Modèles d'Équations Structurelles Latentes
11 pages
Modélisation VAR en Économie et Statistiques
Pas encore d'évaluation
Modélisation VAR en Économie et Statistiques
22 pages
Exercice 1
Pas encore d'évaluation
Exercice 1
2 pages
Applications et principes des réseaux neuronaux
Pas encore d'évaluation
Applications et principes des réseaux neuronaux
28 pages
Perceptron multicouche et rétropropagation
Pas encore d'évaluation
Perceptron multicouche et rétropropagation
46 pages
Tables de Hachage : Concepts et Méthodes
Pas encore d'évaluation
Tables de Hachage : Concepts et Méthodes
44 pages
Programmation Dynamique: Concepts et Techniques
Pas encore d'évaluation
Programmation Dynamique: Concepts et Techniques
16 pages
Introduction aux Systèmes Automatisés
Pas encore d'évaluation
Introduction aux Systèmes Automatisés
28 pages
La Cryptographie Master 01
Pas encore d'évaluation
La Cryptographie Master 01
9 pages
Génération et analyse du bruit blanc sous MATLAB
Pas encore d'évaluation
Génération et analyse du bruit blanc sous MATLAB
9 pages
TDTP 03 - Tris
Pas encore d'évaluation
TDTP 03 - Tris
2 pages