0% ont trouvé ce document utile (0 vote)
22 vues5 pages

SyntheseModèles LM Et GLM

Le document présente des modèles de régression linéaire (LM) et logistique (GLM) appliqués à la prédiction du poids des bébés et de leur état de prématurité. Un modèle LM montre que le poids de la mère influence positivement le poids du bébé, mais a un faible pouvoir prédictif (R²=16%). Le modèle GLM indique que certaines variables augmentent la probabilité de prématurité, mais également avec une performance médiocre (AUC=60%).

Transféré par

Manel
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
22 vues5 pages

SyntheseModèles LM Et GLM

Le document présente des modèles de régression linéaire (LM) et logistique (GLM) appliqués à la prédiction du poids des bébés et de leur état de prématurité. Un modèle LM montre que le poids de la mère influence positivement le poids du bébé, mais a un faible pouvoir prédictif (R²=16%). Le modèle GLM indique que certaines variables augmentent la probabilité de prématurité, mais également avec une performance médiocre (AUC=60%).

Transféré par

Manel
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

MODÈLES LM ET

GLM
Une synthèse via l’exemple birthwt
Si on essai de prédire le poids du bébé en g (bwt)
■ On a un modèle avec cinq variables qui est retenu par selection
progressive (backward) avec le critère AIC
■ L’équation de ce modèle:
bwt=3125.420+lwt *3.136+race*-169.429 +
smoke* -449.104+ht*-723.065+ui*-547.345
■ Coefficient de lwt positif ce qui signifie que plus le poids de la maman
augmente plus le poids du bébé augmente; pour chaque augmentation
de 1 pound du poids de la maman le poids du bébé augmente de 3.13g
■ Coefficient de smoke négatif ce qui signifie qu’une femme qui fume
donnera naissance à un bébé qui pesera presque 450 g de moins qu’un
bébé nait d’une femme (identique pour les autres variables) qui ne fume
pas.
■ Malheureusement le pouvoir prédictif de ce modèle est médiocre
(R²=16%), ce qui signifie que seulement 16% de la variabilité d poids du
bébé est expliquée par les variables incluses dans le modèle. On a donc
rate d’autres variables importantes qui expliquent le poids du bébé.
Prédire l’état du bébé (prémature ou non)
par regression logistique
■ On retient par la methode backward, critère AIC un modèle à 5 variables
■ L’équation du modèle est :
logit(Pr(premature))=1.20-0.027*lwt+1.905*black+0.808*other+0.88*smoke+1.80ht+1.24*ui
■ le coefficient de lwt est négatif ca veut dire que plus le poids de la maman
augmente plus la proba que l'enfant à naitre soit prémature diminue
■ Les coefficients des autres variables sont positifs donc la proba que le bébé
naisse prématuré est augmentée pour les femmes qui fument, ont une ht, une
ui et pour les femmes black (par rapport aux femmes blanches)
■ La prédiction nous donne donc une probabilité (que l’enfant soit prématuré)
■ En évalue la qualité du modèle par AUC (équivalent du R² pour un modèle
linéaire) et par la sensibilité/spécificité/accuracy/MCC pour un cutoff choisi
selon un compromis expert
■ Ici on a AUC=60% Sn= 66.6%, Sp= 58% et Accuracy de 61.2% ce qui assez
médiocre
Résumé sur les modèles LM et GLM
■ LM: variable Y est quantitative
■ GLM: variable Y binaire (regression logistique)
■ LM: L’équation du modèle est sous la forme Y=a+bx1+cx2+…
■ GLM: L’équation du modèle est sous la forme logit(Pr(Y=1))= a+bx1+cx2+…
■ Cox: L’équation du modèle est sous la forme S(t)= a+bx1+cx2+…
■ Paramètres: LM: beta, GLM: beta+OR, Cox: beta+HR
■ Indicateurs de performance
■ LM: ajustement: AIC, BIC, R², prédiction: MSE (ou RMSE), R²
■ GLM: ajustement: AIC, BIC, prédiction: AUC (equivalent du R² dans LM), Sn,
Sp, Acc, MCC, F1-score,.. pour un cutoff particulier (choisi comme meilleur
compromise selon l’objectif)
■ Cox: ajustement: AIC, BIC, prédiction: Concordance (equivalent du R² du LM)

Vous aimerez peut-être aussi