0% ont trouvé ce document utile (0 vote)
71 vues2 pages

TP01 Régression Linéaire Multiple: Exercice 1: Laptops

Le document présente un TP sur la régression linéaire multiple, incluant des exercices pratiques sur l'analyse d'un jeu de données concernant des laptops. Les tâches incluent le chargement de données, l'installation de packages R, la visualisation et l'analyse statistique, ainsi que la création de modèles linéaires pour prédire le prix des laptops en fonction de diverses caractéristiques. Les étudiants doivent également évaluer la qualité des modèles et interpréter des résultats statistiques tels que la covariance, le coefficient de corrélation et le VIF.

Transféré par

Amine Khouildi
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
71 vues2 pages

TP01 Régression Linéaire Multiple: Exercice 1: Laptops

Le document présente un TP sur la régression linéaire multiple, incluant des exercices pratiques sur l'analyse d'un jeu de données concernant des laptops. Les tâches incluent le chargement de données, l'installation de packages R, la visualisation et l'analyse statistique, ainsi que la création de modèles linéaires pour prédire le prix des laptops en fonction de diverses caractéristiques. Les étudiants doivent également évaluer la qualité des modèles et interpréter des résultats statistiques tels que la covariance, le coefficient de corrélation et le VIF.

Transféré par

Amine Khouildi
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

TP01

Régression linéaire multiple

Exercice 1 :
1) Télécharger le fichier de données laptops depuis Classroom
2) Charger le jeu de données
3) Installer les packages suivants :
● library(car)
● library(ggplot2)
● library(lm.beta)
À quoi servent ces packages ?
4) Visualiser le contenu d'un tableau de données à l'aide de la fonction View.
Quelles sont les variables dans ce jeu de données ?
5) Afficher les 6 premières lignes de l'objet "laptops"
6) Attribuer aux colonnes du dataset les noms suivants : Prix", "Taille",
"RAM", "Disque", "Ports", "Marque", "Poids"
7) Afficher les mesures statistiques de base pour le dataset à l’aide de la
commande summary.
8) Quel est le prix maximal et minimal d’un laptop en $
9) Quel est le nombre minimal de ports qu’on peut trouver dans un laptop de
l’échantillon étudié
10) Quelle est la taille moyenne d’un laptop
11) Quelle est la valeur médiane du poids en onces
12) Quels sont les caractéristiques de la marque (longueur, classe, mode) ?
13) On propose d’expliquer le Prix ($) en fonction de la taille du disque
(Giga). Afficher le nuage de point à l’aide de ggplot2. Que
remarquez-vous ?
14) Peut-on établir un modèle linéaire pour représenter la relation entre les
variables Prix et Disque. Si oui, ajouter la droite de régression linéaire.
Interpréter (Est-ce qu’il y a une corrélation forte entre les données ?)
15) Evaluer la qualité du modèle à partir du graphique.
16) Déterminer la covariance entre les variables Prix et Disque. Interpréter.
17) Déterminer le coefficient de corrélation. Interpréter
18) Déterminer le coefficient de détermination. Interpréter
19) Afficher les mesures statistiques pour le modèle linéaire obtenu.
20) Analyser le modèle linéaire sur le plan inférentiel en interprétant la
valeur de p-value.

1
21) On propose de prédire le Prix en fonction de Disque, Taille, Ports,
Poids et RAM)
Etablir le modèle linéaire multiple (model2) correspondant.
22) Afficher les mesures statistiques de base pour le modèle à l’aide de la
commande summary.
Que remarquez-vous par rapport à la valeur de p-value du modèle global
et celle du Disque ?
Observez les valeurs de l’écart type de l’erreur, que remarque vous ?
23) Déterminer la valeur de VIF (variance d’inflation factor) à l’aide de la
fonction vif afin de tester la multi-colinéarité.
24) Déterminer la matrice de corrélation du dataset privé de la variable
qualitative (marque3). Vérifier la corrélation entre Poids et taille
25) On propose de corriger le modèle en ignorant la variable taille.
Etablir le nouveau modèle linéaire (model4). Est-ce le modèle a été
amélioré ?
26) On propose de corriger le modèle en ignorant la variable RAM.
Etablir le nouveau modèle linéaire (model5). Est-ce le modèle a été
amélioré ?
27) Déterminer le VIF du modèle 5. Interpréter
28) Déterminer les coefficients centrés réduits (les β) à l’aide de la
fonction lm.beta
29) Utiliser des intervalles de confiance à l’aide de la fonction confint
pour voir pour chaque β, Interpréter.

Vous aimerez peut-être aussi