0% ont trouvé ce document utile (0 vote)

78 vues5 pages

Traduction - Lab 5 - Multiple - Linear - Regression

Transféré par

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

78 vues5 pages

Traduction - Lab 5 - Multiple - Linear - Regression

Transféré par

Babacar Gaye

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Lab 5: Multiple Linear Regression

Introduction
Ce laboratoire est basé sur l'analyse de l'article de FiveThirtyEight.com intitulé The
Ultimate Halloween Candy Power Ranking (lien vers l'article). L'objectif du laboratoire
est d'utiliser la régression linéaire pour décrire ce qui rend un bonbon populaire.
Getting Started
us utiliserez R Studio via votre conteneur Docker personnel R Studio (https://vm-
manage.oit.duke.edu/containers) sur Duke VM Manage.
Modèle de laboratoire 5
Vous rédigerez votre devoir de laboratoire en utilisant le modèle STA 210 : Lab 5.
Pour accéder au modèle, vous devrez mettre à jour le package STA210. Vous
pouvez mettre à jour le package en utilisant le code ci-dessous dans la console R.

#updates the STA210 package

devtools::install_github("matackett/sta210/STA210") #add STA210
package to your R Studio environment to access the template and
datasets library("STA210")

Packages
En plus du package STA210, vous aurez besoin du packages suivants pour terminer
le laboratoire :

library("readr")
library("dplyr")
library("ggplot2")
library("broom")
library("knitr")

The Data
Nous utiliserons la fonction read_csv() dans le package readr pour lire les données
du site FiveThirtyEight.com Github. Si vous n'avez pas installé le package readr,
vous pouvez exécuter la commande suivante dans la console.

install.packages("readr")

Utilisez le code ci-dessous pour charger le package dans votre environnement R

Studio actuel et lire les données dans un tableau de données appelé candy.
library(readr)
candy <- read_csv("https://raw.githubusercontent.com/f
ivethirtyeight/data/master/candy-power-ranking/candy-d ata.csv")

Après avoir chargé le fichier CSV, vous pouvez utiliser la fonction glimpse() pour
vérifier que le jeu de données a bien été chargé correctement.
Questions
Question 0.
Lisez les premiers paragraphes de l'article The Ultimate Halloween Candy Power
Ranking (lien vers l'article). Décrivez brièvement comment les données du jeu de
données "candy" ont été collectées.
Question 1.
Avant de commencer l'analyse, nous voulons comprendre la structure de base des
données ainsi que les définitions de chaque variable.
a. Combien d'observations contient le jeu de données sur les candy ?
Combien de variables ?
b. Consultez le dictionnaire de données
(https://github.com/fivethirtyeight/data/blob/master/candy-power-
ranking/README.md) pour le jeu de données sur les candy.
L'objectif de notre analyse est d'identifier les attributs qui décrivent le bonbon le plus
populaire. Pour mesurer la popularité, nous utiliserons la variable winpercent. Quelle
est la définition exacte de la variable winpercent ?

Question 2.
Vous décidez de commencer l'analyse en utilisant un seul attribut pour décrire un
type de bonbon : la quantité de sucre contenue dans le bonbon.

a. La variable sugarpercent fournit une mesure de la quantité de sucre dans les

bonbons. Quelle est la définition exacte de sugarpercent ?

b. Créez un graphique en nuage de points montrant winpercent en fonction de

sugarpercent. D'après ce graphique, pensez-vous qu'il existe une relation linéaire
entre les deux variables ? Expliquez brièvement.

c. Calculez un modèle de régression décrivant la relation entre sugarpercent et

winpercent.

d. Avant de tirer des conclusions à partir du modèle, nous voulons vérifier les
hypothèses nécessaires à la régression. Ces hypothèses sont-elles respectées ?
Montrez tous les graphiques utilisés pour cette évaluation.

e. Utilisez la fonction confint() pour calculer un intervalle de confiance à 95 %

concernant l'effet de sugarpercent sur winpercent. Interprétez cet intervalle.
f. Le modèle de régression confirme-t-il votre hypothèse de la partie (b) ? Expliquez
brièvement.

Question 3.
Vous pensez que le fait qu'un bonbon contienne ou non du chocolat est un autre
attribut important pour déterminer le bonbon le plus populaire. Par conséquent, vous
souhaitez inclure l'effet du chocolat dans votre modèle de régression.

a. Calculez un modèle de régression qui utilise sugarpercent et chocolate pour

estimer winpercent.

b. Quel est l'effet estimé du chocolat sur winpercent, après avoir pris en compte
sugarpercent ?

c. Quelle est l'ordonnée à l'origine du modèle pour un bonbon sans chocolat ?

d. Quelle est l'ordonnée à l'origine du modèle pour un bonbon contenant du chocolat

Question 4.
Vous souhaitez vérifier si l'effet de sugarpercent sur winpercent diffère selon que le
bonbon contient ou non une gaufrette de riz croustillante (crispedricewafer).

a. Créez des graphiques en nuage de points séparés montrant winpercent en

fonction de sugarpercent pour les bonbons contenant des gaufrettes de riz
croustillantes et ceux qui n'en contiennent pas.

b. D'après vos graphiques, pensez-vous qu'il existe un effet d'interaction entre

sugarpercent et crispedricewafer ? Expliquez brièvement.

c. Calculez un modèle de régression qui utilise sugarpercent, crispedricewafer et

l'effet d'interaction sugarpercent * crispedricewafer pour estimer winpercent.

d. Quelle proportion de la variation de winpercent est expliquée par le modèle de

régression ?

e. Pourquoi pensez-vous que l'effet d'interaction n'est pas significatif, même si la

relation entre sugarpercent et winpercent semble différer en fonction de
crispedricewafer ? Indice : Prenez en compte la taille de l'échantillon des deux
groupes.

Question 5.
Vous souhaitez maintenant combiner les informations des modèles calculés dans les
questions 3 et 4.

a. Calculez un modèle de régression qui estime winpercent en utilisant les variables

suivantes : chocolate, crispedricewafer, et sugarpercent.

b. D'après le modèle, quel attribut a l'effet le plus fort sur winpercent ? Expliquez
brièvement.
c. Supposons que vous distribuez des bonbons pour Halloween et que vous
souhaitez vous assurer de donner les bonbons les plus populaires. D'après votre
modèle, quelles caractéristiques les bonbons devraient-ils avoir ?

d. Quel bonbon du jeu de données serait considéré comme le meilleur d'après votre
modèle ? Quel était son winpercent ?

Question 6.
Vérifiez les hypothèses pour le modèle de régression de la question 5. Les
hypothèses nécessaires pour la régression sont-elles respectées ? Assurez-vous
d'inclure tous les graphiques utilisés pour cette évaluation.

Soumission de votre devoir :

Une fois le devoir terminé, vous êtes prêt à générer le document PDF en compilant le
fichier. Cliquez sur le bouton Knit dans la barre de menu.

Une fois que vous cliquez sur Knit, votre fichier PDF apparaîtra dans une nouvelle
fenêtre. Si vous ne voyez pas le PDF, vérifiez les bloqueurs de fenêtres contextuelles
dans votre navigateur web.

Une fois le fichier tricoté (knit), vous devriez voir le texte écrit, accompagné de tout
code R ainsi que des sorties et/ou des graphiques correspondants. Si vous souhaitez
modifier quoi que ce soit dans votre document, vous pouvez apporter des
modifications dans le fichier R Markdown, puis recompiler (knit) le document pour
générer un PDF mis à jour.

Une fois le fichier PDF créé, vous pouvez l’exporter depuis le conteneur Docker vers
votre machine locale. Pour exporter le fichier, cliquez sur le bouton Download
(Télécharger) situé dans le coin supérieur droit.
Vous pouvez maintenant soumettre le PDF téléchargé sous l'onglet Assignments
(Devoirs) sur Sakai.

Références
Hickey, Walt. 2017. « The Ultimate Halloween Candy Power Ranking ».
FiveThirtyEight. Consulté le 1er octobre 2018. https://fivethirtyeight.com/features/the-
ultimate-halloween-candy-power-ranking/

Vous aimerez peut-être aussi

Analyse de données statistiques et tests
Pas encore d'évaluation
Analyse de données statistiques et tests
5 pages
TD2: Intervalles de Confiance 1 (Loi Des Données Inconnue Et)
Pas encore d'évaluation
TD2: Intervalles de Confiance 1 (Loi Des Données Inconnue Et)
2 pages
Analyse des Consommations et Ventes Statistiques
Pas encore d'évaluation
Analyse des Consommations et Ventes Statistiques
3 pages
Techniques de prévision et régression
Pas encore d'évaluation
Techniques de prévision et régression
4 pages
Statistiques de base avec R et Rcmdr
Pas encore d'évaluation
Statistiques de base avec R et Rcmdr
33 pages
TPSGD6
Pas encore d'évaluation
TPSGD6
13 pages
TPinit R
Pas encore d'évaluation
TPinit R
4 pages
Analyse de Variabilité des M&M's
Pas encore d'évaluation
Analyse de Variabilité des M&M's
13 pages
Statistiques et Probabilités en Agronomie
Pas encore d'évaluation
Statistiques et Probabilités en Agronomie
4 pages
Analyse SPSS des hamburgers fast-food
Pas encore d'évaluation
Analyse SPSS des hamburgers fast-food
26 pages
Analyse SPSS des Données de Hamburgers
Pas encore d'évaluation
Analyse SPSS des Données de Hamburgers
26 pages
Analyse de la glycémie chez obèses et contrôles
Pas encore d'évaluation
Analyse de la glycémie chez obèses et contrôles
12 pages
Statistiques et R pour étudiants
Pas encore d'évaluation
Statistiques et R pour étudiants
27 pages
Examen TP M1 2023 2024
Pas encore d'évaluation
Examen TP M1 2023 2024
3 pages
Tutoriel: Le Test de Friedman - Statistiques Et Logiciel R
Pas encore d'évaluation
Tutoriel: Le Test de Friedman - Statistiques Et Logiciel R
9 pages
Analyse de données avec R : TP01
Pas encore d'évaluation
Analyse de données avec R : TP01
2 pages
TD2 Taam1 2025
Pas encore d'évaluation
TD2 Taam1 2025
3 pages
Exercice 1
Pas encore d'évaluation
Exercice 1
4 pages
10 Algorithmes ML pour Débutants en Data Science
Pas encore d'évaluation
10 Algorithmes ML pour Débutants en Data Science
1 page
Statistiques Psychologie CM 1 Bases Modle Linaire Rgression Linaire Simple
Pas encore d'évaluation
Statistiques Psychologie CM 1 Bases Modle Linaire Rgression Linaire Simple
26 pages
TD Analyse Sensorielle
100% (1)
TD Analyse Sensorielle
4 pages
Analyse statistique sur la consommation de biscuits
Pas encore d'évaluation
Analyse statistique sur la consommation de biscuits
23 pages
TP3 Classif
Pas encore d'évaluation
TP3 Classif
1 page
Introduction à R pour Statistiques 1A-S5
Pas encore d'évaluation
Introduction à R pour Statistiques 1A-S5
37 pages
QCM sur les probabilités et statistiques
Pas encore d'évaluation
QCM sur les probabilités et statistiques
2 pages
Intervalle de confiance en statistiques
Pas encore d'évaluation
Intervalle de confiance en statistiques
5 pages
Devoir 2 Ue118 Sig
Pas encore d'évaluation
Devoir 2 Ue118 Sig
5 pages
Analyse Statistique avec ggstatsplot
Pas encore d'évaluation
Analyse Statistique avec ggstatsplot
7 pages
Analyse Statistique de Divers Datasets
Pas encore d'évaluation
Analyse Statistique de Divers Datasets
5 pages
Fonctions R : calculs et conditions
Pas encore d'évaluation
Fonctions R : calculs et conditions
9 pages
Sommaire: I Énoncés Des Exercices 1
Pas encore d'évaluation
Sommaire: I Énoncés Des Exercices 1
9 pages
Analyse des Ventes avec NumPy en Python
Pas encore d'évaluation
Analyse des Ventes avec NumPy en Python
2 pages
Analyse de données en biologie végétale
Pas encore d'évaluation
Analyse de données en biologie végétale
3 pages
Analyse des données de consommation de café
Pas encore d'évaluation
Analyse des données de consommation de café
6 pages
Tests Statistiques Avancés
100% (1)
Tests Statistiques Avancés
4 pages
Analyse sensorielle des produits alimentaires
Pas encore d'évaluation
Analyse sensorielle des produits alimentaires
36 pages
Examen de biostatistiques M1 NSA 2021-2022
Pas encore d'évaluation
Examen de biostatistiques M1 NSA 2021-2022
4 pages
Examen Test Statistique
Pas encore d'évaluation
Examen Test Statistique
4 pages
Introduction à SciPy pour Statistiques
100% (1)
Introduction à SciPy pour Statistiques
25 pages
Analyse des performances commerciales 2024
Pas encore d'évaluation
Analyse des performances commerciales 2024
3 pages
Prédiction de consommation d'énergie par régression
Pas encore d'évaluation
Prédiction de consommation d'énergie par régression
19 pages
Mini Projet ADD R
Pas encore d'évaluation
Mini Projet ADD R
3 pages
L Analyse de Données Écologiques Avec R
Pas encore d'évaluation
L Analyse de Données Écologiques Avec R
710 pages
2024 - Example - Analyse Des Donnees
Pas encore d'évaluation
2024 - Example - Analyse Des Donnees
17 pages
Test de Classement
Pas encore d'évaluation
Test de Classement
9 pages
Chap2 Modèle de Régression Linéaire Simple
Pas encore d'évaluation
Chap2 Modèle de Régression Linéaire Simple
10 pages
Fonctions Python pour Ensembles et Dictionnaires
Pas encore d'évaluation
Fonctions Python pour Ensembles et Dictionnaires
4 pages
Diabetes SVM
Pas encore d'évaluation
Diabetes SVM
11 pages
Normes Conceptuelles de Statistiques AP 1516
Pas encore d'évaluation
Normes Conceptuelles de Statistiques AP 1516
5 pages
Analyse statistique des données de TP
Pas encore d'évaluation
Analyse statistique des données de TP
9 pages
BTS Compta Gestion Sept 2020 DV 2
Pas encore d'évaluation
BTS Compta Gestion Sept 2020 DV 2
3 pages
Devoir d'Informatique 4ème Année
Pas encore d'évaluation
Devoir d'Informatique 4ème Année
4 pages
119 Biostatistique Et Analyse Informatique Des Donnees de R TDM
100% (1)
119 Biostatistique Et Analyse Informatique Des Donnees de R TDM
4 pages
ANOVA à un facteur : Analyse statistique
Pas encore d'évaluation
ANOVA à un facteur : Analyse statistique
7 pages
Analyse Statistique des Données Pokémon
Pas encore d'évaluation
Analyse Statistique des Données Pokémon
29 pages
Validation des méthodes chimiques 2024-2025
Pas encore d'évaluation
Validation des méthodes chimiques 2024-2025
4 pages
Java Project
Pas encore d'évaluation
Java Project
6 pages
TPE
Pas encore d'évaluation
TPE
2 pages
Librinova - Active Directory L Administrer Avec Powershell - 1
Pas encore d'évaluation
Librinova - Active Directory L Administrer Avec Powershell - 1
78 pages
Introduction aux Formes Bilinéaires
Pas encore d'évaluation
Introduction aux Formes Bilinéaires
11 pages
Chapitre 9 Contrôle Des Services Et Des Démons
Pas encore d'évaluation
Chapitre 9 Contrôle Des Services Et Des Démons
31 pages
Esa 9162
Pas encore d'évaluation
Esa 9162
6 pages
Isoprothallie chez les Bryophytes
Pas encore d'évaluation
Isoprothallie chez les Bryophytes
8 pages
Introduction à l'optimisation convexe
Pas encore d'évaluation
Introduction à l'optimisation convexe
21 pages
05-7-25 Neet
Pas encore d'évaluation
05-7-25 Neet
2 pages
Devoir Ã Rendre
Pas encore d'évaluation
Devoir Ã Rendre
4 pages
NF en 480-6
Pas encore d'évaluation
NF en 480-6
12 pages
Conférence Verte: Jeunesse et Emplois
Pas encore d'évaluation
Conférence Verte: Jeunesse et Emplois
1 page
Mathematiques Grandeurs Et Mesures
Pas encore d'évaluation
Mathematiques Grandeurs Et Mesures
2 pages
Guide Complet de Couture pour Débutants
83% (6)
Guide Complet de Couture pour Débutants
18 pages
Endomorphismes et Propriétés Positives
Pas encore d'évaluation
Endomorphismes et Propriétés Positives
8 pages
Tarea 1 Frances 4 JP
Pas encore d'évaluation
Tarea 1 Frances 4 JP
3 pages
RCP
Pas encore d'évaluation
RCP
8 pages
Émotions et Musique dans Intouchables
Pas encore d'évaluation
Émotions et Musique dans Intouchables
2 pages
Électrolyse et Orbites de Jupiter
Pas encore d'évaluation
Électrolyse et Orbites de Jupiter
2 pages
Cours - Math - Généralités Sur Les Fonctions - 2ème Sciences (2020-2021) MR Ayadi Mondher
100% (1)
Cours - Math - Généralités Sur Les Fonctions - 2ème Sciences (2020-2021) MR Ayadi Mondher
3 pages
TP2 IHM Prise en Main Figma
100% (2)
TP2 IHM Prise en Main Figma
20 pages
POSTER Développement de L'oasis de Todgha
Pas encore d'évaluation
POSTER Développement de L'oasis de Todgha
1 page
Relevemensuel 2024 12 31
Pas encore d'évaluation
Relevemensuel 2024 12 31
1 page
Évaluation Mathématiques BTS Systèmes Numériques
Pas encore d'évaluation
Évaluation Mathématiques BTS Systèmes Numériques
5 pages
Rapport de Stage
Pas encore d'évaluation
Rapport de Stage
17 pages
Théorie Du Complot Sur La Mort de Diana Spencer
Pas encore d'évaluation
Théorie Du Complot Sur La Mort de Diana Spencer
9 pages
Bulletin D'Inscription (Version Finale)
Pas encore d'évaluation
Bulletin D'Inscription (Version Finale)
9 pages
Ma Bible de La Médecine Chinoise (Marie Borrel Dr. Philippe Maslo)
90% (10)
Ma Bible de La Médecine Chinoise (Marie Borrel Dr. Philippe Maslo)
925 pages
Avis de Vacance de Poste - Chauffeur
Pas encore d'évaluation
Avis de Vacance de Poste - Chauffeur
2 pages
Guide complet sur la métrologie industrielle
Pas encore d'évaluation
Guide complet sur la métrologie industrielle
38 pages
HORAIRE DU RATT-WPS Office
Pas encore d'évaluation
HORAIRE DU RATT-WPS Office
1 page
06 Triangle Et Droites Paralleles Steinmaths
Pas encore d'évaluation
06 Triangle Et Droites Paralleles Steinmaths
8 pages
La Politique Achat
Pas encore d'évaluation
La Politique Achat
2 pages
23 Guide de Montage Réalisation
Pas encore d'évaluation
23 Guide de Montage Réalisation
6 pages
61293cb5c0892corrige TP 12 Fonction Logarithme Neperien Niveau
Pas encore d'évaluation
61293cb5c0892corrige TP 12 Fonction Logarithme Neperien Niveau
5 pages