TD1 Ad Lmio2

Ce document présente un TD sur la statistique descriptive utilisant R, incluant des instructions pour créer des répertoires, importer des données, et effectuer des analyses sur des variables qualitatives et quantitatives. Il couvre la création de tableaux statistiques, de diagrammes, et de régressions linéaires, ainsi que des tests d'hypothèses. Les exercices sont accompagnés de codes R pour faciliter l'apprentissage pratique des concepts statistiques.

Transféré par

sokhoubbthioune

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

38 vues5 pages

TD1 Ad Lmio2

Transféré par

sokhoubbthioune

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Analyse de données

e-mail : [Link]@[Link]

Université de Thiès, UFR SES

Département de Management des Organisations
Licence Deuxième année M.I.O. Année universitaire 2023-2024
Fatou Néné Diop

TD1 : Statistique descriptive sur R

1 Utilisation de RStudio et R :
1. Créer un répertoire de travail nommé par exemple TD1Stat dans Documents.
2. Ouvrir RStudio et sélectionner ce répertoire de travail dans
Session -> Set Working Directory -> Choose Directory.
3. Créer avec
File -> New File -> Rscript
un fichier texte à enregistrer sous le nom par exemple codeTD1 (auquel RStudio mettra l’extension
.R). C’est dans ce fichier texte que vous taperez les instructions R. Pour les exécuter dans R (fenêtre
en bas à gauche) utiliser le bouton Run.
4. Entrez, exécutez les commandes suivantes :

a=c(1,2,3) mean(a)

Les deux structures de données principales dans R sont les vector (structure unidimensionnelle qui
permet de représenter une variable statistique et les [Link] (structure bidimensionnelle qui permet
de représenter (une ou) plusieurs variables statistiques mesurées sur les mêmes personnes. A la fin de
chaque exercice, penser à nettoyer la mémoire (balayette en haut à gauche).

2 Variable qualitative nominale :

On s’intéresse à la variable état-civil notée X et à la série statistique des valeurs prises par X sur 20
personnes. La codification est : célibataire (C), divorcé(D), marié (M), veuf (V). En langage R :
1. Création du vector X dans R :
X=c(’M’,’M’,’D’,’C’,’C’,’M’,’C’,’C’,’C’,’M’,’C’,’M’,’V’,’M’,’V’,’D’,’C’,’C’,’C’,’M’)
2. Vérification X
3. Tableau statistique : T1=table(X)
4. T1
5. Effectifs et fréquences :
[Link](Eff=c(T1),Freq=c(T1)/sum(c(T1)))
6. Diagramme en secteurs : pie(T1)
7. Plus gros : pie(T1,radius=1)
8. Diagramme en barres : barplot(T1)
9. Mieux : barplot(T1, ylim=c(0,max(T1)+1))

1
3 Variable qualitative ordinale :
On interroge 50 personnes sur leur dernier diplôme obtenu (variable Y ). La codification est : sans di-
plôme (Sd), primaire (P), secondaire (S), Supérieur non-universitaire (Su), Universitaire (U). Les résultats
sont donnés dans le fichier [Link]. En langage R :
1. Importer le fichier de données [Link] (cliquer dessus : import data set). R crée un dataframe
appelé ordinale.
2. Pour rendre accessible les variables dans le [Link] ordinale, on l’attache : attach(ordinale)
3. Vérification : Y
4. Tableau statistique : T2=table(Y)
5. T2
6. V2=c(T2)
7. Effectifs, fréquences et fréquences cumulées :
[Link](Eff=V2,EffCum=cumsum(V2),Freq=V2/sum(V2),FreqCum=cumsum(V2/sum(V2)))
8. Diagramme en secteurs : pie(T2)
9. Diagramme en barres des effectifs : barplot(T2)
10. Diagramme en barres des effectifs cumulés : barplot(cumsum(T2))
11. Penser à détacher le [Link] : detach(ordinale)

4 Variable quantitative discrète :

Un quartier est composé de 50 ménages et la variable Z représente le nombre de personnes par ménage.
Il y a 5 ménages composés de 1 personnes, 9 ménages composés de 2 personnes, 15 ménanes composés
de 3 personnes, 10 ménages composés de 4 personnes, 6 ménages composés de 5 personnes et 2 ménages
composés de 6 personnes. En langage R :
1. Création du vector Z :
Z=c(rep(1,5),rep(2,9),rep(3,15),rep(4,10),rep(5,6),rep(6,3),rep(8,2))
2. Vérification : Z
3. Tableau statistique : T4=table(Z)
4. Effectifs, fréquences et fréquences cumulées :
V4=c(T4)
[Link](Eff=V4,EffCum=cumsum(V4),Freq=V4/sum(V4),FreqCum=cumsum(V4/sum(V4)))
5. Diagramme des effectifs en bâtonnets : plot(T4)
6. Fonction de répartition : plot(ecdf(Z))
7. Mieux :
8. Effectifs, fréquences et fréquences cumulées :
plot(ecdf(Z),xlab="",ylab="",main="",frame=0)

5 Variable quantitative continue :

On mesure la taille en centimètres de 50 élèves d’une classe, on note S la variable :

152 152 152 153 153 154 154 154 155 155
156 156 156 156 157 157 157 158 158 159
159 160 160 160 161 160 160 161 162 162
163 164 164 164 164 165 166 167 168 168
168 169 170 171 171 171 171 156 162 169

2
1. Importer le fichier de données [Link] et attacher le dataframe créé.
2. Vérifiation : S
3. Tableau statistique
T5=table(cut(S, breaks=c(151,155,159,163,167,171)))
4. T5
5. T5c=c(T5)
6. Effectifs, fréquences et fréquences cumulées
[Link](Eff=T5c,EffCum=cumsum(T5c),Freq=T5c/sum(T5c),FreqCum=cumsum(T5c/sum(T5c)))
7. Histogramme des fréquences :
hist(S,breaks=c(151,155,159,163,167,171),probability=TRUE)
8. Ajout des graduations de l’axe (Ox) : axis(1, c(151,155,159,163,167,171))
9. Graphe de la fonction des fréquences cumulées :
y=c(0,cumsum(T5c/sum(T5c)))
x=c(151,155,159,163,167,171)
plot(x,y,type="b",xlab="",ylab="",xaxt = "n")
axis(1, c(151,155,159,163,167,171))

6 •
On charge des données déjà présentes dans R, nommées anscombe et on représente les nuages de points
avec les instructions suivantes. Quel est, à votre avis, le couple pxi ; yi q qui a le plus grand cœfficient de
corrélation linéaire ? le plus petit ? Le vérifier.

data(anscombe)
attach(anscombe)
par(mfrow=c(2,2))
plot(x1,y1)
plot(x2,y2)
plot(x3,y3)
plot(x4,y4)

7 Régression linéaire simple et liaison entre deux variables quan-

titatives
On mesure la taille et le poids de 20 individus.
1. Importer le fichier [Link] et l’attacher.
2. Moyennes : mean(taille) ;mean(poids)
3. Variances (corrigées) : var(taille) ; var(poids)
4. Régression linéaire (on donne le nom m à la sortie) :
m=lm(poids ~ taille)
5. Un résumé des sorties de la fonction lm : summary(m)
6. Liste des noms des sorties de la fonction lm : names(m)
7. Ordonnée à l’origine et pente de la droite de régresion :
a=m$coefficients[1];b=m$coefficients[2]
8. Tracé du nuage de point : plot(taille,poids)
9. Tracé de la droite : abline(a,b)

3
8 Liaison entre deux variables qualitatives
Les données proviennent d’une société d’assurance automobile. Les deux variables retenues pour l’ana-
lyse sont :
— Le mode de réglement : annuel, mensuel, semestriel ou trimestriel ;
— La situation maritale : célibataire, concubin, divorcé, marié ou veuf.
En langage R :
1. Création du tableau de contingence :
M = matrix(c(209, 1483, 41, 320, 60, 34, 151, 1, 70, 10,
535,2448, 33, 897, 135, 77, 245, 4, 139, 9), byrow = T, ncol = 5)
colnames(M) = c("celibataire", "concubin", "divorce", "marie","veuf")
rownames(M) = c("annuel", "mensuel", "semestriel", "trimestriel")
2. Vérification : M
3. Profils lignes profLignes = [Link](M, 1)
4. Profils colonnes profCol = [Link](M, 2)
5. Calcul du χ2 et sortie dans res : res=[Link](M)
6. Liste des noms des sorties de la fonction [Link] : names(res)
7. Effectifs théoriques :
res$expected
8. Valeur du χ2 :
chi2=res$statistic

9 Liaison entre une variable quantitative et une variable quali-

tative
Dans une étude sur l’épuisement professionnel, dans le secteur de l’éducation, on a fait remplir un
questionnaire à des enseignants de collège dans 4 pays européens : A, B, C et D. Ensuite, on a attribué
à chaque enseignant interrogé un score représentant son niveau global de stress et d’épuisement. Les
résultats sont dans le fichier [Link].
1. Boîtes à moustaches :
boxplot(Stress~Pays)
2. Calcul des effectifs :
nA=length(which(Pays=="A"))
nB=length(which(Pays=="B"))
nC=length(which(Pays=="C"))
nD=length(which(Pays=="D"))
n=nA+nB+nC+nD
3. Calcul des moyennes :
moyglobale=mean(Stress)
moyA=mean(Stress[Pays=="A"])
moyB=mean(Stress[Pays=="B"])
moyC=mean(Stress[Pays=="C"])
moyD=mean(Stress[Pays=="D"])
4. Calcul de SCF, SCR et SCT et R2 :
moy=c(moyA,moyB,moyC,moyD)
n=c(nA,nB,nC,nD)
SCF=sum(n*(moy-moyglobale)^2)
SCR=SCT-SCF
R2=SCF/SCT

4
5. R calcule tout cela quand on fait une analyse de la variance :
summary(aov(Stress~Pays))
[Link](aov(Stress~Pays))

Vous aimerez peut-être aussi

Saha7 3
Pas encore d'évaluation
Saha7 3
5 pages
Statistiques Univariées avec R
Pas encore d'évaluation
Statistiques Univariées avec R
59 pages
Formulaire Analyse de Données
Pas encore d'évaluation
Formulaire Analyse de Données
12 pages
Statistiques descriptives avec R
Pas encore d'évaluation
Statistiques descriptives avec R
8 pages
TP Statistique Descriptive Univarié
Pas encore d'évaluation
TP Statistique Descriptive Univarié
10 pages
Chapitre 1 2023 2024
Pas encore d'évaluation
Chapitre 1 2023 2024
54 pages
Lecture 2 (La Statistique Descriptive)
Pas encore d'évaluation
Lecture 2 (La Statistique Descriptive)
31 pages
QCM23 24 s1
Pas encore d'évaluation
QCM23 24 s1
7 pages
2 - Statistiques - Descriptives - Avec - R - Master 2
Pas encore d'évaluation
2 - Statistiques - Descriptives - Avec - R - Master 2
24 pages
Zambra Zambrita
Pas encore d'évaluation
Zambra Zambrita
5 pages
BiostatL2 StatR P2016
Pas encore d'évaluation
BiostatL2 StatR P2016
4 pages
Formules et Tests Statistiques en R
Pas encore d'évaluation
Formules et Tests Statistiques en R
4 pages
Lab4 Transcription
Pas encore d'évaluation
Lab4 Transcription
15 pages
Examen
Pas encore d'évaluation
Examen
1 page
TPinit R
Pas encore d'évaluation
TPinit R
4 pages
Analyse des données discrètes avec R
Pas encore d'évaluation
Analyse des données discrètes avec R
6 pages
DR - Pierre-Emmanuel Encinar: Encadrent
Pas encore d'évaluation
DR - Pierre-Emmanuel Encinar: Encadrent
33 pages
Chapitre 4 Le Logiciel R Et Statistique Descriptive Bivariée
Pas encore d'évaluation
Chapitre 4 Le Logiciel R Et Statistique Descriptive Bivariée
5 pages
Correction TD 1
Pas encore d'évaluation
Correction TD 1
8 pages
Statistique Descriptive avec R
Pas encore d'évaluation
Statistique Descriptive avec R
35 pages
SOULEYMANE Vouna Djarma
Pas encore d'évaluation
SOULEYMANE Vouna Djarma
20 pages
Analyse de données R : statistiques et graphiques
Pas encore d'évaluation
Analyse de données R : statistiques et graphiques
9 pages
TD 1 - Stats1a - ENSAIA - 2022-2023
Pas encore d'évaluation
TD 1 - Stats1a - ENSAIA - 2022-2023
37 pages
Statistiques Descriptives
Pas encore d'évaluation
Statistiques Descriptives
125 pages
4 - Analyses - Univaries - Avec - R - Avant Toutes Modelisations
Pas encore d'évaluation
4 - Analyses - Univaries - Avec - R - Avant Toutes Modelisations
9 pages
Corrige CT RST Meca S5 22-23
Pas encore d'évaluation
Corrige CT RST Meca S5 22-23
3 pages
Cours Statistique
Pas encore d'évaluation
Cours Statistique
46 pages
Dev CRITIE
Pas encore d'évaluation
Dev CRITIE
8 pages
CT R - Rst-Meca-Ge S7 - 2021-2022
Pas encore d'évaluation
CT R - Rst-Meca-Ge S7 - 2021-2022
4 pages
2020 TD nc2b04 Et 5 Statistiques
Pas encore d'évaluation
2020 TD nc2b04 Et 5 Statistiques
10 pages
Introduction aux objets R : vecteurs, matrices, listes
Pas encore d'évaluation
Introduction aux objets R : vecteurs, matrices, listes
33 pages
Cours 1
Pas encore d'évaluation
Cours 1
26 pages
Correction Seg2
Pas encore d'évaluation
Correction Seg2
8 pages
TD3 Janvier09
Pas encore d'évaluation
TD3 Janvier09
9 pages
Cours2 - ELEMENTS DE STATISTIQUES (2) - Statistique Descriptive Univariée - Tri À Plat
Pas encore d'évaluation
Cours2 - ELEMENTS DE STATISTIQUES (2) - Statistique Descriptive Univariée - Tri À Plat
23 pages
TD 1-1
Pas encore d'évaluation
TD 1-1
3 pages
Fiche 2
Pas encore d'évaluation
Fiche 2
11 pages
QCM R
Pas encore d'évaluation
QCM R
4 pages
Analyse des Statistiques R² dans R
Pas encore d'évaluation
Analyse des Statistiques R² dans R
25 pages
Cours R Master1 Partie I
Pas encore d'évaluation
Cours R Master1 Partie I
36 pages
Cours Statistique Descriptive 1
Pas encore d'évaluation
Cours Statistique Descriptive 1
42 pages
Statistiques de Gestion Chapitre 1
Pas encore d'évaluation
Statistiques de Gestion Chapitre 1
13 pages
Cours Complet ADD PDF
Pas encore d'évaluation
Cours Complet ADD PDF
55 pages
Chapitre 4
Pas encore d'évaluation
Chapitre 4
18 pages
Exercices Corrigés de Statistiques Descriptives
Pas encore d'évaluation
Exercices Corrigés de Statistiques Descriptives
4 pages
TD 1 - Statistiques Descriptives Univariées Et Bivariées: Démarrage de
Pas encore d'évaluation
TD 1 - Statistiques Descriptives Univariées Et Bivariées: Démarrage de
11 pages
Statistiques descriptives avec R
Pas encore d'évaluation
Statistiques descriptives avec R
8 pages
TDR 602
Pas encore d'évaluation
TDR 602
11 pages
Modélisation et Régression Avancées
Pas encore d'évaluation
Modélisation et Régression Avancées
43 pages
Représentation Graphique des Données
Pas encore d'évaluation
Représentation Graphique des Données
14 pages
Introduction à R pour débutants
Pas encore d'évaluation
Introduction à R pour débutants
19 pages
Introduction à l'analyse de données avec R
Pas encore d'évaluation
Introduction à l'analyse de données avec R
30 pages
Atelier Sur Le Logiciel R
Pas encore d'évaluation
Atelier Sur Le Logiciel R
6 pages
Introduction aux Statistiques Quantitatives
Pas encore d'évaluation
Introduction aux Statistiques Quantitatives
26 pages
Atelier 2
Pas encore d'évaluation
Atelier 2
2 pages
Formules de Statistiques Descriptives
Pas encore d'évaluation
Formules de Statistiques Descriptives
86 pages
Procedures Statistique 1 Variable 1
Pas encore d'évaluation
Procedures Statistique 1 Variable 1
156 pages
TD3 Biostatistique
Pas encore d'évaluation
TD3 Biostatistique
14 pages
Ensemble Des Variables: Table (Gujarati$education) Round (Prop - Table (Table (Gujarati$education) ), 2)
Pas encore d'évaluation
Ensemble Des Variables: Table (Gujarati$education) Round (Prop - Table (Table (Gujarati$education) ), 2)
3 pages
BTS Ida
Pas encore d'évaluation
BTS Ida
139 pages
Problèmes Mathématiques et Statistiques pour Série G2
Pas encore d'évaluation
Problèmes Mathématiques et Statistiques pour Série G2
1 page
3 TP3 El Bouarfaoui Lamrani Radouani
Pas encore d'évaluation
3 TP3 El Bouarfaoui Lamrani Radouani
16 pages
Corrigé Sujet 2 Etude Commerciale Bts 2025
Pas encore d'évaluation
Corrigé Sujet 2 Etude Commerciale Bts 2025
3 pages
Pfe - Moroccan Touch
Pas encore d'évaluation
Pfe - Moroccan Touch
62 pages
Quotidien N°4128
Pas encore d'évaluation
Quotidien N°4128
71 pages
WWW Entrainement Foot FR Blog Tactique Comment Jouer en 3 5 2 Guide Complet
Pas encore d'évaluation
WWW Entrainement Foot FR Blog Tactique Comment Jouer en 3 5 2 Guide Complet
15 pages
Cours Matlab P1
Pas encore d'évaluation
Cours Matlab P1
16 pages
Fiche de Préaccord D'Accueil en Stage: Bac Professionnel
Pas encore d'évaluation
Fiche de Préaccord D'Accueil en Stage: Bac Professionnel
2 pages
Notice Travaux Pratiques Pour Banc Hydraulique BH .TOR
Pas encore d'évaluation
Notice Travaux Pratiques Pour Banc Hydraulique BH .TOR
135 pages
Guidage en Rotation: Exercices Techniques
Pas encore d'évaluation
Guidage en Rotation: Exercices Techniques
3 pages
L'offre Territoriale Des Opportunités D'investissement Et D'accompagnement
Pas encore d'évaluation
L'offre Territoriale Des Opportunités D'investissement Et D'accompagnement
285 pages
Fiche de L'écrit Et Projet 2 AC P 53
Pas encore d'évaluation
Fiche de L'écrit Et Projet 2 AC P 53
1 page
Paie
100% (1)
Paie
43 pages
Ballon Eau-Chaude - Ariston Velis Evo 80
Pas encore d'évaluation
Ballon Eau-Chaude - Ariston Velis Evo 80
21 pages
Choix de solutions radio pour objets connectés
Pas encore d'évaluation
Choix de solutions radio pour objets connectés
11 pages
Solutions TPE pour l'amélioration quotidienne
Pas encore d'évaluation
Solutions TPE pour l'amélioration quotidienne
32 pages
Mesures Hydrologiques Sakia El Hamra 2022
Pas encore d'évaluation
Mesures Hydrologiques Sakia El Hamra 2022
23 pages
Chapitre 4 MB2 2324
Pas encore d'évaluation
Chapitre 4 MB2 2324
8 pages
Agrément Européen Cheville PTB-ETA1-PRO
Pas encore d'évaluation
Agrément Européen Cheville PTB-ETA1-PRO
16 pages
Présentation - La Cybersécurité - V3
Pas encore d'évaluation
Présentation - La Cybersécurité - V3
39 pages
Mémoire Final
Pas encore d'évaluation
Mémoire Final
125 pages
Programme Du Salon
Pas encore d'évaluation
Programme Du Salon
8 pages
Cours Web Fi
Pas encore d'évaluation
Cours Web Fi
98 pages
Macif Mandat Sepa
Pas encore d'évaluation
Macif Mandat Sepa
1 page
Projet D'affaires
Pas encore d'évaluation
Projet D'affaires
8 pages
Plan D Action Integre Des Reformes Des Finances Publiques
Pas encore d'évaluation
Plan D Action Integre Des Reformes Des Finances Publiques
113 pages
Cours de Droit Et Mecanisme de Crédit Corrigé
Pas encore d'évaluation
Cours de Droit Et Mecanisme de Crédit Corrigé
77 pages
Services d'accueil et de placement
Pas encore d'évaluation
Services d'accueil et de placement
3 pages
Dispositifs d'Évacuation de Fumées
Pas encore d'évaluation
Dispositifs d'Évacuation de Fumées
2 pages