0% ont trouvé ce document utile (0 vote)
136 vues3 pages

TP2: Lecture de Différents Jeux de Données: Table Des Matières

Ce document décrit comment importer différents jeux de données dans R à partir de formats papier, de logiciels externes ou de fichiers plus complexes. Il contient des instructions détaillées pour lire et traiter diverses données.

Transféré par

Cyrine Akacha
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
136 vues3 pages

TP2: Lecture de Différents Jeux de Données: Table Des Matières

Ce document décrit comment importer différents jeux de données dans R à partir de formats papier, de logiciels externes ou de fichiers plus complexes. Il contient des instructions détaillées pour lire et traiter diverses données.

Transféré par

Cyrine Akacha
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

TP2: Lecture de différents jeux de données

Yousri Henchiri

19-11-2021

Table des matières


1 Rentrer des données issues d’un format papier 1

2 Importer depuis un logiciel externe 2

3 Importer des fichiers de données plus compliquées. 3

1 Rentrer des données issues d’un format papier


• Boutons de fièvre :

Cinq traitements contre les boutons de fièvre, dont un placebo, ont été administrés par tirage au sort à trente
patients (six patients par groupe de traitement). Le délai (en jours) entre l’apparition des boutons et la
cicatrisation complète a été recueilli chez chaque patient.

Nous allons voir ici comment entrer ces données dans R uniquement pour calculer la moyenne de l’échantillon
de chaque traitement.

1- Entrez directement les données dans R à l’aide de la fonction de().


2- Utilisez la fonction attach() puis la fonction mean() pour calculer la moyenne de chacun des traitements.
3- Calculez simultanément les moyennes des traitements au moyen de la fonction colMeans().
4- Enregistrez votre [Link] dans un fichier nommé [Link] en utilisant la fonction [Link]().
5- Vérifiez que tout s’est bien passé en ouvrant le fichier au moyen d’un éditeur de texte.

1
6- Utilisez la fonction rm() pour effacer tous les objets R que vous venez de créer dans votre environnement
de travail.
7- Importez le fichier [Link] en utilisant [Link]() et affichez le.

• Facteurs de risque de l’athérosclérose :

Lors d’une étude sur les facteurs de risque de l’athérosclérose, des données ont été recueillies et résumées
dans le tableau de contingence suivant :

Il peut être intéressant de savoir s’il y a une dépendance entre les habitudes tabagiques et alcooliques suivant
le sex. Pour entrer ce type de donnée dans R, il faut suivre plusieurs étapes.

1- Utilisez la fonction scan() afin d’obtenir une matrice X de taille 6 × 3 qui contiendra uniquement les
données.
2- Utilisez l’instruction class(X) <- "ftable" pour spécifier qu’il va s’agir d’une table de contingence.
3- Tapez les deux instructions :

X <- scan()
#X <- matrix(X,ncol=3,nrow=6,byrow=F)
attributes(X)$[Link] <- list(alcool=c("ne boit pas",
"boit occasionnellement","boit régulièrement"))
attributes(X)$[Link] <- list(Sexe=c("H","F"), tabac=c("ne fume pas",
"a arrêté de fumer","fume"))

4- Affichez votre tableau de contingence créé.


5- Enregistrez votre tableau de contingence dans un fichier nommé [Link] en utilisant la fonction
[Link]().
6- Vérifiez que tout s’est bien passé en ouvrant le fichier au moyen d’un éditeur de texte.
7- Utilisez la fonction rm() pour effacer tous les objets R que vous venez de créer dans votre environnement
de travail.
8- Importez le fichier [Link] en utilisant [Link]() et affichez le.

2 Importer depuis un logiciel externe


Lors de l’étude de l’IMC chez des enfants, un fichier de données a été recueilli sous plusieurs formats
différents. Nous allons nous entraîner à lire ces différents formats. Il existe plusieurs fichiers portant le nom

2
de base imcenfant, mais avec des extensions différentes.

1- Importez le fichier [Link] dans un [Link] nommé [Link].


2- Importez le fichier [Link] dans un [Link] nommé [Link].
3- Importez le fichier [Link] dans un [Link] nommé [Link].
4- Importez le fichier [Link] dans un [Link] nommé [Link].
Pour ce fichier, la procédure étant plus complexe que pour les autres
#library([Link])
x <- readMat("[Link]")
#class(x) # x est une liste
#x # on voit que les données sont dans $imc[,,1]
x <- x$imc[,,1]
# Notez que les éléements de SEXE et zep sont enregistrés dans #une liste
#x$SEXE
#class(x$SEXE) <- "character"
#x$zep
#class(x$zep) <- "character"
[Link] <- [Link](x)

5- Afin de vérifier que l’importation s’est bien déroulée, utilisez la fonction summary() sur tous ces [Link].
Celle-ci va afficher quelques résumés numériques.
6- Sauvez l’un de ces [Link], qui sont tous identiques, dans un fichier nommé [Link].

3 Importer des fichiers de données plus compliquées.


Il arrive régulièrement que l’on rencontre des fichiers de données ayant un format d’enregistrement non
standard. Nous allons donc nous entraîner à lire plusieurs fichiers de ce type sur lesquels nous serons amenées
à réaliser des analyses statistiques.
1- Importez le fichier [Link] dans un [Link] en vous assurant de bien traiter les valeurs manquantes.
2- Importez le fichier [Link] contenant treize variables mesurées sur 226 individus, dans un [Link]
(indice : utilisez entre autres les fonctions [Link]() et t()).
3- Importez le fichier Poids_naissance.txt contenant dix variables mesurées sur 189 individus dans un
[Link]. Celui-ci devra contenir le nom des variables et le nom des individus (correspondant à la colonne
Id). Pensez à utiliser l’aide en ligne.

Vous aimerez peut-être aussi