Commandes du logiciel R
Exemple Explication
pour affecté a la variable x une valeur (numérique
x=3 ou x<- 3 ou 3 ->x
ou texte)
+-*/>< les opérations
x != 5 different de 5
10%%3 le reste de la division (resultat = 1)
11%/%3 la partie entiere de la division (resultat = 3)
log(x) logarithmes népériens (Ln)
log(x , base=2) ou
pour le log de base quelconque
log2(x)
exp(x) exponentielle
cos(x) sin(x) tan(x) cosinus, sinus, tangente
?log pour avoir de l'aide concernant cette fonction
pour avoir de l'aide concernant tous le logciel R (en
[Link]()
anglais)
[Link](x)
pour tester le type de la variable si c'est vrai ou
[Link](x)
faux
[Link](x) …
[Link](x) pour redefinir le type de la variable (exemple rendre
[Link](x) x=9 de numerique à une chaine de caractères
[Link](x) … x="9")
changer la variable d'un nombre decimal a un
[Link](3.14)
nombre entier (resultat = 3)
floor(15.3) renvoie a l'entier inferieur (resultat = 15)
ceiling(15.3) renvoie a l'entier superieur (resultat = 16)
round(5.654, 2) arrondir la variable à 2ème decimale (ou 3 4 …)
scan() pour demander a l'utilisateur d'enter une donnée
permet de définir combien d'entrées l'utilisateur
scan(nmax=1)
pourra saisir
pour afficher la valeur de la variable x au cours de
print(x)
l'execution du script
x=paste("Bonjour
permet de coller bout à bout différents morceaux de
j'ai", scan(nmax=1), "an
texte pour n'en faire plus qu'un seul
s")
transformer la chaîne de caractères donnée en
toupper("bonjour")
majuscule
transformer la chaîne de caractères donnée en
tolower("LOTFI")
miniscule
ls() permet d'afficher tous les variables que avez utilisé
permet d'afficher tous les variables que avez utilisé
ls(pattern="lotfi")
et qui ont dans une partie de leur nom "lotfi"
rm(x) supprime la variable x
source("D:/Document/Do
pour charger un fichier de l'ordinateur et l'executer
ssier/[Link]")
pour voir l'emplacement ou le logiciel enregistre les
getwd()
données
pour definir l'emplacement ou vous souhaitez
enregistrer les données. Vous n'aurez plus besoin
setwd("/Users/Document/ de préciser l'adresse absolue de votre fichier
Logiciel R") ("C:/Documents/R") mais seulement son adresse
relative au dossier courant (exemple :
source("scripts/test.R"))
sink("C:/Users/Document
pour enregister dans un fichier les resultats des
s/R/essai_sink.txt")
variables et les affichers dans le fichier grace à
print(x) print(y)
print()
……….. sink()
pour enregister dans un fichier les resultats des
sink("C:/Users/Document variables et les affichers dans le fichier grace à
s/R/essai_sink.txt",TRUE) print() avec TRUE qui indique que les données
print(x) print(y) seront ajoutées au fichier, après les données déjà
……….. sink() existantes et FALSE qui indique que le contenu du
fichier existant sera écrasé
permet de sauvgarder les resultats des variables
save(x , qu'on veut dans un ficier (Rdata) que seul le logiciel
file="C:/Users/Document peut le lire. Ca permet d'importer les resultats des
s/R/sav_x.Rdata") variables d'un scripte pour les utilisers dans un
autre scripts
load("C:/Users/Document permet de charger et importer les resultats des
s/R/sav_x.Rdata") variables sauvgardés
créer un vecteur vide de type numerique de 10
numeric(10)
éléments
créer un vecteur vide de type logique de 10
logical(10)
éléments
créer un vecteur vide de type caractère de 10
character(10)
éléments
x=c(1,3,5,….) pour faire un vecteur colone
permet de sourstraire au 1èr élément "1" et au
x=x-c(1,0,…) 2ème élément "2" … et ca se repete sur tous le
vecteur
crée un vecteur avec une suite de valeur
1:10 ou aussi 20:5 (croissante ou decroissante) allant de 1 à 10 ou de
20 à 5
créer un vecteur avec une suite de valeur allant de
seq(1,10)
1 à 10
créer un vecteur avec une suite de valeur allant de
seq(1,10,3)
1 à 10 et avec un pas de 3 (exemple : 1-4-7-10)
créer un vecteur avec la valeur 2 trois fois (exemple
rep(2,3)
: 2 2 2)
on associe un nom à chacun de ces éléments (pour
names(x)=c("a","b","k")
pouvoir lire plus facilement ce vecteur)
pour d'extraire du vecteur x juste les valeurs du
x[c(1,3,5)]
1,3,5 éléments
pour d'extraire du vecteur x juste les valeurs des
x[c("a","b","k")]
éléments qui ont pour nom a,b,k
permet de sélectionner tous les éléments sauf les 3
x[-(1:3)]
premiers
x[x>7] pour avoir que les éléments qui sont superieur à 7
pour avoir la longueur du vecteur (le nombre
length(x)
d'élément du vecteur)
pour mettre à jour la variable en y assignant un vect
x = x[4:length(x)] eur contenant seulement les éléments allant de 4 à
la fin du vecteur
pour changer la valeur de x et l'enregister a
x=edit(x)
nouveau dans la variable x
renvoie un nouveau vecteur contenant les mêmes
sort(x)
éléments mais triés dans l'ordre croissant
sort(x, renvoie un nouveau vecteur contenant les mêmes
decreasing=TRUE) éléments mais triés dans l'ordre décroissant
au lieu de renvoyer les valeurs du vecteur, elle va
order(x) en renvoyer les index (l'élément 2 est plus petit que
l'élément 17 …)
pour créer un facteur (ressemble a un vecteur mais
factor(c(1,2,3)) qui a une proprièté "levels" qui nous indique les
éléments qui existe dans le facteurs (dans l'ordre)
pour créer un facteur (ressemble a un vecteur mais
qui a une proprièté "levels" qui nous indique les
factor(c(1,2,3),levels=c(1
éléments que peut prendre ce facteurs (et si on
,2,3,4))
trouve avec un éléments qui n'existe pas dans
"levels" c'est qu'on s'est trompé quelque part)
levels(x) pour avoir les levels d'un facteur
[Link](x) pour transformer un vecteur en un facteur
[Link](y) pour transformer un facteur en un vecteur
[Link]([Link]( pour transformer un facteur en un vecteur (methode
y)) 2)
pour créer une matrice vide de 2 lignes et 2
matrix(nrow=2,ncol=2)
colonnes
créer une matrice de 3 lignes et 3 colonnes et la
matrix(ncol=3,nrow=3,x,
remplir avec les 3 vecteurs x,y,z par lignes (sinon si
y,z,byrow=TRUE)
c'est FALSE ca sera par colonnes)
rownames(matrice)=c("x
pour le nom des lignes
")
colnames(matrice)=c("x"
pour le nom des colonnes
)
matrice[ligne,colonne] Pour accéder à un élément particulier d'une matrice
ou matrice["nomLin", grace à son numero de ligne et colonne ou grace à
"nomCol"] son nom de ligne et colonne
Pour accéder à des éléments d'une matrice (dans
matrice[2:4, c(1,3)] cette exemple on a la 2,3 et 4 ligne avec 1 et 3
colonnes
matrice[,y] pour sélectionner toutes les lignes de la colonne y
matrice[x,] pour sélectionner toutes les colonnes de la ligne x
[Link](x,y,z) pour affichier un tableau des données des variables
[Link](x=c(1,2), b=c(
3,4), k=c(5,4), [Link] pour créer un tableau avec 2 lignes et 3 colonnes
s=c("nom1","nom2"))
x : est la variable qui enregistre le tableau
x$y y : nom de la colonne
afin d'avoir le contenu de toute une colonne
x : est la variable qui enregistre le tableau
cette fonction crééra pour chaque colonne du
attach(x) tableau une variable dont le nom sera le nom de la
dite colonne et le contenu les éléments de la
colonne
sum(x) la somme des valeurs
prod(x) le produit des valeurs
mean(x) la moyenne des valeurs
var(x) la variance
sd(x) l'ecart-type
cov(x,y) la covariance
cor(x,y) la correlation
x^2 pour la puissance
sqrt(9) la racine
median(x) la médiane
la médiane sans prendre en compte les valeurs
median(x, [Link]=TRUE) inexistant (NA) qui parasitent généralement les
calculs
quantile(x) pour avoir le quartile par defaut (4-quantiles)
quantile(x, pour avoir un q-quantile allant de 0% à 100% et de
probs=seq(0,1,0.2)) pas de 20%
max(x, [Link]=TRUE) permet d'avoir le maximum des valeurs
min(x, [Link]=TRUE) permet d'avoir le minimum des valeurs
Elle prend comme arguments deux vecteurs et
union(names(x),names(y)
retourne l'ensemble des éléments se trouvant dans
)
au moins un de ces vecteurs
Cette fonction prend deux vecteurs en entrée et
intersect(names(x),name renvoie un nouveau vecteur contenant, de manière
s(y)) unique, les éléments présents dans chacun des
deux vecteurs
Cette fonction prend deux vecteurs x et y en
setdiff(names(x),names( argument et renvoie les éléments de x qui ne sont
y)) pas dans y (remarque : x et y ne renverra pas le
même résultat que comparer y et x)
x [names(x) %in%
renvoie tous les valeurs de x qui se trouve dans y
names(y)]
modele linèare (y=ax+b) pour avoir les valeurs de
lm(y~x)
"a" et "b"
plot(x,y,ylab="...",xlab=". pour avoir les nuages de point, en nomant l'axe x et
..") l'axe y
pour tracer la droite y=ax+b dans le graphe des
abline(lm(y~x))
nuages de point (plot)
[Link](x,y,[Link]=0.
Test de corrélation bilateral au risque de 5%
95)
[Link](x,y,
Test de corrélation unilaterale à gauche au risque
alternative="less",conf.l
de 5%
evel=0.95)
[Link](x,y,
Test de corrélation unilaterale à droite au risque de
alternative="greater",co
5%
[Link]=0.95)
[Link](x, y,
Test de médiane au risque de 5%
[Link]=0.95)
[Link](x,mu=n,[Link]= test de student bilateral avec l'hypothese nul = n au
0.95) risque de 5%
summary(lm(y~x)) pour avoir un resumer statistique
une liste c'est comme un tableau en quelque sorte
list(a=c(…),b=(…),...) mais qui donne la possibilité d'avoir des differents
vecteur qui n'ont pas la meme longueur
avec x : variable de type liste
pour avoir l'élément "a" de la liste (remarque : si on
x[[a]] ou x[1:3] ou x$a
utilise la symbole "$" il faut spécifier le nom de
l'élément et non son identifiant numérique)
avec x : variable de type liste
x[["a"]][1:3] on aura sélectionné les 3 premiers éléments du vec
teur contenu dans l'élément de la liste "a"
x : la variable de type liste
fun : la fonction que l'on souhait appliquer sans les
parenthèses (max() ==> max)
lapply(x, fun , ...) ... : les arguments (Si l'on souhaite par exemple
spécifier l'argument [Link] de la fonction max(), il
faudra le préciser comme argument optionnel à la
fonction lapply())
c'est une fonction permettant d'appliquer
automatiquement et indépendamment une même
lapply(x, max
fonction aux différents éléments d'une liste (ici
, [Link]=TRUE)
c'est le maximum de chaque élément de la liste
sans prendre en compte les valeur inexistant (NA)
L'unique différence avec lapply() est que sapply()
essaiera, dans la mesure du possible, de retourner
les résultats sous la forme d'un objet plus
sapply(x, fun , ...) facilement réutilisables tels que des vecteurs,
matrices ou tableaux de données contrairement à la
fonction lapply() qui retourne des resultats sous
forme de liste
x : la variable de type teste (teste de correlation ou
autre)
vous retournera donc les noms des différents
str(x) éléments de la liste mais elle donne aussi un
aperçu rapide de ce qui y est contenu ce qui nous
aide à extraire une information particulière de cette
liste (test)
random deviates normal centrée et reduit du
rnorm(n)
nombre d'observation
random deviates normal (P(X<x) si [Link]=TRUE)
rnorm(n,mean=5,sd=10,l
de moyenne 5 et ecart-type 10 du nombre
[Link] = TRUE)
d'observation
donne la probabilité du vecteur x d'apres le tableau
pnorm(x)
de la loi normal (centrée et reduit)
donne la densité du vecteur x (loi normal centrée et
dnorm(n)
reduit)
l'inverse de pnorm(x) dans la mesure qu'il renvoit un
qnorm(p)
quantile d'apres la probabilité "p"
diagramme quantile-quantile pour verifiée la
qqnorm(x)
normalité du vecteur x
pour dessiner la droite d'origine mean(x) et de
abline(mean(x),sd(x))
pente sd(x)
choose(n,p) pour la combinaison mathematique nCp
pour lire un tabeau des données à partir d'un fichier
[Link]([Link](),h
sur l'ordinateur (header c'est pour prendre les noms
eader=TRUE)
des colonnes)
la p-value est la probabilité (donc un nombre compris entre 0 et 1) que la
différence observée entre nos deux observations soit due au hasard