#********************************************************************************
***#
#********** * Formation sur R ***********************#
#********************************************************************************
****#
###########*************Fondamentaux sur
R********************##########################################
#################*********************************************###################
#####################
####1 Operations simples
# Soustraction : 2-3
#Addition 1+1
#Division 4/2
# Multicplication 2*3
####2 Création de variables simples
####A Assignation d'un nombre à une variable
variable <- 10 ## A gauche c'est la variable et A droite c'est la valeur
print("variable:")
print(variable) ou # taper variable puis entrer
nombre
variabe <- "test"
variable2= "Test"
####### Affectation avec "<-"
######### C'est la méthode traditionnelle d'affectation en R.
########## Elle est largement utilisée dans la communauté R pour sa lisibilité et
sa tradition.
nombre <- 15
print("Affectation avec '<-':")
print(nombre)
####### Affectation avec "="
##### Elle est plus commune dans d'autres langages de programmation comme Python.
##### En R, "=" est principalement utilisée dans les arguments des fonctions.
nombre = 20
print("Affectation avec '=':")
print(nombre)
nombre
######## Différences entre "<-" et "="
# -----------------------------
## 1. Lisibilité:
## "<-" est souvent considéré comme plus lisible, en particulier dans les scripts
R.
## Cela aide à distinguer l'affectation des paramètres dans les appels de
fonction.
#####B Assignation d'une chaîne de caractères à une variable
texte <- "Bonjour le monde"
print("Texte:")
print(texte) # taper variable puis entrer
###### Affichage direct sans utiliser print()
texte
#####3 Création de vecteurs
## Un vecteur est une collection de valeurs du même type
vecteur_numerique <- c(1, 2, 3, 4, 5,10)
genre <-c ("hommme","femme")
print("Vecteur Numérique:")
print(vecteur_numerique)
dernierevaleur<-vecteur_numerique[3]
### operations (soustraction , addition , multiplication) sur les vecteurs
vecteur_numerique-10
vecteur_numerique+10
vecteur_texte <- c("Alice", "Bob", "Charlie")
print("Vecteur de Texte:")
print(vecteur_texte)
vecteur_texte[3]
## Utilisation de seq() pour créer une séquence
sequence <- seq(1, 100000)
print("Séquence de 1 à 10:")
print(sequence)
seq(from=2,to=7,by=1)
ou # 2:7
seq(from=2,to=10,by=2) ##creer une sequence de 2 A 10 avec un pas=2
## Utilisation de rep() pour répéter des valeurs
repetition <- rep(x = 3, times = 10)
print("Répétition du nombre 3, cinq fois:")
print(repetition)
## Opérations arithmétiques de base
somme <- 5 + 3
somme
difference <- 10 - somme
difference
produit <- 7 * 2
produit
quotient <- produit / somme
quotient
# Affichage des résultats des opérations
print("Somme:")
print(somme)
print("Différence:")
print(difference)
print("Produit:")
print(produit)
print("Quotient:")
print(quotient)
#######4 Définition d'une fonction simple
# La fonction 'addition' prend deux arguments et renvoie leur somme
addition <- function(nombre1, nombre2) {
resultat <- nombre1 + nombre2
return(resultat)
}
# Utilisation de la fonction 'addition'
somme <- addition(5, 3)
resultat<-addition(somme, somme)
resultat
print("Résultat de l'addition de 5 et 3:")
print(somme)
#***************************** TYPES DE DONNÉES EN R **************##
###*****************************************************************
# Nombres entiers et décimaux
entier <- 42 # Exemple d'un nombre entier
decimal <- 3.14 # Exemple d'un nombre décimal
cat("Entier:", entier, "Decimal:", decimal, "\n")
# Utilité en data science : Utilisés pour les calculs numériques, analyses
statistiques et modélisations.
typeof(decimal)
# Chaînes de caractères
chaine_simple <- "Bonjour"
chaine_longue <- "Ceci est une chaîne de caractères plus longue."
typeof(chaine_longue)
cat("Chaîne simple:", chaine_simple, "\n")
cat("Chaîne longue:", chaine_longue, "\n")
# Utilité en data science : Idéales pour gérer les données textuelles,
catégorisation et traitement du langage naturel.
# Valeurs booléennes
verite <- TRUE
faux <- FALSE
cat("Vérité:", verite, "Faux:", faux, "\n")
# Utilité en data science : Essentielles pour les tests logiques, filtrages de
données et décisions algorithmiques.
########******************* STRUCTURES DE DONNÉES EN
R********#######################
##########**************************************************#####################
###
# Vecteurs
vecteur_num <- c(1, 2, 3)
vecteur_char <- c("un", "deux", "trois")
cat("Vecteur numérique:", vecteur_num, "\n")
cat("Vecteur de caractères:", vecteur_char, "\n")
# Utilité en data science : Stockent des séries de données pour des analyses et
manipulations efficaces.
# Accéder à un élément : vecteur_num[1], vecteur_char[2]
# Matrices
matrice_num <- matrix(1:4, nrow = 2)
cat("Matrice numérique:\n")
print(matrice_num)
# Utilité en data science : Utiles pour les calculs matriciels, opérations
linéaires et représentation de données.
# Accéder à un élément : matrice_num[1, 2]
# Listes
liste_mixte[[5]]
liste_mixte <- list(nombre = 42, texte = "R", logique =
TRUE,autre="exemple",matrice=matrice_num)
cat("Liste mixte:\n")
print(liste_mixte)
# Utilité en data science : Permet de stocker une collection hétérogène de
données, utile pour des données complexes.
# Accéder à un élément : liste_mixte$nombre, liste_mixte[[2]]
# Data Frames
df_exemple <- [Link](id = 1:3, nom = c("Alice", "Bob", "Charlie"), age =
c(25, 32, 37), test = c(25, 33, 37))
cat("Data Frame:\n")
View(df_exemple)
typeof(df_exemple)
df_exemple[1,1]
# Utilité en data science : Fondamental pour la manipulation de données
tabulaires, analyses statistiques et modélisations.
# Accéder à un élément : df_exemple$age, df_exemple[["nom"]], df_exemple[1,3]
# COERCITION ET MANIPULATION DE TYPES ######################
# Coercition de type
num_en_char <- [Link](42)
typeof(char_en_num)
char_en_num <- [Link]("12333")
cat("Numérique en caractère:", num_en_char, "\n")
cat("Caractère en numérique:", char_en_num, "\n")
# Manipulation de vecteur
vecteur_num[3] <- 45 # Modification du deuxième élément
cat("Vecteur numérique modifié:", vecteur_num, "\n")
# Manipulation de data frame
df_exemple$age <- df_exemple$age + 1 # Augmenter l'âge de tous les individus de
1
cat("Data Frame avec âge modifié:\n")
print(df_exemple)
# NETTOYAGE ET ORGANISATION #################################
# Nettoyage de l'environnement de travail
rm(list = ls()) # Supprime toutes les variables
#************************##NETTOYAGE ***********************************
#***********************#### #####***********************************
# Nettoyer l'environnement de travail
rm(list = ls())
#*************** Install des packages******************************************
#****************** **********************************************
# R est un langage et un environnement pour l'analyse statistique
# et la création de graphiques. RStudio est une interface de
# développement intégrée (IDE) qui facilite l'utilisation de R.
# Pour utiliser certaines fonctionnalités dans R,
# il est souvent nécessaire d'installer des packages supplémentaires.
# Les packages sont des ensembles de fonctions R, de données et
# de code compilé développés par la communauté.
# Pour installer un package, utilisez la fonction [Link]().
# Par exemple, pour installer 'ggplot2' :
[Link]("ggplot2")
# Installer plusieurs package à la fois [Link](c("package1",
"package2", "package3"))
[Link](c("ggplot2", "shiny", "rmarkdown"))
# Une fois le package installé, vous pouvez le charger dans votre session R
# avec library() ou require(). La différence principale est que library()
# génère une erreur si le package n'est pas trouvé, tandis que require()
# Comment mettre à jour et désinstaller un package ------------------------------
-----------
# Mettre à jour un package en R
# ------------------------------
# Pour vous assurer que vous utilisez la version la plus récente d'un package,
# vous pouvez le mettre à jour. La fonction `[Link]()` est utilisée pour
cela.
# Par exemple, pour mettre à jour le package 'ggplot2', utilisez :
[Link]("ggplot2")
# Si vous souhaitez mettre à jour tous les packages installés, vous pouvez
utiliser
# la fonction sans spécifier un nom de package :
[Link]()
# Notez que la mise à jour des packages peut parfois nécessiter de redémarrer R
# pour que les changements prennent effet.
# Désinstaller un package en R
# ----------------------------
# Pour supprimer un package que vous n'utilisez plus, utilisez la fonction
`[Link]()`.
# Par exemple, pour désinstaller 'caret', vous feriez :
[Link]("caret")
# Après avoir exécuté cette commande, le package 'ggplot2' ne sera plus
disponible
# dans votre bibliothèque de packages R et devra être réinstallé pour être
utilisé à nouveau.
# Il est important de ne supprimer que les packages dont vous êtes sûr de ne plus
avoir besoin,
# car certains packages peuvent être des dépendances pour d'autres packages.
# Voilà! Nous avons installé et chargé une série de packages essentiels pour le
travail de data science.
# Avec 'pacman', la gestion des packages est simplifiée et le workflow est plus
propre.
# NETTOYAGE ################################################
# Nettoyer l'environnement de travail
rm(list = ls())
#*****************************************Importation de la base de
donnees***********----
##*******************************************************************************
***********
setwd()
#Type CSV ";"
###Qu’est-ce qu’un fichier CSV?
#Un fichier CSV (en anglais, comma separated values) est le fichier de base des
données recueillies - sans formatage particulier. Chaque champ est séparé par une
virgule.
#Puisque plusieurs applications utilisent des formats de fichier différents
(comme parlerdes langues différentes), les fichiers CSV servent de format
universel permettant de voir vos données dans une variété d'applications, comme
Microsoft Excel, Numbers, le tableur Google ou autres.
base <- read.csv2("C:/Users/FTAB TECH/Downloads/Memoire_Stephy/Nouveau
dossier/NewBaseResistance_conso_ProdAgri.csv")
#Type CSV ","
baseConfiture<-[Link]("C:/Users/FTAB
TECH/Downloads/Memoire_Stephy/BaseRegr_Resistance_conso_prod8AgroAli_Confiture.cs
v")
#Type tab ".text"
#Un fichier TXT est un fichier texte non formaté qui ne nécessite aucun programme
spécial pour être créé et ouvert. Pour ouvrir un fichier TXT, la plupart des
systèmes d’exploitation proposent des programmes de traitement de texte comme «
Bloc-Notes » sous Windows ou « TextEdit » sous macOS. Quant aux smartphones, ils
disposent d’applications gratuites ou préinstallées comme « Google Docs » ou «
File Aid ».
base<-[Link]("C:/Users/FTAB TECH/Downloads/Memoire_Stephy/Nouveau
dossier/NewBaseResistance_conso_ProdAgri.txt", fill = TRUE, header = TRUE)
#Type ".Sav" (#Spss)
#Les fichiers SAV appartiennent principalement à SPSS de IBM. SAV est un fichier
de données utilisé par SPSS. Créé par IBM, SPSS est une solution logicielle
d'analyse statistique utilisée dans de nombreux domaines scientifiques pour
faciliter la compréhension et la visualisation des données de masse.
#Structure: SAV est un fichier texte prenant en charge plusieurs normes
d'encodage, telles que ASCII, EBCDIC et Unicode, indiquées par les trois premiers
octets du fichier. Son contenu peut être divisé en plusieurs parties
identifiables.
library(haven)
base1<-read_sav("C:/Users/FTAB TECH/Downloads/Memoire_Stephy/Nouveau
dossier/Modelisation/Base_Resistanceconfiture.sav")
##*Chargement des Packages----
library(tidyverse)
library(labelled)
library(questionr)
library(gtsummary)
library(GGally)
library(effects)
library(readxl)
# Package readxl
library(readxl)
#base <- read_excel("C:/Users/FTAB TECH/Downloads/Memoire_Stephy/Nouveau
dossier/NewBaseResistance_conso_ProdAgri.xlsx")
base <- read_excel("C:/Users/FTAB TECH/Downloads/Memoire_Stephy/Nouveau
dossier/Modelisation/NewBaseResistance_Regression.xlsx")
base <- read_excel("C:/Users/FTAB TECH/Downloads/Memoire_Stephy/Nouveau
dossier/NewBaseResistance_Confiture_essai.xlsx")
head(base) # premieres lignes et colonnes de la base de donnees
str(base) # Strucutre de la base de donnees
view(base) # voir toute la base
glimpse(base) # donne les details sur les variables de la base
describe(base) # decrit toute la base
#base <- read_excel("data/[Link]")