LANGAGE R
R É A L I S É P A R :
I D O U R I M A N E
G U E R S S Y O U S R A
E L F A L L O U S I L H A M
PLAN
L A N G A G E R
01 05
DEFINITON AVANTAGES DU LANGAGE R
02 06
HISTORIQUE RELATION AVEC LA
STATISTIQUE
03 07
VERSIONS ET GRAPHES
INSTALLATION
04 08
DOMAINES CONCLUSION
D’UTILISATION
DEFINITION
Le langage R est un environnement et langage de
programmation OPEN SOURCE , conçu pour la statistique
et la visualisation des données en effectuant des calculs
complexes et produire des représentations graphiques.
L A N G A G E R
HISTORIQUE
Développé en 1993 par Ross Ihaka et Robert Gentleman à
l’ université d ‘Auckland en New Zealand , ce langage est
dérivé du langage S et sa création était une réponse aux
besoins d’un logiciel plus adapté pour l’ analyse statistique
et la recherche en général .
02
VERSIONS ET L A N G A G E R
INSTALLATION
Le langage R a connu plusieurs versions depuis sa
création , chacune avec des amélirations nouvelles,
parmi elles : L’installation du langage R est devenu facile grâce à
R 1.0.0 (2000) : Première version officielle . la disponnibilité des ressources comme :
R 2.0.0 (2004) et R 3.0.0 (2013) : Introduction des L’accés à CRAN (Comprehensive R archive
améliorations en performance et efficacité. network).
R 4.0.0 (2020) et R 4.4.1 (2023) : Qui ont Utilisation de RSTUDIO pour écrire et éxecuter le
respectivement apporté des améliorations majeurs code R.
en gestion des erreurs et correction des bugs. Communauté active et ressources en ligne.
03
DOMAINES
L A N G A G E R
D’UTILISATION
Statistiques et analyse Science des données Biostatistiques
de données
- Nettoyage et préparation - Analyse de données
- Analyse descriptive
des données biomédicales
- Tests statistiques
- Visualisation des données - Essais cliniques et études
- Modélisation - Machine Learning et
épidémiologiques
statistique intelligence artificielle
04
DOMAINES L A N G A G E R
D’UTILISATION
Génie et informatique Recherche académique et
enseignement
- Traitement de signal - Analyses statistiques dans
- Analyse d'images et vision diverses disciplines
par ordinateur - Outils pédagogiques pour
l'enseignement
04
AVANTAGES DU
LANGAGE R
Spécialisation en statistiques Large bibliothèque de packages
R est exceptionnel pour les R possède de nombreux
analyses statistiques. packages pour des tâches
analytiques variées.
Communauté active
Une grande communauté Graphiques puissants
d'utilisateurs et de R est connu pour ses capacités
développeurs, idéale pour graphiques impressionnantes avec
l'apprentissage et le des outils comme ggplot2.
dépannage.
QUELQUES FONCTIONS
DU LANGAGE R
Variable quantitative
& Variable qualtitative
Les variables qualitatives expriment des
Se sont des valeurs numériques qui
qualités ou des catégories plutôt que des
mesurent des quantités. Par exemple,
quantités. Par exemple, la couleur des
la taille, le poids ou la température.
yeux, le sexe.
Elles se divisent en deux catégories :
On ne peut pas les exploiter
discrètes (comme le nombre d’enfants
mathématiquement. Il est par exemple
dans une famille) et continues (comme
impossible d'additionner la valeur "marié"
la hauteur d’un individu).
et la valeur "divorcé".
“Visualisation et Analyse
Statistique des Données :
Graphiques et Formules
dans R”
Problématique :
-le nombres des particules
détéctées par le compteur
Geiger-Müller, émises d ‘une
source radiactive.
(Par exemple: (15, 18, 22, 20,
hist() : Cette fonction est utilisée pour tracer un histogramme à
25, 17, 19, 23, 21, 16, 24, 18, partir des données contenues dans nombre_particules.
main : Définit le titre de l’histogramme, affiché en haut du
22, 19, 20).
graphique.
xlab : Définit l’étiquette de l'axe des abscisses (axe horizontal), ici
hist() le nombre de particules détectées.
ylab : Définit l’étiquette de l'axe des ordonnées (axe vertical), ici
la fréquence d’apparition des différentes valeurs.
e
HISTOGRAMME:
L A N G A G E R
HISTOGRAMME:
La couleur
col( )
,hist(...,....,col=”light
blue”)
R possède plus de 650 couleurs
prédéfinies, en indiquant leur nom (ex.
07 "red", "blue", "green", etc.).
L A N G A G E R
Diagramme en
batons multiple
P R O B L É M A T I Q U E :
Effectif des étudiants de première année Diagramme en bâtons : Représente des
de Master (M1) 2024/2025 par spécialité données catégorielles ou discrètes. Les
de la Faculté des Sciences Ain Chock. barres sont séparées par des espaces
07
L A N G A G E R
Diagramme en batons multiples
: ggplot() Data frame()
geom_ bar()
Labs()
library(ggplot2) : Charge le package ggplot2, essentiel pour créer des visualisations avancées en R.
data.frame() : Crée un tableau de données structuré, nécessaire pour organiser les données avant de les
visualiser.
ggplot() : Initialise un graphique en spécifiant les données et les esthétiques de base (axes, couleurs, etc.).
geom_bar() : Ajoute des barres au graphique, utile pour les diagrammes en barres.
labs() : Ajoute des titres et des étiquettes aux axes pour rendre le graphique plus compréhensible.
theme_minimal() : Applique un thème minimaliste au graphique pour une présentation plus propre et
professionnelle
L E N O M B R E D E S
É T U D I A N T S E T
É T U D I A N T E S D U
M A S T E R D A N S L A
F A C U L T É D E S
S C I E N C E S A I N
C H O C K 2 0 2 4 \ 2 0 2 5 .
L A B O I T E
À
M O U S T A C H E
-Boîte à moustache :
Elle représente l'intervalle interquartile (IQR), qui contient 50 % des données. La boîte est délimitée par le
premier quartile (Q1) et le troisième quartile (Q3).
La ligne à l'intérieur de la boîte représente la médiane (Q2), qui divise les données en deux parties égales.
Elle s'étend des bords de la boîte jusqu'aux valeurs minimales et maximales,
CONCLUSION
En résumé, R est un langage incontournable pour l’analyse de données grâce
à sa puissance et sa flexibilité. Il assure des résultats reproductibles et
bénéficie d’une communauté active. Utilisez R pour transformer vos données
en insights précieux !
L A N G A G E R
ME CI
R É A L I S É P A R :
I D O U R I M A N E
G U E R S S Y O U S R A
E L F A L L O U S I L H A M
L A N G A G E R
D I S C U S S I O N S