0% ont trouvé ce document utile (0 vote)
130 vues23 pages

Langage R

Le langage R est un environnement open source dédié à la statistique et à la visualisation des données, développé en 1993. Il est largement utilisé dans divers domaines tels que la science des données, la biostatistique et l'enseignement, grâce à ses nombreuses fonctionnalités et une communauté active. R offre des outils puissants pour l'analyse statistique et la création de graphiques, facilitant ainsi la transformation des données en insights significatifs.

Transféré par

imane elbiyaz
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
130 vues23 pages

Langage R

Le langage R est un environnement open source dédié à la statistique et à la visualisation des données, développé en 1993. Il est largement utilisé dans divers domaines tels que la science des données, la biostatistique et l'enseignement, grâce à ses nombreuses fonctionnalités et une communauté active. R offre des outils puissants pour l'analyse statistique et la création de graphiques, facilitant ainsi la transformation des données en insights significatifs.

Transféré par

imane elbiyaz
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

LANGAGE R

R É A L I S É P A R :
I D O U R I M A N E
G U E R S S Y O U S R A
E L F A L L O U S I L H A M
PLAN
L A N G A G E R

01 05
DEFINITON AVANTAGES DU LANGAGE R

02 06
HISTORIQUE RELATION AVEC LA
STATISTIQUE

03 07
VERSIONS ET GRAPHES
INSTALLATION

04 08
DOMAINES CONCLUSION
D’UTILISATION
DEFINITION
Le langage R est un environnement et langage de
programmation OPEN SOURCE , conçu pour la statistique
et la visualisation des données en effectuant des calculs
complexes et produire des représentations graphiques.
L A N G A G E R

HISTORIQUE
Développé en 1993 par Ross Ihaka et Robert Gentleman à
l’ université d ‘Auckland en New Zealand , ce langage est
dérivé du langage S et sa création était une réponse aux
besoins d’un logiciel plus adapté pour l’ analyse statistique
et la recherche en général .

02
VERSIONS ET L A N G A G E R

INSTALLATION
Le langage R a connu plusieurs versions depuis sa
création , chacune avec des amélirations nouvelles,
parmi elles : L’installation du langage R est devenu facile grâce à
R 1.0.0 (2000) : Première version officielle . la disponnibilité des ressources comme :
R 2.0.0 (2004) et R 3.0.0 (2013) : Introduction des L’accés à CRAN (Comprehensive R archive
améliorations en performance et efficacité. network).
R 4.0.0 (2020) et R 4.4.1 (2023) : Qui ont Utilisation de RSTUDIO pour écrire et éxecuter le
respectivement apporté des améliorations majeurs code R.
en gestion des erreurs et correction des bugs. Communauté active et ressources en ligne.

03
DOMAINES
L A N G A G E R

D’UTILISATION
Statistiques et analyse Science des données Biostatistiques
de données

- Nettoyage et préparation - Analyse de données


- Analyse descriptive
des données biomédicales
- Tests statistiques
- Visualisation des données - Essais cliniques et études
- Modélisation - Machine Learning et
épidémiologiques
statistique intelligence artificielle

04
DOMAINES L A N G A G E R

D’UTILISATION
Génie et informatique Recherche académique et
enseignement
- Traitement de signal - Analyses statistiques dans

- Analyse d'images et vision diverses disciplines

par ordinateur - Outils pédagogiques pour


l'enseignement

04
AVANTAGES DU
LANGAGE R
Spécialisation en statistiques Large bibliothèque de packages

R est exceptionnel pour les R possède de nombreux


analyses statistiques. packages pour des tâches
analytiques variées.
Communauté active
Une grande communauté Graphiques puissants
d'utilisateurs et de R est connu pour ses capacités
développeurs, idéale pour graphiques impressionnantes avec
l'apprentissage et le des outils comme ggplot2.
dépannage.
QUELQUES FONCTIONS
DU LANGAGE R
Variable quantitative
& Variable qualtitative

Les variables qualitatives expriment des


Se sont des valeurs numériques qui
qualités ou des catégories plutôt que des
mesurent des quantités. Par exemple,
quantités. Par exemple, la couleur des
la taille, le poids ou la température.
yeux, le sexe.
Elles se divisent en deux catégories :
On ne peut pas les exploiter
discrètes (comme le nombre d’enfants
mathématiquement. Il est par exemple
dans une famille) et continues (comme
impossible d'additionner la valeur "marié"
la hauteur d’un individu).
et la valeur "divorcé".
“Visualisation et Analyse
Statistique des Données :
Graphiques et Formules
dans R”
Problématique :
-le nombres des particules
détéctées par le compteur
Geiger-Müller, émises d ‘une
source radiactive.
(Par exemple: (15, 18, 22, 20,
hist() : Cette fonction est utilisée pour tracer un histogramme à

25, 17, 19, 23, 21, 16, 24, 18, partir des données contenues dans nombre_particules.
main : Définit le titre de l’histogramme, affiché en haut du
22, 19, 20).
graphique.
xlab : Définit l’étiquette de l'axe des abscisses (axe horizontal), ici

hist() le nombre de particules détectées.


ylab : Définit l’étiquette de l'axe des ordonnées (axe vertical), ici
la fréquence d’apparition des différentes valeurs.
e
HISTOGRAMME:
L A N G A G E R

HISTOGRAMME:

La couleur

col( )
,hist(...,....,col=”light
blue”)
R possède plus de 650 couleurs
prédéfinies, en indiquant leur nom (ex.

07 "red", "blue", "green", etc.).


L A N G A G E R

Diagramme en
batons multiple

P R O B L É M A T I Q U E :

Effectif des étudiants de première année Diagramme en bâtons : Représente des


de Master (M1) 2024/2025 par spécialité données catégorielles ou discrètes. Les
de la Faculté des Sciences Ain Chock. barres sont séparées par des espaces

07
L A N G A G E R
Diagramme en batons multiples

: ggplot() Data frame()

geom_ bar()
Labs()

library(ggplot2) : Charge le package ggplot2, essentiel pour créer des visualisations avancées en R.
data.frame() : Crée un tableau de données structuré, nécessaire pour organiser les données avant de les
visualiser.
ggplot() : Initialise un graphique en spécifiant les données et les esthétiques de base (axes, couleurs, etc.).
geom_bar() : Ajoute des barres au graphique, utile pour les diagrammes en barres.
labs() : Ajoute des titres et des étiquettes aux axes pour rendre le graphique plus compréhensible.
theme_minimal() : Applique un thème minimaliste au graphique pour une présentation plus propre et
professionnelle
L E N O M B R E D E S
É T U D I A N T S E T
É T U D I A N T E S D U
M A S T E R D A N S L A
F A C U L T É D E S
S C I E N C E S A I N
C H O C K 2 0 2 4 \ 2 0 2 5 .
L A B O I T E
À
M O U S T A C H E
-Boîte à moustache :
Elle représente l'intervalle interquartile (IQR), qui contient 50 % des données. La boîte est délimitée par le
premier quartile (Q1) et le troisième quartile (Q3).
La ligne à l'intérieur de la boîte représente la médiane (Q2), qui divise les données en deux parties égales.
Elle s'étend des bords de la boîte jusqu'aux valeurs minimales et maximales,
CONCLUSION
En résumé, R est un langage incontournable pour l’analyse de données grâce
à sa puissance et sa flexibilité. Il assure des résultats reproductibles et
bénéficie d’une communauté active. Utilisez R pour transformer vos données
en insights précieux !
L A N G A G E R

ME CI
R É A L I S É P A R :
I D O U R I M A N E
G U E R S S Y O U S R A
E L F A L L O U S I L H A M
L A N G A G E R

D I S C U S S I O N S

Vous aimerez peut-être aussi