Biostatistique
Pr. AINANE Tarik
Pr. OUSSAID Karim
Année universitaire 2024/2025
Chapitre 1 : introduction à la biosatistique
C’est quoi la Biostatistique?
La biostatistique est une discipline qui applique des
méthodes statistiques à des problèmes biologiques,
médicaux et de santé publique. Elle vise à concevoir
des études, collecter et analyser des données, et
interpréter les résultats afin de comprendre les
phénomènes biologiques et d'évaluer l'efficacité des
interventions sanitaires.
Exemples d’application du
biostatistique
Croissance des Étude de la
plantes sous population de
différentes conditions bactéries en fonction
de lumière Analyse de la diversité de la température
génétique dans une
population animale
Chapitre 2 : Statistique descriptive
Statistique descriptive univariée (à une variable)
1)- Définitions:
La statistique englobe les méthodes permettant de
collecter, organiser, traiter, analyser les données, et de
les représenter visuellement
L’analyse statistique se subdivise en deux parties
Statistique descriptive :
La statistique descriptive est une branche des statistiques
qui se concentre sur la collecte, l'organisation, le résumé et
la présentation des données sous une forme
compréhensible. Elle utilise des mesures comme les
moyennes, les médianes, les écarts-types, ainsi que des
représentations graphiques (tableaux, histogrammes,
diagrammes) pour décrire les caractéristiques principales
d'un ensemble de données.
Statistique inférentielle :
La statistique inférentielle est une branche de la statistique
qui permet de tirer des conclusions ou des généralisations
sur une population à partir d'un échantillon de données. Elle
utilise des techniques telles que les tests d'hypothèses, les
intervalles de confiance et l'estimation pour faire des
inférences sur des paramètres inconnus de la population.
2)- Notions de bases :
POPULATION: l'ensemble des individus ou objets sur
lesquels porte l'étude (élèves, habitants, voitures…).
INDIVIDU : éléments qui composent la population.
Ex : une auto, une ville, un client.
ECHANTILLON: partie de la population étudiée. Nombre
d’individus dans un échantillon noté n est appelé taille de
l’échantillon.
2)- Notions de bases :
Un caractère-une variable : propriété commune aux individus
de la population, que l’on veut étudier.
Exemple : état civil; âge ; années d’études; composition familiale
Nominale
Qualitative
Exp: couleur des cheveux Ordinale
Une variable
Discrète
Quantitative
Exp: âge
Continue
Application 1
Il s’agit de quel type de variable dans les cas suivants ?
Variable Type de variable Nature de variable
Salaire mensuel Quantitative Continue
Citoyenneté Qualitative Nominale
Mention du baccalauréat Qualitative Ordinale
Couleur de cheveux
Qualitative Nominale
Année de naissance
Quantitative Discrète
Mois de naissance
Qualitative Ordinale
Nombre des sports pratiqués
Quantitative Discrète
2)- Notions de bases :
MODALITE l’une des formes particulières d’un caractère. La
couleur des yeux est un caractère, ses modalités sont : bleu,
vert, marron,…
EFFECTIF OU FREQUENCE ABSOLUE (noté ni) nombre
d’apparitions de la valeur associé à un caractère dans un
échantillon.
2)- Notions de bases :
𝑛𝑖
FREQUENCE RELATIVE (noté fi) fi = .
𝑛
Série statistique : une liste de valeurs d'une caractéristique,
accompagnée de leurs fréquences absolues ou relatives.
Les statistiques : des ensembles de nombres présentés sous
forme de tableaux ou de graphiques regroupant des
observations liées à un phénomène donné.
Application 2
On veux étudier le nombre des enfants chez les familles dans
la ville de KHENIFRA.
Population étudié : les familles du KHENIFRA
L’échantillon sur lequel porte l’étude : familles d’un quartier ; n=64.
Le caractère étudié : nombre d’enfants par famille. C’est un caractère
quantitatif discret.
Application 2
Nombre
Nombre
des 0 1 2 3 4 5 6
total
enfants
Nombre
des
3 10 12 18 13 6 2 64
familles ou
effectif ni
Fréquence 3/64 = 10/64 = 12/64 = 18/64 = 13/64 = 6/64 = 2/64 =
64/64 = 1
relative 0.0476875 0.15625 0.1875 0.28125 0.203125 0.09375 0.03125
3)Traitement d’une série statistique :
Série ordonnée :
les valeurs obtenues peuvent être rangées par ordre de grandeur
par exemple croissante. On obtient une série statistique ordonnée.
Etendue de la série :
la différence entre les deux valeurs extrêmes est appelée étendue
de la série.
Etendue=𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛
3)Traitement d’une série statistique :
Classe : quand le caractère étudié est quantitatif
continu, la série statistique est répartie en classes ou
intervalles semi ouverts de la forme [a;b[.
Le nombre de classes, k , est calculé dans certains cas
par l’une des deux formules :
La règle de Sturge k=1+3.3 log(n)
La règle de Yule k=2.5 (n)1/4
3)Traitement d’une série statistique :
Centre de classe :
On appelle centre de classe, la demi-somme des valeurs extrêmes
de la classe.
On note 𝑐𝑖 le centre de la classe numéro 𝑖.
Si [𝑎𝑖 ; 𝑏𝑖 [ est la classe numéro 𝑖. Alors
𝑎𝑖 + 𝑏𝑖
𝑐𝑖 =
2
L’effectif 𝑛𝑖 : c’est le nombre de valeurs dans la classe [𝑎𝑖 ; 𝑏𝑖 [.
3)Traitement d’une série statistique :
Effectif cumulé : la somme des effectifs des i première classe est
appelé effectif cumulé de la 𝑖 è𝑚𝑒 classe on le note 𝑛𝑖𝑐𝑢𝑚 on 𝑛𝑖𝑐 .
𝑛𝑖𝑐
Fréquence cumulée : le rapport 𝑛
est appelé fréquence cumulé
de la 𝑖 è𝑚𝑒 classe (𝑛 est la taille de l’échantillon).
3)Traitement d’une série statistique :
Application 3
1. Déterminer l’effectif totale de l’échantillon .
2. Calculer l’étendue de la série statistique.
3. Calculer le nombre des classes en utilisant La règle de Sturge k=1+3.3 log(n)
4. Calculer le centre de chaque classe.
3)Traitement d’une série statistique :
Application 3
Le taux de glucose sanguin (glycémie) déterminé chez 32 sujets est donné ci-dessous en g/l
Série ordonnée :
1,19
0,85 0,95 1,00 1,06 1,11
1,20
0,87 0,97 1,01 1,07 1,13
0,97
0,90 1,03 1,08 1,14
0,98
0,93 1,03 1,08 1,14
0,94 0,98
1,03 1,10 1,15
0,94 1,17
0,99 1,04 1,10
Classe en g/l 𝑐𝑖 𝑔/𝑙 𝑛𝑖 𝑓𝑖 𝑛𝑖
3)Traitement d’une série statistique : cumulés
[0,85Application
; 0,91[ 30,88 3 3Τ32 3
[0,91 ; 0,97[ 0,94 4 4Τ32 7
[0,97 ; 1,03[ 1,00 7 7Τ32 14
[1,03 ; 1,09[ 1,06 8 8Τ32 22
[1,09 ; 1,15[ 1,12 6 6Τ32 28
[1,15 ; 1,21] 1,18 4 4Τ32 32
𝑛 = 𝑛𝑖 = 32 𝑓𝑖 = 1
3)Traitement d’une série statistique :
Application 3
La dernière colonne, dite des effectifs cumulés croissants a la signification
suivante :
Pour la classe [0,85 ; 0,91[ : 𝑛𝑖𝑐 = 3 , on dit qu’il y a 3 valeurs inferieur à
0,91 g/l.
Pour la classe [0,91 ; 0,97[ : 𝑛𝑖𝑐 = 3 + 4 = 7
il y a 7 valeurs inferieures à 0,97 ( 3 inferieures à 0,91 et 4 comprises entre
0,91 et 0,97).
Pour la dernière classe on a donc 𝑛𝑖𝑐 = 𝑛.
3)Traitement d’une série statistique :
Application 3
On appelle fréquence cumulée croissante pour la 𝑖 è𝑚𝑒 classe
𝑛𝑖𝑐
le rapport = 𝑓𝑖𝑐
𝑛
On a donc :
3
Pour la 1è𝑟𝑒 classe 𝑓1𝑐 =
32
7
Pour la 2 è𝑚𝑒
classe 𝑓2𝑐 =
32
32
Pour la dernière 𝑓6𝑐 = =1
32