Support Stat
Support Stat
UTILISER LES OUTILS STATISTIQUES POUR ANALYSER ET METTRE EN FORME DES INFORMATIONS
PROMOTION DE 2012-2014
« L’UNIVERS EST ECRIT EN LANGAGE MATHEMATIQUE : IL VAUT MIEUX ETRE LE PREMIER A SE TROMPER
QUE LE DERNIER A COMPRENDRE CAR UN PROBLEME SANS SOLUTION EST UN PROBLEME MAL POSE. »
COURS DE STATISTIQUE POUR L’ENTREPRENEUR AGROPASTORAL
Pour les objectifs à atteindre dans notre exposé, nous définirons la statistique comme étant une science
mathématique ayant pour objet l’étude de la collecte, l’analyse et l’interprétation des ensembles
d’observations nombreux classifiables relatives à un même phénomène et susceptible d’être caractérisé
par un même nombre. Nous en agronomie, ce sont le poids, le rendement d’une variété de plantes, la
prolificité d’une race d’animaux, les étudiants EAP du niveau 1 de l’ETA de Bafang. La statistique est
également une méthode scientifique qui consiste à réunir des données chiffrées sur des ensembles
nombreux, puis à analyser, à commenter et à critiquer ces données.
Il ne faut pas confondre la statistique qui est la science qui vient d’être définie et une statistique qui est un
ensemble de données chiffrées sur un sujet précis.
Cette étude s’effectue au moyen de techniques appropriées de collecte et d’analyse de données d’une part
et des méthodes d’interprétation d’autres parts.
Les premières statistiques correctement élaborées ont été celles des recensements démographiques. Ainsi
le vocabulaire statistique est essentiellement celui de la démographie. Bien que le nom de statistique soit
relativement récent – l'origine du nom date du XVIII e siècle et vient de l'allemand STAATSKUNDE – cette
activité semble exister dès la naissance des premières structures sociales. Les premiers textes écrits
retrouvés étaient des recensements du bétail, des informations sur son cours et des contrats divers.
Les ensembles étudiés sont appelés population. Les éléments de la population sont appelés individus ou
unités statistiques. La population est étudiée selon un ou plusieurs caractères.
Les statistiques descriptives peuvent se résumer par le schéma suivant :
La statistique a pour but de déduire et non d’expliquer ; c’est donc un moyen d’étude et non une fin. La
statistique est un outil de connaissance, un moyen d’expression qui permet d’appréhender, d’en mesurer
les phénomènes, d’en dessiner les contours, de mettre en lumière certains de leurs aspects. La statistique
facilite l’exercice du jugement lui-même.
Nombre, langage numérique (méthode quantitative) :
Le langage chiffré permet de séparer l’observation de l’appréciation. Le statisticien élabore des résultats
qu’il communique à l’utilisateur et cet utilisateur peut les confronter avec sa propre échelle de valeur qui
est très souvent subjective et variable d’un utilisateur à l’autre. Cependant une appréciation libre et
véritable nécessite au préalable la compréhension des règles et concepts utilisés. La statistique s’applique
sur des ensembles nombreux et importants ; elle s’intéresse donc aux faits collectifs et non aux faits
élémentaires. La statistique cherche à ressortir les permanences et si elle travaille sur les ensembles
nombreux, elle vise à simplifier, à résumer et à synthétiser :
-Classer ;
TYPOLOGIE :
- TYPOLOGIE :
La statistique descriptive a pour but de décrire les caractéristiques d’une population ou de comparer les
caractéristiques de plusieurs populations au moyen des techniques graphiques et numériques.
La probabilité est l’étude basée sur des expériences aléatoires répétés ou non, indépendants ou non.
La statistique inférentielle ou inductive a pour objet d’étudier les rapports qui existent entre les
caractéristiques de la population et celle d’échantillons.
Exemple : Sondage, la plupart des études tels que les sondages politiques sont essentiellement inductives ;
on procède à l’examen d’un échantillon dans le but d’induire les conclusions sur la population entière. Il
s’ensuit que les inductions faites à partir d’un échantillon n’ont de chance de se vérifier que si l’échantillon
est représentatif de la population entière.
- CHAMP D’APPLICATION :
Les domaines d’application de la statistique sont multiples :
En Agronomie, les études comparatives des engrais, de rations alimentaires, les races d’animaux,
les variétés des plantes, les techniques culturales.
En Foresterie, ils auront à faire des inventaires qui permettent d’évaluer l’accroissement des
volumes de bois et d’étudier la dynamique des populations fauniques.
En Biologie, la biostatistique préfère l’application des méthodes statistiques dans l’étude des
mécanismes de l’hérédité et dans l’élaboration des modèles de croissance.
En médecine (Vétérinaire), les études épidémiologiques destinées à déterminer la répartition
géographique, la prévalence des maladies et le taux d’infestation font appel aux méthodes
statistiques.
En géophysique : pour les prévisions météorologiques (la climatologie…), la pollution, les études
des rivières et des océans ;
En démographie : le recensement permet de faire une photographie à un instant donné d'une
population et permettra par la suite des sondages dans des échantillons représentatifs ;
En sciences économiques et sociales et en économétrie : l'étude du comportement d'un groupe de
population ou d'un secteur économique s'appuie sur des statistiques, emploi, conjoncture
économique ;
En marketing : le sondage d'opinion devient un outil pour la décision ou l'investissement ;
En physique : l'étude de la mécanique statistique et de la thermodynamique statistique (cf.
Physique statistique) permet de déduire du comportement de particules individuelles, un
comportement global (passage du microscopique au macroscopique) ;
En métrologie : pour tout ce qui concerne les systèmes de mesure et les mesures elles-mêmes ;
En psychologie et en médecine: tant pour le comportement des maladies que leur fréquence
(épidémiologie) ou la validité d'un traitement ou d'un dépistage ;
En archéologie : appliquée aux vestiges (céramologie...) ;
En écologie : pour l’étude des communautés végétales et des écosystèmes ;
En assurance et en finance : pour le calcul des risques...
- METHODE SCIENTIFIQUE
Quelque soit le champ d’application, la démarche statistique passe par les mêmes étapes :
Tout comme le mathématicien, le statisticien doit d’abord définir avec précision l’ensemble des références
sur lesquelles doit porter les observations, références appelé univers statistique ou population. Autrement
dit la collection d’objets ou d’êtres vivants (animaux, plantes ou hommes) sur lesquels porte l’étude
statistique est la population ou univers.
Exemple 1 : Ensemble des animaux d’un troupeau, d’une race ou d’une localité.
Très souvent le nombre d’élément de la population statistique est très grand, il n’est alors plus possible de
réaliser toutes les mesures souhaitées. On est alors amené à ne considérer qu’un seul ensemble de cette
population. L’ensemble de ces individus de cet sous ensemble est appelé échantillon ou sous population
ou lot et le nombre du sous ensemble est la taille de l’échantillon.
Exemple : Les animaux de sexe mâle ou femelle, les feuilles dentelées, les arbres de taille comprise entre
18 et 25 m.
REMARQUE : L’échantillon est aléatoire lorsque son prélèvement dans la population a été soumis aux lois
du hasard.
Une unité ou membre d’une association est appelé une unité statistique ou encore un individu. C’est
l’élément de l’ensemble que l’on veut étudier. On l’appelle aussi unité expérimentale.
Exemple : L’unité peut être un secteur, une bande, une parcelle de dimensions données.
d) Le caractère et la variable
Le trait déterminé commun à toutes les unités de la population et sur lequel porte l’étude statistique est
appelé caractère. L’expression caractère se rapporte généralement au phénomène qualitatif.
Exemple 1 : La forme ou la constitution d’un organe ; la présence ou l’absence d’une certaine particularité :
les cornes.
Ce sont des grandeurs qui ne peuvent prendre que certaines valeurs déterminées ou entières ou même
des valeurs isolées. Autrement dit un caractère est discret s’il peut prendre seulement certaines valeurs
dans un intervalle donné. En général il résulte d’un comptage ou dénombrement.
Exemple 1 : nombre d’étamines d’une fleur, nombre d’œufs contenu dans une poule.
Exemple 2 : le nombre de petits par portée, le nombre de cellules, de fleurs ou de fruits d’une culture ou
plante, le nombre d’accidents pour une période donnée, etc.
Remarque : Attention, un caractère quantitatif discret peut résulter de la transformation d’un caractère
nominal (ex. comptage des individus porteurs ou non d’un caractère).
Caractères continus
Ce sont des grandeurs qui peuvent avoir des valeurs numériques quelconques dans un certain intervalle.
Autrement dit un caractère est continu s’il peut théoriquement prendre n’importe quelle valeur dans un
intervalle donné. En général il résulte d’une mesure.
Exemple 1 : la longueur, le poids, le salaire.
Exemple 2 : le poids, la taille, le taux de glycémie, le rendement, PNB, PIB, espérance de vie, etc.
Remarque : En réalité le nombre de valeurs possibles pour un caractère donné dépend de la précision de la
mesure. On peut considérer comme continu un caractère discret qui peut prendre un grand nombre de
valeurs.
Exemple : la quantité de sève dans une plante, le nombre de globules blancs ou rouges par ml de sang, le
nombre de nucléotides A dans une très longue séquence d’ADN (plusieurs Mégabases).
e) Modalité
Les différentes situations où les individus peuvent se trouver à l’égard du caractère étudié sont appelé
modalités ; ce sont aussi les différentes variantes que peut présenter un caractère.
On appelle modalité toute valeur :
xi € X (P)
telle que : X (P) = {x1, x2, x3,….., xi,…., xk} avec k nombre de modalités différentes de X.
Exemple : Sexe masculin et féminin chez l’Homme ou mâle et femelle chez l’animal (M, F) ; une pièce ou un
organe défectueux.
f) Valeur observée
C’est celle d’un caractère quantitatif résultant d’une observation ou d’un essai. Dans une série de n
résultats d’observations ou d’essai, les valeurs observées peuvent être distinctes ou non ; si la valeur Xi est
observée ni fois, ni est appelé l’effectif de cette valeur particulière.
Dans le cas d’un caractère quantitatif, on observe souvent un groupement d’observation à priori ou à
postériori en partageant l’intervalle total en un intervalle partiel jointif appelé classe. Toutes les
observations se situant dans une même clase sont ensuite considéré comme ayant la même valeur. Celle-ci
est généralement le centre de la classe ou Ci.
Exemple : [750 - 900 [, [900 - 1 500 [, [1 500 - 2 250 [ , [2 250 - 3 000 [
h) Limites de classe
Ce sont les valeurs qui définissent les bornes inférieures et supérieures d’une classe.
25 – 30
30 – 35
Remarque : Chaque classe contiendra toutes les valeurs égales ou supérieures à la limite mais strictement
inférieures à la limite supérieure.
L’intervalle ne doit être ni trop petit ni trop grand sous peine dans le premier cas de faire apparaître des
variations de fréquences sans signification et dans le second cas d’en faire disparaître des réelles
fréquences.
j) L’écart
k) L’effectif
C’est le nombre d’individus d’un ensemble ou d’un sous ensemble. Autrement dit, c’est la taille de la
population noté N ou de l’échantillon noté n (effectif total).
l) Fréquence
Si ni est l’effectif d’une modalité d’une valeur particulière d’une classe et N ou n est l’effectif observé (total)
alors la fréquence est ni / N = f. C’est le nombre de fois où une modalité apparaît (effectif ou fréquence
absolue).
La fréquence relative (FR) associée à une modalité d’un caractère est le rapport de la fréquence absolue
(FA) de cette modalité à l’effectif total (ET) de la population de cet échantillon.
FR= FA / ET
La proportion ou pourcentage associée à cette modalité d’un caractère est la fréquence relative exprimée
en pourcentage.
Une série relative ou distribution statistique associée à un caractère est l’ensemble des modalités avec en
regard des effectifs correspondants.
Exemple : On fait une observation sur 10 étudiants et le caractère observé est genre.
E1 E2 E3 E4 E5 E6 E7 E8 E9 E10
M F M M F M F M M M
Les observations individuelles d’une variable statistique continue sont généralement regroupées en
intervalles des points successifs et contigus qu’on appelle classes ou intervalles. Les nombres entre
lesquels sont rangés les valeurs d’une classe sont appelés les limites ou extrémités de la classe. Les valeurs
observées des caractères qui appartiennent à une classe donnée sont généralement remplacée par le
milieu ou le centre de la classe. Très souvent on est amené à calculer les limites réelles d’une classe surtout
lorsque les extrémités de ces classes ne sont pas contigus (liés ou semblables).
Exemple :
On a trois échantillons E1, E2, E3, la somme des échantillons a pour erreur la somme des erreurs E 1 + E2 + E3 ou
E1 – E2 – E3.
NOTATION
Les modalités sont désignées avec des lettres minuscules du même type que les caractéristiques mais avec
un indice qui permet de compter le nombre de modalité.
Exemple : x, t, h…etc.
L’effectif total de la population est noté N et la taille d’un échantillon est généralement noté n. L’effectif de
la modalité xi est noté ni.
N=∑ n
i=1
La fréquence relative de la modalité xi est notée fi. La proportion de la modalité xi est notée pi.
Lorsque les données sont regroupées en classe, la i ème classe est noté [ei-1 , ei [ donc l’amplitude de la ième
classe est notée ai = ei – ei-1
METHODE STATISTIQUE
Elle est surtout descriptive et consiste donc à recueillir un certain nombre de données, les empiler, les
dépouiller méthodiquement pour produire des résultats numériques sur lesquels on va faire l’analyse.
Il s’agit dans cette phase de substituer à l’aide des données qui ont été apportées un petit nombre de
résultats. On peut dans cet état comparer les résultats numériques à des résultats théoriques.
C’est le domaine d’application qui justifie le choix de la méthode et l’interprétation des résultats ; c’est
pour dire qu’il peut arriver que les conclusions erronées soient tirées d’une analyse. Il ne faut pas réduire
la statistique à l’application des formules mathématiques car le travail statistique ne se réduit pas au travail
mathématique.
En statistique l’expérimentation n’est pas toujours permise parce qu’ayant fait des observations des
conditions déterminées, il est souvent impossible de reprendre ou de faire varier l’une de ces observations.
-les plans d’expériences : On nomme plan d'expériences la suite ordonnée d'essais d'une
expérimentation, chacune permettant d'acquérir de nouvelles connaissances en contrôlant un ou plusieurs
paramètres d'entrée pour obtenir des résultats validant un modèle avec une bonne économie (nombre
d'essais le plus faible possible, par exemple). On peut le faire dans les stations de recherches, en milieu réel
comme chez le paysan. Un plan d'expériences permet donc de réduire le nombre d'essais à ce qui est
strictement nécessaire pour prendre une décision, ce qui peut sauver du temps, de l'argent et des vies.
En raison d’une logistique limitée (moyens de transport) la collecte de l’information est souvent partielle
au lieu d’être exhaustive. Le relevé exhaustif s’étend à toutes les unités de la population : on l’appelle
recensement ou inspection à 100%.
Le sondage ou échantillonnage est un relevé partiel dans lequel la fraction touchée est relativement faible
mais choisie de telle sorte qu’elle soit représentative et que les informations recueillies puissent être
répandues à l’ensemble de la population.
L'enquête par questionnaire : Pour obtenir des réponses, rien n’est plus naturel que de poser des
questions. L’enquête par questionnaires est, à ce titre, un moyen pratique pour collecter rapidement des
informations et un outil efficace d’aide à la décision. Même s’il n’y a pas de recette miracle pour réaliser
une bonne enquête et obtenir à tous les coups des résultats pertinents, il existe des règles incontournables
à respecter à chaque étape.
L'enquête quantitative
L'enquête qualitative
Pour une enquête qualitative, l’objectif des études est qualitatif et vise à comprendre précisément les
besoins, les usages ou l'opinion d'un groupe restreint de personnes.
A la différence des résultats d'une enquête quantitative, les résultats ne peuvent pas être extrapolés à
l'ensemble de la population car l'échantillon est beaucoup trop faible.
1 6 36
2 7
3 8
4 9
5 12
Béti Yambassa
Maka Bamiléké
Eton Banem
Boulu Bassa
1- Tableaux statistiques
Ils constituent le moyen le plus sûr de pouvoir répondre aux questions posées de par leur
systématisme. Sauf cas exceptionnels, les données statistiques sont présentées sous forme de tableau.
D’une part, cela permet d’appréhender l’information qui est synthétisée et d’autre part facilite ou rend
possible les calculs.
De manière générale, un tableau statistique se présente comme suit :
Modalité du caractère Effectif de chaque Fréquences (fi) Pourcentage
modalité
x1 n1 ni/N fi x 100
x2 n2
… …
xk nk
Total - - 25 1 100
2- Représentation graphique
Les graphiques permettent de donner une synthèse visuelle de la distribution d’une variable et de
percevoir l’éventuelle relation entre les variables, cette section en présente quelques exemples. Les
représentations peuvent être spécifiques à un type de variable ou de caractère. Sauf indication contraire
tous les graphiques sont réalisables en effectifs ou en fréquences, ils sont superposables à l’échelle près.
Les graphiques constituent ; pour les pourcentages, un moyen simple de comparer sur une base
unique des données de valeurs différentes. Les taux permettent de suivre l’évolution de grandeurs. Les
graphiques permettent de mieux percevoir une relation entre des variables, ce chapitre présente quelques
exemples.
NB : Le choix des représentations graphiques dépend pour une large part du type du caractère statistique :
caractère qualitatif, variable statistique discrète, variable statistique continue.
Ai = r2
Avec :
fi = fréquence
r2 = surface du cercle
θi = fi x 360° ou θi = fi x 360°/ f ou N
Avec :
0
ké a u a a ti on
ilé ss ul ak ss Bé Et ne
m
m Ba Bo M ba Ba
Ba m
Ya
4 5
1 Bamiléké
Bassa
Boulu
3 Maka
Yambassa
5 2 Béti
2 Eton
Banem
3
5
4
3
2
1
Nombre de frères et sœurs
1 2 3 4 5 6 7 8 9 12 36
2°- Diagramme en bâtons cumulés de la distribution de la classe de 1 e année 2009 de l’ETA de Bafang
suivant le nombre de frère et sœur des élèves.
Nombre d’élèves
25
20
15
10
5
Nombre de frères et sœurs
1 2 3 4 5 6 7 8 9 12 36
b-) Variables continues
Deux représentations graphiques retiendront plus particulièrement notre attention : l’histogramme
et la courbe cumulative des fréquences.
L’histogramme est réservé aux séries groupées en classes. Pour visualiser l’importance relative des
classes, on préfère les représenter par des surfaces en construisant un histogramme. L’histogramme est
une représentation graphique de la distribution des effectifs ou des fréquences d’une variable statistique
continue ou considérée comme telle. À chaque classe de valeurs en abscisses, on fait correspondre un
rectangle dont l’aire est proportionnelle à l’effectif de la classe (ou à la fréquence) : en abscisse l’amplitude
de la classe, en ordonnée l’effectif (ou la fréquence) par unité d’amplitude.
NB : Soit une distribution {[bi ; bi+1[ ; ni } d’une variable statistique continue, pour chaque classe,
l’histogramme associe un rectangle de largeur ai = bi+1 − bi et de hauteur hi = fi ai.
Exemple : Taille des élèves de 1e année 2009 de l’ETA de Bafang
1°- Histogramme de la répartition de la classe de 1e année 2009 de l’ETA de Bafang selon la taille des
élèves.
Nombre d’élèves
8
7
6
5
4
3
2
1
Taille des élèves
1,50 1,55 1,60 1,65 1,70 1,75 1,80 1,85 1,90 1,95
L’échantillonnage représente l’ensemble des opérations qui ont pour objet de prélever un certain nombre
d’individus dans une population donnée.
Pour que les résultats observés lors d’une étude soient généralisables à la population statistique,
l’échantillon doit être représentatif de cette dernière, c’est à dire qu’il doit refléter fidèlement sa
composition et sa complexité. Seul l’échantillonnage aléatoire assure la représentativité de l’échantillon.
Un échantillon est qualifié d’aléatoire lorsque chaque individu de la population a une probabilité connue
et non nulle d’appartenir à l’échantillon.
Le cas particulier le plus connu est celui qui affecte à chaque individu la même probabilité d’appartenir à
l’échantillon.
Il existe d’autres techniques d’échantillonnage que nous ne développerons pas dans un premier temps
dans ce cours comme l’échantillonnage systématique, l’échantillonnage stratifié, l’échantillonnage avec
probabilité proportionnelle à la taille, échantillonnage à plusieurs degrés et la méthode utilisant des
informations supplémentaires qui répondent à des problématiques biologiques spécifiques.
L’échantillonnage stratifié
Le massif forestier est initialement divisé en strates, chacune d’elles étant plus homogènes que le
massif forestier entier (même formation végétale, partie de forêt d’accessibilité facile, etc.) ;
chaque strate est alors échantillonnée indépendamment.
L’échantillonnage avec probabilité proportionnelle à la taille
Lorsque les unités d’échantillonnage sont de tailles variables, il est plus efficace de les tirer avec des
probabilités proportionnelles à leur taille.
L’échantillonnage à plusieurs degrés (2 ou 3 en général)
Au premier degré, on tire de grandes unités dites unités du premier degré exemple blocs de 5000 ha
environ).
Au deuxième degré, on tire dans chaque unité du premier degré des unités plus petites (unités de
deuxième degré : par exemple des blocs de 100 ha) et ainsi de suite.
L’intérêt de ce type de sondage est de concentrer le travail sur le terrain limitant ainsi le déplacement donc
les coûts.
Les méthodes utilisant des informations supplémentaires
Ces méthodes utilisent habituellement la technique mathématique de régression. Elles sont
particulièrement utiles lorsque la mesure directe du caractère y étudié (par exemple, le volume à l’ha
d’une espèce de taille donnée) est difficile ou revient très cher, alors qu’un autre caractère x plus simple à
mesurer (par exemple, la surface terrière à l’ha) lui est très lié. Dans un tel cas, on mesure x sur un grand
échantillon et y sur un petit échantillon. Les techniques de régression qui exploitent la liaison entre x et y
permettent d’estimer y à partir de x.
Sondage ou échantillonnage systématique
Très utilisée dans les inventaires forestiers, il consiste essentiellement à choisir les unités de sondage non
pas au hasard mais d’une certaine façon systématique : un arbre sur 10 arbres, des parcelles équidistances
sur des layons équidistants, etc. Le terrain est simplifié mais l’estimation de la précision du sondage ne
peut pas se faire à l’aide des formules statistiques classiques.
Les méthodes de collecte sont nombreuses et peuvent être classées suivant différents critères.
A. Relevés directes
B. Relevés indirectes
Le planteur qui exprime sa récolte à partir des surfaces et des rendements unitaires.
D. Le Questionnaire
C’est l’ensemble de questions auxquelles l’enquêté doit répondre destiné à fournir des renseignements
nombreux et exacts. La rédaction doit être l’objet des plus grands soins.
a) Le problème du coût doit être pris en considération
b) Le questionnaire doit être adapté au niveau des personnes consultées
c) Le questionnaire doit être complet et concis
d) Les questions posées doivent être simples et conduire à des réponses précises et courtes.
1- Le dépouillement
b) La codification
Exemple : Chez les animaux, on peut identifier trois sexes au lieu de deux à savoir (mâle, femelle, castré) ou
(M, F, C) sur lesquels des variables seront introduites dans la machine (ordinateurs, calculatrices).
Les informations contenues dans le questionnaire sont souvent présentées sous forme d’un tableau
donnant la liste des modalités (catégories), la liste des valeurs ou des classes et leur effectif ou leur
fréquence.
A- Le groupement qualitatif
Ici les informations sont définies qualitativement. On peut aussi regrouper les individus selon la variété, la
race, la couleur, le teint, le genre, la répartition géographique, etc.
Exemple 1: Le sexe (caractère) des nouveaux nés (population) dans une maternité (unité stat.)
Ensemble : 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Fréquence: 4 1 2 3 4 1 1 2 3 4 1 2 3 4 2 1 3 4 1 2
B- Le groupement quantitatif
a) Sériation et constitution des classes
Le premier travail à faire consiste à sérier les nombres obtenus c’est-à-dire à les ranger par ordre
numérique croissant ou décroissant. Aussi convient-il souvent de réunir ces résultats en classes contenant
chacune les observations comprises entre les limites déterminées.
i. Variables continues
On repartit les mesures d’abords en classe primaire dont l’intervalle est égal à la précision des mesures.
Exemple 1 : si les mesures des longueurs sont faites avec une précision de 1mm, on choisit les intervalles
de1mm précises. S’il est utile les classes primaires sont réunies en nombres égales en classes secondaires.
Exemple 2 : A l’ occasion d’une compétition où 20 athlètes ont des poids en unité de kg, on enregistre 20
observations qui constituent l’ensemble de la population ou la série statistique suivante :
77.45 ; 81.29 ; 56.41 ; 52.2 ; 63.23 ; 67.82 ; 63.22 ; 63.10 ; 71.28 ; 54.93 ; 71.37 ; 61.33 ; 68.78 ; 59.93 ;
71.44 ; 77.82 ; 67.41 ; 61.80 ; 78.52 ; 71.86.
NB : classes médianes primaires et classes médianes secondaires (on additionne les extrêmes et divise par
deux).
Distribution de fréquence
La liste des classes avec l’indication des fréquences correspondantes constitue une distribution de
fréquence qu’on présente souvent sous forme de tableau de fréquence.
On appelle effectif cumulée d’une valeur xi, la somme des effectifs de toutes les valeurs inférieures
ou égales à xi.
Exemple :
Afin d’étudier la structure de la population de gélinottes huppées (Bonasa umbellus) abattues
par les chasseurs canadiens, une étude du dimorphisme sexuel de cette espèce a été entreprise.
Parmi les caractères mesurés figure la longueur de la rectrice centrale (plume de la queue).
Les résultats observés exprimés en millimètres sur un échantillon de 50 mâles juvéniles sont notés dans la
série ci-dessus :
Tableaux statistiques
Le tableau de distribution de fréquences est un mode synthétique de présentation des données. Sa
constitution est immédiate dans le cas d’un caractère discret mais nécessite en revanche une
transformation des données dans le cas d’un caractère continu.
-Fréquences absolues, relatives et cumulées
A chaque modalité du caractère X, peut correspondre un ou plusieurs individus dans l'échantillon de taille
n.
Remarque : Parfois on peut rencontrer le terme de fréquence absolue pour les effectifs.
On appelle fréquence de la modalité xi, le nombre fi tel que fi = ni/n.
Remarque : Parfois on peut rencontrer le terme de fréquence relative pour les fréquences.
Le pourcentage est une fréquence exprimée en pour cent. Il est égal à 100 fi.
L’emploi des fréquences ou fréquences relatives s’avère utile pour comparer deux distributions de
fréquences établies à partir d’échantillons de taille différente.
On appelle fréquences cumulées ou fréquences relatives cumulées en xi, le nombre fi cum tel que
k
fi cum = ∑ fP
p=1
k k
Remarque : On peut noter que ∑ ni = n, taille de l’échantillon et ∑ fi = 1
i=1 i=1
Le traitement graphique constitue une première étape de la synthèse des données. Les représentations
graphiques ont l’avantage de renseigner immédiatement sur l’allure générale de la distribution. Elles
facilitent l’interprétation des données recueillies.
Il existe 12 types de diagrammes dont l’usage dépend de la variable étudiée. Cependant tous utilisent le
principe de proportionnalité entre les effectifs et les aires représentées.
Les Variables qualitatives
On peut représenter la distribution d’une variable qualitative au moyen des diagrammes en barres ou en
tuyaux d’orgue et au moyen du diagramme en secteur ou en camembert.
Le diagramme en barres (ou en tuyaux d'orgue) : Diagramme représentant la distribution d'une variable
qualitative : les modalités sont placées en abscisse, formant des bases de rectangles égales et
équidistantes, et les effectifs (ou fréquences) en ordonnée, suivant une échelle arithmétique. Les surfaces
des rectangles obtenus sont proportionnelles aux effectifs (ou aux fréquences).
Le diagramme en tuyau consiste à représenter chaque modalité de la variable par un rectangle de base
constante et de hauteur égale à l’effectif ou à la fréquence de la modalité.
Exemple : Tableau de fréquence des causes de décès des volailles dans le Haut-Nkam.
C'est l'inventaire des modalités ou valeurs rencontrées dans la série, avec les effectifs correspondants.
Diagramme circulaire ou en secteur illustré ci-dessous à l’aide d’un tableau statistique simple :
Situation Nombre de personnes
familiale dans cette situation
célibataire 150
marié 120
divorcé 10
veuf 80
x x
On tire les bâtons vers l’axe des abscisses à partir des points.
Si l’on joint par des segments de droite des points par le diagramme de points en adjoignant de parts et
d’autres une classe adjacente pour laquelle la classe est nulle, on forme un polygone de fréquence.
-histogramme
Pour construire un histogramme, on marque les limites de classes sur l’axe des abscisses et on y élève des
perpendiculaires dont la hauteur est égale à la fréquence de la classe comprise entre deux de ces
perpendiculaires. Les extrémités de ces dernières sont ensuite reliées par des traits parallèles à l’axe des
abscisses (x).
Remarque : Combien de classes un histogramme doit-il comporter et quel doit être les intervalles de
classe ? Si celles-ci sont très nombreuses l’histogramme sera irrégulier et pourra comporter des trous. Le
choix d’un nombre restreint de classes risque de donner une bonne partie des détails intéressants.
En règle général, il faut au moins 8 classes et au plus lorsque les données sont particulièrement
nombreuses. Il convient de choisir les intervalles de classes de sorte que les bornes inférieures soient des
chiffres ronds aussi simples que possibles. Les intervalles de classes ne doivent pas se chevaucher, ils
doivent de préférence être égaux.
Types d’histogrammes
1-histogramme symétrique
La plus grande partie des données est groupée en son centre et les extrémités en queue peuvent s’écrire
approximativement.
2-histogramme asymétrique 4) 5) 3)
1)
3-histogramme en forme de J
5-histogramme en forme de U 6) 7)
6-histogramme bimodale
7-histogramme multimodale
Autre Exemple :
Effectif : ni
X : nombre de galles par feuille
Dans l’exemple de la cécidomyie de l’eucalyptus, la distribution des fréquences observées du nombre de
galles par feuille peut être représentée par un diagramme en bâtons avec en ordonnée les effectifs ni et
en abscisse les différentes modalités de la variable étudiée.
-Caractères quantitatifs continus
Pour les caractères quantitatifs continus, la représentation graphique est l’histogramme où la hauteur du
rectangle est proportionnelle à l’effectif ni. Ceci n’est vrai que si l’intervalle de classe est constant. Dans ce
cas l’aire comprise sous l’histogramme s’avère proportionnelle à l’effectif total. En revanche lorsque les
intervalles de classe sont inégaux, des modifications s’imposent pour conserver cette proportionnalité.
Dans ce cas, en ordonnée, au lieu de porter l’effectif, on indique le rapport de la fréquence sur l’intervalle
de classe. Ainsi la superficie de chaque rectangle représente alors l’effectif associé à chaque classe.
Exemple :
Dans l’exemple de la longueur de la rectrice centrale des individus mâles de la gélinotte huppée, la
distribution des fréquences observées est représentée par un histogramme avec en ordonnée les effectifs
ni et en abscisse les limites de classe de la variable étudiée.
Indicateurs numériques
Remarque :
Pour un histogramme des effectifs, la hauteur de rectangle correspondant à la classe i est donc donnée
par :
– L’aire de l’histogramme est égale à l’effectif total n, puisque l’aire de chaque rectangle est égale à
l’effectif de la classe i : ai × hi = ni.
Pour un histogramme des fréquences on a :
– L’aire de l’histogramme est égale à 1, puisque l’aire de chaque rectangle est égale à la fréquence de la
classe i : ai × di = fi.
Si [c-i ; c+i [désigne la classe i, on note de manière générale :
– c-i la borne inférieure de la classe i,
– c+i la borne supérieure de la classe i,
– ci = (c+i + c- i) / 2 le centre de la classe i,
– ai = c+i - c-i l’amplitude de la classe i,
– ni l’effectif de la classe i,
– Ni l’effectif cumulé de la classe i,
– fi la fréquence de la classe i,
– Fi la fréquence cumulée de la classe i.
INDICATEURS NUMERIQUES
Le dernier niveau de description statistique est le résumé numérique d’une distribution statistique par des
indicateurs numériques ou paramètres caractéristiques.
Remarque : Ces derniers représentent une transition entre la statistique purement descriptive et
l’estimation des paramètres qui caractérisent les distributions de probabilité.
La moyenne Arithmétique
NB : xi est le centre de classe Ci et on peut aussi utiliser la fréquence fi à la place de ni pour calculer la
moyenne arithmétique à partir des valeurs groupées.
Remarque : La moyenne obtenue après regroupement des données en classe dans l’exemple de la
longueur de la rectrice centrale diffère légèrement en raison d’une perte d’information.
Si l’échantillonnage n’est pas de type aléatoire simple, les deux moyennes peuvent être très différentes.
NB : La moyenne ne peut être définie que sur une variable quantitative.
La moyenne géométrique
Si , on appelle moyenne géométrique la quantité :
La moyenne géométrique s’utilise, par exemple, quand on veut calculer la moyenne du taux d’intérêt.
Moyenne harmonique
Exemple : Un cycliste parcourt 4 étapes de 100km. Les vitesses respectives pour ces étapes sont de 10
km/h, 30 km/h, 40 km/h, 20 km/h. Quelle a été sa vitesse moyenne ?
– Un raisonnement simple nous dit qu’il a parcouru la première étape en 10h, la deuxième en 3h20, la
troisième en 2h30 et la quatrième en 5h. Il a donc parcouru le total des 400km en
Remarque : Il est possible de montrer que la moyenne harmonique est toujours inférieure ou égale à la
moyenne géométrique qui est toujours inférieure ou égale à la moyenne arithmétique
Moyenne pondérée
Dans certains cas, on n’accorde pas le même poids à toutes les observations. Par exemple, si on calcule la
moyenne des notes pour un programme d’étude, on peut pondérer les notes de l’´etudiant par le nombre
de crédits ou par le nombre d’heures de chaque cours.
Si wi > 0, i = 1, . . ., n sont les poids associés à chaque observation, alors la moyenne pondérée par wi est
définie par :
Exemple : Supposons que les notes soient pondérées par le nombre de crédits, et que les notes de
l’étudiant soient les suivantes :
La moyenne pondérée des notes par les crédits est alors
Le mode ou dominante
Remarque : Le mode est aussi la valeur la plus probable. Si on considère les classes d’intervalles finis alors
on parle de classes modales. Pour les distributions en cloche symétrique, la moyenne arithmétique, la
médiane et le mode sont confondus. Mais il n’est pas de même pour les distributions en cloche
dissymétrique.
La médiane
La médiane (Me) est la valeur du caractère pour laquelle la fréquence cumulée est égale à 0,5 ou 50%. Elle
correspond donc au centre de la série statistique classée par ordre croissant, ou à la valeur pour laquelle
50% des valeurs observées sont supérieures et 50% sont inférieures. C’est la valeur de la variable qui
partage les observations ou mesures en 2 effectifs égaux lorsque les observations sont supposées être
rangées par ordre décroissant ou croissant.
Exemples :
-Si n est pair, il n’y a pas d’observation médiane mais on a pour valeur médiane, la moyenne arithmétique
qui est n / 2 ou n + 2 / 2 de ces observations ou mesures.
Classes Fi Fi xi fixi
10-20 1 1 15 15
20-30 3 4 25 75
30-40 9 13 35 315
40-50 13 26 45 585
50-60 24 50 55 1320
60-70 26 76 65 1690
70-80 25 101 75 1875
80-90 31 132 85 2635
90-100 18 150 95 1710
100-110 10 160 105 1050
110-120 3 163 115 345
120-130 2 165 125 250
Total 165
X = ∑ fixi / ∑ fi = 11865/165
d’où X = 71,9.
Il y a donc 165 mesures ou observations impliquant que la valeur de la médiane M e sera située à (n+1 / 2 =
165 +1/2 = 83) la 83ème observation. On a donc :
d’où Me = 72,8.
L’application ici peut être de déterminer la taille médiane approximative c’est-à-dire de trouver le
troupeau qui se trouve à la 83ème position soit 83 = 76 + 7.
Il s’agit de trouver le 7ème troupeau de taille médiane dans l’intervalle [70-80]. Si les troupeaux sont
uniformément répartis à l’intérieur du rectangle c’est-à-dire la présence d’un troupeau à chaque 10/25 =
0,4 unités, le 7ème troupeau se trouve donc à 7 x 0,4 unités au-dessus de la valeur inférieure du rectangle
c’est-à- dire 70 + 2,8 qui est notre médiane.
Remarque : Sauf indication spéciale, lorsque nous parlerons de la moyenne, ce sera la moyenne
arithmétique.
Exemples : Représentation graphique des trois indices de position sur l’exemple de la distribution de la
longueur de la rectrice centrale de la gélinotte huppée.
INDICES OU INDICATEURS OU PARAMETRES DE DISPERSION
Les valeurs typiques sont insuffisantes à elles seules pour caractériser une distribution et d’autres
indications sont nécessaires pour préciser de quelle façon les observations sont concentrées autour de la
valeur centrale. Ces paramètres ont pour objectif dans le cas d'un caractère quantitatif de caractériser la
variabilité des données dans l’échantillon.
L’étendue d’une série de mesures ou d’une série statistique est la différence entre la plus grande et la plus
petite valeur observée dans la série.
C’est un enseignement fréquent utilisé en systématique par la mention des limites inférieures et des
limites supérieures.
Ecart moyen
Pour obtenir une grandeur numérique qui représente l’allure de l’ensemble des écarts, on ne peut avoir
recours à leur somme arithmétique puisque celle-ci est toujours nulle. A cet effet, on peut totaliser les
écarts sans tenir compte de leur signe et l’on appelle écart moyen, la moyenne arithmétique de la valeur
absolue ou module des écarts.
Les quantiles
La notion ne peut être généralisée en considérant les valeurs auxquelles une proportion quelconque
d’observations est inférieure ou égale. Les termes voisins portent le nom générique de quantile.
On appelle quantiles d’ordre α notés xα tel que 0 ≤ α ≤ 1, la valeur de la variable telle qu’une proportion α
de l’observation soit ≤ xα (α ≤ xα).
Parmi les quantiles remarquables, on définit les trois valeurs qui font la distribution en quatre séries
contenant chacune ¼ de l’effectif total. Pour cette raison, ces valeurs sont appelées Quartiles et notées Q1,
Q2 et Q3 ou x1/4, x2/2 et x3/4. Le deuxième quartile Q2 est régulièrement la médiane. De manière analogue,
on défini les 9 Déciles et les 99 Centiles qui divisent la distribution respectivement en 10 et 100 classes
d’effectif. La différence Q3 - Q1 encore appelée écart interquartile donne l’étendue de la classe qui contient
la quantité d’observation située au centre de la distribution dont 25% à gauche et 25% à droite.
Exemple 1 : Soit la série de mesures 5, 8, 9, 11, 12, 14, 15, 17, 19, 20, 21.
Soit 0,40/ 0,27 ≤0,40 x0, 40 0,60/ 0,63 ¿ 0,60 donc11 ne satisfait pas
car 0,63 n’est pas ¿ 0,60 alors que 0,27 ≤ 0,40 vérifie le théorème.
-Si x0, 40 = 12
-Si x0, 40 = 14
Exemple 2: Soit la série statistique 64, 66, 66, 74, 77, 81, 86, 86.
-Si x0, 5 = 77
-Si x0, 2 = 3
0 ¿ 0,20
La variance observée
Soit un échantillon de n valeurs observées x1, x2, …., xi,…., xn d’un caractère quantitatif X et soit x sa
moyenne observée. On définit la variance observée notée s2 comme la moyenne arithmétique des carrés
des écarts à la moyenne.
Dans le cas de données regroupées en k classes d'effectif ni (variable continue regroupée en classes ou
variable discrète), la formule de la variance est la suivante :
NB : δ2 est la variance qui correspond à la population et son effectif est N-1 ; à la place d’i=1 dans les
formules ci-dessus on remplace par n=1 et il s’agit en ce moment là de N classes.
L’écart-type observé
Il est aussi appelé écart unité ou écart étalon ou écart quadratique moyen ou déviation standard ou
déviation type ou déviation unitaire. Il correspond à la racine carré de la variance.
Exemple :
Dans le cas de l’étude du dimorphisme sexuel de la gélinotte huppée, la variance observée de la longueur
de la rectrice centrale du mâle juvénile est :
Remarque : De part sa définition, la variance est toujours un nombre positif. Sa dimension est le carré de
celle de la variable. Il est toutefois difficile d’utiliser la variance comme mesure de dispersion car le recours
au carré conduit à un changement d’unités. Elle n’a donc pas de sens biologique direct contrairement à
l'écart-type qui s’exprime dans les mêmes unités que la moyenne.
Coefficient de variation
La variance et l’écart-type observée sont des paramètres de dispersion absolue qui mesurent la variation
absolue des données indépendamment de l’ordre de grandeur des données.
Le coefficient de variation noté C.V. est un indice de dispersion relatif prenant en compte ce biais et est
égal à :
Population : C.V = δ / μ x 100
Echantillon : C.V =
Exprimé en pour cent, il est indépendant du choix des unités de mesure permettant la comparaison des
distributions de fréquence d’unité différente.
Exemple : Le coefficient de variation des longueurs de la rectrice centrale des gélinottes huppées mâles
juvéniles est égal à :
Exemple :
Le poids moyen et l’écart-type des poids des toisons d’un troupeau de moutons sont respectivement
égalent à 10,3 et 1,5 kg. Quant à leur valeur commerciale, les valeurs de l’écart-type sont respectivement
5,1 et 0,7 unités.
Remarque : L’écart-type est exprimé avec la même unité que la variance et représente une mesure de
même nature que la variance.
Pour comparer la dispersion des diverses distributions par exemples d’organes analogues chez les espèces
de tailles différentes ou de divers éléments de n individus, on utilise la dispersion relative c’est-à-dire le CV.
Le CV est un nombre pur sans dimension, indépendant des unités employées.
Le groupement des variables en classes a pour effet de substituer à chacun des résultats effectivement
obtenus par l’observation du point médian de la classe à laquelle il appartient. Ainsi les observations d’une
classe de fréquence sont ainsi remplacées par f valeur égale au point médian. Il en résulte que les
paramètres calculés à partir de cette nouvelle grandeur ne sont pas exactement les mêmes que ceux qui
seraient obtenus directement mais plus péniblement à partir des données originales
δ2= ∑ fiXi2 / ∑ fi - (∑ fiXi)2 = 455103 / 100 – (6745 / 100)2 = 68.97 d’où δ = 8.30.
La distance interquartile
PARAMETRES DE FORME
Le coefficient d’asymétrie de Yule est basé sur les positions des 3 quartiles (1er quartile, médiane et
troisième quartile), et est normalisé par la distance interquartile :
Coefficient d’asymétrie de Pearson
Le coefficient d’asymétrie de Pearson est basé sur une comparaison de la moyenne et du mode, et est
standardisé par l’écart-type :
Tous les coefficients d’asymétrie ont les mêmes propriétés, ils sont nuls si la distribution est symétrique,
négatifs si la distribution est allongée à gauche (left asymmetry), et positifs si la distribution est allongée à
droite (right asymmetry) comme montré dans la Figure ci-dessous :
Remarque : Certaines variables sont toujours très asymétriques à droite, comme les revenus, les tailles des
entreprises, ou des communes. Une méthode simple pour rendre une variable symétrique consiste alors à
prendre le logarithme de cette variable.
DEUXIEME PARTIE : Statistique descriptive bivariée
Série statistique bivariée :
On s’intéresse à deux variables x et y. Ces deux variables sont mesurées sur les n unités d’observation. Pour
chaque unité, on obtient donc deux mesures. La série statistique est alors une suite de n couples des
valeurs prises par les deux variables sur chaque individu :
Chacune des deux variables peut être, soit quantitative, soit qualitative. On examine deux cas.
Dans ce cas, chaque couple est composé de deux valeurs numériques. Un couple de nombres (entiers ou
réels) peut toujours être représenté comme un point dans un plan
Les variables x et y peuvent être analysées séparément. On peut calculer tous les paramètres dont les
moyennes et les variances :
Ces paramètres sont appelés paramètres marginaux : variances marginales, moyennes marginales,
écarts-types marginaux, quantiles marginaux, etc.. . .
Covariance
Remarque :
Corrélation
Le coefficient de corrélation est la covariance divisée par les deux écart-types marginaux :
Détermination
Remarque :
– Si le coefficient de corrélation est négatif, les points sont alignés le long d’une droite décroissante.
– Si le coefficient de corrélation est nul ou proche de zéro, il n’y a pas de dépendance linéaire. On peut
cependant avoir une dépendance non-linéaire avec un coefficient de corrélation nul.
S'il est proche de + 1 ou - 1, X et Y sont bien corrélées, c'est-à-dire qu'elles sont liées entre elles par une
relation presque affine ; le nuage de points est presque aligné le long d'une droite (croissante si r = + 1,
décroissante si r = - 1). S'il n'y a aucun lien entre X et Y, ce coefficient est nul, ou presque nul.
Droite de régression
La droite de régression est la droite qui ajuste au mieux un nuage de points au sens des moindres carrés.
On considère que la variable X est explicative et que la variable Y est dépendante. L’équation d’une droite
est y = a + bx.
Le problème consiste `a identi.er une droite qui ajuste bien le nuage de points.
Si les coefficients a et b étaient connus, on pourrait calculer les résidus de la régression définis par :
ei = yi - a - bxi.
Le résidu ei est l’erreur que l’on commet (voir Figure 3.3) en utilisant la droite de régression pour prédire yi
à partir de xi. Les résidus peuvent être positifs ou négatifs.
Pour déterminer la valeur des coefficients a et b on utilise le principe des moindres carrés qui consiste à
chercher la droite qui minimise la somme des carrés des résidus :
Théorème : Les coefficients a et b qui minimisent le critère des moindres carrés sont donnés par :
On devrait en outre vérifier qu’il s’agit bien d’un minimum en montrant que la matrice des dérivées
secondes est définie positive. La droite de régression est donc :
Données observées
Si les deux variables x et y sont qualitatives, alors les données observées sont une suite de couples de
variables (x1, y1), . . . , (xi, yj), . . . , (xn, yn), chacune des deux variables prend comme valeurs des modalités
qualitatives.
x1, . . . , xj , . . . , xJ
et
Tableau de contingence
Les données observées peuvent être regroupées sous la forme d’un tableau de contingence :
Exemple : On s’intéresse à une éventuelle relation entre le sexe de 200 personnes et la couleur des yeux.
Le Tableau ci-dessous reprend le tableau de contingence.
Le tableau de fréquences s’obtient en divisant tous les effectifs par la taille de l’´echantillon :
Le tableau de fréquences s’obtient en divisant tous les effectifs par la taille de l’´echantillon :
Le tableau des fréquences est :
Un tableau de contingence s’interprète toujours en comparant des fréquences en lignes ou des fréquences
en colonnes (appelés aussi profils lignes et profils colonnes).
Exemple : Le Tableau 3.3 reprend le tableau des profils lignes, et le Tableau 3.4 reprend le tableau des
profils colonnes.
On cherche souvent une interaction entre des lignes et des colonnes, un lien entre les variables. Pour
mettre en évidence ce lien, on construit un tableau d’effectifs théoriques qui représente la situation où les
variables ne sont pas liées (indépendance). Ces effectifs théoriques sont construits de la manière suivante :
Les effectifs observés njk ont les mêmes marges que les effectifs théoriques .
Probabilités Statistique
Espace fondamental Population
Epreuve Tirage (d’un individu), expérimentation
Evènement élémentaire Individu, observation
Variable aléatoire Caractère
Epreuves répétées Echantillonnage
Nombre de répétitions d’une épreuve Taille de l’échantillon, effectif total
Probabilité Fréquence observée
Loi de probabilité Distribution observée ou loi empirique
Espérance mathématique Moyenne observée
Variance Variance observée
1 Probabilités
1.1 Evénement
Une expérience est dite aléatoire si on ne peut pas prédire a priori son résultat. On note ω un résultat
possible de cette expérience aléatoire. L’ensemble de tous les résultats possibles est not´e Ω. Par exemple,
si on jette deux pièces de monnaie, on peut obtenir les résultats
Ω = {(P, P), (F, P), (P, F), (F, F)}, avec F pour “face” et P pour “pile”. Un événement est une assertion logique
sur une expérience aléatoire comme “avoir deux fois pile” ou “avoir au moins une fois pile”. Formellement,
un événement est un sous-ensemble de Ω.
– L’événement “avoir deux fois pile” est le sous ensemble {(P, P)}.
– L’événement “avoir au moins une fois pile” est le sous ensemble {(P, P), (F, P), (P, F)}.
L’ensemble Ω est appelé événement certain, et l’ensemble vide ∅ est appelé événement impossible.
Sur les événements, on peut appliquer les opérations habituelles de la théorie des ensembles.
L’union
L’évènement A∪B est réalise d`es que A ou B est réalise. Dans un lancer de dé, si l’événement A est
“obtenir un nombre pair” et l’évènement B “obtenir un multiple de 3”, l’évènement A ∪ B est l’évènement
“obtenir un nombre pair OU un multiple de 3”, c’est-a-dire {2, 3, 4, 6}.
L’intersection
L’évènement A ∩ B est réalisé d`es que A et B sont réalisés conjointement dans la même expérience. Dans
un lancer de dé, si l’évènement A est “obtenir un nombre pair” et l’évènement B “obtenir un multiple de
3”, l’évènement A ∩ B est l’´ev´enement “obtenir un nombre pair ET multiple de 3”, c’est-à-dire {6}.
La différence
L’évènement A\B est réalisé quand A est réalisé et que B ne l’est pas.
Exemple : l’évènement « l’entrepreneur agropastoral aime soit le plantain soit le macabo », revient à
trouver l’évènement noté A ∆ B.
Remarque : A ∆ B = (A ∩ B) U (B ∩ A)
Le complémentaire
Exemple : L’expérience peut consister à jeter un dé, alors Ω = {1, 2, 3, 4, 5, 6}, et un évènement, not´e A,
est “obtenir un nombre pair”. On a alors A = {2, 4, 6} et A = {1, 3, 5}.
Si A ∩ B = ∅ on dit que A et B sont mutuellement exclusifs, ce qui signifie que A et B ne peuvent pas se
produire ensemble.
Exemple : Si on jette un dé, l’évènement “obtenir un nombre pair” et l’événement “obtenir un nombre
impair” ne peuvent pas être obtenus en même temps. Ils sont mutuellement exclusifs. D’autre part, si l’on
jette un dé, les événements A : “obtenir un nombre pair” n’est pas mutuellement exclusif avec
l’évènement B : “obtenir un nombre inferieur ou égal à 3”. En effet, l’intersection de A et B est non-vide et
consiste en l’évènement “obtenir 2”.
Inclusion
Exemple : Si on jette un dé, on considère les événements A “obtenir 2” et B “obtenir un nombre pair”.
Exemple : Si on jette une pièce de monnaie alors Ω = {P, F}, et A = {∅, {F}, {P}, {F, P}.
1.5 Axiomatique des Probabilités
Définition 2 : Une probabilité P(.) est une application de A dans [0, 1], telle que :
– Pr(Ω) = 1,
– Pour tout ensemble dénombrable d’´ev´enements A1, .., An mutuellement exclusifs (tels que Ai ∩ Aj = ∅,
pour tout i ̸= j),
Propriété 1 : Pr(∅) = 0.
Démonstration :
On sait que
A ∪ A = Ω et A ∩ A = ∅. Et Pr (∅ ∪ ∅) = Pr(∅) + Pr(∅).
A ∪ A = Ω et A ∩ A = ∅.
Ainsi, on a que
Pr(Ω) = Pr (A ∪ A) = Pr(A) + Pr(A).
Démonstration
Comme A ⊂ B, on a B = (B ∩ A) ∪ A.
Mais on a que (B ∩ A) ∩ A = ∅.
Or une probabilité est à valeur dans [0,1], donc Pr (B ∩ A) ≥ 0. On a alors Pr(B) ≥ Pr(A).
Démonstration
On a: A ∪ B = A ∪ (B ∩ A), et A ∩ (B ∩ A) = ∅.
En effet, B = (B ∩ A) ∪ (B ∩ A) avec (B ∩ A) ∩ (B ∩ A) = ∅
Donc Pr(B) = Pr (B ∩ A) + Pr (B ∩ A), ce qui donne Pr (B ∩ A) = Pr(B) – Pr (A ∩ B).
Définition 3 : Soient deux événements A et B, si Pr(B) > 0, alors Pr(A|B) =Pr (A ∩ B)/Pr(B)
Exemple : Si on jette un dé, et que l’on considère les deux évènements suivants :
– A l’évènement ‘avoir un nombre pair’ et
– B l’évènement ‘avoir un nombre supérieur ou égal à 4’.
On a donc
– Pr(A) = Pr ({2, 4, 6}) =1/2,
– Pr(B) = Pr ({4, 5, 6}) =3/6=1/2,
– Pr (A ∩ B) = Pr ({4, 6}) =2/6=1/3,
– Pr(A|B) =Pr (A ∩ B)/Pr(B)=1/3 /1/2=2/3.
Définition 4 : Deux évènements A et B sont dits indépendants si Pr(A|B) = Pr(A).
On peut montrer facilement que si A et B sont indépendants, alors Pr (A ∩ B) = Pr(A) Pr(B).
1.7 Théorème des probabilités totales et théorème de Bayes
Théorème 1 : (des probabilités totales) Soit A1, . . . , An un système complet d’évènements, alors
Pr(B) =Σ Pr(Ai) Pr(B|Ai)
En effet, Σ Pr(Ai) Pr(B|Ai) = Σ Pr(B ∩ Ai).
Théorème 2 : (de Bayes) Soit A1, . . . , An un système complet d’évènements, alors
Pr(Ai|B) = Pr(Ai)Pr(B|Ai) / Σ Pr(Aj)Pr(B|Aj).
En effet, par le théorème des probabilités totales,
Pr(Ai)Pr(B|Ai)/ Σ Pr(Aj)Pr(B|Aj) = Pr(B ∩ Ai)/ Pr(B) = Pr(Ai|B).
Exemple: Supposons qu’une population d’adultes soit composée de 30% de fumeurs (A1) et de 70% de
non-fumeurs (A2). Notons B l’évènement “mourir d’un cancer du poumon”. Supposons en outre que la
probabilité de mourir d’un cancer du poumon est égale à Pr(B|A1) = 20% si l’on est fumeur et de Pr(B|A2)
= 1% si l’on est non-fumeur. Le théorème de Bayes permet de calculer les probabilités a priori, c’est-à-dire
la probabilité d’avoir ´et´e fumeur si on est mort d’un cancer du poumon. En effet, cette probabilité est
notée Pr(A1|B) et peut être calculée par :
2.1 Introduction
L’analyse combinatoire est l’étude mathématique de la manière de ranger des objets. L’analyse
combinatoire est un outil utilisé dans le calcul des probabilités.
Considérons par exemple l’ensemble {1, 2, 3}. Il existe 6 manières d’ordonner ces trois chiffres :
{1, 2, 3}, {1, 3, 2}, {2, 1, 3}, {2, 3, 1}, {3, 1, 2}, {3, 2, 1}.
Si on dispose de n objets, chacun des n objets peut être place à la première place.
Il reste ensuite n − 1 objets qui peuvent être places `a la deuxième place, puis n−2 objets pour la troisième
place, et ainsi de suite. Le nombre de permutations possibles de n objets distincts vaut donc n × (n − 1) × (n
− 2) × · · · × 2 × 1 = n!.
n 0 1 2 3 4 5 6 7 8 9 10
On peut également se poser la question du nombre de manières de ranger des objets qui ne sont pas tous
distincts. Supposons que nous ayons 2 boules rouges (notées R) et 3 boules blanches (notées B). Il existe 10
permutations possibles qui sont :
Si l’on dispose de n objets appartenant `a deux groupes de tailles n1 et n2, le nombre de permutations
avec répétition est n! / n1!n2!
Par exemple si l’on a 3 boules blanches et 2 boules rouges, on obtient
Si l’on dispose de n objets appartenant à p groupes de tailles n1, n2, . . . , np, le nombre de permutations
avec répétition est n!/n1!n2! × · · · × np! .
2.5 Combinaisons
Soit n objets distincts. On appelle une combinaison une manière de sélectionner k objets parmi les n sans
tenir compte de leur ordre. Le nombre de combinaisons est le nombre de sous-ensembles de taille k dans
un ensemble de taille n. Soit l’ensemble {1, 2, 3, 4, 5}. Il existe 10 sous-ensembles de taille 3 qui sont :
{1, 2, 3}, {1, 2, 4}, {1, 2, 5}, {1, 3, 4}, {1, 3, 5}, {1, 4, 5}, {2, 3, 4}, {2, 3, 5}, {2, 4, 5}, {3, 4, 5}.
De manière générale, quel est le nombre de combinaisons de k objets parmi n ? Commençons par calculer
le nombre de manières différentes de sélectionner k objets parmi n en tenant compte de l’ordre : c’est le
nombre d’arrangements sans répétition Akn. Comme il existe k! manières d’ordonner ces k éléments, si l’on
ne veut pas tenir compte de l’ordre on divise Akn par k!. Le nombre de combinaisons de k objets parmi n
vaut donc Akn / k! = n! / k!(n − k)!.
Le nombre de combinaisons de k objets parmi n s’´ecrit parfois
(n k) et parfois Ckn :
(n k) = Ck n = n!/k!(n − k)!
Par exemple, si on cherche à déterminer le nombre de combinaisons de 3 objets parmi 5, on a (53) = C35 =5! /
3!(5 − 3)! = 120 / 6 × 2 = 10.
3 Variables aléatoires
3.1 Définition
La notion de variable aléatoire formalise l’association d’une valeur au résultat d’une expérience aléatoire.
Définition : Une variable aléatoire X est une application de l’ensemble fondamental Ω dans R.
Exemple : On considère une expérience aléatoire consistant à lancer deux pièces de monnaie. L’ensemble
des résultats possibles est Ω = {(F, F), (F, P), (P, F), (P, P)}.
Chacun des éléments de Ω a une probabilité 1/4. Une variable aléatoire va associer une valeur à chacun
des éléments de Ω. Considérons la variable aléatoire représentant le nombre de “Faces” obtenus :
0 avec une probabilité 1/4
X = 1 avec une probabilité 1/2
2 avec une probabilité 1/4.
C’est une variable aléatoire discrète dont la distribution de probabilités est présentée dans la Figure
suivante :
0.5
0.4
0.3
0.2
0.1
0.0
0 1 2
Une variable aléatoire discrète prend uniquement des valeurs entières (de Z).
Une distribution de probabilités pX(x) est une fonction qui associe à chaque valeur entière une probabilité.
L’espérance vaut
μ = E(X) = 0 × (1 − p) + 1 × p = p,
et la variance vaut
σ2 = var(X) = E(X − p) 2 = (1 − p)(0 − p)2 + p(1 − p)2 = p(1 − p).
Exemple : On tire au hasard une boule dans une urne contenant 18 boules rouges et 12 boules blanches. Si
X vaut 1 si la boule est rouge et 0 sinon, alors X a une loi bernoullienne de paramètre p = 18 / (18 + 12) =
0.6.
X ∼ B (n, p).
De manière synthétique, si X a une distribution binomiale, on note :
Rappel Cette variable est appelée binomiale car sa distribution de probabilités est un terme du
développement du binôme de Newton (p + q)n.
(p + q) 0 = 1
(p + q) 1 = p + q = 1
(p + q) 2 = p2 + 2pq + q2 = 1
(p + q) 3 = p3 + 3p2q + 3pq2 + q3 = 1
(p + q) 4 = p4 + 4p3q + 6p2q2 + 4pq3 + q4 = 1
……………………………………………..
(p + q)n =Σnx=0 (nx) pxqn−x = 1.
Exemple : On tire au hasard avec remise et de manière indépendante 5 boules dans une urne contenant 18
boules rouges et 12 boules blanches. Si X est le nombre de boules rouges obtenues, alors X a une loi
binomiale de paramètre p = 18 / (18 + 12) = 0.6, et d’exposant
n = 5. Donc,
Pr(X = x) = (5x) 0.6x 0.45−x, x = 0, 1, . . ., 4, 5,
Ce qui donne
Pr(X = 0) =5! / 0!(5 − 0)! 0.60 × 0.45−0 = 1 × 0.45 = 0.01024
Pr(X = 1) =5!/1!(5 − 1)! 0.61 × 0.45−1 = 5 × 0.61 × 0.44 = 0.0768
Pr(X = 2) =5!/2!(5 − 2)!0.62 × 0.45−2 = 10 × 0.62 × 0.43 = 0.2304
Pr(X = 3) =5!/3!(5 − 3)! 0.63 × 0.45−3 = 10 × 0.63 × 0.42 = 0.3456
Pr(X = 4) =5!/4!(5 − 4)! 0.64 × 0.45−4 = 5 × 0.64 × 0.41 = 0.2592
Pr(X = 5) =5!/5!(5 − 5)! 0.65 × 0.45−5 = 1 × 0.65 = 0.07776.
0.30
0.15
0.00
0 1 2 3 4 5
En un certain sens, cette loi n’est qu’un cas particulier de la loi binomiale ; elle s’applique lorsque le
nombre d’épreuves n devient très grand et que la probabilité de l’un des deux (2) évènements est très
petite. C’est pourquoi on l’appelle souvent « la loi des petites probabilités ». D’une façon générale, on
pourra y avoir recours pour obtenir des approximations des termes de la loi binomiale lorsque p est petit
et n est assez élevé ou assez grand. Le calcul de ses termes est facile et il existe d’ailleurs des tables pour
certaines valeurs de λ. Cette loi ne dépend qu’un seul paramètre (λ) et ainsi la connaissance d’un seul de
ses termes entraine théoriquement celle du paramètre λ.
La variable X suit une loi de Poisson, ou loi des événements rares, de paramètre λ ∈ R + si
On note alors X ∼ P(λ). La somme des probabilités est bien égale à 1, en effet
Présentation de la loi :
Dans le cas par exemple, de certaines expériences où interviennent les virus qu’on ne peut pas compter et
dont on peut seulement distinguer la présence ou l’absence. Les nombre de virus étant distribués au
hasard entre les cultures, il suffit de connaître la fréquence de cultures indemnes c’est-à-dire fo pour
connaître le nombre moyen λ de virus.
Cas pratiques :
Le nombre d’insectes par sacs de haricots ; le nombre d’hématies par cases d’hématimètres.
Soit X une variable aléatoire. On dit que X suit une loi de Poisson si elle est susceptible de prendre les
valeurs entières Xk = k ≥ 0 avec la probabilité Pk :
proba [X = k] = Pk = e−m x mk / k!
où m est un paramètre arbitraire, positif et 0! = 1 (par définition).
X = m = E(X) et V(X) = m
La distribution de probabilités d’une variable de Poisson P (λ = 1) est présentée dans la Figure ci-dessous :
0.4
0.2
00
0 1 2 3 4 5 6 7
Introduction :
Lorsque l’on s’intéresse à la durée d’une communication téléphonique, à la durée de vie d’un composant
électronique ou à la température de l’eau d’un lac, la variable aléatoire X associée au temps ou à la
température, peut prendre une infinité de valeurs dans un intervalle donné. On dit alors que cette variable
X est continue (qui s’oppose à discrète comme c’est le cas par exemple dans la loi binomiale).
On ne peut plus parler de probabilité d’événements car les événements élémentaires sont en nombre
infini. La probabilité d’une valeur isolée de X est alors nulle.
On appelle densité de probabilité d’une variable aléatoire continue X, la fonction f continue et positive sur
un intervalle I ([a; b], [a;+∞[ou R ) telle que :
P(X ∈ I) =∫ f (t )dt = 1
❑
(I)
α
La fonction F définie par : F(x) = P(X ≤ x) est appelée la fonction de répartition de la variable
X
x
F(x) = ∫ f (t) dt
a
Une variable aléatoire continue prend des valeurs dans R ou dans un intervalle de R .
La probabilité qu’une variable aléatoire continue soit inferieure à une valeur particulière est donnée par sa
fonction de répartition.
Pr(X ≤ x) = F(x).
On a, Pr (a ≤ X ≤ b) = F(b) − F(a).
La fonction de densité d’une variable aléatoire continue est la dérivée de la fonction de répartition en un
point
f (x) = dF(x) / dx
– d’aire égale à un :
∞
∫ f ( x ) dx = 1.
−∞
On a évidemment la relation :
b
F (b) = ∫ f ( x ) dx.
−∞
La probabilité que la variable aléatoire soit inférieure à une valeur quelconque vaut :
a
Pr (X ≤ a) = ∫ f ( x ) dx = F(a).
−∞
La probabilité que la variable aléatoire prenne une valeur comprise entre a et b vaut
a
Pr (a ≤ X ≤ b) =∫ f (x ) dx = F(b) − F(a).
b
Si la variable aléatoire est continue, la probabilité qu’elle prenne exactement une valeur quelconque est
nulle :
Pr (X = a) = 0.
μ = E(X) = ∫ x f (x ) dx ,
−∞
et la variance
∞
−∞
Une variable aléatoire X est dite uniforme dans un intervalle [a, b] (avec a < b), si sa répartition est :
0 si x < a
F(x) = (x − a) / (b − a) si a ≤ x ≤ b
1 si x > b.
0 si x < a
f (x) = 1 / (b − a) si a ≤ x ≤ b
0 si x > b.
Résultat 1
μ = E(X) = b + a / 2
Résultat 2
σ2 = var(X) = (b − a)2 / 12
La distribution binomiale, distribution continue est d’un emploi difficile dans les applications statistique car
il faut en calculer séparément les termes. Ainsi, on a cherché à remplacer par redistributions continues qui
en sont voisines mais qui présentent l’avantage d’être définies par une unique expression analytique et se
prête beaucoup mieux aux calculs. La distribution normale s’est ainsi introduite comme limite de la
distribution binomiale dont elle constitue une approximation souvent pour passer du système des X au
système des Z de la loi normale réduite qui est Z = X – μ / δ où Z s’appelle variable normale réduite
exprimée en unité standard.
De manière synthétique, pour noter que X suit une loi normale (ou gaussienne, d’après Carl Friedrich
Gauss) de moyenne μ et de variance σ2 on écrit :
X ∼ N (μ, σ2).
La loi normale est une des principales distributions de probabilité. Elle a de nombreuses applications en
statistique. Sa fonction de densité dessine une courbe dite courbe de Gauss. On peut montrer (sans
démonstration) que
Fμ; σ
2
(x) = ∫ 1 / σ√2π exp−1/2 (u – μ / σ) 2 du.
−∞
Et sa répartition vaut
x
Φ (− x) = 1 − Φ(x),
De plus, le calcul de la répartition d’une variable normale de moyenne μ et de variance σ2 peut toujours
être ramené à une normale centrée réduite.
Résultat
F μ ; σ2 (x) = Φ (x – μ / σ) = Φ (z).
Les tables de la variable normale ne sont données que pour la normale centrée réduite. Les tables ne
donnent Φ(x) que pour les valeurs positives de x, car les valeurs négatives peuvent être trouvées par la
relation de symétrie.
Si N (nombre des essais) est large et p ou q est ≠ 0 (différent de 0), la distribution binomiale peut être
évaluée approximativement par une distribution normale avec une variable standardisée
Z = (X – Np) / √ Npq
Où μ = Np moyenne de la loi binomiale
σ = √ Npq
5 Distribution exponentielle
Soit une variable aléatoire X qui définit la durée de vie d’un phénomène ou d’on objet. Si la durée de vie
est sans vieillissement, c’est-à-dire la durée de vie au-delà d’un instant T est indépendante de l’instant T,
alors sa fonction de densité est donnée par :
0 sinon
On dit que X suit une loi exponentielle de paramètre λ positif. De manière synthétique, on écrit :
X ∼ ε (λ).
Résultat E(X) = 1 / λ
Il est également possible de montrer que la variance vaut :
Soit une suite de variables aléatoires indépendantes, normales centrées réduites, X1, . . . ,Xp, (c’est-à-dire
de moyenne nulle et de variance égale à 1), alors la variable aléatoire
χ2p = Σpi=1 X2i est appelée variable aléatoire khi-carrée a p degrés de liberté.
Soit une variable aléatoire X normale centrée réduite, et une variable aléatoire khi-carrée χ2p à p degrés de
liberté, indépendante de X, alors la variable aléatoire
1. Pr [Z ≤ 1, 23] ;
3. Pr [Z ∈ [0, 36; 1, 23]] = F (1, 23) – F (0, 36) = 0, 8907 − 0, 6406 = 0, 2501
5. Pr [Z > 2, 65 ou Z ≤ −1, 49] = Pr [Z > 2, 65] + Pr [Z ≤ −1, 49] = 1 – F (2, 65) + F (−1, 49)
Exercice 2 : Déterminez les valeurs j de la variable normale centrée réduite Z telles que :
1. Pr [Z ≤ j] = 0, 9332 ;
2. Pr [−j ≤ Z ≤ j] = 0, 3438 ;
3. Pr [Z ≤ j] = 0, 0125 ;
4. Pr [Z ≥ j] = 0, 0125 ;
5. Pr [j ≤ Z ≤ 3] = 0, 7907.
Solution :
2. Pr [−j ≤ Z ≤ j] = 0, 3438 ⇒ F(j) −F (−j) = F(j) −1+F(j) = 2F(j) −1 = 0, 3438 ⇒ F(j) = 0, 6719 ⇒ j = 0, 45
3. Pr [Z ≤ j] = 0, 0125 ⇒ F(j) = 0, 0125(j est négatif) ⇒ 1− F(− j) = 0, 0125 ⇒ F (−j) = 0, 9875 ⇒ j = −2, 24
5. Pr [j ≤ Z ≤ 3] = 0, 7907 = F(3) − F(j) ⇒ 0, 7907 = 0, 9987− F(j) ⇒ F(j) = 0, 2080 (négatif) ⇒ F (− j) = 0, 7920
⇒ − j = 0, 81 ⇒ j = −0, 81.
Exercice 3 : Soit une variable aléatoire X ∼ N (53; σ2 = 100) représentant le résultat d’un examen pour un
étudiant d’une section. Déterminez la probabilité pour que le résultat soit compris entre 33,4 et 72,6.
∼ N (0, 1)
Pr [33, 4 ≤ X ≤ 72, 6]
= Pr [33, 4 – 53/10 ≤ X – 53/10 ≤ 72, 6 – 53/10]
= Pr [−1, 96 ≤ Z ≤ 1, 96]
= 2F (1, 96) − 1 = 2 0, 975 − 1
= 0, 95.