CHAPITRE 1 : GENERALITES
1.1-Introduction
1.1.1- Définition et historique
L’origine du mot « statistique » remonte au latin classique status (état) qui, par une série
d’évolutions successives, aboutit au français statistique, attesté pour la première fois en 1771.
On peut distinguer trois phases essentielles dans l’évolution de la statistique dans le temps.
1. Depuis l’antiquité et jusqu’à la fin du 19ième siècle, la statistique est restée
principalement un ensemble de techniques de dénombrement.
2. Entre la fin du 19ème siècle et les années 1960, s’est construit, notamment à la suite de
l’école anglaise (K. Pearson, W. Gosset (Student), R. Fisher, J. Neyman.. .), la
statistique mathématique (ou statistique inférentielle).
3. Depuis les années 1960, avec le développement des outils informatiques et graphiques,
la statistique, et surtout la statistique descriptive multidimensionnelle, a connu une
expansion considérable.
La statistique est définie aujourd’hui comme étant un ensemble de méthodes visant à
collecter les données, à les traiter et à les analyser en vue de prendre des décisions.
Les méthodes en question relèvent le plus souvent des mathématiques et font largement appel
à l’outil informatique pour leur mise en œuvre.
Exemple : Si à la suite d’une analyse statistique, le Directeur d’une société constate que le
retard de ses employés est dû au manque de moyens de déplacement, il peut par exemple
augmenter les salaires ou leur accorder des prêts afin que chacun puisse disposer d’un moyen
de déplacement.
Le terme « statistique » peut aussi désigner un ensemble de données numériques concernant
une catégorie de faits.
Exemple : Les statistiques sur le chômage, les statistiques sur la réussite des étudiants de la
FaSEG, les statistiques sur la santé, les statistique du commerce extérieur, ….
En général, on classe les méthodes statistiques en deux groupes :
✓ Les méthodes descriptives (statistique descriptive)
✓ Les méthodes inférentielles (statistique mathématique ou inférentielle).
a. La statistique descriptive. On regroupe sous ce terme les méthodes dont l’objectif principal
est la description des informations ou des données étudiées ; cette description des données se
fait à travers leur présentation (la plus synthétique possible), leur représentation graphique, et
le calcul de résumés numériques. Elle donne un aperçu rapide ou une synthèse de la situation
et permet de prendre rapidement des décisions. C’est essentiellement à ces méthodes qu’est
consacré ce cours.
b. La statistique mathématique ou inférentielle. Ce terme regroupe les méthodes dont
l’objectif principal est de préciser un phénomène sur une population globale, à partir de son
observation sur une partie restreinte de cette population (échantillon) d’une certaine manière, il
s’agit donc d’induire (ou encore d’inférer) du particulier au général. Le plus souvent, ce passage
ne pourra se faire que moyennant des hypothèses de type probabiliste.
D’un point de vue méthodologique, la statistique descriptive précède en général la statistique
inférentielle dans une démarche de traitement de données : les deux aspects de la statistique se
complètent bien plus qu’ils ne s’opposent.
NB : le cours de statistique dont il s’agit ici se limitera à la statistique descriptive.
1.1.2- Domaines d’application
Le champ d'application de la statistique est très large et intéresse aussi bien les acteurs
économiques des administrations publiques et privées que les chercheurs, enseignants, etc…
La production des données statistiques et leur utilisation, souvent à la base de décisions
importantes, accentuent le caractère à la fois rigoureux et fascinant du métier de statisticien.
Posséder une compétence reconnue en statistique permet de travailler dans la plupart des
secteurs et des domaines d’activités et de recherche. Il peut s’agir des domaines comme: les
sciences sociales, la politique, le commerce, la démographie, l’environnement, la santé, le
marketing, la finance, la télécommunication, l’informatique…
1.1.3- Rôle de la statistique
La statistique est directement liée à l’action ou à la préparation de l’action. Elle joue aussi un
rôle de calmant puisqu’elle donne l’impression de comprendre la réalité complexe ou de prévoir
le futur. C’est aussi un outil de publicité ou d’intoxication. Enfin, elle reste une arme puissante
pour impressionner ou dissuader ses adversaires
1.2- vocabulaire de la statistique
Etant une discipline, la statistique possède aussi un vocabulaire que tout apprenant doit
maitriser. Il s’agit des termes ou « mot » que l’on finit par maitriser facilement à force de les
utiliser.
Population Ω (ou population statistique ou population cible): ensemble (au sens
mathématique du terme) concerné par une étude statistique. On parle parfois de champ
de l’étude. Exemple 1.3 :
1. Une étude, dans un village, portant sur le nombre d'enfants à charge par ménage aura pour
population statistique l’ensemble des ménages de ce village.
2. Si on veut connaître le régime matrimonial (séparation de biens, communauté universelle,
communauté d'acquêts) préféré par les couples au Togo, la population statistique ou population
cible sera les actes de mariage.
Individu w ε Ω (ou unité statistique) : tout élément de la population. Exemple : pour
notre étude sur le nombre d’enfants à charge par faille, l’individu ou l’unité statistique
est la famille.
Échantillon : sous ensemble de la population sur lequel sont effectivement réalisées les
observations.
Exemple 1.4 :
Supposons que l’étude portant sur le nombre d'enfants à charge par ménage, est faite dans une
ville importante, il serait impossible d’interviewer tous les ménages. Dans ce cas, seulement
une partie de l’ensemble des ménages sera interviewée.
Taille de l’échantillon n : cardinal du sous-ensemble correspondant. Exemple :
Toujours dans le cas de l’étude portant sur le nombre d’enfants à charge par ménage. Si
on suppose qu’on a interrogé seulement 25 ménages, alors la taille de l’échantillon est
25.
Enquête (statistique) : opération consistant à observer (ou mesurer, ou questionner)
l’ensemble des individus de la population ou d’un échantillon.
Recensement : enquête dans laquelle l’échantillon observé est la population toute
entière (enquête exhaustive).
Sondage : enquête dans laquelle l’échantillon observé est un sous ensemble strict de la
population (enquête non exhaustive).
Caractère ou variable est la grandeur que l'on observe sur les individus d'une
population dans une étude statistique. Exemple 1.5 : Chiffre d’affaire, le revenu, l’âge,
la catégorie socioprofessionnelle, le sexe, niveau d’instruction, milieu de résidence, …
Modalité d’un caractère désigne les différentes valeurs que prend le caractère.
L’ensemble des modalités d’un caractère doit être exhaustif ; c'est-à-dire qu’il faut
disposer d’une liste complète. Tous les cas de figure doivent être prévus et
incompatibles et chaque individu doit se placer dans une seule modalité.
Type ou nature d’un caractère ou variable. Les caractères sont classés en deux grands
types : caractères qualitatifs et caractères quantitatifs.
Un caractère est dit qualitatif si ses modalités ne sont pas mesurables. Les modalités,
dans ce cas, peuvent être constaté ou repérées par un nom ou un code. Ce type de
caractère est subdivisé en deux catégories dont :
- une variable est dite qualitative nominale quand ses modalités ne peuvent pas
être ordonnées. Exemple 1.6 : sexe, la nationalité, le milieu de résidence.
- une variable est dite qualitative ordinale quand les modalités peuvent être
ordonnées. Caractères quantitatifs. Exemple 1.7 : Niveau d’instruction,
appréciation de la performance d’un individu, …
Une variable est dite quantitative si toutes ses valeurs possibles sont numériques.
- Une variable est dite discrète, si l’ensemble des valeurs possibles est dénombrable.
Exemple 1.8 : Nombre d’enfant à charge de ménage,
- Une variable est dite continue, si l’ensemble des valeurs possibles est continu.
Exemple 1.9 : temps de réalisation d’une tâche, la taille, le poids ; la vitesse, le
revenu, le chiffre d’affaire.
1.3- différentes phases de la démarche statistique.
La démarche statistique pour aboutir à un résultat comporte, de façon sommaire :
✓ la phase de conception (définir la population statistique, faire l’échantillonnage,
répertorier les différents caractères, concevoir un questionnaire)
✓ la collecte des données (collecter les données auprès des individus)
✓ Saisir les données
✓ l’apurement (Vérifier les contrôles et traiter les cas particuliers)
✓ le traitement des données (faire le dépouillement pour produire des tableaux et des
graphiques)
✓ l’analyse des résultats
✓ la modélisation (Recherche de relations mathématiques entre les caractères ou
variables).
1.4- Quelques logiciels statistiques
Les études statistiques sont souvent complexes. C’est pour cela que l’on fait recourt à des
logiciels pour faciliter le dépouillement des données. De nos jours, il existe une panoplie de
logiciels qui permettent de faciliter la saisie et le traitement des données statistiques. Les plus
répandus sont : Excel, Access, EpiInfo, EpiData, SPSS, STATA, Eviews, STATISTICA,
SPAD,…