0% ont trouvé ce document utile (0 vote)
144 vues39 pages

Introduction à la statistique descriptive

Transféré par

fekayve
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
144 vues39 pages

Introduction à la statistique descriptive

Transféré par

fekayve
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Statistique

Licence de Géographie
Aménagement
1er année
2017-2018
Organisation du cours

• 11 séances de 2 heures :
– 9 séances de cours
– 2 séances d’évaluation (contrôle continu)

• Organisation des séances :


– 50 minutes de présentation
– 1 heure de mise en application (exercices)
Objectifs du cours

• Acquérir les notions essentielles de la statistique descriptive,


c'est-à-dire apprendre comment décrire de façon claire et
concise l'information apportée par des observations
nombreuses et variées sur un phénomène donné.

• Plus précisément, il s’agira de trier des données, de les


décrire, de les résumer sous forme de tableaux, de
graphiques, et sous forme d'un petit nombre de paramètres
clés.
Plan du cours

• Séance 1 - définition de la statistique et vocabulaire usuel


• Séance 2 - représentation de l’information : tableaux et
graphiques
• Séance 3 - mesures des inégalités
• Séance 4 - statistique descriptive univariée : les paramètres
statistiques
• Séance 5 - échantillonnage
• Séance 6, 7, 8, 9 - statistique descriptive bivariée : relation
entre deux caractères
Séance 1

Définition de la statistique et
vocabulaire usuel
I. Qu’est-ce que la statistique ? 1. Définition

• Ensemble d’outils permettant de décrire et d’analyser, de façon


quantifiée, des phénomènes repérés par des observations
nombreuses, de même nature, susceptibles d’être dénombrées et
classées.
• Elle permet :
– De créer une information systématique (observations de même nature sur
un ensemble homogène d’objets), ce qui autorise les comparaisons ;
– De traiter l’information ainsi créée (résumés graphiques, numériques,
étude de relation entre phénomènes, etc.) ;
– De connaître la fiabilité de l’information, notamment en cas de sondage ;
– De progresser vers des applications opérationnelles.
• Elle ne permet pas :
– De remplacer le raisonnement de type explicatif ;
– De remplacer la culture et les connaissances du phénomène étudié.
I. Qu’est-ce que la statistique ? 2. Confusion statistique et statistiques

• On n’entend parfois que les statistiques sont « fausses » ou


« truquées ». Cette affirmation vient de la confusion entre LA
statistique et LES statistiques.

• La statistique forme un ensemble, un corpus, d’outils destinés


à produire et analyser de l’information. Bien utilisée, elle est
rigoureuse.

• Les statistiques ou données statistiques ne sont que les


résultats numériques auxquels conduit l’application de ces
outils. Elles peuvent donc être fausses, mal interprétées ou
même détournées pour défendre un intérêt particulier.
I. Qu’est-ce que la statistique ? 3. Les deux branches de la statistique

On distingue traditionnellement deux branches dans la


statistique :

– La statistique descriptive dont l’objectif est de représenter


l’information d’une manière compréhensible et utilisable;

– La statistique inférentielle qui a pour but de fournir des


résultats relatifs à une population à partir de mesures
statistiques réalisées sur des échantillons.
I. Qu’est-ce que la statistique ? 4. Quelques jalons historiques

• Le terme statistique est issu du vocable latin status (Etat). La


statistique est au départ liée à l’idée de dénombrement,
d’inventaire et même de recensement réalisé par les États pour
des besoins économiques et militaires.
• Les débuts des recensements se situent à l’époque des grandes
civilisations antiques. Parmi les plus anciennes on peut citer celle
de Sumer (entre 3000 et 5000 Av. JC).
• L’utilisation par les États des statistiques à des fins plus élaborées
(arithmétique politique) date du milieu du XVIIème siècle et
constitue la naissance de la statistique moderne.
• Les méthodes et les lois statistiques connurent leur grand
développement au XIXème sous l’impulsion principalement de
mathématiciens (Laplace, Poisson, Pearson, etc.)
• C’est seulement au XXème siècle que la statistique devient une
science à part entière, autonome.
I. Qu’est-ce que la statistique ? 5. Statistique et géographie

• La statistique est très largement utilisée en géographie surtout


depuis les années 60 avec le développement de l’informatique :
• Les données que traite le géographe présentent certaines
particularités :
– Les individus statistiques sont fréquemment des unités spatiales, elles
sont donc géo-localisables et cartographiables.
– Ces unités spatiales sont souvent des agrégats : ensemble d’habitants,
d’entreprises etc.
• Les outils statistiques permettent au géographe de répondre à ses
questions de prédilection : quels sont les principes de
l'organisation de l'espace ? Existe-t-il des régularités, des
gradients, des spécificités locales ?
II. Vocabulaire et notation 1. Population et individu statistiques

Exemple: étude d'une région

 POPULATION STATISTIQUE
Définition: ensemble d’éléments, de
personnes, d’objets, de pays observés

Notation: Ω (dire oméga majuscule)


II. Vocabulaire et notation 1. Population et individu statistiques

Exemple: étude d'une région

 POPULATION STATISTIQUE
Définition: ensemble d’éléments, de
personnes, d’objets, de pays observés

Notation: Ω (dire oméga majuscule)


La région BFC
II. Vocabulaire et notation 1. Population et individu statistiques

Exemple: étude d'une région

 INDIVIDUS OU UNITÉS STATISTIQUES


Définition: éléments, objets, personnes
composant la population

Notation: ω (dire oméga minuscule)


II. Vocabulaire et notation 1. Population et individu statistiques

Exemple: étude d'une région

 INDIVIDUS OU UNITÉS STATISTIQUES


Définition: éléments, objets, personnes
composant la population

Notation: ω (dire oméga minuscule)


les départements
II. Vocabulaire et notation 1. Populations et individus statistiques

Exemple: étude d'une région

 TAILLE DE LA POPULATION
Définition: nombre d’individus que compte
la population

Notation: N
II. Vocabulaire et notation 1. Populations et individus statistiques

Exemple: étude d'une région

 TAILLE DE LA POPULATION
Définition: nombre d’individus que compte
la population

Notation: N
N= 8 individus (les départements)
II. Vocabulaire et notation 2. Echantillon

Exemple: étude de quelques départements

 ÉCHANTILLON
Définition: Ensemble d’individus
extraits d’une population étudiée

On les utilise quand la population est


trop importante ou le budget limité
II. Vocabulaire et notation 2. Echantillon

Exemple: étude de quelques départements

 TAILLE DE L’ÉCHANTILLON
Définition: Nombre d’individus
composant l’échantillon

Notation : n
II. Vocabulaire et notation 2. Echantillon

Exemple: étude de quelques départements

 TAILLE DE L’ÉCHANTILLON
Définition: Nombre d’individus
composant l’échantillon

Notation : n

Si je tire au hasard 5 départements français : n = 5

Le TAUX DE SONDAGE correspond au rapport : n/N

5/96=0,052 (5,2%)
II. Vocabulaire et notation 3. Caractères, modalités et série statistique

 CARACTÈRE ou VARIABLE
Définition: Données caractérisant la
population

Notation : on note la première X, la


seconde Y, etc.
II. Vocabulaire et notation 3. Caractères, modalités et série statistique

Exemple: étude d'une région

 CARACTÈRE ou VARIABLE

77 000 5 167 48 66
696 500 5 853 30 57

1 023 000 6 224 34 6

349 500 6 139 11 66

441 500 4 116 66 52

Fig. 1 : Nombre d’habitants Fig. 2 : Superficie en km2, Fig. 3 : Code géographique Fig. 4: Classement général
par département en 2008, INSEE des départements où il fait
INSEE bon vivre en 2008, L’Express
II. Vocabulaire et notation 3. Caractères, modalités et série statistique

Exemple: étude d'une région

 CARACTÈRE ou VARIABLE

77 000 5.167 48 66
696 500 5.853 30 57

1 023 000 6.224 34 6

349 500 6.139 11 66

441 500 4.116 66 52

Fig. 1 : Nombre d’habitants Fig. 2 : Superficie en km2, Fig. 3 : Code géographique Fig. 4: Classement général
par départements en 2008, INSEE des départements où il fait
INSEE bon vivre en 2008, L’Express

4 variables
II. Vocabulaire et notation 3. Caractères, modalités et série statistique

Exemple: étude d'une région

 MODALITÉ
Définition: Valeurs possibles prises par
le caractère
48
30
Caractéristiques : un individu = 1 et 1
seule modalité du caractère
34

Notation : le nombre de modalités est


généralement noté k 11

66

Fig. Code géographique


II. Vocabulaire et notation 3. Caractères, modalités et série statistique

Exemple: étude d'une région

 MODALITÉ
Définition: Valeurs possibles prises par
le caractère
48
30
Caractéristiques : un individu = 1 et 1
seule modalité du caractère
34

Notation : le nombre de modalités est


généralement noté k 11

k = 5 modalités (5 valeurs possibles) 66

Fig. Code géographique


II. Vocabulaire et notation 3. Caractères, modalités et série statistique

Exemple: étude d'une région

 DOMAINE DE LA VARIABLE
Définition: Ensemble des modalités
48
30
Notation : { }
34

11

66

Fig. Code géographique


II. Vocabulaire et notation 3. Caractères, modalités et série statistique

Exemple: étude d'une région

 DOMAINE DE LA VARIABLE
Définition: Ensemble des modalités
48
30
Notation : { }
34
Le domaine de la variable code
géographique est {11 ; 66 ; 34 ; 48 ; 30}
11

66

Fig. Code géographique


II. Vocabulaire et notation 3. 3. Caractères, modalités et série statistique

Exemple: étude d'une région

 SÉRIE STATISTIQUE
Définition: Suite des valeurs prises par
une variable X sur les individus
statistiques 48
30

Notation : le nombre d’individus est


34
noté n et les valeurs (modalités) de la
variable X sont notées : x1,…, xi,…, xk
11

66

Fig. Code géographique


II. Vocabulaire et notation 3. Caractères, modalités et série statistique

Exemple: étude d'une région

 SERIE STATISTIQUE
Définition: Suite des valeurs prises par
une variable X sur les individus
statistiques 48
30

Notation : le nombre d’individus est


34
noté n et les valeurs de la variable X
sont notés : x1,…, xi,…, xn
11
Considérons la série statistique du code
géographique : 11 66 34 48 30. On peut 66

noter : x1=11, x2=66,…,X5=30


Fig. Code géographique
II. Vocabulaire et notation 4. Typologie des variables

Exemple: étude d'une région

 TYPES DE VARIABLE
 Variable quantitative : traduit une quantité. Issue de mesure ou dénombrement

Quantitative Quantitative
discrète continue
II. Vocabulaire et notation 4. Typologie des variables

Exemple: étude d'une région

 TYPES DE VARIABLE
 Variable quantitative : traduit une quantité. Issue de mesure ou dénombrement

Quantitative Quantitative
discrète continue

Valeurs isolées et entières dans


l’intervalle de variation (ex : âge
d’un individu, nombre d’enfants
d’un ménage)
II. Vocabulaire et notation 4. Typologie des variables

Exemple: étude d'une région

 TYPES DE VARIABLE
 Variable quantitative : traduit une quantité. Issue de mesure ou dénombrement

Quantitative Quantitative
discrète continue

Valeurs isolées et entières dans Toutes valeurs possibles dans intervalle de


l’intervalle de variation (ex : âge variation (ex : taille d’un individu)
d’un individu, nombre d’enfants
d’un ménage)
II. Vocabulaire et notation 4. Typologie des variables

Exemple: étude d'une région


 TYPES DE VARIABLE
 Variable quantitative : traduit une quantité. Issue de mesure ou dénombrement

Quantitative Quantitative
discrète continue

Valeurs isolées et entières dans l’intervalle Toutes valeurs possibles dans intervalle de
de variation (ex : âge d’un individu, variation (ex : taille d’un individu)
nombre d’enfants d’un ménage)
Cette distinction est à relativiser car toute mesure est limitée en précision.
On mesure généralement la taille d’un individu au mieux en centimètres,
le nombre de valeurs possibles est donc limité.
II. Vocabulaire et notation 4. Typologie des variables

Exemple: étude d'une région

 TYPES DE VARIABLE
 Variable qualitative : traduit une qualité. Opération de catégorisation

Qualitative Qualitative
ordinale nominale
II. Vocabulaire et notation 4. Typologie des variables

Exemple: étude d'une région

 TYPES DE VARIABLE
 Variable qualitative : traduit une qualité. Opération de catégorisation

Qualitative Qualitative
ordinale nominale

Valeurs ordonnées dans un


classement hiérarchique (ex : le
rang des élèves dans une classe)
II. Vocabulaire et notation 4. Typologie des variables

Exemple: étude d'une région

 TYPES DE VARIABLE
 Variable qualitative : traduit une qualité. Opération de catégorisation

Qualitative Qualitative
ordinale nominale

Valeurs ordonnées dans un Valeurs sans aucune hiérarchie (ex:


classement hiérarchique (ex : le la couleur des yeux d’un individu)
rang des élèves dans une classe)
II. Vocabulaire et notation 4. Typologie des variables

Exemple: étude d'une région

 TYPES DE VARIABLE

77.000 5.167 48 66
696.500 5.853 30 57

1.023.000 6.224 34 6

349.500 6.139 11 66

441.500 4.116 66 52

Fig. 1 : Nombre d’habitants Fig. 2 : Superficie en km2, Fig. 3 : Code géographique Fig. 4: Classement général
par départements en 2008, INSEE des départements où il fait
INSEE bon vivre en 2008, L’Express
II. Vocabulaire et notation 4. Typologie des variables

Exemple: étude d'une région

 TYPES DE VARIABLE

77.000 5.167 48 66
696.500 5.853 30 57

1.023.000 6.224 34 6

349.500 6.139 11 66

441.500 4.116 66 52

Fig. 1 : Nombre d’habitants Fig. 2 : Superficie en km2, Fig. 3 : Code géographique Fig. 4: Classement général
par départements en 2008, INSEE des départements où il fait
INSEE bon vivre en 2008, L’Express

QUANTITATIVE QUANTITATIVE QUALITATIVE QUALITATIVE


DISCRÈTE CONTINUE NOMINALE ORDINALE
II. Vocabulaire et notation 4. Typologie des variables

 TYPES DE VARIABLE

PSEUDO
QUALITATIVE
QUANTITATIVE
ORDINALE
CONTINUE
II. Vocabulaire et notation 5. Synthèse
L’ensemble des Caractères
départements de la région
Languedoc-Roussillon
Population quantitatif qualitatif
quantitatif quantitatif qualitatif Qualitatif
discret continu nominal ordinal
Individus Nombre d’habitants Superficie (km²) Code géographique Qualité de vie
Hérault 1 023 000 6 224 34 6 ème
Gard 696 500 5 853 30 57 ème
Pyrénées orientales 441 500 4 116 66 52 ème
Aude 349500 6 139 11 66 ème
Lozère 77 000 5 167 48 66 ème

modalités

Vous aimerez peut-être aussi