Bg Defs carto/stats
• L’information géographique est une information localisée. – Elle décrit
un lieu, caractérisé par un ensemble d’attributs (appelés encore
caractères). • Exemple: chaque commune du département de la Dordogne
est décrite par 3 attributs: le nombre de jeunes de moins de 25 ans, la
part (en %) de jeunes de moins de 25 ans, la population totale.
L’information est stockée dans un tableau élémentaire d’information
géographique.
• Tableau élémentaire : tableau dans lequel les éléments de l’ensemble
observé figurent en lignes et les attributs décrivant les éléments figurent
en colonnes.
• Eléments : en géographie, un élément de l’ensemble observé renvoie à
un même échelon d’observation. Les éléments décrits dans un tableau
élémentaire sont de même nature, c’est-à-dire qu’ils correspondent au
même échelon d’observation. On utilise l’indice i pour évoquer un élément
quelconque du tableau, 1 le premier élément de l’ensemble (première
ligne du tableau), n le dernier.
Ensemble observé : les éléments décrits dans un tableau élémentaire
forment un ensemble. – L’ensemble observé doit être cohérent, c’est-à-
dire qu’il doit réunir des éléments de même nature. – L’ensemble observé
est noté E. Cela peut être un département (ensemble des communes qui
figurent en ligne du tableau), un pays (ensemble de départements ou de
régions) etc.
Caractère : les éléments de l’ensemble observé sont décrits par un
attribut appelé encore caractère (par exemple la population totale). A
chaque élément de l’ensemble E correspond une modalité du caractère X
(par exemple la population de la commune d’Abjat). Si le caractère est
quantitatif, on parlera aussi de « variable » ou « indicateur ».
– Modalité : valeur ou résultat pris par un élément quelconque de
l’ensemble observé. • La modalité peut-être une mesure (caractère
quantitatif, par exemple 2334 habitants) ou une catégorie (caractère
qualitatif, par exemple le nom de chaque commune). • On note xi la
modalité de X qui décrit l’élément i.
• Un caractère est qualitatif si les opérations (faire une moyenne par
exemple) sur les modalités sont impossibles ou absurdes.
Nominal : l’ordre des modalités n’a pas de sens
Ordinal : les modalités peuvent être ordonnées
Les caractères qualitatifs peuvent exprimer une catégorie.
Plusieurs éléments du tableau d’information géographique peuvent
donc appartenir à une même catégorie
Les caractères qualitatifs peuvent exprimer un identifiant, qui peut
être numériques ou textuels (A, B, C…). Chaque élément relève d’un
unique identifiant, il y a autant de modalités différentes que
d’éléments.
Un caractère est quantitatif lorsque les modalités sont exprimées
par un nombre et lorsque le calcul de la moyenne des modalités a
un sens.
–De stock: exprime des valeurs brutes, des quantités concrètes. La
somme des modalités a un sens. Ex : Population, Superficie
–De rapport: exprime le rapport (division) entre deux stocks. La
somme des valeurs n’a pas de signification. Ex : Densité, Part
–D’échelle: caractères quantitatifs pour lesquels la modalité 0 ne
signifie pas l’absence de phénomène.
–Discret: le nombre de modalités est dénombrable a priori
–Continu: les modalités ne sont pas dénombrables, elles sont
définies sur un intervalle continu de valeurs (infinité de valeurs
possibles)
–Dans la pratique, on considère comme continus (« quasi continu »)
les caractères dont le nombre de modalités est très important.
• Distribution statistique : pour un caractère quantitatif, c’est
l’ensemble des modalités de la variable X classées en ordre
croissant
• Valeur centrale : paramètre statistique permettant de résumer
les valeurs d'une distribution par un ordre de grandeur.i
i
– Moyenne : La moyenne est une valeur centrale calculée pour les caractères
quantitatifs. Elle correspond à la somme des valeurs divisée par le nombre
d'éléments. Ex : «En moyenne, les moins de 25 ans représentent 32,5% de la
population totale des régions françaises en 2018 ».
des écarts à la moyenne est toujours égale à 0 : ∑ 𝑥 𝑋 =0 – La moyenne est la
• Propriétés – La moyenne est très sensible aux valeurs extrêmes. - La somme
valeur qui minimise la somme des écarts au carré.
• Moyenne des taux : – Pour une variable de rapport, la moyenne des taux
est construite comme une moyenne arithmétique (on additionne les taux et on
divise par le nombre d’éléments).
Taux moyen, c’est-à-dire calculé pour l'ensemble du territoire observé,
indépendamment des découpages territoriaux (on divise les effectifs calculés
pour le territoire entier par la population totale de ce territoire)
Si la moyenne des taux est supérieure au taux moyen, cela signifie qu’il y a des
éléments caractérisés par de fortes valeurs alors qu’ils ont une petite
population.
– Moyenne pondérée : • Lorsque les éléments n'ont pas le même poids (par
exemple ont des populations très différentes), on peut calculer une moyenne
pondérée • La moyenne pondérée est la somme des valeurs pondérées divisée
par la somme des valeurs qui ont servi à la pondération.
– Mode : • valeur centrale correspondant à la modalité la plus représentée
dans la distribution. – On repère la valeur modale dans le cas d'un caractère
discret– On repère la classe modale dans le cas d'un caractère continu
– Médiane: La médiane est une valeur centrale. Elle correspond à la valeur qui
partage la distribution statistique en deux sous-ensembles d'égal effectif.
• Calcul de la médiane: on travaille sur la distribution statistique avec un
classement par ordre croissant. Le rang de la médiane est égal à (N+1)/2. – Si
N est pair, la médiane est la moyenne des valeurs de rang N/2 et N/2 + 1 (par
exemple N=16 moyenne des valeurs de rang 8 et 9)
• Rédaction: la moitié des régions françaises ont plus de 21% de personnes
âgées de 65 ans et plus en 2019.
• Propriétés de la médiane : –La médiane n'est pas sensible aux valeurs
extrêmes. –Elle minimise les écarts absolus entre elle-même et l'ensemble des
valeurs (alors que la moyenne minimise les écarts quadratiques)
– La comparaison des valeurs centrales permet d'apprécier la forme de la
distribution, en particulier sa symétrie.
– Si moyenne > médiane : présence de valeurs exceptionnellement fortes,
voire d'une dissymétrie (concentration des modalités du côté des valeurs
faibles et dispersion du côté des valeurs fortes dissymétrie à gauche = étirée
à droite).
– Si moyenne < médiane : présence de valeurs exceptionnellement faibles,
voire d’une dissymétrie (concentration des modalités du côté des valeurs fortes
et dispersion du côté des valeurs faibles dissymétrie à droite = étirée à
gauche).
– Si moyenne ≈ médiane : la distribution est symétrique
• Diagrammes de distribution: On peut représenter de manière très simple
une distribution statistique au moyen d'un diagramme de distribution, qui
consiste en un diagramme présentant la répartition des valeurs en abscisse et
l’effectif en ordonnée– On interprète les zones de concentration, ou au
contraire de dispersion des valeurs, en observant l'espacement entre les
éléments sur l'axe des abscisses et l’importance des effectifs