Université Libanaise
Faculté de Sciences
Première année CSVT
S1100
Statistique
Semestre: 2
Crédits: 3 (30 heures)
Dr Zainab Assaghir
1
Zainab Assaghir
Bureau Faculté de Sciences
Département de
Mathématiques Appliquées,
2ème étage, bureau 242
Courrier électronique [email protected]
[email protected]
2
3
Plan Général du cours
• Introduction
• Vocabulaire statistique
• Statistique Univariée
• Représentation graphique
• Représentation numérique
• Statistique Bivariée
• Représentation des données
• Régression simple
• Analyse Combinatoire et Probabilité
• Dénombrement
• Probabilité
4
Plan Général du cours
• Introduction
• Vocabulaire statistique
• Statistique Univariée
• Représentation graphique
• Représentation numérique
• Statistique Bivariée
• Représentation des données
• Régression simple
• Analyse Combinatoire et Probabilité
• Dénombrement
• Probabilité
5
Introduction
6
Définition
La statistique désigne des méthodes scientifiques qui consistent à collecter
des données, puis les analyser, commenter et critiquer les résultats.
collection saisie éditer Analyse et interprétation
des résultats
7
La statistique comprend deux branches:
• Statistique descriptive
Décrire, résumer et synthétiser les données à l’aide d’une mesure
quantitative ou d’un graphique approprié
➢ Etude du salaire des employés dans une entreprise
• Statistique inférentielle
Formuler des lois à partir de l’observation d’échantillons
➢ Comparaison des salaires avant et après une crise économique
8
Vocabulaire Statistique (1)
1) population
2) individu
3) échantillon
4) taille de l'échantillon 9
11 individus
Vocabulaire Statistique (2)
5) enquête : collection de façon organisée les informations
6) recensement : étude de toute la population
7) sondage : étude d’une partie de la population
8) variable : caractéristique décrivant l’individu – la chose qu’on étudie
9) modalité : la valeur de la variable
10) distribution statistique : ensemble des valeurs de la variable étudiée
11) données : ensemble des individus, des variables et leurs valeurs
10
Exemple 1
• La série statistique du nombre des visites de 29
patients est la suivante :
1,4,10,3,12,17,14,10,12,3,5,11,4,8,11,9,3,6,14,7,15,2,10,
12,8,13,9,12,9
1,4,10,3,12,17,14,10,12, • Population: Patients
3,5,11,4,8,11,9,3,6,14,7, • Echantillon: 29 Patients
15,2,10,12,8,13,9,12,9 • Individu: Une Patient (chaque Patient)
• Variable: nombre de visites
Données brutes
11
Table d’effectifs
Exemple 2
On observe les notes sur 100 de 320 étudiants en statistique des
étudiants de CSVT
12
Exemple 3
• On mesure le diamètre des troncs de 80 arbres dans un forêt.
13
Exemple 4
• On observe la mention obtenue (TB, B, AB) de 1100 étudiants dans
une région après l’examen de Bac.
14
Exemple 5
• On a noté le lieu de résidence (Beyrouth, Baalbek, Sud, Nord) de 500
étudiants de l’Université Libanaise.
15
Types des Variables
• Variable qualitative
➢ Variable qualitative nominale
➢ Variable qualitative ordinale
• Variable quantitative
➢ Variable quantitative discrète
➢ Variable quantitative continue
16
population
échantillon
individu
Variable
Qualitative Quantitative
Nominale Ordinale Discrète Continue
Sexe Diamètre
Rang (AB, B, TB) Nb des lits
Couleur de yeux Taille
Température (B, M, E) Nb des personnes
Lieu de naissance Poids 17
Chapitre I
Statistique Descriptive
Univariée
18
Plan du Chapitre
• Notions de base
• Les Graphiques
• Caractéristiques Numériques
• Changement de Variables
• Agrégation de plusieurs Groupes
19
Statistique Descriptive Univariée
Notions de Base
20
Effectifs - Fréquences - Pourcentages
Soit X une variable
• Effectif 𝑛𝑖 : nombre d'apparition de la valeur 𝑥𝑖 de X
• Table d’effectifs :
• Effectif total 𝑛 : le nombre
𝑘
total des individus
𝑛 = 𝑛𝑖 = 𝑛1 + 𝑛2 + ⋯ + 𝑛𝑘
𝑖=1
• Fréquence 𝑓𝑖 : 𝑓𝑖 = 𝑛𝑛𝑖, 0 ≤ 𝑓𝑖 ≤ 1 , σ𝑘𝑖=1 𝑓𝑖 = 1
• Pourcentage 𝑝𝑖 : 𝑝𝑖 = 𝑓𝑖 × 100, σ𝑘𝑖=1 𝑝𝑖 = 100
21
Effectifs - Fréquences cumulés croissants
• Effectifs cumulés croissants (ECC) et fréquences cumulées croissantes (FCC)
𝑖 𝑖
𝑁𝑖 = 𝑛𝑗 , 𝐹𝑖 = 𝑓𝑗
𝑗=1 𝑗=1
• L’ECC d’une valeur x de X représente le nombre des observations ayant une
valeur plus petite ou égale à x
22
Effectifs - Fréquences cumulés Décroissants
• Effectifs cumulés décroissants (ECD) et fréquences cumulées décroissantes (FCD)
𝑘 𝑘
𝑁𝑖↘ = 𝑛𝑗 , 𝐹𝑖↘ = 𝑓𝑗
𝑗=𝑖 𝑗=𝑖
• L’ECD de la valeur x de X représente le nombre des individus ayant une valeur de X
plus grande ou égale à x
23
Résumé
Variable
Qualitative Quantitative
Nominale Ordinale Discrète Continue
𝑛𝑖 , 𝑓𝑖 , 𝑝𝑖 𝑛𝑖 , 𝑓𝑖 , 𝑝𝑖 𝑛𝑖 , 𝑓𝑖 , 𝑝𝑖
𝑛𝑖 , 𝑓𝑖 , 𝑝𝑖
𝑁𝑖 , 𝐹𝑖 , 𝑃𝑖 𝑁𝑖 , 𝐹𝑖 , 𝑃𝑖 𝑁𝑖 , 𝐹𝑖 , 𝑃𝑖
24
• Difficulté de synthétiser les données à partir des effectifs et/ou
pourcentages
• Utiliser ces notions afin de:
➢Tracer des graphes permettant de mieux visualiser les données
➢Calculer des indicateurs numériques permettant de résumer l’information
contenue dans les données
25
Graphiques - Variable qualitative
26
Variable Qualitative Nominale et Ordinale
• Les valeurs sont des caractéristiques (modalités)
➢ nominale : les modalités ne peuvent pas être ordonnées
❑ Sexe (Mâle, Femelle)
➢ ordinale : les modalités peuvent être ordonnées
❑ Altitude (haute, moyenne, élevée)
27
Graphiques Appropriées
• Diagramme en barres
• Diagramme circulaire
28
Diagramme en Barre
• plan à deux axes
• modalités de la variable placées sur l’axe horizontale
• chaque modalité est représentée par une barre
• non orienté si la variable est nominale
• orienté si la variable est ordinale
• effectifs placés sur l’axe vertical (orienté)
• hauteur de la barre proportionnelle à l'effectif
• barres épaisses
• espace entre les barres
29
Exemple
Les groupes sanguins de 10 individus sont:
A, B, O, AB, A, O, O, B, AB, A
𝒙𝒊 𝒏𝒊 𝒇𝒊
A 3 0,3
B 2 0,3
AB 2 0,2
O 3 0,3
total 10 1
30
Diagramme Circulaire
• représenté par un disque (cercle)
• chaque modalité est représentée par un secteur
circulaire
• surface (l'angle au centre) est proportionnelle à
l'effectif correspondant.
α𝑖 = 𝑓𝑖 × 360
𝑛 𝑛𝑖
𝑝𝑖
360 α𝑖 α𝑖 = × 360
100
31
Exemple
𝒙𝒊 𝒏𝒊 𝒇𝒊 𝜶𝒊
A 3 0,3 108
B 2 0,3 72
AB 2 0,2 72
O 3 0,3 108
total 10 1 360
32
Graphiques - Variable Quantitative
33
Variable Quantitative discrète et continue
• Les valeurs sont des valeurs quantitatives
➢discrète: ensemble des valeurs fini
❑ Nombre des feuilles d’une plante
➢continue: un intervalle des valeurs réelles
❑ poids d’un individu
34
Graphiques - Variable Discrète
35
Graphiques Appropriées – Variable Discrète
• Diagramme en bâtons
• Polygone des effectifs
• Diagramme cumulatif ou en escalier
36
Diagramme en bâtons
➢ plan à deux axes
➢ ensemble des bâtons juxtaposés
➢ valeurs discrètes de X placées sur l'axe horizontale (orienté)
➢ effectifs placés sur l'axe verticale (orienté)
➢ hauteur du bâton est proportionnelle à l'effectif
37
Exemple - Diagramme en bâtons
Dans un quartier de 50 ménages on a observé le nombre de personnes
par ménage
Données Brutes
Table d’effectifs
38
Exemple - Suite
Diagramme en Bâtons
39
Polygone des effectifs
• Joindre les sommets des bâtons
40
Diagramme Cumulatif
➢visualiser les effectifs cumulés et permet de déterminer le nombre, ou la
proportion, d'observations inférieures (ou supérieures) ou égales à une valeur
donnée de la série.
Dans un diagramme cumulatif:
➢ valeurs de X figurent en abscisse.
➢ effectifs cumulés figurent en ordonnée.
➢ en face de chaque observation figure un point dont l'ordonnée est égale à l'effectif cumulé correspondant.
➢ différents points sont joints par des segments horizontaux entre deux observations consécutives.
41
Exemple
42
Graphiques Variable Continue
43
Graphiques Appropriées – Variable Continue
• Histogramme
• Polygone des effectifs
• Polygone des effectifs cumulés
44
Notions
• peut prendre une infinité de valeurs
• chaque valeur est un intervalle (classe [𝐶𝑖− , 𝐶𝑖+ ])
• amplitude de la classe 𝑎𝑖 = 𝐶𝑖+ − 𝐶𝑖−
𝐶𝑖− +𝐶𝑖+
• centre de la classe 𝐶𝑖 =
2
45
Histogramme
• plan à deux axes
• ensemble des rectangles juxtaposés
• chaque rectangle associé à chaque classe a une surface
proportionnelle à l'effectif
• Amplitudes égales : effectifs 𝑛𝑖 sur l’axe vertical
𝑛
• Amplitudes différentes : densité 𝑑𝑖 = 𝑖 sur l’axe verticale
𝑎𝑖
• bornes des classes de X placées sur l’axe horizontal
• effectifs ou densité placées sur l’axe vertical
46
Exemple – Amplitudes égales
Attention
à l’échelle
47
Exemple – Amplitudes différentes
48
Polygone des effectifs
• Amplitudes égales
❑ Joindre les points de coordonnées (𝐶𝑖 , 𝑛𝑖 )
• Amplitudes différentes
❑ découper les classes pour avoir des classes avec des amplitudes égales
❑ joindre ensuite les points de coordonnées (𝐶𝑖 ′, 𝑛𝑖 ). 𝐶𝑖 ′ est le centre de la
nouvelle classe.
❑ choisir une amplitude commune à l’aide du pgcd.
49
Exemple – Amplitude égales
50
Exemple – Amplitudes différentes
51
Polygone des effectifs cumulés
Joindre les points dont :
• l'abscisse est la borne supérieure de la classe
• l'ordonnée est l'effectif cumulé de cette classe.
✓ Même procédure pour les classes à amplitudes égales
et celles à amplitudes non égales
52
Exemple – Effectifs cumulés croissants
53
Exemple – Effectifs cumulés décroissants
54
Groupement des Données (1)
• généralement pour les variables quantitatives de type continu
• chaque individu donne une valeur pour la variable X
• les réponses sont souvent des valeurs séparées
• on est parfois amené à grouper les valeurs de la variable X en classes
55
Groupement des Données (2)
• définir le nombre de classes 𝑘
• définir l'amplitude de chaque classe
Le nombre optimal des classes 𝑘 vérifie:
ln 𝑛
2𝑘 ≥ 𝑛 ⟹ 𝑘 ln 2 ≥ ln 𝑛 ⟹ 𝑘 ≥
ln 2
L'amplitude vaut: maximum minimum
𝑥 𝑛 −𝑥 1
𝑎𝑖 ≥
𝑘
56
Exemple
Les salaires de 12 ouvriers :
315; 423; 300; 548; 374; 452; 463; 339; 324; 432; 315; 450
classes effectif
• 𝑛 =12 300-362 5
• 𝑥 𝑛 = 548 362-424 2
• 𝑥 1 = 300 424-486 4
ln 12
•𝑘≥ = 3,58 alors 𝑘 = 4 486-548 1
ln 2
• 𝑎𝑖 = 62 total 12
57