100% ont trouvé ce document utile (1 vote)
12K vues35 pages

Cours Statistiques - s2

Transféré par

cours fsjes
Copyright
© Attribution Non-Commercial (BY-NC)
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
100% ont trouvé ce document utile (1 vote)
12K vues35 pages

Cours Statistiques - s2

Transféré par

cours fsjes
Copyright
© Attribution Non-Commercial (BY-NC)
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Semestre Module Elment Enseignant

:2 : Mthodes Quantitatives : Statistiques : Mr BENMOUSSA


Elments du cours

Dfinitions et lments du vocabulaire Ralisation dun tableau statistique Graphiques statistiques de base Les caractristiques de tendance centrale et de position Les moyennes Les paramtres de dispersion La concentration Ltude de la corrlation

Numrisation & Conception

Mr Mohamed-Fadil ZIADI

Le Portail des Etudiant dEconomie

www.e-tahero.net [email protected]

Professeur BENMOUSSA

Statistiques I

Chapitre 1 : DEFINITIONS ET ELEMENTS DU VOCABULAIRE IDfinitions et objets :

La statistique est la science qui a pour objet de recueillir un ensemble de donnes numriques relatives tel ou tel phnomne alatoire et dexploiter cette information pour tablir toutes relations de causalit par lanalyse et linterprtation. Un phnomne alatoire est un phnomne comportant des variables alatoires, cest dire des variables lies au hasard et dont les valeurs ne peuvent en consquence tre connues davance. (Exemple : le nombre de points marqu par un d) On distingue : La statistique descriptive ou statistique de constatation, qui concerne les tableaux, les graphiques relatives des inventaires, des enregistrements, des recensementsetc. La mthode statistique qui concerne lensemble des procds et mthodes pour lanalyse et linterprtation. 1- Domaines dapplication : Le domaine dutilisation de la statistique est tellement tendu quil serait impossible de citer toutes les applications, mais on va citer quelques exemples : - La recherche biologique et mdicale ; - La recherche spatiale ; - Le contrle des fabrications dans lindustrie ; - Le sondage dopinion ; les enqutes de march ; - Les assurances ; - Les recherches oprationnelles ; - Ltude de la conjoncture ; - La dtermination des indices conomiques. Les sondages dopinion, en particulier, ont connu une extension considrable au cours de ces dernires annes. Les perfectionnements considrables intervenus dans le domaine des machines calculer ont contribu tendre les possibilits de la statistique.
www.e-tahero.net Z.M.F

2- Ensemble, sous-ensembles, units : Un ensemble ou rfrentiel statistique compos dlments ou dunits statistiques est dit population ou univers. Un sous-ensemble de lensemble est un chantillon. Une unit statistique doit tre dfinie sans ambigut. Elle peut comporter de nombreux caractres, ceux-ci pourront eux mme comporter plusieurs modalits.

Portail des Etudiants dEconomie

-2-

Professeur BENMOUSSA

Statistiques I

Exemple : * Ensemble de production : 135 ouvriers de lusine X ; * Echantillon : 5 ouvriers ; * Unit : 1 ouvrier de lusine X ; * Caractres : a- le salaire (modalits) b- anciennet (modalits) 3- Caractres qualitatifs et quantitatifs continus ou directs : Les caractres quantitatifs sont ceux auxquels on peut attribuer une valeur numrique. (Exemple : une taille) Les caractres qualitatifs sont ceux auxquels on peut seulement associer une valeur numrique arbitraire. (Exemple : une couleur) Un ensemble coordonn des valeurs dun caractre quantitatif constitue une suite ou srie statistique. Un caractre continu est un caractre qui peut prendre nimporte quelle valeur numrique. (Exemple : une surface, un prix) Un caractre discret ou discontinu est un caractre qui ne peut prendre que des valeurs isoles en gnral des nombres entiers. (Exemple : nombre de personnes dans une famille). Dans le cas dun caractre discontinu, linterprtation est dnue de sens. IIElaboration des statistiques :

- La collection des renseignements ; - Le recensement et sondage ; - Enqutes et questionnaires ; - Dpouillement.

www.e-tahero.net Z.M.F

Portail des Etudiants dEconomie

-3-

Professeur BENMOUSSA

Statistiques I

Chapitre 2 : REALISATION DUN TABLEAU STATISTIQUE Un tableau permet une prsentation synthtique des informations recueillies, il doit se suffire lui mme, cest pourquoi il est ncessaire quil comporte les indications suivantes : * Le titre indiquant lobjet du travail statistique ; * Lunit de mesure qui a t utilise ; * La rfrence de la source de la documentation. IPrsentation dun tableau :

Dune faon gnrale, un tableau se compose : * Dune colonne indiquant les diffrentes modalits de la variable xi ; * Dune ou plusieurs autres colonnes indiquant leffectif correspondant ces diverses modalits. Mais selon que la variable est discrte ou continue, les tableaux se prsentent de la faon suivante. 1- Tableau concernant une variable directe : Exemple : Distribution du personnel dune entreprise en fonction du nombre denfants. Nombre d'enfants xi 0 1 2 3 4 5 6 et + Effectifs ni 12 31 29 11 4 2 1 Total : 90

Remarque : Lecture du tableau :


www.e-tahero.net Z.M.F

12 membres du personnel portent zro enfant. 31 membres du personnel portent un enfant.

Portail des Etudiants dEconomie

-4-

Professeur BENMOUSSA

Statistiques I

2- Tableau concernant une variable continue : Exemple : Distribution des rceptions de marchandises en fonction du nombre de colis. Nombre de colis xi 15 6 10 11 15 16 20 21 30 31 et + Effectifs ni 20 30 60 50 30 10 Total: 200

Remarque : lecture du tableau : * Nous avons reu 20 fois des livraisons contenant des colis entre 1 et 5. * Les amplitudes peuvent tre ingales. * La colonne des xi peut tre prsente de la faon suivante : 15 5 10 10 15 etc. Mais il faut indiquer clairement la convention de bornage choisi. IINotions de frquence :

La deuxime colonne dun tableau de statistique enregistre le nombre de fois que la valeur de la variable mentionne dans la premire colonne a t rencontre. Il sagit dune frquence, note fi, et celle-ci peut apparatre sous divers aspects selon les critres retenus. 1- Frquence absolue, frquence relative :
www.e-tahero.net Z.M.F

* La frquence absolue, comme son nom lindique, donne le nombre dunits en valeurs absolues. * La frquence relative est calcule en divisant chaque frquence absolue par leffectif total de la population. En dautres termes, la frquence est exprime en valeurs relatives multiplie par 100 donne un pourcentage.

Portail des Etudiants dEconomie

-5-

Professeur BENMOUSSA

Statistiques I

Valeur de colis xi 15 6 10 11 15 16 20 21 30 31 et +

absolues 20 30 60 50 30 10 total: 200

frquences f relatives 0,1 0,15 0,3 0,25 0,15 0,05 total: 1

10 % 15 % 30 % 25 % 15 % 5% total: 100 %

Remarques : * Pour les frquences relatives, le tableau se lis comme suit : 10 % des livraisons reues contenaient entre 1 et 5 colis. * La somme des frquences relatives est toujours gale 1. 2- Frquences simples, frquences cumules : * Les frquences simples, quelles soient absolues ou relatives, indiquent comment se distribue la variable par rapport aux diffrentes modalits. * Les frquences cumules, quelles soient absolues ou relatives, indiquent comment se rpartis la variable par rapport aux diffrentes modalits. Il existe deux catgories de frquences cumules : - Les frquences cumules croissantes qui indiquent combien dunits de la population sont caractrises par une valeur infrieure ; - Les frquences cumules dcroissantes qui indiquent combien dunits de la population sont caractrises par une valeur suprieure. Valeur de colis. xi 15 6 10 11 15 16 20 21 30 31 et +

www.e-tahero.net Z.M.F

Frquences absolues Simples Cumules Croissantes Dcroissantes 20 20 200 30 50 180 60 110 150 50 160 90 30 190 40 10 200 10 200

Frquences relatives Simples Cumules Croissantes Dcroissantes 0,1 0,1 1 0,15 0,25 0,9 0,3 0,55 0,75 0,25 0,8 0,45 0,15 0,95 0,2 0,05 1 0,05 1

* 80 % des livraisons comportent moins 20 colis. * 45 % des livraisons comportent plus de 16 colis.

Portail des Etudiants dEconomie

-6-

Professeur BENMOUSSA

Statistiques I

III-

Typologie des tableaux :

Selon le nombre de variables observes sur une mme unit, plusieurs tableaux sont possibles : * Tableau simple entre cest dire qui tudie une seule variable ; * Tableau double entre cest dire qui tudie deux variables. Exemple : Statistique du personnel dune entreprise en fonction des salaires (xi) et de lge (yi).

www.e-tahero.net Z.M.F

Portail des Etudiants dEconomie

-7-

Professeur BENMOUSSA

Statistiques I

Chapitre 3 : GRAPHIQUES STATISTIQUES DE BASE

La reprsentation graphique des frquences simples ou cumules relatives une variable statistique donne lieu aux distinctions entre graphiques de distribution et graphiques de rpartition. IGraphiques de frquences simples, fonction de distribution : 1- Cas dune variable discrte ou discontinue : La reprsentation graphique des frquences simples dune variable discrte peut seffectuer sous la forme de graphique en bton. La valeur observe de la variable est porte sur laxe des abscisses de la variable, et la frquence simple correspondante est porte sur laxe des ordonns, cette dernire peut tre exprimer en valeur relative ou en valeur absolue, le bton est un segment de droite perpendiculaire laxe des abscisses (ox), de langueur ou de hauteur proportionnelle leffectif correspondant. Exemple : Distinction du personnel dune entreprise en fonction du nombre denfants. Nombre d'enfants par personne (xi) Le nombre de personnes concernes (ni) 0 12 1 31 2 29 3 11 4 6 5 3 Total : 92 ni Distribution du personnel dune entreprise en fonction du nombre denfants. 40 35 31 29 30 25 20 15 12 10 11 6 5 3 xi
0 1 2 3 4 5 6 7 8 9

www.e-tahero.net Z.M.F

Portail des Etudiants dEconomie

-8-

Professeur BENMOUSSA

Statistiques I

Remarque : Dans le cas dune variable discrte, il ne faut pas joindre les sommets des btons car par dfinition, il nexiste pas de valeurs intermdiaires entre deux positions de la variable. 2- Cas dune variable statistique continue : La reprsentation graphique des frquences simples dune variable continue peut seffectuer sous la forme dun histogramme. En portant dans laxe des abscisses les valeurs des classes du caractre, et en leur donnant les frquences correspondantes, ou reprsente la structure de la population tudie. a- Principes de construction de lhistogramme : Pour chaque classe, on lve un rectangle ayant une base proportionnelle lintervalle de classes, et hauteur proportionnelle la frquence simple. Dans ce cas, ce sont les surfaces et non les hauteurs qui sont proportionnelles leffectif. Dans la pratique deux cas peuvent se prsenter : Cas damplitude gale : Exemple : Distribution du courrier du mois de fvrier dune entreprise en fonction du nombre des lettres reues. Nombre des lettres reues (xi) 10 15 15 20 20 25 25 30 30 35 35 40 Frquences absolues (ni) 5 7 6 4 2 1 Total : 25 Amplitudes 5 5 5 5 5 5

www.e-tahero.net Z.M.F

Portail des Etudiants dEconomie

-9-

Professeur BENMOUSSA

Statistiques I

Histogramme du courrier du mois de fvrier de l'entreprise X


8 7 6 5 4 3 2 1 0 7 6 5 4 2 1 10 15 15 20 20 25 25 30 30 35 35 40

Frquences absolues (n) x

Lhistogramme est constitu par lensemble des rectangles adjacent. Nous vrifions par exemple le rectangle reprsentatif de la classe 30 35 (effectif 2) a une surface double de celle du rectangle reprsentatif de la classe 35 40 (effectif 1). Cas damplitude ingale : Dans ce cas, on respecte la proportionnalit des surfaces, il faut rectifier en consquence les hauteurs. Supposant que la distribution prcdente, sur une priode de deux mois, se prsente de la faon suivante : Nombre des lettres reues (xi) 10 15 15 20 20 25 25 35 35 40 40 45
www.e-tahero.net Z.M.F

Frquences absolues (ni) 3 9 12 18 6 3 Total : 51

Amplitude 5 5 5 10 5 5

En effet, lintervalle de la classe 25 35 est double des autres, ce qui se traduit si on ne modifie pas les frquences par une marque de proportionnalit entre les surfaces. Il convient donc de rendre les classes gales. Lamplitude de la classe 25 35 tant le double des amplitudes des autres classes, il faut avant toute reprsentation graphique de diviser par 2 la frquence correspondante de la classe.

Portail des Etudiants dEconomie

- 10 -

Professeur BENMOUSSA

Statistiques I

ni Histogramme du courrier de deux mois de lentreprise X


16 14 12 10 8 6 4 2


5 10

12 9 9 6 3 3

15

20

25

30

35

40

45

50

xi

Le segment pointill indique la transformation effectue et met en garde le lecteur sur le caractre relatif des effectifs rpartis entre les classes 25 30 et 30 35. b- Le polygone des frquences : Le polygone des frquences obtenues en joignant par des segments de droites au milieu des bases suprieurs des rectangles permet de rendre compte de la continuit de la variable. En titre dexemple, on peut prendre la figure prcdente :

ni Histogramme du courrier de deux mois de lentreprise X


16 14 12 10 8 6 4 2


5 10

12 9 9 6 3 3

www.e-tahero.net Z.M.F

15

20

25

30

35

40

45

50

xi

II-

Graphique de frquences cumules, fonction de rpartition : 1- Cas dune variable statistique directe :

Portail des Etudiants dEconomie

- 11 -

Professeur BENMOUSSA

Statistiques I

La reprsentation graphique des frquences cumules dune variable directe seffectue sous la forme de graphique en escalier. Les sauts correspondent aux valeurs possibles de la variable et ils sont gaux aux frquences cumules croissantes ou dcroissantes. Exemple : Rpartition du personnel dune entreprise en fonction du nombre denfants.

xi

0 1 2 3 4 5

Frquences absolues Simples Cumules Croissantes Dcroissantes 12 12 89 31 43 77 29 72 46 11 83 17 4 87 6 2 89 2 89

Simples 0,135 0,348 0,326 0,124 0,045 0,022 1

Frquences relatives Cumules Croissantes Dcroissantes 0,135 1 0,483 0,865 0,804 0,517 0,936 0,191 0,977 0,067 1 0,022

Rpartition croissante : ni
90 80 70 60 50 40 30 20 10

fi
0 87 83 72 90

43

12

xi

www.e-tahero.net Z.M.F

La lecture de ce graphique permet didentifier la rpartition (absolue ou relative) du personnel ayant x enfants ou moins. - Exemple : 43 salaris 48% des salaris ont un enfant ou moins.

Portail des Etudiants dEconomie

- 12 -

Professeur BENMOUSSA

Statistiques I

Rpartition dcroissante : ni
90 80 70 60 50 40 30 20 10 89

fi
0 1 77

46

17 6 2

xi

Ici les rsultats donns sont inverss, savoir x enfants ou plus. - Exemple : 77 salaris ou 86% des salaris ont un enfant ou plus. 2- Cas dune variable statistique continue : La courbe des frquences cumules croissantes se construit en portant les points correspondants chaque classe la limite suprieure de lintervalle de classes. La prsence de classes damplitude ingale nentrane aucune modification en ce qui concerne la construction de cette courbe. La courbe des frquences cumules dcroissantes se construit en portant les points correspondants chaque classe la limite infrieure de lintervalle de classes. Exemple : Soit le tableau suivant :
xi Frquences absolues Simples Cumules Croissantes 3 3 9 12 12 24 18 42 6 48 3 51 1 52 52 Frquences relatives Cumules Croissantes Dcroissantes 0,057 1 0,230 0,943 0,460 0,770 0,806 0,540 0,921 0,194 0,978 0,074 1 0,022

Simples Dcroissantes 52 49 40 28 10 4 1 0,057 0,173 0,230 0,346 0,115 0,057 0,019 1

www.e-tahero.net Z.M.F

10 15 15 20 20 25 25 35 35 40 40 45 45 50

Portail des Etudiants dEconomie

- 13 -

Professeur BENMOUSSA

Statistiques I

ni
90 80 70 60 50 40 30 20 10

52 52 49 40 28 12 3 24 10 4 1 42 48 51

10

15

20

25

30

35

40

45

50

xi

On contrle lexactitude du graphique en vrifiant que lintersection des deux courbes a pour abscisse la moiti de leffectif.

www.e-tahero.net Z.M.F

Portail des Etudiants dEconomie

- 14 -

Professeur BENMOUSSA

Statistiques I

Chapitre 4 : LES CARACTERUSTIQUES DE TENDANCE CENTRALE ET DE POSITION.

I-

Le mode : 1- Dfinition :

Le mode est la valeur de la variable qui correspond la frquence maximale. Dans le cas dune variable discontinue, le mode se dtermine de la faon suivante : Exemple : xi 0 1 2 3 4 5 ni 12 31 29 11 6 3 Total : 92

ni
40 35

30 25 20 15 10 5

31

29

12 11 6 3

www.e-tahero.net Z.M.F

xi

Donc le mode est 25, qui correspond au battons le plus lev du graphique. Dans le cas dune variable continue, le mode sapplique la classe qui correspond la frquence maximale. Celle ci sappelle classe modale .

Remarque :

Portail des Etudiants dEconomie

- 15 -

Professeur BENMOUSSA

Statistiques I

La valeur du mode dans ces conditions dpend de lamplitude des classes et quil faut vrifier lgalit des intervalles de classes. Exemple : xi 100 110 110 120 120 125 125 130 130 140 140 160 ni 8 22 18 20 12 6 Amplitude 10 10 5 5 10 20 Effectifs corrigs 8 22 36 40 12 3

Dans ce cas, la classe modale est 125 130 . Le mode = 125 + (4/ 4+28). 5 = 125,625 En gnral, la formule du mode est la suivante : d1 Mode (Mo) = l1 + .a d1 + d2 IILa mdiane : 1- Dfinition : La mdiane (M) est la valeur de la variable qui partage leffectif en deux parties gales, les lments de la population tant rongs par ordre croissant ou dcroissant. En dautre terme, la mdiane est la valeur statistique qui correspond sur la courbe cumulative une ordonne reprsentant une frquence relative 0,5 ou 50%, ce qui entrane que 50% des observations seront infrieures la mdiane et 50% seront suprieures la mdiane. a- Cas dune variable discrte ou discontinue : Il nexiste pas, en gnral, de valeur mdiane, sauf dans lhypothse o la srie possde un nombre de terme impair est connu individuellement.
www.e-tahero.net Z.M.F

Exemple : 30 4 8 10 6 12 13 15 16 4 6 8 10 12 13 15 16 30 4 termes 4 termes Mdiane

Portail des Etudiants dEconomie

- 16 -

Professeur BENMOUSSA

Statistiques I

b- Cas dune variable continue : La valeur de la mdiane peut de dterminer soit par calcul numrique, soit graphiquement. Par le calcul numrique : Lquation F (M) = 0,5 admet une solution dpendante de leffectif tudi : * Partager le total des effectifs en deux. - Si le total des frquences simples o effectif est impaire, cest dire (2n+1), le rang de la mdiane va tre gale [(2n+1) +1] / 2. - Si le total des frquences simples o effectif est paire, cest dire 2n/2 et (2n+1) / 2. * Rechercher la classe correspondante aux rangs dtermins ; * Dterminer au postulant une rpartition homogne des valeurs dans la classe la valeur de la mdiane par interpolation linaire. Exemple : Frquences Simples 6 12 25 17 5 65

Xi 1000 1500 1500 2000 2000 2500 2500 3000 3000 3500

Cumuls Croissantes 6 18 43 60 65

Dcroissantes 65 59 47 22 5

* Le rang est le suivant : [(2n+1) + 1] / 2 = 33me rang. * Recherche de la classe correspondante au 33me rang : Nous savons daprs le tableau que la valeur de 2000 correspond au 18me rang, et que la valeur de 2500 correspond au 43me rang. La valeur du 33me rang se trouve comprise entre 2000 et 2500, la classe mdiane est donc 2000 2500. La valeur exacte de la mdiane est alors dtermine par lapplication dune rgle de trois : Mdiane = 2000 + x. Calculant cette valeur de x : Sur lintervalle de cet effectif occupe donc un sous intervalle de 500/25 = 20. Pour arriver au 33me rang, il faut donc ajouter 33-18 = 15 sous intervalles. Donc x= 2015 = 300. Et puis la mdiane = 2000+300 = 2300.

www.e-tahero.net Z.M.F

Portail des Etudiants dEconomie

- 17 -

Professeur BENMOUSSA

Statistiques I

Autre solution plus simple : M = 2000 + 500 [ (33-18) / (43-18)]. M = 2300. 2- Dtermination graphique : ni
90 80 70 60 50 40 30 20 10

52 52 49 40 28 12 3 24 10 4 1 42 48 51

10

15

20

25

30

35

40

45

50

xi

Si on prend en titre dexemple ce graphique, la mdiane dans ce cas est denviron 27. Exercice : On donne la rpartition de 100 ouvriers dune entreprise selon leur salaire journalier. Salaires journaliers 80 - 120 120 - 160 160 - 200 200 - 240 Frquences cumules croissantes 10 40 80 100 Frquences cumules dcroissantes 100 90 60 20

ni 10 30 40 20 100

www.e-tahero.net Z.M.F

Mdiane = 160 + 40 [ (50-40) (80-40)] = 170. Donc50% des ouvriers touches un salaire journalier plus que 170 DHS. Et 50% des salaris touchent moins de 170 DHS.

Portail des Etudiants dEconomie

- 18 -

Professeur BENMOUSSA

Statistiques I

Chapitre 5 : LES MOYENNES Une moyenne paramtre de tendance centrale, est un nombre dont la dtermination utilise lensemble des valeurs de la variable. En rgle gnrale, une moyenne est dfinie de la faon suivante : X = 1/n [f(x1) + f(x2) + f(x3) + + f (xn)] La fonction f(x) tant une fonction continue monotone, croissante ou dcroissante. Selon lexpression de f(x), on peut distinguer la moyenne arithmtique, la moyenne gomtrique, harmonique et quadratique. ILa moyenne arithmtique : X

Cette moyenne scrit en abrg : 1- Dfinition :

a- Moyenne arithmtique simple : Si la variable statistique est donne sous forme de srie (x1, x2, x3 xn), la moyenne arithmtique est le rapport : x1 + x2 + x3 + + xn X= n Exemple : Les notes obtenues par un candidat un examen sont les suivants : 8 9 12 14 17. 8 + 9 + 12 + 14 + 17 X= 5 b- Moyenne arithmtique pondre : Lorsque la variable statistique est donne sous forme de tableau de distribution, c'est-dire quand les valeurs de la variables sont affectes de frquence, la moyenne arithmtique scrit de la faon suivante : ni xi X= ni = 550/50 = 11. = 12. = (1/n). xi

www.e-tahero.net Z.M.F

Portail des Etudiants dEconomie

- 19 -

Professeur BENMOUSSA

Statistiques I

Exemple : Notes (xi) 4 6 8 9 10 12 13 14 17 fi x i X= fi Dans le cas de variables groupes en classes, le calcule est le mme en prenant pour valeur de la variable le centre des classes. 2- Calcule en cas dune variable groupe en classes : a- Calcule par changement dorigine : La formule de la moyenne est la suivante : ni (xi x0) X = x0 + Exemple : classes 40 - 45 45 - 50 50 - 55 55 - 60 60 - 65 65 - 70 70 - 75 ni = 11/1 = 11. Effectifs (ni) 1 2 4 7 10 13 5 6 2 50 ni xi 4 12 32 63 100 156 65 84 34 550 fi 0,02 0,04 0,08 0,14 0,2 0,26 0,1 0,12 0,04 1 fi x i 0,08 0,24 0,64 1,26 2 3,12 1,3 1,68 0,68 11

www.e-tahero.net Z.M.F

ni xi xi x0 ni (xi x0) 8 42,5 -15 -120 12 47,5 -10 -120 28 52,5 -5 -140 30 57,5 0 0 58 62,5 5 290 29 67,5 10 290 7 72,5 15 105 172 305 xi, cest le centre des calasses qui est calculer comme suit : (40 + 45) / 2

Portail des Etudiants dEconomie

- 20 -

Professeur BENMOUSSA

Statistiques I

Donc : ni (xi x0) X = x0 + ni Avec : x0 = 57,5.

= 59,27.

b- Calcule par changement dchelle : Si les valeurs de la srie sont des multiples entiers dune valeur k (qui peut tre galement lintervalle de classes). Il est recommand de prendre k comme unit. ni [(xi x0) / k] X = x0 + k Exemple : classes 40 - 45 45 - 50 50 - 55 55 - 60 60 - 65 65 - 70 70 - 75 ni 8 12 28 30 58 29 7 172 ni [(xi x0) / k] X = x0 + k = 59,27. ni xi 42,5 47,5 52,5 57,5 62,5 67,5 72,5 (xi - x0)/k -3 -2 -1 0 1 2 3 ni [(xi x0) /k] - 24 - 24 - 28 0 58 58 21 61 ni

Avec : k = lamplitude. IIMoyenne gomtrique :

www.e-tahero.net Z.M.F

Lorsque les valeurs dune srie statistique varient en gros selon une progression gomtrique, il est prfrable de substituer la moyenne arithmtique la moyenne gomtrique (xG).

1- Dfinition :

Portail des Etudiants dEconomie

- 21 -

Professeur BENMOUSSA

Statistiques I

La moyenne gomtrique de n valeur positive dun caractre est la racine nime du produit de ces valeurs. xG =
n

x1.x 2.x3....xn

Exemple: Le chiffre daffaire mensuel dun nouveau produit a t au cours des six derniers mois : 256 332 432 562 731 950 . xG = 6 256 * 332 * 432 * 562 * 731 * 950 = 492. Gnralisation: Lorsque les valeurs de la variable sont affectes dune frquence, la moyenne gomtrique est donne par la formule suivante : Log xG = 1/n ( ni . log xi). Exemple : xi 2 4 8 16 12 ni 4 5 8 2 1 20 log xi 0,301 0,602 0,403 1,204 1,505 ni . log xi 1,204 3,01 7,224 2,408 1,505 15,351

En appliquant la dernire formule : Log xG = 0,76755 xG = 5,8. IIIMoyenne harmonique :

1- Dfinition :
www.e-tahero.net Z.M.F

La moyenne harmonique est linverse des moyennes arithmtiques des inverses. ni xH = IV ni 1/n

Moyenne quadratique :

Portail des Etudiants dEconomie

- 22 -

Professeur BENMOUSSA

Statistiques I

1- Dfinition : La moyenne quadratique est dfinie par la formule suivante : n i x i2 xQ = 2- Observation : Il faut savoir que : xQ x xG xH. ni

www.e-tahero.net Z.M.F

Portail des Etudiants dEconomie

- 23 -

Professeur BENMOUSSA

Statistiques I

Chapitre 6 : LES PARAMETRES DE DISPERSION.

I-

Ltendu :

Ce paramtre galement appel intervalle de variation . 1- Dfinition : Ltendu dune srie statistique est la diffrence entre la plus grande valeur et la plus petite valeur du caractre. e = xM xm. 2- Application : Soit la srie statistique suivante : xi 100 105 110 115 120 e = 120 100 = 20. 3- Commentaire : La simplicit de ce calcule ne doit pas le faire oublier que ltude est trs sensible aux fluctuations des valeurs (valeurs extrmes) qui sont souvent peu reprsentatives. Cette valeur caractristique qui correspond un concept, forme utilise dans la pratique. (Lcart entre le premier et le dernier coureur, lcart entre la meilleure et plus faible note). IILes intervalles : ni 2 15 28 16 3

www.e-tahero.net Z.M.F

Ces caractristiques permettent une mesure de dispersion qui limine linfluence des valeurs extrmes. 1- Les intervalles interquartiles : a- Dfinition : Lintervalle interquartile dune srie statistique est gal la diffrence : Q3 Q1.
Portail des Etudiants dEconomie - 24 -

Professeur BENMOUSSA

Statistiques I

xi 1000 - 1500 1500 - 2000 2000 - 2500 2500 - 3000

ni 6 8 3 1 18

ni 6 14 17 18

* Calculer Q1 : Rang = 18/4 = 4,5. Q1 = 1000 + 500 [(4,5 0) / (6 0)]. Q1 = 1375. * Calculer Q3 : Rang = (18/4).3 = 13,5. Q3 = 1500 + 500 [(13,5 6) / (14 6)]. Q3 = 1968,75. Q3 Q1 = 1968,756 1375 = 593,75. On trouve dans cet intervalle 50% des observations concentres autour de la mdiane. Plus lintervalle est rduit, plus la concentration autour des valeurs centrales est forte. IIILa variance, lcart type :

1- Dfinitions : * La variance dune srie statistique est la moyenne arithmtique des carrs des carts [ni (xi x)2] V = ni * Lcart type est la racine carre de la variance : = V 2- Application:
www.e-tahero.net Z.M.F

a- dtermination directe de la variance :

Portail des Etudiants dEconomie

- 25 -

Professeur BENMOUSSA

Statistiques I

xi 17 19 21 23 25 27 29 31

ni 1 1 2 6 5 3 2 0 20 fi x i

ni xi 17 19 42 138 125 81 58 0 480

xi - x -7 -5 -3 -1 1 3 5 7

(xi x)2 49 25 9 1 1 9 25 49

ni (xi x) 49 25 18 6 5 27 50 0 180

ni xi2 289 361 882 3174 3125 2187 1682 0 11700

X= fi

= 24. = V = 3.

Lorsquune moyenne arithmtique est une valeur entire, les calcules sont assez simples, mais la plupart du temps la moyenne est un nombre dcimal, ce qui rend llvation au carre des cart plus difficile. Lhypothse de non utilisation de machines, nous proposons les amliorations du calcul suivantes : b- Autres modes de dtermination : Expression dveloppe de la variance : (ni xi )2 x2 V = ni Calcul de la variance, formule simplifie : Comme pour la moyenne, le recours aux procds de simplification peut tre utile.
www.e-tahero.net Z.M.F

* Calcul de variance par changement dorigine : En posant une valeur arbitraire x0 (la plupart du temps cette valeur sera centrale) lexpression de la variance devient :

Portail des Etudiants dEconomie

- 26 -

Professeur BENMOUSSA

Statistiques I
2 2

ni (xi x0) ( x x0) V = ni

* Calcul de la variance en faisant un changement dchelle : Dans les sries intervalles de classes gaux, il est conseill de trouver un nombre k qui signifie en maximum lcart (xi x0). On peut alors crire : k2. ni [(xi x ) / k]2 V = ni La combinaison des deux procds de simplification permet dcrire la formule gnrale : k2. ni [(xi x0 ) / k]2 - (x x0)2 V = ni

www.e-tahero.net Z.M.F

Portail des Etudiants dEconomie

- 27 -

Professeur BENMOUSSA

Statistiques I

Chapitre 7 : LA CONCENTRATION. La notion de concentration est apparente celle de dispersion. On sait limportance tenue par lide de concentration dans les phnomnes conomiques. Soit un ensemble statistique dont chaque lment est affect dun caractre susceptible daddition. Ainsi un ensemble dindividus ou dunit de production classs selon la fortune, le revenu, les salaires verss ou les salaris occups, le chiffre daffaire, et enfin la surface exploite. Il est possible de classer ces units : * Selon leur nombre ; * Selon limportance du caractre procd. Cette distinction conduis une double figuration, c'est--dire conduire : * Un histogramme donnant le nombre des effectifs par classes ; * Un histogramme donnant limportance du caractre procd par classes. On peut partir de ces histogrammes dterminer mes mdianes. Dans lhistogramme donnant limportance du caractre procd par classes, la mdiane porte un nom spcial mdiale . La mdiale est une valeur particulire du caractre. Cette valeur du caractre est tel que tous les caractres suprieurs, constitue une moiti de la masse globale des caractres, lautre moiti tant constitue par tous les caractres infrieurs. Lanalyse de la concentration pourrait rsulter de la comparaison des deux histogrammes, plus prcisment de la mesure de lcart entre la mdiale et la mdiane. On procde cependant autrement, en exprimant les deux distributions sur un mme graphique. Ce graphique porte le nom de courbe de concentration ou courbe de GINI ou courbe de Lorenz. Cette courbe se construit partir des frquences cumules relatives en pourcentage. Dans un graphique cartsien on porte : * En abscisse, les frquences relatives cumules du nombre des effectifs (fi) ; * En ordonn, les frquences relatives cumules du caractre procd par classes. Le rsultat de la concentration est une courbe obtenue point par point. fi x i % 100% B

www.e-tahero.net Z.M.F

A 100% fi % La concavit de la concentration est toujours dirige vers le bas. La surface S sappelle laire de la concentration. Quand laire est nulle, il y a absence de concentration, quand elle est gale la surface du demis carre, il y a concentration totale. On dfinis ainsi un indice de concentration par le rapport suivant :
Portail des Etudiants dEconomie - 28 -

Professeur BENMOUSSA

Statistiques I

C = (5000 S) / 5000. (Coefficient de concentration). Cet indice varie entre 0 et 1. Exemple : Soit la distribution statistique donnant le nombre de salaris par classes de salaire. Classes Nombre de de salaire salaris (n) 0 - 10 4 oct-20 3 20 - 30 2 30 - 40 1 10 ni 4 7 9 10 nixi 20 65 115 150 fi en % 40 70 90 100 Fixi en % 13 43 76 100

xi

ni xi

fi

fi x i

5 15 25 35

20 45 50 35 150

0,4 0,3 0,2 0,1

0,13 0,3 0,33 0,23

* Construire lhistogramme donnant le nombre des effectifs par classes. ni


6 5 4 3 2 1


10

20

30

40

Classes

50

* Dterminer la mdiane : Rang : 10/2 = 5. Mdiane = 10 + 10[(5-4)/(7-4)] = 13,33. * Construire lhistogramme donnant limportance du caractre procd par classes. ni xi
www.e-tahero.net Z.M.F
60 50 40 30 20 10


10

20

30

40

Classes

50

Portail des Etudiants dEconomie

- 29 -

Professeur BENMOUSSA

Statistiques I

* Dterminer la mdiale : Rang : 150/2 = 75. Mdiale = 20 + 10 [(75 65) / (115 65)] = 22. * Que peut on dire de la diffrence : Ml Me = M. 22 13,33 = 8,66. Si M est grand par rapport au domaine de variation du caractre, la concentration est grande ; Si M est petit par rapport au domaine de variation du caractre, la concentration est petite. * Construire la courbe de concentration : fi x i % 90 43
S

13 A
S1 S2 S3

40 S1 = (40 . 13) / 2 = 260. S2 = [(13 + 43).30] / 2 = 845. S3 = [(43 + 76).20] / 2 = 1190. S4 = [(76 + 100).10] / 2 = 880. S1 + S2 + S3 + S4 = 3170.

70

1 S4 90 100%

fi %

Donc : C = (5000 3170) / 5000 = 0,36.

www.e-tahero.net Z.M.F

Portail des Etudiants dEconomie

- 30 -

Professeur BENMOUSSA

Statistiques I

Chapitre 8 : LETUDE DE LA CORRELATION. Afin de faciliter les prises de dcisions, les responsables dentreprises essayent de dterminer des indices annonciateurs du futur. Cette recherche de liaison entre les phnomnes peut tre plus ou moins confi. Par exemple, dans une entreprise, lexprience montre que le chiffre daffaire du printemps dune anne indique avec une certaine fiabilit celui de lautomne, et ceux malgr une absence apparente de cause entre les deux phnomnes. Cependant, cette vision simpliste de relations nindique pas ou mal la dure et lintensit de ces liaisons. Il est donc ncessaire de les confier. La statistique permet de rpondre ce besoin en mesurant de la relation existante entre deux phnomnes, cest la corrlation. Enfin, lexistence de corrlation entre deux phnomnes nimplique pas obligatoirement une relation causale entre ces deux phnomnes. Le chiffre daffaire du printemps de lanne n ne prsente pas la cause du chiffre daffaire de lautomne suivant, il nen est seulement quun indicateur. Le lieu de corrlation entre deux phnomnes est un lien intermdiaire : * La liaison fonctionnelle quon la note y = f(x). Par exemple la circonfrence dun cercle y est fonctionnelle de la grandeur de son rayon x . * Lindpendance totale. Par exemple lvolution du prix de lessence et celle des cotisations de la scurit sociale. Cest ce qui explique que la mthode de la corrlation se ramne au calcul de liaison fonctionnelle une approximation pr. Ca sera la dmarche de notre dveloppement : * Les droites de rgression ; * Le coefficient de corrlation. ILes nuages de points :

Il sagit des reprsentations graphiques des diffrentes courbes de deux caractres. Il permet de visualiser globalement les liens de dpendance statistique. Ce dernier, quand il existe peut tre linaire ou pas. Pour la simplicit de notre expos, nous ne traitons que la corrlation linaire. y *
www.e-tahero.net Z.M.F

y * * * * * * * * * * x Dpendance linaire forte.


- 31 -

* * * * x Dpendance linaire parfaite.


Portail des Etudiants dEconomie

Professeur BENMOUSSA

Statistiques I

II-

Les droites de rgression :

1- Remarque : Lexistence dune relation linaire ne suffit pas comme lien de cause effet. La mesure de la corrlation est purement mathmatique et peut tre effectu entre des phnomnes indpendants, il faudra donc toujours expliquer le pourquoi dune forte corrlation. Dans le cas dune srie de deux variables x et y , il est possible de considrer successivement chaque variable comme variable explique, puis comme variable explicable. Dans ces conditions, nous pouvons calculer deux droites de rgression. a- La droite de rgression de y en x dquation y = ax + b : Permettant de dterminer y connaissant x . b- La droite de rgression de x en y dquation x = ay + b : Permettant de dterminer x connaissant y . Application : Une entreprise souhaite expliquer et prvoir ses ventes y par rapport des dpenses de publicit engages x , ou au contraire dterminer les dpenses de publicit y en fonction de ces ventes x . Pour concrtiser ces notions, nous allons utiliser lexemple suivant : Dpenses de Vente "Y" Xi = xi -x publicit "X" 800 1500 -110 870 1900 -40 900 2000 -10 920 2300 10 970 2500 60 1000 3000 90 5460 13200 (xi x)2 (yi y)2

Yi =yi -y

xi yi

-700 -300 -200 100 300 800

www.e-tahero.net Z.M.F

77000 12000 2000 1000 18000 72000 182000

12100 1600 100 100 3600 8100 25600

490000 90000 40000 90000 90000 640000 1360000

1- Droite de rgression de y en x : * Choix des variables : Nous somme dans le situation suivante : lentrepreneur dsir prvoir ses ventes (Y : variable explique) par rapport des dpenses de publicit engages (X : variable explicative).

Portail des Etudiants dEconomie

- 32 -

Professeur BENMOUSSA

Statistiques I

* Caractristique de la droite y = ax + b : Lquation de cette droite se dtermine en appliquant la mthode des moindres carre. Cette droite passe par le point moyen (x , y) du nuage des points et que la valeur de sa pente (a) se dtermine par la formule suivante : (Xi Yi) a = Xi2 x = 5460/6 = 910. y = 13200 / 6 = 2200.

Xi = xi x Yi = yi y. Donc : b = 2200- (7,10 * 910) = - 4270. a = 7,1. Enfin : y = 7,1 x 4270. 2- Droite de rgression de x en y : * Choix des variables : Nous sommes dans la situation suivante : lentrepreneur veut dterminer ses dpenses de publicit (qui devient variable explique y ) en fonction de ses ventes qui devient variable explicative X . * Caractristique de la droite : Lquation de cette droite se dtermine de la faon suivante : elle passe par le point moyen(x , y) et a pour pente la formule suivante : (Xi Yi) a = Yi2 = 182000/1360000 = 0,13.

b = x - ay = 617,40. Donc: x = 0,13 + 617,40. Commentaire: Il existe donc une liaison certaine entre les deux phnomnes. Certes les dpenses de publicit expliquent correctement les ventes, mais cette dernire influence certainement les dpenses de publicits futures qui leur tour conditionnent les ventes. En gnralisant : * Droite de rgression de y en x : D (yx) ; * Droite de rgression de x en y : D (xy) ; * Graphique ; * Consquences.

www.e-tahero.net Z.M.F

Portail des Etudiants dEconomie

- 33 -

Professeur BENMOUSSA

Statistiques I

a- Le dnominateur de a est la carr de lcart type de la srie de xi (soit sa variance). De mme pour a le dnominateur reprsente la variance de la srie y . b- Les deux droites de rgression ont des coefficients directeurs a et a de mme signe. En effet, les dnominateurs de celui-ci sont toujours positifs et leurs numrateurs sont identiques. c- Les deux droites de rgression D et D ne sont confondues que dans le cas suivent : a = 1/a a.a = 1. d- Le numrateur de a et de a sont gaux, leur valeur commune (xiyi) sappelle covariance de la srie statistique. IIILe coefficient de corrlation : 1- Dfinition : Le coefficient de corrlation r est un indicateur de dpendance entre deux phnomnes. Ce concept est trs utile dans la gestion et ladministration des entreprises. Il permet dentrevoir, puis de vrifier lexistence dun bien entre des phnomnes tel que les salaires et les prix, labsentisme et taux de primes, les accidents du travail et les heures supplmentairesetc. De faon graphique, le coefficient de corrlation indique le plus ou mois grand de degr de rapprochement des deux droites de rgression. Il est dfini comme tant gale la racine carre du produit de la pente des deux droites de rgression. (r2 = aa) r= aa' . r = (Xi Yi) = Remarque: Le coefficient de corrlation : * Est un nombre sans dimension entre 0 et 1 ; * il est toujours du signe de (Xi Yi) qui peut tre positif, nul ou ngatif. Interprtation de la corrlation et de la rgression : * Lorsque les points du nuage ne sont pas aligns, le coefficient de corrlation (r) est, en valeur absolue, infrieur 1. Donc -1 < r < 1. Les deux droites de rgressions sont alors distinctes (aa < 1). * La fidlit de la reprsentation du nuage des points par les droites de rgression est fonction de la valeur des coefficients de corrlation. Plus cette dernire en valeur absolue sapproche de 1 , plus cette fidlit est importante. * si r est proche de 1 , les deux phnomnes sont en relation troite et leur sens de variation est identique : un accroissement de x correspond un accroissement de y . Comme par exemple lvolution des salaires et des prix.
Portail des Etudiants dEconomie - 34 -

(Xi2). (Yi2)

www.e-tahero.net Z.M.F

Professeur BENMOUSSA

Statistiques I

* Si r est proche -1 , les deux phnomnes sont en relation troite, et leur sens de variation est inverse. Autrement dit un accroissement de x correspond une diminution de y . * Si r est comprise entre - 0,5 et 0 ,5 , il ny a pas de vritable relation linaire entre x et y . Cela peut provenir dune indpendance ou dune relation non linaire entre les deux phnomnes x et y . Le nuage de points est dans ce cas trs indicatif. En rgle gnrale, la corrlation : - Est bonne si r 0,8. - Est moyenne si 0,5 < r< 0,8. - Est mauvaise si r< 0,5.

www.e-tahero.net Z.M.F

Portail des Etudiants dEconomie

- 35 -

Vous aimerez peut-être aussi