100% ont trouvé ce document utile (1 vote)
901 vues5 pages

Exercice ACP

Ce document présente une analyse en composantes principales (ACP) réalisée sur des données socio-économiques de 59 pays. L'ACP révèle que le premier axe oppose les indicateurs de développement aux taux de natalité et de mortalité infantile, indiquant qu'une amélioration du développement entraîne une baisse de ces taux. Le deuxième axe est lié à la densité urbaine.

Transféré par

Achraf Dahech
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
100% ont trouvé ce document utile (1 vote)
901 vues5 pages

Exercice ACP

Ce document présente une analyse en composantes principales (ACP) réalisée sur des données socio-économiques de 59 pays. L'ACP révèle que le premier axe oppose les indicateurs de développement aux taux de natalité et de mortalité infantile, indiquant qu'une amélioration du développement entraîne une baisse de ces taux. Le deuxième axe est lié à la densité urbaine.

Transféré par

Achraf Dahech
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Support de cours AD et DM MR1 BFS-CIS élaboré par Foued Ben Said

Université De Manouba

Ecole Superieure de Commerce de Tunis

Dans le but d’analyser les variables qui permettent d’expliquer la baisse du tauxbh de la mortalité
infantile dans un pays on a réalisé une ACP sur les données socio-économiques de 59 pays. Les
variables retenues dans l’analyse sont :

Urban :People living in cities (%) : pourcentage des individus qui résident dans le milieu urbain

Density :Number of people / sq. kilometer: densité de la population par km2

Lifeexpf : Average female life expectancy : espérance de vie des femmes

Baby mort : Infant mortality (deaths per 1000 live births): Indice de mortalité infantile

GDP_cap : Gross domestic product / capita : PIB par tête

Calories : Daily calorie intake : portion calorique moyenne par jour

Birth_rt : Birth rate per 1000 people : taux de natalité

Lit_fema : Females who read (%) : pourcentage des femmes lectrices

1) Analyser le tableau des statistiques descriptives ; que pouvez-vous en déduire.


L’analyse du tableau de l’analyse uni variée indique que 50% de la population de ces pays
résident dans le milieu urbain. La densité de la population est de l’ordre de 159 individus par
km2. L’espérance de vie moyenne de l’échantillon des pays étudiés est de l’ordre de 65 ans.
Le taux de mortalité infantile est égal à 57 enfants sur 1000.
Le PIB par tête moyen est de 3107 $ par an.
L’analyse de ces résultats montre que les variables sont hétérogènes puisque elles possèdent
des unités de mesures différentes et la dispersion de ces variables significativement différente,
la dispersion passe de 11 pour la variable espérance de vie féminine à 4000 pour la variable
PIB par tête. Les variables utilisées dans cette base de données sont des variables qui
possèdent une échelle de mesure métrique, ainsi la réduction de l’espace de l’analyse
nécessite l’utilisation d’une ACP réduite calculée sur la matrice de corrélation des variables.
2) Donner et interpréter la valeur de l'indice de KMO.
L’indice de KMO affiche une valeur de 0,816. Cette valeur est qualifié méritoire et indique que
l’ACP peut être appliquée sur ces variables afin de réduire l’espace de l’analyse et révéler les
tendances latentes dans le phénomène de la mortalité infantile.


élaboré par Foued Ben Said

3) Selon le test de Bartlett que peut-on dire concernant la technique utilisée dans l'analyse.
Les hypothèses de test de bartlett sont les suivantes :
H0 : Ω=Id la matrice des corrélations est égale à la matrice identité c'est-à-dire il y absence d’une
corrélation significative entre les variables et donc l’ACP ne permet de réduire l’espace de l’analyse.
H0 : Ω≠Id sous cette hypothèse on peut appliquer l’ACP sur ces variables pour réduire l’espace de
l’analyse.
Les résultats de test de bartlett montrent que l’hypothèse nulle est rejetée la valeur de Khi-deux
calculée est égale à 422,845 avec p-value=0,000 donc la matrice des corrélation est significativement
différente de la matrice identité.
4) Calculer l'inertie totale du nuage des points.
L’inertie totale est égale à la somme des valeurs propres, puisque on a appliqué une ACP réduite qui
consiste à calculer les valeurs propres de la matrice des corrélations alors Σ aii =Σλi.
Donc l’inertie totale est égales au nombre des variables utilisées dans cette analyse.
It= Σλi.= 8.
5) Calculer l'inertie expliquée par le 1er axe principal et par le 1er plan principal.
L’inertie expliquée par le premier axe principale ou composante principale C1 est égale à λ1 = 5,191
et permet de récupérer 64,883% de la variance totale expliquée.
5,191
64,883%
∑ 8

L’inertie expliquée par le premier principal composé par C1et C2 est égale à λ1+ λ2 et la variance

expliquée par ce plan principale est 78% de la variance totale.

Selon le critère de Kaiser on retient les deux premiers axes principaux qui possèdent des valeurs

propres > 1 et permettent de récupérer plus que 75% de l’inertie initiale.

6) Déterminer à partir de la matrice de la composante les variables qui sont fortement


corrélée entre eux « variables uniquement ».
La matrice des composantes contient les coefficients de corrélation entre les variables initiales et les
nouvelles variables latentes qui sont les composantes principales. Les variables qui sont fortement
corrélées avec une composante sont corrélées entre eux.
Les variables qui sont corrélées fortement et positivement entre eux sont : Urban ; lifeexpf ;
Gdp_cap ; calories ; lit_fema. Les deux variables birth_rt et babymort sont corrélées positivement
entre eux et corrélées négativement avec les autres variables.


élaboré par Foued Ben Said

La variable density et indépendantes de toutes les autres variables.

7) Interpréter la matrice des composantes en analysant la corrélation entre chaque


composante et chaque variable.
La première composante est fortement et positivement corrélées avec Urban ; lifeexpf ; Gdp_cap ;
calories ; lit_fema. Elle est corrélée fortement et négativement avec birth_rt et babymort.
La deuxième composante est fortement et positivement corrélée avec la variable density.

8) Interpréter les résultats obtenus au premier axe.

L’analyse du graphique des variables dans le plan composé par les deux axes principaux,
montre que la première composante oppose les variables ( Urban ; lifeexpf ; Gdp_cap ; calories ;
lit_fema ) aux variables (birth_rt et babymort). Ceci indique qu’une amélioration des indicateurs de
développement entraine une baisse du taux d mortalité infantile.

9) Interpréter les résultats obtenus au deuxième axe.

La deuxième composante principale est l’axe de la densité urbaine, cet axe montra que la densité urbaine
constitue une variable de distinction entre les pays. Cet axe oppose les indicateurs de la croissance et de
l’urbanisation aux indicateurs de la culture et l’alimentation ou bien les indicateurs macro économiques
aux indicateurs individuels.

Les pays qui possèdent des indices de mortalité infantile faibles sont des pays qui ont une forte croissance
économique et un développement urbain significatif ou bien les pays qui investissent dans le progrès de la
femme dans le domaine de la culture et la nutrition.
10) Interpreter la carte des individus ( les pays).

L’analyse de la carte des individus révèle la composition de 3 groupes de pays :

- Le premier groupe (à gauche) est celui des pays qui possèdent les indicateurs de
développement les plus faibles et les taux de natalité et de mortalité infantile les plus élevés,
ces pays se situent dans l’afrique subsaharienne.
- Le deuxième groupe (en bas de la carte) est celui des pays en vois de developpement qui ont
réalisé des progrès en faveur de la femme qui ont permis de baisser les taux de mortalité
infantile.
- Le troisièmme groupe (à droite de la carte) est ceopmosé par les pays qui possèent les
indicateurs de développement les plus élevés et les taux de mortalité les plus faibles
(Espagne ; USA).


élaboré par Foued Ben Said

Descriptive Statistics
Mean Std. Deviation Analysis N
People living in cities (%) 49,76 25,186 59
Number of people / sq. kilometer 159,869 581,7396 59
Average female life expectancy 65,83 11,078 59
Infant mortality (deaths per 1000 live births) 57,729 36,9310 59
Gross domestic product / capita 3107,93 4789,315 59
Daily calorie intake 2588,81 516,132 59
Birth rate per 1000 people 31,492 11,1144 59
Females who read (%) 62,12 27,017 59
KMO and Bartlett's Test
Kaiser-Meyer-Olkin Measure of Sampling ,816
Adequacy.
Bartlett's Test of Approx. Chi-Square 422,845
Sphericity df 28
Sig. ,000

Component Matrixa
Component
1 2
People living in cities (%) ,812 ,035
Number of people / sq. kilometer ,218 ,912
Average female life expectancy ,937 -,157
Infant mortality -,938 ,134
Gross domestic product / capita ,728 ,351
Daily calorie intake ,826 ,042
Birth rate per 1000 people -,881 ,056
Females who read (%) ,859 -,228
Extraction Method: Principal Component Analysis.
a. 2 components extracted.

Total Variance Explained


Component Extraction Sums of Squared Loadings
Total % of Variance Cumulative %
dim 1 5,191 64,883 64,883
ensi 2 1,055 13,192 78,075
on0
Extraction Method: Principal Component Analysis.


élaboré par Foued Ben Said

Vous aimerez peut-être aussi