0% ont trouvé ce document utile (0 vote)
22 vues6 pages

Election Proba

Transféré par

mc22andry
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
22 vues6 pages

Election Proba

Transféré par

mc22andry
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Le succès de Gallup dans la prédiction précise de l'élection présidentielle de 1936, malgré

l'utilisation d'un échantillon beaucoup plus petit que celui du Reader's Digest, est un exemple
frappant de l'importance de l'échantillonnage aléatoire et de la représentativité de
l'échantillon par rapport à la simple taille de l'échantillon. Décomposons les éléments clés de
cette étude et les leçons qu'elle nous enseigne sur les sondages et les statistiques.

Points clés :

1. Prédiction correcte de Gallup (élection de 1936) :


Taille de l’échantillon : Gallup a utilisé un échantillon aléatoire d’environ 3 000
électeurs .
Malgré le petit échantillon, la méthode de Gallup a fonctionné parce que son échantillon
était représentatif de la population électorale générale, ce qui signifie qu'il capturait la
diversité des électeurs en fonction de leurs caractéristiques démographiques, de leur
statut économique et de leur géographie.
L'élection a été un raz-de-marée (Franklin D. Roosevelt a remporté 61 % des voix), de
sorte que même un échantillon restreint et aléatoire a fourni à Gallup un niveau de
confiance très élevé (environ 12 écarts types par rapport à un partage égal). Cela a
rendu sa prédiction presque certaine.
2. Prédiction incorrecte du Reader's Digest :
Taille de l’échantillon : Reader’s Digest a utilisé un échantillon massif de 10 millions
d’électeurs .
Cependant, leur échantillon n'était pas représentatif de la population électorale. Les
personnes interrogées étaient principalement celles qui avaient accès au téléphone ou
à la voiture , symboles de richesse et de privilège dans les années 1930.
Cela a introduit un biais dans leur sondage car les Américains les plus riches étaient plus
susceptibles de soutenir le candidat républicain, Alf Landon, créant une prédiction
biaisée en faveur de Landon.

Pourquoi le petit échantillon de Gallup a fonctionné :

L'échantillon aléatoire de Gallup, bien que beaucoup plus petit, reflète correctement la
population. C'est un élément crucial en statistique : la qualité de l'échantillon est plus
importante que sa taille. Si un échantillon est aléatoire et représentatif, il peut produire des
résultats précis même s'il est petit.
De plus, comme l'élection de 1936 avait donné une large marge de victoire à Roosevelt, la
marge d'erreur du sondage Gallup était très faible, ce qui facilitait la prédiction d'un
vainqueur clair.

Pourquoi le grand échantillon du Reader's Digest a échoué :

L'échantillon de Reader's Digest présentait un biais de sélection . Bien qu'ils aient interrogé
10 millions de personnes, ces répondants n'ont pas été sélectionnés au hasard et ne
représentaient pas l'ensemble de la population électorale.
L'échantillonnage non aléatoire conduit à des estimations biaisées, quelle que soit la taille
de l'échantillon. Dans ce cas, ils ont suréchantillonné les individus les plus riches, qui ne
représentaient pas l'électorat américain dans son ensemble.
Les leçons du Gambit de Gallup :

1. Le hasard est crucial : un échantillon petit mais aléatoire et représentatif est préférable à
un échantillon large et biaisé.
2. La taille de l’échantillon n’est pas tout : bien qu’un échantillon plus grand réduise l’erreur
d’échantillonnage, il ne garantit pas l’exactitude si l’échantillon n’est pas représentatif.
3. Biais dans l’échantillonnage : La collecte de réponses auprès de certains groupes (par
exemple, les personnes possédant un téléphone ou une voiture dans les années 1930) peut
fausser les résultats.
4. Intervalles de confiance et marge d’erreur : Dans le cas d’élections massives, la marge
d’erreur peut être faible, offrant une grande confiance même avec des échantillons plus
petits.
5. La précision du sondage dépend de la conception de l’échantillon et de l’enquête : il ne
s’agit pas seulement du nombre de personnes interrogées, mais de la personne interrogée
et de la manière dont elle le fait.

À quoi ressemblerait le sondage Gallup lors d’une élection plus serrée ?

Si l'élection de 1936 avait été décidée par une marge beaucoup plus petite (par exemple, à 1
%), l'échantillon aléatoire de 3 000 électeurs de Gallup aurait eu une marge d'erreur plus
large, et prédire le résultat avec certitude aurait été plus difficile.
Dans des courses aussi serrées, des échantillons de petite taille pourraient ne pas suffire
à prédire avec certitude le vainqueur, et les sondages nécessiteraient des méthodes plus
précises ou des échantillons aléatoires plus grands pour fournir des prédictions exactes.

Exemple : Que se passerait-il si l'élection avait été serrée ? Supposons que 50,5 % des électeurs
soient en faveur du candidat R à la présidence. Vous interrogez un échantillon aléatoire
composé de 3 000 électeurs. Quelle est la probabilité qu'une majorité de votre échantillon soit
en faveur du candidat R ? Essayez vous-même cette solution avant de lire la solution.

Dans cet exemple, l’élection est serrée, avec 50,5 % des électeurs en faveur du candidat R, et
nous essayons de déterminer la probabilité qu’un échantillon aléatoire de 3 000 électeurs
montre une majorité en faveur du candidat R.

Solution utilisant la distribution binomiale

LaisserXXXdésignent le nombre d'électeurs dans l'échantillon qui sont en faveur du candidat R.


La distribution deXXXest binomial B(3000,0,505)B(3000, 0,505)B ( 3000 ,0,505 ).

Nous voulons estimerP(X≥1501)P(X\geq 1501)P ( X≥1501 ), qui est la probabilité qu'au moins
1501 électeurs sur 3000 dans l'échantillon soient en faveur du candidat R. Cela équivaut
àP(X>1500,5)P(X > 1500,5)P ( X>1500,5 ), nous pouvons donc utiliser une approximation
normale de la distribution binomiale.

Étape par étape :

1. Calculer la moyenne (ET[X]ANCIEN]E [):


2. ET[X]=np=3000×0,505=1515E[X] = np = 3000 \fois 0,505 = 1515E [=par
exemple=3000×0,505=1515
3. Calculer la variance (Vunl[X]Où[X]Où [ X ]):
4. Vunl[X]=np(1−p)=3000×0,505×0,495=749.925Var[X] = np(1 - p) = 3000 \fois 0,505 \fois 0,495 =
749,925Où [ X ]=par exemple ( 1−p )=3000×0,505×0,495=749.925
5. Écart type (pX\sigma_XpX​):
6. pX=749.925≈27,38\sigma_X = \sqrt{749,925} \environ 27,38pX​=749.925​≈27,38
7. Convertir 1500,5 en score z :
8. Avec=1500,5−151527,38≈−14.527,38≈−0,53z = \frac{1500,5 - 1515}{27,38} \environ
\frac{-14,5}{27,38} \environ -0,53Avec=27,381500,5−1515​≈27,38− 14,5​≈− 0,53
9. Trouver la probabilité en utilisant le score z : En utilisant une table de distribution
normale standard, la probabilité correspondant à un score z de−0,53-0,53− 0,53est
d'environ 0,2981 . Puisque nous voulons la probabilité deX≥1501X\geq 1501X≥1501, on
prend la queue supérieure :
10. P(X≥1501)=1−P(AVEC<−0,53)=1−0,2981=0,7019P(X ≤ 1501) = 1 - P(Z < -0,53) = 1 - 0,2981 =
0,7019P ( X≥1501 )=1−P ( Z<− 0,53 )=1−0,2981=0,7019

Ainsi, la probabilité qu’une majorité de l’échantillon favorise le candidat R est d’environ 70,19 % .

Solution utilisant une proportion d'échantillon

Nous pouvons également résoudre ce problème en utilisant la proportion d'échantillon


,P^\chapeau{P}P^, où la distribution de la proportion de l’échantillon est approximativement
normale.

1. Moyenne de la proportion de l'échantillon (ET[P^]E[\chapeau{P}]Et [P^]):


2. ET[P^]=p=0,505E[\hat{P}] = p = 0,505Et [P^]=p=0,505
3. Variance de la proportion de l'échantillon (Vunl[P^]Là[\hat{P}]Guerre [​P^]):
4. Vunl[P^]=p(1−p)n=0,505×0,4953000=0,000083325Var[\hat{P}] = \frac{p(1 - p)}{n} =
\frac{0,505 \times 0,495}{3000} = 0,000083325Guerre [​P^]=np ( 1−p )​=30000,505×0,495​
=0,000083325
5. Écart type de la proportion de l'échantillon (pP^\sigma_{\hat{P}}pP^​):
6. pP^=0,000083325≈0,009128\sigma_{\hat{P}} = \sqrt{0,000083325} \environ 0,009128pP^​
=0,000083325​≈0,009128
7. Convertir 0,5 en score z :
8. Avec=0,505−0,50,009128≈0,0050,009128≈0,55z = \frac{0,505 - 0,5}{0,009128} \environ
\frac{0,005}{0,009128} \environ 0,55Avec=0,0091280,505−0,5​≈0,0091280,005​≈0,55
9. Trouvez la probabilité en utilisant le score z : En utilisant une table de distribution
normale standard, la probabilité correspondant à un score z de 0,55 est d'environ 0,7088 .

Ainsi, la probabilité que la proportion de l’échantillon favorise le candidat R est d’environ 70,88
%.

Exemple : Quelle est la qualité de l'échantillon de Gallup ? Seuls 54 % de l'échantillon de Gallup


étaient favorables à Roosevelt. Supposons que 61 % des électeurs soient favorables au candidat
R à la présidence. Vous interrogez un échantillon aléatoire composé de 3 000 électeurs. Quelle
est la probabilité que 54 % ou moins de votre échantillon soit favorable au candidat R ? Essayez
vous-même avant de continuer à lire.

Cet exemple montre que l'échantillon de Gallup lors des élections de 1936 était statistiquement
inhabituel. Même si 61 % des électeurs soutenaient Roosevelt, seuls 54 % de l'échantillon de
Gallup lui ont apporté leur soutien. Il s'agit d'un écart important par rapport au résultat attendu,
ce qui suggère que l'échantillon de Gallup n'était pas parfaitement représentatif de la population
électorale.

Problème de configuration

LaisserXXXdésignent le nombre d'électeurs dans l'échantillon qui sont en faveur du candidat R


(Roosevelt). La distribution deXXXsuit une distribution binomiale B(3000,0,61)B(3000, 0,61)B (
3000 ,0,61 ), où la taille de l’échantillon est de 3000 et la probabilité qu’un électeur soutienne
Roosevelt est de 0,61.

Nous nous intéressons à la probabilité que 54 % ou moins de l’échantillon soit en faveur de


Roosevelt, c’est-à-dire,P(X≤1620)P(X \leq 1620)P ( X≤1620 ), puisque 54% des 3000 électeurs
équivalent à 1620 électeurs.

Solution utilisant la distribution binomiale

1. Valeur attendue ET[X]ANCIEN]E [:


2. ET[X]=np=3000×0,61=1830E[X] = np = 3000 \fois 0,61 = 1830E [=par
exemple=3000×0,61=1830
3. Variance Vunl[X]Où[X]Où [ X ]:
4. Vunl[X]=np(1−p)=3000×0,61×0,39=713,7Var[X] = np(1 - p) = 3000 \fois 0,61 \fois 0,39 =
713,7Où [ X ]=par exemple ( 1−p )=3000×0,61×0,39=713,7
5. Écart type pX\sigma_XpX​:
6. pX=713,7≈26,72\sigma_X = \sqrt{713,7} \environ 26,72pX​=713,7​≈26,72
7. Convertir 1620 en un score z :
8. Avec=1620.5−183026,72≈−209,526,72≈−7.84z = \frac{1620,5 - 1830}{26,72} \environ
\frac{-209,5}{26,72} \environ -7,84Avec=26,721620.5−1830​≈26,72− 209,5​≈− 7,84
9. Trouver la probabilité en utilisant le score z : En utilisant une table de distribution
normale standard, la probabilité correspondant à un score z de -7,84 est extrêmement
proche de 0 .

Ainsi,P(X≤1620)≈0P(X \leq 1620) \environ 0P ( X≤1620 )≈0, ce qui signifie qu'il est extrêmement
improbable que seulement 54 % d'un échantillon aléatoire soit en faveur de Roosevelt si 61 % de
la population totale le soutient. Cela suggère que l'échantillon de Gallup était inhabituellement
éloigné de la moyenne de la population, ce qui le rend statistiquement improbable, mais la
prédiction de Gallup a quand même réussi.

Solution utilisant une proportion d'échantillon

Nous pouvons également résoudre ce problème en utilisant la proportion d'échantillon


,P^\chapeau{P}P^.

1. Valeur attendue de la proportion de l'échantillon ET[P^]E[\chapeau{P}]Et [P^]:


2. ET[P^]=p=0,61E[\hat{P}] = p = 0,61Et [P^]=p=0,61
3. Variance de la proportion de l'échantillon Vunl[P^]Là[\hat{P}]Guerre [​P^]:
4. Vunl[P^]=p(1−p)n=0,61×0,393000=0,0000793Var[\hat{P}] = \frac{p(1 - p)}{n} = \frac{0,61
\times 0,39}{3000} = 0,0000793Guerre [​P^]=np ( 1−p )​=30000,61×0,39​=0,0000793
5. Écart type de la proportion de l'échantillon pP^\sigma_{\hat{P}}pP^​:
6. pP^=0,0000793≈0,008905\sigma_{\hat{P}} = \sqrt{0,0000793} \environ 0,008905pP^​
=0,0000793​≈0,008905
7. Convertir 0,54 en score z :
8. Avec=0,61−0,540,008905≈0,070,008905≈7.86z = \frac{0,61 - 0,54}{0,008905} \environ
\frac{0,07}{0,008905} \environ 7,86Avec=0,0089050,61−0,54​≈0,0089050,07​≈7.86
9. Trouvez la probabilité en utilisant le z-score : Un z-score de 7,86 correspond à une
probabilité extrêmement proche de 0 .

Ainsi,P(P^≤0,54)≈0P(\hat{P} \leq 0,54) \environ 0P (P^≤0,54 )≈0, confirmant que la probabilité


d’obtenir seulement 54 % de soutien dans un échantillon représentatif est essentiellement nulle
, étant donné que 61 % de la population soutient Roosevelt.

Gallup contre le Tout-Puissant Si l’élection de 1936 avait été serrée (décidée par une marge de
seulement 1 %), il y a une forte probabilité (30 % ou plus) que Gallup aurait mal prédit. Gallup
prenait-il un gros risque

Cette comparaison entre la méthode de sondage de Gallup et les pratiques des rabatteurs
illustre les différences entre une analyse statistique légitime et les tactiques douteuses souvent
employées dans les prédictions de paris. Décomposons les éléments clés de cette analogie.

Les sondages Gallup contre les arnaqueurs

1. Nature des prédictions :


Gallup : Les prévisions de Gallup sont basées sur un échantillon de population conçu
scientifiquement. Il utilise des méthodes statistiques pour fournir des prévisions
éclairées sur les résultats des élections.
Tout : Les prédictions d'un toutou sont essentiellement arbitraires et ne reposent sur
aucune analyse systématique. Le toutou emploie une stratégie consistant à prédire des
résultats différents pour différents clients, ce qui lui permet d'affirmer qu'il a raison pour
au moins la moitié de ses clients.
2. Modèle d'affaires :
Gallup : Gallup a facturé des frais d'abonnement pour accéder à ses données de
sondage et à ses prévisions. Son entreprise s'appuie sur une réputation de précision,
entretenue par la rigueur scientifique de sa méthodologie.
Tout : Le touteur demande une petite commission (par exemple, 1 $) pour une
prédiction et offre une garantie de remboursement. Le modèle du touteur exploite la
psychologie des joueurs, car ceux qui gagnent peuvent revenir pour d'autres prédictions,
souvent à des prix plus élevés.
3. Risque et fiabilité :
Gallup : Bien que les prévisions de Gallup soient basées sur un échantillonnage
statistique, il existe toujours un risque d'erreur important, en particulier lors d'élections
serrées. Par exemple, lors d'une élection serrée (décidée par une marge de 1 %), Gallup
pourrait avoir une probabilité de 30 % ou plus de faire une prédiction erronée.
Cependant, sa méthodologie vise à minimiser ce risque grâce à un échantillonnage et
une analyse minutieux.
Le rabatteur élimine efficacement les risques pour lui-même en prédisant toujours des
résultats gagnants à certains clients. Cependant, cette approche manque de crédibilité,
car elle repose sur la tromperie plutôt que sur des informations fiables. Les clients du
rabatteur sont qualifiés de « pigeons » car il est peu probable qu'ils se rendent compte
qu'ils sont trompés.
4. Fidélisation et renouvellement des clients :
Gallup : La crédibilité de Gallup repose sur la précision de ses prévisions, ce qui lui
permet de fidéliser ses clients qui font confiance à ses analyses. Si ses prévisions sont
exactes, les clients sont susceptibles de renouveler leur abonnement.
Les rabatteurs se nourrissent de la psychologie du jeu. Les clients qui gagnent grâce aux
prédictions d'un rabatteur peuvent ressentir un sentiment de loyauté ou d'espoir, ce qui
les incite à revenir pour d'autres prédictions, malgré le manque de légitimité du service
fourni.

Le facteur de risque

Gallup a peut-être pris un risque calculé dans ses prévisions, surtout si l’on s’attendait à ce
que l’élection soit serrée. Le risque d’erreur substantielle (par exemple une probabilité de 30
% de se tromper) pourrait l’amener à reconsidérer la taille de l’échantillon ou la
méthodologie.
A l'inverse, le risque du rabatteur est largement atténué par des pratiques trompeuses. En
prédisant plusieurs résultats, le rabatteur s'assure de pouvoir paraître efficace quels que
soient les résultats réels.

Vous aimerez peut-être aussi