Introduction Au Bootstrap

Le document présente le principe du bootstrap, une méthode de rééchantillonnage utilisée pour estimer la distribution d'un estimateur lorsque la loi de l'échantillon est inconnue. Il décrit comment la loi empirique est utilisée pour créer des échantillons bootstrap et comment ces échantillons permettent d'estimer des paramètres tels que la moyenne, l'écart-type et le biais. Enfin, il souligne l'importance des propriétés asymptotiques du bootstrap pour justifier son utilisation dans les estimations statistiques.

Transféré par

LI LILI

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

30 vues3 pages

Introduction Au Bootstrap

Transféré par

LI LILI

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

1 Introduction au bootstrap

1.1 Principe du plug-in

Introduction au bootstrap
Soit x = {x1 , . . . , xn } un échantillon de taille n issue d’une loi incon-
nue F sur (Ω, A). On appelle loi empirique Fb la loi discrète des singletons
Résumé (x1 , . . . , xn ) affectés des poids 1/n :

Présentation succincte du principe du bootstrap. n

X
Fb = δxi .
Retour au plan du cours i=1

1 Introduction Soit A ∈ A, PF (A) est estimée par :

Xn
La motivation du bootstrap 1 (Efron, 1982 ; Efron et Tibshirani, 1993) est b(P )F (A) = P b (A) = 1
δxi (A) = Cardxi ∈ A.
d’approcher par simulation (Monte Carlo) la distribution d’un estimateur F n
i=1
lorsque l’on ne connaît pas la loi de l’échantillon ou, plus souvent lorsque
l’on ne peut pas supposer qu’elle est gaussienne. L’objectif est de remplacer De manière plus générale, soit θ un paramètre dont on suppose que c’est une
des hypothèses probabilistes pas toujours vérifiées ou même invérifiables par fonction de la loi F . on écrit donc θ = t(F ). Par exemple, µ = E(F ) est un
des simulations et donc beaucoup de calcul. paramètre de F suivant ce modèle. Une statistique est une fonction (mesurable)
Le principe fondamental de cette technique de ré-échantillonnage est de sub- de l’échantillon. Avec le même exemple :
stituer à la distribution de probabilité inconnue F , dont est issu l’échantillon n
d’apprentissage, la distribution empirique Fb qui donne un poids 1/n à chaque 1X
b=x=
µ xi
réalisation. Ainsi on obtient un échantillon de taille n dit échantillon bootstrap n i=1
selon la distribution empirique Fb par n tirages aléatoires avec remise parmi les
n observations initiales. et x est la statistique qui estime µ. On dit que c’est un estimateur “plug-in” et,
Il est facile de construire un grand nombre d’échantillons bootstrap sur plus généralement,
lesquels calculer l’estimateur concerné. La loi simulée de cet estimateur est
une approximation asymptotiquement convergente sous des hypothèses rai- D ÉFINITION 1. — On appelle estimateur plug-in d’un paramètre θ de F , l’es-
sonnables 2 de la loi de l’estimateur. Cette approximation fournit ainsi des estimateur obtenu en remplaçant la loi F par la loi empirique :
timations du biais, de la variance, donc d’un risque quadratique, et même des
intervalles de confiance de l’estimateur sans hypothèse (normalité) sur la vraie θb = t(Fb ).
loi.
b = E(Fb ) = x.
comme dans le cas de l’estimation de µ : µ

1. Cette appellation est inspirée du baron de Münchhausen (Rudolph Erich Raspe) qui se sortit 1.2 Estimation de l’écart-type de la moyenne
de sables mouvants par traction sur ses tirants de bottes. En France “bootstrap” est parfois traduit
par à la Cyrano (acte III, scène 13) en référence à ce héros qui prévoyait d’atteindre la lune en se Soit X une variable aléatoire réelle de loi F . On pose :
plaçant sur une plaque de fer et en itérant le jet d’un aimant.
2. Échantillon indépendant de même loi et estimateur indépendant de l’ordre des observations. µF = EF (X), et σF2 = VarF (X) = EF [(X − µF )2 ];
2 Introduction au bootstrap

Ce qui s’écrit : suivant la loi Fb ; x∗ est un ré-échantillon de x avec remise.

X∼ (µF , σF2 ).
2.2 Estimation d’un écart-type
Soit (XP
1 , . . . , Xn ) n variables aléatoires i.i.d. suivant aussi la loi F . Posons
n
X = n1 i=1 Xi . Cette variable aléatoire a pour espérance µF et pour variance D ÉFINITION 3. — On appelle estimation bootstrap de l’écart-type σc b
F (θ) de
σF /n. On dit aussi que la statistique
2
b b
θ, son estimation plug-in : σFb (θ).
X ∼ (µF , σF2 /n). Mais, à part dans le cas très élémentaire où, comme dans l’exemple ci-dessus,
Remarquons qu’en moyennant plusieurs valeurs ou observations, on réduit la θ est une moyenne, il n’y a pas de formule explicite de cet estimateur. Une ap-
b
variance inhérente à une observation. De plus, sous certaines conditions sur la proximation de l’estimateur bootstrap (ou plug-in) de l’écart-type de θ est ob-
loi F et comme résultat du théorème de la limite centrale, X converge en loi tenue par une simulation (Monte-Carlo) décrite dans l’algorithme ci-dessous.
vers la loi normale. Pour un paramètre θ et un échantillon x donnés, on note θb = s(x) l’esti-
L’estimateur plug-in de σF est défini par : mation obtenue sur cet échantillon. Une réplication bootstrap de θb est donnée
2
par : θb∗ = s(x∗ ).
b2 = σc
σ F = σF
2
b = Var b
F (X)
n A LGORITHME 1 : Estimation de l’écart-type
1X
= EFb [(X − EFb (X))2 ] = (Xi − X)2 . Soit x un échantillon et θ un paramètre.
n i=1
for b = 1 à B do
L’estimateur plug-in de σF est (légèrement) différent de celui du maximum de Sélectionner 1 échantillon bootstrap x∗b = {x∗b 1 , . . . , xn }. par tirage
∗b

vraisemblance. L’estimateur plug-in est en général biaisé mais il a l’avantage avec remise dans x.
d’être simple et de pouvoir s’appliquer à tout paramètre θ même lorsque l’on Estimer sur cet échantillon : θb∗ (b) = s(x∗b ).
ne peut pas calculer la vraisemblance du modèle. end for
Calculer l’écart-type de l’échantillon ainsi construit :
2 Estimation bootstrap d’un écart-type 1 X b∗
B
bB
σ 2
= (θ (b) − θb∗ (.))2
B−1
Soit θb = s(x) un estimateur quelconque (M.V. ou autre) de θ pour un échan- b=1
B
tillon x donné. On cherche à apprécier la précision de θb et donc à estimer son 1 X b∗
avec θb∗ (.) = (θ (b).
écart-type. B
b=1

2.1 Échantillon bootstrap

bB est l’approximation bootstrap de l’estimation plug-in recherchée de
σ
Avec les mêmes notations, Fb est la distribution empirique d’un échantillon l’écart-type de θ.
b
x = {x1 , . . . , xn }.
2.3 Estimation du biais
D ÉFINITION 2. — On appelle échantillon bootstrap de x un échantillon de
Avec les mêmes notations :
taille n noté
x∗ = {x∗1 , . . . , x∗n } θ = t(F ) et θb = s(x),
3 Introduction au bootstrap

le biais d’un estimateur s’exprime comme Le bootstrap rapidement décrit ici est dit “non-paramétrique” car la loi em-
pirique Fb est une estimation non-paramétrique de F . Dans le cas où F serait
b = EF [s(x)] − t(F ).
BF (θ) connue à un paramètre près, il existe également une version dite paramétrique
du bootstrap.
Un estimateur est sans biais si E[θ] b = θ. Le biais est aussi une mesure de la
précision d’un estimateur et on a vu que, généralement, les estimateurs plug-in Pour des estimateurs plus compliqués (fonctionnels) comme dans le cas de
étaient biaisés. la régression non-paramétrique par noyau ou spline, il est facile de construire
graphiquement une enveloppe bootstrap de l’estimateur à partir de réplications
de l’échantillon. Celle-ci fournit généralement une bonne appréciation de la
D ÉFINITION 4. — On appelle estimateur bootstrap du biais, l’estimateur
qualité de l’estimateur obtenu. Attention, dans le cas de la régression il est
plug-in :
b b en principe plus justifié de répliquer le tirage sur les résidus plutôt que sur les
BcF (θ) = BFb (θ) = EF
b
b [s(x )] − t(F ).
∗
observations. Ce sont les résidus qui sont en effet supposés i.i.d. et qui vérifient
donc les hypothèses nécessaires mais cette approche devient très sensible à
Comme pour l’écart-type, il n’existe généralement pas d’expression analytique
l’hypothèse sur la validité du modèle. Il est finalement d’usage de considérer
et il faut avoir recours à une approximation par simulation.
un échantillon bootstrap issu des données initiales (Efron et Tibshirani) :
A LGORITHME 2 : Estimation bootstrap du biais z∗b = {(x∗b1 , y1 ), . . . , (xn , yn )};
∗b ∗b ∗b

Soit x un échantillon et θ un paramètre.

for b = 1 à B do c’est ce qui a été choisi dans ce document.
Sélectionner 1 échantillon bootstrap x∗b = {x∗b 1 , . . . , x ∗b
n }. par tirage Enfin, l’estimation bootstrap est justifiée par des propriétés asymptotiques
avec remise dans x. (convergence en loi) lorsque le nombre de réplications (B) croit conjointement
Estimer sur cet échantillon la réplication bootstrap de θb : θb∗ (b) = s(x∗b ). avec la taille de l’échantillon (n). Comme la loi empirique Fb converge (en loi)
end for PB vers celle théorique, la distribution du paramètre θb = t(Fb ) converge (en loi)
Approcher EFb [s(x∗ )] par θb∗ (.) = B1 b=1 (θb∗ (b) vers celle théorique de θ = t(Fb ).
L’approximation bootstrap du biais est : Bc b b∗
B (θ) = θ (.) − θ.
b

3 Compléments
En résumé, on peut dire que le bootstrap repose sur une hypothèse très élé-
mentaire : θb∗ se comporte par rapport à θb comme θb par rapport à θ. La connais-
sance de θb∗ (distribution, variance, biais. . . ) renseigne alors sur celle de θ.
b
Beaucoup d’autres compléments sont à rechercher dans la littérature et en
particulier dans Efron et Tibshirani (1993). Il est ainsi possible de définir des
intervalles de confiance bootstrap en considérant la distribution et les quan-
tiles de θb∗ ou même encore des tests à partir des versions bootstrap de leur
statistique.

Vous aimerez peut-être aussi

Resume Outils Stats
Pas encore d'évaluation
Resume Outils Stats
12 pages
Bootstrap
Pas encore d'évaluation
Bootstrap
16 pages
Cours Bootstrap C Huber Web
Pas encore d'évaluation
Cours Bootstrap C Huber Web
47 pages
Atelier1 Bis
Pas encore d'évaluation
Atelier1 Bis
101 pages
Obtention D'Intervalles de Confiance en Reassurance Par La Methode Du Bootstrap
Pas encore d'évaluation
Obtention D'Intervalles de Confiance en Reassurance Par La Methode Du Bootstrap
20 pages
Cours5 PDF
Pas encore d'évaluation
Cours5 PDF
70 pages
Statistique Inductif
Pas encore d'évaluation
Statistique Inductif
8 pages
Méthodes de Rééchantillonnage et Validation
Pas encore d'évaluation
Méthodes de Rééchantillonnage et Validation
4 pages
Bootstrap DEA Imf
Pas encore d'évaluation
Bootstrap DEA Imf
18 pages
LucLehericy IDR Postsoutenance
Pas encore d'évaluation
LucLehericy IDR Postsoutenance
11 pages
TEI Chap2 Estimation Ponctuelle 22 23 Cours
Pas encore d'évaluation
TEI Chap2 Estimation Ponctuelle 22 23 Cours
16 pages
14-Estimation Part
Pas encore d'évaluation
14-Estimation Part
13 pages
Estimation Ponctuelle et Échantillonnage
Pas encore d'évaluation
Estimation Ponctuelle et Échantillonnage
16 pages
Estimation et Modélisation Probabiliste
Pas encore d'évaluation
Estimation et Modélisation Probabiliste
10 pages
Estimation et Échantillonnage Statistique
Pas encore d'évaluation
Estimation et Échantillonnage Statistique
16 pages
Concepts Fondamentaux de L - Estimation
Pas encore d'évaluation
Concepts Fondamentaux de L - Estimation
20 pages
AP Prentiss Age
Pas encore d'évaluation
AP Prentiss Age
90 pages
A7 Cours Non Param PDF
Pas encore d'évaluation
A7 Cours Non Param PDF
69 pages
Méthode Bootstrap et Estimation Statistique
Pas encore d'évaluation
Méthode Bootstrap et Estimation Statistique
15 pages
Cours
Pas encore d'évaluation
Cours
26 pages
Simulations et Bootstrap en Économétrie
Pas encore d'évaluation
Simulations et Bootstrap en Économétrie
82 pages
Estimation Statistique: Concepts et Méthodes
Pas encore d'évaluation
Estimation Statistique: Concepts et Méthodes
20 pages
Estimation Statistique Avancée
Pas encore d'évaluation
Estimation Statistique Avancée
14 pages
Poly Stat Inf
Pas encore d'évaluation
Poly Stat Inf
69 pages
Cours Proba-Stat ENSP 2019-2020
Pas encore d'évaluation
Cours Proba-Stat ENSP 2019-2020
11 pages
Poly DU COURS STATS
Pas encore d'évaluation
Poly DU COURS STATS
23 pages
Stat Nonp P20 Annotations
Pas encore d'évaluation
Stat Nonp P20 Annotations
132 pages
Estimation et Échantillonnage Statistique
Pas encore d'évaluation
Estimation et Échantillonnage Statistique
35 pages
Estimation de La Distribution de La Prev
Pas encore d'évaluation
Estimation de La Distribution de La Prev
15 pages
Resume Stat
Pas encore d'évaluation
Resume Stat
67 pages
SNP MH
Pas encore d'évaluation
SNP MH
77 pages
Estimation Statistique : Concepts et Méthodes
100% (1)
Estimation Statistique : Concepts et Méthodes
38 pages
Estimateur Maximum Vraisemblance-Cours
Pas encore d'évaluation
Estimateur Maximum Vraisemblance-Cours
67 pages
A2 Risque
Pas encore d'évaluation
A2 Risque
23 pages
Statistique Mathématique et Modélisation
Pas encore d'évaluation
Statistique Mathématique et Modélisation
56 pages
Chapitre 2
Pas encore d'évaluation
Chapitre 2
4 pages
Cours 1.02 - Qualité Des Estimateurs, Intervalles de Confiance Et Taille D'échantillon
100% (1)
Cours 1.02 - Qualité Des Estimateurs, Intervalles de Confiance Et Taille D'échantillon
10 pages
Poly Fisher
Pas encore d'évaluation
Poly Fisher
51 pages
Poly Statistiques Et Apprentissage
Pas encore d'évaluation
Poly Statistiques Et Apprentissage
82 pages
Introduction à la Statistique Inférentielle
Pas encore d'évaluation
Introduction à la Statistique Inférentielle
26 pages
Estimation
Pas encore d'évaluation
Estimation
8 pages
Adaptfltr 2
Pas encore d'évaluation
Adaptfltr 2
26 pages
Adaptfltr 2
Pas encore d'évaluation
Adaptfltr 2
26 pages
Estimation statistique avancée
Pas encore d'évaluation
Estimation statistique avancée
7 pages
Cours Stat Non Param
Pas encore d'évaluation
Cours Stat Non Param
27 pages
6 Estimateurs
Pas encore d'évaluation
6 Estimateurs
4 pages
Stat Nonp P20 v2 1
Pas encore d'évaluation
Stat Nonp P20 v2 1
142 pages
Chap2 2024 2025
Pas encore d'évaluation
Chap2 2024 2025
14 pages
Cours 1
Pas encore d'évaluation
Cours 1
29 pages
Chapitre 7
Pas encore d'évaluation
Chapitre 7
6 pages
Estimation Paramétrique Avancée
Pas encore d'évaluation
Estimation Paramétrique Avancée
24 pages
Chap7 Statistique Inferentielle
Pas encore d'évaluation
Chap7 Statistique Inferentielle
8 pages
Forets
Pas encore d'évaluation
Forets
19 pages
L2 Stats4 Fiche 4
Pas encore d'évaluation
L2 Stats4 Fiche 4
2 pages
Probas Chapitre3
Pas encore d'évaluation
Probas Chapitre3
14 pages
θ > X f x θ θ x x x ,: Université de Pau et des Pays de l'Adour Semestre printemps 2023-2024
Pas encore d'évaluation
θ > X f x θ θ x x x ,: Université de Pau et des Pays de l'Adour Semestre printemps 2023-2024
5 pages
FMPC
Pas encore d'évaluation
FMPC
37 pages
Exos Limite2 Belb-2
Pas encore d'évaluation
Exos Limite2 Belb-2
3 pages
CNC MP 2009 Maths 1 Corrige
Pas encore d'évaluation
CNC MP 2009 Maths 1 Corrige
7 pages
Génétique Formelle Des Organismes Haploides (Bio-Cellulaire)
Pas encore d'évaluation
Génétique Formelle Des Organismes Haploides (Bio-Cellulaire)
24 pages
Licence Mention Physique - Onisep
Pas encore d'évaluation
Licence Mention Physique - Onisep
9 pages
Béton Préfabriqué : Avantages et Techniques
Pas encore d'évaluation
Béton Préfabriqué : Avantages et Techniques
18 pages
Fonction exponentielle népérienne
Pas encore d'évaluation
Fonction exponentielle népérienne
7 pages
Fiche Poste 11 Chalumeau
67% (3)
Fiche Poste 11 Chalumeau
2 pages
Gestion des déchets au Maroc : Référentiel OCP
0% (1)
Gestion des déchets au Maroc : Référentiel OCP
29 pages
Support de Cours Delphi 5
100% (2)
Support de Cours Delphi 5
271 pages
Poele MCZ - Télécommande
Pas encore d'évaluation
Poele MCZ - Télécommande
32 pages
2 Evaluation Mathematiques Les Nombres Decimaux Cm2
Pas encore d'évaluation
2 Evaluation Mathematiques Les Nombres Decimaux Cm2
2 pages
Formations Simulateurs Minier et Construction
Pas encore d'évaluation
Formations Simulateurs Minier et Construction
37 pages
Chap. 6-Dynamique Des Fluides
Pas encore d'évaluation
Chap. 6-Dynamique Des Fluides
2 pages
CH4 - Cours SE+logiciels
Pas encore d'évaluation
CH4 - Cours SE+logiciels
6 pages
Guide Acces Supplier Portal
0% (1)
Guide Acces Supplier Portal
15 pages
Analgesie-Sedation en Prehospitalier
Pas encore d'évaluation
Analgesie-Sedation en Prehospitalier
32 pages
Guide Technique Réseau Assainissement - V Finale PDF
67% (3)
Guide Technique Réseau Assainissement - V Finale PDF
240 pages
Programme Eveil Scientifique Primaire v2
Pas encore d'évaluation
Programme Eveil Scientifique Primaire v2
2 pages
Documents Utilisés Dans L'entrepôt
Pas encore d'évaluation
Documents Utilisés Dans L'entrepôt
2 pages
Synthèse Orientation
Pas encore d'évaluation
Synthèse Orientation
50 pages
TP Pandas
Pas encore d'évaluation
TP Pandas
12 pages
Aria Giovanni Se Tape Une Copine
Pas encore d'évaluation
Aria Giovanni Se Tape Une Copine
1 page
Ch05 Exercices+Solutions
Pas encore d'évaluation
Ch05 Exercices+Solutions
25 pages
Modélisation de Nacelle par Éléments Finis
Pas encore d'évaluation
Modélisation de Nacelle par Éléments Finis
7 pages
Cours 8
100% (1)
Cours 8
28 pages
Constructions en Acier
Pas encore d'évaluation
Constructions en Acier
65 pages
50 Problemes Du Moment-1
100% (2)
50 Problemes Du Moment-1
50 pages
Introduction à la Méthode MERISE pour Systèmes d'Information
Pas encore d'évaluation
Introduction à la Méthode MERISE pour Systèmes d'Information
9 pages
Les Descripteurs en Échantillonnage Écologique
Pas encore d'évaluation
Les Descripteurs en Échantillonnage Écologique
7 pages