Estimation

Transféré par

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

59 vues3 pages

Estimation

Transféré par

Quentin Kere

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Estimation par Noyaux pour Données Discrètes

Quentin KERE

2024

Introduction

L’estimation par noyau est une méthode non paramétrique qui permet d’estimer une fonction
inconnue à partir d’un ensemble de données. Pour les données continues, il s’agit d’estimer
une densité de probabilité, mais pour les données discrètes, on s’intéresse à l’estimation des
fonctions de masse de probabilité (fmp). Le problème de base est que, pour un ensemble de
données discrètes, l’estimation directe de la fmp à partir des fréquences observées peut être
imprécise, surtout pour de petits échantillons. Ainsi, l’utilisation de noyaux permet de lisser
les données, en tenant compte à la fois de la nature discrète et de la distribution locale des
observations.

Estimateurs à noyaux continus classiques

Les estimateurs à noyaux classiques sont principalement conçus pour des données continues.
L’idée est de lisser une série de points de données x1 , x2 , · · · , xn pour obtenir une estimation
lisse de la densité de probabilité à un point donné x. L’estimateur à noyau pour les données
continues est défini par :
1 Xn
x − xi

ˆ
f (x) = K
nh i=1 h
Ici :

• fˆ(x) est l’estimation de la densité au point x,

• n est le nombre d’observations,
• h est la bande-passante (paramètre de lissage), qui contrôle à quel point les observations
sont lissées,
• K(·) est une fonction noyau, telle que le noyau de Gauss, Epanechnikov, ou encore
uniforme.

1
Choix du noyau

Le noyau K(·) est généralement choisi pour être une fonction de densité symétrique. Par
exemple, pour le noyau gaussien, on a :
1
!
u2
K(u) = √ exp −
2π 2
La performance de l’estimateur dépend fortement du choix de la bande-passante h. Un h
trop petit provoque un surajustement aux données, tandis qu’un h trop grand conduit à une
sous-estimation de la variabilité des données.

Estimateurs à noyaux pour données discrètes

Dans le cas des données discrètes, comme les comptages ou des observations finies,
l’utilisation directe des noyaux continus est inadéquate. En effet, les données discrètes
nécessitent des noyaux adaptés à leur nature discrète. Dans ce contexte, on utilise des
noyaux associés discrets pour mieux capter les propriétés des données. L’estimateur à noyau
pour les données discrètes est donné par la formule suivante :
1X n
fˆb (x) = Kx,h (xi )
n i=1
où Kx,h est un noyau associé discret, qui est défini spécifiquement pour des points discrets
xi , et h est toujours le paramètre de lissage.

Approche bayésienne globale

L’approche bayésienne repose sur l’idée d’utiliser l’information a priori pour estimer la
fonction de masse de probabilité, en plus des données observées. Dans le cadre bayésien,
l’estimation de la fonction de masse de probabilité nécessite l’intégration de la loi a priori et
la vraisemblance conditionnelle pour obtenir une loi a posteriori.

Estimation de la vraisemblance conditionnelle

La vraisemblance conditionnelle pour une série d’observations x1 , x2 , · · · , xn est définie par :

n
L(x1 , x2 , · · · , xn ; h) = fˆb (xi )
Y

i=1

où fˆb (x) est l’estimateur à noyau associé discret de la fmp.

2
Théorème de Bayes

Selon le théorème de Bayes, la loi a posteriori de h, qui représente le paramètre de lissage,

est donnée par :

π(h|x1 , x2 , · · · , xn ) ∝ L(x1 , x2 , · · · , xn ; h)π(h)

où : - π(h|x1 , x2 , · · · , xn ) est la distribution a posteriori de h, - L(x1 , x2 , · · · , xn ; h) est
la vraisemblance des observations données h, - π(h) est la distribution a priori de h. Cette
approche permet d’incorporer une incertitude sur le paramètre de lissage h, en tenant compte
des données disponibles ainsi que de l’information a priori sur h. En pratique, cela se traduit
par une estimation plus robuste de la fmp, particulièrement lorsque le nombre d’observations
est limité.

Sélection de la bande-passante

Le choix de la bande-passante h est crucial dans l’estimation par noyau. Un choix adéquat
permet de trouver un équilibre entre le biais et la variance de l’estimation. La méthode de
base pour sélectionner h repose sur l’optimisation de l’erreur quadratique intégrée moyenne
(MSE), qui mesure la différence entre la fmp estimée et la vraie fmp. La MSE est définie
comme suit : 2
ˆ
MSE(h) = E fb (x) − f (x)

où f (x) est la vraie fonction de masse de probabilité. Cette expression est décomposée en
deux parties : le biais au carré et la variance de l’estimation :

MSE(h) = Biais2 + Variance

L’objectif est de minimiser la MSE en ajustant h. Plus précisément, une bande-passante
h trop petite entraîne une faible variance mais un fort biais, alors qu’une h trop grande
entraîne un faible biais mais une forte variance. Des techniques comme la validation croisée
ou des méthodes de type plug-in sont utilisées pour choisir h.

Validation croisée pour le choix de la bande-passante

Une méthode couramment utilisée pour sélectionner h est la validation croisée, qui consiste
à diviser les données en sous-ensembles, à estimer la fmp sur un sous-ensemble et à évaluer
l’erreur sur un autre sous-ensemble. Cela permet d’obtenir une estimation plus objective de
la bande-passante optimale. L’erreur de validation croisée (CVE) est calculée par :
1X n
fˆ−i,h (xi ) − f (xi )
2
CVE(h) =
n i=1

où fˆ−i,h (xi ) est l’estimation de la fmp à xi sans inclure l’observation xi elle-même.

Vous aimerez peut-être aussi

STAT2150 Transp
Pas encore d'évaluation
STAT2150 Transp
39 pages
Cours Noyau Bon
Pas encore d'évaluation
Cours Noyau Bon
37 pages
Estimation Bayésienne à Noyau
Pas encore d'évaluation
Estimation Bayésienne à Noyau
45 pages
Khawla Mihi
Pas encore d'évaluation
Khawla Mihi
53 pages
Baia Ikram
Pas encore d'évaluation
Baia Ikram
56 pages
L3 Projet
Pas encore d'évaluation
L3 Projet
20 pages
JSFS 1999 140 1 41 0
Pas encore d'évaluation
JSFS 1999 140 1 41 0
28 pages
Chapitre 2
Pas encore d'évaluation
Chapitre 2
4 pages
Chapitre 3
Pas encore d'évaluation
Chapitre 3
13 pages
Chapitre 3-2019-2020 PDF
Pas encore d'évaluation
Chapitre 3-2019-2020 PDF
12 pages
Chap 2
Pas encore d'évaluation
Chap 2
26 pages
Estimation et Modélisation Probabiliste
Pas encore d'évaluation
Estimation et Modélisation Probabiliste
10 pages
Mat Sta 04-21
Pas encore d'évaluation
Mat Sta 04-21
47 pages
Concepts Fondamentaux de L - Estimation
Pas encore d'évaluation
Concepts Fondamentaux de L - Estimation
20 pages
Cours 1
Pas encore d'évaluation
Cours 1
51 pages
Estimation Statistique Simplifiée
100% (1)
Estimation Statistique Simplifiée
30 pages
Peg Estimation
Pas encore d'évaluation
Peg Estimation
7 pages
Cours5 PDF
Pas encore d'évaluation
Cours5 PDF
70 pages
Cours Estimation 2019
Pas encore d'évaluation
Cours Estimation 2019
53 pages
Mini Projet L3 - Copie
Pas encore d'évaluation
Mini Projet L3 - Copie
7 pages
Estimation Statistique : Concepts et Exemples
100% (1)
Estimation Statistique : Concepts et Exemples
3 pages
Poly DU COURS STATS
Pas encore d'évaluation
Poly DU COURS STATS
23 pages
Statistique Non Paramétrique 101
Pas encore d'évaluation
Statistique Non Paramétrique 101
35 pages
Thèse
Pas encore d'évaluation
Thèse
52 pages
Bayesstat
Pas encore d'évaluation
Bayesstat
16 pages
Chap3 DE
Pas encore d'évaluation
Chap3 DE
12 pages
Estimateurs Ponctuels-Students
Pas encore d'évaluation
Estimateurs Ponctuels-Students
26 pages
Chapitre 9 Estimation Spectrale Presentation
100% (1)
Chapitre 9 Estimation Spectrale Presentation
24 pages
Estimation Non Paramétrique de La Densité de Probabilité Et de La Fonction de Répartition Par Des Séries Orthogonales
Pas encore d'évaluation
Estimation Non Paramétrique de La Densité de Probabilité Et de La Fonction de Répartition Par Des Séries Orthogonales
88 pages
Statistiques Cours Chapitre 3
Pas encore d'évaluation
Statistiques Cours Chapitre 3
7 pages
Chap2 2024 2025
Pas encore d'évaluation
Chap2 2024 2025
14 pages
Estimation et propriétés des estimateurs
Pas encore d'évaluation
Estimation et propriétés des estimateurs
17 pages
Estimation par noyau en statistiques
Pas encore d'évaluation
Estimation par noyau en statistiques
4 pages
Wa0002.
Pas encore d'évaluation
Wa0002.
31 pages
Estimation statistique avancée
Pas encore d'évaluation
Estimation statistique avancée
7 pages
ESTIMATION
Pas encore d'évaluation
ESTIMATION
6 pages
Estimation Ponctuelle et Échantillonnage
Pas encore d'évaluation
Estimation Ponctuelle et Échantillonnage
16 pages
Estimation Statistique : Concepts et Méthodes
100% (1)
Estimation Statistique : Concepts et Méthodes
38 pages
Estimation Non-Paramétrique de Densité
Pas encore d'évaluation
Estimation Non-Paramétrique de Densité
42 pages
Statistics Inferential
Pas encore d'évaluation
Statistics Inferential
14 pages
Theme8 Estimation
Pas encore d'évaluation
Theme8 Estimation
6 pages
TEI Chap2 Estimation Ponctuelle 22 23 Cours
Pas encore d'évaluation
TEI Chap2 Estimation Ponctuelle 22 23 Cours
16 pages
Estimateurs Part1
Pas encore d'évaluation
Estimateurs Part1
12 pages
Problemes Destimations
Pas encore d'évaluation
Problemes Destimations
10 pages
Stat Nonp P20 Annotations
Pas encore d'évaluation
Stat Nonp P20 Annotations
132 pages
Chap 2 Statistique
Pas encore d'évaluation
Chap 2 Statistique
2 pages
Mem Final
Pas encore d'évaluation
Mem Final
21 pages
Stat Nonp P20 v2 1
Pas encore d'évaluation
Stat Nonp P20 v2 1
142 pages
LucLehericy IDR Postsoutenance
Pas encore d'évaluation
LucLehericy IDR Postsoutenance
11 pages
Estimation KDE : Théorie et Codes Python/R
Pas encore d'évaluation
Estimation KDE : Théorie et Codes Python/R
24 pages
Biostatistique Appliquée
Pas encore d'évaluation
Biostatistique Appliquée
28 pages
3 - SESR Partie II - Stats (Suite)
Pas encore d'évaluation
3 - SESR Partie II - Stats (Suite)
37 pages
Estimation
Pas encore d'évaluation
Estimation
1 page
Chapitre 3
Pas encore d'évaluation
Chapitre 3
9 pages
EM-melange Gaussiens
Pas encore d'évaluation
EM-melange Gaussiens
17 pages
Belahcene Intissar
Pas encore d'évaluation
Belahcene Intissar
54 pages
Estimation et Intervalle de Confiance
Pas encore d'évaluation
Estimation et Intervalle de Confiance
27 pages
Plan
Pas encore d'évaluation
Plan
2 pages
Memoire Bouhali Keltoum
Pas encore d'évaluation
Memoire Bouhali Keltoum
69 pages
Théorème de Cochran et Modèles Linéaires
Pas encore d'évaluation
Théorème de Cochran et Modèles Linéaires
10 pages
TD Sondages
100% (2)
TD Sondages
14 pages
Probastat Section7
Pas encore d'évaluation
Probastat Section7
55 pages
DAKKON Mohamed: F.S.J.E.S de Tétouan, Module: Echantillonnage Et Estimation
Pas encore d'évaluation
DAKKON Mohamed: F.S.J.E.S de Tétouan, Module: Echantillonnage Et Estimation
86 pages
Les Methodes de speudo-panel-CB
Pas encore d'évaluation
Les Methodes de speudo-panel-CB
46 pages
TD N°3 Prob Et AD 24-25
Pas encore d'évaluation
TD N°3 Prob Et AD 24-25
2 pages
Cours de Statistique appliquée-S5-ENCG Fès-Pr A - 230914 - 083830
Pas encore d'évaluation
Cours de Statistique appliquée-S5-ENCG Fès-Pr A - 230914 - 083830
107 pages
Exercice Estim 2 Corrigé
Pas encore d'évaluation
Exercice Estim 2 Corrigé
5 pages
Cours Echantillonage Et Estimation SEG S3
100% (2)
Cours Echantillonage Et Estimation SEG S3
47 pages
Cours
Pas encore d'évaluation
Cours
26 pages
Stress Testing Et Théorie Des Valeurs Extrêmes
Pas encore d'évaluation
Stress Testing Et Théorie Des Valeurs Extrêmes
21 pages
Statistique Mathématique Master I
100% (1)
Statistique Mathématique Master I
80 pages
Estimation et Confiance en Statistiques
100% (1)
Estimation et Confiance en Statistiques
8 pages
Sondage Cours
Pas encore d'évaluation
Sondage Cours
154 pages
Sujet TP 1 Et 2
Pas encore d'évaluation
Sujet TP 1 Et 2
28 pages
Corrige Maths Bce Edhec 2020
Pas encore d'évaluation
Corrige Maths Bce Edhec 2020
8 pages
Analyse de la consommation de glace
Pas encore d'évaluation
Analyse de la consommation de glace
2 pages
Maths et Stats pour Business
Pas encore d'évaluation
Maths et Stats pour Business
4 pages
Poly Stat Inf
Pas encore d'évaluation
Poly Stat Inf
69 pages
Estimateurs non biaisés et exhaustifs
100% (3)
Estimateurs non biaisés et exhaustifs
12 pages
Correction 2
Pas encore d'évaluation
Correction 2
16 pages
Correction Exercice 4
Pas encore d'évaluation
Correction Exercice 4
6 pages
GMM Cours
Pas encore d'évaluation
GMM Cours
39 pages
Analyse Statistique et Estimation
Pas encore d'évaluation
Analyse Statistique et Estimation
3 pages
Travau Diriges de Statistiques 2
Pas encore d'évaluation
Travau Diriges de Statistiques 2
4 pages
Modele Lineaire Module 1
Pas encore d'évaluation
Modele Lineaire Module 1
55 pages
Exo Statmath
Pas encore d'évaluation
Exo Statmath
88 pages
Probabilités et Statistiques 2024-2025
Pas encore d'évaluation
Probabilités et Statistiques 2024-2025
2 pages
Module 1 Sondage Aleatoire Simple 2
Pas encore d'évaluation
Module 1 Sondage Aleatoire Simple 2
13 pages