HDR Hal
HDR Hal
densités et applications
Stephane Menozzi
présentée par
Stéphane Menozzi
Ce mémoire présente et met en perspective l’ensemble des travaux de recherche effectués pendant ma thèse,
de 2001 à 2004, à l’Université Pierre et Marie Curie (Paris VI) et à l’Ecole Polytechnique, sous la direction de
Vlad Bally et Emmanuel Gobet, et par la suite depuis mon recrutement en 2005 à l’Université Denis Diderot
(Paris VII).
Ces travaux se sont développés autour de deux axes principaux d’intersection non vide : le premier relatif
à la discrétisation de processus stochastiques, le second à l’estimation de densité de processus dégénérés et à
certaines applications associées.
Les quatre premiers chapitres relèvent majoritairement du premier axe. Le Chapitre 1 est introductif. Nous
y présentons les principaux types de problèmes associés à la discrétisation de processus, les résultats existants
ainsi que les outils utilisés pour les obtenir. Nous détaillons plus particulièrement les techniques employées pour
analyser l’approximation faible.
Le Chapitre 2 regroupe les résultats des articles [1,3,5,7]. Nous y étudions principalement l’approximation
faible d’un processus de diffusion tué/stoppé à la sortie d’un domaine régulier [1,7]. Sont également abordés le
cas du cône pour le mouvement Brownien [3], ainsi qu’une extension de l’analyse de l’erreur à des processus
non Markoviens [5].
Au Chapitre 3, nous rappelons les principes de la méthode Parametrix qui permet d’obtenir une représentation
de la densité de transition d’une équation différentielle stochastique (EDS) comme somme d’une série où cha-
cun des termes est la convolution de la densité d’une EDS à coefficients constants et des convolutions itérées
d’un noyau régularisant. En appliquant cette approche à temps discret nous en déduisons un théorème limite
local pour l’approximation par chaı̂ne de Markov d’un processus de diffusion dégénéré [8] et un développement
d’erreur sur les densités pour une EDS dirigée par un processus de Lévy stable symétrique et approchée par son
schéma d’Euler [9].
Après une brève présentation des Equations Différentielles Progressives Rétrogrades (EDSR) et de leurs
connexions avec certaines équations aux dérivées partielles non linéaires, nous donnerons au Chapitre 4 un
aperçu des méthodes numériques développées pour leur approximation. Nous détaillerons plus particulièrement
les articles [2,4] qui traitent du cas quasi-linéaire (EDSR fortement couplées) qui constitue le cadre le plus
général pour les applications en physique ou en finance. Enfin, nous exposerons certaines propriétés de schémas
de semi-discrétisation pour des EDSR tuées à la sortie d’un domaine, article [6].
Le Chapitre 5 relève lui majoritairement du deuxième axe, i.e. l’estimation de densité. Il débute par une
partie introductive destinée à présenter une synthèse des techniques intervenant dans l’estimation quantitative
de densités de processus stochastiques ou en termes analytique de solutions fondamentales d’équations aux
dérivées partielles. Nous y présentons ensuite les résultats de l’article [10]. Nous obtenons des estimées de type
Aronson pour la densité de transition d’une équation différentielle stochastique dont la dynamique peut se voir
comme celle d’une équation différentielle ordinaire (EDO) dont la première composante serait perturbée par
un bruit Brownien. Bien sûr, pour que la densité existe, les coefficients de l’EDO doivent vérifier une condition
de non dégénérescence de type Hörmander faible dans la mesure où seule la première composante est non
dégénérée. Ces résultats font intervenir contrôle stochastique et techniques analytiques, méthode parametrix
présentée au Chapitre 3. Nous concluons le chapitre par une application des estimées de densité : les contrôles
non asymptotiques d’intervalles de confiance dans les méthodes de Monte Carlo. Nous montrons pour des
schémas d’Euler, éventuellement dégénérés, des estimées d’Aronson et nous utilisons la domination Gaussienne
ainsi que des techniques de concentration de la mesure : inégalités de Sobolev logarithmique, argument de Herbst
pour arriver au résultat, cf. [11].
La note [12] établit une condition suffisante pour avoir l’unicité en loi pour les systèmes dégénérés considérés
au Chapitre 5 et abordés dans les articles [10],[11]. Les idées de ce travail sont présentées à l’Appendice A. En
particulier, ces résultats apportent des éléments de réponse à une question soulevée par le rapport d’Alexander
Veretennikov.
1
Travaux présentés pour l’habilitation
[1] E. Gobet et S. Menozzi.“Exact Approximation rate of killed hypoelliptic diffusions using the discrete
Euler scheme”. Stochastic Processes and their Applications, 112-2 (2004), 201-223.
[2] F. Delarue et S. Menozzi. “A forward backward algorithm for quasi-linear PDEs”.
Annals of Applied Probability, 16-1 (2006), 140-184.
[3] S. Menozzi. “Improved simulation for the killed Brownian motion in a cone”.
SIAM Journal on Numerical Analysis, 44-6 (2006), 2610-2632.
[4] E. Gobet et S. Menozzi. “Discrete Sampling of functionals of Itô processes”.
Séminaire de Probabilités, XL (2007), 355-375.
[5] F. Delarue et S. Menozzi. “An interpolated Stochastic Algorithm for Quasi-Linear PDEs”
Mathematics of Computation, 261-77 (2008), 125-158.
[6] B. Bouchard and S. Menozzi. “Strong Approximations of BSDEs in a domain”.
Bernoulli, 15-4 (2009), 1117-1147.
[7] E. Gobet et S. Menozzi. “Stopped diffusion processes : overshoots and boundary correction”.
Stochastic Processes and their Applications, 120-2 (2010), 130-162.
[8] V. Konakov, S. Menozzi et S. Molchanov. “Explicit parametrix and local limit theorems for some de-
-generate diffusion processes”. Annales de l’Institut Henri Poincaré, Série B, Vol. 46-4 (2010), 908-923.
[9] V. Konakov et S. Menozzi.“Weak Error for stable driven SDEs : expansion of the densities”.
A paraı̂tre dans Journal of Theoretical Probability, 25 pages.
[10] F. Delarue et S. Menozzi. “Density Estimates for a Random Noise Propagating through a Chain of
Differential Equations”. Journal of Functional Analysis, 259-6 (2010), 1577-1630.
[11] V. Lemaire et S. Menozzi. “On some Non Asymptotic Bounds for the Euler Scheme”.
Electronic Journal of Probability, Volume 15 (2010), 1645-1681.
Travail non présenté
[12] S. Menozzi. “Parametrix techniques and martingale problem for some degenerate Kolmogorov’s equations”.
2
Chapitre 1
Dans ce chapitre nous présentons brièvement différents problèmes associés à la discrétisation d’un processus
stochastique de “diffusion-sauts” en distiguant tout d’abord approximation forte et faible. Ces approximations
sont de nature très différentes, tant en terme des résultats de convergence auxquels elles permettent d’aboutir,
que dans les techniques mathématiques utilisées pour les établir.
Nous abordons premièrement le cas de l’approximation forte qui est celle associée trajectoriellement à la
différence entre le processus initial et une approximation donnée. Les contrôles que l’on souhaite obtenir pour
cette erreur sont soit presque sûrs soit en norme Lp . Pour les démontrer, on a recours aux outils de l’analyse
stochastique : développements d’Itô-Taylor, inégalités de martingales de type Burkholder Davies Gundy (BDG),
associés à des arguments de stabilité semblables à ceux utilisés pour l’approximation d’équations différentielles
ordinaires.
Nous poursuivons ensuite par l’approximation faible. Dans ce cadre, on ne souhaite plus avoir un contrôle
trajectoriel, mais proposer un schéma d’approximation pour l’espérance d’une fonctionnelle d’un processus.
Cette fonctionnelle peut être par exemple une fonction du processus observé à une date donnée fixée ou à un
temps d’arrêt, une fonction du maximum de l’une des composantes ou de l’intégrale du processus sur la période.
Le travail fondateur de Talay et Tubaro [TT90] a mis en évidence l’importance fondamentale pour l’analyse de
ce type d’erreur dans le cas Markovien, du lien entre la quantité à approcher et l’équation aux dérivées partielles
dont cette quantité n’est autre que la représentation probabiliste de la solution, formule de Feynman-Kac.
Nous avons essayé de rassembler quelques résultats majeurs de ces vingt dernières années qui seront utiles à
la compréhension des sujets abordés dans les chapitres suivants. Nous insistons particulièrement sur l’approxi-
mation faible et les techniques d’étude de l’erreur associée en distinguant les deux types d’hypothèses requises :
régularité de la fonctionnelle et des coefficients ou non dégénerescence. En effet, cette thématique sera l’objet
d’étude des Chapitres 2 (cas des processus stoppés) et 3 (processus dégénérés et de certains processus à sauts).
Nous conclurons par une section dédiée à quelques autres problèmes de discrétisation : l’approximation en
loi, on entend par là la caractérisation en terme de dynamique d’une renormalisation convenable de la différence
entre le processus initial et le schéma de discrétisation, l’approximation de mesures invariantes et de dynamiques
non linéaires où les contrôles sur l’erreur forte interviennent de nouveau.
Nous supposons sans perte de généralité que la partie de dérive est nulle dans (1.2) dans la mesure où nous
l’avons introduite explicitement dans la dynamique de (1.1). De même, la partie diffusive non normalisée et/ou
3
anisotrope de Z peut être prise en compte
R dans le coefficient σ de (1.1). Enfin, la mesure de Lévy ν de Z vérifie
la condition d’intégrabilité usuelle Rr (1 ∧ |z|2 )ν(dz) < +∞.
Ainsi l’équation (1.1) est dirigée par un processus Z qui s’exprime comme la somme d’un mouvement Brow-
nien standard W et d’un processus de saut pur N de mesure de Lévy ν.
L’EDS (1.1) intervient dans de nombreux domaines d’applications. En particulier, des liens profonds existent
entre équations différentielles stochastiques et équations aux dérivées partielles (EDP) via les formules de
représentation de Feynman Kac, voir Freidlin [Fre85] ou Friedman [Fri75]. Ainsi, dans de nombreux cas détaillés
ci-après, cf. Section 1.3, il est possible d’exprimer la solution d’une EDP linéaire, parabolique ou elliptique,
comme espérance d’une fonctionnelle d’un processus de dynamique (1.1).
Dans le cas où le processus directeur Z = W , le processus X solution de (1.1) interviendra dans les
représentations probabilistes des équations de diffusion de la chaleur en milieu inhomogène ou des équations
de la neutronique. Le cas où Z est un processus de saut pur N intervient quant à lui de façon naturelle dans
la modélisation du trafic dans des réseaux informatiques ou routiers. Enfin, en mathématiques financières,
l’équation (1.1) décrit la dynamique d’un actif dont les variations peuvent faire intervenir composantes brow-
niennes et de sauts, ces dernières intervenant de façon significative dans la modélisation en cette période de
crise. Dans de nombreux cas, le prix d’une option sur l’actif X peut là aussi s’exprimer comme l’espérance d’une
fonctionnelle de X.
Il est donc naturel d’introduire une procédure d’approximation de (1.1) qui de façon générale ne peut être
simulée de façon exacte. Mentionnons à cet égard dans le cas monodimensionnel continu non dégénére, i.e.
d = r = 1, Z = W et σ ≥ σ0 > 0, le travail de Beskos et al. [BPR06] qui permet une simulation exacte.
En toute généralité l’approximation la plus naturelle de (1.1) est celle du schéma d’Euler, qui par ailleurs
fournit dans certains cas un procédé constructif de résolution de (1.1), cf. Revuz et Yor [RY99] pour le cas
continu. Pour un pas de temps fixé h > 0 on pose pour i ∈ N, ti := ih, et l’on définit
Z t Z t
Xth = x + h
b(φ(s), Xφ(s) )ds + h
σ(φ(s), Xφ(s) )dZs , t ≥ 0, (1.3)
0 0
où φ(s) = sup{ti : ti ≤ s}. En d’autres termes, pour une grille temporelle donnée (ti )i∈N∗ , le schéma d’Euler
est obtenu en gelant sur chaque pas de temps la dynamique spatiale et temporelle aux points de discrétisation
en temps. Précisons que dans le cas où Z = W + N possède une composante de sauts, le schéma d’Euler n’est
pas toujours exactement simulable, cf. Section 1.3.2. Il le reste en revanche pour de nombreux cas importants
pour les applications : si N est un processus stable, Γ, ...
Pour la suite nous allons distinguer deux grands types de résultats d’approximation qui font intervenir
(Xt )t≥0 solution de (1.1) et son approximation (Xth )t≥0 solution de (1.3). Historiquement, l’approximation
de processus remonte à Stroock et Varadhan qui à la suite de l’étude des problèmes de martingales s’étaient
intéréssés à des approximations en loi des processus de diffusions avec des contrôles “à la Donsker”, i.e. conver-
gence sans vitesse de l’approximation. Pour un aperçu de cette approche, voir le Chapitre 11 de [SV79] pour les
approximations dans tout l’espace ou l’article [SV71] pour les problèmes de Dirichlet.
Il a fallu attendre les travaux de Milstein [Mil74, Mil76] pour que des approximations de type Itô-Taylor
permettent de quantifier plus précisément l’erreur forte trajectorielle. C’est ensuite dans les années 80 que
Milstein [Mil85] et Talay [Tal86] ont montré que l’erreur faible était d’ordre h sous de bonnes hypothèses.
où la dépendance en b, σ dans la constante C ci-dessus intervient via les modules de continuité en temps et
espace des coefficients. Par rapport à l’analyse de la discrétisation d’une EDO, ce sont les mêmes arguments de
stabilité qui sont utilisés avec une étape supplémentaire pour contrôler les intégrales stochastiques à l’aide des
inégalités BDG. C’est lors de cette étape qu’apparaı̂t l’ordre de l’erreur en h1/2 qui correspond à la norme Lp de
l’accroissement Brownien sur un pas de temps. L’utilisation du Lemme de Gronwall pour conclure nous indique
4
ensuite qu’en toute généralité ces estimations ne seront pertinentes que pour un horizon de temps T > 0 fini,
du fait de la dépendance exponentielle de C en ce paramètre. Un corollaire immédiat de (1.4) et du lemme de
Borel Cantelli est la convergence presque sûre de h−α supt∈[0,T ] |Xt − Xth | vers 0 avec h pour tout α < 1/2.
C’est pour compenser cette vitesse que Milstein a introduit son schéma [Mil76] qui permet de retrouver la
vitesse usuelle en h. En revanche, ce schéma est difficilement simulable en dimension d > 1, sans condition
supplémentaire de commutation sur les colonnes de la matrice de diffusion identifiées à des champs de vecteurs.
Il existe de nombreux schémas d’ordre élévés pour l’erreur forte. Nous renvoyons à l’ouvrage de Kloeden et
Platten [KP92] pour un panorama de ces schémas. Mentionnons toutefois que leur simulation reste beaucoup
plus complexe que celle du schéma d’Euler et que ces schémas ne sont pas forcément les plus appropriés dans
de nombreux cas, voir Section 1.3.
Des arguments similaires peuvent être utilisés pour caractériser l’erreur forte, avec la même vitesse, lorsque
Z est un processus de Lévy de carré intégrable, voir Kohatsu-Higa et Protter [KHP94]. Mentionnons enfin
les travaux de Bruti Liberati et Platten [BLP07] relatifs à la construction de schémas d’ordre plus élévé pour
l’erreur forte dans le cas mixte Z = W + N ou de saut pur Z = N lorsque l’intensité du processus de saut
est finie, i.e. ν(Rr ) < +∞ dans (1.2). Ces auteurs utilisent en particulier l’idée d’une grille de discrétisation
temporelle adaptée aux instants de saut.
5
un opérateur dégénéré. L’intégrale est vue comme une variable supplémentaireR t à laquelle ne sera pas associé de
terme d’ordre 2 dans le générateur infinitésimal du couple (Xt , Yt )t≥0 , Yt := 0 Xs ds.
A partir de cette dernière formulation, l’idée est ensuite d’appliquer un développement de Taylor en temps-
espace autour de (ti , Xthi ) pour chaque i ∈ [[0, N − 1]] grâce à la régularité a priori de u. En exploitant que u
satisfait (1.6), on obtient que les termes d’ordre h s’annulent dans E[u(ti+1 , Xthi+1 ) − u(ti , Xthi )] := EhD,i . Pour
établir ensuite que EhD,i = O(h2 ) il est nécessaire de poursuivre le développement à l’ordre deux en temps et
quatre en espace, en exploitant que l’on peut éliminer les moments d’ordre 3 par centrage. Ainsi, si l’on a a
priori que u ∈ C 2,4 ([0, T ] × Rd ), on déduit que ED
h
= O(h) par simple sommation.
Notons que dans la procédure décrite ci-avant, il n’est pas nécessaire d’avoir un aléa Gaussien dans le
schéma d’Euler (1.3). En effet, le développement ne fait intervenir que les propriétés de centrage des moments
d’ordre 1 et 3 et que la covariance de l’aléa est la matrice identité. Cette dernière observation permet de gagner
en complexité en utilisant par exemple des lois de Bernoulli convenablement normalisées en lieu et place des
accroissements Browniens.
Si l’on poursuit maintenant les développements à l’ordre 3 en temps et 6 en espace, en tuant toujours par
centrage les moments impairs des accroissements, on aboutit au développement d’erreur :
où la constante C := C(T, a, b, u, x), cf. Théorème 1 de [TT90] pour une expression explicite. Du développement
D
précédent il est aisé de voir que si l’on considère le schéma d’Euler de pas h/2, il vient : Eh/2 = C h2 + O(h2 ).
Une simple manipulation algébrique donne ensuite
n o
D h/2
2Eh/2 − EhD = 2Ex [g(XT )] − Ex [g(XTh )] − Ex [g(XT )] = O(h2 ). (1.8)
nP o
M h/2,i
Cette identité suggère d’utiliser l’estimateur de Monte Carlo Θ̂hM = 1
M i=1 2g(XT ) − g(XTh,i ) , où les
h/2,i h/2,i
(XT , XTh,i )i∈[[1,M]] sont des réalisations i.i.d. et pour tout i ∈ [[1, M ]] les XT , XTh,i sont simulés à partir des
mêmes accroissements Browniens. Ce procédé est connu sous le nom d’extrapolation de Richardson-Romberg.
Notons que sous les hypothèses précédentes,
P la régularité de u est suffisante pour obtenir un développement
asymptotique à l’ordre n, i.e. Ehd = ni=1 Ci hi + O(hn+1 ) à partir duquel il serait possible d’itérer le procédé
d’extrapolation et d’obtenir une vitesse d’ordre hn+1 en multipliant la complexité par n + 1. Mentionnons
toutefois que cette procédure peut accroı̂tre la variance de l’estimateur Θ̂hM . On considère en effet n + 1 fois
plus de variables aléatoires.
L’analyse de l’erreur faible s’effectuera toujours suivant le schéma présenté ci-dessus, avec les spécificités
associées à chaque problème, voir Sections 1.3.2 et 1.3.3. Le point clé est d’avoir de la régularité sur la fonc-
tion u et des contrôles sur ses dérivées, afin d’effectuer des développements d’Itô-Taylor. Sous les hypothèses
6
précédentes, ces contrôles s’obtiennent par des techniques usuelles de calcul stochastique. On a cependant be-
soin pour cela de beaucoup de régularité, sur b, σ et g. Or, dans de nombreux cas cette régularité n’est pas
nécessaire. C’est en particulier vrai si l’on peut bénéficier de l’effet régularisant des noyaux de la chaleur. En
d’autres termes, il est possible de relaxer la régularité de la fonction g si par exemple XRT admet une densité
de transition régulière dont on contrôle bien les dérivées. En effet dans ce cas u(t, x) = Rd g(y)p(t, T, x, y)dy
où p(t, T, x, .) désigne la densité de XTt,x . Dans le cas de coefficients homogènes en temps nous noterons pour
simplifier l’écriture p(t, T, x, .) = p(T − t, x, .).
Néanmoins, prouver que XTt,x possède une telle densité nécéssite une hypothèse de non-dégénérescence de
l’équation (1.1). On considère deux jeux d’hypothèses qui garantissent que l’on obtient les propriétés souhaitées :
l’hypoellipticité à la Hörmander (hypothèse (H)) et l’uniforme ellipticité de la matrice de diffusion a (hypothèse
(UE)).
Hypothèse P (H) : Supposons que les coefficients b, σ sont C ∞ , bornés, homogènes en temps et réécrivons dXt =
r
A0 (Xt )dt + i=1 Ai (Xt ) ◦ dWti (i.e. les champs de vecteurs (Ai )i∈[[1,r]] correspondent aux colonnes de la matrice
de diffusion, A0 = b − 21 σ.∇σ et ◦dW désigne l’intégrale de Stratonovitch). Si l’espace vectoriel engendré par
au point initial x est Rd (où [., .] désigne le crochet de Lie entre champs de vecteurs), alors pour tout t > 0,
Xt0,x admet une densité, voir par exemple le Chapitre 2.3 de Nualart [Nua95].
Si l’on suppose de plus qu’il existe L ∈ N∗ tel que que pour tout x ∈ Rd l’espace Rd est engendré en
ne considérant que les crochets de longueur inférieure ou égale à L, alors les travaux de Kusuoka et Stroock
[KS85], donnent les contrôles suivants sur la densité. Soient m, k des entiers et des multi-indices α, β tels que
2m + |α| ≤ k. ll existe des constantes C(T ), c, q, Q dépendant de L, m, k, α, a, b, telles que
C(T )(1 + |x|Q ) |x − y|2
|∂tm ∂xα p(t, x, y)| ≤ q exp −c . (1.9)
t (1 + |y − x|)k t(1 + |x|)2
Par ailleurs, l’inverse de la matrice de Malliavin que nous noterons Γt (x) est contrôlée dans tous les Lp . Pour
tout p ≥ 1 il existe C(T ), µ t.q.
1 + |x|µ
E[|Γt (x)|p ]1/p ≤ C(T ) dL . (1.10)
t
Le propos du travail de Bally et Talay [BT96a] est d’exploiter les contrôles (1.9), (1.10) pour étendre le
développement d’erreur (1.7) au cas d’une diffusion hypoelliptique sans régularité a priori sur g, que l’on peut
ici supposer mesurable et à croissance exponentielle.
Rappelons que lors des développements d’Itô-Taylor précédents apparaissaient pour tout i ∈ [[0, N − 1]], des
quantités du type Qhi := E[∂xα u(ti , Xthi )G(ti , Xthi )], où G fait intervenir les coefficients b, σ et leurs dérivées. Le
contrôle sur la densité (1.9) permet de contrôler les Qhi pour i ≤ N/2. Pour les i > N/2, l’idée naturelle est
d’utiliser une intégration par parties de Malliavin. Notons Qi = E[∂xα u(ti , Xti )G(ti , Xti )], i.e. on remplace Xthi
par Xti . L’intégration par parties pour Qi s’écrit Qi = E[u(ti , Xti )Hα (Xti , G(ti , Xti ))]. Les inégalités de Meyer
permettent alors d’obtenir qu’il existe p ≥ 1 tel que |Qi | ≤ CE[|Γti (x)|p ]1/p , où C dépend de normes des dérivées
de Malliavin de Xti .
On pourra faire l’intégration par parties dans Qhi sur les événements de forte probabilité pour lesquels
l’inverse de la matrice du schéma d’Euler Xthi est “proche” de l’inverse de la matrice de Malliavin Γti (x) de la
diffusion (1.1) et contrôler la probabilité des événements complémentaires, cf. [BT96a].
L’idée sous jacente globale est que l’hypothèse d’hypoellipticité permet de contrôler les dérivées enR utilisant en
temps petit les estimées ponctuelles sur la densité qui sont pertinentes dans la mesure où u(t, x) = R g(y)p(T −
t, x, y)dy, puis d’exploiter qu’en temps plus long c’est la matrice inverse (Γt )t≥T /2 qui est non-dégénérée. Quant
à la croissance de g, c’est le contrôle (1.9) qui rend cette condition suffisante.
Mentionnons que si la non-dégénérescence de l’inverse de la matrice de diffusion est bien contrôlée dans le
cas de la diffusion X, il n’en est pas de même pour son schéma d’Euler X h . C’est ce qui a motivé l’introduction
des Qi ci-dessus pour présenter l’intégration par parties. Il n’y a à ma connaissance pas de preuve d’existence
de la densité pour le schéma d’Euler hypoelliptique. C’est d’ailleurs ce dernier point qui a amené Bally et Talay
à considérer un schéma d’Euler légèrement perturbé pour obtenir un développement d’erreur sur les densités,
cf. [BT96b].
Hypothèse (UE) : On suppose la matrice de diffusion a uniformément elliptique et bornée, i.e. ∃Λ ≥ 1, ∀(t, x) ∈
[0, T ] × Rd , ∀ξ ∈ Rd , Λ−1 |ξ|2 ≤ ha(t, x)ξ, ξi ≤ Λ|ξ|2 . Pour b et σ Lipschitziens en espace et b borné, il est bien
connu que l’unique solution forte de (1.1) admet une densité vérifiant une estimée supérieure Gaussienne, i.e.
7
2
C
∀T > 0, ∃(C, c) := (C, c)(T, |b|∞ , Λ), ∀(t, x, y) ∈ (0, T ] × Rd × Rd , p(t, x, y) ≤ td/2 exp(−c |x−y|
t ). Ce contrôle
s’obtient aisément à partir de la représentation en série parametrix de la densité, voir Friedman [Fri64] ou
McKean et Singer [MS67]. L’idée de ce type de méthode est d’écrire :
+∞
X
p(t, x, y) = p̃(t, x, y) + p̃ ⊗ H (i) (t, x, y). (1.11)
i=1
où p̃(t, x, y) est une densité Gaussienne, dans laquelle on a gelé les cofficients de (1.1) au point d’arrivée y et
où les termes p̃ ⊗ H (i) sont des convolutions temps-espace de densités Gaussiennes gelées et de noyaux H (i)
toujours plus régularisants en temps avec i. En d’autres termes, en temps petit, la contribution des p̃ ⊗ H (i) est
de plus en plus négligeable avec i. Nous reviendrons en détail sur la méthode parametrix au Chapitre 3.
L’approche développée dans [MS67] s’est en fait révelée très adaptée aux discrétisations. Considérons le
schéma d’Euler généralisé de (1.1) où l’on remplace les accroissements Browniens (Wti −Wti−1 )i∈[[1,N ]] dans (1.3)
par les réalisations i.i.d. (ξih )i∈[[1,N ]] d’une loi à densité plus générale ayant mêmes moments que l’accroissement
Brownien jusqu’à un certain ordre. Si ce dernier admet une densité pN , il est possible de la représenter aux
instants de discrétisation sous la forme
+∞
X
pN (t, x, y) = p̃N (t, x, y) + p̃N ⊗N H N,(i) (t, x, y). (1.12)
i=1
Dans l’équation ci-dessus p̃N designe la densité de la somme convenablement normalisée des ξih , ⊗N désigne une
convolution temps-espace discrète en temps et H N,(i) une version discrète des noyaux régularisants de (1.11).
Cette écriture et une analyse de la différence entre les représentations (1.11) et (1.12) a permis à Konakov et
Mammen [KM00] d’obtenir un théorème limite local à l’ordre h1/2 pour la différence (p − pN )(T, x, y). Cette
vitesse correspond à la vitesse d’approximation classique du théorème limite local en régime Gaussien, cf.
Bhattacharya et Rao [BR76]. C’est celle qui contrôle la convergence de p̃N vers p̃. Le résultat entre p et pN
découle ensuite d’une longue analyse de type stabilité. Nous présenterons au Chapitre 3 une extension de ce
résultat pour certains processus dégénérés, article [8].
Dans le cas particulier du schéma d’Euler (1.3), i.e. lorsque les (ξih )i∈[[1,N ]] sont déjà Gaussiens, on retrouve la
vitesse d’ordre h comme dans le cas de l’erreur faible mais sur les densités [KM02] et leur dérivées, cf. [Guy06] :
Sous des hypothèses plus fortes que celles courantes de régularité sur les coefficients, Gobet et Labart [GL08]
ont précisément quantifié l’ordre du premier terme pour T éventuellement petit. Ils ont établi |p − pN |(T, x, y) ≤
ChT −(d+1)/2 exp(−c|x−y|2 /T ), où les constantes C, c sont uniformes sur un compact en temps. C’est l’utilisation
du calcul de Malliavin qui impose une certaine régularité sur les coefficients (b, σ supposés Cb1,3 et ∂t σ ∈ Cb0,1 ).
L’ordre de la singularité en temps du terme de reste est néanmoins intuitivement clair : les développements
parametrix (1.11) et (1.12) font intervenir dans les noyaux H et H N des termes d’ordre deux en espace. Lorsque
l’on fait la différence de ses deux développements on a une sensibilité qui fait donc intervenir des termes d’ordre
trois. Les contrôles usuels sur les dérivées des noyaux de la chaleurs elliptiques, cf. Friedman [Fri64] donnent
que ces termes auront une singularité d’ordre 3/2 en temps. Celle-ci doit néanmoins être intégrée en temps
dans la convolution ce qui, après intégrations par parties, donne bien une singularité globale additionnelle en
T −1/2 correspondant au résultat de Gobet et Labart. Le même résultat peut se retrouver à partir des travaux
de Konakov et Mammen [KM09] qui précisent les résultats de [KM00] pour T éventuellement petit toujours
pour une chaı̂ne de Markov générale approchant (1.1).
L’avantage des développements de type (1.13) pour l’étude de l’erreur faible, par rapport aux approches
précédentes, est de pouvoir précisément relâcher les hypothèses sur la fonction g. Guyon montre en particulier
que le développement (1.7) reste valable si g est une distribution tempérée, incluant en particulier les masses
de Dirac et les dérivées de masse de Dirac. Ce dernier point est en particulier important pour les applications
au calcul de sensibilité, ou d’estimation des dérivées de l’EDP (1.6), qui sont cruciales en finance.
Enfin, l’approche parametrix de [KM00], [KM09] pour l’approximation permettrait d’étendre les résultats
mentionnés à des équations à coefficient de diffusion a uniformément Hölder en espace, borné, mesurable en
temps et dérive b bornée dans le cadre du problème de martingale classique. On retrouverait de la sorte les
hypothèses naturelles en analyse pour obtenir les contrôles sur les noyaux de la chaleur associés à des opérateurs
sous forme non divergence elliptiques, cf. Friedman [Fri64] ou Sheu [She91] pour une approche probabiliste de
ces résultats.
8
En conclusion de cette présentation, notons que l’approche originelle de Talay et Tubaro ne requiert pas de
condition de non-dégénérescence. Elle est robuste dès lors que l’on a de la régularité. Pour se passer de régularité
sur g, une hypothèse de non dégénérescence (hypoellipticité ou uniforme ellipticité) est nécessaire. Cela permet
de faire porter les dérivations spatiales intervenant lors de l’analyse de l’erreur, sur la densité du processus que
l’on sait alors contrôler.
Mentionnons également la recherche active ces dernières années sur les schémas d’erreur faible élevée. Ces
derniers sont issus des travaux de Kusuoka [Kus01] dont le schéma a ensuite été développé par Lyons et Victoir
[LV04] et Ninomiya et al. [NV08], [NN09]. L’idée est toujours de procéder à des développements d’Itô-Taylor
dans les intégrales stochastiques et de remplacer ensuite les intégrales stochastiques itérées apparaissant par des
variables aléatoires ayant les mêmes moments jusqu’à un certain ordre en utilisant des formules de quadrature
pour ces intégrales Browniennes multiples. Le gros du travail est ensuite de déterminer des bonnes fonctions de
quadrature, ce qui requiert un travail algébrique conséquent.
Ces schémas imposent néanmoins beaucoup de régularité sur les coefficients b, σ ce qui n’est pas a priori
nécessaire pour avoir un développement (1.7) (cf. [KM02]) à partir duquel l’extrapolation de Richardson Rom-
berg est toujours possible.
Sous des hypothèses similaires à celles du cas continu, i.e. régularité des coefficients (supposés homogènes) et
de la condition terminale g, en imposant par ailleurs des conditions d’intégrabilité assez fortes sur la mesure
de Lévy ν, Protter et Talay [PT97] ont réussi à obtenir un développement de l’erreur faible similaire à (1.7)
lorsque (1.1) est approchée par son schéma d’Euler (1.3), cf. leur Théorème 2.2. L’idée reste celle de dérivation
du flot. Les hypothèses d’intégrabilité sur ν sont nécessaires pour contrôler en norme Lp , où p est relié à l’indice
de dérivation, les dérivées du flot.
Dans le cas d’EDS dirigées par des processus de Lévy généraux Z se pose également la question de simulation
du schéma d’Euler. En effet, bien que les accroissements de processus de Lévy soient explictement simulables
dans certains cas : processus stables, Gamma, Poisson composé, ..., ils ne le sont pas pas en toute généralité.
L’analyse de l’erreur faible associée à un schéma “simulable” dérivant du schéma d’Euler est effectuée dans
Jacod et al [JKMP05]. Les auteurs introduisent le schéma
h
X̄thi+1 = X̄thi + b(ti , X̄thi )h + σ(ti , X̄thi )ζi+1 , i ∈ [[0, N − 1]], X̄0h = x,
où les (ζi )i≥1 sont des variables i.i.d. approchant en loi les accroissements (Zti+1 − Zti )i≥1 . Toujours sous
des hypothèses fortes concernant l’intégrabilité de la mesure de Lévy ν, ils obtiennent une majoration d’er-
reur de la forme |E[g(X̄Th ) − g(XTh )]| ≤ C(γh ∨ h). Dans l’inégalité précédente γh est tel que pour H ∈ C04 (Rd ),
|E[H(ζh )−H(Zh )]| ≤ Chγh . Sous des hypothèses toujours plus fortes de régularité et d’intégrabilité sur b, σ, g, ν,
un développement d’erreur est également obtenu.
L’hypothèse d’intégrabilité de la mesure ν requise dans les travaux précédents, et cruciale du point de
vue des techniques utilisées, est en revanche génante pour de nombreuses applications qui font intervenir des
processus à queues lourdes. Le cas des processus stables d’indice α ∈ (0, 2), i.e. on exclut le cas Brownien,
illustre bien cet aspect. Ils interviennent dans de nombreux champs d’applications : physique mathématique
[IP06], télécommunications [SK74], finance [JMW96] et ne vérifient pas du tout les conditions d’intégrabilité
précédentes. Par ailleurs, le schéma d’Euler est dans ce cas parfaitement simulable, cf. [PT97] ou [ST94]. Dans
ce cadre, Hausenblas [Hau02] a obtenu dans le cas scalaire une majoration de l’erreur faible à l’ordre 1 en h
pour g ∈ L∞ en utilisant le calcul de Malliavin.
Au chapitre 3, nous développerons comment à partir d’une représentation en série parametrix pour la densité
de l’EDS (1.1) dirigée par un processus stable, ou en termes analytiques de la solution fondamentale de l’EDP
(1.14), on peut obtenir un développement d’erreur entre la densité de la diffusion et de son schéma d’Euler,
article [9]. En utilisant que les queues de la densité ont un comportement asymptotique en espace de l’ordre
9
de (1 + |x|d+α )−1 , qui est optimal au sens où une minoration du même ordre existe, nous pourrons également
relaxer les hypothèses de bornitude de g pour permettre des croissances en |g(x)| ≤ C(1 + |x|β ), β < α.
Mentionnons dans le cas général pour Z le travail de Kohatsu Higa et Tankov [KHT10] qui étudie l’erreur
faible pour des schémas de pas adaptés à l’amplitude des sauts avec une amélioration de l’erreur de convergence
usuelle en h du schéma d’Euler. L’approche reste néanmoins celle de dérivation du flot et requiert donc de la
régularité.
l’adhérence du domaine. En effet, ce choix permet de ne vérifier qu’aux instants de discrétisation si le schéma
d’Euler se trouve ou non dans le domaine. L’analyse de l’erreur de discrétisation
EhD = Ex [g(T ∧ τ h , ΠD̄ (XTh∧τ h ))] − Ex [g(T ∧ τ, XT ∧τ )] = E[u(T ∧ τ h , ΠD̄ (XTh∧τ h ))] − u(0, x),
s’effectue ensuite suivant le même schéma que dans le cas sans bord en utilisant les propriétés de régularité de
u solution de
(∂t + Lt )u(t, x) = 0, (t, x) ∈ [0, T ) × D,
(1.15)
u(t, x) = g(t, x), (t, x) ∈ [0, T ) × ∂D ∪ {T } × D̄.
Des hypothèses de non dégénérescence similaires à celles présentées à la section précédente (hypoellipticité ou
uniforme ellipticité) permettent d’avoir des estimées si le domaine D est suffisamment régulier. Dans ce cadre,
Gobet [Gob00] a montré que EhD = O(h1/2 ) avec certaines conditions de support et/ou régularité sur g. Il est
à noter que ce résultat n’est pas dû à l’approximation du processus de diffusion mais est inhérent au choix de
l’approximation discrète du temps d’arrêt. En effet, dans le cas monodimensionnel, pour Xt = Wt et qu’il n’y a
donc pas d’erreur de discrétisation du processus, on peut déduire des travaux de Siegmund et Yuh [SY82] que
pour l’approximation discrète de la fonction de répartition du processus stoppé, i.e. g(t, x) = It=T Ix>A , A fixé,
EhD = Ch1/2 + o(h1/2 ). Ce résultat a motivé les travaux [1] et [7] qui ont permis d’établir respectivement une
h
borne inférieure et un développement d’erreur à l’ordre 1/2 pour ED .
Par ailleurs, cette mauvaise vitesse en comparaison du cas sans bord a donné lieu à une recherche active
pour l’amélioration de la convergence des méthodes numériques : approximation plus fine du temps de sortie
par ponts Browniens [Gob00, Gob01], techniques de grandes déviations pour les asymptotiques de probabilités
de sortie [Bal95, BCI99], correction de domaine [BGK97]. Détaillons ici cette dernière. Dans le cas du modèle
de Black et Scholes monodimensionnel et pour un demi-espace, Broadie et al. [BGK97], ont introduit l’idée de
baisser convenablement en fonction de h la barrière de sorte à compenser la surestimation des trajectoires prises
en compte du fait de l’estimation discrète. Cette méthode a été généralisée à une large classe de domaines non
cylindriques réguliers dans [7] pour des processus de diffusions.
Nous reviendrons en détail sur ces aspects au Chapitre 2 dédié aux approximations de processus stoppés.
10
où l’on note x = (x, y) et Lt ϕ(x) = hb(t, x), ∇x ϕ(x)i + 12 tr a(t, x)Dx2 ϕ(x) + hx, ∂y ϕ(x)i. Cette équation
Ry
est dégénérée et le générateur Lt est celui du couple (Xt , Yt )t≥0 , Yt = y + 0 Xs ds. Lorsque les coefficients b, σ
dépendent également de y alors l’équation (1.16) peut être associée à un système Hamiltonien stochastique. Pour
2 2
un Hamiltonien donné de la forme H(x, y) = V (y) + |x|2 où V est un potentiel et |x|2 l’énergie cinétique d’une
particule de masse unité, le système Hamiltonien stochastique associé correspondrait à b(Xs , Ys ) = −(∂y V (Ys )+
F (Xs , Ys )Xs ), où F ≥ 0 est un terme de friction.
Dans le cas d’un mouvement Brownien géométrique à coefficient de diffusion aléatoire, l’analyse de EhD
a été effectuée par Temam [Tem01]. L’approximation par chaı̂ne de Markov de la solution fondamentale de
(1.16), avec b, σ dépendant de x = (x, y), est l’objet du travail [8] et sera présentée au Chapitre 3. A l’aide de
développements parametrix nous obtiendrons un théorème limite local en régime Gaussien pour la différence
entre les densités du processus et de la chaı̂ne de Markov. L’étude de systèmes dégénérés de type (1.16) sera
développée au Chapitre 5.2. Nous y présenterons les résultats de [10] qui donnent en particulier des estimées
“à la Aronson” pour la solution fondamentale de (1.16).
où W̃ est un mouvement Brownien indépendant de W . Cette dynamique peut intuitivement se déduire du
développement au premier ordre de la dynamique de la différence :
Z t Z t
′
h
Ut = h
σ (Xs )Us dWs + σσ ′ (Xφ(s)
h
)h−1/2 (Ws − Wφ(s) )dWs + Rth ,
0 0
Mesures invariantes
Lorsque le processus X vérifie certaines propriétés de stabilité de type Lyapunov, la question de l’approxi-
mation de mesures invariantes se pose de façon naturelle.
Des schémas à pas décroissants ont été introduits dans le cas continu par Lamberton et Pagès [LP02, LP03].
Le raffinement du pas de temps permet de converger vers la mesure invariante du processus initial. Cette
approche présente par ailleurs l’avantage de pouvoir s’appliquer au cas de processus dégénérés. Elle a été
généralisée par Panloup pour des d’EDS dirigées par des processus de Lévy [Pan08] et dans des cas continus à
dérive singulière par Lemaire [Lem07].
Dans le cadre des systèmes Hamiltoniens, i.e. lorsque le terme de friction F > 0 dans l’exemple ci-dessus,
Talay [Tal02], Mattingly et al. [MSH02] ont étudié différents schémas d’approximation de la mesure invariante
11
par chaı̂ne de Markov à pas constants. Ces derniers présupposent une meilleure connaissance a priori du semi-
groupe de la diffusion. En effet dans ces travaux c’est la mesure invariante de la chaı̂ne qui est approchée et il
est ensuite nécessaire d’avoir des contrôles précis sur l’écart avec la mesure invariante du processus initial.
12
Chapitre 2
Approximation de processus
tués/stoppés
Ce chapitre vise à faire une synthèse des travaux [1], [3], [4], [7] écrits en partie avec Emmanuel Gobet de
l’ENSIMAG et relatifs à différents problèmes d’approximation pour des processus tués et/ou stoppés. L’idée
est tout d’abord d’établir une vitesse de convergence pour l’erreur faible lorsque l’on fait le choix de stopper le
schéma d’approximation à temps discret. Par opposition au cas de l’espace tout entier, cette vitesse est d’ordre
1/2 en h si h désigne le pas de temps uniforme de discrétisation. Cet ordre correpond à celui de l’overshoot du
schéma d’Euler, i.e. la distance au bord du domaine lorsque le schéma sort à temps discret. Cet ordre est encore
celui de l’accroissement Brownien.
Le travail initial [1] a permis d’isoler l’overshoot comme terme dominant dans l’erreur et d’obtenir un
encadrement de l’erreur à l’ordre 1/2 pour des diffusions hypoelliptiques et des domaines cylindriques réguliers
vérifiant une condition de frontière non caractéristique.
Des théorèmes limites sur l’overshoot existent depuis longtemps dans le cadre du Brownien monodimension-
nel tué à temps discret. En particulier, Siegmund et Yuh [SY82] ont établi l’indépendance asymptotique du
temps de sortie discret et de l’overshoot renormalisé. C’est précisément ce type de résultat qui est à la base
du développement de l’erreur faible. Une grande partie de [7] a consisté à caractériser la loi limite du triplet
temps de sortie discret, position de sortie et overshoot renormalisé pour le schéma d’Euler d’une diffusion uni-
formément elliptique stoppée à la sortie d’un domaine régulier non cylindrique. Il s’agit là de l’un des résultats
principaux de ce chapitre. Dans le cas particulier de cônes formés par l’intersection de demi-espaces un résultat
similaire avait été obtenu pour le Brownien dans [3]. Ce théorème limite a dans les deux cas mentionnés permis
d’aboutir au développement de l’erreur faible (avec une extension au problème stationnaire pour un domaine
régulier).
Comme nous l’avons indiqué au Chapitre 1.3.1, un développement d’erreur permet d’utiliser des méthodes
d’accélération de la convergence pour l’approximation numérique. En particulier, la méthode d’extrapolation de
Romberg est toujours possible, puisque purement algébrique, sans connaissance a priori de la constante dans le
développement limité. Dans le cas de l’approximation faible de processus tués, une caractérisation “explicite” de
cette constante permet d’utiliser une technique alternative d’accélération de convergence. Celle-ci consiste à tuer
le processus à temps discret à la sortie d’un domaine plus petit que celui initial que l’on peut choisir de sorte à
tuer le terme dominant de l’erreur. La construction de ce domaine dépend du pas de temps h, et explicitement de
l’expression de la constante dans le développement limité de l’erreur. L’idée est d’utiliser la notion de sensibilité
du problème de Dirichlet par rapport au domaine, qui avait d’abord été introduite en optimisation de formes,
cf. Sokoloski et Zolesio [SZ92], puis développée dans un cadre probabiliste par Costantini et al. [CKG06].
Nous conclurons ce chapitre en présentant les résulats de [4] où l’on montre comment étendre l’analyse de
l’erreur de discrétisation au cas non Markovien des processus d’Itô pour lesquels il n’est plus possible d’utiliser
une représentation de l’erreur via une EDP.
13
où W est un mouvement Brownien de Rd , et les coefficients b, σ sont Lipschitz en espace et localement bornés
en temps.
On se donne une famille (Dt )t≥0 , dépendant du temps de domaines réguliers bornés de Rd . On suppose
également cette famille régulière en temps. Pour un instant T > 0 déterministe fixé, on associe à la famille
précédente le domaine temps-espace (voir Figure 2.1)
[
D= {t} × Dt = {(t, x) : 0 < t < T, x ∈ Dt } ⊂]0, T [×Rd.
0<t<T
Les domaines cylindriques sont des cas particuliers des domaines temps-espace précédents. On a dans ce cas
Dt
DT
D0
temps
0 t T
Rd
Nous associons au schéma d’Euler son temps de sortie discret τ h := inf{ti > 0 : Xthi ∈
/ Dti }, ce qui conduit à
approcher (2.2) par :
Z τ h ∧T Rt h
Qh (T, g, f, k, x) := Ex [g(τ h ∧ T, Xτhh ∧T )Zτhh ∧T + h
Zφ(s) h
f (φ(s), Xφ(s) )ds], Zth = e− 0
k(φ(r),Xφ(r) )dr
. (2.5)
0
L’erreur faible associée à cette procédure de discrétisation est la différence des équations (2.2) et (2.5), EhD :=
(Qh − Q)(T, g, f, k, x). Précisons que dans l’approximation (2.5) ci-dessus la fonction g est presque sûrement
évaluée hors de l’adhérence du domaine. Cette approximation peut à première vue sembler grossière. Elle
n’affecte pas néanmoins la vitesse de convergence et évite numériquement l’étape potentiellement coûteuse de
projection sur D̄.
Une première hypothèse de travail est celle de frontière non caractéristique du domaine. Précisément, si
F (t, x) désigne la distance signée de x ∈ Rd au bord du domaine Dt 1 , on suppose que
1. Dans le cas d’un domaine cylindrique F (t, x) = F (x), distance signée au bord du domaine D.
14
S
(FNC) Pour un r0 > 0 il existe a0 > 0 tel que ∇F (t, x)[σσ ∗ ](t, x)∇F (t, x)∗ ≥ a0 pour tout (t, x) ∈ 0≤t≤T {t} ×
V∂Dt (r0 ), V∂Dt (r0 ) := {x ∈ Dt : d(x, ∂Dt ) ≤ r0 }.
Cette condition est suffisante pour garantir la convergence de EhD vers 0, cf. Proposition 3 de [1]. Elle apparaı̂t
comme minimale dans la mesure où des contre-exemples existent lorsqu’elle n’est pas vérifiée, cf. [Gob00]. Elle
exprime que dans un voisinage du bord le processus de distance au bord est non dégénéré, ou dit autrement
que la matrice de diffusion est non dégénérée le long des normales au bord des sections Dt du domaine D.
Comme le processus de distance au bord est mono-dimensionnel, il est en quelque sorte similaire à un
mouvement Brownien changé de temps. C’est la formalisation de cette observation heuristique qui a permis de
généraliser au schéma d’Euler les résultats asymptotiques sur l’overshoot à partir des résultats Browniens, voir
Section 2.2.1.
Comme nous l’avons indiqué en Section 1.3.1, un outil essentiel pour l’analyse de l’erreur faible est le contrôle
des dérivées de la solution u de (2.3). Nous avons considéré deux types d’hypothèses :
(A) Le domaine est cylindrique, i.e. D :=]0, T [×D. Les coefficients b, σ sont homogènes en temps et de classe Cb∞
(bornés à dérivées bornées). Le coefficient de diffusion a vérifie (FNC) et une hypothèse de type Hörmander
forte, i.e. seuls les crochets associés à la partie diffusive engendrent l’espace.
Dans ce cadre le noyau de la chaleur tué possède de bonnes propriétés, cf. Cattiaux [Cat91]. Ainsi, lorsque
g|PD\[{T }×DT ] = 0 et que le support de g(T, .) est à une distance positive du bord, il est possible de contrôler
les dérivées de u en adaptant au cas tué les intégrations par parties de Malliavin utilisées par Bally et Talay
[BT96a] (Article [1]).
(B) Le domaine D, les coefficients b, σ, f, g sont suffisamment réguliers et a est uniformément elliptique.
Dans ce cas il est possible d’utiliser des estimées de type Schauder pour les équations dans des domaines non
cylindriques, cf. Lieberman [Lie96] (Article [7]).
Précisons que sous les hypothèses (A) nous avons étudié l’erreur faible sans terme potentiel ni source, i.e.
f = k = 0. En revanche, sous (B) nous avons considéré le cas général de l’équation (2.3). Dans les deux cas
mentionnés, les formules d’Itô-Taylor nécessaires pour contrôler EhD font néanmoins intervenir un développement
en semi-martingale de ΠD̄ (Xth ). En particulier, le contrôle des restes, voir équation (2.6), requiert des estimées
assez fines sur la mesure d’occupation d’un voisinage du bord pour le schéma et sur son temps local au bord, i.e.
temps local de F (t, Xth )t≥0 en 0. Nous renvoyons à l’annexe A de [7] et à la Section 3 de [1] pour des détails.
Sous les hypothèses (A), pour lesquelles g(s, x) = Is=T g0 (x), (s, x) ∈ PD, nous avons établi dans [1] que :
"Z #
T
EhD := Ex [g0 (XTh )Iτ h >T ] − E[g0 (XT )Iτ >T ] = Ex ∂n u(t, Xth )d[F − (Xt∧τ
h
h )] + O(h). (2.6)
0
Ce contrôle illustre l’importance de l’overshoot pour le développement d’erreur. Pour g0 positive, nous avons
déduit de (2.6) dans [1] un encadrement de l’erreur pour h suffisamment petit, i.e. ∃C ≥ 1, C −1 h1/2 ≤ EhD ≤
Ch1/2 , en utilisant la stricte positivité de la dérivée normale. C’est la caractérisation de la loi limite de l’overshoot
qui manquait pour obtenir le développement. C’est précisément cette loi que nous avons pu établir dans [7]
pour des domaines temps-espace vérifiant la condition de frontière non caractéristique (FNC).
Les lois limites d’overshoot ont été étudiées dans de nombreux cadres. Mentionnons les travaux de Siegmund
[Sie79] et Siegmund et Hu [SY82] dans le cas de la marche simple scalaire, ceux d’Alsmeyer [Als94] ou Fuh
et Lai [FL01] pour les chaı̂nes de Markov ergodiques, et enfin Doney et Kyprianou [DK06] pour les processus
de Lévy. Le point commun à toutes ces approches est l’utilisation d’arguments de renouvellement. Une théorie
du renouvellement non linéaire a même été développée afin d’étudier les overshoot de marches aléatoires par
rapport à des frontières courbes, cf. [Woo82] et [Zha88]. Nous étendons ce type de résultats au schéma d’Euler.
15
Théorème 2.2.1 (Lois jointes limites associées à l’overshoot) Supposons que (FNC) est vérifiée, que le
domaine D est de classe C 2 et les coefficients b, σ ∈ C (1+θ)/2,1+θ (D̄) où θ ∈]0, 1[ avec les notations usuelles pour
les espaces de Hölder 2 . Soit ϕ une fonction continue à support compact. Pour tout t ∈ [0, T ], x ∈ D0 , y ≥ 0,
Ex [Iτ h ≤t Zτhh ϕ(Xτhh )IF − (τ h ,X h )≥y√h ] −→ Ex Iτ ≤t Zτ ϕ(Xτ ) 1 − H(y/|∇F σ(τ, Xτ )|) ,
τh h→0
Ry Pn
où H(y) := (E0 [sτ + ])−1 0 P0 [sτ + > z]dz et s0 := 0, ∀n ≥ 1, sn := i=1 Gi , les Gi étant des lois normales
centrées standards i.i.d., τ + := inf{n ≥ 0 : sn > 0}.
En d’autres termes, le triplet (τ h , Xτhh , h−1/2 F − (τ h , Xτhh )) converge donc faiblement vers (τ, Xτ , |∇F σ(τ, Xτ )|Y )
où Y est une variable aléatoire indépendante de (τ, Xτ ) et de fonction de répartition H. En fait, Y est la loi
asymptotique de l’overshoot Brownien, voir [Sie79]. La moyenne de l’overshoot est une quantité importante
E0 [s2τ + ]
qui interviendra dans la procédure de correction de domaine. Notons que E(Y ) = 2E0 [sτ + ] := c0 , et d’après
Siegmund [Sie79]
ζ(1/2)
c0 = − √ = 0.5826... (2.7)
2π
où ζ désigne la fonction de Riemann.
L’idée clé pour prouver le Théorème 2.2.1 est de pratiquer une approximation de la frontière du domaine
par un demi-espace et du schéma d’Euler par un processus à coefficients gelés dans un voisinage du bord. Une
double localisation est toutefois nécessaire, voir Figure 2.2. En effet, l’approximation à domaine et coefficients
constants sera pertinente lorsque le schéma d’Euler se trouve dans un voisinage de taille hα du bord, α > 0. Mais
pour pouvoir appliquer les arguments de renouvellement, il faut également que le schéma d’Euler se trouve hors
d’un voisinage de taille h1/2−ε < hα . Par rapport à l’échelle Brownienne typique de h1/2 , le schéma se trouve
suffisamment loin du bord. Le théorème résulte ensuite de contrôles assez précis sur l’approximation évoquée,
Rd
∂D
1
}∆ 2 −ε
∆α
temps
0 t T
1
Figure 2.2 – Les deux voisinages de localisation avec α < 2 − ε.
avec en particulier des estimées sur les échelles typiques pour les temps de sortie en fonction de l’échelle du
voisinage, voir Section 3 de [7].
16
2.2.3 Correction de domaine
Le Théorème 2.2.2 caractérise précisément la “mauvaise” convergence de l’approximation discrète Qh . De
nombreuses techniques avaient été utilisées numériquement pour y remédier. Mentionnons les approches par
grandes déviations de Baldi et al., [Bal95, BCI99], ou celles par ponts Browniens, pour affiner l’estimation du
temps de sortie entre deux instants de discrétisation, cf. [Gob00, Gob01]. Ces dernières sont néanmoins coûteuses
pour des géométries complexes dans la mesure où il faut procéder à des approximations par plan tangent.
D’autres méthodes numériques ont été développées. Indiquons celles par marches aléatoires sur des sphères,
cf. Milstein [Mil98], ou sur des rectangles, cf. Milstein et Tretyakov [MT99] et Deaconu et Lejay [DL06], qui
sont d’autant plus efficaces que la géométrie du domaine est proche de leur structure naturelle. Nous pensons
néanmoins que notre approche reste une des plus directes.
Par ailleurs, le développement d’erreur du Théorème 2.2.2 ouvre de nouvelles perspectives. Il permet déjà
d’effectuer l’extrapolation de Romberg. Néanmoins, la connaissance explicite de la constante c0 ainsi que la forme
du développement, qui fait intervenir les dérivées normales de la solution de l’EDP (2.3) et le gradient sur la
frontière parabolique de la condition de bord, nous a amenés à proposer une technique alternative d’accélération
de convergence. Celle-ci a par ailleurs un moindre impact sur la variance que l’extrapolation de Romberg.
Il s’agit simplement de stopper à temps discret le processus lorsque ce dernier sort d’un domaine plus petit
que celui initial que l’on déforme suivant une amplitude et une direction qui permettent de supprimer le premier
terme du développement dans (2.8). Précisément, introduisons Dh ⊂ D dont les sections en temps sont définies
par Dth = {x ∈ Dt : d(x, ∂Dt ) > c0 h1/2 |∇F σ(t, x)|}, voir Figure 2.3. Notons τ̂ h = inf{ti > 0 : Xthi ∈ Dthi } le
∂Dt
1111
0000 Dth
0000
1111
0000
1111
0000
1111
0000
1111
0000
1111
temps de sortie discret de Dh . Cette procédure de correction de frontière avait initialement été introduite dans
le cas mono-dimensionnel Brownien par Broadie et al. [BGK99]. Elle amène à simuler la quantité
Z τ̂ h
g(Xτ̂hh )Zτ̂hh + h
Zφ(s) h
f (Xφ(s) )ds. (2.9)
0
R τ̂ h
Notons Q̂h (T, g, f, k, x) := E[g(Xτ̂hh )Zτ̂hh + 0
h
Zφ(s) h
f (Xφ(s) )ds]. Nous avons alors le résultat suivant :
Théorème 2.2.3 (Correction de frontière) Sous les hypothèses du Théorème 2.2.2 et si ∇F (.)|∇F σ(.)| est
de classe C 1,2 , alors pour h suffisamment petit :
√
ÊhD := (Q̂h − Q)(T, g, f, k, x) = o( h).
L’hypothèse supplémentaire sur ∇F (.)|∇F σ(.)| permet d’assurer que le domaine modifié reste de classe C 2 .
L’idée de la preuve repose sur le développement :
Z h Z !
τ̂ τDh ∧T
ÊhD := E[g(Xτ̂hh )Zτ̂hh + h
Zφ(s) h
f (Xφ(s) )ds] − Ex [g(τDh ∧ T, XτDh ∧T )ZτDh ∧T + Zs f (s, Xs )ds]
0 0
Z Z !
τDh ∧T τ ∧T
+ Ex [g(τDh ∧ T, XτDh ∧T )ZτDh ∧T + Zs f (s, Xs )ds] − Ex [g(τ ∧ T, Xτ ∧T )Zτ ∧T + Zs f (s, Xs )ds]
0 0
:= ÊhD,1 + ÊhD,2 ,
où τDh := inf{t > 0 : Xt 6∈ Dth }. Le terme ÊhD,1 est de même nature que EhD . En particulier, les estimées de
type Schauder sur l’EDP associée au domaine Dh sont uniformes pour h petit et la solution de l’EDP dans le
17
domaine perturbé et son gradient vont converger respectivement vers u et ∇u. Le développement du Théorème
2.2.2 va donc rester valable pour ÊhD,1 .
Le terme ÊhD,2 peut être relié à la sensibilité du problème de Dirichlet, cf. Theorème 2.2 dans [CKG06]. Assez
intuitivement, cette sensibilité fait intervenir les gradients de u et g sur la frontière parabolique, l’intensité de
la pertubation, −c0 h1/2 |∇F σ| dans la mesure où l’on rétrécit le domaine, et la direction normale ∇F qui fait
rentrer “le plus vite” dans le domaine. On obtient :
ÊhD,2 = −c0 h1/2 Ex [Iτ ≤T Zτ (∇u − ∇g)(Xτ ) · ∇F (Xτ )|∇F σ(Xτ )|] + o(h1/2 ),
ce qui va exactement compenser le terme du développement du Théorème 2.2.2 et donner l’estimée du Théorème
2.2.3.
Insistons sur le fait qu’il était crucial pour pouvoir effectuer cette correction de connaı̂tre explicitement la
constante c0 dans le développement (2.8). C’est la forme de ce développement qui permet le parallèle avec
la sensibilité du problème de Dirichlet. La connaissance précise de la constante est nécessaire pour prendre la
bonne intensité de perturbation dans le schéma corrigé. Cette technique reste donc très liée au type de problème
considéré.
Nous conclurons en indiquant que le développement d’erreur et la correction associée ont pu être démontrés
sous des hypothèses de type (B), i.e. domaine et coefficients réguliers, uniforme ellipticité, pour un problème
stationnaire, voir Section 4 de [7] et les résultats numériques ci-dessous (Section 2.3). Un autre cadre est celui du
mouvement Brownien tué à la sortie d’un cône, cf. [3]. Ce dernier cas est important en finance où les domaines de
validité des options à barrières sont souvent définis en terme d’espaces produits. Un théorème limite similaire au
Théorème 2.2.1 a été obtenu pour une intersection de demi-espaces. Le développement et la correction n’ont en
revanche été établis en toute généralité que pour des cônes bidimensionnels lorsque g est nulle sur un voisinage
de la singularité du cône. La difficulté est ici de contrôler le gradient de la solution de l’EDP jusqu’au bord,
y compris au voisinage de la singularité. Pour ce dernier point, nous obtenons la régularité gâce à l’hypothèse
sur le support de g et à partir d’un contrôle radial sur les dérivées de la densité du processus tué. Celle-ci se
décompose en une série dont chaque terme fait intervenir une partie sphérique et radiale : la partie sphérique
provient de la décomposition spectrale du Laplacien pour le problème de Dirichlet associé à la trace du cône sur
la sphère, la partie radiale fait intervenir des fonctions de Bessel d’indices associés à la dimension et aux valeurs
propres du Laplacien. Dans le cas bidimensionnel, l’expression explicite de cette densité sous forme de série est
bien connue et s’obtient comme extension de la méthode des images, cf. Carslaw et Jaeger [CJ59]. Dans le cas
d ≥ 2, la formulation générale a été obtenue par Bañuelos et Smits [BS97].
18
h Sans correction Correction de domaine
.1 0.169 (199%) 0.0220 (24.4%)
.05 0.114 (133%) 0.0115 (13.1%)
.01 0.0471 (54.7%) 0.0026 (2.98%)
Table 2.1 – Supremum de la valeur absolue du schéma d’Euler (erreur relative en % entre parenthèses)
( Z !)
MC
X τ h,i
où ErrMC := 1
MC g(Xτh,i
h,i ) + h,i
f (Xφ(s) )ds − u(x0 ). La courbe ainsi obtenue est assez proche d’une
i=1 0
droite de pente 1/2 telle que l’indique le théorème.
3.5
2.5
2
2 2.5 3 3.5 4 4.5 5
-Log(Delta)
Figure 2.4 – Erreur de la méthode de Monte Carlo (sans correction) en fonction de h (échelle logarithmique).
Evaluation en x0 = (−.7, .3, .7).
où τ h := inf{ti := ih : Xti 6∈ D}. Dans le cas tué, i.e. lorsque g(s, x) = Is=T g0 (x), (s, x) ∈ [0, T ] × D̄, et
que g0 bornée vérifie une condition de support, d(supp(g0 ), ∂D) ≥ ε > 0, le résultat précédent s’étend à une
intersection de domaines réguliers.
Extensions et perspectives
Le bilan des travaux [1],[3],[4],[7] est que nous avons pu obtenir dans le cas des processus de diffusion un
développement de l’erreur et une procédure d’accélération de convergence associée en contrôlant précisément
l’overshoot du schéma d’Euler.
Une question naturelle, tant pour la modélisation financière que pour l’approximation numérique d’équations
intégro-différentielles, est celle du comportement de l’erreur faible lorsque le processus dirigeant l’EDS (2.1)
19
comporte une partie de saut. Intuitivement il semble naturel de penser que dans le cas où l’on ajoute dans la
dynamique différentielle les variations d’un processus de Lévy d’intensité finie, il sera possible de distinguer dans
l’analyse de l’erreur les sorties dues aux grands sauts de celles dues à l ’observation discrète du schéma. Par
ailleurs, les propriétés de la solution de l’EDP associée ont été étudiées par Garroni et Menaldi [GM02] dans le
cas elliptique ou Bensoussan et Lions dans le cas parabolique [BL82], cf. Chapitre 3 Section 3. La difficulté reste
de bien contrôler le gradient ponctuellement jusqu’au bord du domaine. Dans ce cadre, l’erreur faible devrait
néanmoins rester du même ordre.
Les résultats numériques de la Section 2.3 suggèrent que sous de bonnes hypothèses de régularité le terme
de reste du Théorème 2.2.3 est un O(h). La question de la poursuite du développement de l’erreur et de la
correction associée aux ordres supérieurs reste ouverte.
Un dernier développement possible de cette thématique est associé à la caractérisation de la régularité des
noyaux de la chaleur dans des domaines non-réguliers. Des techniques variationnelles ont été développées, voir
par exemple Grisvard [Gri92] ou Kozlov et al. [KMR97]. L’approche par décomposition spectrale proposée dans
[BS97] et les contrôles sur le problème elliptique en dimension 2, que l’on peut penser être de même nature que
ceux associés à la trace d’un cône tridimensionnel sur la sphère, devraient permettre de passer à la dimension
3 et de procéder par suite à une sorte de récurrence sur la dimension. Indiquons également que pour des cônes
convexes des techniques de fonctions barrières permettent d’obtenir assez directement la Lipschitz continuité
jusqu’au bord, cf. Chapitre 4, Section 4.4.
20
Chapitre 3
Nous présentons dans ce chapitre les résultats des articles [8] (en collaboration avec V. Konakov de l’Univer-
sité de Moscou et S. Molchanov de l’Université de Charlotte) et [9] (en collaboration avec V. Konakov). Le point
commun à ces deux travaux est l’utilisation de la représentation de la densité de certains processus en terme
de série parametrix. L’idée de cette représentation est ancienne et remonte pour les opérateurs paraboliques
d’ordre deux non dégénérés sous forme non divergence à E. Levi, cf. Friedman [Fri64] pour une présentation.
Elle se base sur une idée de continuité ou de méthode perturbative. En temps petit, la densité d’une EDS à
coefficients variables est a priori proche de la densité d’une EDS à coefficients constants, pour laquelle on a de
bons contrôles de densité. L’idée de la méthode est ensuite d’utiliser les équations de Kolmogorov satisfaites par
ces deux densités pour précisément estimer la différence.
Outre l’approche de Levi, d’autres versions de la méthode parametrix ont été développées. En particulier,
c’est l’approche proposée par McKean et Singer [MS67] pour obtenir des développements asymptotiques du
spectre du Laplacien sur une variété en fonction de sa courbure, qui dans la mesure où elle admet un pendant
discrétisé direct, est la plus propice pour analyser les erreurs associées aux schémas d’approximation. C’est cette
approche qui a permis à Konakov et Mammen d’obtenir dans le cadre des processus de diffusion non dégénérés
inhomogènes un théorème limite local sur les densités pour l’approximation par chaı̂ne de Markov [KM00] ainsi
qu’un développement d’erreur pour le schéma d’Euler [KM02].
Nous présenterons d’abord dans le cadre abstrait des processus de “diffusion-saut” la méthode parametrix de
Mc Kean et Singer, cf. Section 3.1. Nous illustrerons ensuite la robustesse de cette approche pour les problèmes
de discrétisation à travers deux exemples :
- l’approximation par chaı̂ne de Markov de processus dégénérés, qui interviennent entre autres dans des modèles
cinétiques et en finance (options asiatiques), cf. Section 3.2 et article [8].
- le développement d’erreur pour des EDS dirigées par des processus stables. cf. Section 3.3 et article [9].
pour t ≥ 0, a(t, .) matrice de diffusion semi-définie positive, b(t, .) coefficient de dérive borné, ν mesure de Lévy
et ϕ ∈ C0∞ (Rd ) fonction test. Les opérateurs de la forme 3.1 vérifient le principe du maximum faible et sont
quasi locaux, i.e. si supp(ϕ) ∈ B(x, ε), |Lt ϕ(x)| ≤ Cε |ϕ|∞ , cf. Hille and Philips [HP57].
Intuitivement, pour h > 0 petit, l’incrément Xt+h − Xt est “proche” de l’incrément du processus à accrois-
sements indépendants et stationnaires (PAIS) de caractéristiques gelées en b(t, Xt ), a(t, Xt ), ν(t, Xt , .). C’est là
l’idée qui est à la base de l’approche de Levi. Supposons désormais que le processus X admet pour tout t > 0
21
une densité p par rapport à la mesure de Lebesgue et que l’on s’intéresse à l’estimation de p(t, t + h, Xt , x′ ),
i.e. densité en t + h au point x′ . Il est alors également naturel de dire que l’accroissement Xt+h − Xt est
proche de celui du PAIS de caractéristiques gelées en espace au point final où l’on considère la densité, i.e.
b(t, x′ ), a(t, x′ ), ν(t, x′ , .). Cette autre approximation est à la base du travail de Mc Kean et Singer.
Pour obtenir une représentation de la densité p à partir de ces approximations heuristiques, il faut ensuite
quantifier précisément l’erreur d’approximation. Comme l’on a supposé que X admettait une densité pour tout
′
t > 0 il en est de même pour le processus à caractéristiques gelées. Notons p̃x cette densité, où l’indice x′
′
indique explicitement le point de congélation, et L̃x son générateur :
Z
′ 1 hy, ∇ϕ(x)i
L̃xt ϕ(x) = hb(t, x′ ), ∇ϕ(x)i + tr a(t, x′ )Dx2 ϕ(x) + ϕ(x + y) − ϕ(x) − 2
ν(t, x′ , dy).
2 R d 1 + |y|
(3.2)
Sous de bonnes hypothèses, la densité p vérifie les équations de Kolmogorov progressives et rétrogrades, i.e
où L∗t désigne l’adjoint formel de Lt (nous n’avons en effet pas précisé d’hypothèses de régularité sur les
′
coefficients dans (3.1)). La densité p̃x vérifie également l’équation rétrograde :
′ ′ ′ ′
∂s p̃x (s, t, x, y) = −L̃xs p̃x (s, t, x, y), t > s, (x, y) ∈ (Rd )2 , p̃x (s, t, ., y) → δy (.). (3.4)
s↑t
Ainsi,
Z t Z
x′ ′ ′
(p − p̃ )(s, t, x, x ) = du∂u dzp(s, u, x, z)p̃x (u, t, z, x′ )
s Rd
Z t Z
′ ′
= du dz ∂u p(s, u, x, z)p̃x (u, t, z, x′ ) + p(s, u, x, z)∂u p̃x (u, t, z, x′ )
s Rd
Z t Z
′ ′ ′
= du dz L∗u p(s, u, x, z)p̃x (u, t, z, x′ ) − p(s, u, x, z)L̃xu p̃x (u, t, z, x′ )
s Rd
Z t Z
′ ′
= du dzp(s, u, x, z)(Lu − L̃xu )p̃x (u, t, z, x′ ), (3.5)
s Rd
où l’on utilise la convergence vers la masse de Dirac pour la première égalité, les équations de Kolmogorov (3.3)
et (3.4) pour la troisième et le passage à l’adjoint pour la dernière. Nous avons aussi formellement dérivé sous
l’intégrale en espace pour la deuxième égalité. Z Z t
Introduisons la notation f ⊗ g(s, t, x, x′ ) = du dzf (s, u, x, z)g(u, t, z, x′) pour la convolution temps-
s Rd
′ ′
espace et posons p̃(s, t, x, x′ ) := p̃x (s, t, x, x′ ), H(s, t, x, x ) := (Ls − L̃xs )p̃(s, t, x, x′ ). L’équation (3.5) se réécrit
′
alors :
(p − p̃)(s, t, x, x′ ) = p ⊗ H(s, t, x, x′ ).
A partir de cette expression, l’idée est ensuite d’itérer cette procédure pour p(s, u, x, z) dans (3.5) en utilisant
cette fois ci la densité de transition d’un processus de caractéristiques gelées en z variable d’intégration. On fait
de la sorte apparaı̂tre les convolutions itérées du noyau H pour obtenir le développement formel :
∞
X
p(s, t, x, x′ ) = p̃ ⊗ H (r) (s, t, x, x′ ), (3.6)
r=0
où H (0) = I, H (r) = H ⊗ H (r−1) , r ≥ 1. Déduire des estimées sur p à partir de l’expression formelle (3.6)
suppose d’avoir de bons contrôles sur le membre de droite. De façon générale, on utilisera les contrôles a priori
connus sur la densité gelée et des propriétés de régularisation du noyau de convolution H. Nous renvoyons à la
Section 3.1.2 pour une illustration dans le cas des diffusions.
Nous avons jusqu’à présent supposé l’existence de la densité p. Lorsque les coefficients dans (3.1) sont réguliers
(en particulier Lipschitz continus en espace), il est facile de voir Xt comme la solution forte d’une EDS. Sous
des hypothèses de non dégénérescence des coefficients, le calcul de Malliavin permet d’obtenir l’existence et la
22
régularité de la densité, voir Norris [Nor86] pour le cadre de diffusions hypoelliptiques homogènes, Cattiaux et
Mesnager [CM02] pour le cas inhomogène, et Bichteller et al. [BGJ87] pour le cas avec sauts.
Réciproquement, il est toujours possible de partir du terme de droite de l’équation (3.6) résultant du
précédent développement formel. Si la série ainsi que ses dérivées par rapport aux variables de temps et d’espace
sont bien définies, il vient bien par construction que p est une solution des équations de Kolmogorov. Le principe
du maximum donne l’unicité. Si cette procédure aboutit, on construit bien ainsi l’unique solution fondamentale
de l’EDP parabolique intégro-différentielle associée à (3.1). L’identification à la densité du processus de Markov
de générateur (3.1) se fait ensuite par un argument à la Dynkin, cf. Théorème 2.3 de [Dyn63] .
C’est ce que nous allons faire dans la section suivante dans le cadre de processus de diffusion inhomogènes
à coefficient de diffusion uniformément Hölder continu en espace, mesurable en temps et dérive bornée.
où l’on utilise la η-Hölder continuité de a pour compenser la singularité en temps non intégrable des termes
d’ordre 2 en modifiant le c pour la dernière inégalité. Le noyau H est donc régularisant, au sens où lorsqu’on le
convole on obtient :
∃C := C(T, Λ, |b|∞ , η), c := c(Λ, η), ∀r ≥ 1,
r+1
Y
′ (i − 1)η η
|p̃ ⊗ H (r)
(s, t, x, x )| ≤ C r+1 rη/2
(t − s) B 1+ , pc (t − s, x, x′ ), (3.9)
i=1
2 2
R1
où B(m, n) := 0 sm−1 (1 − s)n−1 ds désigne la fonction β. Pour t − s petit, ce terme est donc de plus en plus
négligeable lorsque r croı̂t.
De (3.9) et (3.6) on déduit directement des asymptotiques de la fonction β une borne supérieure de type Aron-
son pour p ainsi définie, i.e. ∃C := C(T, Λ, |b|∞ , η), c := c(Λ, η), ∀0 ≤ s < t ≤ T, (x, x′ ) ∈ (Rd )2 , p(s, t, x, x′ ) ≤
Cpc (t − s, x, x′ ).
Par ailleurs, l’équation (3.6) permet de justifier que p vérifie l’équation de Kolmogorov rétrograde (∂s +
Ls )p(s, t, x, x′ ) = 0, 0 ≤ s < t ≤ T . La propriété régularisante en temps de H, cf. (3.9), permet ensuite
de déduire p(s, t, ., x′ ) → δx′ (.). On a donc bien construit une solution fondamentale de l’EDP parabolique.
s↑t
L’identification avec la densité de transition du processus X solution du problème de martingale se fait de façon
standard, cf. Chapitre 3 de [SV79] ou Dynkin [Dyn63].
23
3.1.3 Représentation parametrix pour un schéma de discrétisation
Considérons un processus de diffusion-saut (Xt )t≥0 à valeurs dans Rd de dynamique :
Z t Z t
Xt = x + b(s, Xs− )ds + σ(s, Xs− )dZs , (3.10)
0 0
pour (Zt )t≥0 processus de Lévy dont le générateur peut se mettre sous la forme (3.1) et admet une densité.
Supposons également que Xt possède pour tout t ∈ (0, T ], T > 0 fixé, une densité que l’on peut exprimer sous
la forme (3.6).
Soit h > 0 un pas de discrétisation tel que T /h = N ∈ N∗ et {(ti = ih)i∈[[0,N ]]} la grille temporelle associée.
Une approximation naturelle de (3.10) par chaı̂ne de Markov est donnée par le schéma
h
Xthi+1 = Xthi + b(ti , Xthi )h + σ(ti , Xthi )ξi+1 , i ∈ [[0, N − 1]], X0h = x, (3.11)
(loi)
où les (ξih )i∈N∗ sont des variables à densité i.i.d. qui approchent l’incrément Zti+1 − Zti = Zh (i.e. Z0 = 0). Si
le coefficient σ vérifie une hypothèse de non-dégénérescence, alors pour tout i ∈ [[1, N ]], Xthi admet une densité.
Notons ph cette densité.
La méthode parametrix de Mc Kean et Singer présentée en Section 3.1 présente le grand avantage de
pouvoir assez directement se transposer au cas discret et d’établir une représentation de ph similaire à (3.6). Si
l’on s’intéresse à la représentation de la densité ph (tj , tj ′ , x, x′ ), 0 ≤ j < j ′ ≤ N , l’idée analogue au cas continu
′
est d’introduire une chaı̂ne de Markov X̃ h,x à coefficients gelés au point d’arrivée x′ où l’on considère la densité.
Sa dynamique s’écrit,
′ ′ ′
X̃th,x
i+1
= X̃th,x
i
+ b(ti , x′ )h + σ(ti , x′ )ξi+1
h
, i ∈ [[j, j ′ − 1]], X̃th,x
j
= x. (3.12)
′
On notera p̃h,x sa densité. Introduisons désormais les analogues discrets des générateurs définis en (3.1) et (3.2).
Soit pour ϕ ∈ C0∞ (Rd ) et j ∈ [[0, j ′ ),
′ ′
E[ϕ(Xthj +h )|Xthj = x] − ϕ(x) ′
e h,x )|X
E[ϕ(X eth,x = x] − ϕ(x)
e h,x tj +h
Lhtj ϕ(x) =
j
, et L tj ϕ(x) = .
h h
′
En utilisant la notation peh (tj , tj ′ , x, x′ ) = peh,x (tj , tj ′ , x, x′ ), on définit de façon similaire à (3.8) le noyau discret
H h par
′
H h (tj , tj ′ , x, x′ ) = Lhtj − L e h,x
tj peh (tj + h, tj ′ , x, x′ )
Z h i
′ ′
= h−1 ph − peh,x (tj , tj+1 , x, z)e ph,x (tj+1 , tj ′ , z, x′ )dz, 0 ≤ j < j ′ ≤ N.
Rd
Une simple manipulation algébrique, cf. Lemme 3.6 de [KM00], permet ensuite d’établir que pour 0 ≤ tj <
tj ′ ≤ T ,
′
jX −j
′
h
p (tj , tj ′ , x, x ) = peh ⊗h H h,(r) (tj , tj ′ , x, x′ ), (3.13)
r=0
P ′ −j−1 R
où f ⊗h g(tj , tj ′ , x, x′ ) = jk=0 h Rd g(tj , tj+k , x, z)f (tj+k , tj ′ , z, x′ )dz est l’opérateur de convolution discret
h,(0) h,(r)
et H = I et H = H ⊗h H h,(r−1) , r ≥ 1.
h
D’après (3.6) et (3.13), les densités respectives du processus X et de son schéma d’Euler X h peuvent se
représenter sous des formes similaires. Les étapes pour contrôler l’écart (p − ph )(0, T, x, x′ ) sont les suivantes :
1. Contrôler les queues de la série dans (3.6), i.e. les termes r ≥ N .
2. Quantifier l’impact de la discrétisation de l’opérateur de convolution dans (3.6), i.e. lorsque l’on remplace ⊗
par ⊗h dans le développement tronqué en r = N .
3. Contrôler la convergence de p̃h vers p̃.
4. Appliquer des arguments fins de stabilité pour quantifier les différences entre les noyaux de convolution continus
H et discrets H h .
24
Dans [KM00], Konakov et Mammen ont pu appliquer ce programme pour des processus de diffusion inhomogènes
à coefficients bornés Lipschitziens et non dégénérés, i.e. la matrice de diffusion a est uniformément elliptique.
Dans ce cadre, c’est l’étape 3. qui donne la vitesse de l’erreur d’approximation qui est de h1/2 et qui est celle
du théorème limite local sur les densités en régime Gaussien, cf. Bhattacharya et Rao [BR76]. Les auteurs
′
−x S −1
établissent que |(p − ph )(0, T, x, x′ )| ≤ h1/2 π(T, x, x′ ), π(T, x, x′ ) ≤ CT −d/2 (1 + | xT 1/2 | ) où l’exposant S est
fonction des propriétés d’intégrabilité des variables (ξih )i≥1 et C est une constante dépendant des coefficients,
uniforme sur les compacts en temps. Ces mêmes techniques leur ont permis d’établir des asymptotiques précises
de l’erreur en temps T petit [KM09].
h
Lorsque les ξi+1 ont même loi que l’accroissement Zti+1 − Zti , i.e. X h est le schéma d’Euler, l’étape 3.
ci-dessus n’est pas nécessaire. On retrouve alors que l’erreur dominante est celle associée à la discrétisation de
l’opérateur de convolution qui est intuitivement de l’ordre de h. C’est ce qu’ont montré Konakov et Mammen
[KM02] pour des processus de diffusion homogènes non dégénérés à coefficients bornés et Lipschitziens, i.e.
pour T = 1, (p − ph )(1, x, x′ ) = hπ(1, x, x′ ) + h2 r(1, x, x′ ), (|π| + |r|)(1, x, x′ ) ≤ C exp(−c|x − x′ |2 ), C :=
C(1, Λ, |b|∞ ), c := c(Λ). L’extension au cas inhomogène ne présente pas de difficultés et se ferait suivant la
même procédure.
Un développement au même ordre a été obtenu dans le cadre hypoelliptique par Bally et Talay [BT96b] pour
un schéma d’Euler perturbé. L’une des difficultés dans ce cadre est en effet de prouver l’existence d’une densité
pour le schéma d’approximation ce que permet la perturbation. Nous avons retrouvé cette difficulté dans [8]
que nous présentons dans la section suivante.
25
Kolmogorov, soit pour T > 0 fixé,
∃C := C(T, Λ, |b|∞ ), c := c(Λ), ∀(t, x, x′ ) ∈ (0, T ] × Rd × Rd , p(t, x, x′ ) ≤ Cpc (t, x, x′ ),
√ !d/2 ′ x +x′
′ 3c |x1 − x1 |2 |x′2 − x2 − 1 2 1 t|2
pc (t, x, x ) := exp −c + 3 . (3.15)
2π(t − s)2 4t t3
A la Section 3.1.2 nous avons gelé les coefficients au point d’arrivée où l’on souhaitait estimer la den-
sité. Au vu des contrôles (3.7) et de la définition de l’opérateur de convolution (3.8), cela permettait en
effet bien d’équilibrer la singularité associée au termes d’ordre deux. Le point clé est qu’il y avait dans ce
cas “compatibilité” entre le terme apparaissant dans l’exponentielle exp(−c|x′ − x|2 /t) et celui résultant de
′
−x|η −1+η/2
|a(t, x) − a(t, x′ )|t−1 ≤ C |xtη/2 t , i.e. cette singularité était compensée par l’exponentielle. Dans le cas
présent ce choix de processus gelé n’est pas satisfaisant dans la mesure où il ne permet pas de prendre en compte
le transport de la condition initiale pour la deuxième composante qui apparaı̂t dans l’expression explicite (3.15).
Pour adapter la méthode de Mc Kean et Singer au cas de processus à coefficient de dérive non borné, l’idée est
de construire un processus Gaussien à coefficients gelés qui permette d’avoir lors de la différence des générateurs
un terme homogène à la composante dans l’exponentielle. Le candidat naturel est :
Z s
e 1,t,x′
Xs = x1 + σ(x′1 , x′2 − x′1 (t − u))dWu + b(x′1 , x′2 )s,
0
Z s
Xes2,t,x′ = x2 + eut,x′ du, s ∈ [0, t].
X (3.16)
0
En effet, les parties dégénérées des deux générateurs sont les mêmes et se simplifient. Par ailleurs, la différence
entre les termes d’ordre 2 des générateurs de (3.14) et (3.16) est dominée par |a(x′1 , x′2 −x′1 t)−a(x)|t−1 p̂c (t, x, x′ ) ≤
x′ +x
C(|x′1 − x1 |(1 + 2t ) + |x′2 − x2 − 1 2 1 t|)t−1 p̂c (t, x, x′ ) ≤ Ct−1/2 pc (t, x, x′ ) grâce à l’hypothèse de Lipschitz conti-
nuité de a et avec une modification de c pour la dernière inégalité. Ce qui permet bien de rattrapper la singularité.
Nous pouvons ainsi retrouver sous nos hypothèses courantes, plus faibles, le contrôle de type Aronson obtenu
dans [Web51].
Proposition 3.2.1 Soit T > 0 fixé. Sous (UE), (S), il existe des constantes C := C(T, Λ, |b|∞ ), c := c(Λ)
telles que pour tout (t, x, x′ ) ∈ (0, T ] × (Rd )2 ,
p(t, x, x′ ) ≤ Cpc (t, x, x′ ),
où pc est défini en (3.15).
En fait, de façon similaire à la Section 3.1.2, il suffit pour obtenir cette borne de considérer le coefficient a,
η-Hölder continu en espace et b borné. De même une dépendance en temps des coefficients n’induirait aucune
difficulté additionnelle.
Pour conclure cette partie, mentionnons que le choix des paramètres de congélation qui permet de contrôler
le développement (3.6) est fortement lié à la métrique dérivant du problème de contrôllabilité déterministe
associé à l’EDS de départ. Le terme dans l’exponentielle apparaı̂t alors comme l’énergie du contrôle optimal qui
permet de joindre x à x′ en un temps t. Nous reviendrons en détails sur ce point au Chapitre 5.2.
où les (ξei )i∈N∗ sont des variables centrées i.i.d. de densité q, de covariance l’identité. Si l’on itère n fois le schéma
il vient
′ p
Xeth0 ,1,t,x = x1 + (nh0 )b(x′ ) + σ(x′1 , x′2 − x′1 t) nh0 ξen(1) ,
n
eth0 ,2,t,x = x2 + (nh0 )x1 + γn (nh0 )2 b(x′ ) + (nh0 )3/2 σ(x′1 , x′2 − x′1 t)ξen(2) ,
′
X (3.18)
n
2
26
(1) Pn e ξen(2) = Pn n−(i−1) e
où γn = (1 + n1 ) et ξen = √1
n i=1 ξi ,
√1
n i=1 ( n )ξi .
Sous des hypothèses d’intégrabilité et régularité de la densité q des (ξei )i∈N∗ , on peut montrer en calcu-
(1) (2)
lant explicitement la fonction caractéristique que pour n suffisamment grand (ξen , ξen ) admet une densité qn
possédant des propriétés
de régularité et intégrabilité
similaires à celles de q, cf. Proposition 4.2 de [8].Par
(1) (2) 1 γn /2 1 1/2
ailleurs Cov(ξen , ξen ) = qui est “proche” pour n grand de =
γn /2 1/3γn (1 + 1/(2n)) 1/2 1/3
R1
Cov(W1 , 0 Ws ds).
Si l’on pose maintenant h := nh0 , pas de temps “macroscopique”, et que l’on s’intéresse à l’approximation
de la densité en tj := jh, j ∈ (0, N ]], N h = T , on introduit le schéma gelé agrégé, dérivant de (3.18) et résultant
du regroupement de n itérations de (3.17) où l’on prend t = tj − ti au ième instant de discrétisation de l’échelle
′
macroscopique. Précisément, pour (x, x′ ) ∈ R2d × R2d , j ∈ (0, N ]] on définit X e h,tj ,x = x et pour i ∈ [[0, j − 1]],
0
′ ′ √ 1
eth,1,tj ,x
X eth,1,tj ,x
= X + b(x′ )h + σ(x′1 , x′2 − x′1 (tj − ti )) he
ηi+1 ,
i+1 i
n √ 2 o
eth,1,tj ,x + γn b(x′ )h + σ(x′1 , x′2 − x′1 (tj − ti )) he
′ ′ ′
eth,2,tj ,x
X eth,2,tj ,x
= X + X ηi+1 h, (3.19)
i+1 i i
2
où les variables i.i.d. (η̃i1 , η̃i2 )i∈(0,j]] ont pour densité qn (.).
Le schéma précédent guide le choix de la dynamique de la chaı̂ne de Markov qui va approcher X solution
de (3.14). Soit pour (x, x′ ) ∈ R2d × R2d , X0h = x et pour i ∈ [[0, N − 1]],
√ 1
Xth,1i+1
= Xth,1
i
+ b(Xthi )h + σ(Xthi ) hηi+1 ,
γ n
√ 2
Xth,2 = Xth,2 + (Xth,1 + b(Xthi )h + σ(Xthi ) hηi+1 )h, (3.20)
i+1 i i
2
où les (ηi1 , ηi2 )i∈(0,N ]] ont également pour densité qn .
En résumé, l’itération du schéma “naturel” gelé (3.17) permet d’obtenir une densité après suffisamment de
pas de temps “microscopiques”. Ceci donne la forme du schéma gelé à l’échelle “macroscopique”, cf. (3.19).
La structure de ce schéma donne ensuite celle de la chaı̂ne de Markov associée à l’approximation du processus
initial. A partir des équations (3.20), (3.19), on peut obtenir pour la densité ph de la chaı̂ne de Markov X h une
représentation de type (3.13) où p̃h est la densité associée à (3.19). Cette représentation sera comparable au
développement (3.6) obtenu pour le processus continu à la Section 3.2.1 à partir de (3.16). En suivant ensuite
le programme détaillé en fin de Section 3.1.3 on obtient :
Théorème 3.2.1 (Théorème limite local pour les densités) . R
Supposons (UE) et (B). Si pour tout multi-indice de dérivation ν, |ν| ≤ 4, Rd |u|S |Duν qn (u)|du < +∞, S >
4(d + 1) + 2d2 , alors ∃c > 0,
" ′ #−1
′ ′ ′ ′ x1 + x1
sup (1 + |x1 | + |x1 |) sup pc (T (1 + δ), x, x ) + χT 1/2 x1 − x1 , x2 − x2 − T
x,x′ ∈R2d δ∈[0,1] 2
×|ph (T, x, x′ ) − p(T, x, x′ )| = O(h1/2 ),
où pc est défini en (3.15) et ∀u = (u1 , u2 ) ∈ R2d ,
(S−4)/4d−1 !−1
−2d u1 2 u2 2
χT 1/2 (u) = T 1+ + 3/2 .
T 1/2 T
La vitesse de convergence reste celle du théorème limite local Gaussien dans la mesure où la densité p̃ du
processus gelé continu (3.16) reste Gaussienne. L’ordre de h1/2 est celui de la convergence de p̃h vers p̃. Le
terme en pc provient d’une correction technique nécessaire pour traiter le coefficient non borné dans l’analyse
de stabilité.
Pour illustrer ce résultat on peut considérer l’exemple de l’approximation numérique de Px [(T −1 XT2 −XT1 )+ >
K] pour K > 0 donné. Cette quantité correspond en finance au prix d’une option Call digital de maturité T
lorsque la dynamique de l’actif est donnée par la première composante de (3.14). Si l’on associe maitenant les
composantes du système (3.14) à la vitesse et à la position d’une particule, Px [(T −1 XT2 − XT1 )+ > K] est un
quantile de la partie positive de l’écart entre vitesse moyenne et vitesse instantanée en T . Le théorème limite
local 3.2.1 permet de directement relier les densités des objets discrets et continus de dynamiques respectives
données en (3.14) et (3.20). Cette approche est préférable à une discrétisation de la composante non-dégénérée
associée une estimation numérique de l’intégrale dans la mesure où dans ce cas là le schéma d’approximation
peut ne pas avoir de densité.
27
3.3 Approximation d’EDS dirigées par un stable : développement
d’erreur des densités
On présente ici les résultats de l’article [9]. Nous considérons le cas où X à valeurs dans Rd suit une dyna-
mique de type (3.10). Les coefficients b, σ sont homogènes en temps et Z est un processus α-stable symétrique,
i.e.
Z t Z t
Xt = x + b(Xs− )ds + σ(Xs− )dZs ,
0 0
et pour t ≥ 0, u ∈ Rd ,
Z
E[exp(ihu, Zt i)] = exp(ithγ, ui − t |hs, ui|α λ(ds)), (3.21)
S d−1
où λ est une mesure symétrique sur la sphère unité S d−1 , α ∈ (0, 2). On exclut le cas Brownien pour lequel on
peut se reporter à [KM02] pour des résultats similaires.
Dans ce cadre, le schéma d’Euler associé à (3.11) est bien défini et explicitement simulable, cf. [PT97] ou
[ST94]. Pour un pas h > 0 et la grille de discrétisation {(ti := ih)i∈N∗ } associée, on pose X0h = x et pour i ≥ 0,
En revanche, les hypothèses d’intégrabilité sur la mesure de Lévy requises dans Protter et Talay [PT97] pour
l’analyse de l’erreur faible ne sont pas satisfaites par les processus stables. Ces derniers ont en effet des queues
lourdes. Dans le cas monodimensionnel et pour des fonctions tests bornées, le contrôle de l’erreur faible avait
été obtenu par Hausenblas [Hau02] à l’aide du calcul de Malliavin. L’approche parametrix permet de contrôler
l’erreur entre les densités.
Sous de bonnes hypothèses spécifiées ci-après, Kolokoltsov a donné une représentation en série (3.6) de la
densité p de X. Il a également établi des contrôles à la Aronson avec une échelle de temps caractéristique en
t1/α généralisant le cas Gaussien, cf. Théorème 3.2 de [Kol00]. Nous avons de façon similaire au procédé présenté
en Section 3.1.3 obtenu le développement (3.13) pour la densité du schéma d’Euler. En suivant le programme
détaillé en fin de Section 3.1.3 nous avons pu établir un développement d’erreur sur les densités à l’ordre h. Pour
ce faire il a fallu dans l’analyse de stabilité raffiner les arguments de [Kol00] et utiliser des découpages minutieux
dans les parties d’analyse de Fourier utilisées pour représenter densités gelées et noyau de convolution.
Soit q ∈ N∗ . Introduisons les hypothèses
(A1-q) Pour d ≥ 2, la mesure sphérique λ a une densité de surface C q (S d−1 ) et pour d ≥ 1, il existe 0 < C1 ≤
C2 < +∞, ∀p ∈ Rd , Z
α
C1 |p|α ≤ |hp, si| λ (ds) ≤ C2 |p|α .
S d−1
(A2-q) Les coefficients b, σ et leurs dérivées jusqu’ à l’ordre q sont uniformément bornées. Ainsi, pour 1 < α < 2,
B(x) := b(x) + σ(x)γ est uniformément borné. On suppose pour 0 < α ≤ 1, que B(x) = 0 pour tout x ∈ Rd .
(A3) Il existe Λ ≥ 1 tel que pour tout x ∈ Rd , ξ ∈ Rd , Λ−1 |ξ|2 ≤ hσ(x)ξ, ξi ≤ Λ|ξ|2 .
Les hypothèses (A1-q) et (A3) sont des hypothèses classiques de non-dégénérescence, de la mesure sphérique
λ et du coefficient σ.
La condition de dérive nulle dans (A2-q) provient du fait que pour α ∈ (0, 1] l’ajout d’une dérive d’ordre t
ne correspond pas en temps petit à un terme négligeable par rapport à l’échelle caractéristique en t1/α . Nous
renvoyons à l’Appendice B de [9] pour des détails.
Théorème 3.3.1 Supposons q > d+ 4 et que (A1-q), (A2-q) vérifiées. Soit 0 < M ≤ q − (d+ 4).
et (A3) sont
1
Il existe une fonction RM (T, x, y), où |RM (T, x, y)| ≤ CM (T ) 1+|y−x|d+α := ρα,M (T, y−x) pour une constante
positive CM (T ), telle que
M−1
X hl
(p − ph )(T, x, y) = π h (T, x, y) + hM RM (T, x, y) ,
(l + 1)! l
l=1
PM−1
où l=1 πlh (T, x, y) ≤ ρα,M (T, y − x), i.e. les contrôles sur les (πlh )l∈[[1,M−1]] sont uniformes en h.
28
Les termes dans le développement précédent dépendent de h. Il est néanmoins possible de faire des dévelop-
pements supplémentaires des quantités πlh de sorte à obtenir des termes indépendants de h dans l’expression
ci-dessus, ce que l’uniformité en h du contrôle laisse d’ailleurs à penser.
Le théorème précédent permet également de relâcher l’hypothèse de bornitude de la fonction test de [Hau02]
et d’obtenir un développement de l’erreur faible EhD := Ex [g(XTh )] − Ex [g(XT )] pour des fonctions g mesurables
vérifiant la condition de croissance ∃C > 0, ∀x ∈ Rd , |g(x)| ≤ C(1 + |x|β ), β < α, qui est optimale pour le cas
considéré. En particulier aucune hypothèse de régularité sur g n’est ici requise, contrairement aux approches
utilisées dans [TT90], [PT97]. Rappelons que d’un point de vue numérique, le développement de l’erreur faible
permet d’utiliser la méthode d’extrapolation de Romberg Richardson pour accélérer la convergence, cf. Chapitre
1.3.1.
Enfin, le développement du Théorème 3.3.1 est utile pour étudier la sensibilité de l’erreur faible EhD par
rapport à x sans conditions supplémentaires sur g. Ce point est fondamental pour les applications en finance
(couverture). Nous renvoyons à Guyon [Guy06] pour des détails das le cas diffusif.
Extensions et perspectives
Nous avons dans les articles [8],[9] utilisé la méthode parametrix de McKean et Singer qui dans des cas non
dégénérés ou faiblement dégénérés est très robuste et se prête naturellement à la discrétisation.
Pour l’instant les théorèmes limites locaux sur les densités ont été obtenus à partir des développements
parametrix (3.6), (3.13) et du théorème limite local en régime Gaussien. Il serait intéressant d’étendre ce type
de résultats à des processus dont la densité n’a pas de comportement de type Gaussien. A titre d’exemple, si
l’on remplace en Section 3.3 les accroissements stables par des variables i.i.d. renormalisées qui sont dans le
bassin d’attraction de la loi stable initiale, quel type de théorème limite local peut-on espérer établir ? Quelle
serait la vitesse en fonction de l’indice α du stable ?
Nous avons également jusqu’à présent toujours énoncé des résultats à horizon T > 0 fini. Dans le cas où
le processus admet une mesure invariante la question de l’existence du théorème limite local et de la vitesse
associée pour une estimation par chaı̂ne de Markov, éventuellement à pas décroissant, reste ouverte.
29
Chapitre 4
Approximation d’Equations
Différentielles Rétrogrades (EDSR)
Nous présentons dans ce chapitre les travaux [2], [5] (en collaboration avec F. Delarue de l’Université
de Nice), [6] (en collaboration avec B. Bouchard de l’Université Paris Dauphine) relatifs à l’approximation
d’équations différentielles stochastiques (progressives) rétrogrades (EDS(P)R). Introduites par Pardoux et Peng
[PP90], les EDSR ont permis d’étendre les réprésentations de Feynman-Kac à des EDP paraboliques ou ellip-
tiques semi ou quasi-linéaires. Ce sont par ailleurs des objets qui apparaissent de façon naturelle en finance, cf.
El Karoui et al. [KPQ97], dans la mesure où les problèmes de réplication d’options se formulent directement en
terme d’EDSR.
C’est un sujet qui a fait l’objet d’une active recherche tant du point de vue théorique que numérique.
Nous présenterons en Section 4.1 un bref aperçu de la théorie des EDSR et de leurs liens avec les EDP non
linéaires. En terme numérique l’approximation d’EDSR fournit un procédé alternatif aux méthodes déterministes
de différences/éléments finis pour les problèmes non linéaires. Nous verrons ci-après que la complexité des
algorithmes proposés dépend de façon hautement non linéaire de la dimension du problème sous-jacent. On
ne retrouve donc pas la complexité linéaire en la dimension spécifique des méthodes de Monte Carlo pour
l’approximation probabiliste de solutions d’EDP linéaires et l’on se heurte à la “fléau de la dimension” bien
connue dans les approximations numériques déterministes d’EDP.
Cette compléxité provient de l’estimation d’espérances conditionnelles, qui est une étape inévitable pour
l’approximation d’EDSR. Trois grands types de techniques ont été introduites à cet effet :
- Les méthodes de Monte Carlo associées à des estimateurs dérivant du calcul de Malliavin. Cette approche a
été développée par Bouchard et Touzi [BT04] pour des EDSR faiblement couplées.
- Les méthodes de régression linéaire, utilisées par Gobet et al. [GLW05] toujours dans le cadre des EDSR
faiblement couplées.
- Les méthodes de quantification, introduites par Bally et Pagès dans le cadre des EDSR réfléchies, problème
d’arrêt optimal pour les options américaines [BP03]. Le premier algorithme de discrétisation d’EDSR proposé
par Chevance [Che97] dans un cadre plus restrictif utilise pour l’estimation des espérances conditionnelles une
méthode qui s’apparente à cette approche. C’est par ailleurs celle que nous avons utilisée dans [2] et [5].
Nous présenterons brièvement en Section 4.2 les algorithmes de [BT04] et [GLW05]. En retenant l’approche
par quantification pour l’approximation des espérances conditionnelles, nous avons pu dans [2], [5] proposer
des schémas de discrétisation d’EDSR fortement couplées associées à des EDP quasi-linéaires. Nous détaillerons
ces algorithmes en Section 4.3. Enfin, nous développerons en Section 4.4, les résultats de [6] où nous avons
analysé l’erreur forte d’un schéma de semi-discrétisation, i.e. on ne propose pas de schéma d’approximation des
espérances conditionnelles, pour une EDSR dans un domaine.
4.1 Quelques résultats sur les EDSR et lien avec les EDP
4.1.1 Introduction à la solvabilité des EDSR et couplage faible
La dynamique d’une EDSR s’écrit de façon générique
Z T Z T
Yt = ξ + f (s, Ys , Zs )ds − Zs dWs , t ∈ [0, T ], (4.1)
t t
31
où (Wt )t≥0 est un mouvement Brownien standard d-dimensionnel sur un espace de probabilité (Ω, F , P) de
filtration naturelle (Ft )t≥0 et T > 0 est un instant arbitraire. La condition terminale ξ est FT mesurable et
généralement supposée de carré intégrable. Le coefficient f est appelé générateur de l’EDSR. Ce dernier peut être
aléatoire à condition de supposer que le processus (f (t, y, z))t≥0 est pour tout (y, z) progressivement mesurable.
Un exemple typique de dépendance aléatoire du générateur est fourni par le couplage faible avec une EDS
progressive, i.e. f s’écrit f (s, Xs , Ys , Zs ), ξ = g(XT ) où X est la solution d’une EDS progressive. L’EDSR
faiblement couplée s’écrit alors :
Z T Z T
Yt = g(XT ) + f (s, Xs , Ys , Zs )ds − Zs dWs ,
t t
Z t Z t
Xt = x + b(s, Xs )ds + σ(s, Xs )dWs , t ∈ [0, T ]. (4.2)
0 0
Ce sont les EDSR de type (4.2) qui permettent d’établir une connexion avec les EDP semi-linéaires.
Principes de résolution
Résoudre une EDSR de type (4.1) consiste à trouver un couple (Yt , Zt )t∈[0,T ] progressivement mesurable
tel que (4.1) soit vérifiée pour tout t ∈ [0, T ], P-presque sûrement. L’hypothèse de progressive mesurabilité est
essentielle. Le terme de droite dans (4.1) est a priori FT mesurable là où l’on cherche à ce que celui de gauche
soit Ft mesurable. C’est le rôle du processus (Zt )t∈[0,T ] que de ramener condition terminale et générateur dans
la bonne tribu.
Ce point s’illustre directement dans le cas d’un générateur nul. En effet, si f = 0 et que l’on considère une
condition terminale ξ de carré intégrable, le théorème de représentation des martingales donne l’existence d’un
RT
unique processus (Zt )t∈[0,T ] progressivement mesurable et de carré intégrable tel que ξ = E[ξ] + 0 Zs dWs .
Rt
Ainsi Yt := E[ξ|Ft ] = E[ξ] + 0 Zs dWs est bien solution de (4.1). L’unicité découle de celle du processus Z de
représentation.
En bref, c’est la condition de mesurabilité sur le couple (Yt , Zt )t∈[0,T ] qui permet de “fermer” l’équation
(4.1) à deux inconnues : à la relation différentielle on ajoute la condition de mesurabilité.
Sous des conditions de structure du générateur f , l’équation (4.1) est alors bien posée. Lorsque f est Lipschit-
RT
zien en (y, z), on peut construire une suite (Y n , Z n )n∈N définie par (Y 0 , Z 0 ) = 0, Ytn+1 = ξ+ t f (s, Ysn , Zsn )ds−
R T n+1
t Zs dWs , t ∈ [0, T ], n ≥ 0. La condition de Lipschitz continuité de f permet d’identifier le processus
n+1
RT
Z au processus de représentation associé à la variable aléatoire ξ + t f (s, Ysn , Zsn )ds qui est bien de carré
intégrable. Les arguments usuels d’analyse différentielle, lemme de Gronwall, et stochastique, inégalités BDG,
permettent de déduire que cette suite admet un unique point fixe solution forte de (4.1). La même démarche
reste possible si l’on remplace l’hypothèse de Lipschitz continuité du générateur en y par une condition de mo-
notonie associée à une croissance au plus linéaire. Ces résultats de solvabilité sont initialement dûs à Pardoux et
Peng [PP90]. Par la suite de nombreux auteurs ont affaibli ces hypothèses pour la solvabilité de (4.1), indiquons
Briand et al. [BDH+ 03] pour le cas d’une condition terminale Lp , p ∈ (1, 2) ou Kobylanski [Kob00] pour le cas
d’un générateur à croissance quadratique en Z, hypothèse par ailleurs naturelle du point de vue des EDP, cf.
Ladyzhenskaya et al. [LSU68].
De l’EDP vers l’EDSR. Comme pour la formule de Feynman-Kac dans le cadre linéaire c’est l’application
de la formule d’Itô qui permet de relier EDP et EDSR. Considérons l’EDP parabolique semi-linéaire
(
(∂t + Lt )u(t, x) + f (t, x, u(t, x), ((σ∇u)(t, x)) = 0, (t, x) ∈ [0, T ) × Rd ,
(4.3)
u(T, x) = g(x), x ∈ Rd ,
où Lt ϕ(x) = hb(t, x), ∇ϕ(x)i+ 12 tr a(t, x)Dx2 ϕ , a(t, x) = σσ ∗ (t, x) est le générateur infinitésimal d’une équation
Rt Rt
de diffusion Xt = x + 0 b(s, Xs )ds + 0 σ(s, Xs )dWs soluble au moins au sens faible. S’il existe une solution
“classique” à (4.3), i.e. bornée et à dérivées d’ordres un en temps et deux en espace bornées, il est possible
d’appliquer sur l’espace de probabilité sous-jacent la formule d’Itô au processus Yt := u(t, Xt ). On identifie alors
Zt = (∇uσ)(t, Xt ) qui permet de retrouver la formulation couplée de l’équation (4.2).
32
Ainsi, la donnée d’une solution régulière à l’EDP a permis de construire par un argument de vérification
une solution à l’EDSR. Cette méthode peut s’étendre à des solutions de (4.3) ayant des dérivées temps espace
au sens de Sobolev à l’aide de la formule d’Itô-Krylov, cf. [Kry96].
De l’EDSR vers l’EDP. Réciproquement, une question naturelle consiste à essayer de retrouver l’EDP à
partir de la solution de l’EDSR. Supposons que l’EDSR (4.2) admette une solution unique et définissons u :
(t, x) ∈ [0, T ] × Rd 7→ u(t, x) := Ytt,x qui désigne la valeur de l’EDSR (4.2) en t pour la condition initiale Xt = x.
De cette définition de u il est aisé de voir que u(0, x) s’écrit comme la solution en 0 d’une EDSR sur [0, t] avec
condition terminale u(t, Xt0,x ). Ce principe de programmation dynamique satisfait par u permet d’établir qu’elle
est solution de viscosité de (4.3). Nous renvoyons à l’article de Crandall et al [CIL92] pour la définition.
Lorsque les coefficients de l’EDSR sont réguliers il est possible de la dériver par rapport à la condition
initiale à l’aide de techniques usuelles de flots stochastiques sur les composantes progressives et rétrogrades,
voir Kunita [Kun90] ou Ikeda et Watanabe [IW89]. Cette opération permet d’obtenir la différentiabilité de u à
l’ordre un en temps et deux en espace. Le calcul de Malliavin permet ensuite l’identification de (Zt )t∈[0,T ] avec
((σ∇u)(t, Xt ))t∈[0,T ] dont on déduit ensuite grâce à (4.2) que u est solution classique de (4.3). Cette démarche
est celle de l’article de Pardoux et Peng [PP92]. Notons que dans cette approche aucune condition de non
dégénérescence n’est a priori requise, seule la régularité des coefficients intervient. Si l’équation de départ est
en revanche non dégénérée, cette approche n’exploite pas l’effet régularisant du noyau de la chaleur.
Ce sont des équations de ce type pour lesquelles nous avons proposé dans [2], [5] des algorithmes de
discrétisation que nous détaillerons en Section 4.3. En gardant à l’esprit les relations Yt = u(t, Xt ), Zt =
(σ∇u)(t, Xt ) qui lient l’EDSR à l’EDP il apparaı̂t naturel que l’objet probabiliste naturellement associé à (4.4)
sera une EDSR “fortement couplée” de dynamique
Z t Z t
Xt = x + b(s, Xs , Ys , Zs )ds + σ(s, Xs , Ys )dWs
0 0
Z T Z T
Yt = g(XT ) + f (s, Xs , Ys , Zs )ds − Zs dWs . (4.5)
t t
Le couplage est dit fort dans la mesure où les coefficients de la composante progressive dépendent de
l’équation rétrograde. Il n’est ainsi plus possible de résoudre l’équation progressive de façon autonome ce qui
induit une difficulté supplémentaire par rapport à la Section précédente.
Solvabilité en temps court. Le cadre naturel de résolution de (4.5) est celui de coefficients Lipschitziens. On
cherche alors à construire un triplet (Xt , Yt , Zt )t∈[0,T ] adapté tel que E[supt∈[0,T ] |Xt |2 ] + E[supt∈[0,T ] |Yt |2 ] <
RT
+∞, et E[ 0 |Zs |2 ds] < +∞ avec Z progressivement mesurable. L’idée naturelle pour obtenir une telle so-
lution consiste à construire, en suivant la démarche du travail de [PP90], une contraction. Les espaces fonc-
tionnels sont ceux naturellement associés aux conditions ci-avant. Si l’on se donne X0 on définit pour n ≥
RT RT Rt
0, Ytn+1 = g(XTn ) + t f (s, Xsn , Ysn+1 , Zsn+1 )ds − t Zsn+1 dWs , Xtn+1 = x + 0 b(s, Xsn+1 , Ysn+1 , Zsn+1 )ds +
Rt
0
σ(s, Xsn+1 , Ysn+1 )dWs . Sous les hypothèses de Lipschitz continuité uniforme des coefficients b, σ, f, g, Anto-
nelli [Ant93] a montré que le procédé précédent définit une contraction et que son unique point fixe est l’unique
solution forte de (4.5) si T ≤ cK où K désigne la constante de Lipschitz des coefficients. Sans autres hy-
pothèses ce résultat est optimal dans la mesure où il existe des contre-exemples. Considérons le cas particulier
déterministe X0 = x, YT = −XT , dXt = Yt dt, dYt = −Xt dt, t ∈ [0, T ], pour lequel Z = 0. La forme générale
des solutions s’écrit Xt = A cos(t) + B sin(t), Yt = −A sin(t) + B cos(t), t ∈ [0, T ] ce qui impose A = x et
A cos(T ) + B sin(T ) = A sin(T ) − B cos(T ) pour vérifier les conditions de bord. Pour T = 3π/4 cette condition
conduit à A = x et A = 0, ce qui met la solvabilité en défaut.
33
Schéma en quatre temps. Cette approche est due à Ma, Protter et Yong [MPY94]. L’idée sous-jacente est
de “décorréler” les composantes progressives et rétrogrades de (4.5) en utilisant des propriétés de la solution
supposée connue de l’EDP (4.4) sous-jacente. Précisément, si u solution de (4.4) est une solution “classique”,
l’identification formelle Yt = u(t, Xt ), Zt = (σ∇u)(t, Xt ) précédente conduit à considérer l’équation progressive
autonome
Z t Z t
Xt = x + b(s, Xs , u(s, Xs ), (σ∇u)(s, Xs ))ds + σ(s, Xs , u(s, Xs ))dWs .
0 0
Si les coefficients, b, σ ainsi que u et son gradient sont Lipschitziens, alors l’équation ci-dessus est fortement
soluble. Sous des hypothèses usuelles de croissance du générateur f , l’application de la formule d’Itô donne que
le triplet (Xt , Yt , Zt )t∈[0,T ] = (Xt , u(t, Xt ), (σ∇u)(t, Xt ))t∈[0,T ] est bien solution de (4.5).
C’est encore là une méthode de type vérification. On construit l’objet probabiliste à partir des propriétés
de l’EDP. Pour l’unicité, partant d’une solution arbitraire (X̄, Ȳ , Z̄) de (4.5) il faut l’identifier avec (X, Y, Z)
construite précédemment. L’idée est ici d’utiliser de nouveau la fonction u solution de l’EDP (supposée bornée
ainsi que ses dérivées d’ordre un et deux en espace) pour identifier Ȳt = u(t, X̄t ), Z̄t = (σ∇u)(t, X̄t ). Pour cela,
on applique la formule d’Itô à (u(t, X̄t ) − Ȳt )2 , t ∈ [0, T ]. Les outils usuels en équations rétrogrades : inégalités
BDG, inégalités de Young et Lemme de Gronwall, permettent de conclure.
Une fois effectuée l’identification pour (Ȳ , Z̄), les hypothèses précédentes de Lipschitzianité sur les coefficients
donnent que X = X̄ car les deux composantes progressives vérifient la même EDS. Dans le cadre d’un générateur
Lipschitzien l’identification (Ȳ , Z̄) = (Y, Z) provient ensuite de l’unique solubilité de l’équation rétrograde.
Pour pouvoir appliquer ce programme il faut donc disposer de coefficients b, σ, f Lipschitziens et d’une
solution classique de (4.4) bornée ainsi que ses dérivées d’ordre un et deux en espace. Un jeu typique d’hypothèses
qui garantit ces propriétés est le suivant :
(a) Les coefficients b, f, σ et g sont réguliers et à dérivées d’ordre un en (x, y, z) bornées.
(b) ∃Λ > 0, |(b, f )(t, x, y, z)| ≤ Λ(1 + |y| + |z|), |g(x)| ≤ Λ.
(c) ∃λ > 0, λId ≤ a(t, x, y) ≤ ΛId .
(d) g ∈ C 2 (Rd ) a des dérivées d’ordre un et deux bornées et uniformément η-Hölderiennes, η ∈ (0, 1].
Théorème 4.1.1 (cf. Ladyzhenskaya et al. [LSU68]) Supposons que (a),(b),(c),(d) soient satisfaites. Alors,
l’équation admet une unique solution classique bornée ainsi que ses dérivées d’ordre un et deux en espace.
C’est sous des hypothèses de ce type que nous nous placerons en Section 4.3. Nous reprendrons pour étudier
la convergence de schémas d’approximation d’EDP/EDSR la démarche présentée ci-dessus pour l’unicité en
exploitant les propriétés de u.
34
4.2.1 Un premier schéma de semi-discrétisation
Soit {(ti := ih)i∈[[0,N ]]}, N h = T , une grille en temps de pas h donnée. Pour discrétiser (4.2), l’idée naturelle
consiste à partir de l’écriture “locale” en temps :
Z ti+1
Yti = E[Yti+1 + f (s, Xs , Ys , Zs )|Fti ], i ∈ [[0, N − 1]]. (4.6)
ti
Pour i = N − 1, Yti+1 = YT = g(XT ), condition terminale connue. Pour déduire un schéma d’approximation de
l’écriture (4.6), si l’on pense par exemple à une méthode des rectangles pour la discrétisation de l’intégrale, il est
fondamental d’avoir une approximation du processus de représentation. A ce propos, partant de la formulation
(4.2) entre ti et ti+1 , i ∈ [[0, N − 1]], si l’on multiplie les deux membres de la composante rétrograde par
l’accroissement Brownien Wti+1 − Wti et que l’on passe à l’espérance conditionnelle en Fti il vient :
Z ti+1 Z ti+1
E[ Zs ds|Fti ] = E[(Yti+1 − Yti )(Wti+1 − Wti )|Fti ] + E[ f (s, Xs , Ys , Zs )ds(Wti+1 − Wti )|Fti ]
ti ti
sous les hypothèses typiques de solvabilité de EDSR. Par ailleurs il est naturel de chercher une approximation
de (Zs )s∈[ti ,ti+1 ] qui soit Fti mesurable. Si l’on néglige la contribution associée au générateur dans (4.7), la
meilleure approximation Fti mesurable de (Zs )s∈[ti ,ti+1 ] dans L2 ([ti , ti+1 ] × Ω, dt ⊗ dP) est donnée par :
Cette technique d’“incrément de martingale” pour l’estimation du Z apparaı̂t initialement chez Bally et Pagès
[BP03]. Supposons que l’on dispose désormais d’une approximation (Xthi )i∈[[0,N ]] de la composante progressive
de (4.2), par exemple le schéma d’Euler. L’itération dérivant des écritures précédentes s’écrit :
La vitesse de convergence de (4.8) a été obtenue pas Zhang [Zha04] sous des hypothèses usuelles de solvabilité.
Précisément, lorsque X h est le schéma d’Euler, il établit qu’il existe C dépendant de T et des constantes de
Lipschitz des coefficients dans (4.2) tel que :
N
X −1 Z ti+1
max E[|Ythi − Yti |2 ] + E[ |Ẑthi − Zs |2 ds] ≤ Ch.
i∈[[0,N ]] ti
i=0
On retrouve que l’erreur obtenue sur la composante rétrograde est du même ordre que celle de l’équation
progressive, voir également Gobet et Labart [GL07] pour un développement d’erreur qui met en évidence cette
propriété.
Pour passer à partir de (4.8) à un schéma “implémentable” il est nécessaire de préciser une méthode d’ap-
proximation des espérances conditionnelles.
35
Qd
où Hx (y) = j=1 Ixj ≤yj est un produit de fonctions de Heaviside résultant de l’intégration par parties. L’ex-
pression de S fait intervenir des intégrales de Skorohod et un terme de localisation qui permet de contrôler la
variance pour l’estimation de Monte Carlo associée.
Ainsi, pour une trajectoire du schéma d’Euler, l’estimation par Monte Carlo de la quantité ci-avant va
nécessiter la simulation de M + 1 trajectoires i.i.d. du schéma d’Euler (en incluant la trajectoire initiale notée
X h,0 := X h ). Dans
la pratique M = KN et à chaque instant (ti )i∈[[0,N −1]] de discrétisation K trajectoires
des (Xth,k
i
)i∈[[0,N ]] sont utilisées pour l’approximation de l’espérance conditionnelle. Ces K variables
k∈[[0,M]]
indépendantes interviennent implicitement dans l’expression de ξ de l’équation (4.9) lorsque R est associée à
l’approximation de l’EDSR. Précisément, si l’on note Ni := {(i − 1)K + 1, ..., iK}, i ∈ [[1, N ]] le schéma s’écrit :
∀l ∈ NN , YTh,l = g(XTh,l ), ∀j ∈ {0} ∪ Ni , i ∈ [[0, N − 1]],
P
1
K l∈Ni+1 HX h,j (Xth,l
i
)Ŷth,l S (Wtli+1 − Wtli , Xth,j
i+1 i i
, Xth,l
i
)
Ẑth,j
ti
i
= 1 P h,l h,j h,l
,
K l∈Ni+1 HX h,j (Xti )Si (1, Xti , Xti )
ti
P
1
K l∈Ni+1 HX h,j (Xth,l
i
)Ŷth,l S (1, Xth,j
i+1 i i
, Xth,l
i
)
Ŷth,j + hf (ti , Xth,j , Yth,j , Ẑth,j
t i
i
= 1 P h,l h,j h,l i i i
).
K l∈Ni+1 HX h,j (Xti )Si (1, Xti , Xti )
ti
La fonction A dans (4.9) est soit l’accroissement Brownien pour la mise à jour du processus de représentation
approché, soit 1 pour la composante rétrograde. L’analyse de l’erreur associée, cf. Théorème 6.2 de [BT04] donne
que pour retrouver l’erreur attendue d’ordre h1/2 en norme L2 , qui était celle du schéma de semi-discrétisation,
il faut prendre K ≥ N 6+d/2 , ce qui conduit à considérer N 7+d/2 trajectoires du schéma d’Euler.
La complexité apparente d’une telle procédure est de l’ordre de K 2 N . Néanmoins les fonctions de Heaviside
intervenant dans l’estimateur permettent de passer à K log(K)(d−1)∨1 N en triant les réalisations. Ce type
d’estimateur reste délicat à calibrer dans la pratique, en particulier le paramètre de troncation implicite dans
S. Enfin, il faut également approcher les intégrales de Skorohod dans ce même terme.
36
leur dynamique rétrograde les variations d’une martingale orthogonale au Brownien ainsi que d’éventuelles
composantes de sauts pour la partie progressive [GLW06].
Nous voyons sur ces exemples que même dans le cas faiblement couplé les complexités algorithmiques as-
sociées à ces modèles non-linéaires sont hautement explosives avec la dimension.
Cette écriture ne peut pas directement s’exploiter numériquement dans la mesure où la dynamique de X entre t
et t+h fait intervenir (Y s , Zs )s∈[t,t+h] soit la solution
u de (4.4) et son gradient v. Si l’on dispose d’approximations
ũ(t + h, .), ṽ(t + h, .) de u(t + h, .), v(t + h, .) sur tout l’espace, on définit une transition “approchée” entre
t et t + h :
On utilise ensuite cette transition dans la dynamique du processus progressif pour mettre à jour l’estimation
du gradient par incrément de martingales, i.e. pour tout x ∈ Rd ,
ũ(t, x) := E[ũ(t + h, x + T (t, x))] + hf (t, x, ũ(t + h, x), ṽ(t, x)). (4.11)
Partant de la condition initiale ũ(T, .) = g(.), ṽ(T, .) = (σ∇g)(T, .), ce schéma est bien défini le long d’une grille
de discrétisation en temps {(ti := ih)i∈[[0,N ]]}.
Deux obstacles subsistent toutefois pour sa mise en oeuvre :
(a) Le schéma ne peut être défini en pratique sur tout l’espace.
(b) Les espérances doivent être estimées numériquement.
Grilles spatiales et prolongement. Pour le premier point nous nous sommes restreints à une grille spatiale ce
qui nous rapproche des algorithmes déterministes. Dans le cas découplé, des simulations autonomes permettent
d’avoir une idée a priori de la “géométrie” associée à la composante progressive, i.e. zones plus visitées que
d’autres. Le cas couplé n’autorise pas une telle procédure et sans autre connaissance a priori nous avons retenu
des grilles Cartésiennes tronquées. C’est également le choix de Milstein et Tretyakov.
37
La restriction à une grille spatiale amène à préciser le sens des relations (4.10),(4.11) pour t = ti , i ∈
[[0, N − 1]]. En effet, si l’on se restreint en ti+1 à l’estimation de u, v sur une grille spatiale Ci+1 , la transition
x + T (ti , x), x ∈ Ci n’appartiendra pas à Ci+1 . Il est alors nécessaire de comprendre ũ(ti+1 , .) dans (4.10), (4.11)
comme un prolongement à tout l’espace de la fonction définie aux points d’une grille spatiale. Dans [2] nous
avons considéré un prolongement au plus proche voisin, i.e. ∀(x, i) ∈ Rd × [[0, N ]], ũ(ti , x) = ũ(ti , ΠCi (x)) où ΠCi
désigne la projection sur la grille Cartésienne Ci (avec une convention pour le centre des mailles).
Dans [5] nous avons en revanche utilisé une interpolation multilinéaire qui peut par ailleurs s’interpréter de
façon naturelle en termes probabilistes. Cette approche a permis de tirer parti de la régularité a priori de u
sous les hypothèses du Théorème 4.1.1 et d’améliorer la vitesse de convergence de notre approximation.
Quantification. Pour le point (b), nous avons choisi d’utiliser une méthode de quantification plutôt que
l’approximation usuelle de Monte Carlo. L’idée de la quantification de variables aléatoires est d’approcher une
variable donnée par une loi discrète à support fini. Cette procédure permet de ramener le calcul d’espérances à
celui d’une somme finie. Nous renvoyons à l’ouvrage de Graf et Luschgy [GL00] pour une référence théorique à
cette technique.
Des équations ci-dessus nous devons quantifier l’accroissement Brownien soit à un changement d’échelle
près la loi normale. Une première approximation consisterait à l’approcher par un produit de lois de Bernoulli
symétriques correctement normalisées, c’est le choix effectué par Milstein et Tretyakov [MT04]. Nous avons
choisi d’utiliser une quantification “optimale” de la loi gaussienne. Si nous notons G la loi gaussienne standard
de Rd et Ĝ une quantifiée optimale ĜM à M points (non nécessairement unique) vérifie (pour M suffisamment
grand) l’inégalité de “distortion” :
Les quantifieurs optimaux vérifient également la propriété projective (ou de stationnarité) E[G|ĜM ] = ĜM dont
on déduit que E[ĜM ] = 0 et que pour une fonction f de classe C 2 à dérivées bornées,
en exploitant la propriété projective pour la première égalité et (4.12) pour la dernière inégalité.
Ainsi, contrairement à la méthode de Monte Carlo, la quantification permet d’exploiter la régularité des
fonctions dont on veut estimer l’espérance. Le comportement de cette méthode se rapproche des techniques de
quadrature ce qui se retrouve sur la vitesse de convergence associée qui dépend fortement de la dimension d
de l’espace. Intuitivement, pour M points, la vitesse de M −1/d provient d’une répartition du même ordre dans
chaque direction. Nous avons tiré tout l’avantage de cette approche dans [5].
4.3.2 Algorithmes
Les deux algorithmes proposés dans [2] et [5] dérivent de (4.10), (4.11) avec les procédures d’extension
précédentes dues aux restrictions à des grilles spatiales. Dans [2], on remplace simplement l’accroissement
Brownien par la quantifiée optimale gaussienne renormalisée en considérant la projection au plus proche voisin.
Il vient
ū(T, x) = g(x), x ∈ CN ,
T (ti , x) := b(ti , x, ū(ti+1 , x), v̄(ti+1 , x))h + σ(ti , x, ū(ti+1 , x))h1/2 ĜM ,
v̄(ti , x) = h−1 E[ū(ti+1 , x + T (ti , x))h1/2 ĜM ],
ū(ti , x) = E[ū(ti , x + T (ti , x))] + hf (ti , x, ū(ti+1 , x), v̄(ti , x)), x ∈ Ci , (4.14)
Dans [5], pour l’analyse de l’erreur, il est nécessaire que la matrice de covariance de la variable aléatoire qui
approche la loi normale soit l’identité. Or ce n’est pas forcément le cas pour une quantification ĜM optimale de
G. Pour M assez grand, ΓM := E[ĜM Ĝ∗M ] est inversible et la technique naturelle consiste à préfixer l’incrément
h1/2 ĜM par γM∗
où γM est la matrice triangulaire inférieure de la factorisation de Cholesky de Γ−1 M = γM γM .
∗
38
On a ainsi l’algorithme
où C dépend des hypothèses sur les coefficients et est uniforme par rapport aux paramètres de discrétisation. Les
ordres des erreurs sont : E(temps) = h1/2 , E(espace) = h−1 δ, E(quantification) = h−1/2 M −1/d et E(troncature) =
ρ/(ρ + R).
Ces ordres s’expliquent de la façon suivante :
- E(temps). L’ordre 1/2 provient de la régularité en temps de l’accroissement Brownien et de la propriété de
1/2-Hölder continuité en temps de ∇x u sous les hypothèses du théorème.
- E(espace). Pour une fonction régulière l’erreur associée à la projection au plus proche voisin sur une grille
spatiale Cartésienne de pas δ est d’ordre δ. Comme ce type d’erreur apparaı̂t à chaque itération en temps on
obtient bien h−1 δ.
- E(quantification). L’erreur de quantification de l’accroissement Brownien est en norme L1 d’ordre h1/2 M −1/2
d’après (4.12). La vitesse indiquée correspond de nouveau à la sommation de N = T /h erreurs le long de la
grille en temps.
- E(troncature). Ce terme est obtenu par des contrôles de type Tchebychev. Nous n’avons pour l’instant pas su
tirer profit de l’échelle caractéristique de temps en t1/2 de la diffusion pour mieux calibrer nos grilles spatiales.
Précisons que le résultat est présenté pour des coefficients homogènes en temps par souci de cohérence avec
les énoncés de [2]. Ce choix avait été motivé par le souci d’alléger les notations. Le résultat ci-dessus reste-
rait vrai sans difficultés techniques additionnelles pour des coefficients uniformément 1/2-Hölder en temps, cf.
Théorème 4.1.1.
39
Algorithme interpolé.
Théorème 4.3.2 (Delarue et Menozzi [5]) Supposons les coefficients b, σ, f dans (4.4) homogènes et uni-
formément α-Hölderiens, α ∈ (0, 1], en x, uniformément Lipschitziens en y, z, uniformément bornés en espace
et à croissance au plus linéaire en (y, z), b indépendant de z, σ uniformément elliptique et la fonction terminale
g ∈ C 2+α , bornée et à dérivées bornées. Si l’on prend des grilles spatiales Cartésiennes infinies de pas d’espace
δ > 0 on a le contrôle suivant pour l’erreur associée à l’algorithme (4.15) :
où C dépend des hypothèses sur les coefficients et est uniforme par rapport aux paramètres de discrétisation.
Les ordres des erreurs sont : E(temps) = hα/2 , E(espace) = h−1 δ 2 , E(quantification) = hα/2 M −2/d .
Le propos du travail [5] était d’estimer le gain découlant de l’interpolation et de l’utilisation intensive de la
stationnarité du quantifieur. Nous n’avons donc pas pris en compte les erreurs associées à la troncation des
grilles Cartésiennes qui pourraient être analysées de façon similaire au travail précédent. Sous les hypothèses
du théorème nous avons toujours que u est une solution classique de (4.4) 1 , cf. Théorème 7.1. du Chapitre 7 de
[LSU68] et [MPY94], à une procédure de régularisation près des coefficients. L’EDSR fortement couplée associée
est alors à comprendre au sens faible, cf. Delarue et Guatteri [DG06].
Les ordres précédents se justifient comme suit :
- E(temps). L’ordre α/2 provient de la composition de la régularité α-Hölder des coefficients en x avec la régularité
en temps de l’accroissement Brownien.
- E(espace). Pour une fonction régulière l’erreur associée l’interpolation linéaire sur une grille spatiale Cartésienne
de pas δ est d’ordre δ 2 . L’itération le long de la grille en temps conduit à l’ordre indiqué.
- E(quantification). L’espérance d’une fonction “régulière” de la quantification Gaussienne optimale renormalisée
par h1/2 est d’après (4.13) d’ordre hM −2/d . La fonction régulière n’est autre dans l’analyse de convergence que
la solution u de (4.4). Ainsi l’itération de la procédure devrait conduire à un contrôle de M −2/d . Nous obtenons
une vitesse de hα/2 M −2/d en utilisant la α-Hölder continuité des dérivées secondes en espace.
Comme nous l’avons indiqué en Section 4.1.2, la démarche pour l’analyse de l’erreur est similaire à celle
utilisée dans [MPY94] pour établir l’unicité de la solution à l’EDSR fortement couplée. Cela nous permet
d’étendre les résultats de Milstein et Tretyakov qui supposent que la solution u de (4.4) est quatre fois dérivable
et utilisent un produit tensoriel de lois de Bernoulli symétriques pour approcher l’incrément gaussien. Par
ailleurs si l’on prend formellement α = 2, M = 2d , δ = h dans le théorème précédent on retrouve bien l’ordre h
obtenu dans [MT04, MT06b, MT07].
Nous conclurons cette section en insistant sur le faible impact de la quantification sur l’erreur globale, ce
dont atteste la borne sur E(quantification).
ε2
∂t u − (u.∇)u + ∆u = 0, (t, x) ∈ [0, T ) × Rd , ε > 0,
2 (4.16)
u(T, x) = g(x), x ∈ Rd ,
où ∀i ∈ [[1, d]], ((u.∇)u)i = ∇ui × u. Bien que le Théorème 4.3.2 soit établi pour des fonctions à valeurs réelles,
l’analyse précédente s’étendrait sans difficultés à des systèmes d’équations.
En dimension un il est bien connu que l’équation de Burgers “visqueuse” possède une solution explicite
donnée par une factorisation de type Cole-Hopf, voir e.g. Whitham [Whi73]. Cette approche s’étend au cas
1. i.e. bornée et à dérivées spatiales d’ordre un et deux bornées.
40
multi-dimensionnel lorsque la condition terminale dérive d’un potentiel, i.e. g = ∇g0 où g0 est une fonction à
valeurs réelles. On a dans ce cas : ∀(t, x) ∈ [0, T ] × Rd ,
E[∇g0 (x + εWT −t ) exp(−ε−2 g0 (x + εWT −t ))]
u(t, x) = .
E[exp(−ε−2 g0 (x + εWT −t ))]
Nous avons pour les résultats ci-après considéré l’interprétation “couplée” de l’équation (4.16), i.e. la non linéarité
apparaı̂t en injectant l’approximation de la solution dans la dérive de l’équation progressive. Ce choix semble
plus robuste numériquement et dans le cas particulier de (4.16) permet même d’éviter l’étape d’estimation du
gradient. Q
Nous considérons le cas d = 2 pour la fonction H0 (x) = i=1,2 sin2 (πxi ) qui est symétrique et périodique
permettant ainsi d’éviter les problèmes de troncation. Une des difficultés est de construire une grille spatiale
qui permette de “voir” les transitions de la diffusion approchée qui sont de l’ordre de εh1/2 . Ceci impose que δ
soit plus petit que εh1/2 . Nous prenons le jeu suivant de paramètres : T = 3/8, h = 2.5 × 10−2 , δ = .01, ε2 = .4.
Comme la solution est symétrique nous ne présentons que les résultats associés à la première composante u1 de
u = (u1 , u2 )∗ .
Nous présentons les profils de la solution, ainsi que la différence entre la valeur de référence, obtenue à partir
de la représentation explicite pour 600 points de quantification, et l’approximation de l’algorithme (4.15). Un
∗
autre graphique représente ensuite les résultats obtenus sans facteur de normalisation γM pour la quantification
de l’accroissement Brownien et illustre l’importance de cette procédure. Nous étudions enfin l’influence du
nombre de points M utilisés pour la quantification en prenant successivement M = 4 et M = 150. Les résultats
corroborent la conclusion de la section précédente, à savoir que le nombre de points de quantification n’a qu’un
faible impact.
Burgers equations d=2: profiles Burgers equations d=2: Algorithm transition, pointwise absolute error
0.06 0.008
0.04 0.007
0.006
0.02 0.005
0 0.004
-0.02 0.003
0.002
-0.04 0.001
-0.06 0
1 1
0.8 0.8
0 0.6 0 0.6
0.2 0.4 0.2 0.4
0.4 0.4
0.6 0.2 0.6 0.2
0.8 0.8
1 0 1 0
Burgers equations d=2: "Natural" transition, pointwise absolute error Burgers equations d=2: pointwise absolute difference between M=4 and M=150
t=0 t=0
0.12 0.0007
0.1 0.0006
0.08 0.0005
0.0004
0.06
0.0003
0.04 0.0002
0.02 0.0001
0 0
1 1
0.8 0.8
0 0.6 0 0.6
0.2 0.4 0.2 0.4
0.4 0.4
0.6 0.2 0.6 0.2
0.8 0.8
1 0 1 0
41
KPZ equation d=2: coupled case and true solution KPZ equation d=2: backward case
8.8 2.5e+19
8.6
8.4 2e+19
8.2
8 1.5e+19
7.8
7.6 1e+19
7.4
7.2 5e+18
7
6.8 0
0.4 0.4
0.2 0.2
-0.4 0 -0.4 0
-0.2 -0.2
0 -0.2 0 -0.2
0.2 -0.4 0.2 -0.4
0.4 0.4
Dans la pratique l’intégration numérique de grands gradients provoque des overflow, et incite dans ce cas de
figure à préférer l’interprétation couplée plus “robuste”. Indiquons qu’un exemple tridimensionnel pour (4.17)
est présenté dans [5]. Pour la grille Cartésienne de pas δ, le nombre de noeuds pour lesquels il faut mettre à jour
la solution et son gradient est de l’ordre de δ −d donnant une complexité globale de h−1 M δ −d ce qui interdit
dans la pratique les grandes dimensions.
42
discrétisation dont la spécificité est de prendre en compte des domaines non-réguliers et des coefficients de
diffusion dégénérés dans un contexte parabolique, i.e. un instant d’observation final T > 0 est fixé.
où les coefficients b, σ, f, g de (4.18) sont uniformément Lipschitziens en espace et τ est le temps de sortie de
(t, Xt ) d’un domaine cylindrique D = [0, T ) × D où D ⊂ Rd est un domaine régulier par morceaux.
Sous de bonnes hypothèses on peut montrer que u(t, x) := Ytt,x est l’unique solution de viscosité de
(
(∂t + L)u(t, x) + f (t, x, u(t, x), (σ∇u)(t, x)) = 0, (t, x) ∈ [0, T ) × D,
u(t, x) = g(t, x), (t, x) ∈ [0, T ) × ∂D ∪ {T } × D̄,
où L désigne le générateur infinitésimal de X, cf. Darling et Pardoux [DP97] pour le cas elliptique qui peut
s’adapter à (4.18).
Considérons maintenant le schéma de semi-discrétisation suivant le long de la grille en temps (ti := ih)i∈[[1,N ]]
où N h = T :
où X h est le schéma d’Euler de l’équation progressive de (4.18), τ h := inf{ti := ih : (ti , Xthi ) 6∈ D} et g désigne
une extension de la condition de bord à tout l’espace. Remarquons que Ythi Iti ≥τ h = g(τ h , Xτhh ) et par conséquent
Zthi Iti ≥τ h = 0.
Le propos est de fournir en fonction du pas de discrétisation un contrôle sur l’erreur :
Z T
Err(h, T )2 := max E[ sup |Yt − Ythi |2 ] + E[ h
|Zt − Zφ(t) |2 dt],
i≤N t∈[ti ,ti+1 ] 0
4.4.2 Résultats
Supposons que la condition terminale g vérifie :
(Hg) g ∈ C 1,2 ([0, T ] × Rd ) et il existe C0 > 0 telle que |∂t g|∞ + |∇g|∞ + |D2 g|∞ ≤ C0 .
Nous avons alors le résultat suivant :
Proposition 4.4.1 Il existe C dépendant uniquement des coefficients de (4.18), de la borne dans (Hg) et de
T telle que Z τ
2 h h h 2
Err(h, T ) ≤ C h + R(Y ) + R(Z) + E ξ|τ − τ | + Iτ h <τ |Zs | ,
τh
où ξ est une variable aléatoire positive telle que E[ξ p ] ≤ C p , p ≥ 2, et R(Y )h := maxi≤N E[supt∈[ti ,ti+1 ] |Yt −
RT Rt
Yti |2 ], R(Z)h := E[ 0 |Zt − Ẑφ(t) |2 dt], Ẑti := h−1 E[ tii+1 Zs ds|Fti ], i ∈ [[0, N − 1]].
Les termes R(Y )h et R(Z)h sont usuels dans l’analyse des schémas de semi-discrétisation d’EDSR et appa-
raissent déjà dans [Zha04]. A l’aune du lien entre EDSR et EDP, il apparaı̂t néanmoins clairement qu’obtenir
un contrôle à l’ordre h pour R(Y )h , R(Z)h nécessite d’avoir des propriétés de Lipschitz continuité en espace de
la solution de viscosité de l’EDP (4.19). Pour obtenir ces estimées et contrôler l’écart entre les temps d’arrêts il
est nécessaire de rajouter quelques hypothèses de “structure” sur le domaine, cf. Chapitre 2.
Introduisons :
43
∗
(D) Le domaine D := ∩m 2
l=1 Dl , m ∈ N et les (Dl )l∈[[1,m]] sont de classe C à frontière compacte. Nous suppo-
serons également que D vérifie une condition de sphère extérieure uniforme et de cône intérieur uniforme (cf.
Section 2.2 de [6] pour une définition précise de ces deux dernières conditions).
Tm
Désignons par C := l6=k=1 ∂Dl ∩ ∂Dk l’ensemble des coins et par B(C, η) un voisinage de rayon η > 0 de
cet ensemble. Nous supposerons également :
(C) Le coefficient de diffusion a vérifie une condition de frontière non caractéristique uniforme hors d’un voisinage
B(C, η), η > 0 des coins, i.e ∃C > 0, ∀x ∈ ∂D\B(C, η), ha(x)n(x), n(x)i ≥ C où n désigne la normale rentrante
au domaine qui est bien définie hors d’un voisinage des coins, cf. Chapitre 2. Le coefficient a est uniformément
elliptique dans un voisinage des coins, i.e. ∃C > 0, ∀x ∈ D̄ ∩ B(C, η), ∀ξ ∈ S d−1 , ha(x), ξ, ξi ≥ C.
Ces conditions permettent d’utiliser des arguments d’EDP de type fonctions barrières pour contrôler le
module de continuité au bord du domaine. A l’intérieur du domaine, où le coefficient de diffusion peut dégénérer,
ce même contrôle est obtenu par des techniques probabilistes plus standards de flots stochastiques. Nous obtenons
ainsi le résultat suivant :
Théorème 4.4.1 Si les coefficients b, σ, f, g sont uniformément Lipschitziens de constante K et que les hy-
pothèses (Hg), (D), (C) sont vérifiées
et l’unique solution de viscosité u de (4.19) dans la classe des solutions continues à croissance polynomiale est
uniformément 1/2 Hölder continue en temps et Lipschitz en espace, i.e. pour le même C :
Théorème 4.4.2 Sous les hypothèses du Théorème 4.4.1, pour tout ε ∈ (0, 21 ), ∃C := C(ε, K, T, (Hg), (D), (C)),
E[|τ − τ h |] ≤ Ch1/2−ε .
Cette estimée s’obtient par des techniques de martingales et des arguments de changement de temps assez
similaires à ceux introduits au Chapitre 2. Par ailleurs, à ε près ce contrôle est optimal, cf. Théorème 2.2.2.
C’est ainsi l’approximation du temps d’arrêt qui domine dans l’erreur et l’on déduit de la Proposition 4.4.1
et des Théorèmes 4.4.1, 4.4.2 la borne finale :
1
∀ε ∈ (0, ), ∃C := C(ε, K, T, (Hg), (D), (C)), Err(h, T )2 ≤ Ch1/2−ε .
2
44
Chapitre 5
Nous présentons ici les résultats des articles [10], écrit en collaboration avec François Delarue de l’Université
de Nice, et [11], en collaboration avec Vincent Lemaire de l’Université Paris 6.
Nous commençons par une synthèse des principales techniques intervenant dans l’estimation quantitative de
densités de processus stochastiques. On soulignera en particulier les hypothèses de nature différente en fonction
des outils utilisés : hypoellipticité et régularité des coefficients pour le calcul de Malliavin, et du côté analytique,
uniforme ellipticité et mesurabilité pour des opérateurs sous forme divergence et uniforme ellipticité et Hölder
continuité pour des opérateurs sous forme non divergence, voir aussi le Chapitre 3. Dans ce dernier cas, la notion
de problème de martingale de Stroock et Varadhan permet d’unifier l’approche probabiliste et analytique.
Nous détaillons ensuite l’article [10] où nous considérons une EDS vérifiant une hypothèse d’Hörmander
faible, i.e. c’est le coefficient de dérive qui propage le bruit dans le système. Sous de bonnes hypothèses, proches
de celles naturelles du point de vue analytique, nous retrouvons des estimées Gaussiennes de type Aronson en
régime non diffusif. Pour obtenir la minoration, une première approche consiste à utiliser la transformée de
Fleming qui permet d’exprimer le logarithme de la densité de la diffusion comme solution d’un problème de
contrôle stochastique. Nous donnerons également une seconde preuve plus géométrique. La majoration découle
quant à elle de l’approche parametrix.
Les techniques développées dans [10] peuvent s’adapter à des schémas de discrétisation de certains processus
dégénérés ou non. Dans [11] nous avons obtenu des estimées Gaussiennes pour les densités de certains schémas
d’Euler. L’utilisation de techniques de concentration de la mesure : inégalités de Sobolev logarithmique, argu-
ment de Herbst, nous a permis d’en déduire des intervalles de confiance non asymptotiques pour l’approximation
de Monte Carlo.
45
La borne supérieure s’obtient typiquement à l’aide des inégalités de Nash et d’opérations sur la forme de
Dirichlet associée à L. La borne inférieure s’obtient via la représentation spectrale du noyau de la chaleur tué
de L et un argument de chaı̂nage, voir Chapitre 7 de Bass [Bas97] ou Stroock [Str88].
Dans cette approche seule la non dégénérescence de a compte. Pour b = 0, l’aspect auto-adjoint est également
très important dans les preuves et donne l’uniformité en temps.
au point initial x est Rd (où [, ] désigne le crochet de Lie entre champs de vecteurs) 2 , alors pour tout t > 0, Xt
admet une densité pt , cf. Norris [Nor86] ou Nualart [Nua98]. La question de l’estimation de cette densité est
dans le cadre hypoelliptique général très difficile. Il est en effet très délicat de mettre en évidence une échelle
globale intrinsèque au système.
Plusieurs résultats ont néanmoins été obtenus l’aide du calcul de Malliavin. Cet outil (voir Malliavin [Mal97],
Stroock [Str83] et Nualart [Nua95]) permet de quantifier la sensibilité du système par rapport au bruit et cette
sensibilité se lit sur sur les dérivées de Malliavin et la matrice de covariance associée. La non-dégénérescence de
cette matrice donne l’existence de la densité. L’utilisation de cette technique pour l’estimation de densité est
due à Kusuoka et Stroock [KS84, KS85, KS87]. Dans le dernier travail, les auteurs établissent des estimées de
type Aronson sous des hypothèses d’Hörmander fortes, i.e. le bruit ne se propage dans le système qu’à travers la
composante diffusive. La normalisation diagonale provient alors du volume des boules hypoelliptiques de rayon
t1/2 centrées au point initial. C’est en effet une normalisation diffusive mais les boules ne sont plus euclidiennes
et le caractère “local” de leur volume apparaı̂t clairement. La décroissance hors diagonale est donnée par la
métrique de Carnot-Carathéodory, ou métrique de contrôle, associée aux champs (Ai )i∈[[1,r]] . Ces résultats ne
sont valables que pour une dérive nulle ou engendrée par les champs de vecteurs de la partie diffusive.
Pour d’autres exemples d’application du calcul de Malliavin nous renvoyons à Bally [Bal90], pour une
discussion sur les liens entre matrice de Malliavin et hypothèses de Hörmander, à Cattiaux [Cat90], pour les
propriétés de résolvantes de diffusions hypoelliptiques, à Cattiaux et Mesnager [CM02] pour l’existence de
la densité dans le cadre non-homogène. Pour des résultats plus spécifiques sur l’estimation de densité nous
renvoyons à Ben Arous et Léandre [BL91], qui ont mis en évidence plusieurs régimes pour le comportement en
temps petit de la densité de certaines diffusions hypoelliptiques en fonction de la forme de leur dérive.
En résumé, dans un cadre dégénéré l’utilisation du calcul de Malliavin pour obtenir des estimées de densités
demande de la régularité sur les coefficients. Cette régularité n’est pas toujours nécessaire. Dans la section
suivante nous arrivons à obtenir pour une diffusion faiblement hypoelliptique des estimées de densités sous
2. Dans l’article initial [Hör67], Hörmander supposait cette condition vérifiée en tout point de l’espace.
46
des hypothèses proches de celles naturelles pour les opérateurs non dégénérés sous forme non divergence. En
particulier peu de régularité des coefficients est nécessaire.
où (Wt )t≥0 désigne un mouvement Brownien d-dimensionnel et pour tout i ∈ [[1, n]], (Xti )t≥0 , est aussi à valeurs
dans Rd .
Un exemple typique pour (5.2) est donné par un système de n oscillateurs couplés, chacun d’entre eux
bougeant verticalement et étant directement relié à son plus proche voisin, lorsque le premier oscillateur est
excité par un bruit aléatoire.
BRUIT ⇒
Précisons que les Fi dans (5.2) ne peuvent pas dépendre des positions Xt1 , . . . , Xti−2 : d’un point de vue physique
le bruit doit traverser les (i − 1) premiers oscillateurs avant d’atteindre le ième . Dans la dynamique différentielle
n’intervient que la composante qui transmet le bruit. Intuitivement cette condition permet la séparation des
échelles. Supposons que le bruit soit en effet transmis par la composante X i−1 à la composante X i , ce qui
sera assuré par la condition de non dégénérescence des Dxi−1 Fi (hypothèse de type Hörmander faible). Alors,
l’échelle caractéristique de X i est ti−1/2 pour tout i ∈ [[1, n]].
Des systèmes de ce type apparaissent dans différents champs d’applications. Pour n = 2, (5.2) décrit la
dynamique de certains systèmes hamiltoniens, voir Soize [Soi94] pour une synthèse ou Talay [Tal02] et Hérau
et Nier [HN04] pour l’aspect convergence à l’équilibre. Toujours pour n = 2, (5.2) correspond à la dynamique
utilisée en finance pour les options asiatiques, cf. [BPV01] pour des questions de régularité du prix associé. Pour
n ≥ 2, cette équation apparaı̂t dans des modèles de conduction de la chaleur, cf. Eckmann et al. [EPRB99] et
Rey-Bellet et Thomas [RBT00] où la chaı̂ne d’oscillateurs est chauffée aux deux extrémités par des bains de
chaleur. Mentionnons également le travail récent de Bodineau et Lefevere [BL08]).
Pour le reste de la section notre jeu d’hypothèses (noté (A)) est le suivant :
(a) Le spectre de la fonction matricielle (t, x) := (t, x1 , · · · , xn ) ∈ R+ × Rnd 7→ a(t, x) = [σσ ∗ ](t, x) est inclus
dans [Λ−1 , Λ]pour Λ ≥ 1.
(b) Les fonctions F1 , . . . , Fn et σ sont respectivement uniformément Lipschitz et η-Hölder continues (η ∈ (0, 1])
par rapport aux variables d’état, pour une constante positive κ.
(c) Pour tout i ∈ [[2, n]], (t, (xi , . . . , xn )) ∈ R+ × R(n−i+1)d , la fonction xi−1 ∈ Rd 7→ Fi (t, xi−1 , . . . , xn ) est
continûment différentiable, la dérivée notée (t, xi−1 , . . . , xn ) ∈ R+ × R(n−i+2)d 7→ Dxi−1 Fi (t, xi−1 , . . . , xn ), est
supposée η-Hölder continue de constante κ en la première variable spatiale xi−1 .
(d) Il existe un ensemble convexe fermé Ei−1 ⊂ GLd (R) (ensemble des matrices inversible d × d) tel que pour
tout t ≥ 0 et (xi−1 , . . . , xn ) ∈ R(n−i+2)d , la matrice Dxi−1 Fi (t, xi−1 , . . . , xn ) appartienne à Ei−1 . Par exemple,
Ei , 1 ≤ i ≤ n − 1, peut-être une boule fermée incluse dans l’ouvert GLd (R).
Le point (a) est une condition classique d’uniforme ellipticité de la matrice de diffusion. La condition (b) est
assez naturelle du point de vue des EDO/EDP. Elle garantit que l’EDO sous-jacente à (5.2), i.e. lorsque l’on
47
supprime le forçage stochastique, est bien posée. Par ailleurs on retrouve sur a l’hypothèse usuelle de régularité
pour les opérateurs sous forme non divergence. La condition (c) est utilisée pour l’analyse de densité : on suppose
un peu plus de régularité sur Fi par rapport à la composante xi−1 qui transmet le bruit.
Le point (d) traduit une condition de type Hörmander faible qui permet la propagation du bruit dans le
système. L’hypothèse de convexité est technique. Nous renvoyons à la Section 3 de [10] pour plus de détails.
En particulier, on retrouve comme au Chapitre 3 que les coefficients, supposés mesurables, peuvent être
irréguliers en temps (F (t, 0) borné).
Théorème 5.2.1 Supposons (A) vérifiée est que l’EDS (5.2) est uniquement soluble en loi. Alors, la solu-
tion (faible) de (5.2) admet pour tout t > 0 une densité p(t, ., .) qui vérifie des estimées de type d’Aronson.
Précisément, pour tout T > 0, ∃CT ≥ 1, CT := CT (Λ, η, κ, (Ei )i∈[[1,n−1]] , n, d), telle que pour tout t ∈ (0, T ],
(x, y) ∈ Rnd × Rnd :
2 2 2 2
CT−1 t−n d/2 exp −CT t Tt−1 θt (x) − y ≤ p(t, x, y) ≤ CT t−n d/2 exp −CT−1 t T−1 t θt (x) − y .
Ci-dessus, Tt est la matrice d’“échelle” du système. C’est une matrice diagonale de taille nd × nd qui se
décompose en n blocs diagonaux de taille d × d où le ième bloc diagonal est donné par ti Id , où Id est la matrice
identité d × d. De plus, θt (x) = (θt1 (x), θt2 (x), . . . , θtn (x)) désigne la valeur dans Rnd au temps t de la solution
de l’EDO déterministe associée à (5.2) :
1
θ˙t = F1 (t, θt1 , . . . , θtn ),
i
θ˙t = Fi (t, θti−1 , . . . , θtn ), 2 ≤ i ≤ n, θ 0 (x) = (θ01 (x), . . . , θn1 (x)) = x. (5.3)
Le transport de la condition initiale x par le flot déterministe θ peut se voir comme une généralisation non linéaire
de l’exemple de Kolmogorov abordé en Section 3.2.1. La matrice d’échelle traduit le fait que Xti , i ∈ [[1, n]] oscille
autour de θti (x) avec des fluctuations d’ordre ti−1/2 . Pour i = 1, l’action du flot (d’ordre t) est négligeable devant
le bruit (d’ordre t1/2 ) en temps petit. A l’opposé, pour i ≥ 2, les fluctuations de Xti peuvent être beaucoup plus
petites que la distance entre θi (x) et xi : le terme de transport joue alors un rôle clé dans l’estimée de densité
pour ces coordonnées.
L’effet multi-échelle dans l’estimation ci-dessus provient de la structure des coefficients (Fi )i∈[[1,n]] et de la
condition de Hörmander (d) qui nous donne que le bruit se propage suivant une seule direction dans le système.
Nous avons supposé ci-avant que F1 était Lipschitz, en autorisant de fait les croissances linéaires. Sous réserve
d’unicité en loi le résultat précédent resterait valable pour F1 mesurable borné.
Pour la suite nous réécrirons la dynamique de (5.2) sous la forme condensée
48
Par ailleurs limε→0 uε (0, x) = limε→0 E[ηε (X0,x T −ε )] = p(T, x, y0 ).
Introduisons maintenant pour (t, x) ∈ [0, T − ε] × Rnd , Jε (t, x) = − ln[uε (t, x)]. Cette fonction vérifie l’EDP
quadratique suivante
(
∂t Jε (t, x) + Lt Jε (t, x) − 12 ha(t, x)Dx1 Jε (t, x), Dx1 Jε (t, x)i = 0, (t, x) ∈ [0, T − ε) × Rnd ,
(5.4)
Jε (T − ε, x) = − ln(ηε (x)), x ∈ Rnd .
Le point clé consiste à remarquer que la partie différentielle précédente peut se réécrire
1
∂t Jε (t, x) + Lt Jε (t, x) + inf hv, Dx1 Jε (t, x)i + ha−1 (t, x)v, vi = 0, (5.5)
v∈R d 2
où l’infimum est atteint en v = v(t, x) := −a(t, x)Dx1 Jε (t, x) et redonne (5.4). Notons P(T − ε) l’ensemble des
R T −ε
processus progressivement mesurables (vt )t∈[0,T −ε] à valeurs dans Rd tels que E[ 0 |vt |2 dt] < +∞. A tout
(vt )0≤t≤T −ε ∈ P(T − ε) on peut associer une version contrôlée de (5.2), i.e.
En exploitant (5.5), nous pouvons écrire Jε (0, x) comme la fonction valeur d’un problème de contrôle stochas-
tique : " Z #
1 T −ε −1 0,x 0,x
Jε (0, x) = inf E ha (t, χt )vt , vt idt − ln[ηε (χT −ε )] . (5.7)
(vt )t ∈P(T −ε) 2 0
L’équation (5.7) associée à l’identité − ln(p(T, x, y0 )) = limε→0 Jε (0, x) constitue l’élément clé de notre preuve.
Elle intervient pour les deux bornes du théorème.
Des arguments usuels de contrôle, cf. Coron [Cor07] nous ont permis d’établir que I(T, x0 , y0 ) est finie,
i.e. l’équation (5.8) est contrôllable. Nous avons également établi que I(T, x0 , y0 ) est du même ordre que
T |T−1 2
T (θ T (x0 ) − y0 )| . La comparaison avec l’énoncé du Théorème 5.2.1, nous donne donc que l’énergie du
contrôle optimal déterministe va fournir la décroissance hors diagonale de la densité. De cette étape on décide
de choisir le contrôle vt dans (5.6) sous la forme vt := ϕt + vt0 .
49
(iii). Il reste donc à choisir (vt0 )t∈[0,T −ε] . Pour cela remarquons que d’après (5.6) et (5.8), la dynamique de
(χ0,x
t − φt )0≤t≤T −ε s’écrit :
d χ0,x
t − φt = Dx F(t, φt )(χ0,x t − φt ) + B(vt − ϕt ) dt + Bσ(t, φt )dWt + dRt , (5.10)
où (Rt )0≤t≤T −ε désigne un terme de reste qu’une analyse de stabilité technique, car non linéaire, permet
de contrôler. Observons que χ0,x 0 − φ0 = 0 et que χ0,x T −ε − φT −ε est a priori proche de y0 − y0 = 0. Ces
observations heuristiques font qu’un candidat naturel pour v 0 est le contrôle optimal Gaussien qui partant de 0
permet d’atteindre 0 en T . Par l’étape (i), nous savons également calculer son coût (au sens de la formulation
2
(5.7)) : celui-ci est à une constante additive près de l’ordre de − ln(T −n d/2 ) et correspond dans le Théorème
5.2.1 au contrôle de la densité sur la “diagonale”.
En résumé, de la formulation contrôle (5.7) on choisit un contrôle particulier vt = ϕt + vt0 , où (ϕt )t∈[0,T −ε]
permet d’isoler les contributions hors diagonale, (vt0 )t∈[0,T ] donne la vitesse diagonale. C’est l’étape de contrôle
des restes dans (5.10) qui est délicate. En effet, nous devons à ce propos utiliser des arguments de type Gron-
wall non linéaire qui font que l’on établira d’abord les bornes du théorème en temps court. Un argument de
convolution ou de changement d’échelle permet ensuite de les étendre à temps arbitraire fixé.
La fonction I(T, x, y) introduite dans (5.9) est la fonctionnelle d’action des grandes déviations. Elle établit
un lien naturel entre le problème de contrôle déterministe (5.8–5.9) et la densité de transition de (5.2), cf.
Freidlin and Wentzell [FW98] pour le cas non-dégénéré et Ben Arous et Léandre [BL91] pour des résultats
sous condition de Hörmander forte. L’utilisation de la transformée de Fleming, introduite par Sheu [She91] et
développée dans cette section permet une extension de ce lien lorsque le temps ne tend pas forcément vers 0.
Comme indiqué ci-avant, nous conservons à cause de l’étude de stabilité une contrainte de temps court.
Désignons par (L̃tT,y0 )0≤t≤T le générateur de X̃ gelé au temps T et au point y0 . On rappelle que la quantité
fondamentale pour le développement parametrix est le noyau
T,y0 T,y0
H(t, T, x, y0 ) = Lt,x − L̃t,x p̃ (t, T, x, y0 ) ,
50
Malheureusement nous n’arrivons pas à faire tendre N vers l’infini dans (5.11). A cause du transport non
linéaire θ, nous n’avons pas réussi à contrôler les noyaux itérés (H ⊗k )k≥1 uniformément en k. Nous renvoyons
au Chapitre 3 pour le cas linéaire auquel la démarche usuelle s’applique.
Nous devons donc ici tronquer la série. Le point clé est que la formulation (5.7) permet d’établir que, pour
N suffisamment grand, le terme de reste
Z TZ
p(t, x0 , z)H ⊗(N +1) (t, T, z, y0 )dzdt
0 Rnd
dans (5.11) admet une borne Gaussienne dont on déduit l’estimée énoncée. Cette technique est à notre connais-
sance nouvelle.
51
5.2.5 Extensions et perspectives
Ce travail ouvre de nombreuses perspectives. Tout d’abord le Théorème 5.2.1 est énoncé sous réserve d’uni-
cité en loi. Si les coefficients de (5.2) vérifient (A) avec η > 1/2 nous obtenons cette identité en loi comme
corollaire d’un principe de comparaison de Ishii et Lions [IL90] pour les solutions de viscosité d’équations non
linéaires. Cet argument n’est pas très approprié dans notre cas dans la mesure où il n’utilise pas du tout l’aspect
régularisant du noyau de la chaleur. Par ailleurs, dans les preuves aucune limite de ce type sur η n’est apparue.
Dans un travail en cours 4 , je m’intéresse au problème de martingale pour (5.2), dans le cas où a est uni-
formément elliptique et continu en espace, en gardant inchangées les autres hypothèses dans (A). Comme dans
le cas non dégénéré, cf. [SV79], l’idée est d’établir des inégalités de Calderón-Zygmund pour le modèle Gaussien.
Une des difficultés est dans notre cadre d’introduire une bonne métrique parabolique qui tienne compte de l’as-
pect multi-échelle. De l’unicité du problème de martingale on déduirait immédiatement que le Théorème 5.2.1
est valable pour η ∈ (0, 1]. Les estimées de Calderón-Zygmund permettraient également d’aborder des EDP
dégénérées semi-linéaires. J’essaie également de donner des contrôles ponctuels sur les dérivées de la densité à
partir de l’analyse précédente.
En terme d’applications, on peut penser aux systèmes Hamiltoniens, deux problèmes associés à l’équation
(5.2) considérée apparaissent naturellement : le développement asymptotique de la densité en temps petit,
et l’estimation du régime stationnaire, ainsi que de la vitesse de convergence vers ce dernier, sous de bonnes
conditions de stabilité. Pour l’estimée en temps petit, on s’attend à ce que le contrôle optimal dans la formulation
(5.7) soit proche du contrôle optimal déterministe dans (5.8). Il faudrait raffiner l’analyse de stabilité pour
l’établir rigoureusement. Adapter la démarche précédente à l’estimation en temps long sous conditions de type
Lyapunov reste à faire. Une idée pourrait être de choisir comme contrôle dans (5.7) un contrôle optimal explicite
associé à un processus “canonique” pour le régime limite considéré, i.e. Ornstein-Ulhenbeck si la force de rappel
est à croissance linéaire.
Si l’on rajoute dans (5.2) un bruit sur la dernière composante on retrouve le cadre des modèles microscopiques
de mécanique statistique pour la diffusion de chaleur. Dans un modèle linéaire d’interaction aux plus proches
voisins comme celui de Bodineau et Lefevere [BL08], il serait intéressant de reprendre l’analyse précédente et
d’essayer d’obtenir des bornes de déviations non asymptotiques en temps. Nous avons prévu avec Raphaël Le-
fevere de discuter à ce propos.
Nous avons considéré ici un régime Gaussien qui permettait de faire apparaı̂tre naturellement, et avec de
bonnes estimées, le lien avec le contrôle déterministe. Une extension naturelle consiste à considérer d’autres
régimes, i.e. lorsque des crochets de Lie d’ordre strictement supérieur à 1 interviennent
Rt pour engendrer l’espace.
L’exemple le plus simple consiste à étudier la densité du couple (x + Wt , 0 (x + Ws )k ds)t≥0 où (Wt )t≥0 est le
mouvement Brownien réel standard.
Pour k = 2 des formules “explicites” existent, cf. formule 1.9.8 de Borodin et Salminen [BS03] mais ne sont
pas directement exploitables pour déduire des contrôles à la Aronson sur la densité. Pour x = 0 et k impair
Chiara Cinti et Sergio Polidoro, des Universités de Bologne et Modena, ont obtenu dans [CP08] une borne
inférieure. Les outils sont ceux de la théorie du potentiel pour les opérateurs sous-elliptiques, cf. Bonfiglioli et
al. [BLU07]. Nous avons avec ces auteurs étendu ces résultats pour k quelconque. Ce travail est en cours de
rédaction.
Par ailleurs, avec V. Konakov de l’Université de Moscou, nous avons montré par des techniques de calcul de
Malliavin que ces estimées sont précises, i.e. qu’il existe une borne supérieure du même ordre. Pour x1 = 0 et k
quelconque nous obtenons ∃c ∈ (0, 1], C := C(T ) ≥ 1 telles que pour tout (t, (0, x2 ), (y1 , y2 )) ∈ (0, T ] × ({0} ×
R) × R2 :
C −1 |y1 |2 |y2 − x2 |2/k C |y1 |2 |y2 − x2 |2/k
exp −c−1 + ≤ p(t, (0, x2 ), (y ,
1 2y )) ≤ exp −c + .
t(k+3)/2 t t1+2/k t(k+3)/2 t t1+2/k
Ce travail est également en cours. L’idée est de bien comprendre la structure du transport de la condition initiale
pour x 6= 0. Nous y arrivons lorsque |y2 − x2 | ≥ t|x1 |k , i.e. lorsque l’on est en grand régime par rapport au
2 k 2/k
transport déterministe. Le terme dans l’exponentielle précédente s’écrit alors |y1 −x
t
1|
+ (|y2 −x2t1+2/k
|−t|x1 | )
.
Le transport en petits régimes reste à analyser. Une piste peut être d’utiliser des inégalités de Tcheby-
chev exponentielles à l’aide des transformées de Laplace, voir Mansuy et Yor [MY09] pour le cas k = 2. La
caractérisation complète, i.e. pour tous les régimes, est une étape nécessaire en vue d’appliquer une méthode
paramétrix pour remplacer le Brownien par une diffusion.
4. [Link] “Well posedness of the martingale problem for Kolmogorov’s equations”
52
5.3 Estimation de densité et concentration
Nous présentons ici une application des estimées de type Aronson : l’obtention d’intervalles de confiance non
asymptotiques pour la méthode de Monte Carlo. La domination Gaussienne permet en effet d’utiliser les outils
usuels en concentration de la mesure, inégalité de Sobolev logarithmique et argument de Herbst (cf. Ledoux
[Led99]), pour déduire des inégalités de déviation non asymptotiques.
Nous avons abordé le cas des diffusions :
Z t Z t
Xt = x + b(s, Xs )ds + σ(s, Xs )dWs , (5.13)
0 0
où (Xt )t≥0 est à valeurs dans Rd et (Wt )t≥0 est un mouvement Brownien de Rd . Par la suite nous ferons
référence à l’équation précédente en parlant du cas (a). Nous avons également considéré :
Z t Z t
Xt1 = x1 + b(s, Xs )ds + σ(s, Xs )dWs ,
0 0
Z t
2
Xt = x2 + Xs1 ds, (5.14)
où Xt = (Xt1 , Xt2 ) est à valeurs dans Rd × Rd . L’équation (5.14) est un cas particulier de (5.2) pour n = 2 et
F (x1 , x2 ) = (b(x1 , x2 ), x1 )∗ . Nous en parlerons comme du cas (b).
Les coefficients b, σ des équations ci-dessus vérifient les hypothèses de la partie opérateurs sous forme non
divergence de la Section 5.1 dans le cas non dégénéré (a), et (H) de la Section 5.2 en supposant F1 = b borné
pour le cas dégénéré (b).
Dans le cas (a), nous avons considéré le schéma d’Euler de pas de temps h := T /N, N ∈ N∗ . Posons
∀i ∈ N, ti = ih, et pour t ≥ 0, φ(t) := sup{ti : ti ≤ t}. La dynamique s’écrit :
Z t Z t
Xth = x + h
b(φ(s), Xφ(s) )ds + h
σ(φ(s), Xφ(s) )dWs . (5.15)
0 0
où Xth := (Xth,1 , Xth,2 ). L’équation (5.16) definit un schéma complètement simulable à incréments Gaussiens.
Sur chaque pas de temps, les d dernières composantes sont l’intégrale d’un processus Gaussien.
L’erreur faible pour ces modèles est bien comprise, voir Chapitre 1 et 3. Il reste donc à contrôler, avec les
notations de l’équation (1.5) :
M
S 1 X
EM,h := f (T, (XTh )i ) − Ex [f (T, XTh )], (5.17)
M i=1
où T > 0 est fixé et (XTh )i i∈N∗ est une suite i.i.d de réalisations du schéma d’Euler (5.15) dans le cas (a) et
(5.16) pour le cas (b).
Dans le cadre ergodique, le contrôle non asymptotique de l’erreur a été étudié par Malrieu et Talay [MT06a].
Les auteurs ont réussi à établir que le schéma d’Euler d’un processus de diffusion multi-dimensionnel à coefficient
de diffusion constant vérifie une inégalité de Sobolev logarithmique, qui implique la concentration gaussienne
(voir e.g. Ledoux [Led99]). La borne de concentration non asymptotique en découle aisément. Toujours dans le
contexte ergodique, mentionnons le travail de Joulin et Ollivier pour les chaı̂nes de Markov [JO09].
Notre but est ici différent. Nous souhaitons donner un contrôle pour T > 0 et ne pouvons appliquer di-
rectement la machinerie log-Sobolev, par ailleurs assez rigide pour le passage aux discrétisations, directement.
Sous les hypothèses précédentes nous avons néanmoins pu établir des bornes Gaussiennes dans les cas (a) et
(b). L’idée pour en dériver une borne non asymptotique est d’utiliser ensuite que la densité Gaussienne qui do-
mine vérifie une inégalité de Sobolev logarithmique. On peut alors modifier l’argument de Herbst pour obtenir
l’inégalité de déviation souhaitée. Il faut toutefois gérer la constante qui apparaı̂t devant la densité Gaussienne
dans l’estimée d’Aronson suivante.
53
Théorème 5.3.1 (Estimées d’“Aronson” Gaussiennes pour le schéma d’Euler) Il existe c ∈ (0, 1], C ≥
1, C := C(T, d, Λ, |b|), c := c(d, Λ), tels que pour 0 ≤ j < j ′ ≤ N :
où ph désigne la densité du schéma d’Euler. Pour 0 ≤ s < t ≤ T , dans le cas (a), pc (t − s, x, x′ ) :=
d/2 ′
−x|2
c
2π(t−s) exp −c |x
2(t−s) et dans le cas (b)
√ !d ′ x +x′
′ 3c |x1 − x1 |2 |x′2 − x2 − 1 2 1 (t − s)|2
pc (t − s, x, x ) := exp −c +3 .
2π(t − s)2 4(t − s) (t − s)3
Pour établir ce théorème, les techniques sont les mêmes qu’auparavant : i.e. représentation parametrix discrète
de la densité des schémas pour obtenir la borne supérieure, et méthode de chaı̂nage adaptée au cas semi-
Markovien du schéma d’Euler pour la minoration. Néanmoins, ce résultat est à ma connaissance le premier sous
les hypothèses usuelles précédentes. Il peut dans le cas non dégénéré se déduire de Gobet et Labart [GL08] sous
des hypothèses plus fortes de régularité de b, σ.
Nous obtenons ensuite le résultat de concentration.
Théorème 5.3.2 (Concentration Gaussienne ) Considérons pour le cas (a) une fonction f : Rd → R
Lipschitzienne en espace et mesurable bornée en temps,
vérifiant |∇f (T, .)|∞ ≤ 1. Pour le cas (b) on suppose
−1 −1 Id 0
que f (T, x) = g(T, TT x) où TT = et g est une fonction Lipschitzienne en espace et mesurable
0 T −1 Id
bornée en temps, vérifiant |∇g(T, .)|∞ ≤ 1.
Pour les constantes c, C du Théorème 5.3.1, pour tout h = T /N, N ≥ 1,
S M 2
∀r > 0, ∀M ≥ 1, Px |EM,h | ≥ r + δC,α(T ) ≤ 2 exp − r ,
α(T )
où (
c
1 2T dans le cas (a),
= √ c
α(T ) (4 − 13) 2T dans le cas (b),
p
et δC,α(T ) = 2 α(T ) log C.
Lorsque de plus f tend vers l’infini dans une direction, nous établissons une borne inférieure du même ordre.
Nous renvoyons à [10] pour un énoncé complet du théorème.
Le terme correctif δC,α(T ) correspond à une borne supérieure pour la distance de Wasserstein entre les lois
de densités ph (T, x, .) et pc (T, x, .) lorsque celles-ci vérifient la condition de domination de l’équation (5.18). Si
C = 1 ce terme correctif disparaı̂t. Dans ce cas là on est directement Gaussien. C’est en revanche le prix à payer
dans le cas général. Ce terme est fixé une fois pour toutes. Pour M grand, l’ordre de déviation typique donné par
le théorème central limite est r = √cM 0
pour c0 > 0 dépendant d’un seuil fixé et de la variance de f (T, XTh ). Du
fait de la technique employée, i.e. domination par une densité qui vérifie une inégalité de log-Sobolev, notre borne
1/2
n’est pas pertinente pour M tendant vers l’infini à T fixé. En revanche elle l’est tant que r = √cM 0
≥ 2T c
1/2
et en particulier lorsque r = √cM 0
et 2Tc sont du même ordre. Ainsi, si le temps T est “petit”, la borne
non asymptotique restera valable jusqu’à M assez grand, relié à T par l’inégalité précédente. Un autre cas
intéressant est celui où pour T > 0 fixé il est difficile de simuler un nombre important de trajectoires de Monte
Carlo. On peut penser pour illustrer ce dernier cas à un schéma d’Euler dont l’évaluation des coefficients ferait
appel à des codes de calculs lourds.
54
Annexe A
Nous indiquons dans cette section les idées principales de la note [12] qui établit un lien entre la méthode
parametrix à la Mc Kean et Singer présentée ci-avant et la technique employée par Bass et Perkins [BP09] pour
prouver l’unicité du problème de martingale pour un opérateur sous forme non divergence non dégénéré.
Cette identification et les contrôles obtenus dans l’article [10] permettent ensuite de prouver l’unicité du
problème de martingale associé à l’équation dégénérée (5.2) sous les hypothèses (A) de la Section 5.2 pour tout
η ∈ (0, 1]. Ceci étend la validité du Théorème 5.2.1, comme nous l’espérions (cf. Section 5.2.5).
La linéarisation utilisée dans la méthode parametrix pour la majoration de la densité faisait intervenir pour
T > 0, y ∈ Rnd l’équation linéaire :
dX̃T,y
t = F(t, θt,T (y)) + DF(t, θ t,T (y)) X̃T,y
t − θ t,T (y) dt
(A.2)
+ Bσ(t, θ t,T (y))dWt , 0 ≤ t ≤ T,
55
Lemme A.1.1 Soit T0 > 0 fixé. Il existe une constante CA.1.1 > 0, dépendant de (A) et T0 t.q. pour tout
t ∈ [0, T ), T ≤ T0 et z, y ∈ Rnd ,
η
|H(t, T, z, y)| ≤ CA.1.1 (T − t) 2 −1 gCA.1.1 ,T −t z − θt,T (y) ,
2d
où pour tout a > 0, t > 0, ga,t (y) = t−n 2 exp(−a−1 t|T−1 2
t y| ), a, t > 0, y ∈ Rnd .
Par le même type de techniques que celles utilisées pour prouver le lemme précédent, on peut également
établir :
Lemme A.1.2 Soit une fonction h ∈ C 0 (Rnd , R). Définissons pour tout (s, x) ∈ [0, T ] × Rnd ,
Z
∀ε > 0, Ξε (s, x) := dyh(s, y)p̃s+ε,y (s, s + ε, x, y).
Rnd
où (Xt )t∈[s,T ] désigne ici le processus canonique associé à (Pi )i∈[[1,2]] . Précisons (comme il est mentionné dans
[BP09]) que Sf est seulement une fonctionnelle linéaire et non une fonction dans la mesure où Pi ne provient
pas forcément d’un processus de Markov. Posons :
S ∆ f := S 1 f − S 2 f, Θ := sup |S ∆ f |.
kf k∞ ≤1
Remarquons que Θ ≤ T − s.
Si f ∈ C02 ([0, T ) × Rnd , R), par définition du problème de martingale nous obtenons :
"Z #
T
f (s, x) + Ei dt(∂t + Lt )f (t, Xt ) = 0, i ∈ [[1, 2]]. (A.4)
s
(∂s + L̃t+ε,y
s,x )p̃
t+ε,y
(s, t, x, z) = 0, ∀(s, x, z) ∈ [0, t) × (Rnd )2 , p̃t+ε,y (s, t, x, .) −→ δx (.). (A.6)
t↓s
56
Si l’on définit pour toute fonction f ∈ C01,2 ([0, T ) × Rnd , R), (s, x) ∈ [0, T ) × Rnd ,
Z T Z
ε,y
Ms,x f (s, x) := dt dzL̃t+ε,y
s,x p̃
t+ε,y
(s, t, x, z)f (t, z),
s Rnd
Introduisons désormais pour une fonction régulière h ∈ C01,2 ([0, T ) × Rnd , R) et pour tout (s, x) ∈ [0, T ) × Rnd :
en utilisant la propriété de semi-groupe de la densité gelée. Ecrivons pour tout (s, x) ∈ [0, T ) × Rnd ,
Z
(∂s + Ls )Ψε (s, x) = dy(∂s + Ls )(Gε,y Φε,y )(s, x)
Rnd
Z Z
= dy(∂s Gε,y Φε,y + Ms,x
ε,y ε,y
Φ )(s, x) + dy(Ls Gε,y Φε,y − Ms,x
ε,y ε,y
Φ )(s, x)
R nd R nd
Z Z
= − dyΦε,y (s, x) + dy(Ls Gε,y Φε,y − Ms,xε,y ε,y
Φ )(s, x) := I1ε + I2ε ,
Rnd Rnd
en utilisant (A.7) pour l’avant dernière égalité. Le Lemme A.1.2 donne I1ε −→ −h(s, x). Par ailleurs,
ε→0
Z T Z
I2ε = dt dy(Ls − L̃t+ε,y
s,x )p̃
t+ε,y
(s, t + ε, x, y)h(t, y)
s Rnd
Z T Z
= dt dyH(s, t + ε, x, y)h(t, y).
s Rnd
Du Lemme A.1.1,
Z T Z
|I2ε | ≤ CA.1.1 khk∞ dt(t + ε − s)−1+η/2 dygCA.1.1 ,t+ε−s (x − θs,t+ε (y))
s Rnd
Z T Z
−1+η/2
≤ khk∞ CA.9 dt(t + ε − s) dygCA.9 ,t+ε−s (θ t+ε,s (x) − y) ≤ CA.9 {(T − s) ∨ ε}η/2 khk∞ ,
s Rnd
(A.9)
en utilisant la propriété de bi-Lipschitz continuité du flot pour l’avant dernière inégalité, en modifiant CA.9 dans
la dernière (cette constante modifiée ne dépend toutefois que de (A)). Ainsi, pour T suffisamment petit nous
avons par (A.9)
1
|I2ε | ≤ khk∞ . (A.10)
2
L’équation (A.4) et la définition précédente de S ∆ donnent :
57
Par la partie convergence bornée du Lemme A.1.2 et (A.10), nous obtenons :
khk∞
|S ∆ h| = lim |S ∆ I1ε | = lim |S ∆ I2ε | ≤ Θ lim sup |I2ε | ≤ Θ .
ε→0 ε→0 ε→0 2
Par un argument de classe monotone, l’inégalité précédente reste vraie pour toute fonction h mesurable bornée,
à support compact dans [0, T ) × Rnd
hR. En prenanti le supremum
hR sur khki∞ ≤ 1, on arrive à Θ ≤ 21 Θ ce qui donne
T T
Θ = 0 comme Θ < +∞. Ainsi, E1 s dth(t, Xt ) = E2 s dth(t, Xt ) ce qui prouve le résultat sur l’intervalle
[0, T ]. Les probabilités conditionnelles régulières permettent d’étendre le résultat sur R+ (voir Chapitre 6.2 de
Stroock et Varadhan [SV79]).
58
Bibliographie
[Als94] G. Alsmeyer. On the Markov renewal theorem. Stoch. Proc. Appl., 50(1) :37–56, 1994.
[Ant93] F. Antonelli. Backward-Forward Stochastic Differential Equations. Ann. Appl. Probab., 3-3 :777–793,
1993.
[Aro67] D. G. Aronson. Bounds for the fundamental solution of a parabolic equation. Bull. Amer. Math.
Soc., 73 :890–896, 1967.
[Bal90] V. Bally. On the connection between the Malliavin covariance matrix and Hörmander’s condition.
J. Funct. Anal., 96–2 :219–255, 1990.
[Bal95] P. Baldi. Exact asymptotics for the probability of exit from a domain and applications to simulation.
Ann. Prob., 23(4) :1644–1670, 1995.
[Bas97] R. F. Bass. Diffusions and Elliptic Operators. Springer, 1997.
[BCI99] P. Baldi, L. Caramellino, and M.G. Iovino. Pricing general barrier options : a numerical approach
using sharp large deviations. Math. Finance, 9(4) :293–322, 1999.
[BDH+ 03] P. Briand, B. Delyon, Y. Hu, E. Pardoux, and L. Stoica. Lp solutions of backward stochastic
differential equations. Stoch. Proc. Appl., 108 :109–129, 2003.
[BGJ87] K. Bichteler, J.B. Gravereaux, and J. Jacod. Malliavin Calculus for processes with jumps. Stochastics
Monographs, volume 2, 1987.
[BGK97] M. Broadie, P. Glasserman, and S. Kou. A continuity correction for discrete barrier options. Ma-
thematical Finance, 7 :325–349, 1997.
[BGK99] M. Broadie, P. Glasserman, and S. Kou. Connecting discrete and continuous path-dependent options.
Fin. and Stoch., 3 :55–82, 1999.
[BL82] A. Bensoussan and J. L. Lions. Contrôle impulsionnel et inéquations quasi variationnelles. Gauthiers
Villars, 1982.
[BL91] G. Ben Arous and R. Léandre. Décroissance exponentielle du noyau de la chaleur sur la diagonale.
II. Prob. Th. Rel. Fields, 90(3) :377–402, 1991.
[BL97] G. Barles and E. Lesigne. SDE, BSDE and PDE. Backward stochastic differential equations (Paris
95-96). Stat. and Prob. Letters, Pitman research, 364 :47–80, 1997.
[BL08] T. Bodineau and L. Lefevere. Large deviations of lattice Hamiltonian dynamics coupled to stochastic
thermostats. Journal of Statistical Physics, 133 :1–27, 2008.
[BLP07] N. Bruti-Liberati and E. Platen. Strong approximations of stochastic differential equations with
jumps. J. Comput. Appl. Math., 205–2 :982–1001, 2007.
[BLU07] A. Bonfiglioli, E. Lanconelli, and F. Uguzzoni. Stratified Lie groups and potential theory for their
sub-Laplacians. Springer, 2007.
[BM01] V. Bally and A. Matoussi. Weak solutions for SPDEs and backward doubly stochastic differential
equations. J. Theoret. Probab., 14–1 :125–164, 2001.
[BM03] Y. Belopolskaya and G. N. Milstein. An approximation method for Navier–Stokes equations based
on probabilistic approach. Stat. and Prob. Letters, 64 :201–211, 2003.
59
[BP03] V. Bally and G. Pagès. A quantization algorithm for solving discrete time multi-dimensional optimal
stopping problems. Bernoulli, 9–6 :1003–1049, 2003.
[BP09] R.F. Bass and E.A. Perkins. A new technique for proving uniqueness for martingale problems. From
Probability to Geometry (I) : Volume in Honor of the 60th Birthday of Jean-Michel Bismut, pages
47–53, 2009.
[BPR06] A. Beskos, O. Papaspiliopoulos, and G. O. Roberts. Retrospective exact simulation of diffusion
sample paths with applications. Bernoulli, 12–6 :1077–1098, 2006.
[BPV01] E. Barucci, S. Polidoro, and V. Vespri. Some results on partial differential equations and asian
options. Math. Models Methods Appl. Sci, 3 :475–497, 2001.
[BR76] R. Bhattacharya and R. Rao. Normal approximations and asymptotic expansions. Wiley and sons,
1976.
[BS97] R. Bañuelos and R.G. Smits. Brownian Motion in cones. Prob. Th. Rel. Fields, 108 :299–319, 1997.
[BS03] A. N. Borodin and P. Salminen. Handbook of Brownian motion : facts and formulae. Birkhauser,
2003.
[BT96a] V. Bally and D. Talay. The law of the Euler scheme for stochastic differential equations : I. Conver-
gence rate of the distribution function. Prob. Th. Rel. Fields, 104-1 :43–60, 1996.
[BT96b] V. Bally and D. Talay. The law of the Euler scheme for stochastic differential equations, II. Conver-
gence rate of the density. Monte-Carlo methods and Appl., 2 :93–128, 1996.
[BT04] B. Bouchard and N. Touzi. Discrete time approximation and Monte-Carlo simulation of Backward
Stochastic Differential Equations. Stoch. Proc. Appl., 111 :175–206, 2004.
[BZ08] C. Bender and J. Zhang. Time discretization and Markovian Iteration for Coupled FBSDEs. Annals
of Applied Probability, 18 :143–177, 2008.
[Cat90] P. Cattiaux. Calcul stochastique et opérateurs dégénérés du second ordre - I. Résolvantes, théorème
de Hörmander et applications. Bull. Sc. Math., 2ème série, 114 :421–462, 1990.
[Cat91] P. Cattiaux. Calcul stochastique et opérateurs dégénérés du second ordre - II. Problème de Dirichlet.
Bull. Sc. Math., 2ème série, 115 :81–122, 1991.
[Che97] D. Chevance. Numerical methods for Backward Stochastic Differential Equations. Publ. Newton
Inst., Cambridge University Press, pages 232–234, 1997.
[CIL92] M. G. Crandall, I. Ishii, and Lions P. L. User’s guide to viscosity solutions of second order partial
differential equations. Bull. Amer. Math. Soc., 27 :1–67, 1992.
[CJ59] H. Carslaw and J. Jaeger. Conduction of Heat in Solids. Oxford Univ. Press, 1959.
[CKG06] C. Costantini, N. El Karoui, and E. Gobet. Boundary sensitivities for diffusion processes in time
dependent domains. Appl. Math. Optim., 54–2 :159–187, 2006.
[CM02] P. Cattiaux and L. Mesnager. Hypoelliptic non-homogeneous diffusions. Prob. Th. Rel. Fields,
123(4) :453–483, 2002.
[Cor07] J.-M. Coron. Control and nonlinearity. Mathematical Surveys and Monographs, 136, AMS, 2007.
[CP08] C. Cinti and S. Polidoro. Harnack inequalities and lifting procedure for evolution hypoelliptic equa-
tions. Lect. Notes Semin. Interdisc. Mat., 7 :93–105, 2008.
[Del02] F. Delarue. On the existence and uniqueness of solutions to FBSDEs in a non-degenerate case.
Stoch. Proc. and App., 99 :209–286, 2002.
[DG06] F. Delarue and G. Guatteri. Weak Existence and Uniqueness for FBSDEs. Stoc. Proc. and Appl.,
116 :1712–1742, 2006.
[DK06] R. A. Doney and A. E. Kyprianou. Overshoots and undershoots of Lévy processes. Ann. Appl.
Probab., 16–1 :91–106, 2006.
60
[DL06] M. Deaconu and A. Lejay. A random walk on rectangles algorithm. Methodology And Computing
In Applied Probability, 8(1) :135–151, 2006.
[DMP96] J. Douglas, J. Ma, and P. Protter. Numerical methods for Forward-Backward Stochastic Differential
Equations. Ann. Appl. Prob., 6 :940–968, 1996.
[DP97] R. Darling and E. Pardoux. Backward SDE with random terminal time and applications to semilinear
elliptic PDE. Ann. Probab, 25 :1135–1159, 1997.
[Dyn63] E. B Dynkin. Markov Processes. Springer Verlag, 1963.
[EPRB99] J.-P. Eckmann, C.-A. Pillet, and L. Rey-Bellet. Non-equilibrium statistical mechanics of anharmonic
chains coupled to two heat baths at different temperatures. Comm. Math. Phys., 201–3 :657–697,
1999.
[FL01] C.D. Fuh and T.L. Lai. Asymptotic expansions in multidimensional Markov renewal theory and first
passage times for Markov random walks. Adv. in Appl. Probab., 33(3) :652–673, 2001.
[Fre85] M. Freidlin. Functional integration and Partial differential equations. Annals of Mathematics studies,
Princeton University Press, 1985.
61
[HN04] F. Hérau and F. Nier. Isotropic hypoellipticity and trend to equilibrium for the fokker-planck
equation with a high-degree potential. Arch. Ration. Mech. Anal., 171–2 :151–218, 2004.
[Hör67] L. Hörmander. Hypoelliptic second order differential operators. Acta. Math., 119 :147–171, 1967.
[HP57] E. Hille and R. S. Philips. Functional Analysis and semigroups. AMS, 57.
[IKO62] A. M. Il’in, A. S. Kalashnikov, and O. A. Oleinik. Second-order linear equations of parabolic type.
Uspehi Mat. Nauk, 17–3(105) :3–146, 1962.
[IL90] H. Ishii and P.-L. Lions. Viscosity solutions of fully nonlinear second-order elliptic partial differential
equations. J. Diff. Equations, 83 :26–78, 1990.
[IP06] P. Imkeller and I. Pavlyukevich. First exit times of sdes driven by stable lÈvy processes. Stoc. Proc.
Appl, 116–4 :611–642, 2006.
[IW89] N. Ikeda and . Watanabe. Stochastic Differential Equations and Diffusion processes. North Holland,
1989.
[Jac04] J. Jacod. The Euler scheme for lévy driven stochastic differential equations : limit theorems. Ann.
Probab., 5(32) :1830–1872, 2004.
[JKMP05] J. Jacod, T. G. Kurtz, S. Méléard, and P. Protter. The approximate euler method for Lévy driven
stochastic differential equations. Ann. Inst. H. PoincarÈ Probab. Statist, 41–3 :523–558, 2005.
[JMW96] A. Janicki, Z. Michna, and A. Weron. Approximation of stochastic differential equations driven by
α-stable Lévy motion. Appl. Math. (Warsaw), 24–2 :149–168, 1996.
[JO09] A. Joulin and Y. Ollivier. Curvature, concentration, and error estimates for Markov chain Monte
Carlo. http ://[Link]/abs/0904.1312, 2009.
[JP98] J. Jacod and P. Protter. Asymptotic error distributions for the euler method for stochastic differential
equations. Ann. Probab, 26–1 :267–307, 1998.
[KHP94] A. Kohatsu-Higa and P. Protter. The Euler scheme for SDEs driven by semimartingales. in Stochastic
analysis on infinite dimensional spaces, 1994. H. Kunita and [Link] (Eds.), 310 :141–151, 1994.
[KHT10] A. Kohatsu Higa and P. Tankov. Jump-adapted discretization schemes for Lévy-driven sdes. Preprint,
2010.
[KM00] V. Konakov and E. Mammen. Local limit theorems for transition densities of Markov chains conver-
ging to diffusions. Prob. Th. Rel. Fields, 117 :551–587, 2000.
[KM02] V. Konakov and E. Mammen. Edgeworth type expansions for euler schemes for stochastic differential
equations. Monte Carlo Methods Appl., 8–3 :271–285, 2002.
[KM09] V. Konakov and E. Mammen. Small time edgeworth-type expansions for weakly convergent nonho-
mogeneous markov chains. Probab. Theory Related Fields, 143–1-2 :137–176, 2009.
[KMR97] V.A. Kozlov, V.G. Maz’ya, and J. Rossmann. Elliptic boundary values problem in domains with
singularities. Math. Surveys and Monographs, 52. AMS, 1997.
[Kob00] M. Kobylanski. Backward stochastic differential equations and partial differential equations with
quadratic growth. Ann. Prob., 28 :558–602, 2000.
[Kol34] A. N. Kolmogorov. Zufällige Bewegungen (zur Theorie der Brownschen Bewegung). Ann. of Math.,
2-35 :116–117, 1934.
[Kol00] V. Kolokoltsov. Symmetric stable laws and stable-like jump diffusions. Proc. London Math. Soc.,
80 :725–768, 2000.
[KP91] T.G. Kurtz and P. Protter. Wong-Zakai corrections, random evolutions and numerical schemes for
SDEs. Academic Press, 1991.
[KP92] P. Kloeden and E. Platen. Numerical solution of stochastic differential equations. Springer-Verlag
Berlin Heidelberg New-York, 1992.
62
[KPQ97] N El Karoui, S. Peng, and M.C. Quenez. Backward stochastic differential equations in finance. Math.
Finance, 7 :1–71, 1997.
[KPZ86] M. Kardar, G. Parisi, and Y.-C. Zhang. Dynamic scaling of growing interfaces. Phys. Rev. Lett.,
56 :889–892, 1986.
[Kry96] N. V. Krylov. Controlled diffusion processes. Springer, 1996.
[KS84] S. Kusuoka and D. Stroock. Applications of the Malliavin calculus. I. Stochastic analysis (Ka-
tata/Kyoto, 1982), North-Holland Math. Library, 32 :271–306, 1984.
[KS85] S. Kusuoka and D. Stroock. Applications of the Malliavin calculus. II. J. Fac. Sci. Univ. Tokyo
Sect. IA Math, 32 :1–76, 1985.
[KS87] S. Kusuoka and D. Stroock. Applications of the Malliavin calculus. III. J. Fac. Sci. Univ. Tokyo
Sect. IA Math, 34 :391–442, 1987.
[Kun90] H. Kunita. Stochastic flows and stochastic differential equations. Cambridge University Press, 1990.
[Kus01] S. Kusuoka. Approximation of expectation of diffusion process and mathematical finance. Taniguchi
Conference on Mathematics Nara ’98. Adv. Stud. Pure Math., Math. Soc. Japan, Tokyo, 31 :147–165,
2001.
[KV06] S. A. Klokov and A. Yu Veretennikov. On mixing and convergence rates for a family of markov
processes approximating SDEs. Random Oper. Stochastic Equations, 14–2 :103–126, 2006.
[Led99] M. Ledoux. Concentration of measure and logarithmic sobolev inequalities. Séminaire de Probabilités
XXXIII. LNM, 1709, page 120–216, 1999.
[Lem07] V. Lemaire. An adaptive scheme for the approximation of dissipative systems. Stochastic Process.
Appl., 117–10 :1491–1518, 2007.
[Lie96] G.M. Lieberman. Second Order parabolic differential equations, 1st edn. World Scientfic, River Edge,
NJ, 1996.
[LP02] D. Lamberton and G. Pagès. Recursive computation of the invariant distribution of a diffusion.
Bernoulli, 8–3 :367–405, 2002.
[LP03] D. Lamberton and G. Pagès. Recursive computation of the invariant distribution of a diffusion : the
case of a weakly mean reverting drift. Stoch. Dyn., 3–4 :435–451, 2003.
[LS01] F. A. Longstaff and R. S. Schwartz. Valuing American options by simulation : a simple least-square
approach. Rev. Financ. Studies, 14 :113–147, 2001.
[LSU68] O.A. Ladyzenskaja, V.A. Solonnikov, and N.N. Ural’ceva. Linear and quasi-linear equations of
parabolic type. Vol.23 Trans. Math. Monog., AMS, Providence, 1968.
[LU68] O.A. Ladyzhenskaya and N.N. Ural’ceva. Linear and quasilinear equations of elliptic type. Academic
Press, 1968.
[LV04] T. Lyons and N. Victoir. Cubature on wiener space, Stochastic analysis with applications to mathe-
matical finance. Proc. R. Soc. Lond. Ser. A Math. Phys. Eng. Sci, 460 :169–198, 2004.
[Mal97] P. Malliavin. Stochastic analysis. Springer-Verlag, Berlin, 1997.
[Mél01] S. Méléard. Monte-Carlo approximations for 2d Navier-Stokes equations with measure initial data.
Prob. Th. Rel. Fields, 121–3 :367–388, 2001.
[Mil74] G.N. Milshtein. Approximate integration of stochastic differential equations. Theory Probab. Appl.,
19 :557–562, 1974.
[Mil76] G.N. Milshtein. A method of second order accuracy integration of sde. Theory Probab. Appl.,
23 :396–401, 1976.
[Mil85] G.N. Milshtein. Weak approximation of solutions of systems of stochastic differential equations.
Theory Probab. Appl., 30 :750–766, 1985.
63
[Mil98] G. N. Milstein. Weak approximation of a diffusion process in a bounded domain. Stoch. Stoch.
Reports, 64 :211–233, 1998.
[MPY94] J. Ma, P. Protter, and J. Yong. Solving Forward-Backward Stochastic Differential Equations expli-
citly - a four step scheme. Prob. Th. Rel. Fields, 98 :339–359, 1994.
[MS67] H. P. McKean and I. M. Singer. Curvature and the eigenvalues of the Laplacian. J. Differential
Geometry, 1 :43–69, 1967.
[MSH02] J. C. Mattingly, A. M. Stuart, and D. J. Higham. Ergodicity for sdes and approximations : locally
Lipschitz vector fields and degenerate noise. Stochastic Process. Appl., 101–2 :185–232, 2002.
[MT99] G. N. Milstein and M. V. Tretyakov. Simulation of a space-time bounded diffusion. Ann. Appl.
Prob., 9–3 :732–779, 1999.
[MT04] G.N. Milstein and M.V. Tretyakov. Stochastic numerics for mathematical physics. Springer-Verlag,
Berlin, 2004.
[MT06a] F. Malrieu and D. Talay. Concentration inequalities for euler schemes. Monte Carlo and Quasi-Monte
Carlo Methods 2004, H. Niederreiter and D. Talay (Eds.), pages 355–37, 2006.
[MT06b] G. N. Milstein and M. V. Tretyakov. Numerical algorithms for forward-backward stochastic diffe-
rential equations. SIAM J. of Sci. Comput., 28 :561–582, 2006.
[MT07] G. N. Milstein and M. V. Tretyakov. Discretization of forward-backward stochastic differential
equations and related quasi-linear parabolic equations. SIAM J. of Sci. Comput., 1 :24–44, 2007.
[MY09] R. Mansuy and M. Yor. Aspects of Brownian motion. Springer, 2009.
[NN09] M. Ninomiya and S. Ninomiya. A new higher-order weak approximation scheme for stochastic
differential equations and the runge-kutta method. Finance and Stochastics, 13–3 :415–443, 2009.
[Nor86] J. R. Norris. Simplified Malliavin Calculus. Séminaire de Probabilités, XX :101–130, 1986.
[Nua95] D. Nualart. The Malliavin calculus and related topics. Probability and its Applications. Springer-
Verlag, New York, 1995.
[Nua98] D. Nualart. Analysis on Wiener space and anticipating stochastic calculus. In Lectures on probability
theory and statistics (Saint-Flour, 1995), pages 123–227. LNM 1690. Springer, Berlin, 1998.
[NV08] S. Ninomiya and N. Victoir. Weak approximation of stochastic differential equations and application
to derivative pricing. Appl. Math. Finance, 15–1-2 :107–121, 2008.
[Pan08] F. Panloup. Computation of the invariant measure for a Lévy driven SDE : rate of convergence.
Stochastic Process. Appl., 118–8 :1351–1384, 2008.
[PP90] E. Pardoux and S.G. Peng. Adapted solution of a Backward Stochastic Differential Equation. Systems
Control Lett, 14-1 :55–61, 1990.
[PP92] E. Pardoux and S.G. Peng. Backward Stochastic Differential Equations and quasilinear parabolic
partial differential equations. Stochastic partial differential equations and their applications (Char-
lotte, NC, 1991), 176 :200–217, 1992.
[PT97] P. Protter and D. Talay. The Euler scheme for lévy driven stochastic differential equations. Ann.
Probab., 1(25) :393–423, 1997.
[RBT00] L. Rey-Bellet and L. Thomas. Asymptotic behavior of thermal nonequilibrium steady states for a
driven chain of anharmonic oscillators. Comm. Math. Phys., 215–1 :1–24, 2000.
[Riv05] O. Rivière. Equations Différentielles Stochastiques Rétrogrades couplées : EDPs et discrétisation.
Thèse de doctorat. Université Paris Descartes, 2005.
[Rub03] S. Rubenthaler. Numerical simulation of the solution of a stochastic differential equation driven by
a Lévy process. Stochastic Process. Appl., 103–2 :311–349, 2003.
64
[RY99] D. Revuz and M. Yor. Continuous martingales and Brownian motion. 3rd ed. Grundlehren der
Mathematischen Wissenschaften. 293. Berlin : Springer, 1999.
[She91] S. J. Sheu. Some estimates of the transition density of a nondegenerate diffusion Markov process.
Ann. Probab., 19–2 :538–561, 1991.
[Sie79] D. Siegmund. Corrected diffusion approximations in certain random walk problems. Adv. in Appl.
Probab., 11(4) :701–719, 1979.
[SK74] B.W. Stuck and B. Z. Kleiner. A statistical analysis of telephone noise. The Bell System Technical
Journal, 53 :1263–1320, 1974.
[Soi94] C. Soize. The Fokker-Planck equation for stochastic dynamical systems and its explicit steady state
solutions. Series on Advances in Mathematics for Applied Sciences, 17. World Scientific Publishing
Co., Inc., River Edge, NJ, 1994.
[ST94] G. Samorodnittsky and M. Taqqu. Stable non Gaussian random processes, stochastic models with
infinite variance. Chapman and Hall, New York, 1994.
[Str83] D.W. Stroock. Some applications of stochastic calculus to partial differential equations. In : Eleventh
Saint Flour probability summer school—1981 (Saint Flour, 1981), Lecture Notes in Math., 976,
Springer, Berlin, pages 267–382, 1983.
[Str88] D. W. Stroock. Diffusion semigroups corresponding to uniformly elliptic divergence form operators.
Séminaire de Probabilités, XXII :316–347, 1988.
[SV71] D.W. Stroock and S.R.S. Varadhan. Diffusion processes with boundary conditions. Comm. Pure
Appl. Math., 24 :147–225, 1971.
[SV79] D.W. Stroock and S.R.S. Varadhan. Multidimensional diffusion processes. Springer-Verlag Berlin
Heidelberg New-York, 1979.
[SY82] D. Siegmund and Y.S. Yuh. Brownian approximations for first passage probabilities. Z. Wahrsch.
verw. Gebiete, 59 :239–248, 1982.
[SZ92] J. Sokolowski and J. P. Zolésio. Introduction to shape optimization. Shape sensitivity analysis,
volume 16. Springer Series in Computational Mathematics, 1992.
[Tal86] D. Talay. Discrétisation d’une eds et calcul approché d’espérances de fonctionnelles de la solution.
Math. Model ling Numer. Anal., 20 :141–179, 1986.
[Tal02] D. Talay. Stochastic Hamiltonian dissipative systems : exponential convergence to the invariant
measure, and discretization by the implicit Euler scheme. Markov Processes and Related Fields,
8–2 :163–198, 2002.
[Tem01] E. Temam. Couverture Approchée d’Options Exotiques, Pricing des Options Asiatiques. Ph. Dis-
sertation. University of Paris VI, 2001.
[TT90] D. Talay and L. Tubaro. Expansion of the global error for numerical schemes solving stochastic
differential equations. Stoch. Anal. and App., 8-4 :94–120, 1990.
[Ver03] A. Yu. Veretennikov. On large deviations for approximations of SDEs. Probab. Theory Related
Fields, 125–1 :135–152, 2003.
[Web51] M. Weber. The fundamental solution of a degenerate partial differential equation of parabolic type.
Trans. Amer. Math. Soc., 71 :24–37, 1951.
[Whi73] N. Whitham. Linear and Non linear waves. Wiley, 1973.
[Woo82] M. Woodroofe. Nonlinear renewal theory in sequential analysis. SIAM, 1982.
[Zha88] C.H. Zhang. A nonlinear renewal theory. Ann. Prob., 16-2 :793–824, 1988.
[Zha04] J. Zhang. A numerical scheme for BSDEs. Annals of Applied Probability, 14–1 :459–488, 2004.
65