Commande Neuronale
Commande Neuronale
THÈSE
Présentée pour l’obtention du diplôme de doctorat en sciences
par :
ZERARI NASSIRA
Un grand merci au Professeur Najib Essounbouli, ainsi que tous les Docteurs
du du Centre de Recherche en Sciences et Techniques de l’Information et
de la Communication (CReSTIC), pour les conseils qu’ils m’ont donné au
cours de mon stage à l’Institut Universitaire de Technologie de Troyes (IUT),
France.
Enfin, je remercie toutes les personnes que j’ai peut-être oubliées et qui m’ont
aidé pour l’accomplissement de cette thèse.
i
D ÉDICACE
Mon père
Ma mère
Mon frère et mes soeurs
Mes amies et collègues
Mes professeurs
iii
R ÉSUMÉ
v
ملخص
انٓذف يٍ ْزِ انشسبنخ ٌزعهك ثشكم أسبسً ثزطٌٕش لٕاٍٍَ انزحكى انزكٍفً نفئخ يٍ األَظًخ
يزعذدح انًزغٍشاد .MIMOرًذ دساسخ غٍش انخطٍخ احب دٌخ انًزغٍشاد ٔ SISO
حبالد األَظًخ انزآنفٍخ ٔغٍش انزآنفٍخ ٔٔ ،خٕد لٍٕد عهى انًخبسج ٔ /أٔ انًذاخم ثبإلضبفخ
إنى االضطشاثبد انخبسخٍخ .عالٔح عهى رنك ،رى االخز ثعٍٍ االعزجبس انًذاخم غٍش انخطٍخ
فً دساسخ األَظًخ انذٌُبيٍكٍخ ٔ ،انزً رزًثم فً انزشجع ٔانًُطمخ انًٍزخ عهى انزٕانً .فً
خًٍع أسبنٍت انزحكى انًمزشحخ اسزخذيُب انشجكبد انعصجٍَٕخ كًمبسة رمذٌشي نهذٔال غٍش
انخطٍخ انًدٕٓنخ فً انُظبو انًشاد انزحكى فٍّ .ثبنًمبسَخ يع انزمٍُبد انزمهٍذٌخ انمبئًخ عهى
يشبكم اَفدبس انزعمٍذ انشٍٓشح ثبإلضبفخ إنى ْزا ،اسزعًهُب طشٌمخ نٍبثَٕٕف نذساسخ اسزمشاس
طشق انزحكى انزالإيً انًمزشحخ ٔلذيُب ثعض َزبئح انًحبكبح انعذدٌخ الثشاص كفبءح أدائٓب.
كلمات مفتاحیة:
انشجكخ انعصجٍخ ،رحكى رالإيً ،أَظًخ الخطٍخ ،رشجع ،يُطمخ يٍزخ ،دانخ ٍَسجٕو.
vii
A BSTRACT
he main objective of this thesis is the development of adaptive control laws for
T particular classes of uncertain SISO and MIMO nonlinear systems. The cases of
the affine and non-affine systems, the presence of the constraints on the outputs
and/or the states as well as the external perturbations are studied. Furthermore, the
saturation and dead-zone inputs nonlinearities of the dynamical systems are investigated.
In all the proposed approaches, the neural networks are used as universal approximators
to estimate the unknown nonlinearities of the dynamical systems. The structures of the
proposed controllers deal with the famous problems of explosion of complexity while
avoiding the use of the traditional back-stepping technique. The proposed adaptive
neural controllers have few online learning parameters compared to similar works. In
addition, stability analysis of all control loops is carried out by using the Lyapunov
method, and for each scheme, simulation results are given to show its effectiveness.
Key words : Neural networks (NNs) ; adaptive control ; nonlinear systems ; saturation ;
dead-zone ; Nussbaum function.
ix
TABLE DES M ATIÈRES
Introduction générale 1
xi
TABLE DES MATIÈRES
1.10.2 La saturation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.11 Notations et préliminaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.11.1 Fonction de Nussbaum . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.11.2 Théorème de la valeur moyenne (MVT) . . . . . . . . . . . . . . . . . 21
1.12 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
xii
TABLE DES MATIÈRES
Bibliographie 137
xiii
L ISTE DES TABLEAUX
TABLEAU Page
xv
TABLE DES FIGURES
F IGURE Page
2.1 Saturation u m tanh( uvm ) (traits discontinus) and sat(v( t)) (traits continus). . . 30
2.2 Le résultat de simulation de l’exemple 1. (a) Performance de poursuite : la
sortie y la référence yd . (b) La poursuite de l’état x2 . . . . . . . . . . . . . . . . 43
2.3 Le résultat de simulation de l’exemple 1. (a) la commande intermédiaire ω̌ ( t)
.(b) Poursuite de u( t) et sat( u( t)). . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
2.4 Les nouveaux variables d’états s le long de leurs estimés ŝ de l’exemple 1. . . 44
2.5 L’événement de déclenchement de l’exemple 1. . . . . . . . . . . . . . . . . . . . 44
2.6 Un robot manipulateur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
2.7 Le résultat de simulation de l’exemple 2. (a) Performance de poursuite : la
sortie y la référence yd . (b) La poursuite de l’état x2 . . . . . . . . . . . . . . . . 47
2.8 Le résultat de simulation de l’exemple 2. (a) la commande intermédiaire w( t)
.(d) Poursuite de u( t) et sat( u( t)). . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
2.9 Les nouveaux variables d’états s avec leurs estimés ŝ de l’exemple 2. . . . . . 48
2.10 L’événement de déclenchement de l’exemple 2. . . . . . . . . . . . . . . . . . . . 48
2.11 Les performances de poursuite : la sortie y la référence yd . . . . . . . . . . . . 61
2.12 La trajectoire de v( t) et N (v( t)). . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
2.13 Les performances de l’erreur de poursuite . . . . . . . . . . . . . . . . . . . . . . 61
2.14 (a) L’erreur de poursuite des deux commande ; (b) la commande d’entrée des
deux approches. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
2.15 Un diagramme structurale du non linéarité de l’entrée u(v). . . . . . . . . . . 62
2.16 Un diagramme structurale du non linéarité de l’entrée satall (.). . . . . . . . . 64
2.17 Les performances de poursuite : la sortie y la référence yd . . . . . . . . . . . . 68
2.18 La trajectoire de v( t) et sat all (v( t)). . . . . . . . . . . . . . . . . . . . . . . . . . . 68
2.19 Les performances de l’erreur de poursuite . . . . . . . . . . . . . . . . . . . . . . 68
xvii
T ABLE DES FIGURES
xviii
T ABLE DES FIGURES
xix
L ISTE DES ABRÉVIATIONS
xxi
I NTRODUCTION GÉNÉRALE
1
INTRODUCTION GÉNÉRALE
réels. Comme cette condition est irréelle, le recours aux versions adaptatives est pri-
mordial. Afin de réaliser ces algorithmes adaptatifs, les systèmes d’inférence flous, les
réseaux de neurones, les réseaux de neurones à base de fonction radiale (RBF) et les
ondelettes sont largement utilisés.
Les réseaux de neurones, par leurs propriété d’approximation universelle sont ex-
ploités dans la commande adaptative directe et indirecte des systèmes non linéaires en
approximant les non linéarités incertaines et la loi de commande idéale, respectivement.
Parmi les techniques connues de la commande non linéaires, l’approche adaptative
basée sur le back-stepping est une méthode systématique basée sur la théorie de la
stabilité de Lyapunov pour la conception d’un contrôleur des systèmes triangulaires.
L’idée de base de cette stratégie est de faire une conception d’une loi de commande
par étapes de façon récursive en allant de proche en proche à partir du premier état.
Parallèlement, les lois d’adaptation pour les paramètres inconnus du système et les lois
de commande peuvent être déduites d’une manière adéquate.
Le problème principal avec l’approche de back-stepping est "l’explosion de complexité"
causée par la dérivation des commandes virtuelles calculées dans les différentes étapes.
C’est-à- dire, la complexité de la conception de la commande augmente lorsque l’ordre du
système augmente. Pour pallier à ce problème, les auteurs ont proposé la technique de la
commande par commande par surface dynamique DSC (Dynamic Surface Control) basée
sur l’introduction d’un filtre du premier ordre à l’entrée de chaque étape de l’approche de
back-stepping traditionnelle.
En pratique, tous les systèmes dynamiques sont soumis à des limitations sur leurs
entrées dues à des contraintes physiques inhérentes aux actionneurs. Ceci nécessite une
prise en compte de ces limites dans l’étude des contrôleurs à synthétiser afin d’éviter
la dégradation des performances et voire même l’instabilité. Les non linéarités les plus
rencontrées sont la saturation et la zone morte. Le traitement de la saturation est assuré
soit par un contrôleur robuste soit par un correcteur anti-emballement (anti-windup) est
utilisé. Cependant, la zone morte est traitée par une loi de commande robuste.
L’objectif principal de cette thèse est le développement de lois de commande adapta-
tive pour certaines classes de systèmes non linéaires incertains. Plusieurs algorithmes
sont développés pour les systèmes non linéaires incertains mono-variables (SISO). Le
cas des systèmes affines et non affines en la commande, la présence des contraintes sur
les sorties et/ou les états ainsi que les perturbations externes sont étudiés. De plus, les
non linéarités qui agissent sur les entrées des systèmes dynamiques sont étudié, en
l’occurrence la saturation et la zone morte. Par ailleurs, la commande adaptative d’une
2
INTRODUCTION GÉNÉRALE
classe des systèmes multi-variable MIMO est étudiée en tenant en compte de toutes les
difficultés étudiées pour le cas SISO.
Dans toutes les approches proposées, les réseaux de neurones sont utilisés en tant
qu’approximaters universels pour approcher les dynamiques incertaines des systèmes.
Les algorithmes proposés évitent les fameux problèmes d’explosion de complexité tout
en évitant le recours à l’approche par back-stepping. Les lois de commandes développées
présentent peu de paramètres à ajuster en ligne en les comparants aux travaux similaires.
La stabilité des boucles de commande sont prouvées d’être stable en se servant de la
méthode de Lyapunov.
3
INTRODUCTION GÉNÉRALE
non linéaires et non affines en la commande sous la forme pure-feedback avec satura-
tion sur l’actionneur. Dans un premier schéma de commande, par l’introduction d’une
transformation d’état et d’un filtre passe bas, les difficultés de la commande commu-
nément rencontrés pour cette classe de système sont contournées en convertissant le
problème de commande de systèmes pure-feedback saturés en un problème normale de
Brunovsky. Dans cette approche, la conception de la commande est basée sur la notion
de positivité des systèmes ( SPR : Strictly Positive Real) afin d’estimer les nouveaux
états et la construction d’un terme de commande robuste pour faire face aux erreurs
d’approximations neuronales et pour compenser l’influence des saturations sur l’entrée.
Dans un deuxième schéma, en plus du premier problème, la présence des contraintes sur
la sortie est considérée simultanément avec les non linéarités sur l’entrée de commande.
Ainsi, un problème plus complexe est étudié. L’analyse de stabilité a permis de garantir
la bornitude de tous les signaux de la boucle fermée et la satisfaction des contraintes de
sortie.
Le quatrième chapitre est dédié à la commande adaptative neuronale d’une classe dite
pure-feedback de systèmes non linéaires multi-variables (MIMO) incertains en la pré-
sence des non-linéarités sur l’actionneur. Dans cette approche, de nouvelles variables
d’état et des transformations de coordonnées sont introduites pour convertir le sys-
tème original pure-feedback en une forme normale. Un observateur d’état est conçu
pour estimer les états indisponibles et l’utilisation de la fonction de Nussbaum rend la
connaissance a priori du signe du gain de commande non nècessaire. Dans la concep-
tion du contrôleur, similairement aux cas SISO, le problème des dérivées circulaire est
contourné en se passant de la technique de back-stepping. La stabilité du système en
boucle fermée est analysée au sens de de SPR -Lyapunov afin de montrer que les erreurs
de poursuite convergent vers un petit voisinage de l’origine. De plus, la performance de
poursuite du schéma de commande est illustrée par un exemple de simulation.
Les lois d’adaptation des paramètres des réseaux de neurones de tous les schèmas de
commande proposés dans cette thèse utilisent la loi dite σ-modification pour garantir la
bornitude des paramètres.
4
CHAPITRE
1
A SPECTS THÉORIQUES DE LA COMMANDE NON
LINÉAIRE
Sommaire
1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.2 Les réseaux de neurones (neural networks NNs) . . . . . . . . . . . . . . 7
1.2.1 Les réseaux de neurones utilisé dans cette thèse . . . . . . . . . 7
1.3 La commande adaptative . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.3.1 Principe de base . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.4 La commande adaptative neuronale . . . . . . . . . . . . . . . . . . . . . . 9
1.5 Stabilité des systèmes dynamiques . . . . . . . . . . . . . . . . . . . . . . 9
1.5.1 Méthode de Lyapunov . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.5.2 La seconde méthode de Lyapunov . . . . . . . . . . . . . . . . . . 10
1.6 La commande back-stepping . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.7 Commande back-stepping adaptative . . . . . . . . . . . . . . . . . . . . . 11
1.7.1 L’algorithme de base . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.8 La commande par surface dynamique (DSC : dynamic surface control) 15
1.9 La commande adaptative DSC . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.9.1 Algorithme de base . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.10 Non-linéarité d’actionneur . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.10.1 La zone-morte (Dead-Zone) . . . . . . . . . . . . . . . . . . . . . . 18
1.10.2 La saturation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
5
CHAPITRE 1. ASPECTS THÉORIQUES DE LA COMMANDE NON LINÉAIRE
6
1.1. INTRODUCTION
1.1 Introduction
a plupart des systèmes industriels sont complexes, difficilement modélisables et
7
CHAPITRE 1. ASPECTS THÉORIQUES DE LA COMMANDE NON LINÉAIRE
(1.3) f ( Z ) = W T S ( Z ) + ε( Z )
(1.4) |ε( Z )| ≤ ε̄
D’après les résultats de l’approximation universelle de NNs étudié dans [3], il est
montré que la constante ε̄ est rendue arbitrairement petite en augmentant le nombre de
nœuds N du NNs.
Dans ce travail on suppose que la structure du réseau de neurones et leurs paramètres
sont correctement spécifiés par l’utilisateur à priori. Cela veut dire que la décision de
l’utilisateur est nécessaire pour régler la structure du NNs et les paramètres de NNs
seront ajustés en ligne par des algorithmes d’adaptation.
8
1.4. LA COMMANDE ADAPTATIVE NEURONALE
9
CHAPITRE 1. ASPECTS THÉORIQUES DE LA COMMANDE NON LINÉAIRE
Cette méthode est basée sur le concept d’énergie dans un système. Pour un système
physique, l’énergie est une fonction définie positive de son état. Dans un système conser-
vatif, l’énergie reste constante ; pour un système dissipatif, elle décroît. Pour ces deux cas,
le système est stable. Si l’énergie croît, le système est instable. L’idée de cette méthode
est d’analyser la stabilité du système, sans avoir à résoudre explicitement les équations
différentielles non linéaires le régissant. Il suffit simplement d’étudier les variations
(signe de la dérivée) de l’énergie (ou une fonction qui lui est équivalente) le long de la
trajectoire du système.
Contrairement à la première méthode, la seconde méthode donne plus d’informations au
niveau de la stabilité. Elle a l’avantage de ne pas se limiter à la prédiction des points
d’équilibre, mais bien d’une région d’attraction autour de ces points d’équilibre. Pour
l’étude de la stabilité d’un système caractérisé par un vecteur d’état x, la méthode directe
et indirect de Lyapunov consiste alors, à chercher une fonction V ( x) (représentative de
l’énergie) de signe défini qui se prête à l’application des théorèmes suivants :
10
1.6. LA COMMANDE BACK-STEPPING
£ ∂V ¤ h iT
où ∂x ( x, t) = ∂∂xV1 ( x, t) , . . . , ∂∂xVn ( x, t) est le gradient de V ( x, t)/ x
Si V̇ ( x, t) < 0 , alors le système est asymptotiquement stable.
Dans ce qui suit, nous allons rappeler l’algorithme de base de la commande back-
stepping adaptative [13, 14].
11
CHAPITRE 1. ASPECTS THÉORIQUES DE LA COMMANDE NON LINÉAIRE
ẋ1 = x2 + ϕ1T ( x1 )θ
ẋ i = x i+1 + ϕTi ( x1 , . . . , ( xn−1 ))θ , i = 2, . . . , n − 1
ẋn = bu + ϕT
n ( x)θ
(1.6) y = x1
(1.7) z1 = x1 − xd
(1.8) z i = x i − α i−1 − xdi−1 , i = 2, 3, . . . , n
12
1.7. COMMANDE BACK-STEPPING ADAPTATIVE
où c 1 est une constante positive. La tâche dans cette étape est de réaliser la poursuite
x1 → xd en considérant la fonction de Lyapunov
1 2
(1.11) V1 = z + θ̃ T Γ−1 θ̃
2 1
où Γ est une matrice définie positive et θ̃ = θ − θ̂ . Puis le dérivé de V1 est
(1.13) τ1 = ϕ1 z1
13
CHAPITRE 1. ASPECTS THÉORIQUES DE LA COMMANDE NON LINÉAIRE
à !
iX
−1 ∂α i−1 iX
−1 ∂α i−1 ∂α i−1
T
α i = − z i−1 − c i z i − x j+1 + θ̂ ϕi − ϕj + Γτ i
j =1 ∂x j j =1 ∂x j ∂θ̂
à ! à !
iX
−1 ∂α i−1 iX
−1 ∂α i−1 iX
−1 ∂α i−1 ( j)
(1.20) + zj Γ ϕi − ϕj + x
j =1 ∂θ̂ j =1 ∂x j ( j −1) d
j =1 ∂ x d
à !
iX
−1 ∂α i−1
(1.21) τ i = τ i−1 + ϕ i − ϕ j zi
j =1 ∂x j
1
(1.22) Vi = Vi−1 + z2i
2
à !
iX
−1 iX
−1 ∂α i−1 ³
Γτ i − θ̂˙ + θ̃ T τ i − Γ−1 θ̂˙
´ ³ ´
(1.23) V̇i = c j z2j + z i z i+1 +
j =1 j =1 ∂θ̂
Dans la dernière étape on peut concevoir la commande réelle u et les lois d’adaptations θ̂˙
et p̂˙ comme suit
14
1.8. LA COMMANDE PAR SURFACE DYNAMIQUE (DSC : DYNAMIC SURFACE
CONTROL)
(1.25) u = p̂ ū
(1.26) ū = αn + x(n)
d
(1.27) ˙
θ̂ = Γτn
(1.28) p̂˙ = −γ si gn( b) ūz n
(1.29) u = b p̂ ū = ū − b p̃ ū
à partir de laquelle on peut déduire la stabilité asymptotique des erreurs. Selon les
équations ci-dessus définissant le contrôleur et les lois d’adaptations, on peut voir
clairement l’explosion de complexité impliquée par l’utilisation de plusieurs entrées de
commande virtuelles avec leurs dérivées compliquées, ainsi que de nombreux paramètres
de conception. Il est important de noté que le calcul précis des commandes virtuelles α̇ i
n’est pas simple, en particulier pour les systèmes d’ordre élevé en raison des dérivées
partielles successives des paramètres d’adaptations.
15
CHAPITRE 1. ASPECTS THÉORIQUES DE LA COMMANDE NON LINÉAIRE
(1.32) y = x1
où, x = [ x1 , ..., x i ]T ∈ ℜn , est le vecteur des variables d’état du système, u ∈ ℜ est l’entrée
de commande du système. θ i ∈ ℜn est le vecteur des paramètres constants inconnus
x̄ i = [ x1 , ..., x i ]T , ϕ i ( x̄ i ) : ℜ i → ℜ p sont des fonctions non linéaires connues. La procédure
de conception se déroulera en plusieurs étapes.
Étape 1 :Nous définissons la première surface :
(1.33) S 1 = x1 + x1d
16
1.9. LA COMMANDE ADAPTATIVE DSC
Nous filtrons x̄2 par un filtre du premier ordre, avec une constante de temps τ2 pour
obtenir x1d :
(1.38) S i = x i + x id
Ṡ i = ẋ i + ẋ id
(1.39) = x i+1 − ϕTi θ̂ i + ẋ id
Nous filtrons x̄ i+1 par un filtre du premier ordre, avec une constante de temps τ i+1 pour
obtenir x i+1d :
(1.43) S n = xn + xnd
Ṡ n = ẋn + ẋnd
(1.44) = u − ϕT
n θ̂ n + ẋ nd
17
CHAPITRE 1. ASPECTS THÉORIQUES DE LA COMMANDE NON LINÉAIRE
Nous choisissons la loi de commande u pour que S n tend vers zéro avec :
(1.45) u = −ϕ T
n θ̂ n + ẋ nd − K n S n
Les lois d’adaptation des paramètres estimés sont données comme suit :
(1.48) θ̂˙
n = Γ S ϕ T ( x)
n n n
où Γ i > 0( i = 1, . . . , n) sont les paramètres de conception. Ce qui est beaucoup plus simple
que les méthodes précédents.
où b r > 0, b l < 0, m r > 0, m l > 0 sont respectivement les paramètres et les pentes de la
zone morte.
18
1.10. NON-LINÉARITÉ D’ACTIONNEUR
1.10.2 La saturation
vmax si v( t) > vmax
(1.50) u(v) = sat(v ( t)) = v si vmin ≤ v( t) ≤ vmax
vmin si v( t) < vmin
avec vmax et vmin sont des valeurs connues de la saturation de l’entrée v. La fonction de
saturation est notée sat( u ( t)) et peut être représentée par la figure (1.2).
Les effets indésirables que peut causer la saturation sur les systèmes de commande
sont la dégradation des performances de commande comme les grands dépassements
et les cycles limite. Dans le pire des cas, elle peut causer une instabilité du schéma de
commande.
19
CHAPITRE 1. ASPECTS THÉORIQUES DE LA COMMANDE NON LINÉAIRE
Z s
(1.52) 2) lim in f (1/ s) N (ζ) d ζ = −∞
s→−∞ 0
Nussbaum.
Dans cette thèse la fonction utilisée est N (ζ) = ζ2 cos(ζ).
Lemme 1.1. ([22, 23]) soient V ( t) et ζ( t) deux fonction continue définies sur [0, t f , avec
¢
V ( t) > 0, ∀ t ∈ [0, t f et N (ζ) est une fonction continue de type Nussbaum. Si l’inégalité
¢
¢
suivante est vérifiée pour ∀ t ∈ [0, t f ,
Z t
(1.53) V ( t) ≤ c 0 + e c1 t
( g (τ) N (ζ (τ)) + 1)ζ̇ (τ) e c1 τ d τ
0
20
1.12. CONCLUSION
f ( x, u) − f x, u0 = f uθ u − u0
¡ ¢ ¡ ¢
(1.54)
∂ f (x,u) ¯
¯
où f uθ = ∂ u ¯ u= uθ
avec uθ = u.θ + (1 − θ ) u0 .
En utilisant la technique de linéarisation, l’expression (1.54) peut être réécrite comme
suit :
4 ( x, u) − 4 x, u0 = ( f uθ − c) u − u0
¡ ¢ ¡ ¢
(1.55)
1.12 Conclusion
Dans ce chapitre, nous avons présenté les concepts de la commande adaptative
neuronale pour des systèmes non linéaires, et nous avons aussi montré que les systèmes
neuronaux, en général, ont la propriété d’approximation universelle. En fait, ils peuvent
estimer n’importe quelle fonction non linéaire continue définie sur un ensemble compact.
Ensuit, nous avons attaché une importance à la commande back-stepping et la commande
DSC associéesà la commande adaptative. Un rappel sur les deux types de back-stepping
adaptative et non adaptative ainsi que un rappel sur DSC ont été établi afin de mettre
en relief ces techniques.
Par ailleurs, un ensemble de définitions relatives à l’analyse de la stabilité, également
des lemmes et des théorèmes ainsi que les non-linéarités de l’actionneur, qui sont très
utiles pour la conception de la commande ont été rappelés.
21
CHAPITRE
2
C OMMANDE ADAPTATIVE NEURONALE DES SYSTÈMES
NL SISO DE LA FORME STRICT- FEEDBACK
Sommaire
2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.2 Système NL strict-feedback avec une saturation de l’entrée et perturba-
tion externe et avec gain de commande inconnu . . . . . . . . . . . . . . 28
2.2.1 Position du problème . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.2.2 La transformation du système et dynamique des erreurs . . . . 31
2.2.3 Conception de l’observateur . . . . . . . . . . . . . . . . . . . . . . 34
2.2.4 Conception d’un mécanisme de déclenchement par événement . 35
2.2.5 Analyse de la stabilité . . . . . . . . . . . . . . . . . . . . . . . . . 37
2.2.6 Résultats de simulation . . . . . . . . . . . . . . . . . . . . . . . . 40
2.3 Système NL strict-feedback avec des non linéarités de l’entrée et contrainte
sur la sortie et avec le gain de commande constant . . . . . . . . . . . . . 49
2.3.1 Position du problème . . . . . . . . . . . . . . . . . . . . . . . . . . 49
2.3.2 La fonction de performance prescrite . . . . . . . . . . . . . . . . 49
2.3.3 Conception de la commande avec une zone morte sur l’entrée . 53
2.3.4 Analyse de la stabilité . . . . . . . . . . . . . . . . . . . . . . . . . 55
2.3.5 Résultats de simulation . . . . . . . . . . . . . . . . . . . . . . . . 58
2.3.6 Conception de la commande avec un équivalent de la saturation
de l’entrée . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
23
CHAPITRE 2. COMMANDE ADAPTATIVE NEURONALE DES SYSTÈMES NL SISO
DE LA FORME STRICT-FEEDBACK
24
2.1. INTRODUCTION
2.1 Introduction
D strict-feedback sera étudiée tout en considérant que les entrées sont assujetties
à des contraintes de type saturation et zone morte, ainsi que la présence de
perturbation externes. Il est bien connu que lorsque la commande est conçue sans tenir
compte de la non linéaritée qui affecte l’actionneur, la performance du système, en boucle
fermée, peut être sérieusement détériorée voire même provoquer son instabilité.
En effet, pour traiter le cas de la saturation, il existe une approche pratique est
systématique pour compenser cette dégradation de performance, qui consiste à augmen-
ter le système original par un sous-système spécifique, anti-wind-up [25–28]. Plusieurs
autres schémas de commande adaptative ont été étudiés dans [29–35] pour gérer la
contrainte de saturation en utilisant une fonction continue bornée inconnue de type
tangente hyperbolique afin d’approximer la fonction de saturation. Dans [28], un schéma
de commande à retour de sortie basé sur la combinaison de la technique back-stepping
et la logique floue a été présenté. Basé sur la combinaison de la perturbation externe et
de l’erreur d’approximation de la fonction de saturation, un contrôleur adaptatif robuste
a été développé dans [29].
Par ailleurs, la zone morte est l’une des non-linéarités les plus courantes dans
les actionneurs industriels et sa présence peut causer l’instabilité et détériorer les
performances des systèmes de commande.
Pour traiter le cas des contraintes de type zone-morte (dead-zone), qui peut limiter
sévérement les performances du système, la compensation via l’emploie de leurs inverses
s’avère la manière la plus naturelle[36]. Cependant, ceci ne peut être envisageable que si
les non-linéarités de la zone-morte sont exactement connues. La construction adaptative
de l’inverse de la zone-morte a été initialement étudiée dans [37, 38]. Une commande
adaptative floue par retour de sortie qui traite les entrées de la zone morte comme des
incertitudes du système, a été développé dans [39] . Dans [40], un contrôleur adaptatif
neuronal est conçu sur la base de n paramètres de NNs à mettre à jour en ligne, pour la
dynamique du CSTR. Dans [40, 41] les systèmes non linéaires non affines sous la forme
pure-feedback avec la contrainte de la zone morte non symétrique sont transformés en
un prédicteur à n-pas successifs, et des termes de commande adaptatifs compensateurs
sont utilisés pour compenser les paramètres de la zone morte. Ces résultats de recherche
sont récemment été combinés avec la technique d’approximation universelle utilisant
des réseaux de neurones (NNs) ou systèmes flous dans [2] et [42], respectivement.
25
CHAPITRE 2. COMMANDE ADAPTATIVE NEURONALE DES SYSTÈMES NL SISO
DE LA FORME STRICT-FEEDBACK
Il est important de mentionné que l’ingénierie pratique nécessite souvent que tout
algorithme de commande proposé satisfasse certaines qualités ou indices de performance,
tels que le dépassement, le taux de convergence et l’erreur en régime permanent. De
nombreux travaux existants ont été développés pour résoudre ce problème en utilisant
la fonction Barrière de Lyapunov (BLF), et ont démontré de garantir la satisfaction des
contraintes. Initialement, la BLF était proposée pour gérer les contraintes sur les états
des systèmes de type normal, dites de Brunovsky [52]. Dans [53, 54], BLF est montrée
pour être prometteuse pour gérer les contraintes de sortie symétriques et asymétriques
pour certaines classes de systèmes non linéaires, même avec des paramètres incertains.
Il existe une autre solution de conception basée sur la transformation de l’erreur de
poursuite. Originalement, cette méthode a été présentée dans le contexte de la commande
adaptative avec prescription de performances (prescribed performance control (PPC)[55,
56] [35,36]. En effet, dans [57], la transformation utilisée est basée sur la fonction
logarithme, cependant, dans [25, 58], c’est la fonction tangente hyperbolique qui est
utilisée.
26
2.1. INTRODUCTION
control). Dans ce cas, la commande ne sera déclenchée que par un événement lorsque
certaines conditions, basées sur un état ou sur une sortie, sont réalisées et le signal de
commande sera maintenu constant jusqu’au prochain déclenchement de l’événement.
Des efforts importants ont été consacrés pour le développement des techniques d’ac-
tionnement déclenchées par événement. Des résultats ont été obtenus pour le contrôle
déclenché par événement pour les systèmes linéaires et non linéaires [59–66]. Dans
[62], cette stratégie est proposée pour les systèmes non linéaires, basé sur la stabilité
entrée/état (ISS input to state stability). Dans[63, 64], les auteurs ont étudié le schéma
de commande adaptatif avec retour de sortie et retour d’état, respectivement pour les
systèmes strict-feedback. Cependant, les résultats de la commande déclenché par un
événement, pour des systèmes non linéaires incertains, sont encore très limités, en
particulier lorsque ces systèmes sont soumis à une non-linéarité en entrée et à des
perturbations externes, ce qui motive notre travail exposé dans ce chapitre.
27
CHAPITRE 2. COMMANDE ADAPTATIVE NEURONALE DES SYSTÈMES NL SISO
DE LA FORME STRICT-FEEDBACK
ẋ i = f i ( x̄ i ) + g i ( x̄ i ) x i+1 , i = 1, . . . , n − 1
ẋn = f n ( x̄n ) + g n ( x̄n ) u(v) + d̄ ( x̄n , t)
(2.1) y = x1
28
2.2. SYSTÈME NL STRICT-FEEDBACK AVEC UNE SATURATION DE L’ENTRÉE ET
PERTURBATION EXTERNE ET AVEC GAIN DE COMMANDE INCONNU
(
sign(v( t)) u m |v( t)| > u m
(2.2) u(v) = sat(v) =
v( t) |v( t)| ≤ u m
Selon [29], la saturation peut être approximé par la fonction lisse suivante :
v
g(v) = u m tanh( )
um
exp( uvm ) − exp −( uvm )
(2.4) = um
exp( uvm ) + exp −( uvm )
Nous pouvons voir qu’il existe une erreur d (v) entre u(v( t)) et g (v). Alors, d (v) peut être
écrit comme as
Par ce que tanh(.) est une fonction bornée, on a | d (v)| = |sat (v ( t)) − g (v)| ≤ u m (1 − tanh (.) )
est bornée comme prouve dans [29].
29
CHAPITRE 2. COMMANDE ADAPTATIVE NEURONALE DES SYSTÈMES NL SISO
DE LA FORME STRICT-FEEDBACK
F IGURE 2.1: Saturation u m tanh( uvm ) (traits discontinus) and sat(v( t)) (traits continus).
(i) Le système en boucle fermée doit d’être stable et robuste dans le sens ou toutes les
variables estimées soient uniformément bornées.
ẋ i = F i ( x̄ i , x i+1 ) + x i+1 , i = 1, . . . , n − 1
ẋn = F n ( x̄n , u(v)) + u(v) + d̄ ( x̄n , t)
(2.6) y = x1
Hypothèse 2.1. Le gain de commande g i ( x̄ i , x i+1 ) est différent de zéro et de signe connu.
30
2.2. SYSTÈME NL STRICT-FEEDBACK AVEC UNE SATURATION DE L’ENTRÉE ET
PERTURBATION EXTERNE ET AVEC GAIN DE COMMANDE INCONNU
Hypothèse 2.2. La trajectoire désirée yd et ses dérivées jusqu’à l’ordre n sont connues,
continues et bornées et le vecteur Yd = [ yd , . . . , yd(n) ] où Yd ∈ Ωd ⊂ R n avec Ωd étant un
ensemble compact.
ς
µ ¶
(2.7) 0 ≤ | q| − qtanh ≤ κς
q
avec κ = 0.2785
Lemme 2.2. (Young’s inequality [67]) For ∀ ( x, y) ∈ R 2 , l’inégalité suivante est valable :
εp 1
(2.8) xy ≤ | x| p + | y| q ,
p pε q
ẋ i = F i ( x̄ i , x i+1 ) + x i+1 , i = 1, . . . , n − 1
(2.9) ẋn = F n ( x̄n , u(v)) + g (v) + d ( x̄n , t) , n ≥ 2
(2.10) v̇ = − cv + ω
31
CHAPITRE 2. COMMANDE ADAPTATIVE NEURONALE DES SYSTÈMES NL SISO
DE LA FORME STRICT-FEEDBACK
s i = x1(i−1) , i = 1, 2, . . . , n + 1.
ṡ 2 = ϕ̇2 ( x̄2 )
∂ϕ2 ( x̄2 ) ∂ϕ2 ( x̄2 )
= ẋ1 + ẋ2
∂ x1 ∂ x2
(2.11) , ϕ3 ( x̄3 )
ṡ i = ϕ̇ i ( x̄ i )
i ∂ϕ x̄
X i ( i)
= ẋ j
j =1 ∂ x j
Étape n+1 : Soit finalement s n+1 = ṡ n , ϕn+1 ( x̄n , u(v)), et en prenant sa dérivée par
rapport au temps, on aura :
32
2.2. SYSTÈME NL STRICT-FEEDBACK AVEC UNE SATURATION DE L’ENTRÉE ET
PERTURBATION EXTERNE ET AVEC GAIN DE COMMANDE INCONNU
où
nX
−1 ∂ϕ ∂ϕn+1 ( x̄n , u(v))
n+1 ( x̄ n , u(v))
F ( x̄n , u(v)) = ẋ j − c v
j =1 ∂x j ∂v
∂ϕn+1 ( x̄n , u (v))
(2.15) + (F n ( x̄n , u(v)) + g(v))
∂ xn
∂ϕn+1 ( x̄n , u(v))
(2.16) g ( x̄n , u(v)) =
∂v
∂ϕn+1 ( x̄n , u (v))
(2.17) ψ ( x̄n , t) = d ( x̄n , t)
∂ xn
En conséquence, le système (2.14) peut être décrit sous la forme normale avec le respect
les nouveaux états :
ṡ i = s i+1 , 1 ≤ i ≤ n
ṡ n+1 = F ( x̄n , u(v)) + g( x̄n , u(v))ω + ψ ( x̄n , t)
(2.18) y = x1
(2.19) e 1 = y − yd = s 1 − yd
h iT
où e = [ e 1 , e 2 , . . . , e n+1 ]T = e 1 , ė 1 , . . . , e(n)
1 . La dynamique des erreurs de poursuite sera
alors donnée par :
avec
0 1 0 0 0 0
···
0 0 1 0
0
0
.. .. .. ∈ ℜn×n , B = ... ∈ ℜn×1 , c = ... ∈ ℜn×1
A=
. . .
0 0 0 1
0 0
···
0 0 0 0 1 1
33
CHAPITRE 2. COMMANDE ADAPTATIVE NEURONALE DES SYSTÈMES NL SISO
DE LA FORME STRICT-FEEDBACK
ê˙ = ( A − Bk T ) ê − B yd(n+1) + L ẽ 1
(2.22) ê 1 = C T ê
de gain d’observateur, et ils seront choisis de sorte que les polynômes caractéristiques de
A − Bk T et A − LC T sont Hurwitz (c.-à-d., stable).
Notons par P1 la solution symétrique et définie positive de l’équation matricielle de
Lyapunov suivante
³ ´T ³ ´
(2.23) A − Bk T P1 + P1 A − Bk T = −Q 1
où A − Bk T et Q 1 est une matrice symétrique et définie positive dont le choix est libre.
¡ ¢
Les fonctions F ( x̄n , u (v)) et g ( x̄n , u (v)) peut être approximées selon le théorème des
approximateurs universels [2], comme suit
34
2.2. SYSTÈME NL STRICT-FEEDBACK AVEC UNE SATURATION DE L’ENTRÉE ET
PERTURBATION EXTERNE ET AVEC GAIN DE COMMANDE INCONNU
(2.28) ω ( t) = ω̌ ( t k ) ∀ t ∈ [ t k , t k+1 )
Par conséquent, il existe un paramètre continu variant dans le temps µ ( t), satisfaisant
µ ( t k ) = 0, µ ( t k+1 ) = ±1, et ¯µ ( t)¯ ≤ 1, ∀ t ∈ [ t k , t k+1 ) , sachant que
¯ ¯
(2.31) ω̌ ( t) = ω ( t) + µ ( t) m.
(2.33) ω̌ ( t) = vω̌ ( t) + v c ( t)
où
v c ( t) = − m̄ sign ( ẽ 1 )
tanh ²1 Ŵ2T S ( Z )
¡ ¢
³ ´
T T (n+1)
vω̌ ( t) = −Ŵ1 S ( Z ) + k ê + yd
+ ϑ r − ϑ m
Ŵ2T S ( Z ) tanh ²1 Ŵ2T S ( Z ) + ²2
¡ ¢
35
CHAPITRE 2. COMMANDE ADAPTATIVE NEURONALE DES SYSTÈMES NL SISO
DE LA FORME STRICT-FEEDBACK
avec m̄ est le gain de la commande satisfaisant m̄ > m, ²1 et ²2 sont des constantes stric-
tement positives de la conception, tanh(.) dénote la fonction de la tangente hyperbolique.
ϑr et ϑm sont un terme de la commande adaptative et une commande adaptative robuste,
respectivement, qui seront définis plus tard. En substituant de (2.33) dans (2.32), on
trouve
³ ´
ẽ˙ = A − LC T ẽ + B[W̃1T S ( Z ) + W̃2T S ( Z ) ω̌ ( t) − µ ( t) m
¡ ¢
− Ŵ2T S ( Z ) v c ( t) − µ ( t) m − ε2 ( Z ) ω̌ ( t) − µ ( t) m
¡ ¢ ¡ ¢
où
²2 ³
T (n+1)
´
ωe = −Ŵ1 S ( Z ) + k ê + yd
+ ϑ r − ϑ m
Ŵ2T S ( Z ) tanh ²1 Ŵ2T S ( Z ) + ²2
¡ ¢
− Ŵ2T S ( Z ) v c ( t) − µ ( t) m + U1 ]
¡ ¢
(2.35) ẽ 1 = C T ẽ
Etant donné que seule l’erreur d’observation de la sortie ẽ 1 dans (2.35) est mesurable, on
utilise la positivitée des systèmes (SPR) pour analyser la stabilité de la boucle fermée, et
pour générer les lois d’adaptation pour estimer les vecteurs des paramètres du NNs et
les constantes inconnues.
En raison de la forme canonique des matrices A, B, et C , de telle sorte que la dynamique
de l’erreur d’observation (2.35) puisse être exprimée dans le domaine fréquentiel en
utilisant la notation mixte temps-fréquence :
h i
T T T
(2.36) ẽ 1 = H ( p) W̃1 S ( Z ) + W̃2 S ( Z ) ω̌ ( t) − µ ( t) m − Ŵ2 S ( Z ) v c ( t) − µ ( t) m + U1
¡ ¢ ¡ ¢
associée à la dynamique (2.31). Notons que cette notation est très fréquente dans la
littérature de la commande adaptative, comme dans [68–71].
Maintenant, puisque H ( p) dans (2.36) n’est pas SPR en générale, on introduit un filtre
passe bas L ( p) sachant que H ( p) L−1 ( p) = H ( p) est SPR.
n o n ¢o
e˜1 = H ( p) L−1 ( p) [L ( p) W̃1T S ( Z ) + L ( p) W̃2T S ( Z ) ω̌ ( t) − µ ( t) m
¡
− L ( p) {Ŵ2T S ( Z ) v c ( t) − µ ( t) m } + L ( p) {U1 }]
¡ ¢
h i
= H ( p) L−1 ( p) W̃1T S ( Z ) + W̃2T S ( Z ) ω̌ ( t) − µ ( t) m + U − ϑr − ϑm
¡ ¢
(2.37)
36
2.2. SYSTÈME NL STRICT-FEEDBACK AVEC UNE SATURATION DE L’ENTRÉE ET
PERTURBATION EXTERNE ET AVEC GAIN DE COMMANDE INCONNU
où
n o n ¢o
U = L ( p) W̃1T S ( Z ) + L ( p) W̃2T S ( Z ) ω̌ ( t) − µ ( t) m + L ( p) {U1 } − W̃1T S ( Z )
¡
Hypothèse 2.3. Chaque élément U du paramètre inconnu défini dans (2.38) est délimité
par une constante, c’est-à-dire qu’il existe une constante positive inconnue τ̄ telle que
(2.39) |U | ≤ τ̄
+ U − ϑr − ϑm ]
(2.40) ẽ 1 = C T ẽ
toutes ses valeurs propres à parties réelles négatives. Par conséquent le système bouclé
sera exponentiellement stable. On lui associe une équation de Lyapunov, ayant pour
solution unique une matrice symétrique définie positive P2 , donnée par
³ ´T ³ ´
(2.41) A − LC T P2 + P2 A − LC T = −Q 2
(2.42) P2 B c = C
où A − LC T et Q 2 est une matrice symétrique et définie positive dont le choix est libre.
¡ ¢
37
CHAPITRE 2. COMMANDE ADAPTATIVE NEURONALE DES SYSTÈMES NL SISO
DE LA FORME STRICT-FEEDBACK
Théorème 2.1. Considérons le système non linéaire non affine (2.1) avec les contraints
sur l’entrée, et supposons que les hypothèses 2.1-2.3 sont satisfaites et l’observateur (2.22).
Ainsi que la loi de commande (2.33) avec deux termes de de commandes additifs suivant :
ẽ 1
µ ¶
(2.43) ϑr = τ̂tanh
²
(2.44) ϑm = LP1 ê
(2.46) ˙
Ŵ Γ2 ( ẽ 1 S ( Z ) vω̌ ( t) − σ21 Ŵ2 )
2 =
ẽ 1
µ ¶
(2.47) τ̂˙ = γ[ ẽ 1 tanh − σ12 τ̂]
²
où Ŵ1 , Ŵ2 et τ̂ sont les valeurs estimées du paramètre inconnu W1 , W2 et τ̄, respectivement,
and Γ1 , Γ2 , γ, σ11 , σ21 , σ12 sont des paramètres de conception positifs. Ensuite, on peut
garantir que tous les signaux du système en boucle fermée sont bornés et que les erreurs
de poursuite convergent vers un petit voisinage d’origine. En plus, il existe un temps t∗ > 0
, tels que les intervalles d’inter-exécution { t k , t k+1 } sont bornés par t∗ , ∀ k ∈ N .
Par substitution de(2.42), (2.43)et (2.44)dans (2.49), on trouve après un calcul intermé-
diaire
ẽ 1 1 ˙
½ µ
¶ ¾
T T
V̇ = − ê Q 1 ê − ẽ Q 2 ẽ + ẽ 1U − ẽ 1 τ̂tanh − τ̃τ̂
² γ
˙ + W̃ T ẽ S ( Z ) v ( t) − Γ −1 Ŵ˙
n o n o
(2.50) + W̃1T ẽ 1 S ( Z ) − Γ1 −1 Ŵ 2 2 1 ω̌ 2 2
38
2.2. SYSTÈME NL STRICT-FEEDBACK AVEC UNE SATURATION DE L’ENTRÉE ET
PERTURBATION EXTERNE ET AVEC GAIN DE COMMANDE INCONNU
ẽ 1 1 ˙
½ µ ¶ ¾
T T
V̇ ≤ − ê Q 1 ê − ẽ Q 2 ẽ + κτ̄ − | ẽ 1 | τ̃tanh − τ̃τ̂
² γ
˙
n o
+ W̃1T ẽ 1 S ( Z ) − Γ1 −1 Ŵ 2
˙
n o
(2.51) + W̃2T ẽ 1 S ( Z ) vω̌ ( t) − Γ2 −1 Ŵ 2
(2.52) V̇ ≤ − ê T Q 1 ê − ẽ T Q 2 ẽ + σ11 W̃1T Ŵ1 + σ21 W̃2T Ŵ2 +σ21 τ̃τ̂ + κτ̄
λmin (Q) σ1 σ2
, σ3 σ1
k k2 + σ22 kW2 k2 + σ23 τ̄2 + kτ̄
n o
où θ = min , ,
λmax (P) λmax (Γ1 −1 ) λmax (Γ2 −1 ) γ
et β = 2 W1 avec
λmin (.) et λmax (.) désigne la valeur propre minimale et maximales de (.), respectivement.
Ainsi, à travers l’analyse standard dans [10], tous les signaux en boucle fermée sont
W̃2 , τ̃ sont bornées vers des ensemble compact Ωτ̃ , ΩW̃1 , ΩW̃2 définissent comme suit
½ ¾
¯¯ ¯ q
ΩW̃1 = W̃1 ∈ R W̃1 ≤ Ω/λmin Γ1
¡ −1 ¢
¯ ¯ ¯
39
CHAPITRE 2. COMMANDE ADAPTATIVE NEURONALE DES SYSTÈMES NL SISO
DE LA FORME STRICT-FEEDBACK
½ ¾
¯¯ ¯ q
ΩW̃2 = W̃2 ∈ R W̃2 ≤ Ω/λmin Γ2
¡ −1 ¢
¯ ¯ ¯
n o
Ωτ̃ = τ̃ ∈ R ||τ̃| ≤ γΩ
p
( )
λmin (Q ) σ11 σ12 σ21
θ = min , ¢, ,
λmax (P ) λmax Γ1 −1 λmax (Γ2 −1 ) γ
¡
En combinant l’équation (2.58) et (2.59) donne t k+1 − t k ≥ m, ce qui complète les preuves
[29].
40
2.2. SYSTÈME NL STRICT-FEEDBACK AVEC UNE SATURATION DE L’ENTRÉE ET
PERTURBATION EXTERNE ET AVEC GAIN DE COMMANDE INCONNU
[Link] Exemple 1
ẋ1 = f 1 ( x1 ) + g 1 ( x1 ),
ẋ2 = f 2 ( x2 ) + g 2 ( x2 ) u(v) + d̄ ( t)
(2.60) y = x1
10.2996 0.2996 −9.7266 46.7234 69.4082 0.0032
P1 =
0.2996 , P2 = 69.4082
10.3257 −9.7004 143.2450 0.0234
−9.7266 −9.7004 18.6067 0.0032 0.0234 0.0443
Le système (2.1) possède deux réseaux de neurones sous la forme (1.1) pour approximer
en ligne les fonctions inconnus, le nombre des réseaux a été choisi avec N = 4, et
les variables d’entrée sont choisis comme Z = [ x1 , x2 , v ( t) , u(v) ]T . Les paramètres de
synthèses et les conditions initiales utilisés dans cette simulation sont donnés dans le
tableau (2.1).
41
CHAPITRE 2. COMMANDE ADAPTATIVE NEURONALE DES SYSTÈMES NL SISO
DE LA FORME STRICT-FEEDBACK
Γ1 , Γ2 1000, 5
σ1 , σ2 , σ3 0.1, 0.9, 0.15
γ, ², a 0.10, 0.1, 50
m, m̄ 5, 6
x (0) = [ x1 (0) , x2 (0) ] [0.01, 0.2]T
ê (0) = [ ê 1 (0) , ê 2 (0) , ê 3 (0) ] [1, 0, 0]T
Wi (0) , i = 1, 2 0
Les figures 2.2-2.5. montrent les résultats de simulation obtenus par le contrôleur
adaptatif neuronale de l’exemple 1. Ces résultats montrent que les performances de
poursuite sont suffisamment bonnes et tous les signaux du système en boucle fermée
sont bornés. On peut voir dans la figure 2.2 (a) que la sortie y suit sa référence yd avec
précision. La figure 2.2 (b) montrer les trajectoires des états x i . La bornitude de la loi de
commande intermédiaire ω̌ ( t) est illustré dans la figure 2.3 (a). Le signale de commande
u( t) et sat( u( t)) peut être observé dans la figure 2.3(b). On remarque aussi clairement
sur la figure 2.4 que l’observateur arrive à estimer correctement les états non mesurés.
L’événement de déclenchement est montré dans la figure 2.5.
42
2.2. SYSTÈME NL STRICT-FEEDBACK AVEC UNE SATURATION DE L’ENTRÉE ET
PERTURBATION EXTERNE ET AVEC GAIN DE COMMANDE INCONNU
(a)
(b)
F IGURE 2.2: Le résultat de simulation de l’exemple 1. (a) Performance de poursuite : la
sortie y la référence yd . (b) La poursuite de l’état x2 .
(a)
(b)
F IGURE 2.3: Le résultat de simulation de l’exemple 1. (a) la commande intermédiaire
ω̌ ( t) .(b) Poursuite de u( t) et sat( u( t)).
43
CHAPITRE 2. COMMANDE ADAPTATIVE NEURONALE DES SYSTÈMES NL SISO
DE LA FORME STRICT-FEEDBACK
(a)
(b)
(c)
F IGURE 2.4: Les nouveaux variables d’états s le long de leurs estimés ŝ de l’exemple 1.
[Link] Exemple 2
Dans cette partie, nous allons considérer le contrôle en poursuite basé sur le réseau
d’un robot manipulateur avec la saturation d’entrée décrite dans la figure 2.6 .Notez que
44
2.2. SYSTÈME NL STRICT-FEEDBACK AVEC UNE SATURATION DE L’ENTRÉE ET
PERTURBATION EXTERNE ET AVEC GAIN DE COMMANDE INCONNU
sa dynamique est modélisée comme une équation lagrangienne de second ordre [62]
avec M est la masse du lien rigide, q et q̇ sont sont l’angle et la vitesse angulaire,
respectivement. J représente l’inertie de rotation du servomoteur, B est le coefficient
d’amortissement, l est la longueur de l’axe de l’articulation au centre de masse, et g
est l’accélération gravitationnelle. Également [62] , J = 1, M gl = 10 et B = 2. À partir de
toute condition initiale, l’objectif est de suivre l’angle q à l’origine. La sturation u(v( t))
est déterminé par(2) avec les paramètre u m = [Link] de minimiser la charge de commu-
nication, l’événement de déclenchement est appliqué avec m = 4, m̄ = 5.
Pour implémenter la commande proposée, le vecteur de gain d’observateur et les vec-
teurs de gain de retour d’état sont sélectionn‘’es respectivement comme suit : k =
[273.75, 161.87, 23.45 ] , L = [17.73, 85.50, 100.69]T . Sélection de la matrice définie po-
sitive Q 1 = Q 2 = D iag [0.5 0.5 0.5 ] et en résolvant l’équation algébrique de Lyapunov
(2.23) et (2.41) pour obtenir les matrices symétriques définies positives suivantes, respec-
tivement
:
0.514 0.004 −0.505 6.080 3.251 0.001
P1
0.004 0.515 −0.505 , P2 3.251
2.416 0.021
−0.505 −0.505 0.996 0.001 0.021 0.012
Le système (2.1) possède deux réseaux de neurones sous la forme (1.1) pour approxi-
mer en ligne les fonctions inconnus, le nombre des réseaux a été choisi avec N = 4, et
les variables d’entrée sont choisis comme Z = [ x1 , x2 , v ( t) , u(v)]T . Les paramètres de
synthèses et les conditions initiales utilisés dans cette simulation sont résumés dans le
tableau (2.2).
Γ1 , Γ2 0.1, 20
σ1 , σ2 , σ2 10, 0.01, 0.01
γ, ²1 , ²2 , a 0.10, 0.001, 0.1, 50
x (0) = [ x1 (0) , x2 (0) ] [0.01, 0.2]T
ê (0) = [ ê 1 (0) , ê 2 (0) , ê 3 (0) ] [1, 0, 0]T
Wi (0) , i = 1, 2 0
45
CHAPITRE 2. COMMANDE ADAPTATIVE NEURONALE DES SYSTÈMES NL SISO
DE LA FORME STRICT-FEEDBACK
Les figures 2.7-2.10 montrent les résultats de simulation obtenus par le contrôleur
adaptatif neuronale de l’exemple 2. Ces résultats montrent que les performances de
poursuite sont suffisamment bonnes et tous les signaux du système en boucle fermée
sont bornés. On peut voir dans la figure 2.7 (a) que la sortie y suit sa référence yd avec
pré[Link] figure 2.7 (b) montrer les trajectoires des états x2 . La bornitude de la loi de
commande intermédiaire ω̌ ( t) est illustré dans la figure 2.8 (a). Le signale de commande
u( t) et sat( u( t)) peut être observé dans la figure 2.8 (b). On remarque aussi clairement sur
la figure 2.9 que l’observateur arrive à estimer correctement les états non mesuré[Link]
la figure 2.10 montre la liste des instants auxquels l’événement est déclenché où l’on
peut compter 12 événement sur les 12 secondes du temps de simulation. À partir de la
figure 2.10 et comparé avec la figure 6 et le tableau dans [62] indiquant le besoin de 87
événement, il est clair que le contrôleur adaptatif NNs proposé peut réduire efficacement
la charge de communication.
46
2.2. SYSTÈME NL STRICT-FEEDBACK AVEC UNE SATURATION DE L’ENTRÉE ET
PERTURBATION EXTERNE ET AVEC GAIN DE COMMANDE INCONNU
(a)
(b)
F IGURE 2.7: Le résultat de simulation de l’exemple 2. (a) Performance de poursuite : la
sortie y la référence yd . (b) La poursuite de l’état x2 .
(a)
(b)
F IGURE 2.8: Le résultat de simulation de l’exemple 2. (a) la commande intermédiaire
w( t) .(d) Poursuite de u( t) et sat( u( t)).
47
CHAPITRE 2. COMMANDE ADAPTATIVE NEURONALE DES SYSTÈMES NL SISO
DE LA FORME STRICT-FEEDBACK
(a)
(b)
(c)
F IGURE 2.9: Les nouveaux variables d’états s avec leurs estimés ŝ de l’exemple 2.
48
2.3. SYSTÈME NL STRICT-FEEDBACK AVEC DES NON LINÉARITÉS DE L’ENTRÉE
ET CONTRAINTE SUR LA SORTIE ET AVEC LE GAIN DE COMMANDE CONSTANT
ẋ i = f i ( x̄ i ) + x̄ i , i = 1, . . . , n − 1
ẋn = f n ( x̄n ) + δ u(v)) + d̄ ( t)
(2.62) y = x1
49
CHAPITRE 2. COMMANDE ADAPTATIVE NEURONALE DES SYSTÈMES NL SISO
DE LA FORME STRICT-FEEDBACK
µ ( t) = µ0 − µ∞ e−κ t + µ∞
¡ ¢
(2.64)
(2.65) e ( t) = µ ( t) T (ξ1 )
−1 e ( t)
· ¸
(2.66) ξ1 = T
µ ( t)
50
2.3. SYSTÈME NL STRICT-FEEDBACK AVEC DES NON LINÉARITÉS DE L’ENTRÉE
ET CONTRAINTE SUR LA SORTIE ET AVEC LE GAIN DE COMMANDE CONSTANT
δ eξ1 − δ e−ξ1
(2.67) T (ξ1 ( t)) =
eξ1 + e−ξ1
Puis, de l’équation (2.66), l’erreur transformée ξ1 ( t) est donnée par :
−1 e ( t) 1 ρ ( t) + δ
· ¸
(2.68) ξ1 = T = ln
µ ( t) 2 δ + ρ ( t)
avec ρ ( t) = e ( t)/µ ( t)
Pour stabiliser le système d’erreur ξ1 et ainsi garantit les performances de l’erreur e,
en différenciant(2.68) par rapport au temps on obtient :
" #·
∂T −1 (.) 1 1 1 ė eµ̇
¸
ξ̇1 = ρ̇ ( t) = − −
∂ρ ( t) 2 ρ ( t ) + δ ρ ( t ) − δ µ µ2
eµ̇
· ¸
(2.69) = ϕ x2 + f 1 ( x1 , x2 ) − ẏd −
µ
h i
où ϕ = 21µ ρ (t)1+δ − 1 peut être calculé en fonction de e ( t) et µ ( t) et 0 < ϕ < ϕ M =
³³ ´ ´ ρ (t)−δ
δ + δ /µ∞ δδ . De plus, on peut obtenir que
eµ̇
· ¸
ξ̈1 = ϕ̇ x2 + f 1 ( x1 , x2 ) − ẏd −
µ
∂ f 1 ( x̄2 ) ∂ f 1 ( x̄2 ) ėµ̇ eµ̈µ eµ̇2
· ¸
+ ϕ ẋ2 + ẋ1 + ẋ2 − ÿd − − 2 + 2
∂ x1 ∂ x2 µ µ µ
eµ̇
· ¸
= ϕ̇ x2 + f 1 ( x1 , x2 ) − ẏd − + ϕ F1 x̄2 , ẏd , e, ϕ + x3 − ÿd
£ ¡ ¢ ¤
(2.70)
µ
¢ ∂ f x̄ ∂ f x̄ ėµ̇ eµ̈µ eµ̇2
où F1 x̄2 , e, µ = ∂1x( 1 2 ) ẋ1 + ∂1x( 2 2 ) ẋ2 + f 2 ( x1 , x2 ) + µ + µ2 − µ2 .
¡
51
CHAPITRE 2. COMMANDE ADAPTATIVE NEURONALE DES SYSTÈMES NL SISO
DE LA FORME STRICT-FEEDBACK
eµ̇
· ¸
ξ(n) = ϕ (n−1)
+ ( n − 1) ϕ(n−2) F n−3 x̄n−2 , e, µ + x3 − ÿd
£ ¡ ¢ ¤
1 x2 + f 1 ( x1 , x2 ) − ẏd −
µ
... ¤ h ¡ i
+ ( n − 2) ϕ(n−3) F n−2 x̄n−3 , e, µ + xn − y d + · · · + ϕ F n x̄n , e, µ + u( t) − yd(n)
£ ¡ ¢ ¢
(2.73)
¤T
e s = [Λ 1] ξ1 , ξ̇1 , . . . , ξ1n
£
(2.74)
où Λ = [λ1 , λ2 , . . . .,λn−1 ]T est un vecteur des coefficients convenablement choisi tel que
ξ1 → 0 lorsque e s → 0. s n−1 + λn−1 s n−2 + · · · + λ1 est Hurwitz. La dérivée de e s par rapport
au temps peut être écrite comme suit :
eµ̇
· ¸
(n−1)
= λ1 ϕ + λ2 ϕ̇ + λ3 ϕ̈ + · · · + ϕ
¡ ¢
ė s x2 + f 1 ( x1 , x2 ) − ẏd −
µ
(n−1)
+ λ2 ϕ + 2λ3 ϕ̇ + 3λ4 ϕ̈ + · · · + ( n − 1) ϕ F1 x̄2 , e, µ + x3 − ÿd
¡ ¢£ ¡ ¢ ¤
... ¤
+ λ3 ϕ + 2λ4 ϕ̈ + 3λ5 ϕ̈ + · · · + ( n − 2) ϕ(n−2) F2 x̄3 , e, µ + x4 − y d +
¡ ¢£ ¡ ¢
..
.
h ¡ i
+ ϕ F n x̄n , e, µ + δ u (v) + d ( t) − yd(n)
¢
h ¡ i
= ϕ F x̄n , e, µ, ẏd , ϕ + δ u (v) + d ( t) − yd(n)
¢
(2.75)
52
2.3. SYSTÈME NL STRICT-FEEDBACK AVEC DES NON LINÉARITÉS DE L’ENTRÉE
ET CONTRAINTE SUR LA SORTIE ET AVEC LE GAIN DE COMMANDE CONSTANT
avec
¢h eµ̇
i
F x̄n , e, µ, ẏd , ϕ = λ1 + λ2 ϕ̇/ϕ + λ3 ϕ̈/ϕ + · · · + ϕ(n−1) /ϕ x2 + f 1 ( x1 , x2 ) − ẏd − µ
¡ ¢ ¡
Cependant, la fonction F x̄n , e, µ, ẏd , ϕ est inconnue, donc il est difficile de concevoir une
¡ ¢
loi de commande pour le système non linéaire (2.62). La solution la plus courante pour
résoudre ce problème est d’utiliser des approximateurs universels pour approximer cette
fonction non linéaire inconnue comme suit :
F x̄n , e, µ, ẏd , ϕ = W T S ( Z ) + ε ( Z )
¡ ¢
(2.76)
53
CHAPITRE 2. COMMANDE ADAPTATIVE NEURONALE DES SYSTÈMES NL SISO
DE LA FORME STRICT-FEEDBACK
Le modèle de la zone-morte avec une entrée v et une sortie u, décrit par [39]
m r ( v( t) − b r ) v( t) > b r
(2.78) u ( v) = o b r ≤ v( t) ≤ b l
m ( v( t) − b ) v( t) < b l
l l
où b r > 0, b l < 0, m r > 0, m l > 0 sont respectivement les paramètres et les pentes de la
zone morte. Afin d’étudier les caractéristiques de la zone-morte dans les problèmes de
commande, les suppositions suivantes sont faites :
Hypothèse 2.4. ([39]) La pente gauche et celle de droite sont égales, c.-à-d. m = m r = m l .
Hypothèse 2.6. ([39]) Les paramètres de la zone morte sont bornés par des constantes
connues m min , m max , d rmin , d rmax , d lmin , d lmax sachant que m ∈ [ m min , m max ], d r ∈
[ d rmin , d rmax ] et d l ∈ [ d lmin , d lmax ].
À partir des hypothèses 2.4-2.6, nous pouvons conclure que h (v( t)) est borné et satisfait
| h(v)| ≤ ρ , où ρ est la borne supèrieure, qui peut être choisie comme ρ = max m max d rmax , − m max d lmin .
Par conséquent, en remplaçant (2.76) dans (2.75), on obtient
h i
(2.81) ė s = ϕ δ u (v) − yd(n) + W T S ( Z ) + ε ( Z ) + d n ( t)
54
2.3. SYSTÈME NL STRICT-FEEDBACK AVEC DES NON LINÉARITÉS DE L’ENTRÉE
ET CONTRAINTE SUR LA SORTIE ET AVEC LE GAIN DE COMMANDE CONSTANT
où D 1 ( t) = ε ( Z ) + d n ( t)
Ensuite, il existe τ̄ une borne supérieure inconnue telle que |D 1 | ≤ τ. De plus, le contrôleur
adaptatif neuronale est donné par
2 2
à !
1 α1 e τ̂
s 1
(2.83) v( t) = − e s + yd(n) − Ŵ T S ( Z ) − + v c ( t)
δm ϕ e s τ̂1 tanh ( e s /²) + ²
(2.84) v c ( t) = −κ∗ si gn ( e s )
(2.85) ˙ = ϕΓ( e S ( Z ) + σ Ŵ )
Ŵ s 1
Théorème 2.2. Considérons le système non linéaire strict-feedback (2.62) avec la zone
morte sur l’entrée, et son contrôleur (2.81)-(2.84). Si les lois d’adaptation données (2.85)-
(2.86), et les Hypothèses 2.4-2.6 sont vraies, alors on peut conclure que tous les signaux du
système en boucle fermée sont bornés et que les erreurs de poursuite convergent vers zéro.
1 2 1 T −1 1 2
(2.87) V= e s + W̃ Γ W̃ + τ̃
2 2 2γ1
55
CHAPITRE 2. COMMANDE ADAPTATIVE NEURONALE DES SYSTÈMES NL SISO
DE LA FORME STRICT-FEEDBACK
V̇ ˙ + 1 τ̃τ̂˙
= e s ė s − W̃ T Γ−1 Ŵ
γ1
h i
(n)
= e s ϕ δ m v ( t) − yd + δ h (v) + W T S ( Z ) + D 1 ( t)
(2.88) ˙ + 1 τ̃τ̂˙
− W̃ T Γ−1 Ŵ
γ1
Selon la loi de commande(2.83)et les paramètres des lois d’adaptation (2.85)-(2.86),
l’équation (2.88) devient
ϕ M σ2 ¡
− σ2 ϕτ̃τ̂ ≤ τ̄2 − τ̃2
¢
(2.91)
2
En se servant le 2.1, et par substitution (2.90)-(2.91), on obtient
V̇ ≤ −α1 e2s +
² | e s | τ̂ °W̃ °2 − ϕ M σ2 τ̃2 + ϕ M σ1 kW k2 + ϕ M σ2 τ̄2
ϕ M σ1 ° °
(2.92) −
| e s | τ̂ + ² 2 2 2 2
x
Puis, utilisant l’inégalité 0 < x+ y < 1, ∀ x ≥ 0, y > 0 , l’équation (2.92) peut être arranger
comme suit
σ1 °
°W̃ °2 − σ2 τ̃2 + σ1 kW k2 + σ2 τ̄2 + ²
≤ −α1 e2s −
°
V̇
2 2 2 2
(2.93) ≤ −θ1 V + β1
où
ϕ M σ1
n o
θ1 = min 2α1 , λmax (Γ−1 )
, ϕ M σ2 γ1
ϕ M σ1 ϕ M σ2
β1 = kW k2 + τ̄2 + ²
2 2
56
2.3. SYSTÈME NL STRICT-FEEDBACK AVEC DES NON LINÉARITÉS DE L’ENTRÉE
ET CONTRAINTE SUR LA SORTIE ET AVEC LE GAIN DE COMMANDE CONSTANT
avec λmin (.)et λmax (.) désigne la valeur propre minimale et maximales de (.), respective-
ment.
Multiplier les deux côtés par eα t , intégration (2.93) sur [0, t], il s’ensuit que
d ³ θ1 t ´
Ve ≤ β1 eθ1 t
dt
β1 ³ ´
V eθ1 t − V (0) ≤ 1 − e θ1 t
θ1
β1 β1 −θ1 t β1
· ¸
(2.94) V ( t) ≤ + V1 | t=0 − e ≤ V | t=0 +
θ1 θ1 θ1
¯ ¯ q ¡
¯W̃ ¯ ≤ 2 V | t=0 + θ1 /β1 /λmin Γ−1
¢ ¡ ¢
q
|τ̃| ≤ γ1 2 V | t=0 + θ1 /β1
¡ ¢
(2.95)
½ ¾
¯¯ ¯ q
ΩW̃ = W̃ ∈ R W̃ ≤ Ω/λmin Γ
¡ ¢
¯ ¯ ¯ −1
n o
Ωτ̃ = τ̃ ∈ R ||τ̃| ≤ γ1 Ω
p
σ1
½ ¾
θ1 = min 2α1 , ¢ , σ2 γ1
λmax Γ−1
¡
σ1 σ2
β1 = kW k2 + τ̄2 + ²
2 2
Ceci termine la preuve de ce théorème.
57
CHAPITRE 2. COMMANDE ADAPTATIVE NEURONALE DES SYSTÈMES NL SISO
DE LA FORME STRICT-FEEDBACK
dC A
(
V dt0 = (C AF − C A ) F − V K 0 exp (E a /RT ) C A
(2.96) dT
V ρ C P dt0 = F ρ C p (T F − T ) − hA (T − TC ) − (4 H ) V K 0 exp (− (E a /RT )) C A
CA Concentration du composant A
F Vitesse d’alimentation
C AF Concentration d’entrée du composant A
FC Vitesse d’alimentation de l’eau de refroidissement
K0 Facteur pré-exponentiel
R Gaz constant
Ea Énergie d’activation
ρ Densités liquides
TF Température d’alimentation
V Volume de réservoir
T Température de réaction
−4 H Chaleur de réaction
h Zone de transfert de chaleur
CP Capacités calorifiques
TC Température du liquide de refroidissement d’entrée
FC Vitesse d’alimentation du liquide de refroidissement en entrée
58
2.3. SYSTÈME NL STRICT-FEEDBACK AVEC DES NON LINÉARITÉS DE L’ENTRÉE
ET CONTRAINTE SUR LA SORTIE ET AVEC LE GAIN DE COMMANDE CONSTANT
x = (C AF −C A ) , x = (TF −T) , ϕ = E a , t = t0 F
1 C AF 2 TF RT
(2.97) V
δ = hA , D = V K 0 e−ϕ , B = (−4H)ϕC AF , u = (T c −TF ) ϕ
F ρC p a F ρC p T FT F
ẋ1 = −2 x1 + D a (1 − x1 ) exp x2 / 1 + x2 /ϕ + x1
£ ¡ ¡ ¢¢¤
(2.98) y = x1
ẋ1 = f 1 ( x̄1 , x2 ) + x2
ẋ2 = f 2 ( x̄2 , u(v)) + δ u (v) + d ( t)
(2.99) y = x1
Où la zone morte sur l’entrée ( u (v)) est déterminée par (2.62) avec le paramètre m min =
0.6, m max = 0.7, b r = 2.09, b l = −1.5 et la perturbation externe d ( x, t) = cos( t) cos( x2 ).
L’objectif de la commande est de forcer la sortie du système (c.-à-d., la concentration y1 )
à suivre la trajectoire désiré yd ( t) = 0.5 + 0.1 sin( t).
Un seul réseau de neurones sous la forme (1.1) est généré pour approximer en ligne
les fonctions inconnus, le nombre des réseaux a été choisi avec N = 4, et les variables
¤T
d’entrée sont choisis comme Z = x1 , x2 , ẏd , e, ϕ . Les valeurs initiales des paramètres
£
estimés sont fixées comme suit : W (0) = 0, nous n’avons aucune information à priori
sur les paramètres neuronaux W . Les autres paramètres de synthèses et les conditions
initiales sont donnés par tableau 2.4.
59
CHAPITRE 2. COMMANDE ADAPTATIVE NEURONALE DES SYSTÈMES NL SISO
DE LA FORME STRICT-FEEDBACK
Γ 20
σ1 , σ2 0.1, 20
γ, ², α 10, 0.1, 1.2
λ, κ ∗
10, 4.5
µ∞ , κ 0.05, 0.009
δ=δ 1
µ0 1. 5
τ̂(0) 0
x (0) = [ x1 (0) , x2 (0) ] [0.6, 0.5]T
Les figures 2.11-2.13 montre les résultats de simulation obtenus par le contrôleur
adaptatif neuronale pour la dynamique de CSTR. Ces résultats montrent que les perfor-
mances de poursuite sont suffisamment bonnes et tous les signaux du système en boucle
fermée sont bornés. On peut voir dans la figure 2.11 que la sortie y1 suit parfaitement sa
référence yd . La bornitude du signale de commande v( t) et N (v ( t)) est illustré dans la
figure 2.12. La figure 2.13 présente les erreurs de poursuite. Pour Montrer l’efficacité
du contrôleur proposé dans ce travail, une comparaison est effectuée avec le contrôleur
back-stepping traditionnel dans [40] , avec la définition de e 1 = x1 − yd , e 2 = x2 − α1 . La
commande d’entré actuel est donné comme [40] :
(2.100) u = − e 1 − c 2 e 2 − Ŵ2T S 2 ( Z2 )
Les commandes virtuelles et les lois d’adaptation sont choisies comme [40] :
(2.101) α1 = − c 1 e 1 + Ŵ1T S 1 ( Z1 )
Il est noté que deux NNs sont utilisés dans le contrôleur back-stepping (2.102)-(2.103)
pour le système CSTR (2.98). À partir des équations ci-dessus définissant le contrôleur
et les lois d’adaptations dans [40], on peut voir clairement l’explosion de complexité
60
2.3. SYSTÈME NL STRICT-FEEDBACK AVEC DES NON LINÉARITÉS DE L’ENTRÉE
ET CONTRAINTE SUR LA SORTIE ET AVEC LE GAIN DE COMMANDE CONSTANT
61
CHAPITRE 2. COMMANDE ADAPTATIVE NEURONALE DES SYSTÈMES NL SISO
DE LA FORME STRICT-FEEDBACK
(a)
(b)
F IGURE 2.14: (a) L’erreur de poursuite des deux commande ; (b) la commande d’entrée
des deux approches.
62
2.3. SYSTÈME NL STRICT-FEEDBACK AVEC DES NON LINÉARITÉS DE L’ENTRÉE
ET CONTRAINTE SUR LA SORTIE ET AVEC LE GAIN DE COMMANDE CONSTANT
La fonction de la saturation sur l’entrée sat(.) peut être exprimée comme suit [74, 75] :
vmax si v( t) > vmax
(2.104) vsat = sat(v ( t)) = v si vmin ≤ v( t) ≤ vmax
vmin si v( t) < vmin
avec vmax et vmin sont des valeurs connues de la saturation de l’entrée v. La fonction de
zone morte sur l’entrée d ead (.) peut être exprimée comme suit [75, 76] :
m r (vsat − b r ) si vsat > b r
(2.105) d ead (vsat ) = o si b r ≤ vsat ≤ b l
m (v − b ) si vsat < b l
l sat l
où m r > 0, m l > 0 dénotent les pentes droite et gauche de la zone morte ; b r , b l indiquent
les paramètres de point de rupture droit et gauche de la zone morte. Il est clair que les
caractéristiques du non linéarités de l’entrée sont relativement compliquées. D’ailleurs,
il est difficile de traiter directement le problème du non linéarités de l’entrée, donc, la
fonction inverse gauche d ead + (.) satisfaisant d ead (.)d ead + (.) = I est défini comme suit
[75–77] :
(v̄/ m r − b r ) si v̄ > 0
(2.106) d ead (v̄) = o si v̄ = 0
(v̄/ m − b ) si v̄ < 0
l l
En ajoutant un bloc de la fonction inverse devant les non linéarités sur l’entrée, la
nouvelle structure est montré dans la figure 2.3, où v est la loi de commande actuelle.
Basé sur l’analyse de la caractéristique de nouvelle structure du non linéarité sur l’entrée
inspiré dans [76], u peut être exprimé comme suit
m r (vmax − b r ) si v̄ > m r (vmax − b r )
(2.107) u = satall (v̄) v̄ si m r (vmax − b r ) ≤ v̄ ≤ m l (vmin − b l )
m l (vmin − b l ) si v̄ < m l (vmin − b l )
L’équation ci-dessus implique que la saturation de l’entrée et la zone morte est couplé
avec le bloc de la fonction inverse gauche de la zone morte résultant un équivalente de la
saturation de l’entrée.
63
CHAPITRE 2. COMMANDE ADAPTATIVE NEURONALE DES SYSTÈMES NL SISO
DE LA FORME STRICT-FEEDBACK
1 α2 ¡
µ ¶
T (n)
e s − χ − ϑr
¢
(2.108) v̄( t) = −Ŵ S ( Z ) + yd −
δ ϕ
(2.111) ˙ = ϕΓ( e S ( Z ) + σ Ŵ )
Ŵ s 3
³e ´
s
(2.112) τ̂˙ = ϕγ2 [− | e s | tanh + σ4 τ̂]
²
64
2.3. SYSTÈME NL STRICT-FEEDBACK AVEC DES NON LINÉARITÉS DE L’ENTRÉE
ET CONTRAINTE SUR LA SORTIE ET AVEC LE GAIN DE COMMANDE CONSTANT
Théorème 2.3. Considérons le système (2.62). Supposons que les hypothèses 2.4-2.6 sont
satisfaites. Le terme de commande auxiliaire (2.110) et les lois de commande définie
par (2.108)-(2.109) avec les lois d’adaptation (2.111)-(2.112), alors on peut conclure que
tous les signaux du système en boucle fermée sont bornés et que les erreurs de poursuite
convergent vers zéro.
˙ + 1 τ̃τ̂˙ + χχ̇
n o
= ϕ e s δu − yd(n) + F x̄n , e, µ, ẏd , ϕ + d ( t)− W̃ T Γ−1 Ŵ
¡ ¢
V̇
γ2
˙ + 1 τ̃τ̂˙ + χχ̇
n o
(2.115) = ϕ e s δ v̄ + δ4 u − yd(n) + Ŵ T S ( Z ) + D 2 ( t) − W̃ T Γ−1 Ŵ
γ2
où F x̄n , e, µ, ẏd , ϕ est une fonction inconnue approximée par NNs comme suit :F x̄n , e, µ, ẏd , ϕ =
¡ ¢ ¡ ¢
T ϕ M σ3 ³ ° ° ´
2 ° °2
(2.119) − ϕσ3 W̃ Ŵ ≤ kW k − W̃
2
65
CHAPITRE 2. COMMANDE ADAPTATIVE NEURONALE DES SYSTÈMES NL SISO
DE LA FORME STRICT-FEEDBACK
ϕ M σ4 ¡
− ϕσ4 τ̃τ̂ ≤ τ̄2 − τ̃2
¢
(2.120)
2
1¡ 2
χ 4u ≤ χ + 4 u2
¢
(2.121)
2
1¡ 2
e sχ ≤ e s + χ2
¢
(2.122)
2
Finalement, en utilisant les inégalités ci-dessus, nous pouvons borner V̇ comme suit
(2.123)
α2 α2 1 2 ϕ M σ3 °
°W̃ °2 − ϕ M σ4 τ̃2 + ϕ M σ3 kW k2 + ϕ M σ4 τ̄2 + ϕ M κτ̄
µ ¶
e2s − − χ −
°
V̇ ≤ − ke −
2 2 2 2 2 2 2
où le paramètre de désigne est choisi pour satisfaire la condition k e − α22 − 12 > 0. Alors
(2.124) V̇ ≤ −θ2 V + β2
½ ¾
ϕ M σ3 α2 1 ϕ σ ϕ σ
où θ2 = min α2 , λmax (Γ− 1 , ϕ M σ4 γ2 , 2( k e − 2 − 2 ) ; β2 = M2 3 kW k2 + M2 4 τ̄2 + ϕ M κτ̄ sont
2 )
toutes constants. Nous pouvons garantir que V̇ est négatif aussi longtemps que e s est en
dehors de d’ensemble compact Ω e s défini comme suit
n p o
Ω e s = e s ∈ R || e s | ≤ Ω
Selon le théorème standard de Lyapunov, nous pouvons conclure que e s est bornée et
converge à l’ensemble compact, de même, le signal W̃ , τ̃, χ sont bornées et convergent à
ΩW̃ , Ωτ̃ , Ωχ définis comme suit
½ ¾
¯¯ ¯ q
ΩW̃ = W̃ ∈ ℜ W̃ ≤ Ω/λmin Γ
¡ ¢
¯ ¯ ¯ −1
n o
Ωτ̃ = τ̃ ∈ ℜ ||τ̃| ≤ γ1 Ω
p
n ¯¯ ¯ p o
Ωχ = χ ∈ ℜ ¯¯χ¯ ≤ Ω
( )
ϕ M σ3 α2 1
θ2 = min α2 , ¡ 1 ¢ , ϕ M σ4 γ2 , 2( k e − − )
λmax Γ− 2
2 2
ϕ M σ3 ϕ M σ4
β2 = kW k2 + τ̄2 + ϕ M κτ̄
2 2
Le reste de la preuve est similaire à la preuve du théorème 2.2, les conclusions du
théorème 2.3 peuvent être facilement obtenues, ce qui n’est pas traité en détail ici.
66
2.3. SYSTÈME NL STRICT-FEEDBACK AVEC DES NON LINÉARITÉS DE L’ENTRÉE
ET CONTRAINTE SUR LA SORTIE ET AVEC LE GAIN DE COMMANDE CONSTANT
Γ 35
σ1 , σ2 0.1, 20
γ, ², α 10, 0.1, 1.2
λ, K e , ϕm 10, 2.2, 5
µ∞ , κ 0.05, 0.009
χ(0), µ0 , τ̂(0) 0, 1.5, 0
δ=δ 1
x (0) = [ x1 (0) , x2 (0) ] [0.6, 0.5]T
W (0) 0
Les figures 2.17-2.19 montrent les résultats de simulation obtenus par le contrôleur
adaptatif neuronale pour la dynamique du CSTR. Ces résultats montrent que les perfor-
mances de poursuite sont suffisamment bonnes et tous les signaux du système en boucle
fermée sont bornés. On peut voir dans la figure 2.17 que la sortie y1 suit parfaitement sa
référence yd . La bornitude de le signale de commande v( t) et sat (v ( t)) est illustré dans
la figure 2.18. La figure 2.19 montre les erreurs de poursuite.
67
CHAPITRE 2. COMMANDE ADAPTATIVE NEURONALE DES SYSTÈMES NL SISO
DE LA FORME STRICT-FEEDBACK
2.4 Conclusion
Dans ce chapitre, des lois de commande adaptative ont été proposé pour des systèmes
strict-feedback non linéaires incertain SISO triangulaires avec contraintes sur l’entrée
en la présence des perturbations externe. Dans un premier cas, le gain de commande
a été considéré comme une fonction non linéaire incertaine dont le signe est inconnue.
68
2.4. CONCLUSION
69
CHAPITRE
3
C OMMANDE ADAPTATIVE NEURONALE DES SYSTÈMES
NL SISO DE LA FORME PURE - FEEDBACK
Sommaire
3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
3.2 Commande adaptative neuronale pour une classe de système non li-
néaire pure-feedback avec une saturation sur l’entrée . . . . . . . . . . . 75
3.2.1 Position du problème . . . . . . . . . . . . . . . . . . . . . . . . . . 75
3.2.2 La conception de la commande adaptative neuronale . . . . . . 76
3.2.3 Conception de l’observateur . . . . . . . . . . . . . . . . . . . . . . 78
3.2.4 Analyse de la stabilité . . . . . . . . . . . . . . . . . . . . . . . . . 81
3.2.5 Résultats de simulation . . . . . . . . . . . . . . . . . . . . . . . . 83
3.3 Commande adaptative pour des systèmes pure-feedback incertains avec
des contraints sur l’entrée et la sortie sans connaissance sur la direction
de commande . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
3.3.1 Position du problème . . . . . . . . . . . . . . . . . . . . . . . . . . 95
3.3.2 La conception de la commande adaptative neuronale . . . . . . 96
3.3.3 La transformation de l’erreur dynamique . . . . . . . . . . . . . 98
3.3.4 Conception de l’observateur . . . . . . . . . . . . . . . . . . . . . . 101
3.3.5 Analyse de la stabilité . . . . . . . . . . . . . . . . . . . . . . . . . 104
3.3.6 Résultats de simulation . . . . . . . . . . . . . . . . . . . . . . . . 106
3.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
71
CHAPITRE 3. COMMANDE ADAPTATIVE NEURONALE DES SYSTÈMES NL SISO
DE LA FORME PURE-FEEDBACK
3.1 Introduction
Cependant, du point de vue pratique, les méthodes développées dans [95] sont cou-
teuses du point de vue calcul suite à l’utilisation récursive des approximateurs neuronaux
où flous à chaque étape de conception. De plus, les lois d’adaptation impliquées dans DSC
nécessitent un nombre important de paramètres à mettre à jour en ligne, ce qui rend
les lois de commande ainsi que l’analyse de stabilité plus compliqués. Seulement peu
72
3.1. INTRODUCTION
de résultats ont été reportés sur la commande adaptative neuronale pour les systèmes
sous la forme générale pure-feedback sans l’utilisation des techniques back-stepping et
la DSC [96, 97]. Malgré ces efforts, les résultats existants [96, 97] sont focalisés sur les
systèmes incertains sans prise en compte de non linéarités sur les entrés.
En pratique, les non linéarités sur les entrées existent largement dans les systèmes
physiques tels qu’en mécanique, hydraulique et autre types de composants de systèmes,
ce qui rend le traitement de ces non linéarités dans la conception des contrôleurs un
domaine de recherche très important. La zone morte dans[76, 92, 98], l’entrée quantifiée
(Quantized input) dans [83, 99], backlash et hysteresis dans [100, 101] et la saturation
d’entrée dans [46, 102–104] sont des non linéarités communément traitées dans la
littérature. La saturation des signaux de commande est une non linéarité parmi les
plus importantes qui sont présente dans les systémes physiques, et qui peut limiter
gravement ses performances voire même provoquer l’instabilité. Alors, l’effet de la
saturation de l’entrée devrait être pris en compte dans la conception et l’analyse des
systèmes de commande. Plusieurs chercheurs ont déployé des efforts afin de traiter
le problème de la commande des systèmes non linéaire incertains avec saturation de
l’entrée [30–32, 35, 105–107].Dans [30], des schémas de commande à base de DSC
floue avec observateur ont été présentés pour les systèmes non linéaire strict-feedback
en présence de la saturation d’entrée. Dans [27], une commande back-stepping floue
adaptative a été développée pour les systèmes non-stricts feedback incertains où un
système auxiliaire a été introduit pour pallier aux effets de la saturation de l’entrée. Ce
résultats a été étendu pour traiter les systèmes pure-feedback avec saturation d’entrée
[108–110]. Dans [109, 110], la classe spécifique des système pure-feedback stochastiques
a été considérée. Cependant, dans les travaux [27, 30–32, 35, 105–110], les contrôleurs
proposés nécessitent N réseaux de neurones pour approximer les dynamiques incertaines
des systèmes non linéaires d’ordre N .
73
CHAPITRE 3. COMMANDE ADAPTATIVE NEURONALE DES SYSTÈMES NL SISO
DE LA FORME PURE-FEEDBACK
74
3.2. COMMANDE ADAPTATIVE NEURONALE POUR UNE CLASSE DE SYSTÈME
NON LINÉAIRE PURE-FEEDBACK AVEC UNE SATURATION SUR L’ENTRÉE
ẋ i = f i ( x̄ i , x i+1 ), i = 1, . . . , n − 1
ẋn = f n ( x̄n , u(v)), n≥2
(3.1) y = x1
ẋ i = F i ( x̄ i , x i+1 ) + x i+1 , i = 1, . . . , n − 1
ẋn = F n ( x̄n , u(v)) + u(v)
(3.3) y = x1
avec F i ( x̄ i , x i+1 ) = f i ( x̄ i , x i+1 ) − x i+1 et F n ( x̄n , u(v)) = f n ( x̄n , u(v)) − u (v). Le système (3.3)
est utilisé pour concevoir l’observateur et le contrôleur dans la section suivante.
Tout au long de ce travail les hypothèses suivantes sont considérées :
75
CHAPITRE 3. COMMANDE ADAPTATIVE NEURONALE DES SYSTÈMES NL SISO
DE LA FORME PURE-FEEDBACK
Remarque 3.1. Quand il n’y a pas de non linéarités sur l’entrée, le système donné par
(3.1) peut être considéré comme une version simplifié du système non linéaire pure-feedback
dans [96]. Toutefois, ce travail est concentré sur la conception des commandes pour la
même classe des systèmes non linéaire avec saturation sur l’entrée. Donc, la conception de
contrôle et l’analyse de stabilité de systèmes en boucle fermée sont plus difficiles que ceux
dans [96].
ẋ i = F i ( x̄ i , x i+1 ) + x i+1 , i = 1, . . . , n − 1
(3.4) ẋn = F n ( x̄n , u(v)) + g (v) + d (v) n ≥ 2
(3.5) v̇ = − cv + ω
76
3.2. COMMANDE ADAPTATIVE NEURONALE POUR UNE CLASSE DE SYSTÈME
NON LINÉAIRE PURE-FEEDBACK AVEC UNE SATURATION SUR L’ENTRÉE
avec
nX
−1 ∂ϕ ∂ϕn+1 ( x̄n , u(v))
n+1 ( x̄ n , u(v))
F ( x̄n , u(v)) = ẋ j − c v
j =1 ∂x j ∂v
∂ϕn+1 ( x̄n , u (v))
(3.7) + F n ( x̄n , u (v))
∂ xn
∂ϕn+1 ( x̄n , u(v))
(3.8) g ( x̄n , u(v)) =
∂v
∂ϕn+1 ( x̄n , u (v))
β Zβ =
¡ ¢
(3.9)
∂ xn
avec Zβ = [ x̄n , u(v)]
En conséquence, le système (3.6)peut être décrit sous la forme normale avec le respect
les nouveaux états :
ṡ i = s i+1 , 1 ≤ i ≤ n
ṡ n+1 = F ( x̄n , u(v)) + g( x̄n , u(v))ω + β Zβ ( g (v) + d (v))
¡ ¢
(3.10) y = x1
(3.11) e 1 = y − yd = s 1 − yd
h iT
où e = [ e 1 , e 2 , . . . , e n+1 ]T = e 1 , ė 1 , . . . , e(n)
1 . La dynamique des erreurs de poursuite sera
alors donnée par :
(3.13) y = CT e
avec avec
0 1 0 0 0 0
···
0 0 1 0
0
0
.. .. .. ∈ ℜn×n , B = ... ∈ ℜn×1 , c = ... ∈ ℜn×1
A=
. . .
0 0 0 1
0
0
···
0 0 0 0 1 1
77
CHAPITRE 3. COMMANDE ADAPTATIVE NEURONALE DES SYSTÈMES NL SISO
DE LA FORME PURE-FEEDBACK
Remarque 3.2. À partir de la transformation ci-dessus, on voit que le système (3.3) est
similaire aux systèmes affine dans [35, 107] qui appliquent l’approche DSC adaptative
et la méthode traditionnelle back-stepping adaptative, respectivement. Ces dernières
procédures contienne " N " étapes avec des lois de commande virtuelles qui ne sont pas
nécessaire dans le travail proposé où la conception de la commande est devenue simple et
directe avec la conception unique de la commande réelle et ses lois d’adaptations.
ê˙ = ( A − Bk T ) ê − B yd(n+1) + L ẽ 1
(3.14) ê 1 = C T ê
¤T
où k = [ k 0 , k 1 , . . . , k n ]T est le vecteur de gain de retour d’état, L = L 1 , . . . , L (n+1) est le
£
vecteur du gain de l’observateur, et ils sont choisis de sorte que les polynômes carac-
téristiques de A − Bk T et A − LC T sont Hurwitz (c.-à-d., stable). Notons que ẽ = e − ê,
ê = ŝ − Yd , avec ŝ est l’estimé du vecteur d’état s et ê est l’estimé du vecteur des erreurs
de poursuite e. Par conséquent, si l’erreur d’observation ẽ converge vers zéro, l’erreur de
poursuite estimée êconvergera également vers zéro.
Pour simplifier la conception de la loi de commande, et selon la propriété d’approximation
universelle des réseaux de neurones, les fonctions non linéaires inconnues suivantes
peuvent être approximées comme suit :
et
où Z = [ x̄n , v, u (v) ]T est le vecteur d’entrée du réseau et S (.) est le vecteur de fonction
d’activation neuronale est supposé convenablement fixé à l’avance par l’utilisateur, W1 et
78
3.2. COMMANDE ADAPTATIVE NEURONALE POUR UNE CLASSE DE SYSTÈME
NON LINÉAIRE PURE-FEEDBACK AVEC UNE SATURATION SUR L’ENTRÉE
W2 sont les paramètres idéaux d’approximation avec les erreurs neuronaux |ε1 | et |ε2 |.
Étant W1 et W2 sont inconnus, ces valeurs estimés Ŵ1 et Ŵ2 seraient utilisées.
Notons que les paramètres optimaux W1 et W2 sont des constantes artificielles inconnues
introduites uniquement pour faire l’étude théorique de la stabilité de l’algorithme de
commande. En fait, la connaissance de leurs valeurs n’est pas nécessaire pour l’implé-
mentation des lois de commande adaptatives.
Puisque les vecteurs de paramètres idéaux Wi sont inconnus, il devrait être estimé par
une loi d’adaptation appropriée. Les estimations sont représentées par Ŵi . Définissons
les vecteurs de l’erreur d’estimation paramétrique comme :
79
CHAPITRE 3. COMMANDE ADAPTATIVE NEURONALE DES SYSTÈMES NL SISO
DE LA FORME PURE-FEEDBACK
avec
h i
U = L( p) g( x̄n , u(v))(W̃1T S ( Z ) + ε1 ( Z ) + vr + k T ê(W̃2T S ( Z ) + ε2 ( Z ))
(3.25) − W̃1T S ( Z ) − k T êW̃2T S ( Z ) + vr
Hypothèse 3.3. Chaque élémentU du paramètre inconnu défini dans (3.25) est délimité
par une constante, c’est-à-dire qu’il existe une constante positive inconnue τ̄ telle que
(3.26) |U | ≤ τ̄
Le vecteur de gain d’observateur L est calculé afin que la matrice A − LC T ait toutes
¡ ¢
ses valeurs propres à parties réelles négatives. Par conséquent le système bouclé sera
exponentiellement stable. On lui associe une équation de Lyapunov, ayant pour solution
unique une matrice symétrique définie positive P , donnée par
³ ´T ³ ´
(3.28) A − LC T P + P A − LC T = −Q
(3.29) PB c = C
où A − LC T et Q est une matrice symétrique et définie positive dont le choix est libre.
¡ ¢
80
3.2. COMMANDE ADAPTATIVE NEURONALE POUR UNE CLASSE DE SYSTÈME
NON LINÉAIRE PURE-FEEDBACK AVEC UNE SATURATION SUR L’ENTRÉE
Théorème 3.1. Considérons le système non linéaire non affine (3.1) avec les contraints
sur l’entrée, et supposons que les hypothèses 3.1-3.4 sont satisfaites et l’observateur (3.14).
Alors la loi de commande définit par l’équation (3.20) avec le terme de de commande
compensateur suivant :
ẽ 1
µ ¶
(3.30) vr = −τ̂tanh
²
˙
1 = Γ1 ẽ 1 S ( Z ) − σ1 Ŵ1
¡ ¢
(3.31) Ŵ
˙
³ ´
T
(3.32) Ŵ 2 = Γ2 k ê ẽ 1 S ( Z ) − σ2 Ŵ2
˙τ̂ = γ ẽ 1 tanh( ẽ 1 ) − σ2 τ̂
µ ¶
(3.33)
²
1 1 1
(3.34) V = ẽ T P2 ẽ + W̃1T Γ1 −1 W̃1 + W̃2T Γ2 −1 W̃2 + τ̃2
2 2 2γ
˙
h i
V̇ = − ẽ T Q ẽ + [ ẽ 1U + ẽ 1 vr ] + W̃1T ẽ 1 S ( Z ) − Γ1 −1 Ŵ 1
i 1
˙ − τ̃ τ̂˙
h
(3.36) + W̃2T ẽ 1 k T êS ( Z ) − Γ2 −1 Ŵ 2
γ
81
CHAPITRE 3. COMMANDE ADAPTATIVE NEURONALE DES SYSTÈMES NL SISO
DE LA FORME PURE-FEEDBACK
En se servant du lemme 2.1 l’équation (2.7), et selon les lois d’adaptation des paramètre
(3.31)-(3.33), on obtient
À partir de (3.44), donc ẽ, W̃1 , W̃2 , τ̃ sont bornés. Utilisant (3.44), V (0) est défini comme
suit :
(3.45) V (0) = ẽ T (0) P ẽ (0) + 21 W̃1T (0) Γ1 −1 W̃1 (0) + 21 W̃2T (0)Γ2 −1 W̃2 (0) + 21γ1 τ̃2 (0)
82
3.2. COMMANDE ADAPTATIVE NEURONALE POUR UNE CLASSE DE SYSTÈME
NON LINÉAIRE PURE-FEEDBACK AVEC UNE SATURATION SUR L’ENTRÉE
¶¶ 1
1 θ θ
µ µ µ ¶
2
−α t
(3.46) k ẽk ≤ + V (0) − e
λmin (P ) α α
( ¯ ¶1 )
1 θ 2
¯ µ
(3.47) Ω ẽ = ẽ ¯ k ẽk ≤
¯
¯ λmin (P ) α
De même, les vecteurs d’erreur de paramètre W̃1 et W̃2 sont également bornés et
convergent vers Ω tildeW1 et Ω tildeW2 , définis comme suit :
¯ Ã !1
¯¯ 2 θ 2
ΩW̃1
° °
(3.48) = W̃ ¯ °W̃1 ° ≤
1 ¯¯ λmin Γ1 −1 α
¡ ¢
¯ Ã !1
¯¯ 2 θ 2
ΩW̃2
° °
(3.49) = W̃ ¯ °W̃2 ° ≤
2 ¯¯ λmin Γ2 −1 α
¡ ¢
De la bornitude ẽ, W̃1 , W̃2 et τ̃ on peut déduire la bornitude de e, ê, s̃, Ŵ1 , Ŵ2 et τ̂ car
ẽ = e − ê = s̃ , Ŵ1 = W1 − W̃1 , Ŵ2 = W2 − W̃2 , τ̃ = τ̄ − τ̂ et les paramètres idéaux W1 ,W2 et τ̄
doit être borné. De la bornitude de ẽ et la définition de ê dans (3.14), on peut conclure
que ê est borné et e est borné également. Basé sur e = s − Yd , on a s est aussi borné et il
s’ensuit que ŝ est borné parce que s̃ est borné. L’état x1 est borné parce que x1 = s 1 . Par
ailleurs, parce que s 2 est borné et ∂ϕ2 ( x2 )/∂ x2 > 0, on conclut que x2 est borné basé sur
la définition de s 2 = ϕ( x̄2 ). Similaire et récursivement, les états x i , i = 3, . . . , n sont tous
bornés.
Par conséquent, il est conclu que tous les signaux du système en boucle fermée résultant
sont bornés.
Afin de montrer l’efficacité de la méthode proposée, deux exemples sont donnés dans
cette section. Le premier est un système non linéaire pure-feedback sous la forme de (3.1),
tandis que le second est directement appliqué au système non linéaire strict-feedback
sous la forme de (3.3).
83
CHAPITRE 3. COMMANDE ADAPTATIVE NEURONALE DES SYSTÈMES NL SISO
DE LA FORME PURE-FEEDBACK
[Link] Exemple 1
Considérons le système non linéaire pure-feedback du troisième roder [96] décrit par
les équations dynamiques suivantes :
ẋ1 = f 1 ( x1 , x2 )
ẋ2 = f 2 ( x̄2 , x3 )
ẋ3 = f 3 ( x̄3 , u(v))
(3.50) y = x1
1−exp(x x )
où f 1 ( x1 , x2 ) = 0.2 x1 + x2 , f 2 ( x̄2 , x3 ) = 1+exp(x11 x22 ) + x3 +0.05 sin( x3 ) et f 3 ( x̄3 , u(v)) = 0.2exp − x24 x36 +
¡ ¢
0.9 + 0.05exp − x12 sat ( u) + 0.1sin (sat ( u)) sont des fonctions non linéaires inconnues.
¡ ¡ ¢¢
La saturation sur l’entrée sat( u( t)) est déterminé par (3.2)avec le paramètre u m = 2.5.
L’objectif de la simulation est d’appliquer la commande adaptative neuronale proposé de
sorte que la sortie du système y1 suit la trajectoire désirée yd ( t) = sin( t). Pour implé-
menter la commande proposée, le vecteur de gain d’observateur et les vecteurs de gain de
retour d’état sont sélectionnés respectivement comme suit : k = [15.596 × 102 , 149.78 ×
T
102 , 463.1 , 50.1], L = [102, 62.03 × 102 , 17.25 × 103 , 29.153 × 103 ] . Sélection de la ma-
trice définie positive
Q = D iag [10 10 10 10] et en résolvant l’équation algébrique de Lyapunov (3.28) pour
obtenir la matrice symétrique définie positive suivante :
25.06 15.06 −25.03 −15.03
15.06 55.16 5.06 −75.08
P =
−25.03 5.06 55.11 −35.03
−15.03 −75.08 −35.03 124.86
Le système (3.1) possède deux réseaux de neurones sous la forme (1.1) pour approximer
en ligne les fonctions inconnus, le nombre des réseaux a été choisi avec N = 5, et les
variables d’entrée sont choisis comme Z = [ x1 , x2 , x3 , v ( t) , u(v)]T . Les paramètres de
synthèses et les conditions initiales utilisés dans cette simulation sont donnés dans le
tableau 3.1.
84
3.2. COMMANDE ADAPTATIVE NEURONALE POUR UNE CLASSE DE SYSTÈME
NON LINÉAIRE PURE-FEEDBACK AVEC UNE SATURATION SUR L’ENTRÉE
Γ1 = Γ2 0.001
σ1 = σ2 0.001
σ3 10
γ, ², a 10, 0.1, 50
x (0) = [ x1 (0) , x2 (0) x3 (0) ] [1, 0, 0]T
ê (0) = [ ê 1 (0) , ê 2 (0) , ê 3 (0) ê 4 (0)] [1, 0, 0, 0]T
Wi (0) , i = 1, 2 0
Les figures 3.1-3.5 présentent les résultats de simulation obtenus par le contrôleur
adaptatif neuronale de l’exemple 1. Ces résultats montrent que les performances de
poursuite sont suffisamment bonnes et que tous les signaux du système en boucle fermée
sont bornés. On peut voir dans la figure 3.1 (a) que la sortie y1 suit parfaitement sa
référence yd . La figure 3.1 (b) montre les trajectoires des états x i .Un observateur d’erreur
ẽ est indiqué dans la figure 3.2 (a). On remarque aussi clairement sur la figure 3.2 (a) que
l’observateur est capable à estimer correctement les états non mesurés. Les normes des
paramètres ajustés sont bornées tel que présentées dans la figure 3.2(b). La bornitude
de la loi de commande intermédiaire ω( t) est illustré dans la figure 3.3(a). Le signal de
commande u( t) et sat( t) peuvent être observés dans la figure 3.3(b). Les figures 3.4-3.5
présentent les erreurs de poursuite et leurs estimations ainsi que les trajectoires des
nouveaux états avec leurs estimations, respectivement.
Pour Montrer l’efficacité de la commande proposé dans ce travail, une comparaison
est effectuée avec le contrôleur de back-stepping traditionnel sans tenir compte de la
saturation en entrée [93]. La commande d’entré réelle est donnée comme [93] :
(3.51) u = − z2 − k 3 z3 − Ŵ3 S ( Z3 )
α1 = − k 1 z1 − Ŵ1T S ( Z1 )
85
CHAPITRE 3. COMMANDE ADAPTATIVE NEURONALE DES SYSTÈMES NL SISO
DE LA FORME PURE-FEEDBACK
¢ ˙
∂α i /∂Ŵk Ŵ
¡
k , i = 1, 2, et les lois de commandes adaptatives sont données par
(3.52) ˙ = Γ ¡ z S ( Z ) − σ Ŵ ¢ , i = 1, 2, 3
Ŵ i i 1 i i i
À partir des équations ci-dessus définissant le contrôleur et les lois d’adaptations dans
[93], on peut voir clairement l’explosion de complexité impliquée par l’utilisation de deux
entrées de commande virtuelles avec leurs dérivées compliquées, ainsi que de nombreux
paramètres de conception. Il est important de noté que le calcul précis des commandes
virtuelles α̇ i n’est pas simple, en particulier pour les systèmes d’ordre élevé en raison
des dérivées partielles successives des NNs. En revanche, l’approche proposée n’a besoin
que de deux paramètre de NNs quel que soit l’ordre du système non linéaire.
Les résultats obtenus lors de l’utilisation du contrôleur défini dans [93] sans saturation
sur l’entrée est montré dans la figure 3.6. Il est trés clair que l’approche proposé ait des
performances supérieures à celle dans [93] parce que la réponse obtenue dans la figure
3.6 (a) montre l’équivalence de performance de poursuite de notre approche mais au prix
d’un signal de commande énergétique, comme indiqué dans la figure 3.6 (b). Ce grand
signal de commande peut être non réaliste. Cependant, lorsque la saturation d’entrée
est appliquée dans les figures 3.7 (a)-(b) montre l’incapacité du contrôleur dans [93] à
amener le système à suivre sa référence.
(a)
(b)
86
3.2. COMMANDE ADAPTATIVE NEURONALE POUR UNE CLASSE DE SYSTÈME
NON LINÉAIRE PURE-FEEDBACK AVEC UNE SATURATION SUR L’ENTRÉE
(a)
(b)
87
CHAPITRE 3. COMMANDE ADAPTATIVE NEURONALE DES SYSTÈMES NL SISO
DE LA FORME PURE-FEEDBACK
(a)
(b)
(a) (b)
(c) (d)
F IGURE 3.4: l’erreur de poursuite du système transformé avec son estimation de l’exemple
1.
88
3.2. COMMANDE ADAPTATIVE NEURONALE POUR UNE CLASSE DE SYSTÈME
NON LINÉAIRE PURE-FEEDBACK AVEC UNE SATURATION SUR L’ENTRÉE
(a) (b)
(c) (d)
(a) (b)
89
CHAPITRE 3. COMMANDE ADAPTATIVE NEURONALE DES SYSTÈMES NL SISO
DE LA FORME PURE-FEEDBACK
(a) (b)
[Link] Exemple 2
ẋ1 = x2 − x1 /1 + x14
2
ẋ2 = sat( u( t)) − x2 e− x1
(3.53) y = x1
où la saturation sur l’entrée sat( u ( t)) est déterminé par (3.2) avec le paramètre u m = 2.
L’objectif de la simulation est d’appliquer la commande adaptative neuronale proposée
de sorte que la sortie du système y suit la trajectoire désiré yd ( t) = sin( t).
Pour implémenter la commande proposée, le vecteur de gain d’observateur et les vecteurs
de gain de retour d’état sont sélectionnés respectivement comme suit : k = [15.813 ×
102 , 407.8 , 350],L = [100, 6000, 5000]T . Sélection de la matrice définie positive
Q = D iag[100 100 100 ] et en résolvant l’équation algébrique de Lyapunov (3.28) pour
obtenir la matrice symétrique définie positive suivante :
3 2
5.1686 × 10 −0.500 × 10 −43.40
P = −50. 00 43. 40 − 50. 00
−43.4.00 −50.00 60.90
Le système (3.1) possède deux réseaux de neurones sous la forme (1.1) pour approxi-
mer en ligne les fonctions inconnus, le nombre des réseaux a été choisi avec N = 4, et
les variables d’entrée sont choisis comme Z = [ x1 , x2 , v ( t) , u(v)]T . Les paramètres de
synthèses et les conditions initiales utilisés dans cette simulation sont donnés dans le
tableau 3.2.
90
3.2. COMMANDE ADAPTATIVE NEURONALE POUR UNE CLASSE DE SYSTÈME
NON LINÉAIRE PURE-FEEDBACK AVEC UNE SATURATION SUR L’ENTRÉE
Γ1 , Γ2 100, 0.001
σ1 = σ3 0.01
σ2 100
γ, ², a 0.01, 0.1, 20
x (0) = [ x1 (0) , x2 (0) ] [0.01, 0.2]T
ê (0) = [ ê 1 (0) , ê 2 (0) , ê 3 (0) ] [1, 0, 0]T
Wi (0) , i = 1, 2 0
Les figures 3.8-3.12 illustrent les résultats de simulation de l’exemple 2. Ces résultats
montrent que les performances de poursuite sont suffisamment bonnes et tous les signaux
du système en boucle fermée sont bornés. On peut voir dans la figure 3.8 (a) que la sortie
y suit sa référence yd avec précision. La figure 3.8 (b) montrer les trajectoires des états
x i . On remarque aussi clairement sur la figure 3.9 (a) que l’observateur arrive à estimer
correctement les états non mesurés. Les normes des paramètres ajustés sont bornées est
présentée dans la figure 3.9 (b). La bornitude de la loi de commande intermédiaire ω( t)
est illustré dans la figure 3.10 (a). Le signale de commande u( t) et sat( t) peut être observé
dans la figure 3.10 (b). Les figures 3.11-3.12 montrent que les erreurs de poursuite et leurs
estimations et les trajectoires des nouveaux états avec leurs estimations, respectivement.
Pour Montrer l’efficacité de la commande proposée dans ce travail, une comparaison est
effectuée avec le contrôle back-stepping traditionnel en considérant la saturation d’entrée
[107]. La commande d’entrée réelle u( t), la fonction de la commande intermédiaire α1 , et
les lois d’adaptations Ŵ1 et Ŵ2 sont donnés par [107] :
1
(3.54) u = − h̄ − z1 − k 2 z2 − z2 − 2(∂α1 /∂ y)2 z2 − H2
2
7 z1
(3.55) α1 = − k 1 z1 − Ŵ1T S 1 ( x1 ) − ẏd − ¡ 2 ¢
4 k b1 − z1
˙ = Γ S (x ) ¡ z1
(3.56) Ŵ 1 1 1 1 2
¢ − σŴ1
k b1 − z1
(3.57) ˙ = Γ z S ( x̂ ) − σŴ
Ŵ 2 2 2 2 2 2
91
CHAPITRE 3. COMMANDE ADAPTATIVE NEURONALE DES SYSTÈMES NL SISO
DE LA FORME PURE-FEEDBACK
(
x̂˙ 1 = x̂2 + Ŵ1T S 1 ( x1 ) + λ1 ( y − x̂1 )
(3.58)
x̂˙ 2 = g (v) + Ŵ T S 2 ( x̂2 ) + λ2 ( y − x̂1 )
2
Il est à noter que deux paramètre de NNs sont utilisés dans le contrôleur par back-
stepping (3.54)-(3.57) pour le système du deuxième ordre (3.53). De la définition de la
commande et les lois d’adaptations dans [107], on peut voir clairement l’explosion de
complexité impliquée par l’utilisation de nombreux paramètres de conception ainsi que
de deux entrées de NNs et une commande virtuelle avec ses dérivées compliquées.
Les résultats obtenus lors de l’utilisation du contrôleur défini dans [107] avec saturation
d’entrée est montré dans la figure 3.13. Il est très clair que l’approche proposé présente
des performances supérieures à celle dans [107] parce que la réponse obtenue dans la
figure 3.13 (a) montre la performance de poursuite est lente par rapport à notre approche.
De plus, le signal de commande est largement fort en phase transitoire comme illustré
sur la figure 3.13 (b). Ce large signal de commande peut être non réaliste.
(a)
(b)
92
3.2. COMMANDE ADAPTATIVE NEURONALE POUR UNE CLASSE DE SYSTÈME
NON LINÉAIRE PURE-FEEDBACK AVEC UNE SATURATION SUR L’ENTRÉE
(a) (b)
(a) (b)
93
CHAPITRE 3. COMMANDE ADAPTATIVE NEURONALE DES SYSTÈMES NL SISO
DE LA FORME PURE-FEEDBACK
(a) (b)
(c)
(a) (b)
(c)
94
3.3. COMMANDE ADAPTATIVE POUR DES SYSTÈMES PURE-FEEDBACK
INCERTAINS AVEC DES CONTRAINTS SUR L’ENTRÉE ET LA SORTIE SANS
CONNAISSANCE SUR LA DIRECTION DE COMMANDE
(a) (b)
ẋ i = f i ( x̄ i , x i+1 ), i = 1, . . . , n − 1
ẋn = f n ( x̄n , u(v)), n≥2
(3.59) y = x1
95
CHAPITRE 3. COMMANDE ADAPTATIVE NEURONALE DES SYSTÈMES NL SISO
DE LA FORME PURE-FEEDBACK
La saturation sur l’entrée u(v( t)) donnéée déjà dans (2.2) est approximé de la même ma-
nière que celle dans (2.3)et réécrite ici uniquement pour simplifier le suivi des dérivations
des équations :
la propriété de g (v), nous avons g (0) = 0. L’équation (3.62) être représentée comme suit :
∂ g (v) ¯¯
¯
(3.63) g ( v) = v
∂v ¯ v=θ .v
L’objective dans ce travail consiste à concevoir une loi de commande adaptative à base de
réseaux de neurones pour une classe de système non linéaire pure-feedback en présence
de non-linéarités d’entrée et de direction de commande inconnue telles que tous les
signaux du système en boucle fermée soient bornés et que la sortie du système y( t) du
système (3.59) suive les trajectoires de références prédéterminées yd ( t).
Tout au long de ce travail, les hypothèses suivantes sont considérées :
∂ f i, j ( x̄ i ,x i+1 )
Hypothèse 3.4. Le gain de commande g i, j ( x̄ i , x i+1 ) = ∂ x i+1
et son signe est inconnu,
¯ ¯
g ≤ ¯ g i, j (.)¯ ≤ g avec g et g sont des constantes positive.
ṡ 2 = η̇ 2 ( x̄2 )
∂η 2 ( x̄2 ) ∂η 2 ( x̄2 )
= ẋ1 + ẋ2
∂ x1 ∂ x2
(3.64) , η3 ( x̄3 )
96
3.3. COMMANDE ADAPTATIVE POUR DES SYSTÈMES PURE-FEEDBACK
INCERTAINS AVEC DES CONTRAINTS SUR L’ENTRÉE ET LA SORTIE SANS
CONNAISSANCE SUR LA DIRECTION DE COMMANDE
De plus, nous avons :
∂η 3 ( x̄3 ) ∂ f 1 ( x1 , x2 ) ∂ f 2 ( x̄2 , x3 )
(3.65) = = g 1 ( x1 , x2 ) g 2 ( x̄2 , x2 )
∂ x3 ∂ x2 ∂ x3
ṡ i = η̇ i ( x̄ i )
i ∂η x̄
X i ( i)
= ẋ j
j =1 ∂ x j
ṡ n = η̇ n ( x̄n )
n ∂η x̄
X n ( n)
= ẋ i
i =1 ∂xi
nX
−1 ∂η ∂η n ( x̄n )
n ( x̄ n )
(3.68) = f i ( x̄ i , x i+1 ) + f n ( x̄n , u (v))
i =1 ∂xi ∂ xn
∂ f n ( x̄n , u (v)) ¯¯
¯
0
u − u0
¡ ¢ ¡ ¢
(3.69) f n ( x̄n , u (v)) = f n x̄n , u +
∂u ¯
u=θ .u
∂η n ( x̄n ) Qn−1
En remplaçant (3.69) dans (3.68), et en utilisant ∂ xn
= i =1 g i ( x̄ i+1 , x i+1 ), (3.68) de-
vient
³ ´
(3.70) ṡ n = f ( x̄n ) + ḡ x̄n , uθ (v) u
où
97
CHAPITRE 3. COMMANDE ADAPTATIVE NEURONALE DES SYSTÈMES NL SISO
DE LA FORME PURE-FEEDBACK
nX
−1 ∂η ∂η n ( x̄n )
n ( x̄ n )
f n x̄n , u0
¡ ¢
(3.71) f ( x̄n ) = f j ( x̄ i , x i+1 ) +
j =1 ∂ xn ∂ xn
∂ f n x̄n , uθ (v)
à ! ¡ ¢
³ ´ nY
−1
(3.72) ḡ x̄n , uθ (v) = g i ( x̄ i+1 , x i+1 ) − u0
i =1 ∂u
En conséquence, le système (3.70) peut être décrit sous la forme normale avec le respect
des nouveaux états :
ṡ i = s i+1 , 1 ≤ i ≤ n
³ ´
ṡ n = f ( x̄n ) + ḡ x̄n , uθ (v) u
(3.73) y = s1
en considération (3.61)et (3.63), le système (3.73) peut être réécrit comme suit :
ṡ i = s i+1 , 1 ≤ i ≤ n
³ ´ ³ ´
ṡ n = f ( x̄n ) + g x̄n , uθ (v) v + ḡ x̄n , uθ (v) d (v)
(3.74) y = s1
¢ ³ ∂ g(v) ¯¯ ´
où g x̄n , uθ (v) = ḡ x̄n , uθ (v)
¡ ¢ ¡
∂v ¯ v=θ .v
(3.75) e 1 ( t) = y( t) − yd ( t)
h i
où e = [ e 1 , e 2 , . . . , e n ] = e 1 , ė 1 , . . . , e(n)
1 .
En rappelant (3.60), et en soustrayant yd ( t) des deux côtés, on obtient :
98
3.3. COMMANDE ADAPTATIVE POUR DES SYSTÈMES PURE-FEEDBACK
INCERTAINS AVEC DES CONTRAINTS SUR L’ENTRÉE ET LA SORTIE SANS
CONNAISSANCE SUR LA DIRECTION DE COMMANDE
Dénoter
(
e ( t) = y ( t) − yd ( t) ,
(3.77)
e ( t) = y ( t) − yd ( t) ,
alors, (3.77) devient
e 1 ( t) = T ξ1 ( t) , e( t), e( t)
¡ ¢
(3.79)
ξ1 ( t) = T −1 e 1 ( t) , e( t), e( t)
¡ ¢
(3.80)
où ξ1 ( t) ∈ ℜ est l’erreur transformée non contrainte, et T (.)est une fonction lisse inversible
et strictement croissante telle que :
∂T (.)
(3.81) >0
∂ξ1
De plus, la fonction T (.) doit être correctement sélectionné de telle sorte que :
lim T ξ1 ( t) , e( t), e( t) = e( t)
¡ ¢
(3.82)
ξ1 →+∞
lim T ξ1 ( t) , e( t), e( t) = e( t)
¡ ¢
(3.83)
ξ1 →−∞
ė i = e i+1 , 1 ≤ i ≤ n
³ ´ ³ ´
ė n = f ( x̄n ) + g x̄n , uθ (v) v + ḡ x̄n , uθ (v) d (v) − yd(n)
ξ1 ( t) = T −1 e 1 ( t) , e( t), e( t)
¡ ¢
(3.86)
99
CHAPITRE 3. COMMANDE ADAPTATIVE NEURONALE DES SYSTÈMES NL SISO
DE LA FORME PURE-FEEDBACK
1 µ 1 ¶· ∂T −1 . ¸(l)
() − l)
× e(2
X
ξ̈1 ( t) = 1
l =0 l ∂e1
¸(l)
1 1 ∂T −1 (.)
µ ¶·
× e(2−l)
X
+
l =0 l ∂ e
1 µ 1 ¶· ∂T −1 . ¸(l)
()
× e(2−l)
X
+
l =0 l ∂ e
h ³ ´ ³ ´ i
= ϕ f ( x̄n ) + ϕ g x̄n , uθ (v) v + ϕ ḡ x̄n , uθ (v) d (v) − ϕ ẏd
· −1 ¸(1) · −1 ¸(1)
∂T (.) ∂T −1 (.) ∂T (.)
+ ė 1 + ë 1 + ė
∂e1 ∂e1 ∂e
· −1 ¸(1)
∂T −1 (.) ∂ T (. ) ∂T −1 (.)
(3.88) + × ë + ė + × ë
∂e ∂e ∂e
ξ˙i = ξ i+1
à !· ¸(l)
h ³
θ
´ ³
θ
´
(n)
i X n n ∂T −1
˙
ξn = ϕ f ( x̄n ) + g x̄n , u (v) v + ḡ x̄n , u (v) d (v) − yd + e 1 (n−l +1)
l =1 l ∂ e 1
(l) (l)
à !· à !·
n n ∂T −1 n n ∂T −1
¸ ¸
e(n−l +1) + e(n−l +1)
X X
(3.89)+
l =0 l ∂ e l =0 l ∂ e
à !
h −1
∂T (.)
i n
où , ϕ = ∂e1
,
est le coefficient binomial.
l
De manière équivalente, (3.89) peut être réécrit sous la forme compacte suivante :
h ³ ´ ³ ´ i
ξ̇ = A ξ + B ϕ f ( x̄n ) + ϕ g x̄n , uθ (v) v + ϕ ḡ x̄n , uθ (v) d (v) − ϕ yd(n) + β( Zβ )
(3.90) y = C T ξ
100
3.3. COMMANDE ADAPTATIVE POUR DES SYSTÈMES PURE-FEEDBACK
INCERTAINS AVEC DES CONTRAINTS SUR L’ENTRÉE ET LA SORTIE SANS
CONNAISSANCE SUR LA DIRECTION DE COMMANDE
à ! à ! à !
n h ∂T −1 i(l) n h ∂T −1 i(l) n h ∂T −1 i(l)
e(n−l +1) + nl=0
Pn Pn
où β Zβ = l =1 e 1 (n−l +1) + + l =0 e(n−l +1)
¡ ¢ P
∂e1 ∂e ∂e
l l l
h i
avec Zβ = x n , e, . . . ., e(n) , e, . . . .., e(n) et
0 1 0 0 0 0
0 ···
0 1 0
0
0
.. . . .. (n)×(n)
.. ∈ ℜ(n)×1 , c = ... ∈ ℜ(n)×1
A= . . . ∈ℜ , B= .
0 0 0 1 0 0
···
0 0 0 0 1 1
vecteur du gain de l’observateur, et ils sont choisis de sorte que les polynômes caractéris-
tiques de A − Bk T et A − LC T sont Hurwitz (c.-à-d., stable). Notons que ξ̃ = ξ − ξ̂, avec
ξ̂ est l’estimé du vecteur d’état ξ. Par conséquent, si l’erreur d’observation ξ̃ converge
vers zéro, l’erreur de poursuite estimée ξ̂convergera également vers zéro. Pour simplifier
la conception de la loi de commande, et selon la propriété d’approximation universelle
des réseaux de neurones, les fonctions non linéaires inconnues suivantes peuvent être
approximées comme suit :
ϕ f ( x̄n ) + β Zβ + ρ = W T S ( Z ) + ε ( Z )
¡ ¢
(3.92)
avec ρ = k T ξ̂ − ϕ yd(n) .
et
101
CHAPITRE 3. COMMANDE ADAPTATIVE NEURONALE DES SYSTÈMES NL SISO
DE LA FORME PURE-FEEDBACK
(3.94) ξ̃1 = C T ξ̃
associée à la dynamique (3.96). Maintenant, puisque H ( p) dans (3.96) n’est pas SPR en
général, on introduit un filtre passe bas L ( p) sachant que H ( p) L−1 ( p) = H ( p) est SPR.
h n o n ³ ´ o i
ξ̃1 = H ( p) L−1 ( p) L ( p) W T S ( Z ) + ϕ L ( p) g x̄n , uθ (v) v + L ( p) {ε1 }
h n o n ³ ´ o i
= H ( p) L ( p) W T S ( Z ) + ϕ L ( p) g x̄n , uθ (v) v + ε1 f
h n o n ³ ´ o i
= H ( p) L ( p) W T S ( Z ) + ϕ L ( p) g x̄n , uθ (v) v + δ
h ³ ´ i
(3.97) = H ( p) W T S ( z) + ϕ g x̄n , uθ (v) v f + δ
où
(3.98) S f ( Z ) = L ( p ) { S ( Z )}
n o
(3.99) W T S f ( z ) = L ( p ) W T S ( Z ) = W T L ( p ) { S ( Z )}
n ³ ´ o ³ ´ ³ ´
(3.100) L ( p) ϕ g x̄n , uθ (v) v = ϕ g x̄n , uθ (v) L ( p) { v} = ϕ g x̄n , uθ (v) v f
102
3.3. COMMANDE ADAPTATIVE POUR DES SYSTÈMES PURE-FEEDBACK
INCERTAINS AVEC DES CONTRAINTS SUR L’ENTRÉE ET LA SORTIE SANS
CONNAISSANCE SUR LA DIRECTION DE COMMANDE
Lorsqu’on utilise un filtre du premier ordre stable avec un gain statique unitaire, l’erreur
entre un signal et sa valeur filtrée est égale à zéro en régime établi et limitée dans le
régime transitoire, ce qui peut être très court avec un τ approprié, alors
³ ´ ³ ´
(3.101) ϕ g x̄n , uθ (v) { v − L ( p) { v}} = ϕ g x̄n , uθ (v) 4v = ε2
δ = W T S f ( Z ) − S ( Z ) + ε1 f + ε2
© ª
(3.102)
avec ε1 f = L ( p) {ε1 }.
Nous aurons besoin par la suite, dans l’analyse de la stabilité de l’hypothèse suivante :
Hypothèse 3.5. Chaque élémentδ du paramètre inconnu défini dans (3.102) est délimité
par une constante, c’est-à-dire qu’il existe une constante positive inconnue τ̄ telle que
(3.103) |δ| ≤ τ̄
Afin d’estimer en ligne le signe de gain g x̄n , uθ (v) nous allons introduire la loi de
¡ ¢
N (ζ) ξ̃1
µ µ ¶¶
T
(3.104) v= Ŵ S ( z) + τ̂tanh
ϕ ²
et
ξ̃1
µ µ ¶¶
T
(3.105) ζ̇ = ξ̃1 Ŵ S ( z) + τ̂tanh
²
où
Pour estimer les paramètres inconnus, nous adoptons les lois suivantes :
(3.107) ˙ = Γ ¡ξ̃ S ( z) − σ Ŵ ¢
Ŵ 1 1
avec Γ,γ,σ1 , σ2 sont des constantes positives. Dans ce qui suit, on montrera que tous
les signaux du système en boucle fermée sont bornés et que les erreurs de poursuite
103
CHAPITRE 3. COMMANDE ADAPTATIVE NEURONALE DES SYSTÈMES NL SISO
DE LA FORME PURE-FEEDBACK
ξ̃1 ξ̃1
· µ ¶ µ ¶ ³ ´ ¸
T T θ
ξ̃1 = H ( p) −W̃ S ( z) + Ŵ S ( z) + τ̂tanh − τ̂tanh + ϕ g x̄n , u (v) v + δ
² ²
ξ̃1 ξ̃1
· µ ¶ µ µ ¶ ¶³ ³ ´ ´ ¸
T T θ
= H ( p) −W̃ S ( z) − τ̂tanh + Ŵ S ( z) + τ̂tanh 1 + g x̄n , u (v) N (ζ) + δ
² ²
(3.109)
où W = Ŵ − W̃ .
Alors, la représentation d’états de (3.109) est donnée par :
toutes ses valeurs propres à parties réelles négatives. Par conséquent le système bouclé
sera exponentiellement stable. On lui associe une équation de Lyapunov, ayant pour
solution unique une matrice symétrique définie positive P , donnée par
(3.111) Ā T P + P Ā = −Q
(3.112) PB c = C
Théorème 3.2. Considérons le système non linéaire non affine (3.60) avec les contraints
sur l’entrée et la sortie, et supposons que les hypothèses 3.3-3.7 sont satisfaites et l’ob-
servateur (3.91). Alors la loi de commande définit par l’équation (3.104) avec les lois
d’adaptation (3.107)-(3.108) appliquée au système (3.61) garantit propriétés suivantes :
i) Tous les signaux du système en boucle fermée sont bornés ;
104
3.3. COMMANDE ADAPTATIVE POUR DES SYSTÈMES PURE-FEEDBACK
INCERTAINS AVEC DES CONTRAINTS SUR L’ENTRÉE ET LA SORTIE SANS
CONNAISSANCE SUR LA DIRECTION DE COMMANDE
ii) L’erreur de poursuite y ( t) − yd ( t) satisfait y ( t) − yd ( t) < e 1 ( t) < y ( t) − yd ( t) pour
∀t ≥ 0 .
ξ̃1 ξ̃1
³ ´ µ ¶ µ µ ¶¶
T T T T
V̇ = ξ̃ Ā P + P Ā ξ̃ + ξ̃1 [−W̃ S ( z) − τ̂tanh + Ŵ S ( z) + τ̂tanh
² ²
˙ + 1 τ̃τ̂˙
³ ³ ´ ´
(3.115) × 1 + g x̄n , uθ (v) N (ζ) + δ] + W̃ T Γ−1 Ŵ
γ
où τ̃ = τ̄ − τ̂,(et τ̂ est l’estimation du paramètre inconnu τ̄). Par substitution de (3.111)
dans (3.115), on trouve
ξ̃1 ˙ + 1 τ̃τ̂˙
³ ´ ³ ´ · µ ¶ ¸
T θ
V̇ ≤ −ξ̃ Q ξ̃ + 1 + g x̄n , u (v) N (ζ) ζ̇ − ξ̃1 τ̂tanh
(3.116) + δ + W̃ T Γ−1 Ŵ
² γ
ξ̃1 ξ̃1
µ ¶ µ ¶
˜
ξ1 δ − ξ̃1 τ̂tanh ≤ ξ̃1 τ̄ − ξ̃1 (τ̄ − τ̃)tanh
¯ ¯
¯ ¯
² ²
ξ̃1
µ ¶
≤ κτ̄ − ¯ξ̃1 ¯ τ̃tanh
¯ ¯
(3.117)
²
Après la substitution des lois d’adaptations (3.107)-(3.108) dans la dynamique (3.117),
on obtient
³ ³ ´ ´
(3.118) V̇ ≤ −ξ̃T Q ξ̃ + 1 + g x̄n , uθ (v) N (ζ) ζ̇ − σ1 W̃ T Ŵ − σ2 τ̃τ̂ + κτ̄
où
λmin (Q ) σ1 σ2 σ3 σ1 σ2
½ ¾
c 1 = min , ¢, , ; c0 = kW k2 + τ̄2 + κτ̄
λmax (P ) λmax Γ−1 γ1 γ2
¡
2 2
105
CHAPITRE 3. COMMANDE ADAPTATIVE NEURONALE DES SYSTÈMES NL SISO
DE LA FORME PURE-FEEDBACK
avec λmin (.) et λmax (.) désigne la valeur propre minimale et maximales de (.), respective-
ment.
Alors en intégrant les deux côtes de (3.121), on aura
Z t
(3.122) V ( t) ≤ c̄ 0 + e c1 t
( gN (ζ (τ)) + 1)ζ̇ (τ) e c1 τ d τ
0
1 1
· ¸
ω̇r = ρ t π R 3 C q δ, β v 2 − K t ω r − T g
¡ ¢
(3.123)
Jt 2
¢ 0.5176 116
µ ¶
C q δ, β = − 0.4β − 5 e−21δ i + 0.0068
¡
(3.124)
δ δ
avec
1 0.035
δi = − 3
δ + 0.08β β + 1
Les valeurs numériques des paramètres du modèle dans [111] sont données dans le
tableau 3.3.
106
3.3. COMMANDE ADAPTATIVE POUR DES SYSTÈMES PURE-FEEDBACK
INCERTAINS AVEC DES CONTRAINTS SUR L’ENTRÉE ET LA SORTIE SANS
CONNAISSANCE SUR LA DIRECTION DE COMMANDE
y ( t) < ω r < y ( t)
Γ 20
σ1 , σ2 0.1, 20
γ, ² 10, 0.1
N 4
Z = [ Z1 , Z2 , Z3 , Z4 ] [ x1 , x2 , v( t), u(v)]T
wr (0) 2. 4
W (0) 0
τ (0) 0
La figure 3.14 présente la sortie ωr du système éolien avec ses bornes .On peut
voir clairement que la sortie de système ωr suit sa valeur nominale désirée ωd tout en
107
CHAPITRE 3. COMMANDE ADAPTATIVE NEURONALE DES SYSTÈMES NL SISO
DE LA FORME PURE-FEEDBACK
garantissant toutes ses contraintes prédéfinies. La figure 3.15 montre que les erreurs
de poursuite convergent vers zéro. La figure 3.16 montre l’effet du contrainte de satu-
ration sur la commande (pitch angle), le système est insensible aux incertitudes et à la
saturation. Ces saturations sont nécessaires pour rendre physiquement réalisable ces
structures de commande sur des systèmes réels.
Tous les signaux du système en boucle fermée sont bornés et le signal de commande
résultant est lisse.
Pour montrer l’efficacité de la méthode proposée, les caractéristiques de performance et
la robustesse du système éolien commandé par la méthode proposée sont évaluées et
comparées avec une méthode proposée dans [111] . Dans la méthode proposé on peut
imposer une contrainte de saturation sur le signal d’entrée telle que dans la figure 3.16,
◦
soit u m = 30 . Cependant, dans [111] le signal de commande est très énergétique et il
◦
est autour de u = 43 comme montré dans la figure 10 dans [111] , donc il ne peut pas
imposer les limites dans leurs signaux de commande.
108
3.4. CONCLUSION
3.4 Conclusion
Dans ce chapitre, on a proposé deux méthodologies de synthèse de commande adapta-
tive neuronale pour une classe des systèmes SISO non linéaires pure-feedback avec la
présence de saturation sur l’entrée de commande. La stabilité des approches proposées
a été prouvé rigoureusement par la méthode de Lyapunov et les performances de la
commande ont été montré par des tests de simulations.
Dans la conception du premier schéma de commande, l’approche back-stepping,
habituellement utilisé dans la littérature, n’est plus utilisée grâce à l’introduction d’un
filtre passe bas et donc l’augmentation du système original. Ceci a permis d’éliminer le
problème de l’explosion de complexité. De plus, seul un paramètre de NNs, quel que soit
l’ordre des systèmes non linéaires saturés, sont utilisés dans la conception du contrôleur,
contrairement à la littérature où autant de NNs que l’ordre du système sont nécessaires.
Dans le deuxième schéma de commande, la même classe de systèmes non linéaires
est considérée tout en traitant la présence simultané des contraintes sur la sortie et la
saturation sur le signal de commande.
Les algorithmes de commande proposés sont considéré plus simple et peuvent gérer
une classe plus large de systèmes non linéaires saturés en entrée.
109
CHAPITRE
4
C OMMANDE ADAPTATIVE NEURONALE DES SYSTÈMES
NL MIMO PURE - FEEDBACK
Sommaire
4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
4.2 Commande adaptative neuronale d’une classe de systèmes pure-feedback
MIMO avec la contrainte de la saturation . . . . . . . . . . . . . . . . . . 114
4.2.1 Position du problème . . . . . . . . . . . . . . . . . . . . . . . . . . 114
4.2.2 La conception de la commande adaptative neuronale . . . . . . 115
4.2.3 Conception de l’observateur . . . . . . . . . . . . . . . . . . . . . . 119
4.2.4 Analyse de la stabilité . . . . . . . . . . . . . . . . . . . . . . . . . 123
4.2.5 Résultats de simulation . . . . . . . . . . . . . . . . . . . . . . . . 126
4.3 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
111
CHAPITRE 4. COMMANDE ADAPTATIVE NEURONALE DES SYSTÈMES NL MIMO
PURE-FEEDBACK
4.1 Introduction
ans la littérature, la plupart des travaux sont développés pour des systèmes non
Cependant, les approches précitées dans [29, 105, 120–123] sont basées sur le back-
stepping dans la procédure de conception des contrôleurs récursifs et des lois adaptatives.
Ceci induit à l’apparition du problème de l’explosion de complexité, nécessitant un grand
nombre de paramètres à ajuster.
112
4.1. INTRODUCTION
mique (DSC). Plusieurs techniques de commande DSC floue ont été développés pour les
systèmes non linéaires MIMO incertains par retour d’état et de sortie respectivement
dans [124, 125].
Cependant, du point de vue pratique, les méthodes développées dans [45, 124, 125]
sont couteuses en temps de calculs puisque les approximateurs neuronaux où flous sont
utilisés à chaque étape de conception pour approximer les dynamiques incertaines. De
plus, les lois d’adaptation impliquées dans DSC nécessitent un nombre important de
paramètres à mettre à jour en ligne ; ce qui rend les lois de commande ainsi que l’analyse
de stabilité plus complexes. Afin de remédier aux problèmes d’explosion de complexités,
dans [31, 88, 126–129] de nouvelles techniques de commande ont été proposés pour les
systèmes pure-feedback discrets [88], pure-feedback continus [126], pure-feedback avec
retard incertain sur l’entrée [127] et pure-feedback retard incertain sur tous les états
[128] et pour la classe strict-feedback avec zone morte sur l’entrée [31].
Tous les travaux susmentionnés ne sont pas basés sur l’approche back-stepping pour
éviter l’explosion due à la récursivité des calculs des différenciations, cependant ils
suivent des techniques similaires aux méthodologies basées sur la technique de back-
stepping avec des calculs lourds.
De plus, ces résultats sont focalisés sur les systèmes SISO et ne peuvent être généralisé
aux systèmes MIMO. L’étude des systèmes non linéaires MIMO en cascade d’ordre
supérieure est beaucoup plus compliquée en raison des interconnexions des états et des
entrées, ce qui rend la généralisation des conceptions des systèmes SISO aux systèmes
MIMO, généralement, non triviale.
Dans ce chapitre, on présentera une approche de commande sans faire recours à la
technique de back-stepping pour les systèmes non linéaires MIMO incertains sous la
forme pure-feedback avec des non-linéarités de type saturation sur l’entrée. Dans cette
approche, de nouvelles variables d’état et des transformations de coordonnées sont
introduites pour convertir le système pure-feedback originale en une forme normale. Un
observateur d’état est alors conçu pour estimer les nouveaux états indisponibles. La
connaissance à priori du signe du gain de commande n’est plus nécessaire et le problème
des dérivés circulaire est contourné en utilisant les fonctions de type Nussbaum et la
transformation d’état, respectivement. Il est démontré que l’approche de commande
proposée est plus simple et plus avantageuse que celles basée sur le back-stepping
tout en assurant de bonnes performances. La stabilité du système en boucle fermée est
assurée au sens de Lyapunov en se servant de la propriété de la positivité (SPR) des
systèmes. Les performances de poursuite du schéma de commande sont illustrées par un
113
CHAPITRE 4. COMMANDE ADAPTATIVE NEURONALE DES SYSTÈMES NL MIMO
PURE-FEEDBACK
exemple de simulation.
ẋ i1 = f¯i1 ( x i1 , x i2 ) + d i1 ( t)
ẋ i2 = f¯i2 ( x̄ i2 , x i3 ) + d i2 ( t)
......
f¯i,n i −1 x̄ i,n i + d i,n i −1 ( t)
¡ ¢
ẋ i,n i −1 =
f¯i,n i x̄ i,n i , u i (v i ) + d i,n i ( X , t)
¡ ¢
ẋ i,n i =
(4.1) yi = x i1 , i = 1, . . . N
,n
où x i = [ x i1 , x i2 , ...x i,n i ] T ∈ ℜ i , ( i = 1, . . . N ) et yi ∈ ℜ désigne le vecteur d’états et la
sortie du i i ème sous-système respectivement. X = [ x1 , x2 , ...x N ] et y = [ y1 , y2 , ...yN ] dé-
signe les états et le vecteur de sortie de l’ensemble du système x̄ i j = [ x i1 , x i2 , ...x i j ] T ∈
ℜ j , ( i = 1, . . . N ) , j = 1, 2, . . . , n i , sont des fonctions non linéaires inconnues, et d i j ( t)
et d i,n i ( X , t) dénote la perturbation externe inconnue mais bornée pour chaque sous-
système. Les non linéarités sur l’entrée u(v) = [ u 1 , u 2 , ...u N ] T incluent la saturation
sur l’entrée.
La saturation sur l’entrée u(v( t)) donnée déjà dans (2.2) est approximé de la même
manière que celle dans (2.3) et réécrite ici uniquement pour simplifier le suivi des
dérivations des équations :
114
4.2. COMMANDE ADAPTATIVE NEURONALE D’UNE CLASSE DE SYSTÈMES
PURE-FEEDBACK MIMO AVEC LA CONTRAINTE DE LA SATURATION
Pour faciliter la conception des lois de commande adaptative pour le système pure-
feedback, le système (4.1) est réécrite comme
ẋ i1 = f i1 ( x̄ i2 ) + x i2 + d i1 ( t)
ẋ i2 = f i2 ( x̄ i3 ) + x i3 + d i2 ( t)
......
¡ ¢
ẋ i,n i −1 = f i,n i −1 x̄ i,n i + x i,n i + d i,n i −1 ( t)
¡ ¢
ẋ i,n i = f i,n i x̄ i,n i , u i + u i + d i,n i ( X , t)
(4.3) yi = x i1 , i = 1, . . . N
Avec f i j x̄ i, j+1 = f¯i j x̄ i j , x i, j+1 − x i+1 et f i,n i x̄ i,n i , u i = f¯i,n i x̄ i,n i , u i (v i ) − u i . Le système
¡ ¢ ¡ ¢ ¡ ¢ ¡ ¢
(4.3) est utilisé pour concevoir l’observateur et le contrôleur dans la section suivante.
s i1 = x i1
s i, j+1 = ṡ i, j ( j = 1, 2, . . . , n i ; i = 1, 2, . . . , N )
yi = s i1 = x i1
(4.4) ṡ i1 = f i1 ( x̄ i2 ) + x i2 + d i1 ( t)
115
CHAPITRE 4. COMMANDE ADAPTATIVE NEURONALE DES SYSTÈMES NL MIMO
PURE-FEEDBACK
∂ f i1 ( x̄ i2 ) ¯¯
¯
f i1 x̄ i2 , x0i2 ( x i2 − x0i2 )
¡ ¢
(4.5) f i1 ( x̄ i2 ) = +
∂x i2
¯
x i2 = xθi2
exprimé comme
∂G i1 x i1 , xθi2 ∂G i1 x i1 , xθi2
¡ ¢ ¡ ¢
∂F i1 ( x i1 ) ³ ´
(4.7) ṡ i2 = ẋ i1 + x̄˙ i1 x i2 + ˙x̄ i2 x i2 + G i1 x i1 , xθ ẋ i2
i2
∂ x i1 ∂ x i1 ∂ x i2
∂ f i2 ( x̄ i3 ) ¯¯
¯
f i2 x̄ i2 , x0i3 ( x i3 − x0i3 )
¡ ¢
(4.8) f i2 ( x̄ i3 ) = +
∂x i3
¯
x i3 = xθi3
∂G i1 x i1 , xθi2
¡ ¢
∂F i1 ( x i1 )
ṡ i2 = ( f i1 ( x̄ i2 ) + x i2 + d i1 ( t)) + ẋ i2 ( x i2
∂ x i1 ∂ x i2
´ ∂G i1 x i1 , xθ
¡ ¢
³
+ G i1 x i1 , xθi2 ) + i2
( f i1 ( x̄ i2 ) + x i2 + d i1 ( t)) x i2
∂ x i1
³ ´
(4.9) = F i2 ( x̄ i2 ) + G i2 x̄ i2 xθi3 x i3
∂G i1 x i1 ,xθi2
¡ ¢
∂F i1 (x i1 )
où F i2 ( x̄ i2 ) = f x̄ + x + d i1 ( t)) +
∂ x i1 ( i1 ( i2 ) ¶ i2 ∂ x i1 ( f i1 ( x̄ i2 ) + x i2 + d i1 ( t)) x i2
∂G i1 x i1 ,xθi2
µ ¡ ¢
θ 0
¡ ¢ £ ¡ ¢ ¤
+ ∂ x i2
x i2 + G i1 x i1 , x i2
f i2 x̄ i2 , x i3
+ d i2 ( t ) et
∂G i1 x i1 ,xθi2
µ ¡ ¢ ¶ · ¸
∂ f i2 ( x̄ i3 ) ¯
¯
θ 0
¡ ¢
G i2 ( x̄ i3 ) = ∂ x i2
x i2 + G i1 x i1 , x i2 1 + ∂ x ¯ (1 − x i3 ) sont des fonctions
i3 x i3 = xθi3
non linéaire inconnus de x i1 ∈ ℜ1 , x i1 , xθi2 ∈ ℜ2 , respectivement.
£ ¤
116
4.2. COMMANDE ADAPTATIVE NEURONALE D’UNE CLASSE DE SYSTÈMES
PURE-FEEDBACK MIMO AVEC LA CONTRAINTE DE LA SATURATION
De même, selon le théorème de la valeur moyenne, il existe des θ ∈ (0, 1) satisfaisant que
´ ∂ f x̄
¡ ¢¯
ij i, j +1 ¯¯
³
0
( x i, j+1 − x0i, j+1 )
¡ ¢
(4.12) f i, j x̄ i j , x i, j+1 = f i j x̄ i j , x i, j+1 +
∂ x i, j+1 ¯
x i, j+1 = xθ i, j +1
où
¡ ¢ P j−1 ∂F ( x̄ ) ¡ ¡ ¢ P j−1 ∂G ( x̄ )
F i j x̄ i j = k=1 i, j−∂1x i, j−1 f ik x̄ i,k+1 + x i,k+1 + d ik ( t) + k=1 i,∂j−x1 i j
¢
ik ik
117
CHAPITRE 4. COMMANDE ADAPTATIVE NEURONALE DES SYSTÈMES NL MIMO
PURE-FEEDBACK
∂G i, j−1 ( x̄ i j )
³ ³ ´´ h ³ ´ i
θ 0
¡ ¡ ¢ ¢
f ik x̄ i,k+1 + x i,k+1 + d ik ( t) x i j + ∂x
x ij + G i, j −1 x̄ x
i j i, j +1 f ij x̄ , x
i j i, j +1 + d ij ( t )
ij
et ´´ · ¸
∂G i, j −1( x̄ i j ) ∂ f i j ( x̄ i, j+1 ) ¯
³ ³ ¯
x i j + G i, j−1 x̄ i j xθi, j+1 (1 − x0i, j+1 ) + 1
¡ ¢
G i j x̄ i j = ∂xi j ∂ x i, j+1 ¯ x
sont des
h i i, j +1 =θ .x i, j +1
Donc, pour le i ème sous-système, sur la base de l’analyse ci-dessus et du calcul concret
et de la redéfinition de chaque nouvelle variable, pour j = 1, 2, . . . , n i , nous décrivons le
système pure-feedback (4.1) sous la forme normale suivante par rapport au nouveau
£ ¤T
vecteur de variable d’état s i = s i1 , s i2 , . . . , s i,n i . Par conséquent,
ṡ i1 = s i2
ṡ i2 = s i3
......
ṡ i,n i −1 = s i,n i
³ ´
F in i x̄ i,n i + G in i x̄ in i , uθi ( t) u i ( t)
¡ ¢
ṡ i,n i =
³ ´
(4.15) = F i ( x i ) + G i x i , uθi ( t) u i ( t)
118
4.2. COMMANDE ADAPTATIVE NEURONALE D’UNE CLASSE DE SYSTÈMES
PURE-FEEDBACK MIMO AVEC LA CONTRAINTE DE LA SATURATION
(4.16) e i ( t) = yi ( t) − yid ( t)
(n −1) T
h i
Et le vecteur de l’erreur de poursuite e i comme e i ( t) = s i − yid = e i , ė i , . . . , e i i
(n i −1) T
h i
= s i1 − yid , s i2 − ẏid , . . . , s i,n i − yid .
(n )
Rappelant (4.15), en soustrayant yid i des deux côtés, on obtient
(n i ) (n i ) (n ) (n )
(4.17) ei = yi − yid i = F i ( x i ) + G i ( x i ) ( g (v i ) + d (v i )) − yid i
De manière équivalente, (4.17) peut L̂etre réécrite sous la forme compacte suivante :
h i
(n )
ė i = A i e i + B i F i ( x i ) + G i ( x i ) ( g (v i ) + d (v i )) − yid i
(4.18) yi = C T
i ei
où
0 1 0 0 0 0
···
0 0 1 0
0
0
.. .. .. ∈ ℜn×n , B i = ... ∈ ℜn×1 , c i = ... ∈ ℜn×1
Ai =
. . .
0 0 0 1
0 0
···
0 0 0 0 1 1
119
CHAPITRE 4. COMMANDE ADAPTATIVE NEURONALE DES SYSTÈMES NL MIMO
PURE-FEEDBACK
n ¤T n ¤T
où k ic = k1ic , k2ic , . . . , k ici , k i0 = k1i0 , k2i0 , . . . , k i0i
£ £
sont le vecteur du gain de retour
d’état est le vecteur du gain d’observateur, respectivement, et qui sont choisis de sorte
que les polynômes caractéristiques de A i − B i k Tic et A i − k i0 C T
¡ ¢ ¡ ¢
i soient Hurwitz (c.-à-d.
stable). Notez que ẽ i = e i − ê i , avec ê i est l’estimé du vecteur d’état e i . Par conséquent, si
l’erreur d’observation ẽ i converge vers zéro, l’erreur de poursuite estiméée ê i convergera
également vers zéro.
Pour faciliter la conception de la commande, et selon la propriété d’approximation
universelle des réseaux de neurones, les fonctions non linéaires inconnues suivantes
peuvent être approximées comme suit :
(n )
(4.20) F i ( x i ) + k Ti ê i − yid i = WiT S i ( Z i ) + ε i ( Z i )
et
(n ) T
où ΩWi est l’espace de contraintes de Wi , Z i = [ x i , yid i ] le vecteur d’entrée du réseau
et S i (.) est le vecteur de fonction d’activation neuronale supposé convenablement fixé
à l’avance par l’utilisateur, Wi est le paramètre idéal d’approximation avec l’erreur
neuronale ε i ( Z ) .
’Etant Wi est inconnu, sa valeur estimé Ŵi sera utilisée. En soustrayant (4.18) de (4.19),
on obtient la dynamique suivante pour l’erreur d’observation :
³ ´ h ³ ´ i
θ (n i )
ẽ˙ i = A i − k i0 C T
i e
e i + B i F x
i( i ) + G i x i , u t g v
i ( ) ( ( i) + d v
( i )) + k T
ê
i i − yid
(4.22)ẽ i = C T ẽ i
Notons 4 u i = g (v i ) − v i , on aura :
³ ´ h ³ ´ ³ ´ i
θ θ
ẽ˙ i = A i − k i0 C T i ẽ i + B i Wi
T
S i ( Z i ) + ε1i + G i x i , u i ( t ) v i + G i x i , u i ( t ) 4 u i
ẽ i = C T ee i
(4.24)
120
4.2. COMMANDE ADAPTATIVE NEURONALE D’UNE CLASSE DE SYSTÈMES
PURE-FEEDBACK MIMO AVEC LA CONTRAINTE DE LA SATURATION
où
n o
(4.27) WiT S i f ( Z i ) = L i ( p) WiT S i ( Z i ) = WiT L i ( p) {S i ( Z i )}
(4.28) ε i f = L i ( p) {ε1i }
δ i = WiT S i f ( Z i ) − S i ( Z i ) + ε i f
© ª
(4.29)
n ³ ´ o ³ ´ ³ ´
(4.30) L i ( p) G i x i , uθi ( t) v i = G i x i , uθi ( t) L ( p) {v i } = G i x i , uθi ( t) v i f ( t)
i
n ³ ´ o ³ ´ ³ ´
θ θ θ
(4.31) L i ( p) G i x i , u i ( t) 4 u i = G i x i , u i ( t) L ( p) {4 u i } = G i x i , u i ( t) 4 u i f
i
dans la dynamique des erreurs rend la conception du système de contrôle très difficile.
Pour faciliter la tâche de ce travail, l’hypothèse suivante est faite.
Hypothèse 4.1. [130] Le filtre SPR L−i 1 ( p) est choisi tel que L i ( p) {v i } = v i f ∼ = v i et
∼ θ θ
¡ ¢ © ¡ ¢ ª
L i ( p) {4 u i } = 4 u i f = 4 u i doncG i x i , u ( t) v i − L i ( p) G i x i , u ( t) v i = 0 et
i i
³ ´ n ³ ´ o
G i x i , uθi ( t) 4 u i − L i ( p) G i x i , uθi ( t) 4 u i = 0
121
CHAPITRE 4. COMMANDE ADAPTATIVE NEURONALE DES SYSTÈMES NL MIMO
PURE-FEEDBACK
Hypothèse 4.2. Chaque élément δ i du paramètre inconnu défini dans (4.29) est délimité
par une constante, c’est-à-dire qu’il existe une constante positive inconnue τ i telle que
(4.32) |δ i | ≤ τ i
Hypothèse 4.3. Le gain de commande G i (.) et son signe est inconnu, et il existe des
constantes positives inconnues g et g telle que g ≤ |G i (.)| ≤ g .
Afin d’estimer en ligne le signe de gain G i x i , uθi ( t) nous allons introduire la loi de
¡ ¢
ẽ i
µ µ ¶ ¶
T
(4.33) v i = N (ζ i ) Ŵ S i ( Z i ) + τ̂ i tanh − αi ψi
²i
g| ẽ i 4 u i |+0.54 u2i
−k ψ − ψi + 4u i si ¯ψ i ¯ > µ i,0
¯ ¯
ie i ψ2i
(4.34) ψ̇ i =
si ¯ψ i ¯ < µ i,0
¯ ¯
0
ẽ i
µ µ ¶ ¶
T
(4.35) ζ̇ i = ẽ i Ŵi S i ( Z i ) + τ̂ i tanh − αi ψi
²i
où
Pour estimer les paramètres inconnus, nous adoptons les lois suivantes :
(4.37) ˙ = Γ ( ẽ S ( Z ) − σ Ŵ )
Ŵ i i i i i i1 i
˙τ̂ i = γ i [ ẽ i tanh ẽ i − σ i2 τ̂ i ]
µ ¶
(4.38)
²i
122
4.2. COMMANDE ADAPTATIVE NEURONALE D’UNE CLASSE DE SYSTÈMES
PURE-FEEDBACK MIMO AVEC LA CONTRAINTE DE LA SATURATION
on obtient
ẽ i
µ ¶
ẽ i = H i ( p) [−W̃iT S i ( Z i ) + ŴiT S i ( Z i ) + τ̂ i tanh
²i
ẽ i
µ ¶
− τ̂ i tanh + αi ψi − αi ψi
²i
³ ´
+ G i x i , uθi ( t) v i ( t) + G i 4 u i + δ i ]
ẽ i
µ ¶
T
= H i ( p) [−W̃i S i ( Z i ) − τ̂ i tanh + αi ψi
²i
ẽ i
µ µ ¶ ¶
+ ŴiT S i ( Z i ) + τ̂ i tanh − αi ψi
²i
³ ³ ´ ´
(4.39) × 1 + G i x i , uθi ( t) N (ζ i ) + G i 4 u i + δ i ]
où Wi = Ŵi − W̃i .
La représentation d’états de (4.39) est donnée comme suit
ẽ i
µ ¶
ẽ˙ i = A i ẽ i + B ic [−W̃iT S i ( Z i ) − τ̂ i tanh + αi ψi
²
¶i
ẽ i
µ µ ¶
T
+ Ŵi S i ( Z i ) + τ̂ i tanh − αi ψi
²i
³ ³ ´ ´
− 1 + G i x i , uθi ( t) N (ζ i ) + δ i + G i 4 u i ]
(4.40) ẽ i = C T
i ẽ i
¤T
avec A i = A i − k i0 C T
¡ ¢ £
i est stable et B ic = 1, b i1 , b i2 , . . . , b in i
. On lui associe une
équation de Lyapunov, ayant pour solution unique une matrice symétrique définie
positive P i , donnée par :
T
(4.41) A i Pi + Pi A i + Ci CT
i = −Q i
(4.42) P i B ic = C T
i
(4.43) ẽ Ti P i B ic = ẽ Ti C i = ẽ i
123
CHAPITRE 4. COMMANDE ADAPTATIVE NEURONALE DES SYSTÈMES NL MIMO
PURE-FEEDBACK
Théorème 4.1. Considérons le système non linéaire non affine (4.1) avec les contraintes
sur l’entrée et la sortie, et supposons que les hypothèses 4.1-4.3 sont satisfaites et consi-
dérant l’observateur (4.19). Alors la loi de commande définie par l’équation (4.33) avec
les lois d’adaptation (4.37)-(4.38) appliquées au système (4.1) garantie les propriétés
suivantes :
i) Tous les signaux du système en boucle fermée sont bornés.
(4.45) ˙ + 1 τ̃ τ̂˙ + ψ ψ̇
+ W̃iT Γ−i 1 Ŵ i i i i i
γi
où τ̃ i = τ i − τ̂ i ,(et τ̂ i est l’estimation du paramètre inconnu τ i ).
Par substitution de (4.41) et le système auxiliaire dans (4.45), on trouve
1 ³ ´ ³ ³
θ
´ ´
V̇i ≤ − ẽ Ti Q i + C i C T i ẽ i + 1 + G i x i , u i ( t ) N ( ζ i ζ̇ i
)
2·
ẽ i
µ ¶ ¸
− ẽ i −τ̂ i tanh + δ i + ẽ i α i ψ i + ẽ i G i 4 u i
²i
˙ + 1 τ̃ τ̂˙
³ ´
+ W̃iT − ẽ i S i ( Z i ) + Γ−i 1 Ŵ i i i
γi
(4.46) − k ie ψ2i − g | ẽ i 4 u i | − 0.54 u2i + ψ i 4 u i
124
4.2. COMMANDE ADAPTATIVE NEURONALE D’UNE CLASSE DE SYSTÈMES
PURE-FEEDBACK MIMO AVEC LA CONTRAINTE DE LA SATURATION
1 T αi 1 2
µ ¶
V̇i ≤ − ẽ i Q i ẽ i − k ie − − ψ
2 2 2 i
³ ³ ´ ´
+ 1 + G i x i , uθi ( t) N (ζ i ) ζ̇ i
(4.51) − σ i1 W̃iT Ŵi − σ i2 τ̃ i τ̂ i + κτ i
αi
où le paramètre k ie est choisi pour satisfaire la condition k ie − 2 − 21 > 0.
En utilisant les inégalités suivantes,
σ i1 σ i1 °
°W̃i °2
−σ i1 W̃iT Ŵi ≤ kWi k2 −
°
(4.52)
2 2
σ i2 2 σ i2 2
(4.53) σ i2 τ̃ i τ̂ i ≤ − τ̃ + τ
2 2 2 2
1 T αi 1 2 ³
µ ¶ ³ ´ ´
V̇i ≤ − ẽ i Q i ẽ i − k ie − − ψ i + 1 + G i x i , uθi ( t) N (ζ i ) ζ̇ i
2 2 2
σ i1 ° °2 σ i2 2 σ i1 σ i2 2
− °W̃i ° − τ̃2 + kWi k2 + τ2 + κτ i
2 2³ ³2 ´ 2 ´
(4.54) ≤ − c i1 Vi + c i0 + 1 + G i x i , uθi ( t) N (ζ i ) ζ̇ i
où ( ¶)
λmin (Q i ) σ i1 αi 1
µ
c i1 = min , ¢ , σ i2 γ i , k ie − − ,
λmax (P i ) λmax Γi
−1
¡
2 2
σ i1 σ i2
c i0 = kWi k2 + τ22 + κτ i
2 2
avec λmin (.) et λmax (.) désignent la valeur propre minimale et maximale de (.), respecti-
vement. Alors on intégrant les deux côtés de (4.54), on aura
Z t³ ³ ´ ´
(4.55) Vi ( t) ≤ c0 + e c1 t 1 + G i x i , uθi ( t) N (ζ i (τ)) ζ̇ i (τ) e c1 τ d τ
0
125
CHAPITRE 4. COMMANDE ADAPTATIVE NEURONALE DES SYSTÈMES NL MIMO
PURE-FEEDBACK
où
I y−I z Ir kϕ I z −I x Jr kθ I x−I y
a1 = I x , a2 = I x , a3 = I x , a4 = I y , a5 = I y , a6 = I y , a7 = I z
kψ
a 8 = I z , b 1 = Idx , b 2 = Idy , b 3 = I1z , Ωr = w1 − w2 + w3 − w4
Les définitions de toutes les constantes et les paramètres du modéle quadrirotor sont
répertoriées dans le tableau 4.1. La commande d’entrée du système est sélectionnée
comme suit :
¡ 2 2
¢
u ϕ = b ¡w4 − w2 ¢
(4.57) u θ = b w32 − w12
u = κ ¡ w2 − w2 + w2 − w2 ¢
ψ 1 2 3 4
126
4.2. COMMANDE ADAPTATIVE NEURONALE D’UNE CLASSE DE SYSTÈMES
PURE-FEEDBACK MIMO AVEC LA CONTRAINTE DE LA SATURATION
¢T
= diag (a 3 , a 6 , a 8 ) η̇ air
¡
(4.58) d ϕ̇ ( t) , d θ̇ ( t) , d ψ̇ ( t)
¢T
avec η̇ air = ϕ̇air , θ̇air , ψ̇air représente la perturbation du vent définie par la vitesse de
¡
rotation de l’air. D’ailleurs, cette perturbation est modalisée par un signale quarré avec
une vitesse de rotation ±(30, 45, 60)T de g/ s, avec une fréquence de 0.1 HZ . Cependant,
¤T
l’objectif de la commande est de forcer les angles de roulis, tangage et lacet y1 = ϕ, θ , ψ
£
¤T
pour suivre une trajectoire désiré yd = ϕd , θd , ψd = [sin( t), sin( t), sin( t)]T tout en ga-
£
127
CHAPITRE 4. COMMANDE ADAPTATIVE NEURONALE DES SYSTÈMES NL MIMO
PURE-FEEDBACK
d 25 cm
Jr 2.8 ∗ 10−5 k g m2
I x, I y 3.82 ∗ 10−3 k g m2
Iz 7.13 ∗ 10−3 k g m2
kϕ , kθ 5.56 ∗ 10−3 N m s/ rad
kψ 6.35 ∗ 10−3 N m s/ rad
d 2.98 ∗ 10−5 N s2 / rad 2
κ 3.23 ∗ 10−7 N s2 / rad 2
Les figures 4.1-4.4 illustrent les résultats de simulation du quadrirotor. Ces résultats
montrent que les performances de poursuite sont suffisamment bonnes et tous les signaux
du système en boucle fermée sont bornés. On peut voir dans la figure 4.1 (a) (b) (c) que la
sortie ϕ, θ , ψ suit sa référence ϕd , θd , ψd avec précision. La figure 4.2 (a) (b)(c) montre
¡ ¢ ¡ ¢
que les erreurs de poursuite convergent vers zéro. La figure 4.3 (a)(b)(c) montre l’effet du
contrainte de saturation sur les commandes de système est insensible aux incertitudes et
à la saturation. Ces saturations sont nécessaires pour rendre physiquement réalisable ces
structures de commande sur des systèmes réels. La figure 4.4 montre que les trajectoires
des nouveaux états avec leurs estimations, on remarque clairement que l’observateur
arrive à estimer correctement les états non mesurés.
128
4.2. COMMANDE ADAPTATIVE NEURONALE D’UNE CLASSE DE SYSTÈMES
PURE-FEEDBACK MIMO AVEC LA CONTRAINTE DE LA SATURATION
(a) (b)
(c)
(a) (b)
(c)
129
CHAPITRE 4. COMMANDE ADAPTATIVE NEURONALE DES SYSTÈMES NL MIMO
PURE-FEEDBACK
(a)
(b)
(c)
130
4.3. CONCLUSION
(a) (b)
(c) (d)
(e) (f)
F IGURE 4.4: L’erreur de poursuite du systè transformé et son estimation : Réel (ligne
rouge) ; Estimé (ligne blue)
4.3 Conclusion
Dans ce chapitre, nous avons proposé et développé une commande adaptative neuro-
nale pour une classe de systèmes non linéaires MIMO sous la forme pure-feedback avec
une contrainte de la saturation sur l’entrée et en présence de perturbations externes.
Pour ce faire, nous avons introduit des transformations de coordonnées pour convertir la
commande par retour d’état en une commande par retour de sortie. Puis, un observateur,
basé sur la positivité (SPR) des systèmes, est adopté pour estimer les états inconnus
du nouveau système canonique. Dans l’approche proposée, le problème de l’explosion de
complexité est complètement évité en se passant d’utiliser la technique de back-stepping.
La stabilité de la boucle fermée a été analysée dans le sens de Lyapunov. Les résultats de
simulation obtenus pour l’ exemple proposé montre de bonne performance de poursuite
et de robustesse.
131
C ONCLUSION GÉNÉRALE
133
CONCLUSION GÉNÉRALE
134
CONCLUSION GÉNÉRALE
135
B IBLIOGRAPHIE
137
BIBLIOGRAPHIE
[11] L PAQUIN :
Application du backstepping a une colonne de flottation.
2001.
138
BIBLIOGRAPHIE
[18] JK H EDRICK et PP Y IP :
Multiple sliding surface control : theory and application.
Journal of dynamic systems, measurement, and control, 122(4):586–593, 2000.
139
BIBLIOGRAPHIE
140
BIBLIOGRAPHIE
Adaptive neural control of uncertain mimo nonlinear systems with state and input
constraints.
IEEE transactions on neural networks and learning systems, 28(6):1318–1330,
2016.
[40] DongJuan L I :
Adaptive neural network control for a class of continuous stirred tank reactor
systems.
Science China Information Sciences, 57(10):1–8, 2014.
[42] W LI :
Adaptive fuzzy systems and control, design and stability analysis, 2000.
141
BIBLIOGRAPHIE
[43] TS L I, ZJ Z OU et WL L UO :
Dsc-backstepping based robust adaptive nn control for nonlinear systems.
Acta Autom. Sin, 34(11):1424–1430, 2008.
142
BIBLIOGRAPHIE
143
BIBLIOGRAPHIE
144
BIBLIOGRAPHIE
145
BIBLIOGRAPHIE
Adaptive neural control for a class of time-delay systems in the presence of back-
lash or dead-zone non-linearity.
IET Control Theory & Applications, 8(11):1009–1022, 2014.
146
BIBLIOGRAPHIE
147
BIBLIOGRAPHIE
148
BIBLIOGRAPHIE
149
BIBLIOGRAPHIE
[114] Wenchao M ENG, Qinmin YANG, You Y ING, Yong S UN, Zaiyue YANG et Youxian
S UN :
150
BIBLIOGRAPHIE
151
BIBLIOGRAPHIE
152
BIBLIOGRAPHIE
[135] Zongyu Z UO :
Adaptive trajectory tracking control design with command filtered compensation
for a quadrotor.
Journal of Vibration and Control, 19(1):94–108, 2013.
153
BIBLIOGRAPHIE
155