Cours de Théorie de la commande
Chapitre 2 : Commande Adaptative
I. Principes et bases de la commande adaptative
I.1. Définition
La commande adaptative désigne un ensemble de méthodes permettant un ajustement
automatique, en temps réel, des paramètres des régulateurs mis en œuvre dans une boucle de
commande afin de réaliser ou de maintenir un niveau de performance désiré lorsque les
paramètres du processus sont inconnus ou varient dans le temps.
A la question "quand faut-il utiliser la commande adaptative ?", on peut répondre comme
suit :
– quand c'est techniquement nécessaire,
– quand c'est économiquement rentable.
I.2. Similarités et différences avec la commande classique à contre
réaction
On peut distinguer deux types de perturbations : les perturbations qui agissent sur les
variables à réguler et celles, dites paramétriques, agissant sur les performances du système de
commande.
La contre réaction classique est essentiellement utilisée pour réduire ou éliminer le premier
type de perturbations. Ainsi le schéma de la figure II.1 est utilisé. perturbations
consigne erreur commande variable à
R(p) G(p) réguler
Figure II.1
Une approche, conceptuellement similaire, peut être considérée pour maintenir les
performances d'un système de commande en présence de perturbations paramétriques :
Il faut, dans un premier temps, définir un indice de performance (IP), le mesurer et le
comparer à un IP désiré. L'écart obtenu sera traité par un mécanisme d'adaptation dont la
sortie va agir sur les paramètres du régulateur : c'est la commande adaptative.
Le principe est résumé sur la figure II.2.
consigne Régulateur variable à
Ajustable Procédé
réguler
IP désiré
Mécanisme
Figure 2 Mesure de
Comparaison l'IP
d'adaptation
Figure II.2
Chapitre II -1- M. GASMI
Cours de Théorie de la commande
I.3. Techniques de la commande adaptative
Il existe plusieurs types de schémas destinés à assurer des performances acceptables quand les
paramètres du procédé sont inconnus ou varient dans le temps, mais seuls ceux possédant une
boucle de contre réaction sur la mesure de performances sont réellement des schémas de
commande adaptative.
Par exemple, les systèmes des régulateurs à gains programmés, figure II.3, dont lesquels on
suppose l'existence d'une relation très rigide entre le procédé et son environnement, sont dits
des systèmes de commande adaptative en boucle ouverte.
Environnement
Régulateur
Procédé
Ajustable
Mécanisme Mesure de
d'adaptation l'environnement
Figure II.3
On entend par relation rigide, une relation physique où on dresse un tableau entre les valeurs
de l'entrée et de la sortie. A chaque variation de l'entrée, on n'a pas besoin de mesurer la
sortie, il suffit de lire sa valeur dans un tableau ; à titre d'exemple, on sait que la valeur de la
résistance est liée à celle de la température à travers une relation physique connue. De ce fait,
la mesure de la température suffit pour connaître celle de la résistance. Cette technique est
utilisée dans le pilotage automatique des avions et des navires.
En général, deux approches ont été essentiellement considérées pour le développement des
systèmes de commande adaptative destinés à la régulation des procédés à paramètres
inconnus et / ou variables dans le temps : la commande adaptative directe et celle indirecte.
I.3.1. Commande adaptative directe
Dans ce type de commande, figure II.4, les paramètres du régulateur sont directement ajustés,
en temps réel, à partir de mesures d'erreur de performances (exemple : commande adaptative
à modèle de référence) ; l'indice de performance étant la différence entre les sorties du
procédé et du modèle de référence.
Mécanisme
d'adaptation
Régulateur
Ajustable Procédé
Modèle de référence
Figure II.4
Chapitre II -2- M. GASMI
Cours de Théorie de la commande
I.3.2. Commande adaptative indirecte
Dans ce type de commande, l'ajustement des paramètres du régulateur est réalisé en deux
étapes :
– estimation des paramètres du modèle du procédé,
– calcul des paramètres du régulateur à partir des paramètres estimés.
La figure II.5 montre le schéma de principe ; (exemple : régulateurs auto ajustables) ; l'indice
de performance est la valeur du critère d'estimation des paramètres.
Mécanisme Estimation des
d'adaptation paramètres
Régulateur
Procédé
Ajustable
Figure II.5
Remarques :
– Le développement de ces techniques repose sur l'hypothèse fondamentale suivante :
pour toutes les valeurs possibles des paramètres du procédé, on suppose qu'il existe un
régulateur de structure donnée pouvant assurer la réalisation des performances désirées. Le
rôle de la boucle d'adaptation est uniquement limité à trouver les bonnes valeurs des
paramètres de ce régulateur dans chaque cas.
– A cause de la présence de la boucle d'adaptation, les systèmes de commande adaptative
sont des systèmes non linéaires ce qui explique les difficultés d'analyse et de synthèse de
tels systèmes.
I.4. Stratégies de commande adaptative
Deux stratégies sont étudiées : la poursuite et la régulation adaptatives à objectifs
indépendants (commande adaptative directe) et le placement de pôles adaptatif (commande
adaptative indirecte). Elles seront détaillées, par la suite, en utilisant l'exemple suivant :
Soit le système échantillonné de la figure II.6.
Te
u y
B0 H(p)
Figure II.6
La fonction de transfert H(p) du système est donnée par la relation :
K e− p
H(p) = , avec : = d Te + L tels que : d N et 0 < L < Te.
1+ Tp
z − d (b1 z −1 + b 2 z −2 )
Il vient la fonction de transfert discrète : H(z −1) =
1 + a1 z −1
Les coefficients sont donnés par les expressions suivantes :
T (L − Te ) T L
− e − e −
a1 = e T , b1 = K[1 − e T ] et b2 = K e T [e T − 1]
Chapitre II -3- M. GASMI
Cours de Théorie de la commande
On voit que si :
i/ L = 0, alors on aura : b 2 = 0
ii/ L = T, alors on aura : b1 = 0
Donc, on conclut que L est un retard fractionnaire ajouté pour introduire un zéro dans la
fonction de transfert H(z −1 ) .
Pour toute la suite, on va adopter les deux hypothèses suivantes :
i/ < Te d = 0,
b2
ii/ 1 le zéro de H(z −1 ) est stable.
b1
La fonction de transfert correspondante est donc réduite à la forme :
y(z) b1 z −1 + b2 z −2
=
u(z) 1 + a1 z −1
Elle correspond à l'équation de récurrence suivante :
y(t + 1) = − a1 y(t) + b1 u(t) + b 2 u(t − 1)
Pour simplifier la présentation dans ce cours, on va introduire une écriture qui regroupe les
représentations temporelle et fréquentielle ; elle se présente comme suit : y(t) = q–d y(t + d)
L'opérateur q est équivalent à z lorsque les paramètres de la fonction de transfert sont
constants.
I.4.1. Poursuite et régulation adaptatives à objectifs indépendants
Cette stratégie correspond à une commande adaptative directe. La procédure à suivre est de
commencer par trouver la loi de commande, en supposant que les paramètres du processus
sont connus, et ensuite développer celle trouvée pour une éventuelle commande adaptative.
a°/ Loi de commande (paramètres connus)
La structure du système bouclé est donnée par la figure II.7.
r(t) Bm y*(t+d+1) 1 y(t)
q −d
u(t) B
T=P
Am S A
HBF
Figure II.7
Chapitre II -4- M. GASMI
Cours de Théorie de la commande
Bm et Am représentent le modèle à poursuivre ; il vient la fonction de transfert HBF suivante :
B1
q −d
q −d B
H BF (q −1) = AS =
−d
R AS + q BR
B1
1+ q −d
AS
q − (d +1) B*
On pose : B = q–1 B* , ce qui donne : H BF (q −1) =
AS + q − (d +1) B* R
ou encore : S = S' B* , on obtient après simplification de B* :
q − (d +1) q − (d +1)
H BF (q −1) = =
AS' + q − (d +1) R P(q −1)
où : P(q–1) représente le polynôme désiré.
Bien sûr la simplification n'est possible que lorsque tous les zéros de la fonction de transfert
sont stables.
On choisit, à présent : T(q–1) = P(q–1), ce qui conduit à : HBF (q−1) = q − (d +1)
Exemple :
On revient à l'exemple où on a :
d = 0, A = 1 + a1 z −1 et B* = b1 + b2 z −1
On choisit : P = 1 + p1 z −1
Pour calculer les polynômes S' et R, on devrait résoudre l'équation polynômiale :
(1 + a1 z−1) S' + z −1 R = 1 + p1 z −1
qui est une équation régulière ; ce qui donne :
S' = 1 – 1 = 0 S' = 1 (il doit être monique) S(z−1) = B* S' = b1 + b2 z −1
R = 1 – 1 = 0 R = r0
Pour calculer r0 , on procède, par identification, dans l'équation suivante :
1 (1 + a1 z−1) + z−1 r0 = 1 + p1 z −1 r0 = p1 − a1 R(z −1) = p1 − a1
Revenons au cas général, pour d = 0, on a le schéma blocs de la figure II.8.
y*(t+1) 1 u(t) B y(t)
T=P
S A
Figure II.8
Bm (q −1)
D'après ce schéma, et avec : y*(t+1) = r(t) , il vient :
A m (q −1)
Chapitre II -5- M. GASMI
Cours de Théorie de la commande
R T
u(t) = – y(t) + y*(t+1)
S S
ou encore :
S(q–1) u(t) + R(q–1) y(t) = T(q–1) y*(t+1) = P(q–1) y*(t+1)
Ce qui donne si on remplace S et R par les expressions trouvées dans l'exemple :
b1 u(t) + b2 u(t – 1) + r0 y(t) = P(q–1) y*(t+1)
qui peut s'écrire sous la forme : P(q–1) y*(t+1) = T. (t)
avec : T = [b1 b2 r0] et (t) = [u(t) u(t – 1) y(t)]T
La fonction de transfert, entre la consigne r(t) et la sortie y(t), qui définit le comportement en
B (q −1)
poursuite, est exprimée par : q − (d +1) m .
A m (q −1)
Le choix des pôles du système en boucle fermée P(q–1) détermine le comportement en
régulation.
On définit, à présent, une erreur °(t) donnée par l'expression :
°(t) = P y(t) – q– (d+1) P y*(t+d+1) = P [y(t) – y*(t)]
La condition : °(t) = 0 conduit à : y(t) = y*(t)
L'erreur °(t) peut être utilisée donc comme un indice de performance (IP) pour l'adaptation
des paramètres du régulateur.
La stratégie de la poursuite et la régulation à objectifs indépendants aura alors pour but :
"Calculer u(t) pour minimiser le critère quadratique : J(t+1) = [°(t+1)]2".
En développant °(t+1), on obtient : J(t+1) = { P [y(t+1) – y*(t+1)] }2
D'un autre côté, avec : d = 0, on a :
P(q–1) = A(q–1) S'(q–1) + q–1 R(q–1)
En la multipliant à droite et à gauche par le terme y(t+1), elle devient :
P(q–1) y(t+1) = A(q–1) y(t+1) S'(q–1) + q–1 y(t+1) R(q–1) (II.1)
Or, on a, pour le processus, la relation suivante :
A(q–1) y(t) = B(q–1) u(t) = q–1 B*(q–1) u(t) = B*(q–1) u(t–1)
Ce qui donne :
A(q–1) y(t+1) = B*(q–1) u(t)
Chapitre II -6- M. GASMI
Cours de Théorie de la commande
La relation (II.1) devient alors :
P(q–1) y(t+1) = B*(q–1) S'(q–1) u(t) + R(q–1) y(t) = S(q–1) u(t) + R(q–1) y(t)
et le critère s'écrit alors sous la forme :
J(t+1) = { S(q–1) u(t) + R(q–1) y(t) – P y*(t+1)] }2
ou encore en remplaçant S et R par leurs expressions :
J(t+1) = { b1 u(t) + b2 u(t – 1) + r0 y(t) – P y*(t+1)] }2
J(t + 1)
La minimisation du critère implique la condition suivante : =0
u(t) u(t) = u
opt
ce qui donne :
J(t + 1)
= 2 b1{ b1 u(t) + b2 u(t – 1) + r0 y(t) – P y*(t+1)] } = 0
u(t)
Ce qui correspond à la condition : b1 u(t) + b2 u(t – 1) + r0 y(t) = P(q–1) y*(t+1)
qui n'est autre que la condition déjà trouvée pour assurer la poursuite.
b°/ Commande adaptative
Elle correspond au cas où les paramètres : a1 , b1 et b 2 sont inconnus.
L'objectif, à présent, est de minimiser le critère J(t+1) pour avoir :
lim 0 (t + 1) = lim P(q −1) [y(t + 1) − y * (t + 1)] = 0
t → t →
Dans le cas adaptatif, on maintient la même structure du régulateur (pour les paramètres
connus) mais on remplace les paramètres fixes par des paramètres ajustables. Ainsi, l'équation
du régulateur ajustable se présente sous la forme :
b̂1(t) u(t) + b̂ 2 (t) u(t – 1) + r̂0 (t) y(t) = P y*(t+1)
qu'on peut écrire comme suit : P(q–1) y*(t+1) = ˆ T (t) . (t)
avec : ˆ T (t) = [ b̂1(t) b̂ 2 (t) r̂0 (t) ], le vecteur des paramètres estimés, à l'instant t, du
régulateur et (t) = [u(t) u(t – 1) y(t)]T, le vecteur des mesures au même instant.
L'étape suivante, dans la synthèse de commande adaptative, sera la détermination d'un
algorithme d'adaptation récursif du vecteur des paramètres du régulateur ajustable ˆ (t) qui
pourra être implanté en temps réel. On peut choisir, dans ce sens et à titre d'exemple,
l'algorithme du gradient ou celui des moindres carrés récursifs (voir cours de MIE en classe
de IIA3).
Chapitre II -7- M. GASMI
Cours de Théorie de la commande
I.4.2. Placement adaptatif de pôles
Cette stratégie correspond à une commande adaptative indirecte.
a°/ Loi de commande (paramètres connus)
On a vu que la stratégie précédente, celle de poursuite et régulation à objectifs indépendants,
ne peut s'appliquer qu'aux systèmes à déphasage minimal, c'est à dire ceux ayant des zéros
stables. On va voir que cette structure s'applique à tous les systèmes à déphasage minimal ou
non. Considérons le schéma blocs de la figure II.9.
Bm y*(t+d+1) y(t)
q −d
r(t) 1 u(t) B
T
Am S A
HBF
H*BF
Figure II.9
Les fonctions de transfert HBF et H*BF sont données par les expressions suivantes :
q− d B q − d B(q −1) q − (d +1) B*(q −1)
H BF (q −1) = = =
AS + q − d B R P(q −1) P(q −1)
q − (d +1) B*(q −1) T(q −1)
H *BF (q −1) =
P(q −1)
On pose : P(q–1) = T(q–1) B(1)
q − (d +1) B*(q −1)
il vient : H *BF (q −1) =
B(1)
Les polynômes S et R sont solutions de l'équation polynômiale suivante :
A(q–1) S(q–1) + q– d B (q–1) R(q–1) = P(q–1)
Pour l'exemple, on a :
d = 0; A = 1 + a1 q −1 et B = b1 q−1 + b2 q −2
On choisit : P = 1 + p1 q– 1
D'après les degrés des polynômes A, B et P, l'équation polynômiale suivante :
A(q–1) S(q–1) + B (q–1) R(q–1) = P(q–1)
est régulière. Donc, on a :
S = B – 1 = 1 S(q–1) = 1 + s1 q– 1
R = A – 1 = 0 R(q–1) = r0
Chapitre II -8- M. GASMI
Cours de Théorie de la commande
Les coefficients s1 et r0 sont déterminés, par identification des coefficients de q–1, en
remplaçant, dans l'équation polynômiale précédente, les polynômes A, S, B, R et P par leurs
expressions.
D'après le schéma blocs de la figure II.9, la loi de commande s'écrit sous la forme suivante :
S(q–1) u(t) + R(q–1) y(t) = T(q–1) y*(t+1)
ou encore, pour l'exemple :
P(q −1)
u(t) + s1 u(t–1) + r0 y(t) = y*(t+1) = P(q–1) y*(t+1)
B(1)
avec :
1
si B(1) 0
= B(1)
1 si B(1) = 0
ou encore :
–1
T
c (t) = P(q ) y*(t+1)
avec :
c = 1 s1 r0 et (t) = [u(t) u(t – 1) y(t)] .
T T
b°/ Commande adaptative
Comme on a déjà précisé, cette commande, qui est une commande adaptative indirecte, est
réalisée en deux étapes.
Etape 1 : Estimation des paramètres du modèle
L'équation du processus est donnée par la forme suivante : y(t+1) = T. (t)
avec : T = [a1 b1 b2] et (t) = [– y(t) u(t) u(t – 1)]T
Pour estimer les paramètres inconnus du modèle, on construit un prédicteur ajustable de la
sortie du procédé en remplaçant les vrais paramètres par leurs estimations à l'instant t, il vient,
avec : y 0 (t + 1) la sortie "a priori" du prédicteur à l'instant (t+1) :
y 0 (t + 1) = ˆ T (t) . (t) = – â1(t) y(t) + b̂1(t) u(t) + b̂ 2 (t) u(t – 1)
On définit alors l'erreur de prédiction "a priori" suivante :
0 (t + 1) = y(t+1) – y 0 (t + 1) = y(t+1) – ˆ T (t) . (t)
Il s'agit alors de trouver, à présent, un algorithme récursif d'adaptation pour déterminer le
vecteur des paramètres (t) minimisant un critère quadratique en termes de l'erreur de
prédiction "a priori".
Chapitre II -9- M. GASMI
Cours de Théorie de la commande
Etape 2 : Calcul des paramètres du régulateur ajustable
A partir de la loi de commande trouvée définie par la relation :
S(q–1) u(t) + R(q–1) y(t) = P(q–1) y*(t+1)
on obtient l'expression suivante :
Ŝ(t ,q −1 ) u(t) + R̂(t , q −1) y(t) = ˆ (t) P(q–1) y*(t+1)
où :
1 ˆ ,1) 0
si B(t
(i) ˆ (t) = B̂(t ,1)
1 ˆ ,1) = 0
si B(t
(ii) Ŝ(t ,q −1 ) et R̂(t , q −1) sont les solutions de l'équation de Bezout suivante :
Â(t , q −1) Ŝ(t ,q −1 ) + q–d B̂(t ,q −1) R̂(t , q −1) = P(q–1)
Remarque :
Pour résoudre l'équation polynômiale, il faut s'assurer, à chaque instant d'échantillonnage, que
la condition de solvabilité est vérifiée ; à savoir les polynômes Â(t , q −1) et B̂(t ,q −1) , trouvés
dans la première étape, sont premiers entre eux.
Chapitre II - 10 - M. GASMI