cours de commande optimale lqg - ensieg.dox.free.frensieg.dox.free.fr/1a_ensieg/automatique/doxs...

Cours de commande optimale LQG

Didier GEORGESINP Grenoble

Octobre 2004

Plan du cours

•Motivations pour la commande optimale

• Le regulateur optimal Lineaire-Quadratique (LQ)

• L’observateur optimal LQ

• La commande optimale Lineaire-Quadratique-Gaussienne (LQG)

• Une methode de synthese (etude de cas : stabilisation du tangage d’un helicoptere) :

– Synthese LQ/LQGa ponderations frequentielles par ”Loop Shaping”

1

Motivations pour la commande optimale

• Placement de poles = choix den poles en boucle fermee pour un systeme d’ordren. Pour un systemea m > 1 entrees, un retour d’etat =m × n gainsKij pourplacer lesn poles=> m × n − n ddls => infinite de gains possibles : quelcritere de choix adopter ?

• Comment choisir lesn poles pour garantir des objectifs de performance et derobustesse d’un systeme d’ordren > 5 ?

• De facon duale, memes questions pour la synthese d’un observateur

• Plutot que placer des poles, optimiser un critere de performance=> on fixe lesddls :

minu

∫ ∞

0

{zT (t)Qz(t) + uT (t)Ru(t)}dt

2

Le regulateur optimal

Lineaire-Quadratique

• Enonce : trouveru = −Kx qui minimise

minu

∫ ∞

0


sous {x(t) = Ax(t) + Bu(t), x(t) ∈ Rn, u(t) ∈ Rm

z(t) = Nx(t)

ou Q = QT ≥ 0 etR = RT > 0.

3

Solution

• Par le principe d’optimalite de Bellman :”une strategie optimale possede la pro-priete que, quelques soient l’etat initial et l’instant initial, les decisions restanta prendre (c’est-a-dire les decisionsa prendrea partir de cetetat initial et decet instant initial) doivent aussi constituer une strategie optimale.”

• Permet de resoudre un probleme de commande optimale :

minu(t),0≤t≤tf

∫ tf

0

l(t, x(t), u(t))dt + qf(tf , x(tf))

x = F (t, x(t), u(t)),u(t) = k(t, x(t)), k ∈ Φx ∈ Rn, u ∈ Rm

(1)

ou tf designe l’horizon de commande, suppose fixe, et ou Φ designe l’ensembledes strategies de commande en boucle fermee admissibles.

4

Solution (suite)

• Notion de fonction de Bellman :

V (t, x) = minu(s),t≤s≤tf

∫ tf

t

l(s, (x(s), u(s))ds + qf(tf , x(tf)) (2)

lorsquex(t) = x quelconque∈ Rn, avec la condition au temps finalV (tf , x) =

qf(tf , x).

• Parametrage en temps et dans l’espace d’etat des problemes commencant autemps initialt ∈ [0, tf ], sachant que l’etat initial estx(t) = x, ∀x ∈ Rn.

5

• Le principe d’optimalite permet d’ecrire :

V (t, x) = minu(t)

[

∫ t+dt

t

l(s, x(s), u(s))ds

+ minu(s),t+dt≤s≤tf

∫ tf

t+dt

l(s, (x(s), u(s))ds + qf(tf , x(tf))]

= minu(t)

[

∫ t+dt

t

l(s, x(s), u(s))ds + V (t + dt, x(t + dt))]

(3)

avec la condition au temps finalV (tf , x) = qf(tf , x).

• On note d’abord qu’au premier ordre :∫ t+dt

t

l(s, x(s), u(s))ds = l(t, x(t), u(t))dt + o(dt). (4)

6

• De plus un developpement au premier ordre deV (t + dt, x(t + dt)) autour de(t, x(t)) conduita :

V (t+dt, x(t+dt)) = V (t, x(t))+∂V (t, x)

∂tdt+

∂V (t, x)

∂xF (t, x, u)dt+o(dt). (5)

• Finalement en reportant ces deux approximations dans (3), on obtient :

V (t, x) = minu(t)

[l(t, x(t), u(t))dt

+V (t, x(t)) +∂V (t, x)

∂tdt +

∂V (t, x)

∂xF (t, x, u)dt + o(dt)]

• Lorsquedt → 0, on obtient l’equation d’Hamilton-Jacobi-Bellman :

−∂V (t, x)

∂t= min

u[l(t, x, u) +

∂V (t, x)

∂xF (t, x, u)] (6)

avec la condition au temps final

V (tf , x) = qf(tf , x). (7)

7

• Ou encore :

minu

[l(t, x, u) + V (t, x)] = 0 (8)

avec la condition au temps final

V (tf , x) = qf(tf , x), (9)

en notant queV (t, x) =∂V (t, x)

∂t+

∂V (t, x)

∂xF (t, x, u).

8

Solution : application au cas LQ

• Problemea temps fini :

minu

∫ tf

0

{zT (t)Qz(t) + uT (t)Ru(t)}dt + x(tf)TQfx(tf)


z(t) = Nx(t)

ou Q = QT ≥ 0, Qf = QTf ≥ 0 etR = RT > 0.

• On chercheV (t, x) sous la forme :V (t, x) = xTP (t)x :

• minu

[l(t, x, u) + V (t, x)] = 0 ⇔ minu

[xTNTQNx + uTRu

+xTP (t)x + xTP (t)x + xT P x] = 0

9

• Soit encore :

minu

[xTNTQNx + uTRu + (Ax + Bu)TPx + xTP (Ax + Bu) + xT P x] = 0

• On pose :H(t, x, u) = xTNTQNx + uTRu + (Ax + Bu)TPx + xTP (Ax +Bu) + xT P x

• La commande optimaleu∗ est donnee par∇uH = 0 (condition de stationnarite)

• ∇uH = 0 ⇔ Ru∗ + BTP (t)x = 0 ⇔ u∗ = −R−1BTP (t)x

• On obtient finalement l’equation differentielle :

xT{NTQN + ATP + PA− PBR−1BTP + P}x = 0, ∀x ∈ Rn

• Equation de Riccati :

NTQN + ATP + PA− PBR−1BTP + P = 0 (10)

• Condition terminale fixee parV (tf , x) = xTQfx ⇔ P (tf) = Qf

10

• Integration retrograde permet d’obtenirP (t), ∀t ∈ [0, tf ] : calcul hors-ligne carindependant dex

• Commande en boucle fermee :u∗(t, x) = −R−1BTP (t)x

• Systeme en boucle fermee : x = (A−BR−1BTP (t))x

11

Poursuite optimale LQ

• Probleme :

minu

∫ tf

0

{(z(t)−r(t))TQ(z(t)−r(t))+uT (t)Ru(t)}dt+(z(tf)−r(tf))TQf(z(tf)−r(tf))


z(t) = Nx(t)

ou Q = QT ≥ 0, Qf = QTf ≥ 0 etR = RT > 0.

• On chercheV (t, x) sous la forme :V (t, x) = xTP (t)x + 2xTg(t) + h(t) :

12

• Solution par programmation dynamique :

NTQN + ATP + PA− PBR−1BTP + P = 0, P (tf) = NTQfN.

g = −(A−BR−1BTP )Tg + NTQr, g(tf) = −NTQfr(tf).

h = gTBR−1BTg − rTQr, h(tf) = rT (tf)Qfr(tf).

13

Regulateur LQ

• tf → +∞ :

minu

∫ ∞

0



z(t) = Nx(t)

• Solution stationnaire de l’equation de Riccati (en faisantP = 0).

• Fonction de Bellman independante det :

V (x) = xTPx = minu

∫ ∞

0

{zT (s)Qz(s) + uT (s)Ru(s)}ds (11)

lorsquex(0) = x.

14

• P = P T > 0 est solution de l’equation algebrique de Riccati :

NTQN + ATP + PA− PBR−1BTP = 0

15

Autre solution du regulateur LQ

• Critere de performance :

J = Trace[

∫ ∞

0

(xTQxx + uTRu)dt] = Trace[(Qx + KTRK)L],

avecQx = NTQN etL =∫∞

0 xxTdt, puisqueu = −Kx.

• Systeme en boucle fermee :x(t) = e(A−BK)tx0 est tel que

(A−BK)L + L(A−BK)T = −x0xT0 .

si K choisi tel queA−BK stable ((A,B) stabilisable).

• Preuve :

(A−BK)L + L(A−BK)T =

∫ ∞

0

[(A−BK)e(A−BK)t(x0xT0 )e(A−BK)T t

+e(A−BK)t(x0xT0 )e(A−BK)T t(A−BK)T ]dt.

16

• Soit encore :

(A−BK)L + L(A−BK)T =

∫ ∞

0

d

dt[e(A−BK)t(x0x

T0 )e(A−BK)T t]dt = 0− x0x

T0

• Probleme : trouverK qui minimiseJ sous la contrainte(A − BK)L + L(A −BK)T = −x0x

T0 .

• Hamiltonien :

H = Trace[(Qx + KTRK)L + P ((A−BK)L + L(A−BK)T + x0xT0 )]

• C.N. d’optimalite : ∂H∂L = 0 et ∂H

∂K = 0.

• ∂H∂L = 0 ⇒ Qx + KTRK + P (A−BK) + (A−BK)TP = 0.

• ∂H∂K = 0 ⇒ 2RKL− 2BTPL = 0 ⇒ K = −R−1BTP .

• d’ou l’ equation de Riccati :PA + ATP − PBR−1BTP + Qx = 0.

• Cout optimal :Jmin = xT0 Px0.

17

Resolution de l’equation de Riccati

•Matrice Hamiltonienne :

H =

(A −BR−1BT

−Qx −AT

)

• Propriete : les2n valeurs propres deH sont lesn valeurs propres deA−BK etlesn valeurs propres opposees.

• Preuve :

detH = det

(A−BR−1BTP −BR−1BT

−Qx − ATP −AT

)

detH = det

(A−BK −BR−1BT

P (A−BK) −AT

)= det

(A−BK −BR−1BT

0 −AT + KTBT

)

C.Q.F.D.

18

• Corollaire : siH n’a pas de v.p. sur l’axe imaginaire,n et seulementn v.p. apartie reelle< 0, appeleesλi, i = 1, ..., n.

• On peutecrire :HX = XΛ avecλ = diag(λ1, ..., λn).

• En partitionnantX :(

A −BR−1BT

−Qx −AT

)(X1

X2

)=

(X1

X2

)Λ

• on obtient :

AX1 −BR−1BTX2 = X1Λ

−QxX1 − ATX2 = X2Λ

• En posantP = X2X−11 :

−Qx − ATP = P [AX1 −BR−1BTX2]X−11 ]

c’est-a-dire :

PA + ATP + Qx − PBR−1BTP = 0.

19

• Stabilite deA−BK, car :

X−11 (A−BK)X1 = Λ

• Positivite deP , carequation de Lyapunov :

(A−BK)TP + P (A−BK) = −Qx −KTRK

• Remarque importante : on montre que si(A,B) est stabilisable et(A,Q1/2x )

est detectable, alorsH n’a pas de valeurs propres sur l’axe imaginaire etP =

P T ≥ 0 (seulement semi-definie positive).

20

Stabilite du regulateur LQ

• si (A,B) est stabilisable et(C, Q1/2x ) est detectable, alors il existe une unique

matriceP symetrique, semi-definie positive, solution stabilisante de l’equationde Riccati algebrique.

21

Comportement modal en boucle fermee

• Cas mono-entree, mono-sortie (u ∈ R, z ∈ R) :

J =

∫ ∞

0

(zTz + ru2)dt =

∫ ∞

0

(xTNTNx + ru2)dt.

• Fonction de transfert du systeme :G(s) = N(sI − A)−1B. On supposeq zeroszi etn polespi deG(s).

• Si r → 0 :

– Systemea dephasage minimal: q poles tendent asymptotiquement vers lesq

zeros deG(s). n − q poles tendent vers−∞ : le temps de reponse devientinfiniment court.P → 0.

– Systemea dephasage non minimal: q desn poles tendent vers

zi =

{zi, Re(zi) ≤ 0−zi, Re(zi) > 0

22

Lesn− q poles restant tendent vers−∞ : temps de reponse

limit e par les zeros instables ”en miroir”.P ne tend pas vers0.

• Si r → +∞ : lesn poles en boucle fermee tendent vers :

pi =

{pi, Re(pi) ≤ 0−pi, Re(pi) > 0

”Effet miroir des poles instables” : presence d’au moins un pole instable = com-mandea energie minimale non nulle.

• Resultats generalisables si dimu ≥ dim z.

23

Robustesse du regulateur LQ

• Transfert de boucle :L(s) = K(sI − A)−1B = R−1BTP (sI − A)−1B.

• Reecriture de l’equation de Riccati :

NTQN − PBR−1BTP − (sI − AT )P − P (sI − A) = 0.

•Multiplication parBT (−SI − AT ) a gauche et par(sI − A)−1B a droite :

GT (−s)QG(s)− LT (−s)RL(s)−RL(s)− LT (−s)R = 0.

• ou encore :

(I + LT (−s))R(I + L(s)) = R + GT (−s)QG(s).

• D’ou :

(I + LT (−s))R(I + L(s)) ≥ R.

24

• Cas mono-entree, mono-sortie :

|1 + L(jω)| ≥ 1 ⇔ S(jω) ≤ 1

ou S(s) = 11+L(s) designe la fonction de sensibilite.

•Marges de stabilite :

– Marge de gain[0.5; +∞]

– Marge de phase[−60◦; +60◦]

– Marge de module≥ 1.

• Remarques :

– La presence d’un observateur fait perdre ces marges.

– Ces marges sont perdues en presence de termes croises enx et u dans lecritereJ .

25

Exemples numeriquesConsiderons la commande LQ (Q = 1, R = 1) du systemea non minimum de

phase eta deux poles instables, de fonction de transfertH(s) =s− 3

(s− 1)(s− 2).

−2.5 −2 −1.5 −1 −0.5 0 0.5 1 1.5−2

−1.5

−1

−0.5

0

0.5

1

1.5

2

Lieu de Nyquist − Transfert de boucle

Axe réel

Axe

imag

inai

re

Figure 1: Exemple de lieu de Nyquist d’un regulateur LQ

26

• Considerons le systeme double integrateur :

x =

(0 10 0

)x +

(01

)u

z =(

1 −1)x

• G(s) = (1− s)/s2.

• On recherche la commande LQ qui minimise :

J =

∫ +∞

0

z2(t) + ru2(t)dt

• P =

(p1 p2

p2 p3

)avec

p1 = 1 +√

1 + 2√

rp2 =

√r

p3 =√

r(1 + 2√

r)

etK =(

1√r

√1+2

√r√

r

)

• Lorsquer → 0 : 1 pole tend vers−1, l’autre, vers−∞.

27

L’observateur optimal LQ

• Objectif : produire un estime x de l’etatx du systeme :{

x(t) = Ax(t) + Bu(t), x(t) ∈ Rn, u(t) ∈ Rm

y(t) = Cx(t)

sachant quex(0) est inconnu et en cherchanta minimiser le critere :

J = xT (0)S−1x(0) +

∫ τ

0

((y − y)TV −1(y − y) + vTW−1v)dt

sachant quex = Ax + Bu + Mv et x(0), inconnu.

28

Resolution

• Resolution comme un probleme de poursuite optimale LQ : en inversant letemps :t → τ − t : x(t) = x(τ − t)

d

dtx(t) = −Ax−Bu

• Le critere devient :

J =

∫ τ

0

((y − ˜y)TV −1(y − ˜y) + vTW−1v)dt + ˜xTS−1 ˜x

sachant quex = −A ˜x−Bu− Ev.

29

• Solution :

CTV −1C + AT P + PA− PEWET P + ˙P = 0, P (τ ) = S−1.

˙g = −(A− EWET P )T g + CTV −1y, g(τ ) = 0.

˙h = gTEWET g − yTV −1y, h(τ ) = 0.

• Le cout optimal :

J = ˜xT P ˜x + 2˜xT g + h

s’ecrit aussi :

J = (˜x + P−1g)T P (˜x + P−1g)− gT P−1g + h

dont le minimum est obtenu pour˜x = −P−1g.

30

• En revenant en temps ”direct”, en posantM(t) = P−1 et sachant queM =

−MPM : equations du filtre de Kalman instationnaire :

M = MAT + AM −MCTV −1CM + EWET , M(0) = S

˙x = Ax + Bu + M(t)CTV −1(y − Cx), x(0) = 0

31

Filtre de Kalman stationnaire

• Horizon infini : τ → +∞MAT + AM −MCTV −1CM + EWET = 0,

˙x = Ax + Bu + MCTV −1(y − Cx)

• Interpretation stochastique : il s’agit de l’estimateur d’etat optimal du systeme :{

x = Ax + Bu + Ewy = Cx + v,

ou w etv representent des bruits blancs, centres et independant de variance :

E[w(t)w(t)T ] = W ≥ 0, E[v(t)v(t)T ] = V > 0

qui minimise la variance de l’erreur d’estimationE{trace((x− x)(x− x)T )}.

32

Dualite

• Dualite entre observateur LQ et commande LQ : passage desequations de Ric-cati de l’observateur et du regulateur grace aux correspondances :

A ↔ AT , B ↔ CT , N ↔ ET

R ↔ V, Q ↔ W

K ↔ LT

• Corollaire : Stabilite de l’observateur :si (A,C) est detectable et(A,W1/21 ),

avecW1 = EWET , est stabilisable, alors il existe une unique matriceM

symetrique, semi-definie positive, solution stabilisante de l’equation de Riccatialgebrique de l’observateur optimal.

33

Commande LQG

• Soit le systeme :

x = Ax + Bu + Ew,y = Cx + v,z = Nx

ou w etv representent des bruits blancs, centres et independant de variance :

E[w(t)w(t)T ] = W ≥ 0, E[v(t)v(t)T ] = V > 0.

On cherche la commande qui minimise :

J = limT→+∞

E[

∫ T

0

(zTQz + uTRu)dt], Q = QT ≥ 0, R = RT > 0

34

Solution

• Principe de separation :

– Calcul du regulateur optimal LQ :u = −Kx, avecK = R−1BTP et P ,solution de

ATP + PA− PBR−1BTP + NTQN = 0.

– Calcul de l’observateur optimal LQ de gainL = MCTV −1 :

˙x = Ax + Bu + L(y − Cx), x(0) = 0

avecM , solution de

MAT + AM −MCTV −1CM + EWET = 0.

35

Synthese LQ/LQGa ponderations frequentielles

Figure 2: Loop Shaping

• Performance : bon suivi de consigne et bonne rejection des perturbationsp :Sy faible⇒ σ(Sy(jω)) < 1

|W1(jω)| pourω < ωb,

• Robustesse :attenuation deTy en haute frequence.

36

Ponderations frequentielles

• D’apres le theoreme de Parseval, le critere Sortie/Entree :∫ +∞

0

(yTQy + uTRu)dt

estequivalenta :

1

2π

∫ +∞

−∞(Y (jω)∗QY (jω) + U(jω)∗RU(jω))dω

Si on introduit des ponderations frequentielles :

1

2π

∫ +∞

−∞(Y (jω)∗Q(jω)Y (jω) + U(jω)∗R(jω)U(jω))dω

37

• Cela revienta introduire des filtresQ1/2 etR1/2, sur la sortie et sur l’entree :

U(s) = R1/2(s)U(s)Y (s) = Q1/2(s)Y (s)

• Le critere peut alors se mettre sous la forme :

1

2π

∫ +∞

−∞(Y (jω)∗Y (jω) + U(jω)∗U(jω))dω

• Plus de ponderations !

38

InterpretationLe probleme estequivalenta calculer le regulateur optimal LQ, solution duprobleme :

minu

∫ +∞

0

(yTy + uTu)dt

sous le systeme augmente d’etatX = (xT , xTQ, xT

R)T , defini par

x = Ax + Bu (12)y = Cx (13)

R−1/2

{xR = ARxR + BRuu = CRxR

(14)

Q1/2

{xQ = AQxQ + BQyy = CQxQ + DQy

(15)

Le regulateur est de la forme :

u = −Lxx− LQxQ − LRxR

39

Schema du regulateur LQ

Figure 3:

• On doit souvent associer ce regulateura un observateur d’etat optimal (LQG) :

˙x = Ax + Bu + K(y − Cx) ,

{K = MCTV −1,MAT + AM −MCTV −1CM + W = 0

40

Choix deR−1/2(s) et Q1/2(s)

Figure 4:

En prenant les filtres de la forme suivante :

R−1/2(s) =kR

1 + τRsIm, Q1/2(s) = kQ

1 + τQs

1 + 10τQsIp

41

Proprietes

• On obtient :

– GraceaR−1/2(s) : decroissance plus rapide deL hors bande passante (ameliorationde robustesse), ((−1− nR)× 20 dB/decade,nR : ordre du filtre) ;

– Gracea Q1/2(s) : accroissement de la pente deL dans la bande passante(accroissement de performance), (nQ × 20 dB/decade,nQ : ordre du filtre)

42

Loop Transfer Recovery (LTR)• LQG avec gain du regulateurL et gain de l’observateurK.

• Transfert de boucle du regulateur LQ :

LLQ(s) = L(sId − A)−1B

• Transfert de boucle du controleur LQG :

LLQG(s) = L(sId − A + BL + KC)−1KC(sId − A)−1B

• Calcul de l’observateur optimal : W = W0 + q2BBT etV = V0

• Proposition : Si G(s) = C(sId−A)−1B (avecm = p) esta minimum de phase,alors lorsqueq → +∞, LLQG(s) → LLQ(s).

• Approche : augmenterq, jusqu’a ce que les 2 transferts soient proches (au sensdes valeurs singulieres) ; attention : sensibilite au bruit de mesure accrue.

• Propri ete modale : lorsqueq → +∞, les poles de l’observateur (v.p. deA −KC) tendent vers les zeros du systeme et les poles restant, vers−∞.

43

Methodologie :

1. Reglage du regulateur LQ par ponderations frequentielles (Loop Shaping) ;

2. Calcul de l’observateur optimal (LTR)˙x = (A−KC)x + BCRxR + Ky a partirdeV = V0 etW = W0 + q2BBT , pourq donne.

3. Comparaison des valeurs singulieres deLLQ etLLQG ;

• Si OK, alors FIN, sinon : augmenterq et retour en 2).

LLQ (u → u∗) est calcule a partir de :

X =

AR −BRLR −BRLx −BRLQ

0 A 00 BQC AQ

X +

0B0

u

u∗ =(

CR 0 0)X

44

avecXT = (xTR, xT , xT

Q)T , L = (LR, Lx, LQ) etLLQG, a partir de :

X =

AR −BRLR 0 −BRLQ −BRLx

0 A 0 00 BQC AQ 0

BCR KC 0 A−KC

X +

0B00

u

u∗ =(

CR 0 0 0)X

avecXT = (xTR, xT , xT

Q, xT )T .

45

Etude de cas

• Stabilisation du mouvement longitudinal d’un helicoptere :

Figure 5:

• Systeme d’ordre 4,a 2 entrees et 2 sorties

46

• Representation d’etat autour d’une vitesse de 40 nœuds :

x =

−0, 02 0, 005 2, 4 −32−0, 14 0, 44 −1, 3 −30

0 0, 018 −1, 6 1, 20 0 1 0

x +

0, 14 −0, 120, 36 −8, 60, 35 0, 009

0 0

u

y =

(0 1 0 00 0 0 57, 3

)x

• etat x : vitesse longitudinale, vitesse verticale, vitesse angulaire de tangage,assiette de tangage

• commandeu : pas cyclique longitudinal, pas collectif.

• Systeme instable (poles : +0, 491 ± 0, 415j; 0,0652; -2,228), maisa dephasageminimal (zero : -0,018).

47

Reponses frequentielles

10−4

10−3

10−2

10−1

100

101

102

103

−200

−150

−100

−50

0

50

100

150

200

Réponse fréquentielle avec/sans modèle rotors − hélicoptère + gabarit incertitude

Frequency (rad/sec)

Sin

gula

r V

alue

s (d

B)

• Pulsation de coupure autour de 20 rd/s.

• Dynamiques negligees des rotors : du type 2nd ordre avec pole double (G(s) =625/(p+25)2), avec pulsation proprea 25 rd/s : gabarit d’incertitude multiplica-tive.

48

Synthese LQ

• Objectifs :

– Stabiliser le mouvement longitudinal;

– Obtenir un gain statique nominal unitaire;

– Assurer la robustesse vis-a-vis des dynamiques HF negligees (dynamique des2 rotors en entree).

• Correcteur :u = −Kx + Kryref .

• Ponderations du regulateur LQ :Q = CTC, R = I2.

K =

[ −0, 0033 0, 0472 14, 6421 60, 88940, 0171 −1, 0515 0, 2927 3, 2469

]

• Poles en boucle fermee :[ −8, 6168 −3, 3643 + 2, 9742j −3, 3643− 2, 9742j −0, 0196

]

49

•Kr choisi de sorte que le gain statique en boucle fermee =1 :C(−A+BK)−1BKr =

1 c’est-a-direKr = (C(−A + BK)−1B)−1 :

Kr =

[ −0, 0042 1, 0951−1, 0030 −0, 0331

]

• Illustration du comportement modal : avecR = 0, 01 × I2 : poles en bouclefermee :

[ −86, 0759 −10, 0773 + 9, 9524j −10, 0773− 9, 9524j −0, 0180]

• Le pole−0, 0180 compense le zero (−0, 0180) du systeme.

• Robustesse - rotors : siσi(Ty)σ(∆) ≤ 1, i = 1, 2, ou Ty = (I +L)−1L, sensibilite

en sortie et∆(s) =−s2 − 50s

s2 + 50s + 625(incertitude multiplicative en entree).

• Gabarit d’incertitudesa ne pas depasser est donc :∆−1 =s2 + 50s + 625

−s2 − 50s

50

• Robustesse vis-a-vis des incertitudes assuree et marge de gain[0, 5; +∞] :

10−4

10−2

100

102

−50

0

50

100

150

200

10−4

10−2

100

102

0

5

10

15

20

25

30

Transfert de boucle LQ − Ty − gabarit incertitude

Frequency (rad/sec)

Sin

gula

r V

alue

s (d

B)

sigma (I + L)

Frequency (rad/sec)

Sin

gula

r V

alue

s (d

B)

Figure 6: Transfert LQ -Q = CTC etR = I2.

51

• Gabarit non respecte, mais toujours marge de gain[0, 5; +∞] :

10−4

10−2

100

102

104

−100

−50

0

50

100

150

200

10−4

10−2

100

102

104

0

5

10

15

20

25

30

35

40

45

50

Transfert de boucle LQ − Ty − gabarit incertitude

Frequency (rad/sec)

Sin

gula

r V

alue

s (d

B)

sigma (I + L)

Frequency (rad/sec)

Sin

gula

r V

alue

s (d

B)

Figure 7: Transfert LQ -Q = CTC etR = 0, 01× I2.

52

LQG/LTR

• Ponderation de l’observateur :W = q2BBT et V = I2 : perte des marges[0, 5; +∞], degradation de la performance (v.s. inferieuresa celles du LQ).

100

105

−300

−250

−200

−150

−100

−50

0

50

100

150

200

10−4

10−2

100

102

−15

−10

−5

0

5

10

15

Transfert de boucle LQG − Ty − gabarit incertitude

Frequency (rad/sec)

Sin

gula

r V

alue

s (d

B)

sigma (I + L)

Frequency (rad/sec)

Sin

gula

r V

alue

s (d

B)

Figure 8: Transfert LQG -Q = CTC, R = I2, q = 0, 1.

53

LQG/LTR : recouvrement

100

105

−300

−250

−200

−150

−100

−50

0

50

100

150

200

10−4

10−2

100

102

−15

−10

−5

0

5

10

15

20

25

30

Recouvrement LQ − LQG

Frequency (rad/sec)

Sin

gula

r V

alue

s (d

B)

sigma (I + L LQ) et sigma (I + L LQG)

Frequency (rad/sec)

Sin

gula

r V

alue

s (d

B)

Figure 9: Recouvrement LQ - LQG -q = 0, 1.

54

LQG/LTR : recouvrement

100

105

−250

−200

−150

−100

−50

0

50

100

150

200

100

105

−5

0

5

10

15

20

25

30

Recouvrement LQ − LQG

Frequency (rad/sec)

Sin

gula

r V

alue

s (d

B)

sigma (I + L LQ) et sigma (I + L LQG)

Frequency (rad/sec)

Sin

gula

r V

alue

s (d

B)

Figure 10: Recouvrement LQ - LQG -q = 100.

55

Sensibilite au bruit de mesure

10−2

100

102

104

−200

−150

−100

−50

0

50

10−4

10−2

100

102

−60

−50

−40

−30

−20

−10

0

10

Sensibilité au bruit de mesure en sortie

Frequency (rad/sec)

Sin

gula

r V

alue

s (d

B)

Sensibilité au bruit de mesure en entrée

Frequency (rad/sec)

Sin

gula

r V

alue

s (d

B)

Figure 11:q = 0.1.

56

Sensibilite au bruit de mesure

100

105

−250

−200

−150

−100

−50

0

50

100

105

−50

−40

−30

−20

−10

0

10

20

Sensibilité au bruit de mesure en sortie

Frequency (rad/sec)

Sin

gula

r V

alue

s (d

B)

Sensibilité au bruit de mesure en entrée

Frequency (rad/sec)

Sin

gula

r V

alue

s (d

B)

Figure 12:q = 100.

57

Commentaires

• Roll off avec pente de -20dB/decade : risque de manque de robustesse en HF.

• Performance limitee par gain en BF : solution = introduction d’un integrateursur chaque sortie (filtreQ1/2).

58

LQ avec ponderations frequentielles

• R−1/2 =

(1

0,05s+1 0

0 10,05s+1

)etQ1/2 =

(1s 00 1

s

).

10−8

10−6

10−4

10−2

100

102

−100

−50

0

50

100

150

200

250

300

Transfert de boucle LQ avec/sans pondérations fréquentielles − KG/(I+KG) − gabarit

Frequency (rad/sec)

Sin

gula

r V

alue

s (d

B)

Figure 13: - : LQ avec pf; – :(I + KG)−1KG; -. : LQ sans pf; .. : gabarit

59

LQ avec ponderations frequentielles

0

0.5

1

1.5

To:

Out

(1)

0 1 2 3 4 5 6 7 80

0.5

1

1.5

To:

Out

(2)

Linear Simulation Results

Time (sec)

Am

plitu

de

Figure 14:

60

LQG/LTR avec pond. freq.

100

105

−300

−250

−200

−150

−100

−50

0

50

100

150

100

105

−20

0

20

40

60

80

100

120

140

Transfert L LQ (−) − L LQG (.)

Frequency (rad/sec)

Sin

gula

r V

alue

s (d

B)

sigma (I + L LQ) (−) − sigma (I + L LQG) (.)

Frequency (rad/sec)

Sin

gula

r V

alue

s (d

B)

Figure 15: LQG/LTR -q = 100

61

Commentaires

• Roll off ameliore.

• Integrateur en sortie permettant de rejeter les perturbations constantes.

62

cours de commande optimale lqg - ensieg.dox.free.frensieg.dox.free.fr/1a_ensieg/automatique/doxs...

Documents