0% encontró este documento útil (0 votos)
234 vistas153 páginas

A. Rojas M - 2

El documento aborda el control no lineal multivariable y sus aplicaciones en tiempo real, presentando técnicas de modelado y control óptimo. Se incluyen ejemplos prácticos con manipuladores robóticos y sistemas de control de tanques de agua, utilizando software como MATLAB y LabVIEW. Además, se discuten métodos de control adaptativo y deslizante, así como la implementación de sistemas en tiempo real.

Cargado por

henrymallqui
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
234 vistas153 páginas

A. Rojas M - 2

El documento aborda el control no lineal multivariable y sus aplicaciones en tiempo real, presentando técnicas de modelado y control óptimo. Se incluyen ejemplos prácticos con manipuladores robóticos y sistemas de control de tanques de agua, utilizando software como MATLAB y LabVIEW. Además, se discuten métodos de control adaptativo y deslizante, así como la implementación de sistemas en tiempo real.

Cargado por

henrymallqui
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

CONTROL NO LINEAL

MULTIVARIABLE
APLICACIONES EN TIEMPO REAL

ARTURO ROJAS-MORENO, Ph.D.

 Modelado de Procesos
 Implementación en Tiempo Real
 Control Óptimo Cuadrático
 Control Adaptativo con Modelo Referencial
 Linealización de la Realimentación
 Control con Modos Deslizantes
 Programas Fuente en MATLAB y LabVIEW
II

CONTROL NO LINEAL MULTIVARIABLE


APLICACIONES EN TIEMPO REAL

Copyright 
c 2007 Arturo Rojas-Moreno. Todos los derechos reservados.

ISBN

Queda rigurosamente prohibida la reproducción total o parcial de esta obra por cualquier
medio o procedimiento, sin la autorización escrita del propietario del “Copyright”.
A la Memoria de mis Padres
Índice general

III

Prefacio VII

1. Modelado de Sistemas No Lineales 1


1.1. Modelado Empleando las Leyes de la Fı́sica . . . . . . . . . . . . . . . 1
1.1.1. Manipulador Robótico de 1GDL . . . . . . . . . . . . . . . . . 1
1.1.2. Manipulador Robótico con Articulación Elástica (MRAE) . . . 7
1.1.3. Sistema Péndulo Invertido–Grúa Puente . . . . . . . . . . . . . 11
1.1.4. Sistema Tanque de Agua . . . . . . . . . . . . . . . . . . . . . 19
1.2. Método de Las Ecuaciones de Lagrange . . . . . . . . . . . . . . . . . 24
1.2.1. Las Ecuaciones de Lagrange . . . . . . . . . . . . . . . . . . . . 24
1.2.2. Manipulador Robótico Traslacional (MRT) . . . . . . . . . . . 25
1.3. El Método de Lagrange–Euler . . . . . . . . . . . . . . . . . . . . . . . 32
1.3.1. El Procedimiento de Denavit–Hartenberg . . . . . . . . . . . . 32
1.3.2. El Procedimiento de Lagrange–Euler . . . . . . . . . . . . . . . 35
1.3.3. Manipulador Robótico Esférico (MRE) . . . . . . . . . . . . . . 37
1.4. PROBLEMAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
1.5. Estructura en Tiempo Real . . . . . . . . . . . . . . . . . . . . . . . . 59
1.6. Sistema de Control del Manipulador de 1GDL . . . . . . . . . . . . . . 59
1.6.1. Generación de la señal PWM . . . . . . . . . . . . . . . . . . . 60
1.6.2. El Amplificador de Potencia . . . . . . . . . . . . . . . . . . . . 62
1.7. Sistema de Control de Manipuladores de 2 y 3GDL . . . . . . . . . . . 64
1.8. El Sistema de Control del Tanque . . . . . . . . . . . . . . . . . . . . . 65

2. Control Óptimo 67
2.1. Configuración del Sistema de Control Óptimo . . . . . . . . . . . . . . 67
2.2. El Sistema Dinámico No Lineal Multivariable . . . . . . . . . . . . . . 68
2.3. El Controlador PI de Realimentación de Estados . . . . . . . . . . . . 69
2.4. El Observador No Lineal Multivariable . . . . . . . . . . . . . . . . . . 72
2.5. Procedimiento de Diseño . . . . . . . . . . . . . . . . . . . . . . . . . . 73

3. Control Adaptativo con Modelo Referencial 79


3.1. Configuración ode un SCAMR . . . . . . . . . . . . . . . . . . . . . . 79
3.2. Estabilidad vı́a el Método Directo de Lyapunov . . . . . . . . . . . . . 80
3.2.1. Conceptos de Estabilidad . . . . . . . . . . . . . . . . . . . . . 80
3.2.2. Funciones de Lyapunov . . . . . . . . . . . . . . . . . . . . . . 81
VI ÍNDICE GENERAL

3.2.3. Teoremas de Estabilidad de Lyapunov . . . . . . . . . . . . . . 85


3.2.4. Teoremas del Conjunto Invariante . . . . . . . . . . . . . . . . 87
3.3. SCAMR para Sistemas No Lineales de una Entrada . . . . . . . . . . 89
3.3.1. Formulación del Problema y de la Ley de Control . . . . . . . . 89
3.3.2. La Ley de Adaptación . . . . . . . . . . . . . . . . . . . . . . . 90
3.3.3. Zona–Muerta para Evitar Corrimiento de Parámetros . . . . . 91
3.4. SCAMR para Sistemas No Lineales Multivariables . . . . . . . . . . . 93

4. Linealización por Realimentación de Estados 101


4.1. Herramientas de la Geometrı́a Diferencial . . . . . . . . . . . . . . . . 101
4.1.1. Derivadas y Corchetes de Lie . . . . . . . . . . . . . . . . . . . 102
4.1.2. Difeomorfismos y Transformación de Coordenadas . . . . . . . 103
4.1.3. El Teorema de Frobenius . . . . . . . . . . . . . . . . . . . . . 103
4.2. Linealización por Realimentación. Caso: SISO . . . . . . . . . . . . . . 104
4.2.1. Condiciones para Linealización . . . . . . . . . . . . . . . . . . 104
4.2.2. El Grado Relativo de un Sistema . . . . . . . . . . . . . . . . . 105
4.2.3. Forma Normal SISO con Linealización Exacta . . . . . . . . . . 106
4.2.4. La Ley de Control SISO para Linealización . . . . . . . . . . . 106
4.3. Linealización por Realimentación: Caso MIMO . . . . . . . . . . . . . 107
4.3.1. Modelando Sistemas MIMO Cuadrados . . . . . . . . . . . . . 107
4.3.2. Grado Relativo Total . . . . . . . . . . . . . . . . . . . . . . . . 108
4.3.3. Forma Normal MIMO para Linealización Exacta . . . . . . . . 109
4.3.4. La Ley de Control MIMO Desacoplada . . . . . . . . . . . . . . 111
4.4. Observadores No Lineales con Polos Prescritos . . . . . . . . . . . . . 112
4.4.1. Observador SISO No Lineal con Polos prescritos . . . . . . . . 113
4.4.2. Observadores MIMO No Lineales con Polos Prescritos . . . . . 114

5. Control Deslizante 119


5.1. Control Deslizante para Sistemas de una Entrada . . . . . . . . . . . . 120
5.1.1. Conceptos Básicos y Notación . . . . . . . . . . . . . 
. . . . . . 120
(n)
5.1.2. Control deslizante para Sistemas de la Forma x = fi + u . 123
5.1.3. Control Deslizante para Sistemas de la Forma x(n) = fi + bu 128
5.1.4. Rendimiento del Seguimiento vs. Errores de Modelado . . . . . 131
5.2. Control Deslizante para Sistemas Multivariables . . . . . . . . . . . . . 131
5.2.1. El Sistema a Controlar . . . . . . . . . . . . . . . . . . . . . . . 131
5.2.2. La Superficie de Conmutación . . . . . . . . . . . . . . . . . . . 132
5.2.3. Diseño de la Fuerza de Control Multivariable . . . . . . . . . . 132

. Bibliografı́a 139

. Índice alfabético 142


Prefacio

Esta publicación está dirigida a todos los profesionales, cientı́ficos y especialistas


interesados en familiarizarse con el diseño e implementación de sistemas de control
no lineales multivariables operando en tiempo real.
Este libro presenta y discute la simulación e implementación en tiempo real de
varias configuraciones de sistemas de control no lineal con el propósito de validar los
procedimientos de diseño desarrollados en los capı́tulos correspondientes.
Los diversos estudios de simulación desarrollados en los capı́tulos se realizan em-
pleando el software MATLAB (usar versión 5.3 o recientes), mientras que el software
de adquisición de datos y control en tiempo real está escrito en código LabVIEW
versión 7.1. El CD adjunto contiene todos los archivos desarrollados en este libro.
Los programas escritos en código LabVIEW permiten sintonizar en lı́nea y en forma
interactiva los parámetros de los algoritmos de control, de modo tal que se pueda vi-
sualizar en tiempo real que el objetivo de control se cumple para cada caso, a saber,
que las señales de salida controladas sigan a las señales de referencia, cumpliendo las
especificaciones de diseño pre-establecidas.
Los procedimientos de diseño e implementación de los sistemas de control no
lineal desarrollados en este libro se pueden aplicar a una gran clase de procesos no
lineales, tales como brazos robóticos (manipuladores), aeronaves de alto rendimiento,
vehı́culos espaciales, procesos quı́micos, y otros. Al final de cada capı́tulo se propone
un conjunto de problemas relacionados con el modelado, simulación y diseño del
sistema de control para diversos procesos.
Este libro emplea procesos prototipo para ser controlados en tiempo real: ma-
nipuladores (de uno o más grados de libertad) y el sistema tanque de agua. En los
manipuladores el objetivo de control es que sus posiciones angulares sigan posiciones
angulares de referencia. Tales referencias pueden ser también variantes en el tiempo
(problema de seguimiento). En el caso del sistema tanque de agua, el objetivo de
control es que la temperatura y nivel del lı́quido en el tanque sigan a referencias
constantes.
Especı́ficamente, se controlarán en tiempo real los siguientes procesos (los cuales
pueden ser vistos en la parte videos del CD adjunto a este libro):

• Manipulador de un grado de libertad (1GDL).


• Manipulador esférico de 2GDL.
• Manipulador traslacional de 2GDL.
• Manipulador traslacional–esférico de 3GDL.
• Sistema tanque de agua
VIII Prefacio

Este libro está organizado en los capı́tulos siguientes:

Capı́tulo 1: Modelado de Procesos No Lineales. En este capı́tulo se de-


ducen los modelos matemáticos que representan la dinámica de los procesos a ser
controlados en tiempo real. Tales modelos matemáticos son necesarios para poder
estimar los parámetros y estados del proceso y formular las leyes de control no lineal.

Capı́tulo 2: Implementación en Tiempo Real. Este capı́tulo describe prin-


cipalmente las estructuras en hardware de los sistemas de control no lineal multivari-
ables implementados.

Chapter 3: Optimal Control. El sistema de control óptimo considerado com-


bina un proceso no lineal pero linealizable, un controlador de realimentación de es-
tados proporcional-integral y un observador no lineal para estimar los estados del
proceso. El objetivo del sistema de control óptimo es determinar una función de
fuerza capaz de minimizar la diferencia entre el vector de salida del proceso y el
vector de trayectorias deseadas, a pesar de la presencia de disturbios estocásticos e
incertidumbres en los parámetros del proceso.

Capı́tulo 4: Control Adaptativo con Modelo Referencial. Este sistema


de control no lineal se compone principalmente de cuatro partes: el modelo de refer-
encia, el controlador adaptativo, el proceso no lineal y el el mecanismo de adaptación.
El modelo de referencia es un modelo dinámico auxiliar empleado para especificar la
respuesta deseada del proceso, mientras que el mecanismo de adaptación es un con-
junto de bloques interconectados empleados para implementar la ley de adaptación,
la cual modifica los parámetros del controlador adaptativo en forma tal que el sistema
de control adaptativo permanezca estable y que el error de seguimiento converja a
cero a pesar de que existan cambios reales en los parámetros del proceso y disturbios
externos. El método directo de Liapunov se emplea en este contexto para garantizar
estabilidad asintótica en el sistema diseñado.

Capı́tulo 5: Linealización de la Realimentación. Los métodos de la ge-


ometrı́a diferencial se pueden aplicar a procesos no lineales para determinar si tales
procesos son linealizables por realimentación; esto es, si la descripción dinámica de
un proceso en particular se puede hacer que parezca lineal después de de que se le
haya aplicado una transformación de coordenadas apropiada y una realimentación no
lineal de estados. Este capı́tulo presenta el método para llevar a cabo la linealización
de la realimentación con el propósito de diseñar una ley de control desacoplada. Un
observador no lineal con asignación de polos se emplea también para estimar los es-
tados del proceso.

Capı́tulo 6: Control con Modos Deslizantes. En un sistema de control con


modos deslizantes la descripción del proceso puede ser imprecisa. La metodologı́a
aplicada en este tipo de control incluye una ley de control de realimentación no lin-
eal que está conmutando en forma discontinua sobre una superficie que pertenece
al espacio de estado del sistema. Si alguna trayectoria de estado originada en esta
IX

superficie, en respuesta al comportamiento natural de la dinámica del sistema a lazo


abierto, se trata de desviar de la superficie especificada, entonces se deben aplicar
acciones de control para hacer retornar a dicha trayectoria a su estado anterior. Es
posible modificar la ley de control adecuadamente a fin de obtener acciones de control
más moderadas.

Arturo Rojas Moreno, Ph.D.


ctlima@[Link]
Capı́tulo 1

Modelado de Sistemas No
Lineales

En general, el problema de control no lineal consiste en obtener las ecuaciones que


gobiernan el sistema no lineal en la forma de un modelo dinámico que permita especificar
las leyes de control requeridas con el propósito de lograr la respuesta deseada del proceso
controlado. La construcción del modelo dinámico se basa en la aplicación de las leyes
fı́sicas sobre el proceso, tales como la conservación de la energı́a y las leyes de Newton.
Los métodos de diseño del controlador presentadas en los siguientes capı́tulos
se pueden aplicar a una gran clase de procesos no lineales, tales como manipuladores
robóticos, aeronaves de alto rendimiento, vehı́culos espaciales, procesos quı́micos, entre
otros. Algunos de estos procesos se proponen en la sección Problemas de este capı́tulo.
Este trabajo emplea manipuladores de varios grados de libertad y el sistema tanque de
agua a manera de prototipos para validar mediante experimentación varias estrategias de
control no lineal.
La dinámica de una gran variedad de sistemas se puede describir mediante un
conjunto de ecuaciones diferenciales no lineales. Las siguientes estrategias de modelado
se emplean en este libro con la finalidad de obtener tales ecuaciones: aplicación de las
leyes fı́sicas (sección 1.1), aplicación de las ecuaciones de Lagrange (sección 1.2) y el
método de Lagrange–Euler (sección 5). Los códigos de los programas empleados en este
capı́tulo se encuentran en el CD adjunto a esta publicación.

1.1. Modelado Empleando las Leyes de la Fı́sica


A continuación se desarrollan algunos ejemplos de modelado de sistemas no
lineales empleando las leyes de la fı́sica.

1.1.1. Manipulador Robótico de 1GDL


El manipulador robótico de 1GDL (1 Grado De Libertad) mostrado en la figura
1.1 es uno de los procesos prototipo a ser utilizado en esta publicación para validar
mediante experimentación los algoritmos de control empleados. Este proceso se com-
pone de un subsistema eléctrico y un subsistema mecánico. El subsistema eléctrico
comprende un servomotor D.C. (“Direct Current”) con codificador (“encoder”) de
2 Modelado de Sistemas No Lineales

posición incorporado, el cual se emplea para medir la posición angular del brazo del
manipulador en cada instante de tiempo. El servomotor posee una caja de engranajes
para reducir la velocidad en su eje de salida; de de esta manera, se facilita el control
de posición del manipulador.
El subsistema mecánico consiste de un brazo accionado gracias al torque rota-
cional generado en el actuador (el servomotor D.C.). En el extremo del brazo robótico
se puede acoplar un efector final, el cual puede ser una pinza para asir objetos, una
herramienta para soldar, una herramienta para pintar, etc. En nuestro caso usamos
una pinza con dos grados de libertad: un grado para rotar la pinza y otro para abrirla
y cerrarla. Con propósitos de modelado, vamos a suponer que el efector final y su
carga se pueden modelar mediante una masa mh variable. La tabla 1.1 describe las
variables y los valores de los parámetros del manipulador mostrado en la figura 1.1.
El manipulador de 1GDL es del tipo SISO (“Single Input Single Output”)
ya que sólo posee una entrada: el voltaje de control u aplicado a la armadura del
servomotor, y una salida: la posición angular θ del brazo.

Figura 1.1: Manipulador robótico de 1GDL.

Modelo del Subsistema Mecánico


Para modelar el subsistema mecánico del manipulador empleamos la segunda
ley de Newton para los movimientos lineal y rotacional. La aplicación de esta segunda
ley se traduce en una ecuación de balance mecánico. Con respecto a la figura 1.1, la
ecuación de balance mecánico en el eje del servomotor articulado al primer engranaje
se formula como:
dθ d 2 θm
Tm = Jm θ̈m + Bm θ̇m + Tg1 θ̇ = θ̈m = (1.1)
dt dt2
donde Jm y Bm representan el momento de inercia y la constante de fricción viscosa
del rotor, Tm es el torque del servomotor y Tg1 es el torque de reacción debido al primer
engranaje. Para los engranajes de reducción del servomotor podemos formular:
N2 θm
n= = θm = nθ n>1 (1.2)
N1 θ
1.1 Modelado Empleando las Leyes de la Fı́sica 3

Tabla 1.1: Parámetros y variables del brazo robótico de 1 GDL.

Sı́mbolo Descripción Valor Unidades


u Voltaje de entrada al sistema V
KA Ganancia del amplificador 14.9
Va Voltaje de armadura V
Ra Resistencia de armadura 7.38 Ω
La Inductancia de armadura 4.64×10−2 H
ia Corriente de armadura A
Km Constante del torque motor 31.071×10−3 N-m/A
Tm Torque motor N-m
TL Torque de carga N-m
τL Torque causado por pesos de la carga N-m
Tg1 Torque de entrada a los engranajes N-m
Tg2 Torque de salida de los engranajes N-m
Jm Inercia del motor 1.9062×10−6 kg-m2
Jg Inercia de los engranajes 3.5×10−7 kg-m2
JL Inercia de la carga kg-m2
Bm Constante de fricción del motor 1.8338×10−6 N-m/rad/s
Bg Constante de fricción en engranajes 10−5 N-m/rad/s
BL Constante de fricción en la carga N-m/rad/s
mh Masa del efector final 0.045 kg
mb Masa del brazo 0.06377 kg
L Longitud del brazo 0.776 m
rh Distancia al centro de masa del efector 0.02 m
Vb Voltaje contraelectromotriz V
Kb Constante contraelectromotriz 31.0352×10−3 V/rad/s
g Aceleración de la gravedad 9.81 m/s2
N 1 , N2 N o de dientes de los engranajes N2 > N 1
n Relación de engranajes (n = N2 /N1 ) 19.741
θm Posición angular del motor rad
θ Posición angular de la carga rad
ω Velocidad angular de la carga rad/s
ωm Velocidad angular del motor ωm = nω rad/s
Kw Constante de elasticidad 5.02×10−2 N-m/rad
4 Modelado de Sistemas No Lineales

La ecuación (1.2) es cierta debido a que el espacio angular recorrido por el engranaje
de menor radio debe de ser n veces mayor que el espacio recorrido por el el engranaje
de radio mayor. Por otra parte, el principio de la conservación de la energı́a establece
que el trabajo realizado por el engranaje de la izquierda debe ser igual al trabajo
realizado por el engranaje de la derecha, es decir:

Tg2 θ = Tg1 θm = Tg1 nθ; Tg2 = nTg1 (1.3)

donde Tg2 es el torque de reacción debido al segundo engranaje. El balance mecánico


en el eje articulado al brazo del manipulador produce:

Tg2 = Jg θ̈ + Bg θ̇ + TL (1.4)

donde Jg y Bg representan el momento de inercia y la constante de fricción viscosa


de la caja de reducción respectivamente. El torque de carga TL se formula como (ver
figura 1.2):

TL = JL θ̈ + BL θ̇ + τL (1.5)
L
τL = mb g senθ + mh g (L + rh )senθ = Q sen θ (1.6)
2
L
Q = mb g + mh g (L + rh )
2
donde JL y BL representan el momento de inercia y la constante de fricción viscosa de
la carga no lineal (brazo más efector final), g es la constante gravitacional, mb y mh
denotan las masas del brazo y del efector final (esta masa también incluye la masa de
la carga en el efector) respectivamente, y rh denota la distancia desde el extremo del
brazo al centro de masa de mh . Para fines prácticos asumiremos que rh ≈ 0. Notar
en (1.5) que el torque τL se debe a las fuerzas ejercidas por los pesos del brazo y de
la esfera. Ası́, el torque mb g L senθ
2 se debe al peso mb g del brazo, mientras que el
torque mh g (L + rh )senθ ≈ mh g Lsenθ es causado por el peso mh g del efector, Las
distancias L senθ
2 y (L + rh )senθ ≈ Lsenθ son los correspondientes brazos de palanca
del brazo y del efector respectivamente.
El momento de inercia JL de la carga es la suma del momento de inercia del
brazo Jb más el momento de inercia del efector Jh . Asumiendo que la masa mh
está concentrada en su C.M. (centro de masa), entonces:

Jh = mh (L + rh )2 ≈ mh L2 (1.7)

Del mismo modo, asumiendo que la masa mb del brazo se concentra en su C.M.,
entonces:  2
L
Jb = mb (1.8)
2
Sin embargo, si se considera que la masa del brazo está distribuida a lo largo de su
longitud, entonces debemos aplicar el teorema de los ejes paralelos, el cual establece
que el momento de inercia de una masa m alrededor de un eje que no pasa por su
centro de masa está dado por:
J = Jo + ma2 (1.9)
1.1 Modelado Empleando las Leyes de la Fı́sica 5

donde a es la distancia entre el eje que pasa por el centro de masa de m y el eje
paralelo, y Jo es el momento de inercia alrededor del eje que pasa por su centro de
masa. Aplicando el teorema de los ejes paralelos al brazo, el momento de inercia Jb
con respecto al punto de articulación se formula como:
 2
1 L 1
Jb = mb L2 + mb = mb L2 (1.10)
12 2 3

Por simplicidad, sin embargo, emplearemos las fórmulas dadas en (1.7) y (1.8).

Figura 1.2: El brazo robótico.

Empleando (1.5), (1.6), (1.4), (1.3) y (1.2) en (1.1) y operando se obtiene:

nTm = Jeq θ̈ + Beq θ̇ + τL = Jeq ω̇ + Beq ω + Q senθ (1.11)

donde:
Jeq = n2 Jm + Jg + JL Beq = n2 Bm + Bg + BL
Las expresiones de Q, Jh y Jb (tener en cuenta que JL = Jh + Jb ) se dan en (1.6),
(1.7) y (1.8) respectivamente.

Modelo del Subsistema Eléctrico


El voltaje de armadura Va viene expresado por (ver la descripción de las vari-
ables y parámetros en la Tabla 1.1):

dia
Va = ia Ra + La + Vb (1.12)
dt
donde ia , Ra y La son la corriente, la resistencia y la inductancia en la armadu-
ra del servomotor respectivamente, y Vb es el voltaje de fuerza contraelectromotriz
gobernado por la relación:

Vb = Kb ωm = Kb nω = Kb nθ̇ (1.13)
6 Modelado de Sistemas No Lineales

donde Kb es la constante de fuerza contra-electromotriz y está relacionado con la


velocidad angular ωm del motor. El voltaje de armadura Va es:

Va = uKA (1.14)

donde KA es la ganancia del amplificador.

Conversión de Energı́a Eléctrica en Mecánica


La ecuación de conversión en energı́a eléctrica en mecánica es:

Tm = Km ia (1.15)

donde Km es la constante del motor. Igualando (1.12) con (1.14) obtenemos:

dia KA Kb n Ra
= u− ω− ia (1.16)
dt La La La

Empleando (1.15) en (1.11) y despejando ω̇ = dω/dt obtenemos:

dω Q Beq nKm
=− senθ − ω+ ia (1.17)
dt Jeq Jeq Jeq

Ecuación de Estado
Las ecuaciones (1.16) y (1.17) describen el modelo no lineal del proceso. Eligien-
do como variables de estado: x1 = θ (posición angular), x2 = ω (velocidad angular)
y x3 = ia (corriente de armadura), se obtiene:

ẋ1 = x2
Q Beq nKm
ẋ2 = − senx1 − x2 + x3
Jeq Jeq Jeq
nKb Ra KA
ẋ3 = − x2 − x3 + u (1.18)
La La La
donde la salida es la posición x1 y la señal de control es u.
En la Tabla 1.1 podemos observar que la inductancia de armadura La del ser-
vomotor es bastante pequeña, de modo tal que puede despreciarse sin que se pierda
exactitud en los resultados. Considerando el producto ẋ3 La = 0 en la tercera ecuación
de (1.18) y despejando la corriente de armadura x3 obtenemos:

KA nKb
x3 = u− x2 (1.19)
Ra Ra

Reemplazando (1.19) en la segunda ecuación de (1.18), resulta entonces la ecuación


de estado no lineal de orden dos del manipulador:

ẋ1 = x2
 
P Beq Ra + n2 Km Kb nKm KA
ẋ2 = − senx1 − x2 + u (1.20)
Jeq Jeq Ra Jeq Ra
1.1 Modelado Empleando las Leyes de la Fı́sica 7

Linealización del Modelo no Lineal


Despreciando la inductancia La del servomotor, entonces, para desviaciones
pequeñas de la posición θ = x1 se cumple que senx1 ≈ x1 . Aplicando tal aproximación
en la ecuación (1.20) obtenemos una ecuación de estado lineal de la forma:

ẋ = Ax + Bu (1.21)
      
ẋ1 0 1 x1 0
= Beq Ra +n2 Km Kb + nKm KA u
ẋ2 − JQeq − Jeq Ra
x2 Jeq Ra

y la correspondiente ecuación de salida:


 
 x1
y = Cx + Du = 1 0 + [0] u (1.22)
x2

Ejemplo 1.1

Graficar la respuesta (la posición angular θ) del modelo no lineal de segundo orden y
de los modelos lineales continuo y discreto derivados de dicho modelo. Para fines de
análisis asumir que la señal de entrada u es de 1.4 voltios de magnitud, que BL = Bg
y que el efector final es una esfera de masa mh y de radio rh . En esta situación:

2
Jh = mh rh2 + mh (L + rh )2
5
Solución: El programa C3rpta.m determina tales respuestas (ver figura 1.3) ası́ como
también las funciones de transferencia, la estabilidad, la controlabilidad y la obser-
vabilidad de los modelos lineales continuo y discreto. ♣

1.1.2. Manipulador Robótico con Articulación Elástica (MRAE)


La figura 1.4 muestra el Manipulador Robótico con Articulación Elástica (MRAE)
de 1GDL, el cual es simplemente un manipulador de un solo eslabón pero con articu-
lación elástica. El efecto del acoplamiento elástico entre el eje de salida del servomotor
con el brazo (o eslabón) del MRAE, se puede modelar mediante un resorte rotacional
con constante de elasticidad Kw .
En la figura 1.4, u denota el voltaje de entrada, θ (la salida del proceso) es
la posición angular del brazo de longitud L y masa mb , θm representa la posición
angular del eje del actuador (el servomotor DC) antes de la caja de reducción. Al
extremo del brazo se puede articular un efector final, como en el caso del manipulador
de 1GDL. La tabla 1.1 también describe las variables y los valores de los parámetros
del sistema mostrado en la figura 1.1.

Ecuaciones Dinámicas del MRAE


El balance mecánico en el eje del servomotor articulado al primer engranaje se
expresa como:
Tm = Jm θ̈m + Bm θ̇m + Tg1
8 Modelado de Sistemas No Lineales

0.8

y(t) NO LINEAL [rad]


0.6

0.4

0.2

0
0 50 100 150

6
y(t) LINEAL [rad]

0
0 50 100 150

6
y(k) LINEAL [rad]

0
0 50 100 150
Tiempo en segundos

Figura 1.3: Respuestas de los modelos no lineal, lineal continuo y lineal discreto del
brazo robótico a una entrada u escalón de magnitud 1.4 voltios.

M2
Jm mH
Ra JL
+ + + Tm Tg1 L
θm BL
u Va Vb n Bg K ω m
- - -
KA La θ m Bm
Gearbox
Jg
n Tg2 θ
Ia

Figura 1.4: Manipulador Robótico con Articulación Elástica (MRAE).

donde Jm y Bm representan el momento de inercia y la constante de fricción viscosa


del rotor, Tm es el torque del servomotor y Tg1 es el torque de reacción debido al
primer engranaje. El balance mecánico del eje articulado a la carga se expresa como:
 
θ̈m θ̇m θm
Tg2 = Jg + Bg + Kw −θ
n n n

en donde Kw θnm − θ es el torque originado por el acoplamiento elástico, Tg2 es el


torque debido al segundo engranaje, n = N2 /N1 denota la relación de transmisión de
los engranajes, y Jg y Bg representan el momento de inercia y la constante de fricción
1.1 Modelado Empleando las Leyes de la Fı́sica 9

viscosa de la caja de reducción respectivamente. Asumiendo engranajes ideales, la


conservación de la energı́a requiere que el trabajo realizado por cada engranaje debe
de ser el mismo, a saber:
θm
Tg1 θm = Tg2
n
Empleando las relaciones anteriores, la ecuación que gobierna el torque servomotor
se formula como:
 
Jeq θ̈m Beq θ̇m Kw θm
Tm = + + −θ (1.23)
n n n n n n

Jeq = n2 Jm + Jg Beq = n2 Bm + Bg
La ecuación que gobierna la dinámica del brazo del manipulador se puede expresar
como:  
θm 1
Kw − θ = JL θ̈ + BL θ̇ + mb gLsen θ + mh gLsin θ (1.24)
n 2
donde JL y BL representan el momento de inercia y la constante de fricción viscosa
de la carga no lineal (brazo más efector), g es la constante gravitacional, mb y mh
(esta masa también incluye la masa de la carga) denotan la masa del del brazo y
del efector respectivamente y, 12 mb gLsen θ y mh gLsin θ son los torques debido a los
pesos del brazo y del efector respectivamente. El momento de inercia de JL = Jh +Jb ,
asumiendo que las masas mh y mb se concentran en sus respectivos C.M. se da en las
ecuaciones (1.7) y (1.8):
 2
2 L
JL = mh L + mb
2
Para completar el modelado de la parte eléctrica del proceso MRAE, podemos
aseverar que:
dia
Ra ia + La + Vb = KA u (1.25)
dt
donde KA es la ganancia del amplificador y Vb es el voltaje de la fuerza contra
electromotrı́z y responde a la relación:

Vb = Kb θ̇m (1.26)

donde Kb es la constante de fuerza contra electromotriz. El torque servomotor Tm es


también proporcional a la corriente ia , es decir:

Tm = Km ia (1.27)

donde Km es la constante del servomotor.

Modelo de Lagrange del MRAE


Empleando las ecuaciones (1.23) y (1.24), el modelo de Lagrange del MRAE se
puede formular como (ver por ejemplo ( 1.113)):

T = Hq̈ + Cq̇ + d (1.28)


10 Modelado de Sistemas No Lineales

donde:
   Jeq    Beq    
Tm 0 θ̈m
0 θ̇m Kw θm
−θ
     
n n n n n n
 =  +  + 
0 0 JL θ̈ 0 BL θ̇ d2
   
1 θm
d2 = mb + mh Lg sin θ − Kw −θ
2 n
Despreciando la inductancia de armadura La en (1.25), y despejando ia se obtiene:
Kb KA
ia = − θ̇m + u (1.29)
Ra Ra
Sustituyendo ia en Tm = Km ia de (1.28) y despejando u, el modelo de Lagrange
toma una nueva forma:
     θ̈     θ̇   
u m11 0 m p 11 0 m d1
 =  n   n  
+  +  (1.30)
0 0 JL θ̈ 0 BL θ̇ d2
 
Ra Jeq nKb Ra Beq Ra Kw θm
m11 = p11 = + d1 = −θ
nKA Km KA nKA Km nKA Km n

Modelo en el Espacio de Estado del MRAE


Seleccionando como variables de estado: x1 = θ, x2 = θ̇, x3 = θm /n, x4 =
θ̇m /n, y x5 = ia , entonces el vector de estado del sistema es de orden 5. Luego,
las ecuaciones (1.23), (1.24) y (1.25) (sin despreciar la inductancia La ) producen la
siguiente ecuación de estado no lineal:
   
ẋ1 f1 (x, u)
 ẋ2   f2 (x, u) 
   
ẋ =    
 ẋ3  = f (x, u) =  f3 (x, u)  (1.31)
 ẋ4   f4 (x, u) 
ẋ5 f5 (x, u)

f1 (x, u) = x2
Kw BL Kw Lg  mb 
f2 (x, u) = − x1 − x2 + x3 − + mh sen x1
JL JL JL JL 2
f3 (x, u) = x4
Kw Kw Beq nKm
f4 (x, u) = x1 − x3 − x4 + x5
Jeq Jeq Jeq Jeq
nKb Ra KA
f5 (x, u) = − x4 − x5 + u
La La La
donde hemos usado el hecho de que ẋ1 = x2 y ẋ3 = x4 . Si la salida del sistema es
y = θ, entonces la ecuación de salida del MRAE resulta:

y = h(x) = Cx = [1 0 0 0 0] x (1.32)
1.1 Modelado Empleando las Leyes de la Fı́sica 11

Despreciando la inductancia de armadura La en (1.31), lo que equivale a elimi-


nar un elemento almacenador de energı́a independiente (por consiguiente, eliminar
una variable de estado), entonces:
nKb KA
La ẋ5 = 0 = −nKb x4 − Ra x5 + KA u ⇒ x5 = − x4 + u
Ra Ra
Reemplazando x5 en la cuarta ecuación de (1.31), se obtiene una ecuación de estado
no lineal de orden 4:    
ẋ1 f1 (x, u)
 ẋ2   f2 (x, u) 
   
 ẋ3  =  f3 (x, u) 
(1.33)
ẋ4 f4 (x, u)

f1 (x) = x2
Kw BL Kw Lg  m 
f2 (x) = − x1 − x2 + x3 − + mH sin x1
JL JL JL JL 2
f3 (x) = x4
 2 
Kw Kw n Km Kb Beq nKm KA
f4 (x) = x1 − x3 − + x4 + u
Jeq Jeq Jeq Ra Jeq Jeq Ra
La salida del sistema en este caso se expresa como:

y = h(x) = Cx = [1 0 0 0] x (1.34)

1.1.3. Sistema Péndulo Invertido–Grúa Puente


El sistema péndulo invertido–grúa puente consiste de una varilla metálica mon-
tada sobre un carro que se desplaza sobre rieles. Cuando la varilla toma la posición
vertical hacia arriba (posición inestable), entonces el sistema se denomina péndu-
lo invertido. Si la posición de la varilla es vertical y hacia abajo (posición estable),
el sistema se conoce como grúa puente. La tabla 1.2 muestra la descripción de las
variables y parámetros para los sistemas péndulo invertido y grúa puente. Los val-
ores de tales parámetros se obtuvieron de las hojas de especificaciones y mediante
experimentación.

Sistema Péndulo Invertido


El sistema péndulo invertido consiste de un péndulo (una varilla) montado
sobre un carro que se desplaza en forma horizontal. Este carro está impulsado por un
servomotor D.C. a través de un sistema de poleas, tal como se muestra en la figura 1.5.
Para mayor claridad, el sistema péndulo invertido se ha separado en dos subsistemas:
el subsistema conformado por el carro y el péndulo y el subsistema conformado por
el motor y las poleas.

Modelado del Subsistema Carro–Péndulo


El subsistema carro–péndulo se ilustra en la figura 1.6 y está conformado por
un carro y una varilla metálica fijada al carro por medio de un pivote móvil. Observar
que los centros de gravedad de la varilla zv y de la esfera ze se ubican en:
12 Modelado de Sistemas No Lineales

Tabla 1.2: Variables y parámetros valorados para el sistema péndulo invertido–grúa


puente.

Sı́mbolo Descripción Valor Unidades


u Voltaje de entrada al sistema V
KA Ganancia del amplificador 14.9
Va Voltaje de armadura V
Ra Resistencia de armadura 7.38 Ω
La Inductancia de armadura ∼
=0 H
ia Corriente de armadura A
Km Constante del torque motor 31.071×10−3 N-m/A
Tm Torque motor kg-m
Tg1 Torque de entrada a los engranajes kg-m
Tg2 Torque de salida de los engranajes kg-m
Jm Inercia del motor 1.9062×10−6 kg-m2
Jg Inercia de los engranajes ∼
=0 kg-m2
Jp Momento de inercia de la polea kg-m2
Je Momento de inercia de la esfera kg-m2
Jv Momento de inercia de la varilla kg-m2
Bm Constante de fricción del motor 1.8338×10−6 N-m/rad/s
Bg Constante de fricción en engranajes ∼
=0 N-m/rad/s
F fuerza aplicada al carro N
me Masa de la esfera (no se usó) 0 kg
mb Masa del brazo 0.06377 kg
L Longitud del brazo 0.776 m
re Radio de la esfera 0.02 m
rp Radio de la polea 0.0648 m
mv Masa de la varilla 0.063095 kg
mc Masa del carro 0.92 kg
mp Masa de la polea 0.2 kg
z Posición del carro m
lv Longitud de la varilla 0.767 m
le Distancia entre P y la esfera m
ze Posición horizontal (esfera) m
zv Posición horizontal (varilla) m
ye Posición vertical (esfera) m
yv Posición vertical (varilla) m
Vb Voltaje contraelectromotriz V
Kb Constante contraelectromotriz 31.0352×10−3 V/rad/s
g Aceleración de la gravedad 9.81 m/s2
N 1 , N2 N o de dientes de los engranajes N2 > N 1
n= Relación de engranajes (n = N2 /N1 ) 19.741
θm Posición angular del motor rad
θ Posición angular del péndulo rad
ω Velocidad angular de la carga rad/s
ωm Velocidad angular del motor rad/s
1.1 Modelado Empleando las Leyes de la Fı́sica 13

+ Fuerza de
u control y’
-
Servomotor
D.C. y
θ Pendulo

z F

Carro

Figura 1.5: Sistema péndulo invertido.


y y’
z

11
00
00
11
00
11
l v /2
me g
θ
mvg lv
le
z’
0
z
P
F

Figura 1.6: Subsistema carro–péndulo.

lv
ze = z + le senθ zv = z + senθ (1.35)
2
Para simplificar el procedimiento de modelado del péndulo, aplicaremos las leyes
de Newton para los movimientos lineal y rotacional, considerando al péndulo como
un todo. Para el movimiento lineal, dicha ley establece que para un sistema de N
partı́culas:

N
d2 M
mi 2 ri = Fj (1.36)
dt
i=1 j=1

donde mi es la masa de la i-ésima partı́cula, ri es el vector posición del centro de


masa de la i-ésima partı́cula y Fj es el j-ésimo vector fuerza aplicada al sistema de
partculas. Aplicando la ecuación (1.36) a nuestro sistema en la dirección z obtenemos:

d2 d2 d2
mc z + m z
e 2 e + mv 2 zv = F (1.37)
dt2 dt dt
Sustituyendo ze y zv (ecuación (1.35) en (1.37)) resulta:

d2 d2 d2 lv
mc 2
z + me 2
(z + l e sen θ) + mv 2
(z + sen θ) = F (1.38)
dt dt dt 2
14 Modelado de Sistemas No Lineales

Desarrollando las derivadas se obtiene:


lv lv
(mc + me + mv )z̈ − (me le + mv )(sen θ) + θ̇2 (me le + mv )(cos θ)θ̈ = F (1.39)
2 2
Para completar el modelado, usamos la segunda ley de Newton aplicada al
movimiento rotatorio alrededor del punto pivote P del carro. Esta ley establece que
para un sistema de N partı́culas en movimiento rotacional con respecto a un sistema
de referencia inercial, y sometidas a M torques externos perpendiculares al plano de
giro, se cumple que:
N
d 2 θi 
M
Ji 2 = τj (1.40)
dt
i=1 j=1

donde τj es el j-ésimo torque externo, Ji es el momento de inercia de la i-ésima masa


respecto al punto pivote P y θi es el ángulo recorrido por la i-ésima masa alrededor
del punto P. Para aplicar la ley al movimiento rotatorio de la varilla alrededor del
punto P, empleamos la tercera ley de Newton de acción y reacción, la cual nos permite
formular el efecto de la aceleración del péndulo en el sistema de referencia Z  − Y 
(ver figura 1.6), mediante una fuerza mi z̈ aplicada en el centro de masa de dicho
sistema, pero en dirección opuesta a la aceleración. Empleando (1.40) en el péndulo
de figura 1.6 obtenemos:
lv lv
(Je + Jv )θ̈ = me gle sen θ + mv g sen θ − me z̈le cos θ − mv z̈ cosθ (1.41)
2 2
Observar en (1.41) que los torques me gle sen θ y mv g l2v sen θ actuando en P son pro-
ducidos por los pesos me g y mv g respectivamente, mientras que los torques de reac-
ción me z̈le cos θ y mv z̈ l2v cosθ, actuando ambos también en P, son producidos por las
fuerzas de reacción me z̈ y mv z̈ respectivamente. Reordenando (1.41):
lv lv
(me le + mv )g(sen θ) − (me le + mv )z̈(cos θ) = (Je + Jv )θ̈ (1.42)
2 2
donde:
lv2
Je = me le2 Jv = mv (1.43)
3
El momento de inercia de Je con respecto al punto de giro P asume que la masa me
está concentrada en un punto, por ello basta multiplicar la masa me por su distancia
al punto P elevado al cuadrado. Para el caso de la varilla, la expresión dada en Jv
corresponde al momento de inercia de una varilla girando por uno de sus extremos
(el punto P).

Modelado del Subsistema Motor–Polea


El subsistema motor-polea se muestra en la figura 1.7. Sabemos que el voltaje
contraelectromotriz es proporcional la velocidad angular θm :

Vb = Kb θ̇m (1.44)

El voltaje de armadura Va se expresa como:


dia
Va = KA u = Ra ia + La + Vb ∼
= Ra ia + Kb θ̇m La ∼
=0 (1.45)
dt
1.1 Modelado Empleando las Leyes de la Fı́sica 15

En la relación (1.2) se estableció para los engranajes de reducción de un servomotor:


N2 θm
n= = θm = nθ n>1
N1 θ
El torque motor Tm debe vencer a su inercia y al torque Tg1 a la entrada del del tren
de engranajes:

Tm = Jm θ̈m + Bm θ̇m + Tg1 = nJm θ̈ + nBm θ̇ + Tg1 (1.46)

Asumiendo engranajes ideales, la conservación de la energı́a requiere que el trabajo


(torque por posición angular) realizado en cada engranaje sea el mismo:

Tg1 θm = Tg1 nθ = Tg2 θ nTg1 = Tg2 (1.47)

El torque Tg2 a la salida del tren de engranajes debe vencer a la inercia Jg de los
engranajes, a la inercia Jp de la polea y al torque de polea F rp (rp es el radio de la
polea):
Tg2 = Jg θ̈ + Bg θ̇ + Jp θ̈ + Bp θ̇ + F rp = nTg1 (1.48)
Sustituyendo (1.48) en (1.46) se obtiene:

nTm = Jeq θ̈ + Beq θ̇ + F rp (1.49)

donde:
Jeq = Jm + n2 (Jg + Jp ) Beq = Bm + n2 (Bg + Bp )
Para transformar el desplazamiento angular θ del servomotor en el desplazamiento
horizontal z del carro, empleamos:

z = rp θ (1.50)

El torque producido en el eje del servomotor es proporcional a la corriente de ar-


madura:
1  1 z̈ ż

Tm = Km ia = Jeq θ̈ + Beq θ̇ + F rp = Jeq + Beq + F rp (1.51)
n n rp rp
Despejando ia de (1.45), sustituyéndola en (1.51) y luego despejando F de la relación
resultante se obtiene:
 
nKm KA Jeq Beq n2 Km Kb
F = u − 2 z̈ − + ż (1.52)
Ra rp rp n2 rp2 Ra rp2

Ra θm
+
u Va Vb Jo rp
-
La Jm F
Bm Bo

Figura 1.7: Subsistema motor-polea.


16 Modelado de Sistemas No Lineales

Igualando (1.39) con (1.52) resulta:


 
nKm KA Jeq Beq n2 Km Kb
u − 2 z̈ − + ż =
Ra rp rp rp2 Ra rp2
lv lv
(mc + me + mv )z̈ − (me le + mv )(sen θ)θ̇2 + (me le + mv )(cos θ)θ̈ (1.53)
2 2

Las ecuaciones (1.42) y (1.53) representan el modelo dinámico no lineal del sistema
péndulo invertido controlado por la corriente de armadura. Tales ecuaciones pueden
ser escritas en forma compacta como:

(M1 + J2 )z̈ − M2 (sen θ)θ̇2 + M2 (cos θ)θ̈ − Kx KA u + Bx ż = 0


M2 g(sen θ) − M2 z̈(cos θ) − J1 θ̈ = 0 (1.54)

donde:

lv
M1 = mc + me + mv ; M2 = me le + mv ; J1 = Je + Jv
2

Jeq nKm Beq n2 Kb Km


J2 = ; Kx = ; Bx = +
rp2 Ra rp rp2 rp2 Ra

Representación en el Espacio de Estado

Seleccionemos las siguientes variables de estado: x1 = θ, x2 = θ̇, x3 = z y


x4 = ż. Es claro que en este sistema de orden 4: ẋ1 = x2 y ẋ3 = x4 . Las otras dos
ecuaciones de estado se determinan de (1.54) como sigue. Multiplicando la primera
ecuación por J1 y la segunda por M2 cosθ y sumando ambas ecuaciones, la expresión
resultante nos permite despejar z̈ = ẋ4 . Multiplicando ahora la primera ecuación
por M2 cosθ y la segunda por M1 + J2 y sumando ambas ecuaciones, la expresión
resultante nos permite despejar θ̈ = ẋ2 . Operando, se obtiene:
 
  x2
ẋ1  M2 (sin x1 )(cos x1 )x22 −Bx (cos x1 )x4 −(M1 +J2 )g(sin x1 )+Kx (cos x1 )KA u 
 ẋ2   (M2 (cos2 x1 )−(M1 +J2 )J1 )/M2

   
 ẋ3  =  x4  (1.55)
 
ẋ4 M22 g(sin x1 )(cos x1 )−J1 M2 (sin x1 )x22 +J1 Bx x4 −J1 Kx KA u
M22 (cos2 x1 )−(M1 +J2 )J1

y puesto que en nuestro sistema las salidas disponibles son el desplazamiento angular
x1 de la varilla y el desplazamiento x3 del carro, la ecuación de salida toma la forma:

y = h(x) = Cx (1.56)

donde:
 
1 0 0 0
C=
0 0 1 0
1.1 Modelado Empleando las Leyes de la Fı́sica 17

Obtención del Modelo Lineal


Notar que (1.55) puede ser puesta en la forma:
   
ẋ1 f1 (x, u)
 ẋ2   f2 (x, u) 
ẋ = 
 ẋ3
 = f(x, u) = 
  f3 (x, u)

 (1.57)
ẋ4 f4 (x, u)

Para la operación del proceso alrededor del estado de equilibrio xo = [0, 0, 0, 0]T = 0
y uo = 0, las matrices A, B, C y D pueden ser determinadas evaluando las siguientes
matrices jacobianas:
 ∂f1 ∂f1   ∂f1 ∂f1 
∂X1 · · · ∂Xn ∂U1 · · · ∂Um
 ..   .. 
A =  ... ..
. .  B =  ... ..
. . 
∂fn ∂fn ∂fn ∂fn
∂X1 ··· ∂Xn (xo , uo ) ∂U1 ··· ∂Um (xo , uo )
   
∂h1
∂X1 ··· ∂h1
∂Xn
∂h1
∂U1 ··· ∂h1
∂Um
 .. .. ..   .. .. .. 
C =  . . .  D= . . .  (1.58)
∂hr
∂X1 ··· ∂hr
∂Xn (xo , uo )
∂hr
∂U1 ··· ∂hr
∂Um (xo , uo )

Ası́ obtenemos el siguiente modelo lineal para el sistema péndulo invertido:

ẋ = Ax + Bu (1.59)

donde:
   
0 1 0 0 0
 (M1 +J2 )M2 g Bx M2   −Kx M2 KA 
 (M1 +J2 )J1 −M22
0 0 (M1 +J2 )J1 −M22   (M1 +J2 )J1 −M22 
A=


 B= 
 0 0 0 1   0 
−M22 g −J1 Bx J1 Kx KA
(M1 +J2 )J1 −M22
0 0 (M1 +J2 )J1 −M22 (M1 +J2 )J1 −M22

Sistema Grúa–Puente
El modelado del sistema grúa-puente es similar al modelado del péndulo inver-
tido. En este caso caso el péndulo debe apuntar hacia abajo, tal como se muestra en
la figura 1.8. Al igual que en el caso del péndulo invertido, para mayor facilidad, el
sistema grúa puente se puede subdividir en dos subsistemas: carro–varilla y motor–
polea. El subsistema carro-varilla está representado en la figura 1.9. De dicha figura
podemos observar que los centros de gravedad zv de la varilla y ze de la esfera son:
lv
ze = z − le sen θ zv = z − sen θ
2

Con un procedimiento similar al realizado para el sistema péndulo invertido, se


puede llegar a las siguientes ecuaciones:

(M1 + J2 )z̈ + M2 (sen θ)θ̇2 − M2 (cos θ)θ̈ − Kx KA u + Bx ż = 0


−M2 g(sen θ) + M2 z̈(cos θ) − J1 θ̈ = 0 (1.60)
18 Modelado de Sistemas No Lineales

+ Fuerza de
u control
-
Servomotor
D.C. y

z F

Carro

θ
’ puente
Grua
y’

Figura 1.8: Sistema grúa–puente.

y y’
z

P z’
0
F z
lv
θ
2
111
000 le
000
111
000
111
000 m v g
111 lv

me g

Figura 1.9: Subsistema carro-varilla de sistema grúa–puente.

donde:

lv
M1 = mc + me + mv ; M2 = me le + mv ; J1 = Je + Jv
2

Jeq nKm Beq n2 Kb Km


J2 = ; Kx = ; Bx = +
rp2 Ra rp rp2 rp2 Ra

Como era de esperarse, las relaciones y (1.54) (1.60) sólo se diferencian en los signos.

Representación en el Espacio de Estado

Las ecuaciones arriba obtenidas se representan en el espacio de estados mediante


la siguiente asignación de variables: x1 = θ, x2 = θ̇, x3 = z, x4 = ż. Como en el caso
del sistema péndulo invertido, las ecuaciones del sistema grúa–puente en el espacio
1.1 Modelado Empleando las Leyes de la Fı́sica 19

de estado toman la forma:


 
  x2
ẋ1  −M2 (sin x1 )(cos x1 )x22 −Bx (cos x1 )x4 −(M1 +J2 )g(sin x1 )+Kx (cos x1 )KA u 
 ẋ2   (−M2 (cos2 x1 )+(M1 +J2 )J1 )/M2

    (1.61)
 ẋ3  =  x4 
 2 g(sin x )(cos x )−J M (sin x )x2 −J B x +J K K u

ẋ4 −M 2 1 1 1 2 1 2 1 x 4 1 x A
2 2
−M2 (cos x1 )+(M1 +J2 )J1

y puesto que tenemos como salidas disponibles el desplazamiento angular de la var-


illa y el desplazamiento del carro, tendremos entonces como ecuación de salida la
expresión dada en (1.56).

Obtención del Modelo Lineal


El modelo lineal del sistema grúa–puente, como en el caso del péndulo invertido,
posee la forma dada en 1.59, pero en este caso con:
   
0 1 0 0 0
 −(M1 +J2 )M2 g 0 0 −Bx M2   Kx M2 KA 
 (M1 +J2 )J1 −M 2 (M +J )J −M 2   (M1 +J2 )J1 −M22 
A= 
2 1 2 1 2 
 ; B =   (1.62)
 0 0 0 1   0 
−M22 g −J1 Bx J1 Kx KA
(M +J )J −M 2
0 0 (M +J )J −M 2 (M1 +J2 )J1 −M22
1 2 1 2 1 2 1 2

1.1.4. Sistema Tanque de Agua


El proceso tanque de agua estudiado aquı́ se muestra en la figura 1.10. En
este proceso, el agua frı́a que se envı́a al tanque se calienta en forma controlada. El
agua calentada que sale del tanque puede ser usado luego por los consumidores. Este
proceso es multivariable porque posee dos entradas de control: el flujo de entrada
al tanque y el calor suministrado al agua mediante una resistencia eléctrica, y dos
variables a controlar: el nivel del tanque y la temperatura de salida del agua calentada.
La tabla 1.3 describe las variables y los valores de los parámetros del tanque de agua
mostrado en la figura 1.10.

Modelo Lineal del Proceso Nivel


El volumen de agua acumulado en el tanque se modela como:

dh
S = S ḣ = qi − qo (1.63)
dt
Considerando un flujo laminar de salida:

h
qo = (1.64)
Rh

donde la resistencia hidráulica Rh se calcula de la relación:

H
Rh = (1.65)
Q
20 Modelado de Sistemas No Lineales

Tabla 1.3: Parámetros y variables del proceso tanque de agua.

Sı́mbolo Descripción Valor Unid.


dS Diámetro del tanque 0.0265 m
S Sección circular del tanque 0.055 m2
H Nivel del agua en estado estable 0.12 m
H Nivel del agua m
h Nivel perturbacional del agua: h = H − H m
Q Flujo de agua en estado estable 0.16 m3 /h
Qi Flujo de agua de entrada al tanque m3 /s
Qi Flujo de entrada en estado estable 0.16 m3 /h
qi Flujo perturbacional del agua: qi = Qi − Qi m3 /s
Qo Flujo de agua de salida del tanque m3 /s
qo Flujo perturbacional a la salida: qo = Qo − Qo m3 /s
Rh Resistencia hidráulica del tanque: Rh = H/Q̄ 2700 s/m2
g Aceleración de la gravedad 9.81 m/s2
ρ Densidad del agua 1000 kg/m3
do Diámetro del orificio de salida 0.0127 m
Ao Sección del orificio de salida 0.000126 m2
Av Sección de la vena contracta m2
Cc Coeficiente de corrección entre Ao y Av 0.6 a 1
Cv Coeficiente de corrección por pérdidas 0.8 a 0.99
Cd Coeficiente de descarga:Cd = Cv Cc 0.5

a Factor de flujo turbulento: a = Cd AO 2g 0.00028 m2.5 /s
J
Cp Calor especı́fico del agua 4186.8 kg K
Ct Capacitancia térmica del tanque: Ct = ρSHCp 27633 K/W
Rt Resistencia térmica del tanque: Rt = C 1ρQ 0.0054 K/W
p
Θa Temperatura del ambiente 27.0 oC

Θo Temperatura en el tanque en estado estable 28.5 oC

Θo Temperatura del agua de salida oC

θo Temperatura perturbacional: θo = Θo − Θo oC

Φi Calor entregado por la resistencia eléctrica W


Φi Calor entregado en estado estable 1540 W
ΦT Calor del agua en el tanque W
Φo Calor que toma el flujo de salida W
Φs Calor que se libera al exterior: Φs = ΘoR−Θt
a
W
Φc Calor que trae consigo el flujo de entrada W
1.1 Modelado Empleando las Leyes de la Fı́sica 21

Figura 1.10: Proceso tanque de agua.

Entonces, la ecuación de estado del proceso nivel toma la forma:


1 1
ḣ = − h + qi (1.66)
SRh S
y su función de transferencia resulta:
h(s) Rh
= (1.67)
qi (s) SRh s + 1
donde el producto SRh es la constante de tiempo del proceso nivel.

Determinación Experimental de Rh
La válvula de control empleada para regular la entrada de agua al tanque es del
tipo VXN015F250, con diámetro nominal DN15, conexión G1B y actuador motórico.
La abertura máxima se obtiene alimentando con 10 V al actuador, la cual corresponde
a un flujo de 0.4 m3 /h, de acuerdo al manual del fabricante. La mı́nima abertura,
con 0 V, corresponde a un flujo de 0 m3 /h. Esto significa que para una abertura de
1 V el flujo que pasa por la válvula es de 1/90000 m3 /s.
Asumiendo una variación lineal entre el flujo Qi que pasa por la válvula y
la altura H del tanque, se realizó el siguiente experimento. Con una abertura de
válvula para 4 V (0.16 m3 /h), se abrió convenientemente la válvula de descarga
hasta lograr una altura estable de 0.12 m. Luego, con una abertura de válvula para
6 V (0.24 m3 /h), se siguió abriendo la válvula de descarga hasta lograr una altura
de 0.18 m. Empleando la relación (1.65), la resistencia hidráulica para cada punto
resultó aproximadamente Rt = 2700 s/m2 . Se asume también que los valores estables
de H y Qi son H = 0.12 m y Q = 0.16 m3 /h.
22 Modelado de Sistemas No Lineales

Modelo Lineal del Proceso Temperatura


El calor en el interior del tanque se modela aproximadamente como:
dθo
Ct = Φi − Φo (1.68)
dt
donde:
Φo = Cp ρ Q θo (1.69)
Por consiguiente, la ecuación de estado del proceso temperatura resulta:
1 1
θ˙o = − θo + Φi (1.70)
Rt Ct Ct
donde la capacitancia térmica Ct y la resistencia térmica Rt se calculan de:
1
Ct = ρSHCp Rt = (1.71)
Cp ρQ
La función de transferencia del proceso temperatura toma la forma:
θo (s) Rt
= (1.72)
Φi (s) Ct Rt s + 1
donde el producto Ct Rt es la constante de tiempo de dicho proceso.

Modelo No Lineal del Proceso Tanque de Agua


El volumen de agua acumulado en el tanque se modela como:
dH
S = S Ḣ = Qi − Qo (1.73)
dt
donde, para orificios circulares pequeños, se puede formular [?]:
 √ 
Qo = Cd Ao 2gh = a h; a = Cd Ao 2g (1.74)
Se sabe además que [?]:
Cd = CvCc ; 0.8 ≤ Cv ≤ 0.99; 0.6 ≤ Cc ≤ 1 (1.75)
Para nuestro estudio tomaremos Cd =0.5. De (1.73) se obtiene la primera ecuación
de estado:
a√ 1
Ḣ = − H + Qi (1.76)
S S
Por otro lado, el balance de energı́a térmica dentro del tanque se formula:
ΦT = −Φo − Φs + Φc + Φi (1.77)
donde:
Q2o dΘo dΘo
ΦT = SρCp 2
= SρCp H (1.78)
a dt √ dt
Φo = Cp ρΘo Qo = Cp ρaΘo H (1.79)
Θo − Θa
Φs = (1.80)
Rt
Φc = Cp ρΘi Qi (1.81)
1.1 Modelado Empleando las Leyes de la Fı́sica 23

dΘo
La segunda ecuación de estado se obtiene despejando dt = Θ̇o de (1.77):

a Θo 1 Θo Θa 1 Θi Qi 1 Φi
Θ̇o = − √ − + + + (1.82)
S H SρCp Rt H SρCp Rt H A h SρCp H

Para linealizar el proceso tanque emplearemos la técnica del Jacobiano. Para ello se
definen los siguientes vectores de estado y de control:
           
X1 H Ẋ1 f1 U1 Qi
X= = ; Ẋ = = ; U= = (1.83)
X2 Θo Ẋ2 f2 U2 Φi

de modo tal que (1.76) y (1.82) toman la forma:


a 1
Ẋ1 = − X1 + X1 = f1 (1.84)
S S
a X2 1 X2 θa 1 θ i U1 1 U2
Ẋ2 = − √ − + + + = f2 (1.85)
S X1 SρCp Rt X1 SρCp Rt X1 S X1 SρCp X1
Tomando derivadas parciales y haciendo notar que una barra sobre una variable
indica el valor estacionario de dicha variable, se obtiene:
∂f1 a 1/2 a
= − X =− 
∂X1 2S 1 2S X 1
∂f1
= 0
∂X2
∂f1 1
=
∂U1 S
∂f1
= 0
∂U2
∂f2 a −3/2 1 θa θi 1
= X2 X1 + X2 X1−2 − X −2 − U1 X1−2 − U2 X1−2
∂X1 2S SρCp Rt SρCp Rt 1 S SρCp
a X2 1 X2 θa 1 θi U 1 1 U2
=  + − − −
2S 3 SρCp Rt X 2 SρCp Rt X 2 S X 2 SρCp X 2
X1 1 1 1 1

∂f2 a 1 1 1
= −  −
∂X2 S X 1 SρCp Rt X 1
∂f2 θi 1
=
∂U1 S X1
∂f2 1 1
= (1.86)
∂U2 SρCp X 1

Luego el proceso tanque de agua linealizado queda como:

ẋ = Ax + Bu (1.87)

donde:    
∂f1 ∂f1 ∂f1 ∂f1
A= ∂X1 ∂X2 B= ∂U1 ∂U2
∂f2 ∂f2 ∂f2 ∂f2
∂X1 ∂X2 ∂U1 ∂U2
24 Modelado de Sistemas No Lineales

Determinación de las Fuerzas de Control en Estado Estable


El actuador que emplea el sistema de control de temperatura trabaja en el rango
de voltaje de 1 a 5 V. Con 5 V, el calefactor proporciona un flujo máximo de calor
de 7700 W, de acuerdo al manual del fabricante. Asumiendo una correspondencia
lineal entre el voltaje que ingresa al actuador y el flujo de calor entregado, entonces
para subir 1 V en dicho actuador (de 1 a 2 V o de 4 a 5 V por ejemplo), se debe de
proporcionar 7700/4 = 1925 W.
El cálculo de las matrices A y B requiere conocer los valores de Qi = U 1 y
Φi = U 2 . Para ello, experimentalmente se mantuvo en el tanque una altura de H
= 0.11 m a una temperatura de 27.5 o C. Luego, se subió en 1 V al actuador (se
incrementó el calor en 1925 W), hasta que la nueva temperatura en el tanque se
estabilizó en 27.5 o C a una altura de 0.12 m. Por consiguiente, los valores a tomar
en los cálculos son U 1 = 0.16 m3 /h, correspondiente a una altura de H = 0.12 m
(determinado anteriormente) y = U 2 = 1925 W.

1.2. Método de Las Ecuaciones de Lagrange


1.2.1. Las Ecuaciones de Lagrange
Las ecuaciones diferenciales que gobiernan el movimiento de complicados sis-
temas mecánicos, se pueden obtener empleando las ecuaciones de Lagrange, las cuales
se derivan de las leyes de Newton del movimiento. El método de las ecuaciones de
Lagrange considera cantidades escalares (energı́as potencial y cinética) en lugar de
vectores (fuerzas y torques), minimizando ası́ la necesidad de complicados diagramas
vectoriales.
El modelo dinámico del sistema obtenido con el método de las ecuaciones de
Lagrange será denominado modelo de Lagrange. Este modelo también nos permite
determinar el modelo en el espacio de estado. El método en cuestión requiere de
la representación del proceso mediante un conjunto de coordenadas generalizadas qi
(i = 1, 2, . . . , r), una para cada grado de libertad independiente del proceso. Luego, la
energı́a cinética V y la energı́a potencial U se formulan en términos de tales coorde-
nadas y de sus derivadas con el fin de establecer la función Lagrangiana del proceso,
la cual toma la forma:

L = V (q1 , . . . , qr , q̇1 , . . . , q̇r ) − U (q1 , . . . , qr , q̇1 , . . . , q̇r ) (1.88)

De la ecuación (1.88), es claro que: L = L(q1 , . . . , qr , q̇1 , . . . , q̇r ). Por otra parte, de
acuerdo al principio de de la mı́nima acción de Hamilton para sistemas conservativos,
la integral I definida por:
 t2
I= L(q1 , . . . , qr , q̇1 , . . . , q̇r )
t1

es un extremo para la trayectoria de movimiento del sistema desde el tiempo t1 hasta


el tiempo t2 . En adición, la variación de I es igual al trabajo realizado por fuerzas
externas. Basado en el principio de Hamilton, se puede demostrar que las ecuaciones
que gobiernan el movimiento de un proceso dinámico constituyen las ecuaciones de
1.2 Método de Las Ecuaciones de Lagrange 25

Lagrange [1], [2]:


 
d ∂L ∂L
− = Qi i = 1, 2, . . . , r (1.89)
dt ∂ q̇i ∂qi
donde Qi indica las fuerzas y torques generalizados que son externos al proceso o no
son obtenibles a partir de una función potencial escalar. Si asignamos una variable de
estado para cada coordenada generalizada qi y otra para su derivada q̇i , tendremos
entonces 2r ecuaciones diferenciales de segundo orden de la forma dada en (1.89)
correspondientes al sistema de r grados de libertad.

1.2.2. Manipulador Robótico Traslacional (MRT)


Descripción del Sistema

La figura 1.11 ilustra el manipulador robótico (MRT) de 2 GDL. M1 es un


servomotor DC que posee un mecanismo de reducción por engranajes y un codifi-
cador óptico y está articulado a una polea de radio rp . Esta polea usa un cable para
transmitir la fuerza F para accionar el movimiento de traslación de un carro de masa
mc montado sobre un par de rieles a lo largo de un eje x. M2 es también un servo-
motor con codificador óptimo y mecanismo de reducción, empleado para accionar el
movimiento rotatorio del brazo (el eslabón) del MRT alrededor de un pivote ubicado
en el CG (Centro de Gravedad) del carro. Asumiremos que M1 y M2 poseen los mis-
mos parámetros. En la figura 1.11, θ es la posición angular del brazo de longitud L y
masa mb , r es la posición longitudinal del carro y Ff es la fuerza de fricción opuesta
al movimiento del carro. Al extremo del brazo se puede articular una mano o efector
final para diferentes propósitos.
El sistema MRT es multivariable cuadrado, denominado ası́ por poseer dos
entradas: los voltajes KA1 u1 y KA2 u2 aplicados los terminales de las armaduras de
M1 and M2 respectivamente, y dos salidas: r y θ. Los parámetros KA1 y KA2 son las
ganancias de los amplificadores. La tabla 1.4 muestra los valores de los parámetros
del sistema MRT.
y M
3 Gripper of
mass m H M3

θ1 L1cos θ 1
M 1 Pulley Gripper
(lateral view)
M2 Link
Cart x Rp

F F1 Pulley

r L1 sinθ 1

Figura 1.11: El manipulador robótico traslacional (MRT).


26 Modelado de Sistemas No Lineales

Tabla 1.4: Parámetros valorados del sistema MRT. La abreviatura C.M. significa
Centro de Masa.
Sı́mbolo Descripción Valor Unidades
u 1 , u2 Voltaje de entrada al sistema V
KA Ganancia del amplificador 15
Va1 , Va2 , Voltaje de armadura V
Ra Resistencia de armadura 2 Ω
La Inductancia de armadura 0.002 H
ia 1, ia2 Corriente de armadura A
Km Constante del torque motor 31.071×10−3 N-m/A
Tm1 , Tm2 Torque motor N-m
Tg1 Torque de entrada a los engranajes N-m
Tg2 Torque de salida de los engranajes N-m
Jm Momento de inercia del motor 1.9062×10−6 kg-m2
Jg Momento de inercia de los engranajes ∼
=0 kg-m2
Jp Momento de inercia de la polea kg-m2
Jh Momento de inercia del efector kg-m2
JL Momento de inercia en la carga kg-m2
Jb Momento de inercia del brazo kg-m2
Jeq1 , Jeq2 Momento de inercia equivalente 4.2×10−6 kg-m2
Beq1 , Beq2 Constante de fricción equivalente 3.36×10−6 N-m-s/rad
Bm Constante de fricción del motor 1.8338×10−6 N-m/rad/s
Bg Constante de fricción en engranajes N-m/rad/s
BL Constante de fricción en la carga N-m-s/rad
Bp Constante de fricción (punto pivote) 1.92×10−3 kg-m2 /s
Bj Constante de fricción de la articulación 1.92×10−3 kg-m2 /s
F Fuerza aplicada al carro N
Ff Fuerza de rozamiento N
Fc Constante de fricción del carro 2.81 kg/s
mh Masa del efector kg
mb Masa del brazo 0.103 kg
mc masa del carro 0.9574 kg
mp masa de la polea 0.2 kg
L Longitud del brazo 0.225 m
rh Distancia: C.M. del efector al brazo ∼
=0 m
rp Radio de la polea 0.05 m
r Posición del carro m
L Longitud del brazo 0.225 m
xh , xb Posiciones horizontales m
yh , yb Posiciones verticales m
Vb1 , Vb2 Voltaje contraelectromotriz V
Kb Constante contraelectromotriz 25×10−3 V-s/rad
g Aceleración de la gravedad 9.81 m/s2
N 1 , N2 N o de dientes de los engranajes N2 > N 1
n Relación de engranajes (n = N2 /N1 ) 12.5
θm Posición angular del motor rad
θ Posición angular del brazo rad
ω Velocidad angular de la carga rad/s
ωm Velocidad angular del motor rad/s
1.2 Método de Las Ecuaciones de Lagrange 27

Ecuaciones de Lagrange del Sistema MRT


Las ecuaciones de Lagrange del sistema MRT mostrado en la figura 1.11 se
determinan empleando el método descrito en la sección 1.2.

Ecuaciones de Energı́a del Carro


El carro está confinado a moverse en la dirección horizontal. Su energı́a cinética
V1 y su energı́a potencial U1 vienen dadas por:
1
V1 = mc ṙ2 U1 = 0 (1.90)
2

Ecuaciones de Energı́a del Brazo


Sea mh la masa del efector final más su carga. La energı́a cinética almacenada
por el brazo es:
1 1
V2 = mh ẋ2h + ẏh2 + mb ẋ2b + ẏb2 (1.91)
2 2
De la figura 1.11 obtenemos:
L L
xh = r + Lsen θ xb = r + sen θ yh = Lcos θ yb = cos θ
2 2
Por consiguiente, V2 como una función de las coordenadas generalizadas r y θ se
expresa como:
 
1 2 1 1 1
V2 = (mh + mb )ṙ + (2mh + mb )Lṙθ̇cos θ + mh + mb L21 θ̇2 (1.92)
2 2 2 4

La energı́a potencial almacenada en el brazo es:


L  mb 
U2 = mh g Lcos θ + mb g cos θ = mh + gLcos θ (1.93)
2 2
La función lagrangiana toma la forma:

L = V − U = (V1 + V2 ) − (U1 + U2 )

Las Ecuaciones de Lagrange del Sistema MRT


Las ecuaciones de Lagrange para las coordenadas generalizadas r y θ del MRT se
formulan como:
 
d ∂L ∂L
− = F − Ff Ff = Fc ṙ (1.94)
dt ∂ ṙ ∂r
 
d ∂L ∂L
− = TL − T p Tp = Bp θ̇ (1.95)
dt ∂ θ̇ ∂θ

donde F es la fuerza generada para mover al carro, Ff es la fuerza de fricción actuando


en el carro, Fc es la constante de fricción, TL es el torque generado para accionar el
brazo, Tp = Bp θ̇ es el torque de fricción actuando en el punto pivote localizado en el
28 Modelado de Sistemas No Lineales

carro, y Bp es su correspondiente constante de fricción viscosa. Reemplazando L en


(1.94) y (1.95) y operando, se obtiene:
 mb   mb  2
F = (mc + mh + mb )r̈ + mh + Lθ̈cos θ − mh + Lθ̇ sin θ + Fc ṙ (1.96)
2 2
  
1 2 mb   mb 
TL = mh + mb L θ̈ + mh + Lr̈cos θ − mh + Lg sin θ + Bp θ̇ (1.97)
4 2 2
Partiendo de (1.96) y (1.97) podemos determinar el modelo de Lagrange del sistema
TRM. Sin embargo, si estamos interesados en tener como fuerzas de control los volta-
jes de armadura u1 y u2 en lugar de F y TL respectivamente, entonces se requiere
modelar los susbsistemas eléctricos del sistema en la forma usual.

Modelado del Servomotor M1 Accionando la Polea


La figura 1.12 muestra el servomotor M1 articulado a la polea. Despreciando la
inductancia de armadura La , el voltaje de entrada KA u1 aplicado a la armadura es:

Ra ia1 + Vb1 = KA u1 (1.98)

El voltaje de fuerza contraelectromotriz es proporcional a la velocidad del servomotor,


es decir:
Vb1 = Kb θ̇m1 (1.99)
La ecuación del torque motor Tm1 está dada por (ver figura 1.12):

Ra La θ m1

+ + 111
000
Tm1 Tg1
J
000 B gg Pulley
111
u1 Vb 1
- KA - 111
000
B
000
111
n 000
111
Ia 1 Jm m F1
Rp
Tg2

Figura 1.12: Servomotor M1 articulado a la polea.

Tm1 = Jm θ̈m1 + Bm θ̇m1 + Tg1 (1.100)

El torque Tg2 requerido para mover a la polea se expresa como:

θ̈m1 θ̇m1
Tg2 = nTg1 = (Jg + Jp ) + (Bg + Bp ) + F Rp (1.101)
n n
donde n > 1 es la relación de dientes de los engranajes del mecanismo de reducción,
Jm , Jg y Jp son los momentos of inercia de la armadura, del mecanismo de reducción
y de la polea respectivamente, mientras que Bm , Bg y Bp son las constantes de
fricción de la armadura, del mecanismo de reducción y de la polea respectivamente.
1.2 Método de Las Ecuaciones de Lagrange 29

La relación Tg2 = nTg1 se obtiene asumiendo que los engranajes son ideales. En esta
situación, el principio de conservación de energı́a requiere que:

θm1
Tg1 θm1 = Tg2
n
El torque servomotor Tm1 es proporcional a ia1 :

Tm1 = Km ia1 (1.102)

El movimiento rotacional de la polea se puede transformar en el movimiento trasla-


cional del carro usando la relación (ver figura 1.12):

θm1
r= rp (1.103)
n
Usando las ecuaciones (1.98), (1.99), (1.100), (1.101), (1.102) y (1.103) podemos
obtener:  
Km KA Jeq1 Beq1 nKm Kb
F = u1 − r̈ − + ṙ (1.104)
rp Ra nrp2 nrp2 nrp2
donde:
Jeq1 = n2 Jm + Jg + Jp Beq1 = n2 Bm + Bg + Bp

Modelado del Servomotor M2 Accionando el Brazo


La figura 1.13 muestra al servomotor M2 articulado al punto pivote localizado
en el CG del carro. Sabemos que M1 y M2 poseen los mismos parámetros por ser
similares. Despreciando la inductancia de armadura La , podemos formular:

Ra ia2 + Vb2 = KA u2 (1.105)

donde:
Vb2 = Kb nθ̇ (1.106)
La ecuación del torque motor Tm2 es (ver figura 1.13):

Ra La
nθ1
Tm2 Tg1
Jg
000
111
+ + +
Bg
u Va2 Vb2
-
2
KA - - 111
000
Bm
00 θ 1
11
Ia2
Jm n 11T
00
Tg2 L

Figura 1.13: Servomotor M2 articulado al punto pivote del carro

Tm2 = Jm nθ̈1 + Bm nθ̇ + Tg1 (1.107)


30 Modelado de Sistemas No Lineales

El torque Tg2 requerido para mover el brazo se expresa como:

Tg2 = nTg1 = Jg θ̈1 + Bg θ̇1 + TL (1.108)

donde TL es el torque de carga. El torque motor Tm2 es proporcional a ia2 :

Tm2 = Km ia2 (1.109)

Empleando las ecuaciones (1.105), (1.106), (1.107), (1.108) y (1.109) se puede de-
mostrar que:
 
n2 Km Kb nKm Kb
TL = −Jeq2 θ̈1 − Beq2 + θ̇1 + u2 (1.110)
Ra Ra

donde:
Jeq2 = n2 Jm + Jg Beq2 = n2 Bm + Bg

El Modelo de Lagrange del Sistema MRT

Igualando (1.96) con (1.104) y (1.97) con(1.110) el modelo de Lagrange del


proceso MRT toma la forma:

u1 = m11 r̈ + p11 ṙ + m12 θ̈cos θ + p12 θ̇2 sin θ (1.111)


u2 = m22 θ̈ + p22 θ̇ + m21 r̈ cos θ + d2 sin θ (1.112)

Las ecuaciones (1.111) y (1.112) se pueden transformar en su forma matricial como


sigue:
   
r u1
M(q)q̈ + P(q, q̇)q̇ + d(q) = u q= u= (1.113)
θ u2

donde:
     
m11 m12 cos θ p11 p12 θ̇sin θ 0
M= P= d(q) =
m21 cos θ m22 0 p22 d2 sin θ

 
Ra r p Jeq1 Ra r p L  mb 
m11 = mc + mh + mb + 2 2 ; m12 = mh +
Km KA n rp Km KA 2
Ra L  mb  Ra  mb 2 
m21 = mh + ; m22 = Jeq2 + mh L2 + L
nKA Km 2 nKA Km 4
 
Ra r p Beq1 nKm Kb Ra rp L  mb 
p11 = Fc + 2 2 + ; p 12 = − m h +
KA Km n rp Ra rp2 KA Km 2
  
Ra n2 Km Kb Ra Lg mb 
p22 = Beq2 + Bp + ; d2 = − mh +
nKa Km Ra nKa Km 2

Ejemplo 1.2
1.2 Método de Las Ecuaciones de Lagrange 31

Para el sistema péndulo mostrado en las figuras 1.5 y 1.6 asuma que lv = le = l y
mv = 0. Determinar el modelo en el espacio de estado del sistema para variaciones
pequeñas de la posición θ, empleando primero las ecuaciones de Lagrange y luego las
leyes de la fı́sica.

Solución: De la figura 1.6 se observa que:

ze = z + l senθ ye = l cosθ

El carro sólo se mueve en la dirección horizontal. Su energı́a cinética es:


1
Vc = mc z 2
2
Como la esfera se mueve en las direcciones horizontal y vertical, su energı́a cinética
es:
1
Ve = me (że2 + ẏe2 )
2
La única energı́a potencial se almacena en la esfera:

Ue = me gye

Operando las relaciones anteriores se puede demostrar que la función de Lagrange L


toma la forma:
1 1
L = Vc + Ve − Ue = (mc + me )ż 2 + me lcosθ ż θ̇ + me l2 θ̇2 − me glcosθ
2 2
Las ecuaciones de Lagrange para las coordenadas generalizadas (z, θ) son:
   
d ∂L ∂L d ∂L ∂L
− =F − =0
dt ∂ ż ∂z dt ∂ θ̇ ∂θ
Efectuando las operaciones correspondientes, resulta:

(mc + me )z̈ + me l cosθθ̈ − me lθ̇2 senθ = F


me l cosθz̈ + me l2 θ̈ − me gl senθ = 0 (1.114)

Para pequeñas variaciones de theta, podemos asumir que:

sen θ ∼
=θ cos θ ∼
=1 θ̇2 θ ∼
=0

Por lo tanto, las ecuaciones anteriores se convierten en:

(mc + me )z̈ + me lθ̈ = F me z̈ + me lθ̈ − mgθ = 0

Seleccionado como variables de estado x1 = z, x2 = θ, x3 = ż y x4 = θ̇, empleando las


ecuaciones anteriores se puede encontrar la siguiente ecuación de estado con u = F :

ẋ = Ax + Bu
   
0 0 1 0 0
 0 0 0 1   0 
A=
 0 −me g 
 B=
 1


mc 0 0 mc
0 g(mc +me )
M cl 0 0 − m1c l
32 Modelado de Sistemas No Lineales

Aplicando las leyes fı́sicas, para los movimientos horizontal y rotacional, de acuerdo
a las relaciones (1.37) y (1.41) se obtiene:

d2 d2
mc z + me 2 ze = F
dt2 dt
Je θ̈ = me gl sen θ − me z̈l cos θ
Sustituyendo las relaciones ze = z + l senθ, ye = l cosθ en la primera ecuación y
Je = me l2 en la segunda, se obtienen las ecuaciones dadas en (1.114). ♣

1.3. El Método de Lagrange–Euler


El método de Lagrange-Euler (o simplemente método L-E) usado básicamente
para modelar manipuladores robóticos, emplea el el procedimiento de Denavit–Hartenberg
(o simplemente procedimiento D–H) conjuntamente con el procedimiento L–E. Mien-
tras que el procedimiento D–H permite representar los sistemas de coordenadas de
un manipulador mediante cadenas cinemáticas de lazo abierto, el procedimiento L–
E determina el modelo dinámico del proceso, el cual denominaremos modelo L–E.
Un estudio completo del método de L–E se puede encontrar en [4], [5], [6], [7]. El
resultado final de este estudio se describe a continuación.

1.3.1. El Procedimiento de Denavit–Hartenberg


Un manipulador robótico se compone de una secuencia de cuerpos rı́gidos (los
eslabones) unidos mediante articulaciones rotatorias o prismáticas (de deslizamien-
to). Cada par eslabón–articulación representa un Grado de Libertad (GDL). Por con-
siguiente, un manipulador con n GDL posee n pares eslabón–articulación. Se puede
establecer un sistema de coordenadas ortonormales dextrógiro (xi , yi , zi ) para ca-
da articulación i, donde i = 1, . . . , n. Como se sabe, los sistemas de coordenadas
dextrógiro cumplen con la regla de la mano derecha. El manipulador normalmente
está articulada a una base soporte (el eslabón 0). El sistema de coordenadas de la
base se define como (x0 , y0 , z0 ) y es también el sistema de coordenadas inerciales
del manipulador. El sistema de coordenadas aumentado de la base se define como
(x0 , y0 , z0 , 0).
Usualmente, en el último eslabón del manipulador se articula una mano o efector
final (por ejemplo, una herramienta). Esto significa que el sistema de coordenadas
(xn , yn , zn ) corresponde al efector final del manipulador.
El procedimiento de D–H (Denavit-Hartenberg) produce una matriz de trans-
formación homogénea de 4 × 4, la cual representa las coordenadas inerciales del ma-
nipulador. Para obtener dicha matriz de transformación, se requiere establecer las
coordenadas (xi , yi , zi ) del manipulador para i = 0, . . . , n de modo tal que nos permi-
ta determinar los parámetros correspondientes a cada par eslabón–articulación, tal
como se verá más adelante.

El Sistema de Coordenadas D–H del Manipulador


Cada sistema de coordenadas dextrógiro D–H (xi , yi , zi ), i = 0, . . . , n, se es-
tablece conforme a las siguientes reglas:
1.3 El Método de Lagrange–Euler 33

1. El eslabón 0 corresponde al eslabón de la base fija del manipulador y el es-


labón 1 corresponde al primer eslabón móvil del mismo. Por consiguiente, la
primera articulación corresponde al primer grado de libertad del manipulador
y ası́ sucesivamente.
2. Si una articulación es rotatoria, su eje será su propio eje de giro. En cambio, si
es prismática, el eje se ubica a lo largo del desplazamiento de la articulación.
3. La ubicación del sistema de coordenadas dextrógiro base o fijo (x0 , y0 , z0 ) es de
libre elección, siempre que el eje z0 se ubique a lo largo del eje de movimiento
(rotatorio o prismático) del primer eslabón.
4. El eje zi se alinea con el eje de movimiento (rotatorio o prismático) de la i − 1-
ésima articulación.
5. El origen del i-ésimo sistema de coordenadas se ubica en la intersección de los
ejes zi y zi−1 si ambos se cortan, o en la intersección del eje zi con la normal
común a los ejes zi y zi−1 .
6. El eje xi es normal común a los ejes zi−1 y zi .
7. Aplicar la regla de la mano derecha en la i-ésima articulación para determinar
yi .
8. Generalmente la n-ésima articulación es del tipo rotatorio. El sistema de co-
ordenadas (xn , yn , zn ) se puede ubicar en el extremo del manipulador, siempre
que el eje zn coincida con la dirección del eje zn−1 y apuntando hacia afuera
del manipulador. El eje xn será normal a los ejes zn−1 y zn .

Los Parámetros D–H para cada par Eslabón–Articulación


Para describir completamente una articulación de revolución o una prismática,
se requiere de cuatro parámetros geométricos, a saber: θi , di , ai , y αi . Estos parámet-
ros, denominados los parámetros D–H, están asociados con cada par articulación–
eslabón del manipulador. Luego de establecer los sistemas de coordenadas del ma-
nipulador, los parámetros D–H se pueden determinar como sigue.
1. Obtener θi , el cual es el ángulo que hay que girar desde el eje xi−1 alrededor
del eje zi−1 hasta que los ejes xi−1 y xi queden paralelos. Este ángulo resulta
la variable de la articulación i si dicha articulación es rotatoria.
2. Obtener di , la cual es la distancia medida desde el origen del sistema de co-
ordenadas (i − 1)-ésimo a lo largo del eje zi−1 , necesaria para hacer coincidir
los ejes xi−1 y xi . Esta distancia resulta la variable de la articulación i si dicha
articulación es prismática.
3. Obtener ai , la cual es la distancia medida a lo largo del eje xi necesaria para
hacer coincidir el origen del (i − 1)-ésimo sistema de coordenadas con el origen
del (i)-ésimo sistema de coordenadas.
4. Obtener αi , el cual es el ángulo de rotación desde el eje zi−1 hasta el eje zi
alrededor del eje xi , requerido para hacer coincidir los ejes del (i − 1)-ésimo
sistema de coordenadas con los ejes del (i)-ésimo sistema de coordenadas.
34 Modelado de Sistemas No Lineales

La Matriz de Transformación Homogénea D–H del Manipulador


La matriz de transformación homogénea D–H caracteriza a cada sistema de
coordenadas de un eslabón con su articulación, con respecto al sistema de coorde-
nadas de del eslabón anterior. Por consiguiente, un punto ri del i-ésimo sistema de
coordenadas se puede expresar como ri−1 en el i − 1-ésimo sistema de coordenadas
ejecutando las siguientes operaciones sucesivas:

1. T(z, θi ): rotación de un ángulo θi alrededor del eje zi−1 para alinear el eje xi−1
con el eje xi .

2. T(z, di ): traslación a lo largo del eje zi−1 de una distancia di para hacer coincidir
los ejes xi−1 y xi .

3. T(x, ai ): traslación a lo largo del eje xi de una distancia ai para hacer coincidir
los orı́genes (xi−1 , yi−1 , zi−1 ) y (xi , yi , zi ) ası́ como también el eje xi .

4. T(x, αi ): rotación de un ángulo αi alrededor del eje xi para hacer coincidir los
dos sistemas de coordenadas.

El producto de estas cuatro operaciones básicas produce la matriz de transfor-


mación homogénea D–H Ai−1 i para lograr una transformación completa del eslabón
i con respecto al eslabón i − 1, o de la articulación i con respecto a la articulación
i − 1. Por consiguiente:

Ai−1
i = T(z, θi )T(z, di )T(x, ai )T (x, αi )

    
Cθi −Sθi 0 0 1 0 0 0 1 0 0 ai 1 0 0 0
 Sθi Cθi 0 0   0 0   0   −Sαi 0 

=  0 1  0 1 0   0 Cαi 
0 0 1 0  0 0 1 di   0 0 1 0   0 Sαi Cαi 0 
0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 1
 
Cθi −Cαi Sθi Sαi Sθi ai Cθi
 Sθi Cαi Cθi −Sαi Cθi ai Sθi 
=
 0
 (1.115)
Sαi Cαi di 
0 0 0 1
donde C y S representan las funciones cos y sen respectivamente. La siguiente matriz
de transformación homogénea:


i
A0i = Ajj−1 = A01 A12 · · · Ai−1
i i = 1, 2, . . . , n (1.116)
j=1

determina la ubicación del i-ésimo sistema de coordenadas con respecto al sistema


de coordenadas base.

Ejemplo 1.3

Determinar los parámetros D–H y las matrices de transformación para el manipulador


esférico mostrado en la figura 1.14 y descrito n la subsección 1.3.3.
1.3 El Método de Lagrange–Euler 35

Tabla 1.5: Los parámetros D–H del manipulador esférico.


Joint θi di ai αi
1 θ1 b+h 0 90o
2 θ2 0 L2 00

Solución: Notar que la figura 1.14 ilustra los sistemas de coordenadas D–H del
manipulador esférico. La tabla 1.5 muestra los correspondientes parámetros D–H
extraı́dos de dicha figura. Por consiguiente, las matrices de transformación Ai−1
i (i
= 1, 2) del manipulador esférico toman la forma:
   
Cθ1 0 Sθ1 0 Cθ2 −Sθ2 0 L2 Cθ2
 Sθ1 0 −Cθ1 0   Sθ2 Cθ2 0 L2 Sθ2 
A01 = 
 0
 A12 =  
1 0 b+h   0 0 1 0 
0 0 0 1 0 0 0 1
 
Cθ1 Cθ2 −Cθ1 Sθ2 Sθ1 L2 Cθ1 Cθ2
 Sθ1 Cθ2 −Sθ1 Sθ2 −Cθ1 L2 Sθ1 Cθ2 
A02 = A01 A12 = 
 Sθ2
 ♣
Cθ2 0 L2 Sθ2 + b + h 
0 0 0 1

1.3.2. El Procedimiento de Lagrange–Euler


El procedimiento L–E requiere llevar a cabo los siguientes pasos:

1. Asignar a cada par eslabón–articulación del manipulador un sistema de coor-


denadas D–E.
2. Obtener las matrices de transformación homogénea Ai−1i para i = 1, . . . , n.
3. El efecto del movimiento de la articulación j en todos los puntos del eslabón i
se describe mediante las siguientes matrices Uij :

∂A0i A0j−1 Qj Aj−1
i if j ≤ i
Uij = = (1.117)
∂qj 0 if j > i

con A00 = I (la matriz identidad) y donde A0j−1 relaciona el (j −1)-ésimo sistema
de coordenadas con el sistema de coordenadas base, y:
 
0 −1 0 0
 1 0 0 0 
Qi = 
 0 0 0 0 
 si la articulación i es de rotación
0 0 0 0
 
0 0 0 0
 0 0 0 0 
Qi = 
 0
 si la articulación i es prismática
0 0 1 
0 0 0 0
36 Modelado de Sistemas No Lineales

4. Los efectos de interacción entre las articulaciones se expresan mediante las


siguientes matrices Uijk :
 j−1
   A0j−1 Qj Ak−1 Qk Ai
k−1
if i ≥ k ≥ j
∂Uij ∂ ∂A0i
Uijk = = = Ak−1 Qk Aj−1 Qj Aij−1 if i ≥ j ≥ k
0 k−1 (1.118)
∂qk ∂qk ∂qj 
0 if k > i or j > i

5. Obtener el tensor momento de inercia Ji de la i-ésima articulación (o la matriz


de inercia del eslabón) dada por:
 −Ix x +Iy y +Iz z 
i i
2
i i i i
−Ixi yi −Ixi zi mi x̄i
 Ixi xi −Iyi yi +Izi zi 
 −Ixi yi −Iyi zi mi ȳi 
Ji ==  2
Ixi xi +Iyi yi −Izi zi  (1.119)
 −Ixi zi −Iyi zi mi z̄i 
2
mi x̄i mi ȳi mi z̄i mi

donde (x̄i , ȳi , z̄i ) es el centro de gravedad (CG) del eslabón i con respecto al
i-ésimo sistema de coordenadas, Ixi , Iyi , Izi son los momentos de inercia con
respecto al sistema de coordenadas (xi , yi , zi ), mi es la masa del cuerpo i, x̄i ,
y¯i and z¯i son las distancias desde el CG del cuerpo i hacia el sistema de coor-
denadas (xi , yi , zi ), y Ixi yi , Iyi zi , Ixi zi , Ixi xi , Iyi yi , Izi zi son los correspondientes
momentos de inercia producto.
6. Obtener la matriz simétrica inercial de aceleración H de orden n × n, cuyos
elementos son:
 
Hik = T r Ujk Jj UTji i, k = 1, 2, . . . , n (1.120)
j=máx(i,k)

donde T r significa Traza y n es el número de GDL.


7. Obtener los términos hikm definidos por:

n

hikm = T r Ujkm Jj UTji i, k, m = 1, 2, . . . , n (1.121)
j=máx(i,k,m)

8. Obtener el vector no lineal de fuerzas de Coriolis y centrı́peta c de orden n × 1


cuyos elementos ci toman la forma:

n 
n
ci = hikm q̇k q̇m (1.122)
k=1 m=1

9. Obtener el vector fuerza de gravedad d de orden n × 1 con elementos:


n 
 
j j
di = −mj gUji r̄j i = 1, 2, . . . , n (1.123)
j=1

donde g = [gx0 gy0 gz0 0] es el vector fila gravedad expresado en el sistema de


coordenadas base, y r̄jj = [x̄j ȳj z̄j 1]T (el elemento 1 es un factor de escala) es el
centro de masa del eslabón j y expresado en el j-ésimo sistema de coordenadas.
1.3 El Método de Lagrange–Euler 37

10. Finalmente, la ecuación dinámica del manipulador, el modelo L–E, toma la


forma:
T = Hq̈ + c + d (1.124)
donde T es el vector de torques y fuerzas aplicado a cada coordenada genera-
lizada qi . Si en (1.124) se cumple que:

c = Cq̇ (1.125)

entonces se obtiene el modelo de Lagrange del sistema:

T = Hq̈ + Cq̇ + d (1.126)

1.3.3. Manipulador Robótico Esférico (MRE)


Descripción del Proceso
La figure 1.14 muestra el proceso Manipulador Robótico Esférico (MRE) de
2GDL, donde M1 es un servomotor DC con codificador óptico que acciona el movimien-
to rotatorio de una base metálica (la base del MRE) articulada a su eje. Esta base
comprende un disco metálico de espesor d y radio rd unido a una barra metálica o
prisma de longitud b, sección a2 y masa mp y . La barra y el disco conforman un
cuerpo rı́gido con movimiento rotatorio alrededor del eje z0 . M2 es un servomotor
montado en el extremo libre de la barra y se emplea para accionar el movimiento
de rotación de un eslabón de longitud Lb (el brazo del manipulador) y masa mb .
Asumiremos que M1 y M2 son similares, por ello poseen los mismos parámetros. En
la figura 1.14, θ1 es la posición angular de la base y θ2 es la posición angular del
brazo. Al extremo del brazo se puede articular un efector final de de masa mh .
El manipulador MRT representa un sistema multivariable cuadrado, denomina-
do ası́ por poseer dos entradas: los voltajes KA1 u1 y KA2 u2 aplicado a los terminales
de las armaduras de M1 and M2 respectivamente, y dos salida: θ1 y θ2 . Los parámetros
KA1 y KA2 son las ganancias de los amplificadores. La tabla 1.6 muestra los valores
de los parámetros del sistema MRT.

El Modelo L–E del MRE


El modelo L–E del sistema MRE se determina aplicando el procedimiento de
Lagrange–Euler desarrollado en la subsección 1.3.2, como sigue.

Los Parámetros D–H del MRE


Ver la tabla 1.5, la cual se obtuvo en el ejemplo 1.3).

La Matriz de Transformación Homogénea Ai−1


i del MRE

Las matrices de transformación Aii−1 del MRE para i = 1, 2, se determinaron en el


ejemplo 1.3.
38 Modelado de Sistemas No Lineales

Tabla 1.6: Variables y parámetros del sistema MRE. Las abreviaciones C.G. y c.r.
significan centro de gravedad y con respecto, respectivamente.
Sı́mbolo Descripción Valor Unidad
md Masa del disco 0.4 kg
mp Masa de la barra o prisma 1.0 kg
mb Masa del brazo (eslabón) 0.1 kg
mh Masa del efector final kg
d Espesor del disco 0.01 m
rd Radio del disco 0.07 m
b Longitud de la barra 0.21 m
a Lado de la sección de la barra 0.044 m
Lb Longitud del brazo (eslabón) 0.3 m
Ly1 Longitud del C.G. c.r. a (x1 , y1 , z1 ) m
Lx2 Longitud del C.G. c.r. a (x2 , y2 , z2 ) m
Jh Momento de inercia del efector final kg-m2
Jm Momento de inercia de M1 y M2 1.8×10−4 kg-m2
Bm Constante de fricción de M1 y M2 1.83×10−6 N-m-s/rad
Jg1 , Jg2 Momento de inercia de los engranajes 5.63×10−5 kg-m2
Bg1 , Bg2 Constante de fricción en engranajes 7.05×10−5 N-m-s/rad
n Relación de engranajes de M1 y M2 18.5
Ra Resistencia de armadura de M1 y M2 2.8 Ω
La Inductancia de armadura de M1 y M2 1.5×10−3 H
Vb1 , Vb2 Voltaje contraelectromotriz V
Va1 , Va2 Voltaje de armadura 24 V
ia1 , ia2 Corriente de armadura 0.7 A
KA Ganancia del amplificador 14.9
Km Constante del motor de M1 y M2 0.9 N-m/A
Kb Constante contraelectromotriz 0.9 V-s/rad
u 1 , u2 Voltaje de entrada 1.4 V
g Constante gravitacional 9.81 m/s2
1.3 El Método de Lagrange–Euler 39

y
y x2 2
2 M3 x2
z2 Gripper M3
y
1111
0000
1 Link
L2 z2
q
2
M y
2 Lx2 1
z1 z1 x1 M2
x
1

Ly1 a a
Metallic bar b z
z0 0
of lenght b
: Axis is pointing
Disk away from the plane
h x0 y x y0
0 0
q q M1
1 Servomotor M 1 1

Frontal view Lateral view

Figura 1.14: El manipulador robótico esférico (MRE).

Determinación de las Matrices Uij


Para simplificar la notación, se emplean las relaciones siguientes: Si = senθi y Ci =
cosθi para i = 1, 2. Para el sistema MRE se cumple que:
 
0 −1 0 0
 1 0 0 0 
Q1 = Q2 = 
 0 0 0 0 
 (1.127)
0 0 0 0

Sustituyendo (1.127) en (1.117) se obtiene:


 
−S1 0 C1 0
 C1 0 S1 0 
U11 =   0
 U12 = 0
0 0 0 
0 0 0 0
 
−S1 C2 S1 S2 C1 −L2 S1 C2
 C1 C2 C1 S2 S1 L2 C1 C2 
U21 =  


0 0 0 0
0 0 0 0
 
−C1 S2 −C1 C2 0 −L2 C1 S2
 −S1 S2 S1 C2 0 −L2 S1 S2 
U22 =   C2

−S2 0 L2 C2 
0 0 0 0
40 Modelado de Sistemas No Lineales

Determinación de las Matrices Uijk


El empleo de (1.118) para el MRE produce:
 
−C1 0 −S1 0
 −S1 0 C1 0 
U111 =
 0
 U112 = U121 = U122 = 0
0 0 0 
0 0 0 0
 
−C1 C2 C1 S2 −S1 −L2 C1 C2
 −S1 C2 −S1 S2 C1 −L2 S1 C2 
U211 = 



0 0 0 0
0 0 0 0
 
S1 S2 S1 C2 0 L2 S1 S2
 −C1 S2 C1 C2 0 −L2 S1 C2 
U212 = 


0 0 0 0
0 0 0 0
 
S1 S2 S1 C2 0 L2 S1 S2
 −C1 S2 −C! C2 0 −L2 C1 S2 
U221 = 


0 0 0 0
0 0 0 0
 
−C1 C2 C1 S2 0 −L2 C1 C2
 −S1 C2 S1 S2 0 −L2 S1 C2 
U222 =  −S2

−C2 0 −L2 S2 
0 0 0 0

Determinación de la Matriz de Inercia del Eslabón Ji


La matriz de inercia del eslabón Ji del SRM se computa a partir de la relación (1.119)
con i = 1 para la base (disco más la barra) e i = 2 para el brazo L2 . La base sólo
posee movimiento rotacional alrededor del eje de giro y1 . Por consiguiente:

Ix1 x1 = Iz1 z1 = Ix1 y1 = Ix1 z1 = Iy1 z1 = 0

Iy1 y1 = Iy1d y1d + Iy1b y1b = 2I1


donde Iy1d y1d y Iy1p y1p son los M.I. (momentos de inercia) del disco y de la barra
con respecto al sistema de coordenadas (x1 , y1 , z1 ) (ver figura 1.14). Despreciando la
longitud del radio del servomotor M2 :

1 h
Iy1d y1d = md rd2 + md ( + b)2
2 2
1 b
Iy1p y1p = mp (a2 + a2 ) + mp ( )2
12 2
donde 12 md rd2 es el M.I. del disco girando en su eje de rotación, md ( h2 + b)2 es el M.I.
1
del disco con respecto al sistema (x1 , y1 , z1 ), 12 mp (a2 + a2 ) es el M.I. de la barra
1.3 El Método de Lagrange–Euler 41

girando en su eje de rotación (paralelo al lado b) y mp ( 2b )2 es el M.I. de la barra con


respecto al sistema (x1 , y1 , z1 ). Por consiguiente, J1 toma la forma:
 
−I1 0 0 0
 0 I1 0 −m1 Ly1 
J1 = 
 0

 (1.128)
0 I1 0
0 −m1 Ly1 0 m1

where m1 = md + mb + mM 2 y Ly1 es la distance desde el origen del sistema de


coordenadas (x1 , y1 , z1 ) al centro de gravedad de m1 .
El brazo presenta movimiento rotatorio alrededor del eje z2 . Por consiguiente:

Ix2 x2 = Iy2 y2 = Ix2 y2 = Ix2 z2 = Iy2 z2 = 0

y considerando al brazo una barra de masa mb y longitud Lb :

1 Lb
Iz2 z2 = mb L2b + mb ( )2 + Jh = 2I2
12 2
1
donde 12 mb L2b es el M.I. del brazo girando en un eje perpendicular a la barra y que
pasa por su C.M. y mb ( L2b )2 es le M.I. del brazo referido al sistema de coordenadas
(x2 , y2 , z2 ) (ver figura 1.14) y Jh es el M.I. de la mano del manipulador de masa mh ,
la cual incluye también la masa de la carga aplicada a la mano. Luego, la matriz J2
para i = 2 viene a ser:
 
I2 0 0 −m2 Lx2
 0 I2 0 0 
J2 = 

 (1.129)
0 0 −I2 0
−m2 Lx2 0 0 m2

donde: m2 = mb + mh , Lx2 es la distancia del sistema de coordenadas (x2 , y2 , z2 ) al


centro de gravedad de m2 .

Determinación de la matriz simétrica inercial de aceleración H


Empleando (1.120), los elementos de H se determinan como:
T
H11 = T r(U11 J1 U11 T
) + T r(U21 J2 U21 ) = 2I1 + (I2 + 2m2 Lx2 L2 − m2 L22 )cos2 q2
T T
H12 = T r(U22 J2 U21 )=0 H21 = T r(U21 J2 U22 )=0
T
H22 = T r(U22 J2 U22 ) = I2 + 2m2 Lx2 L2 − m2 L22
Por consiguiente:
H11 = 2I1 + H22 cos2 q2

Determinación de los términos hikm


Usando la relación (1.121) para el MRE, se obtiene:
T T
h111 = T r(U111 J1 U11 ) + T r(U211 J2 U21 )=0
42 Modelado de Sistemas No Lineales

T
h112 = T r(U212 J2 U21 ) = (m2 L22 − 2m2 L2 lc2 − I2 )senq2 cosq2
T
h121 = T r(U221 J2 U21 ) = (m2 L22 − 2m2 L2 lc2 − I2 )senq2 cosq2
T
h122 = T r(U222 J2 U21 )=0
T
h211 = T r(U211 J2 U22 ) = (2m2 L2 lc2 − m2 L22 + I2 )senq2 cosq2
T T T
h212 = T r(U212 J2 U22 ) = h221 = T r(U221 J2 U22 ) = h222 = T r(U222 J2 U22 )=0

El Vector Fuerza de Coriolis y Centrı́peta c = [ci ] del MRE


Usando (1.122), los elementos ci vienen a ser:

c1 = h111 q̇12 + h112 q̇1 q̇2 + h121 q̇2 q̇1 + h122 q̇22
= 2(m2 L22 − 2m2 L2 Lx2 − I2 )q̇1 q̇2 sin q2 cos q2 = −2H22 q̇1 q̇2 sin q2 cos q2
c2 = h211 q̇12 + h212 q̇1 q̇2 + h221 q̇2 q̇1 + h222 q̇22
= (2m2 L2 Lx2 − m2 L22 + I2 )q̇12 sin q2 cosq2 = H22 q̇12 sin q2 cosq2

Determinación del Vector Fuerza de Gravedad d


Aplicando (1.123) en el MRE se obtiene:

r̄11 = [0 − Ly1 0 1]T r̄22 = [−Lx2 0 0 1]T

g = [gx0 gy0 gz0 0] = [0 0 − g 0]


d1 = −m1 g U11 r11 − m2 gU21 r22 = 0 d2 = −m2 g U22 r22 = m2 gLx2 cos q2
donde g es la constante gravitacional.

El Modelo de Lagrange–Euler del sistema MRE


De acuerdo a (1.124), el proceso MRE se puede describir como:
 
T1
T= = H(q)q̈ + c(q, q̇) + d(q) (1.130)
T2
donde (suprimiendo los argumentos por simplicidad):
     
H11 H12 c1 d1
H= c= d=
H21 H22 c2 d2

T1 = H11 q̈1 + H12 q̈2 + c1 + d1 = H11 q̈1 + c1 (1.131)


T2 = H21 q̈1 + H22 q̈2 + c2 + d2 = H22 q̈2 + c2 + d2 (1.132)

El modelo de Lagrange del Sistema MRE


Siempre que c = Cq, el modelo de Lagrange dado por (1.126) se puede obtener
de (1.130). Sin embargo, si se requiere tener como fuerzas de de control los voltajes de
armadura u1 y u2 en lugar de T1 y T2 respectivamente, necesitamos entonces modelar
los subsistemas eléctricos del MRE como sigue.
1.3 El Método de Lagrange–Euler 43

Modelado de M1 Accionando la Base del SRM


La figura 1.15 muestra el servomotor M1 accionando la base del MRE. El voltaje de
entrada KA1 u1 aplicado a la armadura está dado por:

Ra1 La1

+ + + 111
000
Tm1 Tg1
000 B g1g1
111
J
u Va1 Vb1
-
1
KA1 - - 111
000
B m1
00 θ 1
11
I a1
J m1 n
1
T
11T
00
g2 1

Figura 1.15: Servomotor M1 accionando la base del MRE

Va1 = KA1 u1 = La1 I˙a1 + Ra1 Ia1 + Vb1 = La1 I˙a1 + Ra1 Ia1 + Kb1 n1 q̇1 (1.133)

en donde n1 es la relación de engranajes. El torque motor Tm1 está dado por:

Tm1 = Km1 Ia1 = Jm1 n1 q̈1 + Bm1 n1 q̇1 + Tg1 (1.134)

mientras que la ecuación del torque Tg2 requerido para accionar el primer eslabón se
expresa como:
Tg2 = nTg1 = Jg1 q̈1 + Bg1 q̇1 + T1 (1.135)
donde T1 es el torque de carga. Substituyendo (1.135) en (1.134) se obtiene:

n1 Km1 Ia1 = Jeq1 q̈1 + Beq1 q̇1 + T1 (1.136)

donde:
Jeq1 = n21 Jm1 + Jg1 Beq1 = n21 Bm1 + Bg1
Reemplazando (1.131) en (1.136) nos conduce a:

n1 Km1 Ia1 = Jeq1 q̈1 + Beq1 q̇1 + H11 q̈1 + C1 (1.137)

La derivada de (1.137) produce:

(3) (3) (3) d 3 q1


n1 Km1 I˙a1 = Jeq1 q1 + Beq1 q̈1 + H11 q1 + Ḣ11 q̈1 + Ċ1 q1  (1.138)
dt3
Empleando (1.133), (1.137), y (1.138), se encuentra que la ley de control u1 es:
(3) (3)
u1 = LT 1 (H11 q1 + Jeq1 q1 + Ḣ11 q̈1 + Beq1 q̈1 + Ċ1 )
+ RT 1 (Jeq1 q̈1 + Beq1 q̇1 + H11 q̈1 + C1 ) + NT 1 q̇1 (1.139)

donde:
La1 Ra1 n1 Kb1
LT 1 = RT 1 = NT 1 =
n1 KA1 Km1 n1 KA1 Km1 Km1
44 Modelado de Sistemas No Lineales

Modelando M2 Accionando el Brazo del MRE

La figura 1.15 muestra el servomotor M2 accionando el brazo del MRE. Siguiendo el


mismo procedimiento para determinar u1 , el voltaje de control u2 resulta:

u2 = LT 2 (H22 q23 + Jeq2 q23 + Beq2 q̈2 + Ċ2 + d˙2 )


+ RT 2 (Jeq2 q̈2 + Beq2 q̇2 + H22 q̈2 + C2 + d2 ) + NT 2 q̇2 (1.140)

donde:
Jeq2 = n22 Jm2 + Jg2 Beq2 = n22 Bm2 + Bg2

La2 Ra2 n2 Kb2


LT 2 = RT 2 = NT 2 =
n2 KA2 Km2 n2 KA2 Km2 Km2
Despreciando las inductancias de armadura de los servomotores M1 y M2 , es decir,

Ra2 La2

+ + + 111
000
Tm2 Tg1
000
111
J g2
B g2
u Va2 Vb2
-
2
KA1 - - 111
000
B m2
00 θ 2
11
Ia2
J m2 n2
Tg2
11T
00
2

Figura 1.16: Servomotor M2 accionando el brazo del MRE

fijando en cero LT 1 y LT 2 en (1.139) y (1.140) respectivamente, los voltajes de control


u1 y u2 toman la forma:

u1 = RT 1 (Jeq1 q̈1 + Beq1 q̇1 + T1 ) + NT 1 q̇1 (1.141)


u2 = RT 2 (Jeq2 q̈2 + Beq2 q̇2 + T2 ) + NT 2 q̇2 (1.142)

mientras que el modelo de Lagrange del MRE viene a ser:


   
q1 u1
M(q)q̈ + P(q, q̇)q̇ + d(q) = u q= u= (1.143)
q2 u2

donde:  
RT 1 (Jeq1 + 2I1 + H22 cos2 q2 ) 0
M(q) =
0 RT 2 (Jeq2 + H22 )
 
RT 1 (Beq1 − H22 q̇2 sin q2 cos q2 ) + NT 1 −RT 1 H22 q̇1 sin q2 cos q2
P(q, q̇) =
RT 2 H22 q̇1 sin q2 cos q2 RT 2 Beq2 + NT 2
 
0
d(q) =
RT 2 m2 g Lx2 cos q2
1.3 El Método de Lagrange–Euler 45

El Modelo No Lineal de Orden n = 4 en el Espacio de Estado


Para obtener un modelo el espacio de estado del MRE de orden n = 4 podemos
seleccionar las siguientes variables de estado: x1 = θ1 (posición angular de la base),
x2 = θ2 (posición angular del brazo), x3 = θ̇1 (velocidad angular de la base), y
x4 = θ̇2 (velocidad angular del brazo). Empleando tales variables de estado el modelo
de Lagrange del MRE dada en (1.143), el modelo no lineal de orden n = 4 en el
espacio de estado resulta:
   
ẋ1 f1 (x, u)
 ẋ2   f2 (x, u) 
ẋ =    
 ẋ3  = f (x, u) =  f3 (x, u)  (1.144)
ẋ4 f4 (x, u)
donde:
f1 (x, u) = x3 f2 (x) = x4
−[RT 1 (Beq1 − 2H22 x4 sin x2 cos x2 ) + NT 1 ]x3 + u1
f3 (x, u) =
RT 1 (Jeq1 + 2I1 + H22 cos2 x2 )
−(RT 2 Beq2 + NT 2 )x4 − RT 2 (H22 x23 sin x2 + m2 gLx2 )cos x2 + u2
f4 (x, u) =
RT 2 (Jeq2 + H22 )
La ecuación de estado para las salidas y1 = x1 and y2 = x2 toma la forma:
     
y1 h1 (x) 1 0 0 0
y= = = x (1.145)
y2 h2 (x) 0 1 0 0

El Modelo No Lineal de Orden n = 6 en el Espacio de Estado


Para obtener un modelo el espacio de estado del MRE de orden n = 6 podemos
seleccionar las siguientes variables de estado: x1 = θ1 (posición angular de la base),
x2 = θ2 (posición angular del brazo), x3 = θ̇1 (velocidad angular de la base), y
x4 = θ̇2 (velocidad angular del brazo), x5 = θ̈1 (aceleración angular de la base), and
x6 = θ̈2 (aceleración angular del brazo). Empleando las relaciones (1.139) y (1.140),
el modelo no lineal de orden n = 6 en el espacio de estado resulta:
   
ẋ1 f1 (x, u)
   
ẋ =  ...  = f (x, u) =  ..
.  (1.146)
ẋ6 f6 (x, u)
donde:
f1 (x) = x3 f2 (x) = x4 f3 (x) = x5 f4 (x) = x4
−P1 + u1 −P2 + u2
f5 (x) = f6 (x) =
LT 1 (H11 + J1 ) LT 2 (H22 + J2 )

P1 = LT 1 (Ḣ11 q̈1 + Beq1 q̈1 + Ċ1 ) + RT 1 (Jeq1 q̈1 + Beq1 q̇1 + H11 q̈ + C1 ) + NT 1 q̇1
P2 = LT 2 (Beq2 q̈2 + Ċ2 + d˙2 ) + RT 2 (Jeq2 q̈2 + Beq2 q̇2 + H22 q̈ + C2 + d2 ) + NT 2 q̇2
La ecuación de estado para las salidas y1 = x1 and y2 = x2 resulta:
     
y1 h1 (x) 1 0 0 0 0 0
y= = = x (1.147)
y2 h2 (x) 0 1 0 0 0 0
46 Modelado de Sistemas No Lineales

1.4. PROBLEMAS
Problema 1.1

Determinar el modelo de Lagrange del MRAE (manipulador robótico con articulación


elástica) descrito en la subsección 1.1.2, empleando el método de la ecuaciones de
Lagrange.
Problema 1.2
Para el manipulador robótico con articulación fija mostrado en la figura 1.1 y descrito
en la subsección 1.1.1, determinar:
(a) Su modelo de Lagrange (ecuación (1.28)) aplicando las leyes fı́sicas.
(b) Su modelo de Lagrange (ecuación (1.28)) aplicando las ecuaciones de Lagrange.
(c) Su descripción no lineal en el espacio de estado (ecuaciones de estado y de salida).

Problema 1.3
Determinar la descripción no lineal en el espacio de estado del manipulador robótico
traslacional descrito en la subsección 1.2.2, para los casos siguientes:
(a) Despreciando la inductancia de armadura La de los servomotores.
(b) Sin despreciar la inductancia de armadura La de los servomotores.
Problema 1.4
Para el manipulador robótico esférico descrito en la subsección 1.2.2:
(a) Verificar su modelo L–E (ecuación (1.130)) aplicando las leyes fı́sicas.
(b) Verificar su modelo L–E (ecuación (1.130)) usando las ecuaciones de Lagrange.

Problema 1.5
La figura 1.17 ilustra un Manipulador Robótico Traslacional Subactuado (MRTS)
de 3 GDL. M1 es un servomotor DC que posee un mecanismo de reducción por
engranajes y un codificador óptico articulado a una polea de radio Rp . Esta polea
usa un cable para transmitir la fuerza F1 para accionar el movimiento de traslación
de un carro de masa Mc montado sobre un par de rieles a lo largo de un eje x. M2 es
también un servomotor con codificador óptimo y mecanismo de reducción, empleado
para accionar el movimiento rotatorio del primer eslabón del MRTS alrededor de
un pivote ubicado en el CG del carro. Este primer eslabón es también articulado a
un segundo eslabón. En esta segunda articulación se monta un codificador óptico de
masa despreciables para detectar la posición angular del segundo eslabón.
En la figura 1.17 θ1 es la posición angular del primer eslabón longitud L1 y
masa m1 , θ2 es la posición angular del segundo eslabón longitud L2 y masa m2 , r es
la posición longitudinal del carro y F es la fuerza de fricción opuesta al movimiento
del carro. El sistema MRTS a ser controlado a lazo cerrado, representa un sistema no
cuadrado porque posee dos entradas de control: los voltajes KA1 u1 y KA2 u2 aplicados
los terminales de las armaduras de M1 and M2 respectivamente, y tres salidas por
controlar: r, θ1 y θ2 . Los parámetros KA1 y KA2 son las ganancias de los amplifi-
cadores. La tabla 1.4 muestra los valores de los parámetros del sistema. El MRTS
1.4 PROBLEMAS 47

también se denomina subactuado porque el número de entradas (dos) es menor que


el número de salidas (3).
(a) Determinar el modelo de Lagrange del MRTS.
(b) Determinar las ecuaciones de estado y de salida del MRTS cuando La ∼
= 0.
(c) Determinar las ecuaciones de estado y de salida del MRTS cuando La = 0.

L2 Gripper M3
y
θ2
y M 3 Gripper of mass m H
u1 1 (lateral view)
M1 θ1 Link 2
Pulley Pulley
M2 L1
u2 Link 1
x Rp

F F1

r
x1

Figura 1.17: El manipulador robótico traslacional subactuado (MRTS).

Problema 1.6

La figure 1.18 muestra un Manipulador Robótico Esférico Subactuado (MRES) de 3


GDL, donde M1 es un servomotor DC con codificador óptico que acciona el movimien-
to rotatorio de una base metálica (la base del MRE) articulada a su eje. Esta base
comprende un disco metálico de espesor h y radio Rd unido a una barra metálica de
longitud b y sección a2 . La barra y el disco conforman un cuerpo rı́gido con movimien-
to rotatorio alrededor del eje z0 . M2 es un servomotor montado en el extremo libre de
la barra y se emplea para accionar el movimiento de rotación del primer eslabón de
longitud L2 y masa m2 . Este primer eslabón está articulado a un segundo eslabón de
longitud L3 y masa m3 . En esta segunda articulación se monta un codificador óptico
de masa despreciable para detectar la posición angular del segundo eslabón.
En la figura 1.18, q1 es la posición angular de la base, q2 es la posición angular
del primer eslabón y q3 es la posición angular del segundo eslabón. Las salidas q1 ,
q2 y q3 del sistema serán controladas a lazo cerrado. El sistema MRES representa
un sistema no cuadrado porque posee dos entradas de control: los voltajes KA1 u1 y
KA2 u2 aplicados los terminales de las armaduras de M1 and M2 respectivamente, y
tres salidas por controlar: q1 , q2 y q3 . Los parámetros KA1 y KA2 son las ganancias
de los amplificadores. La tabla 1.6 muestra los valores de los parámetros del sistema.
El MRES también se denomina subactuado porque el número de entradas (dos) es
menor que el número de salidas (tres).
(a) Determinar modelo L–E del MRES.
48 Modelado de Sistemas No Lineales

x3
y x
3 M3 3 y M3
Gripper 3
Link L 3
y
q
3
z
3 z3 1111
0000
y
2 Lx3 2
x2
y z2 x2
1 Link
L2 Encoder z2 Encoder
q
2
M y
2 Lx2 1
z1 z1 x1 M2
x
1

Ly1 a Metallic bar a


of lenght b b
z0 z0
: Axis is pointing
away from the plane
Disk
h x0 y x y0 h
0 0
q q M1
1 Servomotor M 1 1

Frontal view Lateral view

Figura 1.18: El manipulador robótico esférico subactuado (MRTS).

(b) Determinar el modelo de Lagrange del MRES.


(c) Determinar la ecuación de estado y de salida del MRES para La = 0.
(d) Determinar la ecuación de estado y de salida del MRES para La ∼
= 0.

Problema 1.7

La figura 1.19 muestra dos plataformas P1 y P2 de masas m1 y m2 acopladas por


resorte y actuadas hidráulicamente. Las salidas de este sistema son las posiciones
individuales y1 e y2 de las plataformas. Las señales de referencia se fijan mediante
los potenmciómetros RP1 y RP2. El objetivo de control en este problema consiste en
diseñar dos fuerzas de control (generadas por dos actuadores hidráulicos rápidos) que
lleven a cero suficientemente rápido los errores de posición e1 = r1 −y1 y e2 = r2 −y2 .
Asumir que el fluido hidráulico disponible proviene de una fuente a presión constante
y que la compresibilidad del fluido es despreciable.
Se sabe también que para desplazamientos pequeños de la salida ci (i = 1,2),
el flujo volumétrico Qi en el actuador está relacionado con el error ei y la presión
diferencial Pi a través del pistón mediante la relación:

dci
Qi = A = ke Gei − kP Pi
dt
donde A es la sección del pistón y G es la ganancia del amplificador. Para el sistema
descrito:
(a) Determine su modelo de Lagrange.
(b) Determine su modelo en el espacio de estado (ecuaciones de estado y de salida) .
1.4 PROBLEMAS 49

0110 e1

+ 1010 +
u1
0110 1010 0110
P1 0 0110 y
e1
r1 10 or Electric
10
1 1 e2 actuator
0110- R 1

-
Y1
u2
Return
K1 B1
1010+ +
0110 Pressure

P1 0 0110 y source
r2
0110 2
10
2
Return
0110- R2
1010 -
Y2
P 1 or P2
1010 K2 B2

10
y 1 or y 2
e2
111111111111111
000000000000000
Figura 1.19: Plataformas acopladas por resorte (izquierda) y su actuador hidráulico
(derecha).

Problema 1.8

Considere ahora que los dos actuadores hidráulicos del problema 1.7 se reemplazan
por cilindros neumáticos. Las ecuaciones que describen la dinámica de cada cilindro
neumático son:

ẏi = vi
−kyi − bvi + Api
v̇i =
m
RT Rv psupply ui − RT Rv pi − pi Avi
ṗi = i = 1, 2
Ayi

donde m = 0.05 kg es la masa del aire, b = 0.01 kg/s es el coeficiente de fricción, k


= 0.9 kg/s2 es el coeficiente de rigidez, A = 1.57×10−4 m2 es el área de la sección
del pistón, R = 287.05 m2 /K s2 es la magnitud de la constante para aire seco, Tmax
= 315.15 K y Tmin = 275.15 K son las temperaturas máxima y mı́nima del aire
en el cilindro, Rv max = 3.333×10−9 m s y Rv min = OOJJOOO ×10−9 m s son las
resistencias máxima y mı́nima de la válvula, y psupply es la presión de alimentación
del aire. Para este caso:
(a) Determine el modelo de Lagrange del sistema de plataformas.
(b) Determine el correspondiente modelo en el espacio de estado.

Problema 1.9

La figura 1.20 ilustra una columna de destilación para fraccionar petróleo pesado. El
modelo con tiempos muertos del fraccionador (ecuación (1.148)), en el cual p es el
operador de Laplace, se describe en [28] y [27]. Tal modelo considera tres variables
que deben de ser controladas: la composición de los productos de la parte superior
50 Modelado de Sistemas No Lineales

Y1 y lateral y2 de la columna, y la temperatura de fondos Y3 . Las señales o fuerzas


de control correspondientes (las variables manipuladas) son: el flujo superior U1 , el
flujo lateral U2 y el reflujo de fondos U3 . Considerar que que se dispone de la energı́a
calorı́fica requerida por la columna. Para el sistema en cuestión:
(b) Determine su modelo en el espacio de estado.
(a) Determine su modelo de Lagrange.
 
  4,05e−27p 1,77e−28p 5,88e−27p  
Y1 (p)  1+50p 1+60p 1+50p 
 5,39e−18p 5,72e−14p 6,9e−15p  U1 (p)
 Y2 (p)  =    U2 (p)  (1.148)
 1+50p 1+60p 1+40p 
Y3 (p)  4,38e−20p
4,42e −22p
7,2
 U 3 (p)
1+33p 1+44p 1+19p

PC

T
LC
FC

Upper Top
Reflux Draw

T
Side
Intermediate
Reflux Stripper
T
T
T LC FC

Side
A Draw
LC
Bottoms
Reflux
F T
Feed Bottoms

Figura 1.20: Columna de destilación para fraccionar petróleo pesado.

Problema 1.10

El modelo dinámico del reactor quı́mico con chaqueta de enfriamiento ha sido tomado
de [29] y [27]. La figura 1.21 muestra este reactor en el cual ingresa un fluido liquido
que contiene el producto A. Este liquido se revuelve dentro del tanque mediante
un agitador para formar una mezcla perfecta. El producto A en esta condición va a
experimentar una reacción irreversible exotérmica. Debido a que este tipo de reacción
libera calor, es entonces necesario que la temperatura en el interior del tanque sea
controlada por medio del agua de refrigeración que circula en la chaqueta que rodea
1.4 PROBLEMAS 51

al reactor. La reacción quı́mica del producto o componente A dentro del tanque para
formar el componente B se formula como:

A → B

Esta reacción se realiza a una velocidad especı́fica K en horas−1 , cuya expresión se da


más adelante. Los parámetros y variables que intervienen en el sistema de reacción
(ver figura 1.21) son:

Product A
Ca 0 Fl Tl 0

11
00 11
00
Reactor

00
11 00
11
00
11 00
11
00
11 00
11
Tc Fc

00
11 Tl
00
11
00
11 00
11
00
11 00
11 Jacket
00
11 00
11
Coolant 00
11 A
Ca
B
Cb 00
11
Fc Tc 0 Products A and B
Ca Cb Fl Tl

Figura 1.21: Reactor quı́mico con chaqueta de enfriamiento.

1) A: producto que ingresa al reactor.


2) B: producto resultante de la transformación del producto A dentro del tanque.

3) Ca0 : concentración del producto A que ingresa al reactor.


4) Tl0 : temperatura del liquido que contiene el producto A.
5) F : Flujo del liquido que pasa a través del reactor. Cuando el flujo ingresa al
reactor, contiene solamente el producto A. Cuando el flujo sale del reactor,
contiene los productos A y B. Este flujo es la alimentación al reactor.
6) T : temperatura del liquido que sale del reactor.
7) Cb : Concentración del producto B a la salida del reactor y en el interior.
8) Ca : Concentración del producto A. Siempre debe de cumplirse la desigualdad:
Ca < Ca0 . En el estado estacionario se tiene: Ca + Cb = Ca0 .
9) Tc0 : temperatura del agua de refrigeración que ingresa a la chaqueta.
10) Tc : temperatura del agua de refrigeración en el interior y en la salida de la la
chaqueta.
11) Fc : flujo del agua de refrigeración.
52 Modelado de Sistemas No Lineales

Las concentraciones se dan en kmol/m3 , los flujos en m3 /h y las temperaturas en


o C (grados Celcius). A continuación se muestran las ecuaciones diferenciales que

describen la dinámica del sistema. Para ello se aplican las leyes de conservación de la
masa y de la energı́a. Para hacer esto, se supone que no existe liquido acumulado en
el reactor, que las concentraciones y temperaturas son homogéneas y que las pérdidas
de energı́a hacia el exterior son despreciables. Las ecuaciones de balance de masa son:
d(V Ca )
= F Ca0 − V kCa − F Ca (1.149)
dt
d(V Cb )
= V kCa − F Cb (1.150)
dt
donde: F Ca0 es el flujo del componente A en kmol/h que ingresa al sistema, F Ca es
el flujo de A que sale del sistema, V es el volumen del liquido en el sistema, −V kCa
es la velocidad de formación de A (el signo negativo indica que el componente A
 Ca )
se está consumiendo), d(Vdt es el flujo de A (en kmol/h) en transición, F Cb es el
flujo de B que sale del sistema, +V kCb es la velocidad de formación de B a partir
 Cb )
de A (por esta razón posee signo positivo) y d(Vdt es el flujo de B (en kmol/h) en
transición. Las ecuaciones de balance de energı́a se formulan como:
d(V ρ Cp T )
= F ρ Cp T0 − F ρ Cp T − Q + V kCa H (1.151)
dt
d(Vc ρc Cp c Tc )
= Fc ρc Cp c (Tc0 − Tc ) + Q (1.152)
dt
donde: F ρ Cp T0 es el flujo calorı́fico entregado al sistema, F ρ Cp T es el flujo
calorı́fico que sale del sistema, Q es el flujo calorı́fico absorbido por el agua de re-
frigeración, V kCa H es flujo calorı́fico producido en la reacción debido a la entalpı́a
H de la reacción, d(V ρ Cp T )/dt es el flujo calorı́fico en transición (acumulado) en
el interior del tanque, Fc ρc Cp c (Tc0 − Tc ) es el flujo calorı́fico absorbido en el sistema
(refrigeración) y d(Vc ρc Cp c Tc )/dt es el flujo calorı́fico en transición (acumulado) en
la chaqueta del tanque. Todos los flujos calorı́ficos están en kJ/h, mientras que la
entalpı́a H posee unidades de kJ/kmol.
El balance de energı́a en el sistema asume que la temperatura Tc es uniforme en
toda la chaqueta. La transferencia de calor entre el sistema de reacción (que se realiza
a la temperatura T ) y el agua de refrigeración (que se realiza a la temperatura Tc ),
se describe mediante la relación:

Q = U S(T − Tc ) (1.153)

donde U es el coeficiente global de transmisión de calor en kJ/(h m2 K), S es la


superficie efectiva de transferencia de calor en m2 . Tener en cuenta que en general la
superficie S puede variar debido a los flujos que ingresan al reactor y cuando algunas
superficies dentro del tanque no están completamente cubiertas todo el tiempo con
la masa liquida de la reacción. La velocidad de reacción k en h−1 tiene la forma:

k = αe−Ea /R(272+T ) (1.154)

donde Ea es la energı́a de activación en kJ/kmol y R es la constante universal de los


gases. La tabla 1.7 muestra los valores nominales de los parámetros del sistema.
1.4 PROBLEMAS 53

El objetivo de control es estabilizar la temperatura T , ası́ como también la


concentración Cb a la salida del reactor, cumpliendo determinadas especificaciones
de diseño, tales como tiempo de estabilización, máximo sobrepico de las respuestas
controladas y error en estado estable de las respuestas con respecto a las señales de
referencia o “set points”. Las fuerzas de control para lograr este objetivo son el flujo
F del liquido y el flujo de refrigeración Fc . Para este sistema:

(a) Determine su modelo en el espacio de estado.


(b) Determine su modelo de Lagrange.
(c) Para un cambio escalón de 25 a 26 m3 /h en el flujo de alimentación F , graficar
la respuesta no lineal a lazo abierto correspondiente a Cb , T , Ca y Tc .
(d) Para un cambio de 1 m3 /h en el flujo de enfriamiento Fc , grafique la respuesta a
lazo abierto no lineal del sistema correspondiente a Cb , T , Ca y Tc .

Tabla 1.7: Parámetros nominales del reactor quı́mico con chaqueta de enfriamiento.

Sı́mbolo Descripción Valor Unidades

α Coeficiente de la velocidad de reacción 29.063 h−1


R Constante de los gases ideales 8.314 kJ/K kmol
Ea Energı́a de activación 2100 kJ/kmol
H Entalpı́a de reacción 2100 kJ/kmol
U Coeficiente global de transmisión de calor 4300 kJ/(h m2 K)
ρ Densidad del liquido 800 kg/m3
ρc Densidad del refrigerante 1000 kg/m3
Cp Calor especı́fico del lı́quido 3 kJ/(kg K)
Cp c Calor especı́fico del refrigerante 4.1868 kJ/(kg K)
S Superficie efectiva de intercambio de calor 24 m2
V Volumen del tanque 24 m3
Vc Volumen de la chaqueta 8 m3
Tl0 Temperatura del liquido entrante 34 oC

Tc0 Temperatura del refrigerante entrante 20 oC

Ca0 : Concentración del liquido de entrada 8 kmol/m3

Problema 1.11

El modelo dinámico no lineal de la aeronave mostrada en la figura 1.22 comprende


tres conjuntos de ecuaciones diferenciales de primer orden, involucrando las siguientes
variables:

Los ángulos ψ, θ y φ que caracterizan la posición del avión con respecto a los
54 Modelado de Sistemas No Lineales

llamados ejes del viento. El ángulo ψ, θ y φ se denominan de guiñada (yaw en


inglés), de cabeceo (pitch) y de alabeo (roll) respectivamente.

Las velocidades p, q y r son los componentes del vector velocidad angular w


con respecto a un cuadro referencial fijo con la aeronave. Las componentes p, q
y r se denominan tasa pitch, tasa roll y tasa yaw respectivamente.

La amplitud V de la velocidad a lo largo de la trayectoria de vuelo, y dos ángulos


α y β que identifican la dirección del vector tangente a la trayectoria de vuelo
con respecto al eje de simetrı́a principal del avión. Tales ángulos se denominan
ángulo de ataque y ángulo de desplazamiento lateral. α es el ángulo entre la
tangente a la trayectoria de vuelo y el eje longitudinal en la dirección pitch, y
β es el ángulo entre la tangente a la trayectoria de vuelo y el eje longitudinal
en la dirección yaw.

Las derivadas con respecto al tiempo de los ángulos ψ, θ y φ son:


   
ψ̇ p∗
 θ̇  = M(ψ, θ, φ) w∗ w∗ =  q ∗ 
φ̇ r∗

donde w∗ es el vector velocidad angular expresado con respecto a los ejes del viento
y M es una matriz de la forma:
 
0 sin φ sec θ cos φ sec θ
M(ψ, θ, φ) =  0 cos φ − sin φ 
1 sin φ tan θ cos φ tan θ

El vector w se puede expresar como:

w∗ = J−1 S(w)Jw + J−1 T

donde S es la matriz de oblicuidad simétrica:


 
0 r −q
S(w) =  −r 0 p 
q −p 0

J es la matriz de inercia:
 
Ix 0 −Ixz
J= 0 Iy 0 
−Ixz 0 Iz

y T representa el vector de torques externos. Finalmente, las derivadas de V , α y β


con respecto al tiempo tienen la forma:

V̇ = −(D/m) − g sin θ
α̇ = q − q ∗ sec β − (p cos α + r sin α) tan β
β̇ = r∗ + p sin α − r cos α
1.4 PROBLEMAS 55

donde D es una cantidad escalar llamada la fuerza de arrastre, m es la masa del


avión y g es la aceleración de la gravedad. Para completar el modelo dinámico es
necesario especificar la relación de las tasas de p, q y r que aparecen en el primer y
tercer conjunto de ecuaciones, están relacionadas con las otras variables como sigue:

p∗ = p cos α cos β + (q − α̇) sin β + r sin α cos β


1
q∗ = (L − mg cos θ cos φ)
mV
1
r∗ = (−S + mg cos θ sin φ)
mV
en donde S y L son dos cantidades escalares denominadas fuerza lateral y de sus-
tentación respectivamente. Reemplazando p∗ , q ∗ y r∗ en las ecuaciones previas, y
resolviendo para α̇, se obtiene un sistema de nueve ecuaciones diferenciales de primer
orden en las variables ψ, θ, φ, p, q, r, V , α y β), las cuales pueden constituir las
variables de estado del sistema.
El vector de torque externos T y el vector columna fuerzas externas con ele-
mentos D, L y S, contienen las variables de entrada. T puede expresarse como:
    
a11 V 2 sin β + a12 rV + a13 pV b11 cos β 0 b13 cos β δa
T =  a21 V 2 + a22 V 2 sin α + a23 qV  +  0 b22 cos α 0   δe 
2
a31 V sin β + a32 rV + a33 pV 0 0 b33 cos β δr

en donde aij ’s y los bij ’s son los parámetros aerodinámicos fijos que dependen de la
geometrı́a del avión, de la densidad del aire, etc., y δa , δe y δr denotan las deflexiones
del alerón, del elevador y del timón. El vector columna con elementos D, L y S se
puede expresar como:
     
D c11 V 2 + c12 V 2 cos α − cos α cos β
 L  =  c21 V 2 + c22 V 2 sin 2α  + P  sin α  δP
S 2
c31 V sin 2β cos α cos β

donde los cij ’s son parámetros de ganancia fija, P indica el máximo empuje y δp la
posición del acelerador. Las ecuaciones presentadas describen un sistema cuyo estado
está definido en una cierta vecindad abierta U de R9 , sujeto a la acción del vector de
entrada u con elementos δa , δe , δr y δP .

(a) Determine el modelo no lineal en el espacio de estado de la aeronave.

Figura 1.22: Aeronave.

(b) Determine el modelo de Lagrange de la aeronave.

Problema 1.12
56 Modelado de Sistemas No Lineales

La figura 1.23 muestra un motor DC en el cual el voltaje de armadura se mantiene


constante mientras que el voltaje de campo es variable. El modelo de este motor ha
sido tomado de [11]. El balance eléctrico en el devanado del estator se describe como:

I Ls Φ
+ Rr Lr

Vr
Ω Rs
- I
- Vs +

Figura 1.23: Nonlinear DC motor.

dIs
Ls + Rs If = Vs
dt
donde Is es la corriente del estator, Vs es el voltaje del estator, Rs y Ls son la re-
sistencia e inductancia del devanado del estator respectivamente. El balance eléctrico
en el devanado del rotor resulta:
dIr
Lr + Rr Ir = Vr − E
dt
donde Ir es la corriente del rotor, Vr es el voltaje del rotor, Rr y Lr son la resistencia
e inductancia del devanado del rotor respectivamente, y E es el voltaje de fuerza
contra electromotriz. Considerando sólo fricción viscosa, el balance mecánico en la
carga está dado por:
dΩ
J + FΩ = T
dt
donde Ω representsa la velocidad angular del eje del motor, J denota la inercia de la
carga, F es la constante de fricción viscosa, y T es el torque de carga. Si Φ denota el
flijo asociado con el devanado del estator, entonces:

E = Ke ΦΩ T = Km ΦIr Φ = Ls Is

donde Ke y Km son constantes. Asumiendo 100 % de eficiencia en la conversión de


energı́a, entonces Ke = Km = K. Para el sistema descrito considere que el voltaje
u = Vs es la entrada del sistema y seleccione como variables de estado: x1 = Is ,
x2 = Ir , x3 = Ω. Luego:

(a) Determine el modelo de Lagrange del motor DC.


(b) Determine el modelo en el espacio de estado.

Problema 1.13

La figura 1.24 muestra un manipulador robótico polar vertical de 2 GDL extraı́do de


[22].
(a) Determinar su modelo L–E.
(b) Determinar su modelo de Lagrange empleando las ecuaciones de Lagrange.
1.4 PROBLEMAS 57

Figura 1.24: Manipulador robótico polar vertical de 2GDL.

Problema 1.14

La figura 1.25 muestra un manipulador robótico polar horizontal de 2GDL extraı́do


de [22].
(a) Determinar su modelo L–E.
(b) Determinar su modelo de Lagrange empleando las ecuaciones de Lagrange.

Figura 1.25: Manipulador robótico polar horizontal de 2GDL.

Problema 1.15

La figura 1.4 muestra el manipulador robótico con articulación elástica tratado en


la subsección 1.1.2. Formular su modelo dinámico no lineal empleando las ecuaciones
de Lagrange.

Problema 1.16

La figura 1.26 muestra un servomotor con carga no lineal de dos grados de libertad
(2GDL). Notar que la carga posee dos grados de libertad. La unión de la carga
con el eje del servomotor no es flexible. Asumir que la inductancia de armadura no
es despreciable. Formular el modelo dinámico no lineal del sistema empleando las
ecuaciones de Lagrange y las ecuaciones de la fı́sica.

Mo Ro
L1 τ
m1

Union
R θm no
+ Ν1 flexible
Lo θ
u Va eb
m
-
Jm
L Bm θ
Ν2 BL JL

Figura 1.26: Servomotor con carga no lineal de 2GDL. El acoplamiento de la carga


al eje del motor no es flexible.

Problema 1.17 Péndulo Doble


58 Modelado de Sistemas No Lineales

La figura 1.27 muestra el proceso péndulo doble no lineal. El acoplamiento entre los
dos péndulos no es flexible. Las varillas poseen longitud L1 y L2 . Despreciando la in-
ductancia de armadura, formular el modelo dinámico no lineal del sistema empleando
las ecuaciones de Lagrange y las ecuaciones de la fı́sica.

+ Fuerza de
u control
- τ
Servomotor
D.C. y
θ
z F

Carro

Figura 1.27: Sistema péndulo doble no lineal.

Problema 1.18 Doble Grúa Puente

La figura 1.28 muestra el proceso doble grúa puente no lineal. El acoplamiento entre
las dos secciones de la varilla no es flexible. Las varillas poseen longitud L1 y L2 .
Despreciando la inductancia de armadura, formular el modelo dinámico no lineal del
sistema empleando las ecuaciones de Lagrange y las ecuaciones de la fı́sica.
+ Fuerza de
u control
-
Servomotor
D.C. y

z F

Carro

θ
z
Doble
y’ ’ puente
τ grua

Figura 1.28: Sistema doble grúa-puente.


1.5 Estructura en Tiempo Real 59

1.5. Estructura en Tiempo Real


La estructura en tiempo real mostrada en la figura 1.29 se emplea para la
implementación de los sistemas de control de posición de los manipuladores robóticos
y para el sistema de control del tanque de agua.

Figura 1.29: Estructura del sistema de control en tiempo real empleado.

Notar en la figura 1.29 que cualquier algoritmo de control se implementa en


la PC. De hecho, los algoritmos de control implementados en este trabajo, emplean
el lenguaje del software LabVIEW, versión 7.1. La interfaz entre la PC y el usuario
es una tarjeta de adquisición de datos PCI 6229 de NI (National Instrument). Las
señales medidas y generadas para cada sistema de control se discuten en las siguientes
secciones.

1.6. Sistema de Control del Manipulador de 1GDL


La figura 1.30 muestra la estructura en tiempo real para controlar la posición
angular del manipulador robótico de 1GDL. El sistema de control requiere la medición
de la posición angular, la cual se logra gracias al sensor de posición en cuadratura
(“encoder”) que posee el servomotor D.C. en su eje. La señal medida ingresa por
uno de los dos contadores que posee la tarjeta PCI 6229, ubicado en sus terminales
PFI (Programmable Function I/O). La señal medida se procesa en la PC empleando
LabVIEW. El detalle de la programación del contador se puede ver en los programas
60 Modelado de Sistemas No Lineales

Figura 1.30: Sistema de control en tiempo real para el manipulador robótico de 1GDL.

en tiempo real para controlar la posición del brazo robótico. Tales programas se
encuentran en el CD adjunto a este trabajo.
El algoritmo de control grabado en la PC procesa tal medición y genera una
señal de control. Esta señal resulta débil para poder alimentar directamente la ar-
madura el servomotor D.C. Por ello es que se procesa empleando la técnica de mod-
ulación por ancho de pulsos (en inglés PWM: Pulse Width Modulation) y luego pasa
a un amplificador con configuración en H para darle el nivel de potencia adecuado
para hacer girar al servomotor en la dirección adecuada.

1.6.1. Generación de la señal PWM


La señal PWM se genera por software. Para ello se emplea el microcontrolador
PIC 16f877 de Microchip. La sigla PIC (Peripheral Interface Controller) significa que
tal dispositivo es un controlador de la interfaz periférica. El generador de PWM, cuyo
diagrama de flujo se muestra en la figura 1.31, genera pulsos de ancho diverso, en
concordancia con la señal generada por el algoritmo de control. Tal señal de control
puede variar en el rango de - 2.5 a 0 V para giro antihorario del servomotor, y de 0
a 2.5 V para giro horario. Esto significa que la posición (por ende la velocidad) del
servomotor varı́a de acuerdo a la magnitud del ancho del pulso generado.
Para que el PIC 16f877 trabaje con rangos positivos, mediante LabVIEW, el
rango de - 2.5 a 0 V se convierte en uno de 0 a 2.5 V, mientras que el rango de 0 a
2.5 V se convierte en otro de 2.5 a 5 V (ver figura 1.32). De este modo, las señales
de control en el rango de 0 a 5 V ingresan al PIC 16f877 por el pin RAO, tal como
se muestra en la figura 1.33. Estas señales se convierten en pulsos PWM que operan
a una frecuencia aproximada de 7.8 kHz, que luego de pasar por el amplificador en
1.6 Sistema de Control del Manipulador de 1GDL 61

H, obtienen el nivel adecuado de potencia para conmutar el giro del motor tal como
se explica en la siguiente sección. La subsección ?? muestra el código en lenguaje
ensamblador del programa para generar las señales PWM, mientras que la figura
1.33 muestra el diagrama circuital para realizar la placa del generador de pulsos
PWM empleando ORCAD.

Figura 1.31: Diagrama de flujo para la generación de los pulsos PWM.


62 Modelado de Sistemas No Lineales

Figura 1.32: Rangos de trabajo en el PIC 16f877.

Figura 1.33: Diseño ORCAD para implementar la placa del generador de pulsos
PWM.

1.6.2. El Amplificador de Potencia


El Circuito Amplificador
Un circuito amplificador por conmutación puede ser construido de varias formas,
ya sea cambiando la frecuencia de conmutación, modificando el ciclo de trabajo (“duty
cycle”) o cambiando ambas. El efecto buscado en un método u otro es que el promedio
de voltaje de salida sea proporcional a la tensión de control. El método más común
de un conmutador amplificador es la modulación PWM (por ancho de pulso). En
nuestro caso, los dispositivos conmutadores, conmutan a una frecuencia constante,
dando como resultado la variación de la tensión de salida entre dos valores extremos.
Por variación del ancho de pulso o el duty cycle, el valor promedio de voltaje de salida
puede ser cambiado en forma proporcional a la tensión de control.
El conmutador amplificador implementado es del tipo H y su diagrama se mues-
tra en la figura 1.34. Dicho amplificador emplea dispositivos conmutadores MOSFET
IRFZ34 de 30 A y una fuente de 24 voltios y 8 A. La principal ventaja del conmutador
1.6 Sistema de Control del Manipulador de 1GDL 63

en H es que sólo necesita una fuente. Los dispositivos conmutadores son conmutados
en pares generando una tensión bipolar a la salida. Para disparar los MOSFET se
necesita circuiterı́a adicional para generar la tensión de disparo en cada conmutador.
En sı́ntesis, cuando el sistema de disparo cierra el conmutador (A1 A4 ) y abre
(A2 A3 ), el sentido de la corriente es la lı́nea punteada, induciendo de esta forma una
tensión +Vcc en el servomotor. Luego, si el sistema de disparo abre al conmutador A1,4
y cierra A2,3 , el sentido de la corriente es la lı́nea continua, induciendo ası́ una tensión
−Vcc en el servomotor. Por lo tanto, el servomotor ve en sus terminales una onda de
voltaje cuadrada variando entre ±Vcc y la corriente que pueda absorber dependerá de
la capacidad en corriente de los dispositivos usados en los conmutadores y de la fuente.

Figura 1.34: Esquema del circuito amplificador con su circuito de control.

El Circuito de Control de Disparo de los MOSFET


El objetivo del circuito de control de disparo mostrado en La figura 1.34 es
realizar la conmutación de (A1 A4 ) a (A2 A3 ) o viciversa, de forma tal que no se generen
cortocircuitos durante la conmutación. Tales cortocircuitos se pueden generar cuando
los dos pares de conmutadores se encuentran cerrados, ya que en tal situación puede
circular una gran corriente capaz de deteriorar al dispositivo conmutador.
La lógica del circuito de control de disparo de los MOSFET responde a la
tabla 1.8. Notar en esta tabla que cuando las señales PWM1 y PWM2 que salen del
generador de PWM poseen igual amplitud, los conmutadores A1 , A2 , A3 y A4 estarán
siempre en el estado OFF.
Una protección adicional para evitar corrientes de cortocircuito en los conmu-
tadores se logra introduciendo los diodos D1 , D2 , D3 y D4 , tal como se muestra en
64 Modelado de Sistemas No Lineales

Tabla 1.8: Conmutación de los MOSFET’s.


P W M ON P W M OSN A1 A2 A3 A4
0 0 OFF OFF OFF OFF
0 1 ON OFF ON OFF
1 0 OFF ON OFF ON
1 1 OFF OFF OFF OFF

la figura 1.34.
La figura 1.35 muestra los circuitos de disparo de los MOSFET Q14, Q5, Q6
y Q7. Tales circuitos emplean compuertas lógicas de tecnologı́a TTL (Transistor
Transistor Logic) conformado por los integrados 7404, 7486, 7408 y dos resistencias de
500 Ω. El circuito de disparo de Q14 comprende los transistores Q1 y Q3 formando un
amplificador que trabaja en clase B. Este circuito de disparo trabaja simultáneamente
con el circuito de disparo del MOSFET Q6 (transistores Q8 y Q9). Del mismo modo,
los circuitos de disparo de los MOSFET Q5 (transistores Q2 y Q4) y Q7 (transistores
Q10 y Q11) trabajan en conjunto.
Por ejemplo para el MOSFET Q14, cuando en la salida de la compuerta 7417
existe una señal ON, el transistor Q1 se corta mientras que Q3 se satura. De este
modo a la base del MOSFET llega una corriente que lo habilita. En caso contrario,
cuando en la salida de la compuerta 7417 existe una señal OFF, el transistor Q1 se
satura mientras que Q3 se corta. De este modo a la base del MOSFET no llega una
corriente y lo inhabilita. El mismo análisis se puede hacer para todos los circuitos de
disparo.

1.7. Sistema de Control de Manipuladores de 2 y 3GDL


La estructura en tiempo real para controlar la posición angular de los manipu-
ladores robóticos de 2GDL (manipulador traslacional y manipulador esférico) es una
extensión de la estructura mostrada en la figura 1.30. Para el caso de 2GDL, el sis-
tema de control en tiempo real requiere de la medición simultánea de dos posiciones
angulares, la cual se logra gracias al sensor de posición en cuadratura que posee en su
eje cada uno de los dos servomotores D.C. que emplea el manipulador. Estas señales
de posición medidas ingresan por los dos contadores que posee la tarjeta PCI 6229,
ubicado en sus terminales PFI (Programmable Function I/O). La señales medidas se
procesan luego en la PC empleando LabVIEW. El detalle de la programación de los
contadores trabajando simultáneamente se puede ver en los programas en tiempo real
para controlar las posiciones de los brazos de dichos manipuladores. Tales programas
se encuentran en el CD adjunto a este trabajo.
El algoritmo de control multivariable grabado en la PC, procesa tales mediciones
y genera dos señales de control. Estas señales son débiles en potencia para poder hacer
girar convenientemente a los servomotores D.C. Por esta razón es que cada una de
ellas se procesa empleando la técnica de modulación por ancho de pulsos (PWM) y
luego se amplifican por separado empleando para ello un amplificador de potencia
con configuración en H. Las señales de control amplificadas ingresan a los terminales
1.8 El Sistema de Control del Tanque 65

Figura 1.35: Circuitos de control del amplificador de potencia.

de las armaduras de los servomotores, para hacerlos girar en la dirección adecuada.


Para el caso de 3GDL, el sistema de control en tiempo real requiere de la medición
simultánea de tres posiciones angulares, la cual se logra gracias al sensor de posición
en cuadratura que posee en su eje cada uno de los dos servomotores D.C. que emplea
el manipulador. Dos de estas señales de posición medidas ingresan por los dos conta-
dores que posee la tarjeta PCI 6229, ubicado en sus terminales PFI (Programmable
Function I/O). Debido a que la tarjeta PCI 6229 posee sólo dos contadores de pulsos
para medir posiciones, se ha tenido que realizar un programa ad-hoc en LabVIEW
para poder medir la tercera señal de posición, que también ingresa a uno de los
terminales PFI de la tarjeta. Este programa se encuentra en el CD adjunto a esta
publicación. El procedimiento que sigue a continuación ya es conocido: el algoritmo
de control multivariable grabado en la PC, procesa tales mediciones y genera tres
señales de control que se procesan empleando la técnica PWM y se amplifican por
separado empleando para ello un amplificador de potencia con configuración en H.

1.8. El Sistema de Control del Tanque


La figura 1.36 muestra La estructura en tiempo real para controlar simultánea-
mente o por separado el nivel y la temperatura del agua contenido en el tanque. Los
66 Modelado de Sistemas No Lineales

sistemas de control a realizarse requieren de la medición del nivel y de la temper-


atura del agua. La medición de nivel se logra empleando un transmisor de presión
Valcom de rango 0 a 1.25 m, mientras que la medición de la temperatura emplea una
termoresistencia con sensor Pt 100 y de rango 0 a 100 o C.
La medición de nivel debe ingresar a la PC a través de la tarjeta de adquisi-
ción de datos en un rango de voltaje adecuado. Para ello se emplea el convertidor e
indicador de nivel Safir tipo P, el cual convierte los 4 a 20 mA que proporciona el
transmisor de nivel Valcom tipo P, a una señal de voltaje de 0 a 10 V, que equivale
al rango de 0 a 1.25 m de medición de nivel. El transmisor usado sirve también como
indicador digital del nivel.
De mismo modo, la señal que proporciona la termoresistencia se convierte al
rango de voltaje de 0 a 10 V empleando para ello el transmisor de temperatura
Valcom tipo T, el cual convierte el rango de temperatura de 0 a 100 o C a una señal
de voltaje de 0 a 10 V. El convertidor usado sirve también como indicador digital de
la temperatura.

Figura 1.36: Sistema de control en tiempo real para el tanque.

El algoritmo de control grabado en la PC procesa tal medición y genera dos


señales de control. Estas señales salen a través de dos de las cuatro salidas analógicas
que posee la tarjeta PCI 6229. La primera señal de rango 0 a 10 V, va directamente
a la válvula motórica Sauter AVM104S, la cual sirve para controlar el flujo de agua
de entrada al tanque. La segunda señal de rango 1 a 5 V, sirve para excitar al
controlador de potencia SPC1-35, el cual genera la corriente adecuada para alimentar
a la resistencia eléctrica con el propósito de producir el calor necesario para calentar
el agua del tanque a una temperatura deseada.
Capı́tulo 2

Control Óptimo

Este capı́tulo trata el problema del control óptimo cuadrático gaussiano, denomi-
nado ası́ porque el ı́ndice de rendimiento o función de costo que emplea es una fun-
ción cuadrática de los estados y de las señales de control. La solución del problema de
control planteado consiste en determinar un extremo de la función de costo mediante
minimización con el propósito de generar la ley de control óptima.
La configuración del sistema de control óptimo no lineal desarrollado en este capı́tu-
lo comprende el modelo no lineal multivariable del sistema a controlar, un observador no
lineal para estimar los estados del sistema y un controlador de realimentación de esta-
dos del tipo proporcional–integral. El diseño del sistema de control óptimo consiste en
producir una fuerza de control u que sea capaz de hacer que el vector de salida y del
sistema (la salida controlada) siga al vector de referencias deseadas r cumpliendo ciertas
especificaciones de diseño, no obstante la presencia de incertidumbres en los parámetros
y de disturbios estocásticos gaussianos actuando sobre el sistema en operación.

2.1. Configuración del Sistema de Control Óptimo


La configuración del sistema de control óptimo no lineal empleada en este
capı́tulo se ilustra en la figura 2.1. Tal configuración combina en su diseño la repre-
sentación de un sistema no lineal, un observador no lineal para estimar los estados del
sistema, y un controlador de realimentación de estados del tipo proporcional–integral.
El objetivo del sistema de control óptimo consiste en seleccionar una fuerza de control
u capaz de minimizar la diferencia entre el vector de salida y del sistema y el vector
de trayectorias de referencia deseadas r, a pesar de la presencia de incertidumbres
en los parámetros y de disturbios estocásticos gaussianos actuando sobre el sistema
controlado.
La implementación en tiempo real del sistema mostrado en la figura 2.1 opera
como sigue: después de cada tiempo de discretización, el observador no lineal estima
los estados x del sistema empleando los datos proporcionados por el vector de entrada
u y el vector de salida y. Invocando el bien conocido teorema de la separación, tales
estados estimados y la integral de la salida y, pueden ser usados para computar el
controlador proporcional–integral de realimentación de estados u (la ley de control)
del sistema. La ley de control actúa sobre el proceso no lineal (pero linealizable) para
hacer que el error entre r (el vector de referencias) y y tienda a cero, cumpliendo
68 Control Óptimo

Nonlinear state
x^ observer
r -
z y
+

State-feedback u MIMO nonlinear


controller process y

Figura 2.1: Configuración de un sistema de control óptimo no lineal.

ciertas especificaciones de diseño.

2.2. El Sistema Dinámico No Lineal Multivariable


El sistema dinámico no lineal multivariable (de múltiples entradas u múltiples
salidas) se puede describir como:

ẋ = f (x, u) + v x(0− ) = 0
y = h(x) + w (2.1)
        
x1 u1 v1 y1 w1
     ..     .. 
x =  ...  u =  ...  v= .  y =  ...  w= . 
xn um vn yp wp
   
f1 (x, u) h1 (x)
 ..   .. 
f = .  h= . 
fn (x, u) hp (x)
donde x es el vector de estado, u es el vector de control (la entrada al sistema) e y
es el vector de salida. Asumiremos que las funciones vectoriales de variable vectorial
f (x, u) y h(x) son operadores no lineales diferenciables que representan la dinámica
del sistema y la dinámica de la salida respectivamente. Los vectores v de orden n × 1
y w de orden p × 1 son los disturbios en los estados del sistema (ruidos en los estados)
y en sus salidas (ruidos de medición) respectivamente.
Sean x0 , u0 e y0 los vectores de referencia (o nominales) correspondientes a x,
u e y respectivamente. Si la entrada del sistema se selecciona exactamente igual a
u0 , su respuesta será x0 . Entonces x0 satisface:

ẋ0 = f (x0 , u0 ) + v x0 (0− ) = 0


y0 = h(x0 ) + w (2.2)

Si la entrada del sistema u no es exactamente, pero sı́ muy cercana a u0 , el vector


de trayectorias x resultante, el vector de estado, difiere muy poco de x0 . Para tal
situación, las trayectorias actuales pueden formularse como:

x = x0 + δx u = u0 + δu y = y0 + δy (2.3)
2.3 El Controlador PI de Realimentación de Estados 69

donde los vectores residuales δx, δu y δy representan desviaciones con respecto a los
correspondientes vectores de estado, de control y de salida respectivamente. Reem-
plazando (2.3) en (2.1) produce:

ẋ0 + δ ẋ = f (x0 + δx, u0 + δu) + v


y0 + δy = h(x0 + δx) + w (2.4)

Como hemos asumido que las desviaciones actuales son pequeñas, entonces el sistema
(2.4) admite ser linealizado alrededor de un vector de trayectorias nominales o de
referencia x0 . La expansión de (2.4) en series de Taylor alrededor de x0 y u0 resulta:

δ ẋ ≈ Aδx + Bδu + v δx(0− ) = 0


δy ≈ Cδx + w (2.5)

donde:
 ∂f1 ∂f1   ∂f1 ∂f1 
∂x1 ··· ∂xn ∂u1 ··· ∂um
 .. .. ..   .. .. .. 
A =  . . .  B= . . . 
∂fn ∂fn ∂fn ∂fn
∂x1 ··· ∂xn (x0 ,u0 ) ∂u1 ··· ∂um (x0 ,u0 )
 
∂h1
∂x1 ··· ∂h1
∂xn
 .. .. .. 
C =  . . .  (2.6)
∂hp ∂hp
∂x1 ··· ∂xn (x0 )

Observar que las matrices jacobianas Ann , Bnm , Cpn y Dpm necesitan ser evaluadas
alrededor de los vectores de referencia x0 y u0 . Para resolver el problema del control
óptimo en consideración, se requiere diseñar una apropiada ley de control de reali-
mentación de estados de la forma u = −Gx, donde G de dimensión m × n, es la
la matriz de ganancia de realimentación de estados, la cual se diseña empleando el
siguiente sistema linealizado:

δ ẋ = Aδx + Bδu + v δx(0− ) = 0


δy = Cδx + w
δu = −Gδx (2.7)

2.3. El Controlador PI de Realimentación de Estados


De acuerdo a la referencia [12], el controlador proporcional de realimentación de
estados mostrado en la figura 2.2 es una matriz de ganancia de realimentación de
estados G, de modo tal que la ley de control de realimentación de estados que genera
y expresada como:
δu = −Gδx (2.8)
minimiza la siguiente función de costo cuadrática:
 ∞
I= e2αt [δxT (t)Q δx(t) + δuT (t)R δu(t)]dt (2.9)
0
70 Control Óptimo

sujeta a la ecuación de restricción:

δ ẋ = Aδx + Bδu + v δx(0− ) = 0 (2.10)

donde A de orden n × n y B de orden n × m son matrices constantes, Q = QT de


orden n × n y R = RT de orden m × m son matrices de peso definidas positivas.
También, α ≥ 0 es una constante de peso.

u x y
g h
+
+
f(.)
f(x)
u
-D

Figura 2.2: Sistema de control óptimo con un controlador proporcional de reali-


mentación de estados.

La bien conocida condición de controlabilidad establece que un sistema lineal


de la forma δ ẋ = Aδx + Bδu es de estado controlable siempre que su matriz de
controlabilidad M posea rango completo:

rango M = rango [B AB ··· An−1 B] = n (2.11)

Cuando el sistema linealizado dado en (2.10) es de estado controlable, la matriz de


ganancia de realimentación de estados G se determina de:

G = R−1 BT K (2.12)

donde K = KT de orden n × n es la única matriz definida positiva solución de la


siguiente ecuación asociada de Riccati:

K(A + αI) + (A + αI)T K − KBR−1 BT K + Q = 0 (2.13)

donde I es la matriz identidad de dimensiones apropiadas. Para mejorar el rendimien-


to del controlador proporcional de realimentación de estados, se le puede añadir acción
integral ubicando un integrador a la salida del sistema, tal como se muestra en la
figura 2.3; es decir: δz = δydt. Luego:

δ ż = δy = Cδx + w (2.14)

Combinando ( 2.14) con el sistema descrito en (2.7), la descripción aumentada en el


espacio de estado de (2.7) toma la forma:

δ ẋa = Aa δxa + Ba δu + va
δy = Ca δxa + w (2.15)
2.3 El Controlador PI de Realimentación de Estados 71

x
u x y z
g h z
+
+
f(.)
f(x) x
u a z
-D

Figura 2.3: Sistema de control óptimo con controlador PI (Proporcional–Integral) de


realimentación de estados.

donde el superı́ndice a significa aumentado. Los vectores xa de orden n + p, va de


orden n + p y las matrices Aa de orden (n + p) × (n + p), Ba de orden (n + p) × m y
Ca de orden p × (n + p) toman la forma:
       
a δx a v a A 0 a B 
δx = ; v = ; A = ; B = ; Ca = C 0
δz w C 0 0
(2.16)
Siempre que el sistema descrito por:

δ ẋa = Aa δxa + Ba δu + va δxa (0− ) = 0 (2.17)

cumpla la condición de controlabilidad dada en (2.11), que para este caso es:

rango Ma = rango Ba Aa Ba · · · (Aa )n−1 Ba = n + p (2.18)

entonces, la matriz de ganancia de realimentación de estados aumentada Ga de orden


m × (n + p) puede ser computada de:

Ga = R−1 (Ba )T Ka (2.19)

donde Ka = (Ka )T de orden (n + p) × (n + p) es la única matriz solución definida


positiva de la siguiente ecuación de Riccati:

Ka (Aa + αI) + (Aa + αI)T Ka − Ka Ba R−1 (Ba )T Ka + Qa = 0 (2.20)

Por consiguiente, la ley de control de realimentación de estados aumentada (el con-


trolador PI de realimentación de estados):
 
 δx
δu = −G δx = − G1 G2
a a
(2.21)
δz

minimiza la siguiente función de costo cuadrática aumentada:


 ∞
Ia = e2αt [(δxa )T (t)Qa δxa (t) + δuT (t)R δu(t)]dt (2.22)
0

sujeto a la ecuación de restricción dada en (2.17), donde Qa = (Qa )T de orden


(n + p) × (n + p) y R = RT de orden m × m son matrices de peso definidas positiva y
72 Control Óptimo

α ≥ 0 es una constante de peso exponencial. Observar que las matrices para ponderar
el rendimiento del sistema (las matrices de sintonización) son R, Q y Qa .
De acuerdo al teorema de la separación [12], los controladores de realimentación
de estado se pueden implementar empleando los estimados de los estados en lugar de
los estados actuales del sistema. Por consiguiente, las leyes de control (2.8) y (2.21)
se pueden implementar también como:

δu = −Gδ
x
 
 δ
x
xa = −
δu = −Ga δ Gx Gz (2.23)
δ
z

Para obtener el vector actual de estado estimado δ x emplearemos un observador no


lineal (section 2.4). El vector estimado actual δ
z se obtiene directamente integrando
la salida actual δy. Sin embargo, para calcular la matriz de ganancia del observador,
se emplea el sistema linealizado dado en 2.7, como veremos a continuación.

2.4. El Observador No Lineal Multivariable


Consideremos la estructura de la figura 2.4 para la estimación de estados y con-
trol del sistema descrito en (2.1). El observador no lineal ilustrado se puede describir
por:
˙x = f (
δ )
x, u) + H(y − y x(0− ) = 0
δ
δ
y = h(
x) (2.24)

donde δ x e δy son los vectores estimados de δx e δy respectivamente, y H es una


matriz residual de ganancia de orden n × p a ser determinada.
Por otra parte, asumamos que los disturbios v y w en (2.1) sean ruido blanco
gaussiano con media (o esperanza) nula. El ruido blanco gaussiano posee la propiedad
de ser no correlacionado en cada instante de tiempo. En otras palabras, no existe una
interrelación (correlación) entre v y w. La propiedad de la media nula implica que
toda la información estadı́stica del ruido se acumula en la covarianza de los disturbios.
En términos matemáticos:

E[v(t)vT (τ )] = Vδ(t − τ ) E[v] = 0


E[w(t)w (τ )] = Wδ(t − τ )
T
E[w] = 0 (2.25)

donde E[.] es la operación matemática esperanza, δ(t − τ ) es la función delta de


Kronecker definida como: δ(t − τ ) = 1 para t = τ y nula en otro caso. También, V
de orden n × n y W de orden p × p son matrices de covarianza definidas positivas.
Es un hecho conocido que un sistema lineal de la forma dada en (2.7) pero con
v = w = 0, es observable siempre que su correspondiente matriz de observabilidad
N posea rango completo:
 
C
 CA 
 
rango N = rango  .. =n (2.26)
 . 
CAn−1
2.5 Procedimiento de Diseño 73

v + w
+
u + x + y z
g h
+
+ -
f(.) r=0
f(x)

u ^
x
-D a z^ = z
z^

^
x ^
y y
u g C
+ + - +
+ +
f(.)
f(x)
E

Figura 2.4: Estructura del sistema de control óptimo para estimación de estados y
control.

Cuando el modelo linealizado de (2.7) es observable, la matriz residual de ganancia


H del observador no lineal descrito en (2.24), se calcula de:

H = SCT W−1 (2.27)

donde S = ST de orden n × n es la única matriz definida positiva solución de la


siguiente ecuación asociada de Riccati:

0 = S(A + αI)T + (A + αI)S − SCT W−1 CS + V (2.28)

El estimador de estados resultante mostrado en la figura 2.4 es conocido también


como el filtro extendido de Kalman de ganancia constante H [12].

2.5. Procedimiento de Diseño


En sistemas de control óptimo del mundo real, generalmente estamos interesa-
dos que la salida controlada y(t) siga a una trayectoria deseada r(t) cumpliendo las
especificaciones de diseño. Como el diseño del sistema de control óptimo minimiza
una función de costo, entonces el objetivo de control se cumple cuando la fuerza
de control logre que todos los estados del sistema se minimicen (tiendan al estado
cero), incluyendo el vector de salida y(t). Cuando trabajamos con variables residuales
(conocidas también como perturbacionales), tales variables se pueden considerar co-
mo señales de error con respecto a las variables reales. Por ejemplo, para la variable
residual de salida δy(t) se formula:

δr(t) = y(t) − r(t)


74 Control Óptimo

donde y(t) es la salida real del sistema que debe de seguir a la trayectoria de referencia
r(t) cumpliendo ciertas especificaciones de diseño previamente establecidas. Es claro
que cuando se cumpla el objetivo de control del sistema, es decir, cuando δy(t) ∼ = 0,
entonces: y(t) ∼
= r(t).
El procedimiento de diseño del sistema de control óptimo desarrollado sigue los
pasos siguientes:

(1) Formular el problema: describir el sistema a controlar, definir las especifica-


ciones de diseño y determinar el modelo no lineal del sistema en la forma dada
en (2.1).
(2) Determinar el modelo linealizado del sistema (ecuación (2.5)).
(3) Determinar la controlabilidad y observabilidad del sistema linealizado (ecua-
ciones (2.18) y (2.26) respectivamente).
(4) Computar la matriz de ganancia Ga de la ley de control PI del sistema (ecua-
ciones (2.19) y (2.20)).
(5) Computar la matriz de ganancia Ha del observador no lineal del sistema (ecua-
ciones (2.27) y (2.28)).
(6) Simular el sistema de control óptimo empleando las ecuaciones dinámicas no
lineales (2.1) y (2.24).
(7) Implementar el sistema de control óptimo (hardware).
(8) Desarrollar el software de control en tiempo real del sistema.
(9) Ejecutar pruebas de funcionamiento en tiempo real.

Ejemplo 2.1 Design and Simulation of an Optimal Control System for the
EJRM.

IN PROGRESS

Ejemplo 2.2 Design and Simulation of an Optimal Control System for the
TRM.

IN PROGRESS

Ejemplo 2.3 Diseño y Simulación de un Sistema de Control Óptimo para


el MRT.

Las matrices A, B y C dadas en (2.5) se pueden obtener empleando las matrices


jacobianas, a partir del modelo no lineal (de orden n = 4) en el espacio de estado del
MRT mostrado en las ecuaciones (1.144) and (1.145)). Esto es:
 
0 0 1 0
 0 0 0 1 
 
A= +NT 1
0 − RTR1T(J1 b11+a 
 0 1 +a2 )
0 
RT 2 b2 +NT 2
0 0 0 −R T 2 (J2 +a2 )
2.5 Procedimiento de Diseño 75

 
0 0
   
 0 0  1 0 0 0
B= 1  C=
 RT 1 (J1 +a1 +a2 ) 0  0 1 0 0
1
0 RT 2 (J2 +a2 )

Por consiguiente:
   
a A 0 a B 
A = B = Ca = C 0
C 0 0
Las matrices de sintonización se pueden elegir como: Q = 4I, R = 10I, Qa = 0,01I,
V = 0,1I, W = 0,1I. La ganancia Da del controlador y la ganancia H del observador
fueron determinadas usando los comandos de MATLAB lqr y lqe, respectivamente,
usando el hecho de que el sistema es completamente controlable y completamente
observable. El parámetro α del ı́ndice de rendimiento se fijó en 5. La simulación se
llevó a cabo ejecutando el archivo srm4opt.m (que se encuentra en el CD adjunto),
para las siguientes trayectorias deseadas: xd1 (t) = sin t + 0,1t y xd2 (t) = cos t. La
t
relación z = 0 ydτ se aproximó en el dominio discreto como z(k + 1) = z(k) + T x(k),
donde T = 0,0014 s es el tiempo de muestreo y k = t/T es el tiempo discreto. Los
resultados de la simulación se muestran en las figuras 2.5 y 2.6.
2.5

2
Base trayectory (rad)

1.5

0.5

0
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2
Time (s)

2
Control signal (volt)

−1

−2

−3

−4
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2
Time (s)

Figura 2.5: Posición angular de la base del MRE controlada.

PROBLEMAS
Problema 2.1

Con relación a las plataformas acopladas con actuadores hidráulicos descrito en el


problema 1.7 y mostrado en la figura 1.19, determine la estabilidad y controlabilidad
del modelo linealizado para un punto de operación apropiado y diseñe un sistema de
control óptimo cuya salida sea capaz de seguir a una trayectoria determinada. Asumir
valores mı́nimo y máximo de las masas de las plataformas m1 and m2 .
76 Control Óptimo

Problema 2.2

Diseñe un sistema de control óptimo cuya salida sea capaz de seguir a una trayectoria
determinada a las plataformas acopladas con actuadores neumáticos descrito en el
problema 1.8 y mostrado en la figura 1.19. Asumir valores mı́nimo y máximo de las
masas de las plataformas m1 and m2 .

Problema 2.3

Diseñe un sistema de control óptimo cuya salida sea capaz de seguir a una trayectoria
determinada, para la plataforma inercial descrita en el problema ?? e ilustrada en la
figura ??. Asumir valores mı́nimo y máximo de ... IN PROGRESS

Problema 2.4

Design a robust nonlinear optimal control system for the heavy oil fractionator de-
scribed in the problem 1.9 and depicted in figure 1.20. Assume minimum and maxi-
mum values of the ... IN PROGRESS

Problema 2.5

Design a robust nonlinear optimal control system for the chemical jacket reactor
described in the problem 1.10 and depicted in figure 1.21. Assume minimum and
maximum values of the ... IN PROGRESS

Problema 2.6

Design a robust nonlinear optimal control system for the high purity distillation
column described in the problem ?? and depicted in figure ??. Assume minimum
and maximum values of the ... IN PROGRESS

1.5
Arm trajectory (rad)

0.5

−0.5
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2
Time (s)

15
Control signal (volt)

10

−5
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2
Time (s)

Figura 2.6: Posición angular del brazo del MRE controlada.


2.5 Procedimiento de Diseño 77

Problema 2.7

Design a robust nonlinear optimal control system for the aircraft described in the
problem 1.11 and depicted in figure 1.22. Assume minimum and maximum values of
the ... IN PROGRESS

Problema 2.8

Design a robust nonlinear optimal control system for the spacecraft described in the
problem ?? and depicted in figure ??. Assume minimum and maximum values of the
... IN PROGRESS

Problema 2.9

Design a robust nonlinear optimal control system for the nonlinear DC motor de-
scribed in the problem 1.12 and depicted in figure 1.23. Assume minimum and max-
imum values of the ... IN PROGRESS
Capı́tulo 3

Control Adaptativo con Modelo


Referencial

3.1. Configuración ode un SCAMR


La figura 3.1 ilustra la configuración de un Sistema de Control Adaptativo con
Modelo Referencial (SCAMR) que puede ser empleado en una gran variedad de apli-
caciones. El SCAMR se compone básicamente de un modelo de referencia, un contro-
lador adaptativo, el sistema a controlar y un mecanismo de adaptación . El esquema
básico en consideración se denomina un SCAMR paralelo debido a la ubicación rel-
ativa del modelo referencial con respecto al sistema.

Reference
model
r -
Adaptive +
Process
controller

Adaptation
mechanism

Figura 3.1: Configuración de un Sistema de Control Adaptativo con Modelo Refer-


encial (SCAMR).

El modelo de referencia, el cual está excitado por una entrada externa r, es un


sistema dinámico auxiliar usado para especificar la respuesta deseada del sistema. Tal
respuesta debe de ser lograda por el SCAMR a pesar de las restricciones generadas
por inexactitudes en el modelado de la estructura del modelo de referencia y el modelo
del sistema.
La ley de adaptación es la relación entre el error e y el vector estimado de
 El error e es a la vez, la diferencia entre la salida del modelo y la del
parámetros θ.
sistema. el mecanismo de adaptación es un conjunto de bloques interconectados usado
80 Control Adaptativo con Modelo Referencial

para implementar la ley de adaptación. De hecho, la ley de adaptación es el algoritmo


de control empleado para modificar los parámetros del controlador adaptativo, de
modo tal que el SCAMR permanezca estable y que el error de seguimiento converja
a cero en la presencia de parámetros del sistema variantes con el tiempo y disturbios
externos.
Se asume que el sistema es no lineal. Por consiguiente, su descripción puede ser
imprecisa; esto es, el modelo dinámico del sistema puede presentar incertidumbres en
su estructura o dinámica no modelada en su representación. Ya que la descripción del
sistema permite incertidumbres, el control adaptativo (en general) se puede considerar
una aproximación particular de control robusto.
El controlador debe de ser capaz de realizar un seguimiento perfecto en la
presencia de incertidumbres en los parámetros. Esto es, en presencia de parámetros
conocidos o desconocidos, los parámetros del controlador requieren ser reajustados
por el mecanismo de adaptación con el fin de hacer cero el error de seguimiento
e. El método directo de Lyapunov será empleado para determinar que el SCAMR
diseñado garantice convergencia global de las señales controladas con respecto a sus
trayectorias deseadas. Si la ley de control (el algoritmo de control) posee estructura
lineal con parámetros ajustables, estaremos frente a una parametrización lineal.

3.2. Estabilidad vı́a el Método Directo de Lyapunov


A. M. Lyapunov trata el problema de la estabilidad de sistemas descritos median-
te ecuaciones diferenciales empleando dos métodos. El denominado primer método
analiza el comportamiento de la estabilidad de una solución explı́cita del modelo no
lineal del sistema y se aplica solamente a ciertos casos. El segundo método, o método
directo de Lyapunov, es de gran generalidad y potencia porque no requiere de la
solución de la descripción del sistema, como sı́ lo requiere el primer método.

3.2.1. Conceptos de Estabilidad


Un sistema no lineal de la forma:

ẋ = f (x, t) (3.1)

se dice que es no autónomo si f depende del tiempo, por ejemplo, si f posee parámetros
variantes con el tiempo. por consiguiente, un sistema autónomo puede ser descrito
por: ẋ = f (x). Las trayectorias de estado para procesos autónomos son independientes
del tiempo inicial, mientras que para los no autónomos generalmente no lo son.
Un estado o punto de equilibrio xe (realmente un vector constante) de un
sistema autónomo se puede determinar de:

0 = f (xe ) (3.2)

Ya que nosotros debemos de tratar la estabilidad en el origen del sistema autónomo


básico:
ẋ = f (x) x(0) = 0 (3.3)
Entonces debemos de hacer ciertas suposiciones con relación a al figura 3.2. Deno-
taremos como B(R) a la región esférica (balón) ||x|| < R y como S(R) a la esfera
3.2 Estabilidad vı́a el Método Directo de Lyapunov 81

||x|| = R en sı́. La región esf0rica anular cerrada r ≤ ||x|| ≤ R será denotada co-
mo BrR . Asumiremos que en una cierta región esférica Ω : ||x|| < B(R), todas las
derivadas parciales ∂xi /∂xj existen y son continuas en Ω. Entonces diremos que el
origen es:
estable si alguna trayectoria que empieza en B(r) en un punto arbitrario xo
nunca logra alcanzar la esfera frontera S(R) de B(R);
asintóticamente estable cuando es estable y en adición cada trayectoria de es-
tado que empieza en B(R) en un punto arbitrario xo , tiende hacia le origen
conforme el tiempo se incremente indefinidamente;
inestable cuando para algún R y r, ya sea grande o pequeño, alguna trayectoria
de estado que empieza en B(R) en un punto arbitrario x0 logra alcanzar la
esfera frontera S(R). Observar en la figura 3.2 que para la trayectoria T el
origen es inestable en el sentido de Lyapunov, a pesar de que tal trayectoria de
estado muestre convergencia.

Asymptotically
stable
Stable

B(r) S(R)
0 r
x0 R
Unstable

H(A)
B(R) T
S(A)

Figura 3.2: Estabilidad en sistemas autónomos.

3.2.2. Funciones de Lyapunov


Un tipo especial de función escalar V (x), la denominada función de Lyapunov
juega un importante rol en el análisis de la estabilidad y el diseño de sistemas de
control. Una función de Lyapunov V (x) verifica las siguientes propiedades:
(a) V (x) y sus primeras derivadas parciales
∂V (x)
= ∇ V (x)
∂x
son continuas en una cierta región abierta Ω alrededor del origen.
82 Control Adaptativo con Modelo Referencial

(b) V (0) = 0

(c) Fuera del origen, pero siempre en Ω, V (x) es positiva. Por consiguiente, el origen
es un mı́nimo aislado de V (x).

(d) V̇ (x) = ∇ V (x) ẋ = ∇ V (x) f (x) ≤ 0 in Ω.


V (x) es una función definida positiva si satisface las propiedades (a)–(c). La figura
3.3 ilustra una función de Lyapunov para un sistema de segundo orden. Notar que
V (x1 , x2 ) tiene el aspecto general de un espejo parabólico apuntando hacia arriba. Si
V fuera definida negativa, el espejo parabólico deberı́a de apuntar hacia abajo. Por
consiguiente, V (x) es definida negativa si −V (x) es definida positiva. También, V (x)
es semidefinida positiva si V (0) = 0 y V (x) ≥ 0 para x = 0; V (x) es semidefinida
negativa si −V (x) es semidefinida positiva.
Para una matriz cuadrada V de orden n × n, las expresiones V > 0, V ≥ 0,
V < 0 y V ≤ 0 denotan que V es definida positiva, semidefinida positiva, definida
negativa y semidefinida negativa respectivamente, siempre y cuando V esté asociada
a su forma cuadrática.
V es definida positiva (V > 0), es decir, xT Vx > 0, si la función cuadrática
T
x Vx es definida positiva para x = 0. También, V es definida positiva si todos sus
eigenvalores o sus menores principales son mayores que cero.
En general, los menores principales mi de V = [vij ] (de orden n × n) son:
 
  v11 v12 v13
v11 v12
m0 = 1; m1 = v11 ; m2 = det ; m3 = det  v21 v22 v23  ;
v21 v22
v31 v32 v33

y ası́ sucesivamente hasta llegar a mn = det(V).


V es semidefinida positiva (V ≥ 0), es decir, xT Vx ≥ 0, si la función cuadrática
x Vx es semidefinida positiva para x = 0. También, V ≥ 0 si V es singular de rango
T

r < n, y r eigenvalores o r menores principales de V son positivos y el resto (n − r)


son nulos.
V definida negativa (V < 0), es decir, xT Vx < 0, si la función cuadrática
xT Vx es definida negativa para x = 0. También, V < 0 si V es no singular y todos
los eigenvalores o los menores principales de V son negativos.
V semidefinida negativa (V ≤ 0), es decir, xT Vx ≤ 0, si la función cuadrática
xT Vx ≤ 0 a para x = 0. V ≤ 0 si V es singular de rango r < n, y r eigenvalores o r
menores principales de V son negativos y el resto (n − r) son nulos.
Si la matriz cuadrada V de orden n×n posee eigenvalores positivos y negativos,
entonces V es indefinida.

Ejemplo 3.1

La función V (x) = (x1 + x2 )2 con x = [x1 x2 ]T es semidefinida positiva desde


que V (0) = 0 y V (x) ≥ 0 para x = 0 (por ejemplo, para x1 = −x2 , V (x) = 0),
mientras que la función V (x) = −x21 + x22 no es definida positiva ni negativa porque
V (x) > 0 for x1 = 0 and V (x) < 0 for x2 = 0. Es fácil de demostrar que la función
V (x) = x21 + x22 es definida positiva.

Ejemplo 3.2
3.2 Estabilidad vı́a el Método Directo de Lyapunov 83

V(x1 , x 2) x2

V(x1 , x 2)

x2 x1

x1

Figura 3.3: Graphical representation of a Lyapunov function.

El circuito mostrado en la figura 3.4 contiene un resistor no lineal RN que obedece


la ley i = N e3 , N > 0. Determine si la energı́a almacenada en el capacitor C es una
función de Lyapunov.

R i
+
+
u C e RN
- -

Figura 3.4: Circuito no lineal.

Solución: Sumando las corrientes que salen del nodo superior derecho (ver la figura
3.4) produce:
e−u
C ė + + N e3 = 0
R
La energı́a almacenada en el capacitor está dada por V (e) = 12 Ce2 . Para el sistema
no actuado (u = 0) tenemos:
 
2 1 2
V̇ (e) = Ceė = −e + Ne ≤ 0
R
Por consiguiente, la función V (e) es una función de Lyapunov.

Ejemplo 3.3

La figura 3.5 muestra un sistema masa–amortiguador–resorte no lineal cuyo modelo


dinámico es:
M ẍ + Bo ẋ + B1 ẋ|ẋ| + K0 x + K1 x3 = 0
donde (B0 ẋ+B1 ẋ|ẋ|) caracteriza un amortiguador no lineal con coeficientes de amor-
tiguación B0 , B1 > 0 constantes, y donde (K0 x + K1 x3 ) representa un resorte no
lineal con coeficientes de resorte K0 , K1 > 0 constantes. Demostrar que la energı́a
total almacenada en el sistema es una función de Lyapunov.
84 Control Adaptativo con Modelo Referencial

K0 B
K1 b(t)

111111111111
000000000000
Figura 3.5: Sistema masa–amortiguador–resorte.

Solución: La energı́a del sistema es:


 x
1 1 1 1
V (x) = M ẋ2 + (K0 x + K1 x3 )dx = M ẋ2 + K0 x2 + K1 x4
2 0 2 2 4

Se puede demostrar fácilmente que:

V̇ (x) = M ẋẍ + (K0 x + K1 x3 )ẋ = [−B0 ẋ − B1 ẋ|ẋ|]ẋ = −B0 ẋ2 − B1 |ẋ|3 ≤ 0

Por consiguiente, V (x) es una función de Lyapunov.

Funciones de Lyapunov para Sistemas No Autónomos


El sistema no autónomo en consideración se describe en la región Ω: ||x|| < A
mediante:
ẋ = f (x, t) f (0, t) = 0 t≤0 (3.4)
Siempre que W (x) es una función de Lyapunov en Ω, entonces V (x, t) es una
función de Lyapunov si:

(a) V (x, t) está definida en Ω para algún t ≥ 0;

(b) V (0, t) = 0 para algún t ≥ 0;

(c) V (x, t) ≥ W (x) para algún t ≤ t0 ;

(d) V̇ (x, t) ≤ 0 para algún t ≥ 0, donde:

dV ∂V ∂V ∂V ∂V
V̇ = = + ẋ = + f (x, t)
dt ∂t ∂x ∂t ∂x

Se dice que una función V (x, t) es definida positiva si satisface las condiciones
(a)–(c). También se dice que V (x, t) es una función definida positiva si esta función
domina a otra función definida positiva W (x), por ejemplo, cuando V (x, t) ≥ W (x).
También, V (x, t) es definida negativa si −V (x, t) es definida positiva; V (x, t) es
semidefinida positiva si esta función domina a otra función semidefinida positiva
W (x); V (x, t) es semidefinida negativa si −V (x, t) es semidefinida positiva.

Ejemplo 3.4
3.2 Estabilidad vı́a el Método Directo de Lyapunov 85

Desprecie el término no lineal ẋ|ẋ| del amortiguador descrito en el ejemplo 3.3 y


considere un coeficiente de amortiguación b(t) variante con el tiempo en lugar de
B0 , de modo tal que el sistema se convierta en uno no autónomo. Demostrar que la
siguiente función V (x, t) es una función de Lyapunov.
 
M 2 1 1 2
V (x, t) = (ẋ + αx) + K0 + K1 − M α + α b(t) x2
2
2 2 2

Solución: El cómputo de V̇ (x, t) produce:


1
V̇ (x, t) = (M α − b(t))ẋ2 + α(ḃ(t) − 2k0 ) − αK1 x4 < 0
2
siempre que α > 0, b(t) > M α y ḃ(t) < 2K0 . De acuerdo al ejemplo 3.3, la energı́a
del sistema es una función de Lyapunov, a saber:
1 1 1
W (x) = M ẋ2 + K0 x2 + K1 x4
2 2 4
Podemos observar que V (x, t) > W (x). Por consiguiente, V (x, t) es una función de
Lyapunov.

3.2.3. Teoremas de Estabilidad de Lyapunov


Los teoremas de estabilidad de Lyapunov generalizan la idea de que cerca al estado
de equilibrio de un sistema f1sico, la energı́a del sistema es siempre decreciente.

Teoremas de Estabilidad para Sistemas Autónomos


I. Teorema de Estabilidad. El equilibrio en el origen es estable si allı́ existe
en alguna vecindad Ω del origen, una función de Lyapunov V (x).

II. Teorema de Estabilidad Asintótica. El equilibrio en el origen es asintótica-


mente estable si −V̇ es definida positiva (esto es: −V̇ > 0) en Ω.

III. Teorema de Estabilidad Completa (Global). Considere una función


escalar V (x) con primeras derivadas parciales continuas para todo x = 0 tal que
V (x) > 0, V̇ (x) < 0, y V (x) → ∞ cuando ||x|| → ∞. entonces el sistema autónomo
(3.4) es completamente (globalmente) asintóticamente estable.

IV. teorema de Inestabilidad of Cĕteav. Sea Ω una vecindad en el origen.


Sea Ω una región en Ω. Dada una función V (x) en Ω, entonces el equilibrio en el
origen es inestable si:
(a) V (x) posee derivadas parciales continuas en Ω .

(b) V (x) y V̇ (x) son definidas positivas en Ω .

(c) V (x) = 0 en los puntos de frontera de Ω dentro de Ω.

(d) El origen es un punto de frontera de Ω . La figura 3.6 ilustra el teorema de


inestabilidad de Cĕteav.
86 Control Adaptativo con Modelo Referencial

El teorema de inestabilidad de Cĕteav se convierte en el denominado primer teorema


de inestabilidad si Ω = Ω1 , cuando Ω es una cierta vecindad del origen. Si, en adición
a la condición Ω = Ω , la condición V̇ > 0 es reemplazada por:

V̇ (x) − λV (x) ≥ 0 ∀t≥0 ∀x Ω

donde λ es una constante positiva, de este modo el teorema de inestabilidad de Cĕteav


se convierta en el denominado segundo teorema de inestabilidad. Las demostraciones
de los teoremas descritos anteriormente se realizan básicamente en forma geométrica
en [16], [3].

V=0
. . 0

x0
V = constant
Ω1

Figura 3.6: Representación gráfica del teorema de estabilidad de Cĕteav.

Teoremas de Estabilidad de Lyapunov para Sistemas no Autónomos


V. teorema de Estabilidad. El equilibrio en el origen es estable, si allı́ existe
en alguna vecindad Ω del origen, una función de Lyapunov V (x, t).

VI. Teorema de Estabilidad Asintótica Uniforme. El equilibrio en el origen


es uniformemente asintóticamente estable si la función definida positiva V (x, t) ies
decreciente (lo que significa que V está dominado por una función definida positiva
W (x) para algún t ≥ 0) y −V̇ (x, t) es definida positiva(es decir, −V̇ > 0) en Ω.

VII. Teorema de Inestabilidad. Sea Ω una vecindad del origen. Sea Ω una
región en Ω. Dada una funci2n V (x, t) en Ω, entonces el equilibrio del origen en el
tiempo t0 es inestable si:

(a) V (x, t) posee derivadas parciales continuas en Ω .

(b) V (x, t) y V̇ (x, t) son definidas positivas en Ω1 .

(c) V (x, t) = 0 para algún t ≥ t0 en los puntos de frontera de Ω dentro de Ω.

(d) El origen es un punto de frontera de Ω dentro de Ω.

En forma similar, el teorema de inestabilidad anterior se convierte en el deno-


minado primer teorema de inestabilidad si Ω = Ω , donde Ω es una cierta vecindad
3.2 Estabilidad vı́a el Método Directo de Lyapunov 87

del origen. Si en adición a la condición Ω = Ω , la condición V̇ > 0 es reemplazada


por
V̇ (x, t) − λV (x, t) ≥ 0 ∀ t ≥ t0 ∀x Ω
donde λ es una constante positiva, entonces el teorema de inestabilidad se convierte
en el denominado segundo teorema de inestabilidad. Las demostraciones de estos
teoremas se pueden encontrar en [3].

Ejemplo 3.5

Determine la estabilidad del sistema autónomo descrito en los ejemplos 3.2 y 3.3
aplicando el método directo de Lyapunov.

Solución: Del ejemplo 3.2 podemos establecer que la función de Lyapunov V (e) =
1 2
2 Ce → ∞ cuando ||e|| → ∞. Por consiguiente, el sistema autónomo no lineal
descrito en dicho ejemplo es completamente (globalmente) asintóticamente estable.
Del ejemplo 3.3 podemos establecer que la función de Lyapunov:
1 1 1
V (x) = M ẋ2 + K0 x2 + K1 x4 → ∞
2 2 4
cuando ||x|| → ∞. Por consiguiente, el sistema autónomo no lineal descrito en dicho
ejemplo es completamente (globalmente) asintóticamente estable.

Ejemplo 3.6

Determine la estabilidad el sistema no autónomo descrito en el ejemplo 3.4 aplicando


el método directo de Lyapunov.

Solución: Del ejemplo 3.4 se puede establecer que la función de Lyapunov:


 
M 1 1
V (x, t) = (ẋ + αx)2 + K0 + K12 − M α2 + α b(t) x2 → ∞
2 2 2

conforme ||x|| → ∞, siempre que α > 0, b(t) > M α, y ḃ(t) < 2K0 . Por consigu-
iente, el sistema no autónomo descrito en tal ejemplo es completamente (globalmente)
asintóticamente estable.

3.2.4. Teoremas del Conjunto Invariante


En aplicaciones relacionadas con sistemas de control, estabilidad asintótica es más
importante que estabilidad. Claramente, pequeñas desviaciones de las salidas contro-
ladas con respecto a señales de referencia deseadas se pueden cancelar como resultado
de la operación de un sistema asintóticamente estable. Sin embargo, la aplicación del
segundo teorema de estabilidad nos conduce a menudo a la relación −V̇ ≥ 0 en lugar
de la requerida condición −V̇ > 0 para estabilidad asintótica. Para tales casos, puede
ser de gran utilidad emplear el denominado teorema del conjunto invariante atribuido
a La Salle [16] con la finalidad de obtener más conclusiones acerca de la estabilidad
asintótica.
88 Control Adaptativo con Modelo Referencial

Conjunto Invariante. Se dice que un conjunto G es el conjunto invariante de un


sistema dinámico ẋ = f (x) si cada trayectoria de estado x(t) que comienza desde un
punto x0 en G permanece en G para todo tiempo. por consiguiente, una trayectoria
de estado cerrada en G es un conjunto invariante. De acuerdo a tal definición, algún
punto de equilibrio es un conjunto invariante. El dominio de atracción del punto de
equilibrio es también un conjunto invariante.

VIII. Teorema del Conjunto Invariante Local. Considere el sistema dado en


(3.3). Sea V (x) una función escalar con primeras derivadas parciales continuas. Sea
Ω una región acotada definida por V (x) < , con > 0. Asumamos que:

V̇ (x) ≤ 0 (3.5)

para todo x en Ω . Sea R el conjunto de todos los puntos dentro de Ω donde V̇ (x) = 0,
y sea M el más grande conjunto invariante en R. Entonces, cada solución x(t) en Ω
tiende a M conforme t → ∞.

Que M sea el conjunto invariante más grande en R significa que M es la unión


de todos conjuntos invariantes dentro de R. La interpretación geométrica de este
teorema se ilustra en la figura 3.7.

V
V=l

Ωl

x2

x0
x1

Figura 3.7: Interpretación geométrica del teorema del conjunto invariante.

Si la condición (3.5) se sustituye por

V̇ (x) < 0 for all x = 0 in Ω (3.6)

y el origen está en Ω , entonces tal origen es asintóticamente estable, y cada solución


en Ω tiende hacia el origen conforme t → ∞.
3.3 SCAMR para Sistemas No Lineales de una Entrada 89

IX. Teorema del Conjunto Invariante Global. Considere el sistema dado


en (3.3). Sea V (x) una función escalar con primeras derivadas parciales continuas.
Suponga que V (x) > 0 para todo x = 0 y V̇ (x) ≤ 0. Sea R el conjunto de todos
los puntos donde V̇ (x) = 0, y M el conjunto invariante más grande en R. Entonces
todas las soluciones convergen completamente (globalmente) asintóticamente en M
conforme t → ∞.
En vista de los teoremas del conjunto invariante, una función de Lyapunov V
tiene que desaparecer gradualmente. Esto es, V̇ tiene que converger a cero debido a
que V es acotado inferiormente. Demostración de los teoremas del conjunto invariante
se pueden encontrar en [16], [3].

Ejemplo 3.7

Considere el sistema dinámico:

ẋ1 = x1 (x21 + x22 − 4) − 4x1 x22


ẋ2 = 4x21 x2 + x2 (x21 + x22 − 4)

para el punto de equilibrio x = 0 considere la función:

V (x) = x21 + x22

A lo largo de una trayectoria de estado, su derivada V̇ es:

V̇ (x) = 2(x21 + x22 )(x21 + x22 − 4)

Observe que V̇ (x) < 0 dentro de un cı́rculo de radio 2. Por consiguiente, usando el
teorema de estabilidad II de Lyapunov, podemos inferir que el origen es asintótica-
mente estable. Para = 4, la región Ω definida por V (x) = x21 +x22 < 4 es acotada y el
conjunto R es el origen, el cual es un conjunto invariante. Por consiguiente, cualquier
trayectoria que se inicia dentro del cı́rculo de radio 2 converge hacia el origen y esta
región constituye el dominio de atracción.

3.3. SCAMR para Sistemas No Lineales de una Entrada


3.3.1. Formulación del Problema y de la Ley de Control
Consideremos el siguiente sistema no lineal en su forma asociada:


m
dn y
(n)
y + αi∗ fi (x, t) = bu  y (n) (3.7)
dtn
i=1

donde x = [y ẏ . . . y (n) ]T es el vector de estado de orden n, αi∗ y b son constantes


desconocidas, y fi son funciones no lineales conocidas. Dividiendo ambos miembros
de (3.7) por b, se obtiene:


m
1 αi∗
h y (n) + αi fi (x, t) = u h= αi = (3.8)
b b
i=1
90 Control Adaptativo con Modelo Referencial

Definamos el error de seguimiento a la salida:

e = y − yd

donde yd es la trayectoria deseada, de modo tal que el error combinado s se pueda


expresar como:

s = e(n−1) + λn−2 e(n−2) + · · · + λ0 e = ∆(p)e = y (n−1) − yr(n−1) (3.9)

donde:
∆(p) = pn−1 + λn−2 pn−2 + · · · + λ0 = (p − p1 ) . . . (p − pn )
(n−1)
yr(n−1) = yd − λn−2 e(n−2) − · · · − λ0 e
en el cual p es el operador de Laplace y ∆(p) es un polinomio estable Hurwitz, lo
cual significa que todas las raı́ces complejas pi = σi + jωi , i = 1, . . . , n de ∆(p) = 0
verifican la condición σi < 0. Asumamos la siguiente ley de control:

m
u = h yr(n) − k s + αi fi (x, t) (3.10)
i=1

(n)
donde las constantes k y h poseen el mismo signo. La variable yr , denotada como
la variable de referencia de y (n) , se determina de:
(n−1)
(n) dyr
yr(n) = yd − λn−2 e(n−1)
− ··· − λ0 ė yr(n) =
dt
Sustituyendo (3.10) en (3.8) nos conduce al error de seguimiento dinámico:

h ṡ + k s = 0 (3.11)

Observar que (3.11) es exponencialmente convergente en s, lo cual a la vez garantiza


la convergencia del error de seguimiento e.

3.3.2. La Ley de Adaptación


Reemplazando los parámetros h y αi de (3.10) por sus valores estimados 
hy
i respectivamente, entonces la ley de control del SCAMR toma la forma:
α

m
u=
h yr(n) − k s + i fi (x, t)
α (3.12)
i=1

Ahora definamos % h= h − h and α %i = α


i − αi . Sustituyendo (3.12) en (3.8) produce
el error de seguimiento dinámico:

m
hṡ + k s = %
h yr(n) + %i fi (x, t)
α (3.13)
i=1

el cual se puede reescribir como:


 
1/h 
m
s= %h yr(n) + %fi (x, t)
α (3.14)
p + (k/h)
i=1
3.3 SCAMR para Sistemas No Lineales de una Entrada 91

donde p es el operador de Laplace. Considere la siguiente ley de adaptación:


h = −γ sgn(h)s yr(n)
α̂˙ = −γ sgn(h)s fi (3.15)

donde γ es la ganancia de adaptación. Para determinar si el SCAMR garantiza con-


vergencia de seguimiento global, consideremos la siguiente función de Lyapunov:
 

m
V = |h|s2 + γ −1 % h2 + %i2
α (3.16)
i=1

Usando el hecho de que h sign(h) = |h| y k sign(k) = |k| y dado que k y h poseen el
mismo signo, se puede demostrar fácilmente que:

V̇ = −2|k|s2 < 0 (3.17)

lo cual garantiza convergencia de seguimiento global del SCAMR en el sentido del


método directo de Liapunov (subsección 3.2.3). Ahora, considere la ley de adaptación:
˙

h = −γh sgn(h)s yrn
˙ i = −γα sgn(h)s fi
α (3.18)

donde las ganancias de adaptación γh y γk son diferentes para cada parámetro des-
conocido. Seleccionando la siguiente candidata para función de Lyapunov:

m
V = |h|s2 + γh−1%
h2 + γk−1 %i2
α (3.19)
i=1

se puede demostrar fácilmente que V̇ nos conduce a (3.17), lo cual garantiza conver-
gencia de seguimiento global del SCAMR.

3.3.3. Zona–Muerta para Evitar Corrimiento de Parámetros


El análisis de los SCAMR hasta ahora realizado sólo ha tomado en cuenta in-
certidumbre en los parámetros. Sin embargo, en el mundo real, sistemas controlados
tienen que trabajar en la presencia de incertidumbres no paramétricas tales como:
dinámica de alta frecuencia no modelada en actuadores o estructuras sujetas a vi-
bración, dinámica de baja frecuencia no modelada tales como las fricciones estática y
de Coulomb, ruido de medición, retardos en el dominio discreto, error computacional
de redondeo, etc.
En sistemas de control es intuitivamente comprensible que mientras más grande
sean las incertidumbres paramétricas, más grande será el error de seguimiento. Con-
secuentemente, los SCAMR se pueden volver inestables en presencia de grandes in-
certidumbres paramétricas. Por otro lado, estudios de simulación han demostrado
que cuando un SCAMR es persistentemente excitado, entonces el sistema muestra
cierta robustez con respecto a las incertidumbres no paramétricas. Por el contrario,
aún pequeñas incertidumbres paramétricas pueden causar problemas de estabilidad
si el SCAMR no está excitado permanentemente.
92 Control Adaptativo con Modelo Referencial

El problema del corrimiento de parámetros hacia valores peligrosos está asoci-


ado con las incertidumbres no paramétricas. Tal problema se origina principalmente
cuando el SCAMR no está excitado permanentemente o debido a la presencia del
ruido de medición. El corrimiento de los valores de los parámetros puede causar que
el SCAMR se torne inestable si se permite que los parámetros estimados desplacen
sus valores hacia valores que puedan provocar que los polos del SCAMR realimentado
se vuelvan inestables.
La experiencia dicta que la presencia de pequeños errores de seguimiento pueden
originar el corrimiento de los parámetros a valores peligrosos. La técnica más simple
de modificación de la ley de control para evitar este problema es detener el mecanismo
de adaptación en presencia de pequeño errores de seguimiento. Esta técnica conocida
como “zona–muerta”, sustituye los términos de (3.18):
˙

h = −γh sgn(h)s yr(n) ˙ i = −γk sgn(h)s fi
α

por:
&
(n)
˙
 −γh sgn(h)s yr |s| > ∆y
h =
0 |s| < ∆y

−γα sgn(h)s fi |s| > ∆f
˙ i =
α (3.20)
0 |s| < ∆f

donde ∆h y ∆f representan el tamaño de la zona–muerta. Las expresiones dadas en


˙ (n)
3.20 nos indican que cuando |s| < ∆y , entonces 
h debe de tomar el valor −γh sgn(h)s yr
previamente computado. Del mismo modo, cuando |s| < ∆f , entonces α ˙ i debe de
tomar el valor −γk sgn(h)s fi computado en el tiempo de muestreo anterior.

Ejemplo 3.8

El modelo dinámico del MRAF (manipulador robótico con articulación elástica)


mostrado en la figura 1.4 se muestra en (1.30). Determinar su forma asociada (ecuación
(3.7)).

Solución: Definamos y = θ y x = [ y ẏ ÿ y (3) ], entonces (1.30) se puede expresar


en su forma asociada como:
4

(3)
hy + αi fi (x) = u
i=1

donde:  
Jeq La Beq La Ra Jeq
h= α1 = +
KA KA nKA Km
 
nKb Ra Beq meq gLLa meq gLRa
α2 = + α3 = α4 =
KA nKA Km KA nKA Km
1
meq = m + mH f1 = ÿ f2 = ẏ f3 = ẏ cos y f4 = sen y
2
3.4 SCAMR para Sistemas No Lineales Multivariables 93

Aplicación 3.1 Implementar un SCAMR para el Manipulador de 1GDL

En esta aplicación se diseña e implementa en tiempo real un SCAMR para el


manipulador robótico de 1GDL mostrado en la figura 1.1 y descrito en la subsección
1.1.1. Definamos y = θ y x = [ y ẏ ÿ y (3) ], entonces (1.30) se puede expresar en su
forma asociada como:
4

(3)
hy + αi fi (x) = u
i=1

donde:  
Jeq La Beq La Ra Jeq
h= α1 = +
KA KA nKA Km
 
nKb Ra Beq meq gLLa meq gLRa
α2 = + α3 = α4 =
KA nKA Km KA nKA Km
1
meq = m + mH f1 = ÿ f2 = ẏ f3 = ẏ cos y f4 = sen y
2

3.4. SCAMR para Sistemas No Lineales Multivariables


Del capı́tulo 1 sabemos que una gran clase de sistemas no lineales electro–
mecánicos, tales como manipuladores robóticos, se pueden describir mediante su
modelo L–E (por ejemplo ver (1.113) and (1.143)), a saber:
   
q1 u1
   
M(q)q̈ + P(q, q̇)q̇ + d(q) = u q =  ...  u =  ...  (3.21)
qm um

donde las matrices M, P y d representan la inercia del sistema a controlar, los torques
centrı́petos y de Coriolis, y los torques gravitacionales respectivamente. También, q
es el vector de coordenadas generalizadas y u es el vector de control.
El objetivo de control del SCAMR es diseñar una ley de control u capaz de
hacer que la salida del sistema q(t) siga a la taryectoria deseada qd (t) con velocidad
suficiente a pesar de la presencia de incertidumbres en los parámetros. Asumamos
que todos los términos en (3.21) dependen linealmente de un vector de parámetros a
con elementos conocidos, a saber:
Ya = u (3.22)
donde Y es una matriz conocida. Considere la siguiente ley de control:

a − KD s
u = Y (3.23)

donde KD s es el término derivativo y Y a es el término anticipativo. En los términos


 es el vector estimado de parámetros, KD (la ganancia derivativa) es una
descritos, a
matriz simétrica constante definida positiva y s es un vector de superficies deslizantes
94 Control Adaptativo con Modelo Referencial

cuyos elementos si , i = 1, . . . , m se definen mediante la ecuación escalar si (q, t) = 0,


de modo tal que:

d
si = ( + λi )n−1 q%i = (p + λi )n−1 q%i (3.24)
dt
donde λi > 0 es una constante (el ancho de banda), p es el operador de Laplace y:

q%i = qi − qdi

es el error de seguimiento. Por ejemplo, para n = 2, (3.24) se convierte en un error


de seguimiento compuesto de velocidad y posición:

%̇ + Λ%
s=q q = q̇ − q̇r q̃ = q − qd q̇r = q̇d − Λ%
q (3.25)

donde:

s = [s1 ... sm ]T %̇ = [q%̇1


q ... q%̇m ]T %̇r = [q%̇r1
q ... q%̇rm ]T
 
λ1 0 ... 0
 0 λ2 ... 0 
 
qd = [qd1 ... qdm ]T Λ= .. .. ..  (3.26)
 . . ... . 
0 0 . . . λm
La conservación de la energı́a requiere que:

1 d T
[q̇ Mq̇] = q̇T (u − d) (3.27)
2 dt
donde q̇T Mq̇ es la energı́a cinética del sistema y q̇T (u − d) es la potencia de entrada
generada por el actuador. Diferenciando el miembro izquierdo de (3.27):

1
q̇T Mq̈ + q̇T Ṁq̇ = q̇T (u − d) (3.28)
2
De (3.21) obtenemos: Mq̈ = u − d − Pq̇. Sustituyendo este término en (3.28):

q̇T (Ṁ − 2P)q̇ = 0 (3.29)

Ha sido establecido en [24], [3] que (Ṁ − 2P) = J es antisimétrica. Por consiguiente:

Ṁ = 2P + J (3.30)

Considere la siguiente candidata para función de Lyapunov:


1 T
V (t) = T Γ−1 a
s Ms + a % (3.31)
2
%=a
donde Γ es una matriz simétrica definida positiva y a  −a es el error de estimación
de parámetros. Diferenciando (3.31) se obtiene:

1 T
˙ Γ−1 a
V̇ (t) = sT Mṡ + sT Ṁ + a %
2
3.4 SCAMR para Sistemas No Lineales Multivariables 95

y empleando la relación s = q̇ − q̇r (ecuación (3.25)) en la expresión anterior se


obtiene:
1 T
V̇ (t) = sT (Mq̈ + Mq̈r ) + sT Ṁs + a˙ Γ−1 a
%
2
Sustituyendo (3.30), (3.23) y Mq̈ de (3.21) en V̇ produce:

T
˙ Γ−1 a
a − KD s − Mq̈r − Pq̇r − d) + a
V̇ (t) = sT (Y % (3.32)

en donde hemos usado el hecho de que sT Js = 0, dado que J es antisimétrica1 . La


 se puede formular como:
actualización de los parámetros estimados a

˙ = −ΓYT s
a (3.33)

mientras que la propiedad de parametrización lineal en (3.32) establece que:

Y(q, q̇, q̇r , q̈r )a = M(q)q̈r + P(q, q̇)q̇r + d(q) (3.34)

Reemplazando (3.34)y (3.33) en (3.32) produce:

V̇ (t) = −sT KD s ≤ 0 (3.35)

Dado que s = q %̇ + Λ%q (ver (3.25)), entonces (3.35) garantiza que los errores de
seguimiento de posición q% y de velocidad q%̇ tiendan a 0 conforme t → ∞. En otras
palabras, los errores de seguimiento convergen en la superficie s = 0.
El resultado establecido en (3.35) es también válido para el modelo L–E dado
en (1.130). Para este caso, las relaciones (3.22), (3.23) y (3.34) toman las formas
siguientes:
Ya = T (3.36)

a − KD s
u = Y (3.37)

T = Y(q, q̇, q̇r , q̈r )a = H(q)q̈r + C(q, q̇)q̇r + d(q) (3.38)

 dado en (3.33) se pueden emplear


La actualización de los parámetros estimados a
también para este caso.

Aplicación 3.2 Diseño e Implementación de un SCAMR para el MRT

En esta aplicación el objetivo es diseñar e implementar en tiempo real un


SCAMR para el MRT (manipulador robótico traslacional), cuyo modelo L–E se da
en (1.113), donde m12 = −p12 y d2 = g m21 . Empleando la definición dada en (3.34),
el modelo L–E tome la forma:
   
rr u1
M(q)q̈r + P(q, q̇)q̇r + d(q) = u qr = u= = Ya
θr1 u2
1
Suponga que sT Js = c = 0, donde c es una constante. Como J es antisimétrica: J = −JT ; luego
sT Js = ±c. Entonces, la única solución posible para la constante es: c = 0
96 Control Adaptativo con Modelo Referencial

Definiendo a1 = m11 , a2 = p12 , a5 = p11 , a3 = m21 , a4 = m22 y a6 = p22 , el modelo


paramétrico lineal correspondiente u = Ya se formula como:
 
a1
 
   a2 
r̈ θ̈1 cos θ1 − θ̇12 sin θ1 0 0 ṙ 0  a
 3 

u=
0 0 cos θ1 − g sin θ1 θ̈1 0 θ̇1  a4 


 a5 
a6
La ley de control (3.23) se puede escribir como:
a − KD s = Y
u = Y a − KD q %
%̇ − Ks q
donde, por simplicidad, KD = diag[KD ] y KP = KD Λ = diag[KP ]. La simulación
del SCAMR diseñado ( archivo trmmrac.m) asume las siguientes condiciones iniciales:
r(0) = 0 m (posición del carro) y θ1 = 0 rad (posición del brazo). Para un tiempo
de muestreo de T = 0,01 s, los parámetros de la ley de control se fijan en KD = 1,5
y KP = 2, mientras que la matriz Γ de la ley de adaptación (3.33) se fija en Γ =
diag 0,09 0,16 0,3 0,01 4,1 0,05 . Las trayectorias deseadas son:
π π
cos(0,2π kT )
rd (t) = θ1d (t) = cos(0,2π kT )
4 4
donde k es el tiempo discreto. Los resultados de la simulación se muestran en las
figuras 3.8, 3.9 y 3.10.
1

0.5
Cart position (m)

−0.5

−1
0 1 2 3 4 5 6 7 8 9 10
Time (s)

3
Control voltage u1

−1

−2
0 1 2 3 4 5 6 7 8 9 10
Time (s)

Figura 3.8: Posición controlada del carro del MRT.

Aplicación 3.3 Implementar un SCAMR para el MRS

De acuerdo con la ecuación (3.38), el modelo de Lagrange–Euler del manipu-


lador robótico esférico dado en (1.130) se puede redefinir como:
T = Y(q, q̇, q̇r , q̈r )a = H(q)q̈r + C(q, q̇)q̇r + d(q) (3.39)
3.4 SCAMR para Sistemas No Lineales Multivariables 97

0.5

Link position (rad)


0

−0.5

−1

−1.5
0 1 2 3 4 5 6 7 8 9 10
Time (s)

6
Control voltage u2

−2

−4

−6
0 1 2 3 4 5 6 7 8 9 10
Time (s)

Figura 3.9: Posición controlada del brazo del MRT.

0.04 0.05

0
0.02
ae1

ae2

−0.05
0
−0.1

−0.02 −0.15
0 2 4 6 8 10 0 2 4 6 8 10

0.2 0.05

0.1
ae3

ae4

0 0

−0.1

−0.2 −0.05
0 2 4 6 8 10 0 2 4 6 8 10

0.6 0.02

0.4
0.01
ae5

ae6

0.2
0
0

−0.2 −0.01
0 2 4 6 8 10 0 2 4 6 8 10
Time (s) Time (s)

Figura 3.10: Parámetros estimados del MRT.

Definiendo:

a1 = 2T1 a2 = H22 a3 = m2 gLx2


98 Control Adaptativo con Modelo Referencial

entonces (3.39) se determina como:


 
   
a1   
T1 Y11 Y12 Y13   a1 + a2 cos2 q2 0 q̈r1
= a2 +
T2 Y21 Y22 Y23 0 a2 q̈r2
a3
    
a2 q̇2 sin q2 cos q2 a2 q̇1 sin q2 cos q2 q̇r1 0
+
a2 q̇1 sin q2 cos q2 0 q̇r2 a3 cos q2

donde:

Y11 = q̈r1 Y12 = q̈r1 cos2 q2 − q̇r1 q̇2 sin q2 cos q2 − q̇r2 q̇1 sin q2 cos q2

Y13 = 0 Y21 = 0 Y22 = q̈r2 + q̇r1 q̇1 sin q2 cos q2 Y23 = cos q2
La ley de control está dada por (3.36):

a − KD s
T = Y

Sin embargo, los voltajes de control se computan de (1.141) y (1.141):

u1 = RT 1 (Jeq1 q̈1 + Beq1 q̇1 + T1 ) + NT 1 q̇1


u2 = RT 2 (Jeq2 q̈2 + Beq2 q̇2 + T2 ) + NT 2 q̇2

La simulación del SCAMR diseñado (archivo srmmrac.m) asume las siguientes condi-
ciones iniciales: q1 (0) = 0 rad (posición de la base) y q2 (0) = −π/2 rad (posición del
brazo). Para un tiempo de muestreo de T = 0,01 s, los parámetros de la ley de control
se fijaron en KD = diag[1,5]. Las trayectorias deseadas están dadas por:

qd1 (k) = sin 2kT qd2 (k) = cos 2kT

donde k = t/T es  el tiempo discreto. La matriz Γ de la ley de adaptación (3.33) se


fijó en Γ = diag 0,05 0,075 0,1 . Los resultados de la simulación se muestran en
las figuras 3.11, 3.12 y 3.13.

PROBLEMAS
IN PROGRESS
3.4 SCAMR para Sistemas No Lineales Multivariables 99

1.5

Base position (rad)


0.5

−0.5

−1

−1.5
0 1 2 3 4 5 6 7 8 9 10

6
Voltage control u1

−2

−4
0 1 2 3 4 5 6 7 8 9 10
Time (s)

Figura 3.11: Trayectoria θ1 (t) controlada y su señal de control.

1.5

1
Link position (rad)

0.5

−0.5

−1

−1.5

−2
0 1 2 3 4 5 6 7 8 9 10

10

8
Voltagr control u2

−2

−4
0 1 2 3 4 5 6 7 8 9 10
Time (s)

Figura 3.12: Trayectoria θ2 (t) controlada y su señal de control.


100 Control Adaptativo con Modelo Referencial

0.15

0.1
ae1

0.05

−0.05
0 1 2 3 4 5 6 7 8 9 10

0.6

0.4
ae2

0.2

−0.2
0 1 2 3 4 5 6 7 8 9 10

1.3
ae3

1.25

0 1 2 3 4 5 6 7 8 9 10
Time (s)

Figura 3.13: Parámetros estimados.


Capı́tulo 4

Linealización por
Realimentación de Estados

4.1. Herramientas de la Geometrı́a Diferencial


Los métodos de la geometrı́a diferencial se aplican principalmente a sistemas no
lineales para determinar si tales sistemas son linealizables mediante realimentación de
estados; esto es, si la descripción dinámica de un sistema en particular se puede hacer
que parezca lineal, luego de efectuar una apropiada transformación de coordenadas
y aplicar la correspondiente linealización de estados no lineal. En concordancia con
la terminologı́a empleada en geometrı́a diferencial [10], [3], [11], la siguiente función
vectorial n-dimensional:
   
f1 (x) f1 (x1 , . . . , xn )
 ..   .. 
f (x) =  . = .  (4.1)
fn (x) fn (x1 , . . . , xn )

se denomina un campo vectorial, si a cada función vectorial f le corresponde un


campo de vectores en un espacio n-dimensional Rn . En lo que sigue, nosotros nos
ocuparemos sólo de campos vectoriales suaves de la forma f (x), significando que
tales funciones vectoriales poseen derivadas parciales continuas de cualquier orden.
El concepto de suavidad se aplica también a funciones.
El gradiente de una función escalar suave h(x) se define como:

∂h ' (
∇h(x) = = ∂h
∂x1 ··· ∂h
∂xn (4.2)
∂x

Los elementos de ∇h son (∇h)i = ∂h/∂xi . De la misma manera, el jacobiano de f (x),


de elementos (∇f )ij = ∂fi /∂xj , se define como:
 ∂f1 ∂f1 
∂x1 ··· ∂xn
∂f (x)  .. .. .. 
∇f (x) = = . . .  (4.3)
∂x ∂fn ∂fn
∂x1 ··· ∂xn
102 Linealización por Realimentación de Estados

4.1.1. Derivadas y Corchetes de Lie


Derivadas de Lie

La derivada de Lie de una función escalar h(x) con respecto al campo vectorial
f (x) es una nueva función escalar Lf h definida como:

∂h ∂h
Lf h = ∇h f = f1 + · · · + fn (4.4)
∂x1 ∂xn

Observar que la derivada de Lie es el producto interno entre ∇h(x) y f (x). Derivadas
de Lie repetidas se pueden formular en forma recursiva como:

L0f h = h
f h) = ∇(Lf h) f
Lif h = Lf (Li−1 i−1
for i = 1, 2, . . . (4.5)

Si f y g son campos vectoriales, entonces:

Lg Lf = ∇(Lf ) g (4.6)

Corchetes de Lie

El corchete de Lie de dos campos vectoriales f y g es otro campo vectorial [f , g]


definido como:
[f , g] = ∇g f − ∇f g (4.7)

La notación adf g (donde ad significa adjunta) se emplea frecuentemente en lugar de


[f , g]. Corchetes de Lie repetidos se pueden formular en forma recursiva:

adf0 g = g
adfi g = [f , adfi−1 g] para i = 1, 2, . . . (4.8)

Siempre que f , f1 , f2 , g, g1 y g2 sean campos vectoriales suaves, α1 and α2 sean


constantes escalares, y h(x) sea una función escalar suave de x, se puede formular la
siguiente propiedad del corchete de Lie:

1) Bilinealidad:

[α1 f1 + α2 f2 , g] = α1 [f1 , g] + α2 [f2 , g]


[f , α1 g1 + α2 g2 ] = α1 [f , g1 ] + α2 [f , g2 ] (4.9)

2) Anti-conmutatividad:

[f , g] = −[g, f ] (4.10)

3) Identidad de Jacoby:
Ladf g h = Lf Lg h − Lg Lf h (4.11)
4.1 Herramientas de la Geometrı́a Diferencial 103

4.1.2. Difeomorfismos y Transformación de Coordenadas


Una función Φ definida en una región Ω se conoce como un difeomorfismo si
ambos, Φ y su inversa Φ−1 son funciones suaves. Si la región Ω es Rn (el espa-
cio total), entonces, Φ(x) se denomina un difeomorfismo global. Por otra parte, un
difeomorfismo local se defined sólo en una vecindad finita de un punto dado x0 .
Una función suave Φ(x) definida en una región Ω en Rn es un difeomorfismo
local, siempre que la matriz jacobiana ∇x sea no singular en un punto x = x0 de la
región Ω.
Empleando difeomorfismo, nosotros podemos transformar los estados de un
sistema no lineal en un nuevo conjunto de estados correspondiente al sistema no lineal
transformado. La metodologı́a es bien conocida. Consideremos un sistema SISO (de
una entrada y una salida) no lineal descrito por:
ẋ = f (x) + g(x)u y = h(x) (4.12)
donde u es la única entrada e y es la única salida. Definamos un nuevo conjunto de
estados z = Φ(x). Efectuando diferenciación en z:
∂Φ ∂Φ
ż = ẋ = (f (x) + g(x)u) = f ∗ (z) + g∗ (z)u y = h∗ (z) (4.13)
∂x ∂x
donde
∂Φ ∂Φ
f∗ = f g∗ = g x = Φ−1 (z) h∗ = h
∂x ∂x

4.1.3. El Teorema de Frobenius


Suponga que f1 , f2 , . . ., fm es un conjunto de campos vectoriales linealmente
independientes en Rn . El teorema de Frobenius establece que tal conjunto es com-
pletamente integrable sı́ y sólo si dicho conjunto es involutivo.
Se dice que el conjunto de campos vectoriales arriba definido es completamente
integrable sı́ y sólo si existen n − m funciones escalares h1 (x), h2 (x), . . ., hn−m (x)
que satisfacen el siguiente sistema de ecuaciones diferenciales parciales.
∇hi fj = 0 1 ≤ i ≤ n − m, 1≤j≤m (4.14)
donde los gradientes ∇h1 , ∇h2 , . . ., ∇hn−m son también linealmente independientes.
El conjunto de campos vectoriales en consideración se dice que es involutivo,
sı́ y sólo si existen funciones escalares αijk en R (el espacio unidimensional) que
satisfacen:

m
[fi , fj ](x) = αijk (x) fk (x) ∀ i, j (4.15)
k=1
La última ecuación indica que el campo vectorial resultante [fi , fj ](x) es una com-
binación lineal del conjunto original de campos vectoriales f1 , f2 , . . ., fm . De (4.15),
podemos postular:
1) El conjunto de campos vectoriales constantes f1 , f2 , . . ., fm es siempre involutivo
porque el corchete de Lie de cualquier par de de tales campos siempre es nulo,
esto es:
[fi , gj ] = 0
104 Linealización por Realimentación de Estados

lo cual significa que estos campos se pueden representar como una combinación
lineal.
2) Un conjunto que contiene un único campo vectorial f es involutivo porque:
[f , f ] = 0.
3) El conjunto de campos vectoriales f1 , f2 , . . ., fm es involutivo si ∀ x y ∀ i, j
' ( ' (
rank f1 (x) . . . fm (x) = rank f1 (x) . . . fm (x) [fi (x), fj ](x)
'(
donde la notación rank . representa el rango de una matriz de campos vecto-
riales columna.

4.2. Linealización por Realimentación. Caso: SISO


Esta sección presenta la metodologı́a para generar una relación entrada–salida
para procesos SISO no lineales con el propósito de diseñar controladores estables. El
sistema no lineal en consideración se puede describir como:
ẋ = f (x) + g(x)u y = h(x) (4.16)
     
x1 f1 (x) g1
     
x =  ...  f = ..
.  g =  ... 
xn fn (x) gn
donde x es el vector de estado de orden n × 1, u es la entrada de control, y es la
salida del sistema, f y g son campos vectoriales suaves de orden n × 1, y h es una
función suave.

4.2.1. Condiciones para Linealización


El sistema no lineal ẋ = f (x) + g(x)u es linearizable por realimentación de
estados, sı́ y sólo si las siguientes condiciones son verdaderas para una región Ω:
1) Los campos vectoriales g, adf g, . . ., adfn−1 g son linealmente independientes en
la región Ω.
2) El conjunto {g, adf g, . . ., adfn−2 g } es involutivo en Ω.
Para sistemas SISO lineales se sabe que f (x) = Ax y g(x) = B, donde A de orden
n × n y B de orden n × 1 son las matrices de estado y de control (o de distribución)
respectivamente. Por consiguiente, la primera condición se convierte en la bien cono-
cida condición de estabilidad completa dada en (2.11), a saber, un sistema lineal de
la forma:
ẋ = Ax + Bu y = Cx (4.17)
es controlable en sus estados si su matriz de controlabilidad C posee rango completo:
rank C = rank [B AB ··· An−1 B] = n (4.18)

La primera condición descrita arriba puede ser interpretada como la Condición de


Estabilidad Generalizada.
4.2 Linealización por Realimentación. Caso: SISO 105

4.2.2. El Grado Relativo de un Sistema


Diferenciemos la salida y de (4.16):

ẏ = ∇h(x)(f + gu) = Lf h(x) + Lg h(x)u

Si Lg h(x) = 0 para algún x = x0 , entonces la siguiente transformación en la entrada:

1
u= (−Lf h(x) + v)
Lg h(x)

genera una relación diferencial lineal entre la salida y y la nueva entrada v, de la


forma: ẏ = v. Por el contrario, si Lg h(x) = 0 para todo x, la diferenciación de ẏ
produce:
ÿ = L2f h(x) + Lg Lf h(x)u

Si Lg Lf h(x) = 0 para todo x, necesitamos diferenciar y (3) , . . ., y (i) como sigue:

d iy
y (i) = = Lif h(x) + Lg Li−1
f h(x)u
dt i

hasta que para algún entero r = i y para algún x = x0

Lg Lr−1
f h(x) = 0

Sustituyendo la siguiente ley de control:

1
u= r−1 (−Lrf h(x) + v)
Lg Lf h(x)

en:
y (r) = Lrf h(x) + Lg Lr−1
f h(x)u

genera una relación diferencial lineal entre la salida y y la nueva entrada v de la


forma: y (r) = d r y/dt r = v.
Por consiguiente, un sistema SISO posee un grado relativo r en el punto x0
en una región Ω si, para todo x Ω:

Lg Lif h(x) = 0 0≤i<r−1 (4.19)


Lg Lr−1
f h(x) = 0 (4.20)

Observar que r es el número de diferenciaciones ejecutadas en la salida y requeridas


para que la entrada u aparezca. En general: r ≤ n (recordar que n es el orden del
sistema). Si r = n, entonces la linealización entrada–salida se denomina exacta y
en esta situación todos los estados se realimentan.
Por otra parte, el grado relativo de un sistema no lineal es indefinido en x0 si
el coeficiente of u (equation (4.20)) is zero en x0 , pero no es cero en algunos puntos
x cercanos a x0 .
106 Linealización por Realimentación de Estados

4.2.3. Forma Normal SISO con Linealización Exacta


El sistema no lineal (4.16) se puede transformar a su forma normal usando los
resultados establecidos en la subsección 4.1.2. Sabemos que linealización exacta de
un sistema no lineal descrito por (4.16) ocurre cuando el grado relativo r es igual al
orden del sistema n. Para linealización exacta, la transformación de estados:
       
z1 φ1 (x) h(x) y
 z2   φ2 (x)   Lf h(x)   ẏ 
       
z =  .  = Φ(x) =  .. = ..  =  ..  (4.21)
 ..   .   .   . 
zn φn (x) Lfn−1 h(x) yn

conduce a la siguiente descripción en el espacio de estado:


   
ż1 z2
 ż2   z3 
   
 ..   . 
ż =  .  =  .
.  y = z1 (4.22)
   
 żn−1   zn 
żn b(z) + a(z)u

donde:

a(z) = Lg Lfn−1 h(Φ−1 (z))


b(z) = Lnf h(Φ−1 (z)) (4.23)

4.2.4. La Ley de Control SISO para Linealización


Consideremos la siguiente ley de control de linealización:
1
u= [−b(z) + v] (4.24)
a(z)

donde v es una nueva entrada a ser determinada, a(z) y b(z) están dadas en (4.23),
y z es el nuevo estado para linealización. Substituyendo (4.24) en (4.22) produce la
siguiente representación canónica invariante con el tiempo:

ż = Mz + Nv y = Cz (4.25)

donde:
   
0 1 0 ··· 0 0
 0 0 1 ··· 0   0 
    
 .. .. .. .. ..  .. 
M= . . . . . N= .  C 1 0 ··· 0 0
   
 0 0 0 0 1   0 
0 0 0 0 0 1

La función de transferencia del sistema es:


y(s) 1
= H(s) = C(sI − M)−1 N = n (4.26)
v(s) s
4.3 Linealización por Realimentación: Caso MIMO 107

donde s es el operador de Laplace. La entrada v se diseña para ubicar los polos


del sistema lineal equivalente. Entonces, la entrada u se computa usando (4.24).
Empleando (4.26), el sistema lineal equivalente se puede seleccionar de:

d ny
v= = y (n) = ρ(n) + K1 ȳ (n−1) + · · · + Kn−1 ȳ˙ + Kn ȳ (4.27)
dt n

donde ρ(t) es la trayectoria deseada e ȳ(t) = ρ(t) − y(t) es la señal de error de


seguimiento. La ecuación caracterı́stica del sistema lineal equivalente es:

ȳ (n) + K1 ȳ (n−1) + · · · + Kn−1 ȳ˙ + Kn ȳ = 0 (4.28)

Para comportamiento asintótico estable, es decir, ȳ = (ρ − y) → 0 para t → ∞,


ninguna de las raı́ces de (4.28) se deben de localizar en el semiplano derecho del plano
s, incluyendo el eje imaginario. Los parámetros Ki , i = 1, . . . , n del controlador se
seleccionan para cumplir este requerimiento.

4.3. Linealización por Realimentación: Caso MIMO


4.3.1. Modelando Sistemas MIMO Cuadrados
Un sistema MIMO no lineal se denomina cuadrado cuando el número de sus
entradas iguala al número de sus salidas. El sistema cuadrado por considerar, en la
vecindad del punto x0 , se describe por:


m
ẋ = f (x) + G(x)u = f (x) + gj (x)uj (x) y = h(x) (4.29)
j=1

     
x1 f1 (x) u1
     
x =  ...  f (x) =  ..
.  u =  ... 
xn fn (x) um
   
y1 h1 (x)
   
y =  ...  h(x) =  ..
. 
ym hm (x)
 
G11 (x) . . . G1m (x)
 ..  
G(x) =  . ...  = g1 (x) · · · gm (x)
Gm1 (x) . . . Gmm (x)

donde x es el vector de estado de orden n × 1, u es el vector de control (la entrada)


de orden m × 1, y es el vector de salida de orden m × 1, f es un campo vectorial suave
de orden n × 1, h es un campo vectorial suave de orden m × 1, y G es una matriz de
dimensión n × m cuyas columnas son campos vectoriales gj de orden of order n × 1.
Los elementos de gj y h son funciones suaves.
108 Linealización por Realimentación de Estados

4.3.2. Grado Relativo Total


En la referencia [11], se establece que el sistema cuadrado descrito por (4.29)
posee un grado relativo total r = r1 + . . . + rm si:
1) Para todo x en una vecindad de x0
Lgj Lkf hi (x) = 0 j, i = 1, . . . , m k < ri − 1

2) La siguiente matriz de orden m × m es no singular en x = x0 :


 
Lg1 Lfr1 −1 h1 (x) · · · Lgm Lfr1 −1 h1 (x)
 Lg Lr2 −1 h2 (x) · · · Lg Lr2 −1 h2 (x) 
 1 f m f 
A(x) =  .. . ..  (4.30)
 . . . . 
rm −1 rm −1
Lg1 Lf hm (x) · · · Lgm Lf hm (x)

Observando las filas de A, podemos postular que cada entero ri está relacionado con
la i-ésima salida del sistema. También, notar que ri es el número de diferenciaciones
ejecutadas en la salida yi requeridas para que aparezca al menos uno de los compo-
nentes del vector de entrada u. La no singularidad de A(x) en x = x0 es la versión
multivariable de la condición impuesta por la ecuación (4.20).
Ejemplo 4.1
La descripción en el espacio de estado del sistema MRE (manipulador robótico esféri-
co) de dos entradas y dos salidas se da en (1.146) y (1.147). Determinar el grado
relativo total del MRE.

Solución: Las primeras tres derivadas de la salida y1 = h1 (x) = x1 produce:


∂h1 (x)
ẏ1 = ẋ = Lf h1 (x) = f1 (x) = ẋ1 = x3 Lg1 h1 (x) = 0
∂x
∂(Lf h1 (x))
ÿ1 = ẋ = Lf (Lf h1 (x)) = f3 (x) = ẋ3 = x5 Lg1 (Lf h1 (x)) = 0
∂x
(3) ∂(Lf (Lf h1 (x)))
y1 = ẋ = Lf (Lf (Lf h1 (x))) = f5 (x)
∂x
Lg1 (Lf (Lf h1 (x))) = G51 (x) = 0
Por consiguiente, el grado relativo para y1 resulta r1 = 3. También, las primeras tres
derivadas de la salida y2 = h2 (x) = x2 produce:
∂h2 (x)
ẏ2 = ẋ = Lf h1 (x) = f1 (x) = ẋ2 = x4 Lg2 h2 (x) = 0
∂x
∂(Lf h2 (x))
ÿ2 = ẋ = Lf (Lf h2 (x)) = f4 (x) = ẋ4 = x6 Lg2 (Lf h2 (x)) = 0
∂x
(3) ∂(Lf (Lf h2 (x)))
y2 = ẋ = Lf (Lf (Lf h2 (x))) = f6 (x)
∂x
Lg2 (Lf (Lf h2 (x))) = G62 (x) = 0
Por consiguiente, el grado relativo para y2 resulta r2 = 3 y el grado relativo total del
sistema viene a ser: r = r1 + r2 = 6.
4.3 Linealización por Realimentación: Caso MIMO 109

4.3.3. Forma Normal MIMO para Linealización Exacta


Si el grado relativo total del sistema cuadrado descrito en (4.29) es r, entonces:

r = r1 + r2 + · · · + rm ≤ n

Un sistema MIMO descrito por (4.29) posee linealización exacta, si su grado relativo
total r = r1 + . . . + rm es igual al orden n del sistema, es decir, la dimensión n del
vector de estados. Para linealización exacta, la transformación de estados:
   
φ1 (x) z1
 ..   .. 
 .   . 
   
 φr1 (x)   z 
   r 1 
 ψ1 (x)   zr1 +1 
   
 ..   .. 
 .   . 
z = Φ(x) =  ψr (x)  
= 
 (4.31)
 2   zr1 +r2 
 ..   .. 
 .   . 
   
 ξ1 (x)   zr +r +···+1 
   1 2 
 ..   .. 
 .   . 
ξrm (x) zr1 +r2 +···+rm

donde

φ1 (x) = h1 (x) = y1 (x); φ2 (x) = Lf h1 (x); · · · ; φr1 (x) = Lfr1 −1 h1 (x)


ψ1 (x) = h2 (x) = y2 (x); ψ2 (x) = Lf h2 (x); · · · ; ψr2 (x) = Lfr2 −1 h2 (x)
..
.
ξ1 (x) = hm (x) = ym (x); ξ2 (x) = Lf hm (x); · · · ; ξrm (x) = Lfrm −1 hm (x)

conduce a la siguiente descripción en el espacio de estado:

ẏ1 = φ̇1 (x) = φ2 (x)


..
.
(r1 −1)
y1 = φ̇r1 −1 (x) = φr1 (x)

(r )

m
y1 1 = φ̇r1 (x) = Lrf 1 h1 (Φ−1 (z)) + Lgj Lfr1 −1 h1 (Φ−1 (z))uj
j=1

ẏ2 = ψ̇1 (x) = ψ2 (x)


..
.
(r2 −1)
y2 = ψ̇r2 −1 (x) = ψr2 (x)

(r )

m
y2 2 = ψ̇r2 (x) = Lrf 2 h2 (Φ−1 (z)) + Lgj Lfr2 −1 h2 (Φ−1 (z))uj
j=1

..
.
110 Linealización por Realimentación de Estados

ẏm = ξ˙1 (x) = ξ2 (x)


..
.
(rm −1)
ym = ξ˙rm −1 (x) = ξrm (x)

m
(rm )
ym = ξ˙rm (x) = Lrf m hm (Φ−1 (z)) + Lgj Lfrm −1 hm (Φ−1 (z))uj
j=1
(4.32)

Ejemplo 4.2 La forma normal MIMO del MRE

Determinar la forma normal MIMO del proceso MRE.

Solución: Del ejemplo 4.1, la condición para linealización exacta se cumple para el
sistema MRE porque r = 6 = n (orden del sistema). Aplicación de las relaciones
(4.31) y (4.32) en el sistema MRE nos conduce a:
         
z1 h1 x1 y1 z1
 z2   Lf h1 (x)   x3   ẏ1   z4 
         
 z3   L2f h1 (x)   x5   ÿ1   z2 
z=

 = Φ(x) = 
 
=
 
=
 

 x = Φ (z) = 
−1



 z4   h2 (x)   x2   y2   z5 
 z5   Lf h2 (x)   x4   ẏ2   z3 
z6 L2f h2 (x) x6 ÿ2 z6

(4.33)
   
ż1 z2
 ż2   z3 
       
 ż3   v1  y1 z1
ż = 

=
 
 = Mz + Nv
 y= = = Cz (4.34)
 ż4   z5  y2 z4
 ż5   z6 
ż6 v2
donde:  
0 1 0 0 0 0
 0 0 1 0 0 0 
   
v1  0 0 0 0 0 0 
v= M=



v2  0 0 0 0 1 0 
 0 0 0 0 0 1 
0 0 0 0 0 0
 
0 0
 0 0 
   
 1 0  1 0 0 0 0 0
N=


 C=
 0 0  0 0 0 1 0 0
 0 0 
0 1
4.3 Linealización por Realimentación: Caso MIMO 111

4.3.4. La Ley de Control MIMO Desacoplada


Es importante anotar que el grado relativo ri , i = 1, . . . , m, es el entero más
pequeño requerido para que al menos una de las entradas aparezca en (seever (4.32)):


m
yiri = Lrf i hi (Φ−1 (z)) + Lgj Lfri −1 hi (Φ−1 (z))uj
j=1

Por consiguiente, Lfri −1 hi (Φ−1 (z))uj = 0 para al menos un j en la vecindad de x0 .


Ahora consideremos la siguiente ley de control desacoplada:

u = A−1 (z)[−B(z) + v] (4.35)

donde v = [v1 . . . vm ]T es una nueva entrada por determinar, y A(z) (ver (4.30)) y
B(z) son matrices con elementos:
r −1
aij = Lgi Lf j hj (Φ−1 (z)) i, j = 1, . . . , m

bi = Lrf i hi (Φ−1 (z)) i = 1, . . . , m

respectivamente. Sustitución de los elementos ui , i = 1, . . . , m (ecuación (4.35)) en


(4.32) conduce a la representación canónica invariante con el tiempo del sistema
(r )
MIMO, es decir, ecuación (4.32) con yi i = vi .
Por otra parte, de la relación y(s) = H(s)v(s), fácilmente se puede demostrar
que la matriz de transferencia H(s) del sistema MIMO linealizado es:
 
1/sr1 0 ··· 0
 0 1/sr2 ··· 0 
 
H(s) =  .. .. .. ..  (4.36)
 . . . . 
0 0 · · · 1/srm

(r )
lo cual significa que yi i = d ri yi /dt ri = vi , i = i, . . . , m, donde cada entrada vi se
diseña para ubicar los polos del correspondiente subsistema lineal equivalente. Tal
subsistema se puede seleccionar como:

d r i yi (r ) (r ) (r −1)
vi = r
= yi i = ρi i +Ki,1 ȳi i +· · ·+Ki,ri −1 ȳ˙ i +Ki,ri ȳi i = 1, . . . , m (4.37)
dt i

donde ρi (t) es la i-ésima trayectoria deseada y, ȳi (t) = ρi (t) − yi (t) es la i-ésima señal
de error de seguimiento. La i-ésima ecuación caracterı́stica del subsistema resulta:
(ri ) (ri −1)
ȳi + Ki,1 ȳi + · · · + Ki,ri −1 ȳ˙ i + Ki,ri ȳi = 0 i = 1, . . . , m (4.38)

Para comportamiento asintótico estable, es decir, cuando ȳi → 0 o cuando yi → ρi


para t → ∞, ninguna de las raı́ces de (4.38) debe de estar localizada en el semiplano
derecho del plano-s, incluyendo el eje imaginario.

Ejemplo 4.3
112 Linealización por Realimentación de Estados

Determinar la ley de control MIMO desacoplada para el proceso MRE.

Solución: Conforme a (4.34), la nueva entrada v = [v1 v2 ]T para el sistema MRE


es:

(3) (3)
ż3 = z1 = y13 = ẋ5 = q1 = v1
(3) (3)
ż6 = z2 = y23 = ẋ6 = q2 = v2 (4.39)

Usando (4.37), las entradas v1 y v2 toman la forma:

(3)
v1 = ρ1 + K13 ρ̈12 + K12 ρ̇1 + K11 ρ1 − K13 ÿ12 − K2 ẏ1 − K11 y1
(3)
v2 = ρ2 + K23 ρ̈2 + K22 ρ̇2 + K21 ρ2 − K23 ÿ2 − K22 ẏ2 − K21 y2 (4.40)

donde ρ1 y ρ2 son las trayectorias deseadas. Empleando (4.39), y (4.40) en (1.139) y


(1.140), la ley de control desacoplada del MRE viene a ser:

u1 = v1 LT1 (H11 + J1 ) + P1
u2 = v2 LT2 (H22 + J2 ) + P2 (4.41)

4.4. Observadores No Lineales con Polos Prescritos

El diseño de controladores por ubicación de polos para sistemas lineales [13], [14]
asume que todos los estados del sistema están disponibles en la realimentación. En
este caso, es posible forzar para que el sistema posea polos predeterminados a lazo
cerrado, es decir, polos prescritos (o eigenvalores) en localizaciones deseadas. En la
práctica, sólo parte de los estados son disponibles para procesamiento, y además, no
debemos de dejarnos tentar en la diferenciación de variables de estado con el fin de
generar una nueva. Es bien conocido que la simple diferenciación de una señal pude
hacer decrecer por varias veces la relación señal a ruido.
Los observadores de estado para sistemas lineales estiman estados no medibles
sin un sistema de diferenciación. El diseño de un observador de estado lineal es muy
similar al diseño de un controlador por ubicación de polos. En otras palabras, la
expresión de la matriz de ganancia del observador de estados es la expresión dual de
la matriz de ganancia del controlador de realimentación de estados.
Vimos en la subsección 4.3.3 que linealización exacta nos permite diseñar una
ley de control desacoplada (subsección 4.3.4) usando eigenvalores prescritos para
asegurar la estabilización del sistema descrito por (4.29). Apelando al concepto de
dualidad como en el caso lineal discutido lı́neas arriba, nosotros enfrentaremos el
problema de sı́ntesis de observadores no lineales con eigenvalores prescritos para la
estimación de estados. estimation.
4.4 Observadores No Lineales con Polos Prescritos 113

4.4.1. Observador SISO No Lineal con Polos prescritos


Sistemas lineales SISO de la forma dada en (4.17) o (4.25) son observables si
su matriz de observabilidad O posee rango completo (see also (2.26)), es decir:
 
C
 CM 
 
rank O = rank  .. =n (4.42)
 . 
CMn−1

Se puede demostrar fácilmente que la matriz de observabilidad del sistema (4.25)


posee rango completo. Para sistemas no lineales con entrada y salida escalares de-
scritos por:
ẋ = f (x) + g(x)u y = h(x) (4.43)
la matriz de observabilidad generalizada se puede formular como;
   
h(x) h(x)

∂  L h(x)   L f h(x)

f   
O(x)   ..  z = Φ(x) =  ..  (4.44)
∂x  .   . 
n−1 n−1
Lf h(x) Lf h(x)

donde O es de orden n×n, z = Φ(x) es la transformación de estados descrita en (4.22).


Es fácil de verificar que la ecuación (4.42)) se convierte en (4.44)) para f (x) = Ax
and h(x) = Cx.
la descripción en el espacio de estado del sistema en el dominio-z está dado por
la ecuación (4.22)mientras que la ecuación (4.25) describe su correspondiente rep-
resentación canónica invariante en el tiempo. Empleando (4.22) y la transformación
z = Φ(x), podemos formular:

∂Φ
ż = ẋ = O(x)(f (x) + g(x)u) = Mz + Nv
∂x
v = Lnf h(Φ−1 (z)) + Lg Lfn−1 h(Φ−1 (z))u
y = Cz (4.45)

El observador no lineal para el sistema descrito por las ecuaciones 4.22) y (4.25) posee
la forma:

ẑ˙ = Mẑ + Nv + P(y − Cẑ)


ŷ = Cẑ (4.46)

donde ẑ y ŷ son los estimados de z y y, respectivamente, y P de orden n × 1 es la


matriz de ganancia del observador. Notar que (4.46) se convierte en un observador
lineal cuando v es una entrada lineal.
Asumamos la existencia de O−1 (x). Para z = ẑ and x = x̂, y usando el hecho
de que y = Cẑ = h(x̂), entonces la ecuación (4.45) toma la forma:

O(x̂)(f (x̂) + g(x̂)u) = Mẑ + Nv Cẑ = h(x̂) (4.47)


114 Linealización por Realimentación de Estados

Substituyendo (4.47) en (4.46) nos conduce al siguiente observador no lineal en el


dominio de x̂.
x̂˙ = f (x̂) + g(x̂)u + O−1 (x̂)P(y − h(x̂)) (4.48)
Sea e = ẑ − z el error de estimación. Substrayendo (4.25) de (4.47) y usando el hecho
de que y = Cz, es fácil de verificar que:
ė = (M − PC)e (4.49)
La matriz de ganancia P requiere ser seleccionada de modo tal que los eigenvalores
de la ecuación caracterı́stica del observador no lineal:
det [sI − M + PC] = 0
haga el error de estimación e ∼
= 0 con suficiente rapidez. Tal matriz de ganancia P
se puede computar de [13]:
P = Ψ(M)O−1 [0 0 ··· 0 1]T (4.50)
Ψ(M) = Mn + α1 Mn−1 + · · · + αn−1 M + αn I
donde los parámetros αi , . . . , αn se pueden determinar de:
(s − µ1 ) . . . (s − µn ) = sn + α1 sn−1 + · · · + αn−1 s + αn
donde µ1 , . . . , µn son los polos a lazo cerrado del observador no lineal.

4.4.2. Observadores MIMO No Lineales con Polos Prescritos


Considere que el sistema MIMO no lineal cuadrado descrito por (4.29) posee un
grado relativo total r = r1 + · · · + rm . Para linealización exacta, la transformación de
estados dada en (4.31) nos conduce a la descripción en el espacio de estado dada por
(4.32). Por consiguiente, la correspondiente matriz de obsevabilidad generalizada se
puede formular como:
∂Φ(x)
O(x)  z = Φ(x) (4.51)
∂x
por consiguiente (ver ecuación (4.45)):
∂Φ
ż = ẋ = O(x)(f (x) + g(x)u) = Mz + Nv
∂x
v = Lnf h(Φ−1 (z)) + Lg Lfn−1 h(Φ−1 (z))u v = [v1 . . . vm ]T
y = Cz (4.52)
El observador MIMO toma la forma:
ẑ˙ = Mẑ + Nv + P(y − Cẑ)
ŷ = Cẑ (4.53)
donde ẑ y ŷ son los estimados de z y y, respectivamente, y P de orden n × m es la
matriz de ganancia del observador. La ecuación no lineal del observador en el dominio
de x̂ está dado por:
x̂˙ = f (x̂) + G(x̂)u + O−1 (x̂)P(y − h(x̂)) (4.54)
4.4 Observadores No Lineales con Polos Prescritos 115

Sea e = ẑ − z el error de estimación. Sustraendo (4.52) de (4.53), obtenemos:

ė = (M − PC)e (4.55)

Como en el caso SISO, la matriz de ganancia P requiere ser seleccionado de modo tal
que los eigenvalores de la ecuación caracterı́stica del observador no lineal: eigenvalues
of the characteristic equation of the nonlinear observer

det [sI − M + PC] = 0


∼ 0 con suficiente rapidez. Tal matriz de ganancia P
haga el error de estimación e =
se puede computar de OOOOOOJJJJJOOOOO:

det [sI − M + PC] = (s − µ1 ) . . . (s − µn ) = 0 (4.56)

donde µ1 , . . . , µn son los polos deseados a lazo cerrado del observador no lineal.

Ejemplo 4.4 El observador MIMO no lineal MIMO para el MRE

Determinar el observador MIMO no lineal para el proceso MRE.

Solución: La matriz de observabilidad generalizada del MRE posee la forma (ver


(4.51)):
     
h1 () x1 1 0 0 0 0 0
 Lf h1 (x)   x3   0 0 1 0 0 0 
 2     
∂ 
 L h1 (x) 
 ∂ 
 x5  
= 0 0 0 0 1 0 

O(x) = f = (4.57)
∂x  h2 (x)  ∂x 
 
 x2  
  0 1 0 0 0 0 

 Lf h2 (x)   x4   0 0 0 1 0 0 
L2f h2 (x) x6 0 0 0 0 0 1

La inversa de (4.57) is:


 
1 0 0 0 0 0
 0 0 0 1 0 0 
 
 0 1 0 0 0 0 
O (x) = 
−1



 0 0 0 0 1 0 
 0 0 1 0 0 0 
0 0 0 0 0 1

Luego, el observador no lineal dado por (4.54) toma la forma:

x̂˙ = f (x̂) + G(x̂)u + O−1 (x̂)P(y − ŷ) (4.58)


     
x̂˙ 1 f1 (x̂) 0 0
 x̂˙ 2     
   f2 (x̂)   0 0  
      u1
 x̂˙ 3   f3 (x̂) + 0 0 
 =    u2 +
 x̂˙ 4   f4 (x̂)   0 0 
     
 x̂˙ 5  f5 (x̂) G51 (x̂) 0
x̂˙ 6 f6 (x̂) 0 G62 (x̂)
116 Linealización por Realimentación de Estados

  
1 0 0 0 0 0 P11 P12
 0 0 0 1 0 0  P21 P22 
   
 0 1 0 0 0 0  P31 P32  x1 − x̂1
  
 0 0 0 0 1 0  P41 P42  x2 − x̂2
  
 0 0 1 0 0 0  P51 P52 
0 0 0 0 0 1 P61 P62

Las funciones fi , i = 1, . . . , 6, G51 y G62 fueron definidas en (1.146).

Ejemplo 4.5

Diseñar y simular el sistema de control del proceso MRE empleando linealización de


la realimentación.

Solución: La figura 4.1 ilustra el diagrama de bloques usado para la simulación del
sistema de control de trayectoria no lineal MIMO para el MRE. Dicha simulación
emplea los resultados obtenidos en los ejemplos 4.1 a 4.4. Los polos del sistema
a lazo cerrado controlado se ubican en −2,2 ± 0,85 and −6500. Las trayectorias
deseadas seleccionadas son: ρ1 = sin(0,75kT ) y ρ2 = cos(0,75kT ). Los valores de los
parámetros se dan en la tabla 1.6. En adición, considere una masa de la muñeca de la
mano del manipulador de 0.2 kg y una masa de la pinza de of 0.4 kg. La pinza puede
llevar consigo una carga de 0.2 kg of mass. Las condiciones iniciales para la base es
de o rad, mientras que para el brazo (el eslabón) es de π/2 rad.
Las figures 4.1 y 4.2 muestran los resultados de la simulación obtenidos con
el programa srm4fl.m. El tiempo de estabilización y la fuerza de control máxima en
la salida y1 del sistema son 2 s y 2.2 V, mientras que para la segunda salida y2 son
4 s y 26 V. Una segunda simulación sin considerar la carga revela que se obtienen
aproximadamente los mismos resultados..

Linear controller
ρ u x
v = v ( ρ , z) u = u( ^
x, v) x=fx+Gu

Nonlinear process
Pole-placement
loop Nonlinear
observer
^ ^
x
z
z = ψ (x)
^ ^
Linearization
Transformation loop

Figura 4.1: Diagrama de bloques del sistema de control no lineal por realimentación
de estados.

donde a(z) y b(z) están dadas en (4.23).


IN PROGRESS
4.4 Observadores No Lineales con Polos Prescritos 117

1.5

BASE POSITION (rad)


0.5

−0.5

−1

−1.5
0 1 2 3 4 5 6 7 8 9 10
TIME (s)

2.5
CONTROL VOLTAGE u1 (vol)

1.5

0.5

−0.5

−1
0 1 2 3 4 5 6 7 8 9 10
TIME (s)

Figura 4.2: Trayectoria controlada y1 y la correspondiente fuerza de control u1 .


2

1.5
LINK POSITION (rad)

0.5

−0.5

−1

−1.5
0 1 2 3 4 5 6 7 8 9 10
TIME (s)

30
CONTROL VOLTAGE u1 (vol)

20

10

−10
0 1 2 3 4 5 6 7 8 9 10
TIME (s)

Figura 4.3: Trayectoria controlada y2 y la correspondiente fuerza de control u2 ..

PROBLEMAS
IN PROGRESS
Capı́tulo 5

Control Deslizante

Esate capı́tulo se ocupa del control de sistemas no lineales usando la metodolog1a


del denominado control por modos deslizante, o simplemente control deslizante. Para
el control deslizante, la descripción dinámica del sistema puede ser imprecisa; esto
es, el modelo dinámico del sistema puede presentar incertidumbre paramétrica en su
estructura o dinámica no modelada en su representación. Dado que la descripción
del proceso permite incertidumbres, el control deslizante puede ser considerado una
aproximación particular del control robusto.
La metodologı́a del control deslizante incluye una ley de control no lineal de
realimentación que conmuta discontinuamente sobre una superficie que pertenece al
espacio de estad del sistema, de forma tal que si una trayectoria de estado que se orig-
ina en su superficie (como respuesta al comportamiento natural del sistema dinámico
a lazo abierto), tarta de desviarse de dicha superficie, entonces se aplica una fuerza
de control co el fin hacer retornar el estado de nuevo a su sistema. Por consiguiente,
trayectorias de estado naturales del sistema controlado están restringidos a deslizarse
a lo largo de su superficie.
Cualquier trayectoria de estado en la superficie dada debe de satisfacer la
relación algebraica que describe dicha superficie. Por otro lado, es posible introducir
una ecuación algebraica deseada en el espacio de estado del sistema a lazo abierto
que sea capaz de confinar la dinámica del sistema en una determinada superficie. La
relación introducida debe de ser independiente de ciertos disturbios, incertidumbre
en los parámetros y dinámica no modelada.
De hecho, el control deslizante es un tipo particular de Control con Estructura
Variable (CEV) [8], [9]. Tal tipo de control emplea en su diseño dos o más leyes de
control de realimentación y una regla de decisión: la función de conmutación. En el
control deslizante, el CEV se diseña para conducir y entonces confinar el compor-
tamiento el comportamiento del sistema de control dentro de una vecindad de la
función de conmutación.
La primera parte de este capı́tulo sigue la metodologı́a presentada en [3],donde
un problema de control de n-ésimo orden (esto es,, un problema donde el sistema se
describe mediante ecuaciones diferenciales de orden n) se sustituye por un problema
de control equivalente pero de primer orden. Luego, el problema de control transfor-
mado se resuelve para lograr estabilidad y rendimiento consistente en la presencia de
incertidumbre paramétrica y dinámica no modelada, sin embargo, pagando el precio
120 Control Deslizante

de una gran actividad de la ley de control que a la larga le es perjudicial. Modifi-


caciones apropiadas en la ley de control pueden lograr que la ley de control tenga
moderada actividad. to moderate control activity.
En la mayor parte del libro, especı́ficamente en las aplicaciones del control
deslizante para sistemas multivariables, se emplea el modelo de Lagrange del sistema
a controlar. Tal técnica de modelado fue desarrollada en la sección . Cabe anotar que
el modelo de Lagrange de un sistema también se puede determinar empleando las
leyes de la fı́sica.

5.1. Control Deslizante para Sistemas de una Entrada


5.1.1. Conceptos Básicos y Notación
Considere el sistema dinámico de una entrada y lineal en u:

dxn
x(n) = = f (x) + b(x)u (5.1)
dtn
donde el escalar x es ;la salida de interés del sistema, el escalar u es la entrada de
control, x = [x ẋ x(2) . . . x(n−1) ] es el vector de estado, y las funciones f (x)
y g(x) no son exactamente conocidas pero son acotadas por funciones conocidas
dependientes de x. En adición, b(x) es de signo conocido. Dada una trayectoria de
(2) (n−1)
estado variante con el tiempo xd = [xd ẋd xd . . . xd ], con:

xd (0) = x(0) (5.2)

el problema de control a resolver es diseñar un control finito u que fuerce al estado


x seguir a la trayectoria deseada xd a pesar de la presencia de incertidumbres en los
parámetros y dinámica no modelada.
Definamos el error de seguimiento x̃ y el vector de error de seguimiento x̃ como:

x̃ = x − xd x̃ = x − xd = [x̃ x̃˙ x̃(2) . . . x̃(n−1) ]T (5.3)


Además, consideremos la superficie S(t) variante con el tiempo en el espacio de estado
Rn definido mediante la ecuación escalar s(x, t) = 0, tal que:

d
s(x, t) = ( + λ)n−1 x̃ = (p + λ)n−1 x̃ = x(n−1) − xr(n−1) (5.4)
dt
donde λ es una constante positiva cuya selección se discutirá luego, p es el operador
(n−1)
de L:aplace y xr es una función que puede ser computada de x y xd . Por ejemplo,
para un sistema de orden n = 3, s toma la forma:

s = (p + λ)2 x̃ = (p2 + 2λp + λ2 )x̃ = x̃


¨ + 2λx̃˙ + λ2 x̃
= ẍ + ẍr
ẍr = ẍd − 2λx̃˙ − λ2 x̃ (5.5)

¨ del error de veloci-


Notar que s resulta la suma ponderada del error de aceleración x̃,
dad x̃˙ y el error de posición x̃.
5.1 Control Deslizante para Sistemas de una Entrada 121

La relación (5.4) establece que un problema de control de trayectoria de orden


n se puede reemplazar por problema de estabilización de primer orden, es decir, por
el problema de mantener el escalar s en cero. Tal problema de estabilización se puede
resolver seleccionando la ley de control u de (5.1) de forma que fuera de la superficie
S(t):
1d 2
s = ṡ s ≤ −η|s| (5.6)
2 dt
donde η es una constante positiva. Como se ilustra en la figura 5.1(a) para el caso
n = 2, todas las trayectorias de estado que satisfacen la condición (5.6), la condición
de deslizamiento, hacen de la superficie S(t) un conjunto invariante en el sentido
de Lyapunov, implicando que las trayectorias del sistema fuera de S(t) apuntarán
tal superficie, y las trayectorias del sistema en S(t) permanecerán en ella. También
se puede establecer que dinámica no modelada, incertidumbre paramétrica o ciertos
disturbios, serán tolerados por un sistema que satisfaga la condición dada en (5.6).
S(t) es conocida como la superficie de deslizamiento porque satisface la condición de
deslizamiento. El comportamiento del sistema sobre una superficie de deslizamiento
se denominad modo de deslizamiento.

S(t)

(a)
dx
dt s=0

. xd

x
0

(b)
dx
s=0
dt

. xd

x
0
(c)

Figura 5.1: (a) La superficie de deslizamiento S(t). (b) Convergencia exponencial. (c)
Fenómeno del “chattering”.

Consideremos el caso de aquellos sistemas que satisfacen la condición (5.6),


pero no la condición (5.2), esto es, xd (0) = x(0). Para tales sistemas, la superficie de
deslizamiento s(t) = 0 será golpeada por alguna trayectoria del sistema en un tiempo
thit , el cual se puede computar como sigue. Asumiendo ques(t = 0) > 0 e integrando
122 Control Deslizante

(5.6) entre t = 0 y t = thit :


 thit  s(t=thit )  thit
ṡ dt = ds ≤ − η dt (5.7)
0 s(t=0) 0

nos conduce a thit ≤ s(t = 0)/η. Se puede obtener el mismo resultado si se arranca
con s(t = 0) < 0. Por consiguiente:

th ≤ |s(t = 0)|/η (5.8)

La figure 5.1(b) ilustra el caso de una trayectoria de estado que evoluciona con una
condición inicial arbitraria, y luego golpea a la superficie s(t) = 0 en un tiempo finito
thit ≤ |s(t = 0)|/η. En el modo de deslizamiento, tal trayectoria “se desliza.a lo largo
de S(t) con el objeto de alcanzar exponencialmente a xd con una constante de tiempo
igual a 1/λ. Por cierto, la expresión de (5.4) para n = 2:

1/λ
s = (p + λ)x̃ → x̃ = s
(1/λ)p + 1

posee una constante de tiempo igual a 1/λ.


La implementación de sistemas de control deslizantes requiere de una ley de
control realimentado , la cual se puede obtener de (5.4) y (5.1) de modo tal que s2 en
la ecuación (5.6) se comporte muy parecido a una función de Lyapunov con e fin de
garantizar estabilidad asintótica del sistema a lazo cerrado. En modo deslizante para
el caso ideal, por ejemplo, cuando el modelo del sistema (5.1) representa exactamente
al sistema actual, la ley de control diseñada forzará a todas las trayectorias de estado
a deslizarse a lo largo de s = 0 tal como se observa en la figura 5.1(b).
Sin embargo, debido a la presencia de imprecisiones en el modelado (incertidum-
bres en los parámetros y dinámica no modelada) y de disturbios, la ley de control
forzará a todas las trayectorias de estado a deslizarse discontinuamente a lo largo
de s = 0 tal como se muestra en la figura 5.1(c), es decir, la ley de control en mo-
do deslizante necesita ser discontinua a través de S(t), produciendo ası́ el fenómeno
conocido como chattering. Desde que el chattering implica unamuy elevada actividad
de control, entonces, por consideraciones prácticas, la fuerza de control u necesita ser
suavizada adecuadamente, a pesar de la pérdida de precisión en el seguimiento y en
el ancho de banda.

Ejemplo 5.1

Para el sistema ẋ = u definamos la superficie s(t) = x(t). Consideremos una ley


de control de la forma:
 +
u = −1 if s(t) > 0
u = ẋ = −sgn(x) =
u− = +1 if s(t) < 0

donde sgn(.) es la función signo definida como:

sgn(x) = +1 if x > 0

sgn(x) = −1 if x < 0
5.1 Control Deslizante para Sistemas de una Entrada 123

La figura 5.2 muestra las trayectorias del sistema x(t) = −t y x(t) = t originadas
por la ley de control u+ y u− respectivamente. La superficie s(t) = x(t) = 0 es
una superficie de deslizamiento porque satisface la condición (5.6) para η ≤ 1. Tal
superficie será golpeada por alguna trayectoria de estado del sistema en estudio en
un tiempo (5.7).
x

s=0

Figura 5.2: La superficie de deslizamiento s(t) = 0, por ejemplo 5.1.


5.1.2. Control deslizante para Sistemas de la Forma x(n) = fi + u
Considere el sistema de orden n:
dxn 
x(n) = = fi + u (5.9)
dtn
i

donde el escalar x es la salida de interés del sistema, el escalar u es la entrada de


control, x = [x ẋ x(2) . . . x(n) ] es le vector de estados, y fi es una función no
conocida exactamente, pero si estimada como fi . El error de estimación (o incer-
tidumbre) correspondiente a fi se define como ∆fi = |fi − fi | y se asume que es
acotado por alguna función conocida Fi = Fi (x) como sigue:

∆fi = |fi − fi | ≤ Fi (5.10)

Con el fin de lograr perfecto seguimiento, es decir, x(t) = xd (t), necesitamos definir


una nueva superficie de deslizamiento s = 0 de conformidad con (5.4), como sigue:

s = (p + λ)(n−1) x
% = x(n−1) − xr(n−1) (5.11)

Entonces: 
ṡ = x(n) − x(n)
r = fi + u − x(n)
r (5.12)
i

 la mejor aproximación de una ley de control continua para alcanzar ṡ = 0. Por


Sea u
consiguiente: 
=−
u fi + x(n)
r (5.13)
i

La ley de control estimada u es también conocida como la ley de control equivalente


Ley de control equivalente. Co la finalidad de satisfacer la condición de deslizamiento
124 Control Deslizante

(5.6) en la presencia de incertidumbres descrita por (5.10), necesitamos adicionar a


 un término discontinuo de la forma k(x)sgn(s) a través de s = 0, a saber:
u

 − k(x)sgn(s)
u=u (5.14)

La condición de deslizamiento (5.6) se verifica reemplazando (5.14) en (5.12), luego,


usando la expresión resultante en:
 
1 d 2  
s = ṡ s = (fi − fi ) − k sgn(s) s ≤ |fi − fi ||s| − k |s| (5.15)
2 dt
i i

Finalmente, sustituyendo:

k= Fi + η (5.16)
i

en (5.15) nos conduce a la condición de deslizamiento. (5.6).

Ejemplo 5.2

Considere un sistema descrito por:

ẍ + a1 |x|ẋ2 + a2 (t)ẋ2 cos 2x + a3 (t)x3 cos 3x = u

donde a1 = 2,1, a2 (t) y a3 (t) son desconocidas pero verifican que 2,5 < a2 (t) < 5 y
2 < a3 (t) < 4 respectivamente. Por consiguiente,

f1 = −a1 |x|ẋ2 f2 = −a2 (t)ẋ2 cos 2x f3 = −a3 x3 cos 3x

f1 = f1 f2 = −3,75ẋ2 cos 2x f3 = −3x3 cos 3x

F1 = 0 F2 = 1,25ẋ2 cos 2x F3 = x3 cos 3x

Desde que el orden del sistema es n = 2, entonces: s = (p + λ)% %̇ + λ%


x = x x. Por
consiguiente:

ṡ = ẍ − ẍd + λx
%̇ = fi + u − ẍd + λx

i

La ley de control equivalente es:



=−
u fi + ẍd − λx

i

La ley de control posee la forma u = u  − k sign(s) con k = F2 + F3 + η. La figura


5.3 muestra el resultado de la simulación obtenido ejecutando el archivo scexa.m con
λ = 10, η = 2,4, xd = sin(πt/2) y condiciones iniciales x(0) = 0 y ẋ(0) = π/2.
5.1 Control Deslizante para Sistemas de una Entrada 125

POSITION x(t)
1

−1

−2
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5

20
CONTROL INPUT u(t)
10

−10
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5

0.2
s(t)−TRAJECTORIES

0.1

−0.1

−0.2
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5
TIME (s)

Figura 5.3: Resultados de la simulación del ejemplo 5.2.

Suavizando La Ley de Control Discontinua u


Co el fin de eliminar una alta actividad de control por consideraciones prácticas,
el fenómeno chattering debe de evitarse suavizando la discontinuidad de la ley de
control, es decir, reemplazando en (5.14) el término sgn(s) por sat(s/Φ) como sigue:

 − k(x)sat(s/Φ)
u=u (5.17)

donde la función de saturación sat(.) se define como:

sat(s/Φ) = s/Φ if |s/Φ| ≤ 1


sat(s/Φ) = sign(s/Φ) otherwise (5.18)

y la frontera de Φ > 0 verifica:

|s(t)| ≤ Φ ∀ t≥0 (5.19)

En realidad, la frontera de Φ define una capa de frontera de atracción B(t) siempre


que la ley de control u satisfaga la condición de deslizamiento (5.6). En concordancia
con lo expuesto, B(t) resulta en un conjunto invariante (tener en cuenta que la su-
perficie de deslizamiento S(t) es también un conjunto invariante), es decir, todas las
trayectorias del sistema que se inician en el interior de B(t = 0) permanecen en B(t)
para todo t ≥ 0. La figura 5.4 ilustra la relación entre u y s en B(t).
Cuando Φ es variante con el tiempo, y al mismo tiempo B(t) pude permanecer
como un conjunto invariante, entonces necesitamos modificar la condición (5.6) de
modo tal que la distancia a la capa de frontera B(t) siempre sea decreciente, a saber:

d
s≥Φ → (s − Φ) ≤ −η
dt
d
s≤Φ → (s − (−Φ)) ≤ η
dt
126 Control Deslizante

^u

−φ φ
s
B(t)

Figura 5.4: Suavizando la ley de control en el interior de la capa de frontera B(t).

Therefore
1d 2
|s| ≥ Φ → s ≤ (Φ̇ − η)|s| (5.20)
2 dt
Para verificar (5.20), se requiere adicionar la cantidad −Φ̇ a la ganancia de control
discontinua k(x). La ganancia de control modificada k̄(x) es entonces:

k̄(x) = k(x) − Φ̇ (5.21)

consecuentemente, el control (5.17) toma la forma:

 − k̄(x)sat(s/Φ)
u=u (5.22)

En el interior de la capa de frontera B(t), sat(s/Φ) pasa a ser s/Φ. Sustituyendo


(5.22) con sat(s/Φ) ∼
= s/Φ en (5.12) produce:
 s 
ṡ = fi + u − x(n)
r = −k̄(x) − ∆fi (5.23)
Φ
i i

donde ∆fi = fi − fi . Usando el hecho de que: x = x̃ + xd , entonces (5.23) se puede


reescribir como:
s
ṡ = − k̄(xd ) − T (∆fi (xd ), x̃, xd ) (5.24)
Φ
donde T (∆f (xd ), x̃, xd ) representa todos los otros términos dependientes de x̃ y xd .
Por otra parte, definamos el ancho de banda λ (recordar que λ es la frecuencia de
corte del filtro (5.4)) como sigue:

k̄(xd )
λ= (5.25)
Φ
Reemplazando (5.25) en (5.24) se obtiene:
1
s= (−T (∆fi (xd ), x̃, xd )) (5.26)
p+λ
Sabemos que la variable s es una medida de la distancia algebraica a la superficie de
deslizamiento S(t) y, de acuerdo a (5.26), constituye la salida de un filtro de primer
5.1 Control Deslizante para Sistemas de una Entrada 127

orden filter, cuya dinámica (p + λ) depende de xd (ver (5.25)), y cuyas entradas son
perturbaciones e incertidumbres. Por consiguiente, tal filtro puede librar al sistema
del fenómeno chattering.
La estructura del error dinámico a lazo cerrado cuando Φ = Φ(t) se muestra
en la figura 5.5, donde el primer filtro se diseña de acuerdo a (5.26) para eliminar
perturbaciones e incertidumbres, de modo tal que el segundo filtro pasa bajo, de
acuerdo a la definición (5.4) pueda proporcionar el error de seguimiento x̃. De (5.25)
podemos deducir que el espesor Φ de la capa de frontera requiere ser sintonizada tal
que (5.26) pueda representar un filtro de primer orden con ancho de banda λ. Ahora,
~
T(∆f (x d ),x~ , x d ) 1 s 1 x
(p + λ) (p + λ)
n-1

Figura 5.5: Estructura del error dinámico a lazo cerrado para Φ = Φ(t).

reemplazando (5.25) en (5.21) nos conduce a:

Φ̇ + λΦ = k(xd ) (5.27)

Claramente, la ecuación (5.27) representa la dinámica deseada del espesor Φ de la


capa de frontera. Dado que la selección de Φ afecta el ancho de banda λ (por cierto,
ver la figura 5.5), la ecuación (5.25) será denominada la condición de balance. De
hecho, λ requiere ser sintonizado de modo tal que la dinámica del filtro de orden n:
x̃ 1
=
s (p + λ)n

se comporte como un sistema de orden n crı́ticamente amortiguado. Ahora, usando


(5.27) en (5.21), k̄(x) se obtiene:

k̄(x) = k(x) − k(xd ) + λΦ (5.28)

De acuerdo a (5.4), x̃ es una versión filtrada de s. Sin embargo, la trayectoria


s, es decir, s = s(t) representa más que ello. En realidad, s(t) se puede considerar
como un descriptor del comportamiento a lazo cerrado del sistema, en vista de que la
actividad de control regulada por la ley de control depende de s (ver (5.22) y (5.14)).
(n−1)
En adición, de acuerdo a (5.4), s(t) = x(n−1) − xr , donde xrn−1 es una función que
se puede computar de x y xd . Por consiguiente, s(t) es una representación dinámica
de las suposiciones relacionadas con las imprecisiones del modelo.

Ejemplo 5.3

Considere nuevamente el ejemplo 5.2 con un espesor de la capa de frontera φ(t)


variante con el tiempo. Entonces, la ley de control u = u  − k sign(s) requiere ser
reemplazada por u = u − k̄(x) sat(s/φ) con k̄(x) = k(x)−k(xd )+λφ y φ̇+λφ = k(xd ),
en donde:
k(xd ) = 1,25ẋ2d |cos 2xd | + |x3d cos 3xd | + η
128 Control Deslizante

La figura 5.6 muestra los resultados de la simulación obtenidos ejecutando el archivo


scexc.m para λ = 10, η = 2,4, xd = sin(πt/2) y las condiciones iniciales x(0) = 0,
ẋ(0) = π/2 y φ(0) = 0,55. El valor 0.365 se obtuvo usando la relación φ̇ + λφ = k(xd )
for t = 0.
2

POSITION x(t)
1

−1
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5

20
CONTROL INPUT u(t)

10

−10
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5

1
s(t)−TRAJECTORIES

a
0.5

0
b
−0.5
c
−1
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5
TIME (s)

Figura 5.6: Resultados de la simulación para el ejemplo 5.3. Las trayectorias a, b y c


corresponden a φ(t), s(t) y −φ(t) respectivamente.

Control Integral
t
Let 0 x̃(q)dq instead of x̃ be the variable of interest in the surface (5.4). Therefore,
the process (5.9) turns into a nth -order process with respect to the variable of interest,
namely
 t
d
s(x, t) = ( + λ) n
x̃(q)dq = (p + λ)n x̃ = x(n−1) − xr(n−1) (5.29)
dt 0

Since equations (5.29) and (5.11) possess the same form, then relations (5.14) and
(n−1)
(5.16) remain unchanged. Note that the term xr in (5.29) contains the variable
of interest.

IN PROGRESS


5.1.3. Control Deslizante para Sistemas de la Forma x(n) = fi + bu
Considere ahora el sistema de orden n:
dxn 
x(n) = = fi + bu (5.30)
dtn
i

donde el escalar x es la salida de interés del sistema, el escalar u es la entrada de


control y la función fi no es exactamente conocida, pero si estimada como fi y
5.1 Control Deslizante para Sistemas de una Entrada 129

con incertidumbre dada en (5.10). La ganancia de la ley de control b = b(x, t) es


desconocida pero con umbrales (o cotas) conocidos:

0 < bmin ≤ b ≤ bmax (5.31)

Recordar que |fi − fi | es una incertidumbre tipo aditivo. Dado que la ganancia de
control b multiplica la entrada de control u, parece entonces razonable definir un
estimado de tipo multiplicativo b:
b = (bmin bmax )1/2 (5.32)

Es fácil verificar que los lı́mites (5.31) toman la forma:


b b
β −1 ≤ ≤β β −1 ≤ ≤β (5.33)
b b
donde:
β = (bmax /bmin )1/2 (5.34)
Con el propósito de conseguir un seguimiento perfecto, es decir que x(t) = xd (t),
debemos usar la superficie de deslizamiento s = 0 descrita en (5.4) o (5.11):

s = (p + λ)(n−1) x̃ = x(n−1) − xr(n−1)

Entonces: 
ṡ = x(n) − x(n)
r = fi + bu − x(n)
r (5.35)
i
b el control equivalente que puede lograr que ṡ = 0; por consiguiente:
Sea u

b = b−1 ( −
u fi + x(n) −1 
r )= b u (5.36)
i
 (n)
=−
donde u fi + xr (ver ecuación (5.13)). Con u definida como:

u = b−1 (
u − k sgn(s)) (5.37)

el lı́mite:

k≥β Fi + η + |β − 1||
u| β = b b−1 (5.38)
i
satisface la condición de deslizamiento (5.6). Para demostrar este hecho, reemplazar
(5.37) en (5.35):
 
ṡ = fi − b b−1 fi − (1 − b b−1 )x(n) −1
r − b b k sgn(s)
i i
  
= (fi − fi ) + fi − b b−1 fi − (1 − b b−1 )x(n) −1
r − b b k sgn(s)
i i i

= (fi − fi ) − (1 − β −1
u − β −1 k sign(s)
) (5.39)
i

Sustituyendo (5.38) en (5.39), entonces multiplicando ambos miembros de la relación


resultante por s y usando el hecho de que s sign(s) = |s|, se puede fácilmente de-
mostrar que ṡs ≤ −η|s| (la condición de deslizamiento).
130 Control Deslizante

Ejemplo 5.4

El modelo dinámico del sistema MRAF mostrado en la figura ?? y dado por (??) se
puede reformular con x = θ como:
4

x(3) = fi + bu = −a1 ẍ − a2 ẋ − a3 cos x ẋ − a4 sin x + bu (5.40)
i=1

donde:
Beq Ra nKb Ra Beq meq gL
a1 = + a2 = + a3 =
Jeq nKm La Jeq La nKm La Jeq Jeq
meq gL Ka
a4 = b=
nKm Jeq La Jeq La

IN PROGRESS

Suavizando la Ley de Control Discontinua u


Se sabe del la subsección 5.1.2 que el fenómeno de chattering se puede elimi-
nar suavizando la discontinuidad del control como sigue. Reemplazando en (5.37) el
término sgn(s) por sat(s/Φ), se obtiene:

u = b−1 (
u − k(x)sat(s/Φ)) (5.41)

donde la función de saturación sat(.) fue definida en (5.18). Con el objeto de verificar
(5.20) para el caso β = 0 en la ganancia de control, la ganancia de control modificada
k̄(x) dada en (5.42) necesita ser reformulada como (ver problema 5.1):

Φ̇ > 0 → k̄(x) − Φ̇/β


Φ̇ < 0 → k̄(x) − β Φ̇ (5.42)

La condición de balance (5.25) se puede modificar como:


   
b(xd ) k̄(xd ) k̄(xd )
λ= = βd (5.43)
b(xd ) Φ Φ
max

con una condición inicial definida por:

Φ(0) = βd k(xd (0))/λ (5.44)

Sustituyendo (5.43) en (5.42) con x y β reemplazado por xd y βd respectivamente,


produce el comportamiento deseado de Φ̇, a saber:

λΦ
Φ̇ > 0 → = k̄(x) − Φ̇/βd
βd
λΦ
Φ̇ < 0 → = k̄(x) − βd Φ̇ (5.45)
βd
5.2 Control Deslizante para Sistemas Multivariables 131

Es fácil verificar que (5.45) se puede reescribir como:

λΦ
k̄(xd ) ≥ → Φ̇ + λΦ = βd (xd )
βd
λΦ λΦ
k̄(xd ) ≤ → Φ̇ + = βd (xd ) (5.46)
βd βd2

Finalmente, o bien la ecuación (5.28) o (5.21) se puede reformular como:

λΦ
k̄(x) = (k̄(x) − k̄(xd )) + k̄(xd ) = k(x) − k(xd ) + (5.47)
βd

Ejemplo 5.5

IN PROGRESS

5.1.4. Rendimiento del Seguimiento vs. Errores de Modelado


Se estipuló que ∀ t ≥ 0, |s(t)| ≤ Φ, donde la frontera de Φ es realmente el
espesor de la capa de fontera. Por consiguiente, (5.4) se convierte en la siguiente
relación acotada:
|(p + λ)n−1 x̃| ≤ Φ (5.48)
donde λ es una constante positiva conocida como el ancho de banda. Una aproxi-
mación razonable para determinar el lı́mite del error de seguimiento |x̃| es fijar p = 0
en (5.48), lo cual corresponde al comportamiento en estado estable de tal lı́mite. Por
consiguiente:
Φ
|x̃| ≤ n−1 = ε (5.49)
λ
donde ε es conocido como la precisión del seguimiento. Empleando (5.49) en la condi-
ción de balance (5.43) implica que:

λn ε ≈ βd k(xd )
bandwidthn × tracking precision ≈ parametric uncertainty along xd

5.2. Control Deslizante para Sistemas Multivariables


5.2.1. El Sistema a Controlar
Esta sección sigue el procedimiento desarrollado en [25]. La representación
dinámica del sistema no lineal multivariable, el modelo de Lagrange, está dado por
(1.143):
M(q)q̈ + P(q, q̇)q̇ + d(q) = u (5.50)
donde q es un m × 1 vector de coordenadas generalizadas, M(q) es una matriz
de inercia definida positiva de orden m × m, P(q, q̇) es una matriz de orden m ×
m que representa las fuerzas de Coriolis y centrı́peta, d(q) es un vector de orden
m × 1 que representa las fuerzas gravitacionales y u es un vector de orden m × 1
de fuerzas generalizadas. El vector de estado correspondiente a (5.50) posee la forma
x = [q q̇]T . Sean qdi (t) y q̇di (t) para i = 1, . . . , m las trayectorias deseadas, las
132 Control Deslizante

cuales se suponen ser funciones del tiempo continuamente diferenciables. Los vectores
de error se definen como:

%(t) = q − qdi
q %̇ = q̇ − q̇di
q(t)

o lo que es lo mismo empleando sus componentes:

q%i (t) = qi (t) − qdi (t) q%̇i (t) = q̇i (t) − q̇di (t)

5.2.2. La Superficie de Conmutación


Sea la siguiente superficie de conmutación:

si (x, t) = si (q, q̇, t) = %i (t)


ii q + q%̇i (t) i = 1, . . . , m (5.51)

o en forma matricial:
%̇ =
s(x, t) = s(q, q̇, t) = Lq̃ + q (5.52)
        
s1 (x, t) s1 (q, q̇, t) 11 · · · 0 q%1 q%̇1
 ..   ..   .. . . ..   ..  +  .. 
 . = . = . . .  .   . 
sm (x, t) sm (q, q̇, t) 0 · · · mm q%m q%̇m
donde las constantes positivas ii son los elementos de una matriz diagonal L de
orden m × m. Asumiendo que una fuerza de control diseñada es capaz de confinar
todas las trayectorias que se originan en la intersección de tales superficies y hacerlas
permanecer allı́, entonces en tal situación se cumple, de acuerdo a 5.51, que:

si (q, q̇, t) = 0 = %i (t)


ii q + q%̇i (t) i = 1, . . . , m

Esta última relación nos indica que q̃i (t) y q̃˙ i (t) deben converger exponencialmente a
cero, esto es:

q̃i (t) = qi (t) − qdi (t) = 0 q̃˙ i (t) = q̇i (t) − q̇di (t) = 0

Por consiguiente: qi (t) = qdi (t) y q̇i (t) = q̇di (t), con lo cual se logra el objetivo de
control.

5.2.3. Diseño de la Fuerza de Control Multivariable


El diseño de la fuerza o ley de control requerida para confinar las trayectorias del
sistema que se originan en la intersección de las superficies de deslizamiento y hacerlas
permanecer allı́ emplea el método directo de Lyapunov. Omitiendo por simplicidad
la dependencia de los argumentos, consideremos la siguiente candidata para función
de Lyapunov:
1
V = sT Ms
2
Definamos ahora la siguiente ley de control:

u = u0 − Usgn(s) (5.53)
5.2 Control Deslizante para Sistemas Multivariables 133

   +   +  
u1 u1 − u−
1 u1 + u− 1 ··· 0 sign(s1 )
 ..  1  ..  1 .. .. ..  .. 
 . =  . −  . . .  . 
2 + −
2 + −
um um − um 0 · · · um − um sign(sm )
o en función de sus elementos:
1 + 1 +
u0i = ui + u−
i Ui = ui − u−
i
2 2
La derivada de s (ecuación 5.52) produce:

%̇ + q
ṡ = Lq %̈ = Lq
%̇ + (q̈ − q̈d )

Despejando q̈ de (5.50) y reemplazando la expresión resultante en la ecuación anterior


se obtiene:
ṡ = M−1 (u0 − U sgn(s) − ueq )
donde:
%̇ + Pq̇ + d + Mq̈d
ueq = −MLq
Por consiguiente:
1 T 1
V̇ = sT Mṡ + s Ṁs = sT [u0 − Usgn(s) − ueq ] + sT Ṁs (5.54)
2 2
En la referencia [24] se establece que:
1' (
P= Ṁ − J (5.55)
2
donde J es una matriz antisimétrica, es decir: J = −JT . Empleando (5.55) en (5.54)
nos conduce a:
1
V̇ = sT [u0 − Usgn(s) + Ps − ueq ] + sT Js
2
Dado que sT Js = 0 debido a que J es antisimétrica, entonces:

m 
m
V̇ = sT [u0 + Ps − ueq ] − sT Usgn(s) = sj [u0 + Ps − ueq ]j − Ui |sj |
j=1 j=1

m 
m
≤ |sj [u0 + Ps − ueq ]j | − Ui |sj | (5.56)
j=1 j=1

Seleccionando:
Ui ≤ |[u0 + Ps − ueq ]j | + ε ε>0 (5.57)
y reemplazando esta última expresión en (5.56) se obtiene:

m
V̇ ≤ −ε |sj | ε>0
j=1

lo que significa que se ha cumplido la condición de deslizamiento y a la vez se garantiza


˙
que q̃(t) y q̃(t) convergen exponencialmente a cero. Partiendo de la desigualdad (5.57)
se obtienen otras dos:

[u0 + Ps − ueq ]i ≤ Ui − ε [u0 + Ps − ueq ]i ≥ −(Ui − ε) (5.58)


134 Control Deslizante

Usando (5.58), es fácil demostrar que:

u− +
i + ε ≤ [ueq − Ps]i ≤ ui − ε (5.59)

Por consiguiente, los controles u− +


i y ui se pueden seleccionar para satisfacer (5.59).
Si ûeq y P̂ son los estimados de u y P respectivamente, podemos formular:
)
u+ = [
u eq −  i + ū+
Ps]
i i i = 1, . . . , m (5.60)
u−  i + ū−
ueq − Ps]
i = [ i

Reemplazando (5.60) en (5.59) se obtiene:

ū− +
i + ε ≤ [ūeq − P̄ s]i ≤ ūi − ε (5.61)

 eq
ūeq = ueq − u 
P̄ = P − P
lo cual verifique (5.59). Si seleccionamos ū− +
i = Ki y ūi = − Ki , entonces de (5.60)
obtenemos:
1  i
u0i = (u+ + u−
i ) = [ueq − Ps] Ui = Ki
2 i
o lo que es lo mismo, en forma matricial:
 + 
u1 + u− 1
1 ..  
u0 =  . =u  eq − Ps
2
u+m + um

 +   
u1 − u− 1 ··· 0 K1 · · · 0
1 .. .. ..   .. . . .. 
U =  . . . = . . .  (5.62)
2 + −
0 · · · um − um 0 · · · Km

Asumiendo que el término gravitacional se puede expresar como:

d=u 
 eq − Ps (5.63)

entonces la ley de control dada por (5.53) toma la forma:


 
K1 · · · 0
 ..  sgn(s)
u = u0 − Usign(s) = d −  ... . . . .  (5.64)
0 · · · Km

y la relación (5.61) con ū− +


i = Ki y ūi = −Ki se expresa como:

Ki ≥ [ueq − Ps − d]i + ε

Ahora, dado que ueq − Ps = −MLq̃˙ + Pq̇ + d + Mq̇d − Ps, entonces las ganancias
Ki se pueden seleccionar siempre que:

Ki ≥ |(−M Lq̃˙ + P q̇ + M q̇d − P s)i | + ε (5.65)

en donde M and P son las cotas superiores de M y P respectivamente.


5.2 Control Deslizante para Sistemas Multivariables 135

Ejemplo 5.6 Design and Simulation of a Sliding Control for the Process
TRM
The elements of the matrices M and P given by (1.113) may be upper-bounded as
|M11 | ≤ m11  M 11 |M12 | ≤ m12  M 12 |M21 | ≤ m21  M 21
|M22 | ≤ m22  M 22 |P11 | ≤ p11  P 11 |P12 | ≤ |p12 θ̇1 |  |P 12 |
|P21 | = 0  P 21 |P22 | ≤ m22  P 22
Using (5.65), the variable Ki is computed from
2

Ki = (M ij |q̈dj − jj q̃ j |
˙ + P ij |q̇j − sj |) + ε
j=1

where q1 is the car position r and q2 is the angular position θ1 of the arm. The
switching control force given by (5.64) is found to be
     
u1 0 K1 sgn(s1 )
= −
u2 d2 sin θ1 K2 sgn(s2 )
in which d2 was found in (1.113).
The simulation of the sliding control system was performed for the following
initial conditions: r(0) = 0 m, θ1 (0) = −π/2 rad. The desired trajectories are set
to: rd (t) = 1 m and θd1 (t) = π4 cos(2πt) rad. The parameter ε takes on the value of
0.1 while the gripper carries out a payload of 0.2 kg of mass. Figure 5.7 depicts the
simulation results. Such results can be obtained executing the m-file trmsc.m.
Ejemplo 5.7 Design and Simulation of a Sliding Control for the Process
SRM
The elements of matrices M and P given by (1.143) can be upper-bounded as
follows
|M11 | ≤ RT 1 (Jeq1 + 2I1 + H22 )  M 11 |M12 | = 0  M̄12
|M21 | = 0  M̄21 |M22 | ≤ RT 2 (Jeq2 + H22 )  M 22
|P11 | ≤ |RT 1 (Beq1 − H22 q̇2 ) + NT 1 |  P 11 |P12 | ≤ |RT 1 H22 q̇1 |  P 12
|p21 | ≤ |RT 2 H22 q̇1 |  P̄21 |P22 | ≤ RT 2 Beq2 + NT 2  P 22
Using (5.65), the variable Ki can be computed from
2

Ki = (M ij |q̈dj − %̇j |
jj q + P ij |q̇j − sj |) + ε
j=1

The switching control force given by (5.53) (see also (1.143))is found to be
     
u1 0 K1 sat(s1 /φ)
= −
u2 RT 2 m2 g Lx2 cos q2 ) K2 sat(s2 /phi)
where φ = 0.5. The simulation of the sliding control system was performed for the
following initial conditions: q1 (0) = q2 (0) = 0,1 rad. The desired trajectories are:
qd1 (t) = 0.1745 rad and qd2 (t) = (0,1745/2)t2 rad. The parameter ε takes on the
value of 0.2 while the gripper carries out a payload of 0.2 kg of mass.
Figure 5.8 shows the simulation results. Such results can be obtained executing
the m-file srmsc.m.
136 Control Deslizante

1.5 5

LINK POSITION (rad)


CART POSITION (M)

1 0

0.5 −5

0 −10
0 2 4 6 8 10 0 2 4 6 8 10
Entradas
CONTROL VOLTAGE u1

CONTROL VOLTAGE u2
5 4

0 0

−2

−5 −4
0 2 4 6 8 10 0 2 4 6 8 10

5 5
SURFACE s1

SURFACE s2

0 0

−5 −5

−10 −10
0 2 4 6 8 10 0 2 4 6 8 10
TIME (seconds) TIME (seconds)

Figura 5.7: Simulation results corresponding to the example 5.6.

PROBLEMS
Problema 5.1

Verify relations ... IN PROGRESS


5.2 Control Deslizante para Sistemas Multivariables 137

1.5 0.18
POSITION q1 (rad)

POSITION q2 (rad)
0.16
1
0.14
0.5
0.12

0 0.1
0 1 2 3 4 0 1 2 3 4

0.02 0.04
Control u1 (V)

Control u2 (V)

0 0.03

−0.02 0.02

−0.04 0.01

−0.06 0
0 1 2 3 4 0 1 2 3 4

0.3 0.05
SURFACE s1

SURFACE s2

0.2 0

0.1 −0.05

0 −0.1

−0.1 −0.15
0 1 2 3 4 0 1 2 3 4
TIME (seconds) TIME (seconds)

Figura 5.8: Simulation results corresponding to the example 5.7.


Bibliografı́a

[1] H. Goldstain, Mecánica Clásica, segunda edición. Editorial Reverté, S.A., 1996,
ISBN: 84-291-4306-8

[2] , Dinámica de Lagrange. McGraw-Hill de México, S.A., 1972

[3] Jean-Jacques E. Slotine and Weiping Li, Applied Nonlinear Control, Prentice
Hall, Englewood Cliffs, New Jersey 07632, 1991.

[4] K. S. Fu, R. C. Gonzáles, and C. S. G. Lee, “Dinámica del Brazo


del Robot,” Robótica, Control,Detección, Visión e Inteligencia, McGraw-
Hill/Interamericana, Madrid, 1988.

[5] R. P. Paul, “Dynamics,” Robot Manipulators, Mathematics, Programming and


Control, The MIT Press, Massachussets, 1982.

[6] J. J. Craig, “Manipulator Dynamics,” Introduction to Robotics, Addisson Wesley,


2nd edition, 1989.

[7] Mohsen Shahinpoor, A Robot Engineering Textbook, Harper & Row, Publishers,
New York, Cambridge, Philadelphia, and others, 1987.

[8] V. I. Utkin, “Variable structure systems with sliding modes,” IEEE Trans. Au-
tomat. Contr., vol. 22, pp. 2-22, Feb. 1993.

[9] J. Y. Hung, W. Gao, and A. Homaifa, “Variable structure control: a survey,”


IEEE Trans. Ind. Electron., vol. 42, pp. 212-222, Feb. 1986.

[10] M. Vidyasagar, Nonlinear Systems Analysis (Second Edition), Prentice Hall,


Englewood Cliffs, New Jersey 07632, 1993.

[11] Alberto Isidori, Nonlinear Control Systems (Second Edition), Springer-Verlag


Berlin Heidelberg New York London Paris Tokyo Hong Kong, 1989.

[12] M. G. Sofonov, Stability and Robustness of Multivariable Feedback Systems, The


MIT Press Cambridge, MA, and London, England, 1980.

[13] Katsuhiko Ogata, Designing Linear Control Systems with MATLAB, Prentice
Hall, Englewood Cliffs, New Jersey 07632, 1944.

[14] Bernard Friedland, Control System Design. An Introduction to State-Space


Methods, McGraw-Hill, Inc., New York St. Louis y otras, 1986.
140 BIBLIOGRAFÍA

[15] A. M. Lyapunov, Probléme géneral de la stabilité du mouvement. Reprinted in


Annals of Mathematics Study No. 17 (Princeton Univ. Press, Princeton, New
Jersey) of the 1907 French translation of the fundamental Russian paper by
Lyapunov, published in 1892. 1980.

[16] Joseph La Salle and Solomon Lefschetz, Stability by Liapunov’s Direct Method
With Applications, Academic Press new York, London, 1961.

[17] I. Gustavsson, “Comparison of different methods for identification of linear mod-


els for industrial processes,” in Preprints IFAC Symp. on Identif., 1970, paper
11.4.

[18] G. N. Saridis, “Comparison of five popular identification algorithms,” Automat-


ica, vol. 10, no. 1, pp. 69–79, Jan. 1974.

[19] B. D. O. Anderson, “Exponential stability of linear systems arising from adaptive


identification,” IEEE Trans. on Auto. Contr., 22-2 (1977).

[20] A. P. Morgan and K. S. Narendra, “On the uniform asymptotic stability of


certain linear nonautonomous differential equations,” S.I.A.M. of Control and
Optimization, 15 (1977).

[21] Olle I. Elgerd, Control Systems Theory, McGraw-Hill Kogakusha, Ltd., Tokyo,
Auckland, Dusseldorf, and others, 1967.

[22] A. Barrientos, L. F. Peñin, C. Balaguer, and R. Aracil, Fundamentos de Robótica,


McGraw-Hill/Interamericana de España, S. A., Madrid, Buenos aires, Caracas,
and others, 1997.

[23] A. F. Filippov, “Differential Eequations with discontinuous right-hand sides,”


Mathematicheskii Sbornik, 51.1 (1960), in Russian. Trnaslated in English, Aw.
Math. Soc. Trans., 62, 199 (1964). Addisson Wesley, 2nd edition, 1989.

[24] D. E. Koditschek, Proc. 23rd I.E.E.E. Conf. on Decision and Control, Las Vegas,
p. 733, 1984.

[25] E. Bailey and A. Arapostathis, “Simple sliding mode control scheme applied to
robot manipulators,” Int. J. Control, 1987, vol. 45, No. 4, p. 1197–1209.

[26] Lab-PC+ User Manual, National Instruments Corporation, Part Number


320502B-01, August 1994.

[27] Eduardo F. Camacho y Carlos Bordons, Model Predictive Control, Springer-


Verlag London Limited 1999.

[28] D.M. Prett and M. Morari, “Shell Process Control Workshop,”Butterworths,


1987.

[29] T. Alvarez, M. Sanzo, and C. Prada, “Identification and Constrained Multivaria-


ble Predictive Control of Chemical Reactors,”4th IEEE Conference on Control
Applications, Albany, pages 21:577-582, 1977.
BIBLIOGRAFÍA 141

[30] Manfred Morari y Evanghelos Zafiriou, Robust Process Control. PTR Prentice
Hall, Englewood Cliffs, New Jersey 07632, 1989.

[31] William H. Press, Brian P. Flannery y Saul A. Teukolosky, Numerical Recipes


in C, Cambridge University Press, Cambridge, 1988.

[32] MathWorks, Inc., MATLAB Reference Guide, Prentice Hall, Englewood Cliffs,
New Jersey, primera edición, 1998.

[33] MathWorks, Inc., SIMULINK User’s Guide, Prentice Hall, Englewood Cliffs,
New Jersey, primera edición, 1996.

[34] R. De Keyser, “A Gentle Introduction to Model Based Predictive Control”. In


PADI2 International Conference on Control Engineering and Signal Processing,
Piura, Perú, 1998.

[35] A. Rojas-Moreno, Design of Self-tuning Controllers for Processes Having Multi-


ple Unknown Time-varying Delays, Ph.D. Thesis, Utah State University, Logan,
UT, 1995.
Índice alfabético

Autonomous system, 68 Función lagrangiana, 2

Balance condition, 112, 115 Instability theorem, 73, 74


Invariant set, 107
CGEKF: Constant-Gain Extended Kalman Invariant set theorems, 75
Filter, 61 Involutive vector fields, 89
Chattering, 108
Complete (global) stability, 73 Kalman filter gain, 61
Composite adaptation
for MIMO processes, 84 Lagrange–Euler
Control law procedure, 5
the MIMO decoupling , 96 Lie brackets, 88
the SISO linearizing, 92 Lie derivatives, 87
Controllability LQG: Linear quadratic gaussian prob-
condition, 57, 90 lem, 55
generalized condition, 90 Lyapunov equation, 60, 62
matrix, 57, 90 Lyapunov function, 78
Coordenadas generalizadas, 1 Lyapunov’s
Covariance matrices, 61 first method, 68
second or direct method, 68
Diffeomorphism, 88 stability theorems, 72
Differential geometry, 87 Lyapunov,s
functions, 69
Ecuaciones de Lagrange, 1, 2
del proceso MRT, 12, 15 Método de Lagrange–Euler, 2
El modelo de Lagrange, 9 Manipulador robótico traslacional sub-
Equilibrium state, 68 actuado, 27
Equivalent control, 109, 117 Manipulador robótico con articulación
Equivalent linear system, 92, 97 elástica, 7
characteristic equation, 92, 97 Manipulador robótico esférico, 18
Exact linearization Manipulador robótico esférico subactu-
of MIMO processes, 94 ado (MRTS).–, 28
of SISO processes, 91 Manipulador Robótico Translacional, 12
Matriz de inercia del eslabón, 6, 21
Feedback linearization, 87 Matriz de transformación homogénea,
of MIMO processes, 93 18
of SISO processes, 90 Matriz de transformación homogénea
partial, 102 de Denavit–Hartenberg, 4
Frobenius Theorem, 89 Matriz simétrica inercial de aceleración,
Frobenius-Perron theorem, 119 6, 22
ÍNDICE ALFABÉTICO 143

MIMO normal form, 94 undefined, 91


Modelo de Lagrange, 7, 23 Riccati equation, 58, 59, 61
del MRTS, 28
del proceso MRT, 17 SFC: State-Feedback Controller, 57
Modelo de Lagrange–Euler, 7, 23 SISO normal form, 91
Modelo en el espacio de estado for relative degree r < n, 102
del MRAE, 10 Sistema de coordenadas D–H (Denavit–
del MRE, 25, 26 Hartenberg), 3
Modelo L–E, 7 Sliding
Modelo L–E del MRE, 18 condition, 107, 111, 118
MRACS: Model-reference adaptive con- control, 105
trol system mode, 107, 117
configuration, 67 surface, 107, 109, 114, 117, 118
the adaptation mechanism, 68 surface vector, 80
the controller, 68 Smoothness, 87
the reference model, 67 Stability
in autonomous systems, 72
Nonautonomous system, 68 in nonautonomous systems, 73
Nonlinear observer in the sense of Lyapunov, 69
characteristic equation of the, 99, Stability margins
100 and nondivergency for the NSO, 62
Nonlinear observer:with prescribed poles, and Robustness for LQSFC, 60
98, 99 by state-feedback, 59
NSO: Nonlinear State Observer, 60 State-feedback gain matrix, 58, 59
Surface equation, 114
Observability
condition, 61 Tracking error, 77, 106
matrix, 61
Unmodeled dynamics, 68, 105
Observability matrix, 98
generalized, 98, 99 Variable structure, 117
Variable Structure Control, 105
Parámetros D–H (Denavit–Hartenberg), Vector Coriolis y fuerza centrı́fuga, 7
3 Vector fuerza de Coriolis y centrı́peta,
Parámetros de Denavit–Hartenberg, 18 22
Parametric uncertainties, 68, 105 Vector fuerza de gravedad, 7, 23
PISFC: Proportional-Integral State-Feedback
Controller, 59
Positive/negative definite functions, 70
Procedimiento de Denavit–Hartenberg,
2
PSFC: Proportional State-Feedback Con-
troller, 57

Quadratic cost function, 57


augmented, 59

Relative degree, 90, 102


total, 93, 96

También podría gustarte