0% encontró este documento útil (0 votos)

234 vistas153 páginas

A. Rojas M - 2

El documento aborda el control no lineal multivariable y sus aplicaciones en tiempo real, presentando técnicas de modelado y control óptimo. Se incluyen ejemplos prácticos con manipuladores robóticos y sistemas de control de tanques de agua, utilizando software como MATLAB y LabVIEW. Además, se discuten métodos de control adaptativo y deslizante, así como la implementación de sistemas en tiempo real.

Cargado por

henrymallqui

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

234 vistas153 páginas

A. Rojas M - 2

Cargado por

henrymallqui

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

CONTROL NO LINEAL

MULTIVARIABLE
APLICACIONES EN TIEMPO REAL

ARTURO ROJAS-MORENO, Ph.D.

Modelado de Procesos
Implementación en Tiempo Real
Control Óptimo Cuadrático
Control Adaptativo con Modelo Referencial
Linealización de la Realimentación
Control con Modos Deslizantes
Programas Fuente en MATLAB y LabVIEW
II

CONTROL NO LINEAL MULTIVARIABLE

APLICACIONES EN TIEMPO REAL

ISBN

Queda rigurosamente prohibida la reproducción total o parcial de esta obra por cualquier
medio o procedimiento, sin la autorización escrita del propietario del “Copyright”.
A la Memoria de mis Padres
Índice general

III

Prefacio VII

1. Modelado de Sistemas No Lineales 1

1.1. Modelado Empleando las Leyes de la Fı́sica . . . . . . . . . . . . . . . 1
1.1.1. Manipulador Robótico de 1GDL . . . . . . . . . . . . . . . . . 1
1.1.2. Manipulador Robótico con Articulación Elástica (MRAE) . . . 7
1.1.3. Sistema Péndulo Invertido–Grúa Puente . . . . . . . . . . . . . 11
1.1.4. Sistema Tanque de Agua . . . . . . . . . . . . . . . . . . . . . 19
1.2. Método de Las Ecuaciones de Lagrange . . . . . . . . . . . . . . . . . 24
1.2.1. Las Ecuaciones de Lagrange . . . . . . . . . . . . . . . . . . . . 24
1.2.2. Manipulador Robótico Traslacional (MRT) . . . . . . . . . . . 25
1.3. El Método de Lagrange–Euler . . . . . . . . . . . . . . . . . . . . . . . 32
1.3.1. El Procedimiento de Denavit–Hartenberg . . . . . . . . . . . . 32
1.3.2. El Procedimiento de Lagrange–Euler . . . . . . . . . . . . . . . 35
1.3.3. Manipulador Robótico Esférico (MRE) . . . . . . . . . . . . . . 37
1.4. PROBLEMAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
1.5. Estructura en Tiempo Real . . . . . . . . . . . . . . . . . . . . . . . . 59
1.6. Sistema de Control del Manipulador de 1GDL . . . . . . . . . . . . . . 59
1.6.1. Generación de la señal PWM . . . . . . . . . . . . . . . . . . . 60
1.6.2. El Ampliﬁcador de Potencia . . . . . . . . . . . . . . . . . . . . 62
1.7. Sistema de Control de Manipuladores de 2 y 3GDL . . . . . . . . . . . 64
1.8. El Sistema de Control del Tanque . . . . . . . . . . . . . . . . . . . . . 65

2. Control Óptimo 67
2.1. Conﬁguración del Sistema de Control Óptimo . . . . . . . . . . . . . . 67
2.2. El Sistema Dinámico No Lineal Multivariable . . . . . . . . . . . . . . 68
2.3. El Controlador PI de Realimentación de Estados . . . . . . . . . . . . 69
2.4. El Observador No Lineal Multivariable . . . . . . . . . . . . . . . . . . 72
2.5. Procedimiento de Diseño . . . . . . . . . . . . . . . . . . . . . . . . . . 73

3. Control Adaptativo con Modelo Referencial 79

3.1. Conﬁguración ode un SCAMR . . . . . . . . . . . . . . . . . . . . . . 79
3.2. Estabilidad vı́a el Método Directo de Lyapunov . . . . . . . . . . . . . 80
3.2.1. Conceptos de Estabilidad . . . . . . . . . . . . . . . . . . . . . 80
3.2.2. Funciones de Lyapunov . . . . . . . . . . . . . . . . . . . . . . 81
VI ÍNDICE GENERAL

3.2.3. Teoremas de Estabilidad de Lyapunov . . . . . . . . . . . . . . 85

3.2.4. Teoremas del Conjunto Invariante . . . . . . . . . . . . . . . . 87
3.3. SCAMR para Sistemas No Lineales de una Entrada . . . . . . . . . . 89
3.3.1. Formulación del Problema y de la Ley de Control . . . . . . . . 89
3.3.2. La Ley de Adaptación . . . . . . . . . . . . . . . . . . . . . . . 90
3.3.3. Zona–Muerta para Evitar Corrimiento de Parámetros . . . . . 91
3.4. SCAMR para Sistemas No Lineales Multivariables . . . . . . . . . . . 93

4. Linealización por Realimentación de Estados 101

4.1. Herramientas de la Geometrı́a Diferencial . . . . . . . . . . . . . . . . 101
4.1.1. Derivadas y Corchetes de Lie . . . . . . . . . . . . . . . . . . . 102
4.1.2. Difeomorﬁsmos y Transformación de Coordenadas . . . . . . . 103
4.1.3. El Teorema de Frobenius . . . . . . . . . . . . . . . . . . . . . 103
4.2. Linealización por Realimentación. Caso: SISO . . . . . . . . . . . . . . 104
4.2.1. Condiciones para Linealización . . . . . . . . . . . . . . . . . . 104
4.2.2. El Grado Relativo de un Sistema . . . . . . . . . . . . . . . . . 105
4.2.3. Forma Normal SISO con Linealización Exacta . . . . . . . . . . 106
4.2.4. La Ley de Control SISO para Linealización . . . . . . . . . . . 106
4.3. Linealización por Realimentación: Caso MIMO . . . . . . . . . . . . . 107
4.3.1. Modelando Sistemas MIMO Cuadrados . . . . . . . . . . . . . 107
4.3.2. Grado Relativo Total . . . . . . . . . . . . . . . . . . . . . . . . 108
4.3.3. Forma Normal MIMO para Linealización Exacta . . . . . . . . 109
4.3.4. La Ley de Control MIMO Desacoplada . . . . . . . . . . . . . . 111
4.4. Observadores No Lineales con Polos Prescritos . . . . . . . . . . . . . 112
4.4.1. Observador SISO No Lineal con Polos prescritos . . . . . . . . 113
4.4.2. Observadores MIMO No Lineales con Polos Prescritos . . . . . 114

5. Control Deslizante 119

5.1. Control Deslizante para Sistemas de una Entrada . . . . . . . . . . . . 120
5.1.1. Conceptos Básicos y Notación . . . . . . . . . . . . .
. . . . . . 120
(n)
5.1.2. Control deslizante para Sistemas de la Forma x = fi + u . 123
5.1.3. Control Deslizante para Sistemas de la Forma x(n) = fi + bu 128
5.1.4. Rendimiento del Seguimiento vs. Errores de Modelado . . . . . 131
5.2. Control Deslizante para Sistemas Multivariables . . . . . . . . . . . . . 131
5.2.1. El Sistema a Controlar . . . . . . . . . . . . . . . . . . . . . . . 131
5.2.2. La Superﬁcie de Conmutación . . . . . . . . . . . . . . . . . . . 132
5.2.3. Diseño de la Fuerza de Control Multivariable . . . . . . . . . . 132

. Bibliografı́a 139

. Índice alfabético 142

Prefacio

Esta publicación está dirigida a todos los profesionales, cientı́ﬁcos y especialistas

interesados en familiarizarse con el diseño e implementación de sistemas de control
no lineales multivariables operando en tiempo real.
Este libro presenta y discute la simulación e implementación en tiempo real de
varias configuraciones de sistemas de control no lineal con el propósito de validar los
procedimientos de diseño desarrollados en los capı́tulos correspondientes.
Los diversos estudios de simulación desarrollados en los capı́tulos se realizan em-
pleando el software MATLAB (usar versión 5.3 o recientes), mientras que el software
de adquisición de datos y control en tiempo real está escrito en código LabVIEW
versión 7.1. El CD adjunto contiene todos los archivos desarrollados en este libro.
Los programas escritos en código LabVIEW permiten sintonizar en lı́nea y en forma
interactiva los parámetros de los algoritmos de control, de modo tal que se pueda vi-
sualizar en tiempo real que el objetivo de control se cumple para cada caso, a saber,
que las señales de salida controladas sigan a las señales de referencia, cumpliendo las
especificaciones de diseño pre-establecidas.
Los procedimientos de diseño e implementación de los sistemas de control no
lineal desarrollados en este libro se pueden aplicar a una gran clase de procesos no
lineales, tales como brazos robóticos (manipuladores), aeronaves de alto rendimiento,
vehı́culos espaciales, procesos quı́micos, y otros. Al final de cada capı́tulo se propone
un conjunto de problemas relacionados con el modelado, simulación y diseño del
sistema de control para diversos procesos.
Este libro emplea procesos prototipo para ser controlados en tiempo real: ma-
nipuladores (de uno o más grados de libertad) y el sistema tanque de agua. En los
manipuladores el objetivo de control es que sus posiciones angulares sigan posiciones
angulares de referencia. Tales referencias pueden ser también variantes en el tiempo
(problema de seguimiento). En el caso del sistema tanque de agua, el objetivo de
control es que la temperatura y nivel del lı́quido en el tanque sigan a referencias
constantes.
Especı́ficamente, se controlarán en tiempo real los siguientes procesos (los cuales
pueden ser vistos en la parte videos del CD adjunto a este libro):

• Manipulador de un grado de libertad (1GDL).

• Manipulador esférico de 2GDL.
• Manipulador traslacional de 2GDL.
• Manipulador traslacional–esférico de 3GDL.
• Sistema tanque de agua
VIII Prefacio

Este libro está organizado en los capı́tulos siguientes:

Capı́tulo 1: Modelado de Procesos No Lineales. En este capı́tulo se de-

ducen los modelos matemáticos que representan la dinámica de los procesos a ser
controlados en tiempo real. Tales modelos matemáticos son necesarios para poder
estimar los parámetros y estados del proceso y formular las leyes de control no lineal.

Capı́tulo 2: Implementación en Tiempo Real. Este capı́tulo describe prin-

cipalmente las estructuras en hardware de los sistemas de control no lineal multivari-
ables implementados.

Chapter 3: Optimal Control. El sistema de control óptimo considerado com-

bina un proceso no lineal pero linealizable, un controlador de realimentación de es-
tados proporcional-integral y un observador no lineal para estimar los estados del
proceso. El objetivo del sistema de control óptimo es determinar una función de
fuerza capaz de minimizar la diferencia entre el vector de salida del proceso y el
vector de trayectorias deseadas, a pesar de la presencia de disturbios estocásticos e
incertidumbres en los parámetros del proceso.

Capı́tulo 4: Control Adaptativo con Modelo Referencial. Este sistema

de control no lineal se compone principalmente de cuatro partes: el modelo de refer-
encia, el controlador adaptativo, el proceso no lineal y el el mecanismo de adaptación.
El modelo de referencia es un modelo dinámico auxiliar empleado para especiﬁcar la
respuesta deseada del proceso, mientras que el mecanismo de adaptación es un con-
junto de bloques interconectados empleados para implementar la ley de adaptación,
la cual modiﬁca los parámetros del controlador adaptativo en forma tal que el sistema
de control adaptativo permanezca estable y que el error de seguimiento converja a
cero a pesar de que existan cambios reales en los parámetros del proceso y disturbios
externos. El método directo de Liapunov se emplea en este contexto para garantizar
estabilidad asintótica en el sistema diseñado.

Capı́tulo 5: Linealización de la Realimentación. Los métodos de la ge-

ometrı́a diferencial se pueden aplicar a procesos no lineales para determinar si tales
procesos son linealizables por realimentación; esto es, si la descripción dinámica de
un proceso en particular se puede hacer que parezca lineal después de de que se le
haya aplicado una transformación de coordenadas apropiada y una realimentación no
lineal de estados. Este capı́tulo presenta el método para llevar a cabo la linealización
de la realimentación con el propósito de diseñar una ley de control desacoplada. Un
observador no lineal con asignación de polos se emplea también para estimar los es-
tados del proceso.

Capı́tulo 6: Control con Modos Deslizantes. En un sistema de control con

modos deslizantes la descripción del proceso puede ser imprecisa. La metodologı́a
aplicada en este tipo de control incluye una ley de control de realimentación no lin-
eal que está conmutando en forma discontinua sobre una superﬁcie que pertenece
al espacio de estado del sistema. Si alguna trayectoria de estado originada en esta
IX

superﬁcie, en respuesta al comportamiento natural de la dinámica del sistema a lazo

abierto, se trata de desviar de la superficie especificada, entonces se deben aplicar
acciones de control para hacer retornar a dicha trayectoria a su estado anterior. Es
posible modificar la ley de control adecuadamente a fin de obtener acciones de control
más moderadas.

Arturo Rojas Moreno, Ph.D.

ctlima@[Link]
Capı́tulo 1

Modelado de Sistemas No
Lineales

En general, el problema de control no lineal consiste en obtener las ecuaciones que

gobiernan el sistema no lineal en la forma de un modelo dinámico que permita especificar
las leyes de control requeridas con el propósito de lograr la respuesta deseada del proceso
controlado. La construcción del modelo dinámico se basa en la aplicación de las leyes
fı́sicas sobre el proceso, tales como la conservación de la energı́a y las leyes de Newton.
Los métodos de diseño del controlador presentadas en los siguientes capı́tulos
se pueden aplicar a una gran clase de procesos no lineales, tales como manipuladores
robóticos, aeronaves de alto rendimiento, vehı́culos espaciales, procesos quı́micos, entre
otros. Algunos de estos procesos se proponen en la sección Problemas de este capı́tulo.
Este trabajo emplea manipuladores de varios grados de libertad y el sistema tanque de
agua a manera de prototipos para validar mediante experimentación varias estrategias de
control no lineal.
La dinámica de una gran variedad de sistemas se puede describir mediante un
conjunto de ecuaciones diferenciales no lineales. Las siguientes estrategias de modelado
se emplean en este libro con la finalidad de obtener tales ecuaciones: aplicación de las
leyes fı́sicas (sección 1.1), aplicación de las ecuaciones de Lagrange (sección 1.2) y el
método de Lagrange–Euler (sección 5). Los códigos de los programas empleados en este
capı́tulo se encuentran en el CD adjunto a esta publicación.

1.1. Modelado Empleando las Leyes de la Fı́sica

A continuación se desarrollan algunos ejemplos de modelado de sistemas no
lineales empleando las leyes de la fı́sica.

1.1.1. Manipulador Robótico de 1GDL

El manipulador robótico de 1GDL (1 Grado De Libertad) mostrado en la ﬁgura
1.1 es uno de los procesos prototipo a ser utilizado en esta publicación para validar
mediante experimentación los algoritmos de control empleados. Este proceso se com-
pone de un subsistema eléctrico y un subsistema mecánico. El subsistema eléctrico
comprende un servomotor D.C. (“Direct Current”) con codiﬁcador (“encoder”) de
2 Modelado de Sistemas No Lineales

posición incorporado, el cual se emplea para medir la posición angular del brazo del
manipulador en cada instante de tiempo. El servomotor posee una caja de engranajes
para reducir la velocidad en su eje de salida; de de esta manera, se facilita el control
de posición del manipulador.
El subsistema mecánico consiste de un brazo accionado gracias al torque rota-
cional generado en el actuador (el servomotor D.C.). En el extremo del brazo robótico
se puede acoplar un efector final, el cual puede ser una pinza para asir objetos, una
herramienta para soldar, una herramienta para pintar, etc. En nuestro caso usamos
una pinza con dos grados de libertad: un grado para rotar la pinza y otro para abrirla
y cerrarla. Con propósitos de modelado, vamos a suponer que el efector final y su
carga se pueden modelar mediante una masa mh variable. La tabla 1.1 describe las
variables y los valores de los parámetros del manipulador mostrado en la figura 1.1.
El manipulador de 1GDL es del tipo SISO (“Single Input Single Output”)
ya que sólo posee una entrada: el voltaje de control u aplicado a la armadura del
servomotor, y una salida: la posición angular θ del brazo.

Figura 1.1: Manipulador robótico de 1GDL.

Modelo del Subsistema Mecánico

Para modelar el subsistema mecánico del manipulador empleamos la segunda
ley de Newton para los movimientos lineal y rotacional. La aplicación de esta segunda
ley se traduce en una ecuación de balance mecánico. Con respecto a la ﬁgura 1.1, la
ecuación de balance mecánico en el eje del servomotor articulado al primer engranaje
se formula como:
dθ d 2 θm
Tm = Jm θ̈m + Bm θ̇m + Tg1 θ̇ = θ̈m = (1.1)
dt dt2
donde Jm y Bm representan el momento de inercia y la constante de fricción viscosa
del rotor, Tm es el torque del servomotor y Tg1 es el torque de reacción debido al primer
engranaje. Para los engranajes de reducción del servomotor podemos formular:
N2 θm
n= = θm = nθ n>1 (1.2)
N1 θ
1.1 Modelado Empleando las Leyes de la Fı́sica 3

Tabla 1.1: Parámetros y variables del brazo robótico de 1 GDL.

Sı́mbolo Descripción Valor Unidades

u Voltaje de entrada al sistema V
KA Ganancia del ampliﬁcador 14.9
Va Voltaje de armadura V
Ra Resistencia de armadura 7.38 Ω
La Inductancia de armadura 4.64×10−2 H
ia Corriente de armadura A
Km Constante del torque motor 31.071×10−3 N-m/A
Tm Torque motor N-m
TL Torque de carga N-m
τL Torque causado por pesos de la carga N-m
Tg1 Torque de entrada a los engranajes N-m
Tg2 Torque de salida de los engranajes N-m
Jm Inercia del motor 1.9062×10−6 kg-m2
Jg Inercia de los engranajes 3.5×10−7 kg-m2
JL Inercia de la carga kg-m2
Bm Constante de fricción del motor 1.8338×10−6 N-m/rad/s
Bg Constante de fricción en engranajes 10−5 N-m/rad/s
BL Constante de fricción en la carga N-m/rad/s
mh Masa del efector ﬁnal 0.045 kg
mb Masa del brazo 0.06377 kg
L Longitud del brazo 0.776 m
rh Distancia al centro de masa del efector 0.02 m
Vb Voltaje contraelectromotriz V
Kb Constante contraelectromotriz 31.0352×10−3 V/rad/s
g Aceleración de la gravedad 9.81 m/s2
N 1 , N2 N o de dientes de los engranajes N2 > N 1
n Relación de engranajes (n = N2 /N1 ) 19.741
θm Posición angular del motor rad
θ Posición angular de la carga rad
ω Velocidad angular de la carga rad/s
ωm Velocidad angular del motor ωm = nω rad/s
Kw Constante de elasticidad 5.02×10−2 N-m/rad
4 Modelado de Sistemas No Lineales

La ecuación (1.2) es cierta debido a que el espacio angular recorrido por el engranaje
de menor radio debe de ser n veces mayor que el espacio recorrido por el el engranaje
de radio mayor. Por otra parte, el principio de la conservación de la energı́a establece
que el trabajo realizado por el engranaje de la izquierda debe ser igual al trabajo
realizado por el engranaje de la derecha, es decir:

Tg2 θ = Tg1 θm = Tg1 nθ; Tg2 = nTg1 (1.3)

donde Tg2 es el torque de reacción debido al segundo engranaje. El balance mecánico

en el eje articulado al brazo del manipulador produce:

Tg2 = Jg θ̈ + Bg θ̇ + TL (1.4)

donde Jg y Bg representan el momento de inercia y la constante de fricción viscosa

de la caja de reducción respectivamente. El torque de carga TL se formula como (ver
ﬁgura 1.2):

TL = JL θ̈ + BL θ̇ + τL (1.5)
L
τL = mb g senθ + mh g (L + rh )senθ = Q sen θ (1.6)
2
L
Q = mb g + mh g (L + rh )
2
donde JL y BL representan el momento de inercia y la constante de fricción viscosa de
la carga no lineal (brazo más efector final), g es la constante gravitacional, mb y mh
denotan las masas del brazo y del efector final (esta masa también incluye la masa de
la carga en el efector) respectivamente, y rh denota la distancia desde el extremo del
brazo al centro de masa de mh . Para fines prácticos asumiremos que rh ≈ 0. Notar
en (1.5) que el torque τL se debe a las fuerzas ejercidas por los pesos del brazo y de
la esfera. Ası́, el torque mb g L senθ
2 se debe al peso mb g del brazo, mientras que el
torque mh g (L + rh )senθ ≈ mh g Lsenθ es causado por el peso mh g del efector, Las
distancias L senθ
2 y (L + rh )senθ ≈ Lsenθ son los correspondientes brazos de palanca
del brazo y del efector respectivamente.
El momento de inercia JL de la carga es la suma del momento de inercia del
brazo Jb más el momento de inercia del efector Jh . Asumiendo que la masa mh
está concentrada en su C.M. (centro de masa), entonces:

Jh = mh (L + rh )2 ≈ mh L2 (1.7)

Del mismo modo, asumiendo que la masa mb del brazo se concentra en su C.M.,
entonces: 2
L
Jb = mb (1.8)
2
Sin embargo, si se considera que la masa del brazo está distribuida a lo largo de su
longitud, entonces debemos aplicar el teorema de los ejes paralelos, el cual establece
que el momento de inercia de una masa m alrededor de un eje que no pasa por su
centro de masa está dado por:
J = Jo + ma2 (1.9)
1.1 Modelado Empleando las Leyes de la Fı́sica 5

donde a es la distancia entre el eje que pasa por el centro de masa de m y el eje
paralelo, y Jo es el momento de inercia alrededor del eje que pasa por su centro de
masa. Aplicando el teorema de los ejes paralelos al brazo, el momento de inercia Jb
con respecto al punto de articulación se formula como:
2
1 L 1
Jb = mb L2 + mb = mb L2 (1.10)
12 2 3

Por simplicidad, sin embargo, emplearemos las fórmulas dadas en (1.7) y (1.8).

Figura 1.2: El brazo robótico.

Empleando (1.5), (1.6), (1.4), (1.3) y (1.2) en (1.1) y operando se obtiene:

nTm = Jeq θ̈ + Beq θ̇ + τL = Jeq ω̇ + Beq ω + Q senθ (1.11)

donde:
Jeq = n2 Jm + Jg + JL Beq = n2 Bm + Bg + BL
Las expresiones de Q, Jh y Jb (tener en cuenta que JL = Jh + Jb ) se dan en (1.6),
(1.7) y (1.8) respectivamente.

Modelo del Subsistema Eléctrico

El voltaje de armadura Va viene expresado por (ver la descripción de las vari-
ables y parámetros en la Tabla 1.1):

dia
Va = ia Ra + La + Vb (1.12)
dt
donde ia , Ra y La son la corriente, la resistencia y la inductancia en la armadu-
ra del servomotor respectivamente, y Vb es el voltaje de fuerza contraelectromotriz
gobernado por la relación:

Vb = Kb ωm = Kb nω = Kb nθ̇ (1.13)
6 Modelado de Sistemas No Lineales

donde Kb es la constante de fuerza contra-electromotriz y está relacionado con la

velocidad angular ωm del motor. El voltaje de armadura Va es:

Va = uKA (1.14)

donde KA es la ganancia del ampliﬁcador.

Conversión de Energı́a Eléctrica en Mecánica

La ecuación de conversión en energı́a eléctrica en mecánica es:

Tm = Km ia (1.15)

donde Km es la constante del motor. Igualando (1.12) con (1.14) obtenemos:

dia KA Kb n Ra
= u− ω− ia (1.16)
dt La La La

Empleando (1.15) en (1.11) y despejando ω̇ = dω/dt obtenemos:

dω Q Beq nKm
=− senθ − ω+ ia (1.17)
dt Jeq Jeq Jeq

Ecuación de Estado
Las ecuaciones (1.16) y (1.17) describen el modelo no lineal del proceso. Eligien-
do como variables de estado: x1 = θ (posición angular), x2 = ω (velocidad angular)
y x3 = ia (corriente de armadura), se obtiene:

ẋ1 = x2
Q Beq nKm
ẋ2 = − senx1 − x2 + x3
Jeq Jeq Jeq
nKb Ra KA
ẋ3 = − x2 − x3 + u (1.18)
La La La
donde la salida es la posición x1 y la señal de control es u.
En la Tabla 1.1 podemos observar que la inductancia de armadura La del ser-
vomotor es bastante pequeña, de modo tal que puede despreciarse sin que se pierda
exactitud en los resultados. Considerando el producto ẋ3 La = 0 en la tercera ecuación
de (1.18) y despejando la corriente de armadura x3 obtenemos:

KA nKb
x3 = u− x2 (1.19)
Ra Ra

Reemplazando (1.19) en la segunda ecuación de (1.18), resulta entonces la ecuación

de estado no lineal de orden dos del manipulador:

ẋ1 = x2

P Beq Ra + n2 Km Kb nKm KA
ẋ2 = − senx1 − x2 + u (1.20)
Jeq Jeq Ra Jeq Ra
1.1 Modelado Empleando las Leyes de la Fı́sica 7

Linealización del Modelo no Lineal

Despreciando la inductancia La del servomotor, entonces, para desviaciones
pequeñas de la posición θ = x1 se cumple que senx1 ≈ x1 . Aplicando tal aproximación
en la ecuación (1.20) obtenemos una ecuación de estado lineal de la forma:

ẋ = Ax + Bu (1.21)

ẋ1 0 1 x1 0
= Beq Ra +n2 Km Kb + nKm KA u
ẋ2 − JQeq − Jeq Ra
x2 Jeq Ra

y la correspondiente ecuación de salida:

x1
y = Cx + Du = 1 0 + [0] u (1.22)
x2

Ejemplo 1.1

Graficar la respuesta (la posición angular θ) del modelo no lineal de segundo orden y
de los modelos lineales continuo y discreto derivados de dicho modelo. Para fines de
análisis asumir que la señal de entrada u es de 1.4 voltios de magnitud, que BL = Bg
y que el efector final es una esfera de masa mh y de radio rh . En esta situación:

2
Jh = mh rh2 + mh (L + rh )2
5
Solución: El programa C3rpta.m determina tales respuestas (ver ﬁgura 1.3) ası́ como
también las funciones de transferencia, la estabilidad, la controlabilidad y la obser-
vabilidad de los modelos lineales continuo y discreto. ♣

1.1.2. Manipulador Robótico con Articulación Elástica (MRAE)

La figura 1.4 muestra el Manipulador Robótico con Articulación Elástica (MRAE)
de 1GDL, el cual es simplemente un manipulador de un solo eslabón pero con articu-
lación elástica. El efecto del acoplamiento elástico entre el eje de salida del servomotor
con el brazo (o eslabón) del MRAE, se puede modelar mediante un resorte rotacional
con constante de elasticidad Kw .
En la figura 1.4, u denota el voltaje de entrada, θ (la salida del proceso) es
la posición angular del brazo de longitud L y masa mb , θm representa la posición
angular del eje del actuador (el servomotor DC) antes de la caja de reducción. Al
extremo del brazo se puede articular un efector final, como en el caso del manipulador
de 1GDL. La tabla 1.1 también describe las variables y los valores de los parámetros
del sistema mostrado en la figura 1.1.

Ecuaciones Dinámicas del MRAE

El balance mecánico en el eje del servomotor articulado al primer engranaje se
expresa como:
Tm = Jm θ̈m + Bm θ̇m + Tg1
8 Modelado de Sistemas No Lineales

0.8

y(t) NO LINEAL [rad]

0.6

0.4

0.2

0
0 50 100 150

6
y(t) LINEAL [rad]

0
0 50 100 150

6
y(k) LINEAL [rad]

0
0 50 100 150
Tiempo en segundos

Figura 1.3: Respuestas de los modelos no lineal, lineal continuo y lineal discreto del
brazo robótico a una entrada u escalón de magnitud 1.4 voltios.

M2
Jm mH
Ra JL
+ + + Tm Tg1 L
θm BL
u Va Vb n Bg K ω m
- - -
KA La θ m Bm
Gearbox
Jg
n Tg2 θ
Ia

Figura 1.4: Manipulador Robótico con Articulación Elástica (MRAE).

donde Jm y Bm representan el momento de inercia y la constante de fricción viscosa

del rotor, Tm es el torque del servomotor y Tg1 es el torque de reacción debido al
primer engranaje. El balance mecánico del eje articulado a la carga se expresa como:

θ̈m θ̇m θm
Tg2 = Jg + Bg + Kw −θ
n n n

en donde Kw θnm − θ es el torque originado por el acoplamiento elástico, Tg2 es el

torque debido al segundo engranaje, n = N2 /N1 denota la relación de transmisión de
los engranajes, y Jg y Bg representan el momento de inercia y la constante de fricción
1.1 Modelado Empleando las Leyes de la Fı́sica 9

viscosa de la caja de reducción respectivamente. Asumiendo engranajes ideales, la

conservación de la energı́a requiere que el trabajo realizado por cada engranaje debe
de ser el mismo, a saber:
θm
Tg1 θm = Tg2
n
Empleando las relaciones anteriores, la ecuación que gobierna el torque servomotor
se formula como:

Jeq θ̈m Beq θ̇m Kw θm
Tm = + + −θ (1.23)
n n n n n n

Jeq = n2 Jm + Jg Beq = n2 Bm + Bg
La ecuación que gobierna la dinámica del brazo del manipulador se puede expresar
como:
θm 1
Kw − θ = JL θ̈ + BL θ̇ + mb gLsen θ + mh gLsin θ (1.24)
n 2
donde JL y BL representan el momento de inercia y la constante de fricción viscosa
de la carga no lineal (brazo más efector), g es la constante gravitacional, mb y mh
(esta masa también incluye la masa de la carga) denotan la masa del del brazo y
del efector respectivamente y, 12 mb gLsen θ y mh gLsin θ son los torques debido a los
pesos del brazo y del efector respectivamente. El momento de inercia de JL = Jh +Jb ,
asumiendo que las masas mh y mb se concentran en sus respectivos C.M. se da en las
ecuaciones (1.7) y (1.8):
2
2 L
JL = mh L + mb
2
Para completar el modelado de la parte eléctrica del proceso MRAE, podemos
aseverar que:
dia
Ra ia + La + Vb = KA u (1.25)
dt
donde KA es la ganancia del ampliﬁcador y Vb es el voltaje de la fuerza contra
electromotrı́z y responde a la relación:

Vb = Kb θ̇m (1.26)

donde Kb es la constante de fuerza contra electromotriz. El torque servomotor Tm es

también proporcional a la corriente ia , es decir:

Tm = Km ia (1.27)

donde Km es la constante del servomotor.

Modelo de Lagrange del MRAE

Empleando las ecuaciones (1.23) y (1.24), el modelo de Lagrange del MRAE se
puede formular como (ver por ejemplo ( 1.113)):

T = Hq̈ + Cq̇ + d (1.28)

10 Modelado de Sistemas No Lineales

donde:
   Jeq    Beq    
Tm 0 θ̈m
0 θ̇m Kw θm
−θ
     
n n n n n n
 =  +  + 
0 0 JL θ̈ 0 BL θ̇ d2

1 θm
d2 = mb + mh Lg sin θ − Kw −θ
2 n
Despreciando la inductancia de armadura La en (1.25), y despejando ia se obtiene:
Kb KA
ia = − θ̇m + u (1.29)
Ra Ra
Sustituyendo ia en Tm = Km ia de (1.28) y despejando u, el modelo de Lagrange
toma una nueva forma:
     θ̈     θ̇   
u m11 0 m p 11 0 m d1
 =  n   n  
+  +  (1.30)
0 0 JL θ̈ 0 BL θ̇ d2

Ra Jeq nKb Ra Beq Ra Kw θm
m11 = p11 = + d1 = −θ
nKA Km KA nKA Km nKA Km n

Modelo en el Espacio de Estado del MRAE

Seleccionando como variables de estado: x1 = θ, x2 = θ̇, x3 = θm /n, x4 =
θ̇m /n, y x5 = ia , entonces el vector de estado del sistema es de orden 5. Luego,
las ecuaciones (1.23), (1.24) y (1.25) (sin despreciar la inductancia La ) producen la
siguiente ecuación de estado no lineal:
   
ẋ1 f1 (x, u)
 ẋ2   f2 (x, u) 
   
ẋ =    
 ẋ3  = f (x, u) =  f3 (x, u)  (1.31)
 ẋ4   f4 (x, u) 
ẋ5 f5 (x, u)

f1 (x, u) = x2
Kw BL Kw Lg mb
f2 (x, u) = − x1 − x2 + x3 − + mh sen x1
JL JL JL JL 2
f3 (x, u) = x4
Kw Kw Beq nKm
f4 (x, u) = x1 − x3 − x4 + x5
Jeq Jeq Jeq Jeq
nKb Ra KA
f5 (x, u) = − x4 − x5 + u
La La La
donde hemos usado el hecho de que ẋ1 = x2 y ẋ3 = x4 . Si la salida del sistema es
y = θ, entonces la ecuación de salida del MRAE resulta:

y = h(x) = Cx = [1 0 0 0 0] x (1.32)
1.1 Modelado Empleando las Leyes de la Fı́sica 11

Despreciando la inductancia de armadura La en (1.31), lo que equivale a elimi-

nar un elemento almacenador de energı́a independiente (por consiguiente, eliminar
una variable de estado), entonces:
nKb KA
La ẋ5 = 0 = −nKb x4 − Ra x5 + KA u ⇒ x5 = − x4 + u
Ra Ra
Reemplazando x5 en la cuarta ecuación de (1.31), se obtiene una ecuación de estado
no lineal de orden 4:    
ẋ1 f1 (x, u)
 ẋ2   f2 (x, u) 
   
 ẋ3  =  f3 (x, u) 
(1.33)
ẋ4 f4 (x, u)

f1 (x) = x2
Kw BL Kw Lg m
f2 (x) = − x1 − x2 + x3 − + mH sin x1
JL JL JL JL 2
f3 (x) = x4
2
Kw Kw n Km Kb Beq nKm KA
f4 (x) = x1 − x3 − + x4 + u
Jeq Jeq Jeq Ra Jeq Jeq Ra
La salida del sistema en este caso se expresa como:

y = h(x) = Cx = [1 0 0 0] x (1.34)

1.1.3. Sistema Péndulo Invertido–Grúa Puente

El sistema péndulo invertido–grúa puente consiste de una varilla metálica mon-
tada sobre un carro que se desplaza sobre rieles. Cuando la varilla toma la posición
vertical hacia arriba (posición inestable), entonces el sistema se denomina péndu-
lo invertido. Si la posición de la varilla es vertical y hacia abajo (posición estable),
el sistema se conoce como grúa puente. La tabla 1.2 muestra la descripción de las
variables y parámetros para los sistemas péndulo invertido y grúa puente. Los val-
ores de tales parámetros se obtuvieron de las hojas de especiﬁcaciones y mediante
experimentación.

Sistema Péndulo Invertido

El sistema péndulo invertido consiste de un péndulo (una varilla) montado
sobre un carro que se desplaza en forma horizontal. Este carro está impulsado por un
servomotor D.C. a través de un sistema de poleas, tal como se muestra en la ﬁgura 1.5.
Para mayor claridad, el sistema péndulo invertido se ha separado en dos subsistemas:
el subsistema conformado por el carro y el péndulo y el subsistema conformado por
el motor y las poleas.

Modelado del Subsistema Carro–Péndulo

El subsistema carro–péndulo se ilustra en la ﬁgura 1.6 y está conformado por
un carro y una varilla metálica ﬁjada al carro por medio de un pivote móvil. Observar
que los centros de gravedad de la varilla zv y de la esfera ze se ubican en:
12 Modelado de Sistemas No Lineales

Tabla 1.2: Variables y parámetros valorados para el sistema péndulo invertido–grúa

puente.

Sı́mbolo Descripción Valor Unidades

u Voltaje de entrada al sistema V
KA Ganancia del ampliﬁcador 14.9
Va Voltaje de armadura V
Ra Resistencia de armadura 7.38 Ω
La Inductancia de armadura ∼
=0 H
ia Corriente de armadura A
Km Constante del torque motor 31.071×10−3 N-m/A
Tm Torque motor kg-m
Tg1 Torque de entrada a los engranajes kg-m
Tg2 Torque de salida de los engranajes kg-m
Jm Inercia del motor 1.9062×10−6 kg-m2
Jg Inercia de los engranajes ∼
=0 kg-m2
Jp Momento de inercia de la polea kg-m2
Je Momento de inercia de la esfera kg-m2
Jv Momento de inercia de la varilla kg-m2
Bm Constante de fricción del motor 1.8338×10−6 N-m/rad/s
Bg Constante de fricción en engranajes ∼
=0 N-m/rad/s
F fuerza aplicada al carro N
me Masa de la esfera (no se usó) 0 kg
mb Masa del brazo 0.06377 kg
L Longitud del brazo 0.776 m
re Radio de la esfera 0.02 m
rp Radio de la polea 0.0648 m
mv Masa de la varilla 0.063095 kg
mc Masa del carro 0.92 kg
mp Masa de la polea 0.2 kg
z Posición del carro m
lv Longitud de la varilla 0.767 m
le Distancia entre P y la esfera m
ze Posición horizontal (esfera) m
zv Posición horizontal (varilla) m
ye Posición vertical (esfera) m
yv Posición vertical (varilla) m
Vb Voltaje contraelectromotriz V
Kb Constante contraelectromotriz 31.0352×10−3 V/rad/s
g Aceleración de la gravedad 9.81 m/s2
N 1 , N2 N o de dientes de los engranajes N2 > N 1
n= Relación de engranajes (n = N2 /N1 ) 19.741
θm Posición angular del motor rad
θ Posición angular del péndulo rad
ω Velocidad angular de la carga rad/s
ωm Velocidad angular del motor rad/s
1.1 Modelado Empleando las Leyes de la Fı́sica 13

+ Fuerza de
u control y’
-
Servomotor
D.C. y
θ Pendulo

z F

Carro

Figura 1.5: Sistema péndulo invertido.

y y’
z

11
00
00
11
00
11
l v /2
me g
θ
mvg lv
le
z’
0
z
P
F

Figura 1.6: Subsistema carro–péndulo.

lv
ze = z + le senθ zv = z + senθ (1.35)
2
Para simpliﬁcar el procedimiento de modelado del péndulo, aplicaremos las leyes
de Newton para los movimientos lineal y rotacional, considerando al péndulo como
un todo. Para el movimiento lineal, dicha ley establece que para un sistema de N
partı́culas:

N
d2 M
mi 2 ri = Fj (1.36)
dt
i=1 j=1

donde mi es la masa de la i-ésima partı́cula, ri es el vector posición del centro de

masa de la i-ésima partı́cula y Fj es el j-ésimo vector fuerza aplicada al sistema de
partculas. Aplicando la ecuación (1.36) a nuestro sistema en la dirección z obtenemos:

d2 d2 d2
mc z + m z
e 2 e + mv 2 zv = F (1.37)
dt2 dt dt
Sustituyendo ze y zv (ecuación (1.35) en (1.37)) resulta:

d2 d2 d2 lv
mc 2
z + me 2
(z + l e sen θ) + mv 2
(z + sen θ) = F (1.38)
dt dt dt 2
14 Modelado de Sistemas No Lineales

Desarrollando las derivadas se obtiene:

lv lv
(mc + me + mv )z̈ − (me le + mv )(sen θ) + θ̇2 (me le + mv )(cos θ)θ̈ = F (1.39)
2 2
Para completar el modelado, usamos la segunda ley de Newton aplicada al
movimiento rotatorio alrededor del punto pivote P del carro. Esta ley establece que
para un sistema de N partı́culas en movimiento rotacional con respecto a un sistema
de referencia inercial, y sometidas a M torques externos perpendiculares al plano de
giro, se cumple que:
N
d 2 θi
M
Ji 2 = τj (1.40)
dt
i=1 j=1

donde τj es el j-ésimo torque externo, Ji es el momento de inercia de la i-ésima masa

respecto al punto pivote P y θi es el ángulo recorrido por la i-ésima masa alrededor
del punto P. Para aplicar la ley al movimiento rotatorio de la varilla alrededor del
punto P, empleamos la tercera ley de Newton de acción y reacción, la cual nos permite
formular el efecto de la aceleración del péndulo en el sistema de referencia Z − Y
(ver ﬁgura 1.6), mediante una fuerza mi z̈ aplicada en el centro de masa de dicho
sistema, pero en dirección opuesta a la aceleración. Empleando (1.40) en el péndulo
de ﬁgura 1.6 obtenemos:
lv lv
(Je + Jv )θ̈ = me gle sen θ + mv g sen θ − me z̈le cos θ − mv z̈ cosθ (1.41)
2 2
Observar en (1.41) que los torques me gle sen θ y mv g l2v sen θ actuando en P son pro-
ducidos por los pesos me g y mv g respectivamente, mientras que los torques de reac-
ción me z̈le cos θ y mv z̈ l2v cosθ, actuando ambos también en P, son producidos por las
fuerzas de reacción me z̈ y mv z̈ respectivamente. Reordenando (1.41):
lv lv
(me le + mv )g(sen θ) − (me le + mv )z̈(cos θ) = (Je + Jv )θ̈ (1.42)
2 2
donde:
lv2
Je = me le2 Jv = mv (1.43)
3
El momento de inercia de Je con respecto al punto de giro P asume que la masa me
está concentrada en un punto, por ello basta multiplicar la masa me por su distancia
al punto P elevado al cuadrado. Para el caso de la varilla, la expresión dada en Jv
corresponde al momento de inercia de una varilla girando por uno de sus extremos
(el punto P).

Modelado del Subsistema Motor–Polea

El subsistema motor-polea se muestra en la ﬁgura 1.7. Sabemos que el voltaje
contraelectromotriz es proporcional la velocidad angular θm :

Vb = Kb θ̇m (1.44)

El voltaje de armadura Va se expresa como:

dia
Va = KA u = Ra ia + La + Vb ∼
= Ra ia + Kb θ̇m La ∼
=0 (1.45)
dt
1.1 Modelado Empleando las Leyes de la Fı́sica 15

En la relación (1.2) se estableció para los engranajes de reducción de un servomotor:

N2 θm
n= = θm = nθ n>1
N1 θ
El torque motor Tm debe vencer a su inercia y al torque Tg1 a la entrada del del tren
de engranajes:

Tm = Jm θ̈m + Bm θ̇m + Tg1 = nJm θ̈ + nBm θ̇ + Tg1 (1.46)

Asumiendo engranajes ideales, la conservación de la energı́a requiere que el trabajo

(torque por posición angular) realizado en cada engranaje sea el mismo:

Tg1 θm = Tg1 nθ = Tg2 θ nTg1 = Tg2 (1.47)

El torque Tg2 a la salida del tren de engranajes debe vencer a la inercia Jg de los
engranajes, a la inercia Jp de la polea y al torque de polea F rp (rp es el radio de la
polea):
Tg2 = Jg θ̈ + Bg θ̇ + Jp θ̈ + Bp θ̇ + F rp = nTg1 (1.48)
Sustituyendo (1.48) en (1.46) se obtiene:

nTm = Jeq θ̈ + Beq θ̇ + F rp (1.49)

donde:
Jeq = Jm + n2 (Jg + Jp ) Beq = Bm + n2 (Bg + Bp )
Para transformar el desplazamiento angular θ del servomotor en el desplazamiento
horizontal z del carro, empleamos:

z = rp θ (1.50)

El torque producido en el eje del servomotor es proporcional a la corriente de ar-

madura:
1 1 z̈ ż

Tm = Km ia = Jeq θ̈ + Beq θ̇ + F rp = Jeq + Beq + F rp (1.51)
n n rp rp
Despejando ia de (1.45), sustituyéndola en (1.51) y luego despejando F de la relación
resultante se obtiene:

nKm KA Jeq Beq n2 Km Kb
F = u − 2 z̈ − + ż (1.52)
Ra rp rp n2 rp2 Ra rp2

Ra θm
+
u Va Vb Jo rp
-
La Jm F
Bm Bo

Figura 1.7: Subsistema motor-polea.

16 Modelado de Sistemas No Lineales

Igualando (1.39) con (1.52) resulta:

nKm KA Jeq Beq n2 Km Kb
u − 2 z̈ − + ż =
Ra rp rp rp2 Ra rp2
lv lv
(mc + me + mv )z̈ − (me le + mv )(sen θ)θ̇2 + (me le + mv )(cos θ)θ̈ (1.53)
2 2

Las ecuaciones (1.42) y (1.53) representan el modelo dinámico no lineal del sistema
péndulo invertido controlado por la corriente de armadura. Tales ecuaciones pueden
ser escritas en forma compacta como:

(M1 + J2 )z̈ − M2 (sen θ)θ̇2 + M2 (cos θ)θ̈ − Kx KA u + Bx ż = 0

M2 g(sen θ) − M2 z̈(cos θ) − J1 θ̈ = 0 (1.54)

donde:

lv
M1 = mc + me + mv ; M2 = me le + mv ; J1 = Je + Jv
2

Jeq nKm Beq n2 Kb Km

J2 = ; Kx = ; Bx = +
rp2 Ra rp rp2 rp2 Ra

Representación en el Espacio de Estado

Seleccionemos las siguientes variables de estado: x1 = θ, x2 = θ̇, x3 = z y

x4 = ż. Es claro que en este sistema de orden 4: ẋ1 = x2 y ẋ3 = x4 . Las otras dos
ecuaciones de estado se determinan de (1.54) como sigue. Multiplicando la primera
ecuación por J1 y la segunda por M2 cosθ y sumando ambas ecuaciones, la expresión
resultante nos permite despejar z̈ = ẋ4 . Multiplicando ahora la primera ecuación
por M2 cosθ y la segunda por M1 + J2 y sumando ambas ecuaciones, la expresión
resultante nos permite despejar θ̈ = ẋ2 . Operando, se obtiene:
 
  x2
ẋ1  M2 (sin x1 )(cos x1 )x22 −Bx (cos x1 )x4 −(M1 +J2 )g(sin x1 )+Kx (cos x1 )KA u 
 ẋ2   (M2 (cos2 x1 )−(M1 +J2 )J1 )/M2

   
 ẋ3  =  x4  (1.55)
 
ẋ4 M22 g(sin x1 )(cos x1 )−J1 M2 (sin x1 )x22 +J1 Bx x4 −J1 Kx KA u
M22 (cos2 x1 )−(M1 +J2 )J1

y puesto que en nuestro sistema las salidas disponibles son el desplazamiento angular
x1 de la varilla y el desplazamiento x3 del carro, la ecuación de salida toma la forma:

y = h(x) = Cx (1.56)

donde:

1 0 0 0
C=
0 0 1 0
1.1 Modelado Empleando las Leyes de la Fı́sica 17

Obtención del Modelo Lineal

Notar que (1.55) puede ser puesta en la forma:
   
ẋ1 f1 (x, u)
 ẋ2   f2 (x, u) 
ẋ = 
 ẋ3
 = f(x, u) = 
  f3 (x, u)

 (1.57)
ẋ4 f4 (x, u)

Para la operación del proceso alrededor del estado de equilibrio xo = [0, 0, 0, 0]T = 0
y uo = 0, las matrices A, B, C y D pueden ser determinadas evaluando las siguientes
matrices jacobianas:
 ∂f1 ∂f1   ∂f1 ∂f1 
∂X1 · · · ∂Xn ∂U1 · · · ∂Um
 ..   .. 
A =  ... ..
. .  B =  ... ..
. . 
∂fn ∂fn ∂fn ∂fn
∂X1 ··· ∂Xn (xo , uo ) ∂U1 ··· ∂Um (xo , uo )
   
∂h1
∂X1 ··· ∂h1
∂Xn
∂h1
∂U1 ··· ∂h1
∂Um
 .. .. ..   .. .. .. 
C =  . . .  D= . . .  (1.58)
∂hr
∂X1 ··· ∂hr
∂Xn (xo , uo )
∂hr
∂U1 ··· ∂hr
∂Um (xo , uo )

Ası́ obtenemos el siguiente modelo lineal para el sistema péndulo invertido:

ẋ = Ax + Bu (1.59)

donde:
   
0 1 0 0 0
 (M1 +J2 )M2 g Bx M2   −Kx M2 KA 
 (M1 +J2 )J1 −M22
0 0 (M1 +J2 )J1 −M22   (M1 +J2 )J1 −M22 
A=


 B= 
 0 0 0 1   0 
−M22 g −J1 Bx J1 Kx KA
(M1 +J2 )J1 −M22
0 0 (M1 +J2 )J1 −M22 (M1 +J2 )J1 −M22

Sistema Grúa–Puente
El modelado del sistema grúa-puente es similar al modelado del péndulo inver-
tido. En este caso caso el péndulo debe apuntar hacia abajo, tal como se muestra en
la figura 1.8. Al igual que en el caso del péndulo invertido, para mayor facilidad, el
sistema grúa puente se puede subdividir en dos subsistemas: carro–varilla y motor–
polea. El subsistema carro-varilla está representado en la figura 1.9. De dicha figura
podemos observar que los centros de gravedad zv de la varilla y ze de la esfera son:
lv
ze = z − le sen θ zv = z − sen θ
2

Con un procedimiento similar al realizado para el sistema péndulo invertido, se

puede llegar a las siguientes ecuaciones:

(M1 + J2 )z̈ + M2 (sen θ)θ̇2 − M2 (cos θ)θ̈ − Kx KA u + Bx ż = 0

−M2 g(sen θ) + M2 z̈(cos θ) − J1 θ̈ = 0 (1.60)
18 Modelado de Sistemas No Lineales

+ Fuerza de
u control
-
Servomotor
D.C. y

z F

Carro

θ
’ puente
Grua
y’

Figura 1.8: Sistema grúa–puente.

y y’
z

P z’
0
F z
lv
θ
2
111
000 le
000
111
000
111
000 m v g
111 lv

me g

Figura 1.9: Subsistema carro-varilla de sistema grúa–puente.

donde:

lv
M1 = mc + me + mv ; M2 = me le + mv ; J1 = Je + Jv
2

Jeq nKm Beq n2 Kb Km

J2 = ; Kx = ; Bx = +
rp2 Ra rp rp2 rp2 Ra

Como era de esperarse, las relaciones y (1.54) (1.60) sólo se diferencian en los signos.

Representación en el Espacio de Estado

Las ecuaciones arriba obtenidas se representan en el espacio de estados mediante

la siguiente asignación de variables: x1 = θ, x2 = θ̇, x3 = z, x4 = ż. Como en el caso
del sistema péndulo invertido, las ecuaciones del sistema grúa–puente en el espacio
1.1 Modelado Empleando las Leyes de la Fı́sica 19

de estado toman la forma:

 
  x2
ẋ1  −M2 (sin x1 )(cos x1 )x22 −Bx (cos x1 )x4 −(M1 +J2 )g(sin x1 )+Kx (cos x1 )KA u 
 ẋ2   (−M2 (cos2 x1 )+(M1 +J2 )J1 )/M2

    (1.61)
 ẋ3  =  x4 
 2 g(sin x )(cos x )−J M (sin x )x2 −J B x +J K K u

ẋ4 −M 2 1 1 1 2 1 2 1 x 4 1 x A
2 2
−M2 (cos x1 )+(M1 +J2 )J1

y puesto que tenemos como salidas disponibles el desplazamiento angular de la var-

illa y el desplazamiento del carro, tendremos entonces como ecuación de salida la
expresión dada en (1.56).

Obtención del Modelo Lineal

El modelo lineal del sistema grúa–puente, como en el caso del péndulo invertido,
posee la forma dada en 1.59, pero en este caso con:
   
0 1 0 0 0
 −(M1 +J2 )M2 g 0 0 −Bx M2   Kx M2 KA 
 (M1 +J2 )J1 −M 2 (M +J )J −M 2   (M1 +J2 )J1 −M22 
A= 
2 1 2 1 2 
 ; B =   (1.62)
 0 0 0 1   0 
−M22 g −J1 Bx J1 Kx KA
(M +J )J −M 2
0 0 (M +J )J −M 2 (M1 +J2 )J1 −M22
1 2 1 2 1 2 1 2

1.1.4. Sistema Tanque de Agua

El proceso tanque de agua estudiado aquı́ se muestra en la figura 1.10. En
este proceso, el agua frı́a que se envı́a al tanque se calienta en forma controlada. El
agua calentada que sale del tanque puede ser usado luego por los consumidores. Este
proceso es multivariable porque posee dos entradas de control: el flujo de entrada
al tanque y el calor suministrado al agua mediante una resistencia eléctrica, y dos
variables a controlar: el nivel del tanque y la temperatura de salida del agua calentada.
La tabla 1.3 describe las variables y los valores de los parámetros del tanque de agua
mostrado en la figura 1.10.

Modelo Lineal del Proceso Nivel

El volumen de agua acumulado en el tanque se modela como:

dh
S = S ḣ = qi − qo (1.63)
dt
Considerando un ﬂujo laminar de salida:

h
qo = (1.64)
Rh

donde la resistencia hidráulica Rh se calcula de la relación:

H
Rh = (1.65)
Q
20 Modelado de Sistemas No Lineales

Tabla 1.3: Parámetros y variables del proceso tanque de agua.

Sı́mbolo Descripción Valor Unid.

dS Diámetro del tanque 0.0265 m
S Sección circular del tanque 0.055 m2
H Nivel del agua en estado estable 0.12 m
H Nivel del agua m
h Nivel perturbacional del agua: h = H − H m
Q Flujo de agua en estado estable 0.16 m3 /h
Qi Flujo de agua de entrada al tanque m3 /s
Qi Flujo de entrada en estado estable 0.16 m3 /h
qi Flujo perturbacional del agua: qi = Qi − Qi m3 /s
Qo Flujo de agua de salida del tanque m3 /s
qo Flujo perturbacional a la salida: qo = Qo − Qo m3 /s
Rh Resistencia hidráulica del tanque: Rh = H/Q̄ 2700 s/m2
g Aceleración de la gravedad 9.81 m/s2
ρ Densidad del agua 1000 kg/m3
do Diámetro del orificio de salida 0.0127 m
Ao Sección del orificio de salida 0.000126 m2
Av Sección de la vena contracta m2
Cc Coeficiente de corrección entre Ao y Av 0.6 a 1
Cv Coeficiente de corrección por pérdidas 0.8 a 0.99
Cd Coeficiente de descarga:Cd = Cv Cc 0.5
√
a Factor de flujo turbulento: a = Cd AO 2g 0.00028 m2.5 /s
J
Cp Calor especı́fico del agua 4186.8 kg K
Ct Capacitancia térmica del tanque: Ct = ρSHCp 27633 K/W
Rt Resistencia térmica del tanque: Rt = C 1ρQ 0.0054 K/W
p
Θa Temperatura del ambiente 27.0 oC

Θo Temperatura en el tanque en estado estable 28.5 oC

Θo Temperatura del agua de salida oC

θo Temperatura perturbacional: θo = Θo − Θo oC

Φi Calor entregado por la resistencia eléctrica W

Φi Calor entregado en estado estable 1540 W
ΦT Calor del agua en el tanque W
Φo Calor que toma el ﬂujo de salida W
Φs Calor que se libera al exterior: Φs = ΘoR−Θt
a
W
Φc Calor que trae consigo el ﬂujo de entrada W
1.1 Modelado Empleando las Leyes de la Fı́sica 21

Figura 1.10: Proceso tanque de agua.

Entonces, la ecuación de estado del proceso nivel toma la forma:

1 1
ḣ = − h + qi (1.66)
SRh S
y su función de transferencia resulta:
h(s) Rh
= (1.67)
qi (s) SRh s + 1
donde el producto SRh es la constante de tiempo del proceso nivel.

Determinación Experimental de Rh
La válvula de control empleada para regular la entrada de agua al tanque es del
tipo VXN015F250, con diámetro nominal DN15, conexión G1B y actuador motórico.
La abertura máxima se obtiene alimentando con 10 V al actuador, la cual corresponde
a un flujo de 0.4 m3 /h, de acuerdo al manual del fabricante. La mı́nima abertura,
con 0 V, corresponde a un flujo de 0 m3 /h. Esto significa que para una abertura de
1 V el flujo que pasa por la válvula es de 1/90000 m3 /s.
Asumiendo una variación lineal entre el flujo Qi que pasa por la válvula y
la altura H del tanque, se realizó el siguiente experimento. Con una abertura de
válvula para 4 V (0.16 m3 /h), se abrió convenientemente la válvula de descarga
hasta lograr una altura estable de 0.12 m. Luego, con una abertura de válvula para
6 V (0.24 m3 /h), se siguió abriendo la válvula de descarga hasta lograr una altura
de 0.18 m. Empleando la relación (1.65), la resistencia hidráulica para cada punto
resultó aproximadamente Rt = 2700 s/m2 . Se asume también que los valores estables
de H y Qi son H = 0.12 m y Q = 0.16 m3 /h.
22 Modelado de Sistemas No Lineales

Modelo Lineal del Proceso Temperatura

El calor en el interior del tanque se modela aproximadamente como:
dθo
Ct = Φi − Φo (1.68)
dt
donde:
Φo = Cp ρ Q θo (1.69)
Por consiguiente, la ecuación de estado del proceso temperatura resulta:
1 1
θ˙o = − θo + Φi (1.70)
Rt Ct Ct
donde la capacitancia térmica Ct y la resistencia térmica Rt se calculan de:
1
Ct = ρSHCp Rt = (1.71)
Cp ρQ
La función de transferencia del proceso temperatura toma la forma:
θo (s) Rt
= (1.72)
Φi (s) Ct Rt s + 1
donde el producto Ct Rt es la constante de tiempo de dicho proceso.

Modelo No Lineal del Proceso Tanque de Agua

El volumen de agua acumulado en el tanque se modela como:
dH
S = S Ḣ = Qi − Qo (1.73)
dt
donde, para oriﬁcios circulares pequeños, se puede formular [?]:
√
Qo = Cd Ao 2gh = a h; a = Cd Ao 2g (1.74)
Se sabe además que [?]:
Cd = CvCc ; 0.8 ≤ Cv ≤ 0.99; 0.6 ≤ Cc ≤ 1 (1.75)
Para nuestro estudio tomaremos Cd =0.5. De (1.73) se obtiene la primera ecuación
de estado:
a√ 1
Ḣ = − H + Qi (1.76)
S S
Por otro lado, el balance de energı́a térmica dentro del tanque se formula:
ΦT = −Φo − Φs + Φc + Φi (1.77)
donde:
Q2o dΘo dΘo
ΦT = SρCp 2
= SρCp H (1.78)
a dt √ dt
Φo = Cp ρΘo Qo = Cp ρaΘo H (1.79)
Θo − Θa
Φs = (1.80)
Rt
Φc = Cp ρΘi Qi (1.81)
1.1 Modelado Empleando las Leyes de la Fı́sica 23

dΘo
La segunda ecuación de estado se obtiene despejando dt = Θ̇o de (1.77):

a Θo 1 Θo Θa 1 Θi Qi 1 Φi
Θ̇o = − √ − + + + (1.82)
S H SρCp Rt H SρCp Rt H A h SρCp H

Para linealizar el proceso tanque emplearemos la técnica del Jacobiano. Para ello se
deﬁnen los siguientes vectores de estado y de control:

X1 H Ẋ1 f1 U1 Qi
X= = ; Ẋ = = ; U= = (1.83)
X2 Θo Ẋ2 f2 U2 Φi

de modo tal que (1.76) y (1.82) toman la forma:

a 1
Ẋ1 = − X1 + X1 = f1 (1.84)
S S
a X2 1 X2 θa 1 θ i U1 1 U2
Ẋ2 = − √ − + + + = f2 (1.85)
S X1 SρCp Rt X1 SρCp Rt X1 S X1 SρCp X1
Tomando derivadas parciales y haciendo notar que una barra sobre una variable
indica el valor estacionario de dicha variable, se obtiene:
∂f1 a 1/2 a
= − X =−
∂X1 2S 1 2S X 1
∂f1
= 0
∂X2
∂f1 1
=
∂U1 S
∂f1
= 0
∂U2
∂f2 a −3/2 1 θa θi 1
= X2 X1 + X2 X1−2 − X −2 − U1 X1−2 − U2 X1−2
∂X1 2S SρCp Rt SρCp Rt 1 S SρCp
a X2 1 X2 θa 1 θi U 1 1 U2
= + − − −
2S 3 SρCp Rt X 2 SρCp Rt X 2 S X 2 SρCp X 2
X1 1 1 1 1

∂f2 a 1 1 1
= − −
∂X2 S X 1 SρCp Rt X 1
∂f2 θi 1
=
∂U1 S X1
∂f2 1 1
= (1.86)
∂U2 SρCp X 1

Luego el proceso tanque de agua linealizado queda como:

ẋ = Ax + Bu (1.87)

donde:
∂f1 ∂f1 ∂f1 ∂f1
A= ∂X1 ∂X2 B= ∂U1 ∂U2
∂f2 ∂f2 ∂f2 ∂f2
∂X1 ∂X2 ∂U1 ∂U2
24 Modelado de Sistemas No Lineales

Determinación de las Fuerzas de Control en Estado Estable

El actuador que emplea el sistema de control de temperatura trabaja en el rango
de voltaje de 1 a 5 V. Con 5 V, el calefactor proporciona un ﬂujo máximo de calor
de 7700 W, de acuerdo al manual del fabricante. Asumiendo una correspondencia
lineal entre el voltaje que ingresa al actuador y el ﬂujo de calor entregado, entonces
para subir 1 V en dicho actuador (de 1 a 2 V o de 4 a 5 V por ejemplo), se debe de
proporcionar 7700/4 = 1925 W.
El cálculo de las matrices A y B requiere conocer los valores de Qi = U 1 y
Φi = U 2 . Para ello, experimentalmente se mantuvo en el tanque una altura de H
= 0.11 m a una temperatura de 27.5 o C. Luego, se subió en 1 V al actuador (se
incrementó el calor en 1925 W), hasta que la nueva temperatura en el tanque se
estabilizó en 27.5 o C a una altura de 0.12 m. Por consiguiente, los valores a tomar
en los cálculos son U 1 = 0.16 m3 /h, correspondiente a una altura de H = 0.12 m
(determinado anteriormente) y = U 2 = 1925 W.

1.2. Método de Las Ecuaciones de Lagrange

1.2.1. Las Ecuaciones de Lagrange
Las ecuaciones diferenciales que gobiernan el movimiento de complicados sis-
temas mecánicos, se pueden obtener empleando las ecuaciones de Lagrange, las cuales
se derivan de las leyes de Newton del movimiento. El método de las ecuaciones de
Lagrange considera cantidades escalares (energı́as potencial y cinética) en lugar de
vectores (fuerzas y torques), minimizando ası́ la necesidad de complicados diagramas
vectoriales.
El modelo dinámico del sistema obtenido con el método de las ecuaciones de
Lagrange será denominado modelo de Lagrange. Este modelo también nos permite
determinar el modelo en el espacio de estado. El método en cuestión requiere de
la representación del proceso mediante un conjunto de coordenadas generalizadas qi
(i = 1, 2, . . . , r), una para cada grado de libertad independiente del proceso. Luego, la
energı́a cinética V y la energı́a potencial U se formulan en términos de tales coorde-
nadas y de sus derivadas con el ﬁn de establecer la función Lagrangiana del proceso,
la cual toma la forma:

L = V (q1 , . . . , qr , q̇1 , . . . , q̇r ) − U (q1 , . . . , qr , q̇1 , . . . , q̇r ) (1.88)

De la ecuación (1.88), es claro que: L = L(q1 , . . . , qr , q̇1 , . . . , q̇r ). Por otra parte, de
acuerdo al principio de de la mı́nima acción de Hamilton para sistemas conservativos,
la integral I deﬁnida por:
t2
I= L(q1 , . . . , qr , q̇1 , . . . , q̇r )
t1

es un extremo para la trayectoria de movimiento del sistema desde el tiempo t1 hasta

el tiempo t2 . En adición, la variación de I es igual al trabajo realizado por fuerzas
externas. Basado en el principio de Hamilton, se puede demostrar que las ecuaciones
que gobiernan el movimiento de un proceso dinámico constituyen las ecuaciones de
1.2 Método de Las Ecuaciones de Lagrange 25

Lagrange [1], [2]:

d ∂L ∂L
− = Qi i = 1, 2, . . . , r (1.89)
dt ∂ q̇i ∂qi
donde Qi indica las fuerzas y torques generalizados que son externos al proceso o no
son obtenibles a partir de una función potencial escalar. Si asignamos una variable de
estado para cada coordenada generalizada qi y otra para su derivada q̇i , tendremos
entonces 2r ecuaciones diferenciales de segundo orden de la forma dada en (1.89)
correspondientes al sistema de r grados de libertad.

1.2.2. Manipulador Robótico Traslacional (MRT)

Descripción del Sistema

La ﬁgura 1.11 ilustra el manipulador robótico (MRT) de 2 GDL. M1 es un

servomotor DC que posee un mecanismo de reducción por engranajes y un codifi-
cador óptico y está articulado a una polea de radio rp . Esta polea usa un cable para
transmitir la fuerza F para accionar el movimiento de traslación de un carro de masa
mc montado sobre un par de rieles a lo largo de un eje x. M2 es también un servo-
motor con codificador óptimo y mecanismo de reducción, empleado para accionar el
movimiento rotatorio del brazo (el eslabón) del MRT alrededor de un pivote ubicado
en el CG (Centro de Gravedad) del carro. Asumiremos que M1 y M2 poseen los mis-
mos parámetros. En la figura 1.11, θ es la posición angular del brazo de longitud L y
masa mb , r es la posición longitudinal del carro y Ff es la fuerza de fricción opuesta
al movimiento del carro. Al extremo del brazo se puede articular una mano o efector
final para diferentes propósitos.
El sistema MRT es multivariable cuadrado, denominado ası́ por poseer dos
entradas: los voltajes KA1 u1 y KA2 u2 aplicados los terminales de las armaduras de
M1 and M2 respectivamente, y dos salidas: r y θ. Los parámetros KA1 y KA2 son las
ganancias de los amplificadores. La tabla 1.4 muestra los valores de los parámetros
del sistema MRT.
y M
3 Gripper of
mass m H M3

θ1 L1cos θ 1
M 1 Pulley Gripper
(lateral view)
M2 Link
Cart x Rp

F F1 Pulley

r L1 sinθ 1

Figura 1.11: El manipulador robótico traslacional (MRT).

26 Modelado de Sistemas No Lineales

Tabla 1.4: Parámetros valorados del sistema MRT. La abreviatura C.M. signiﬁca
Centro de Masa.
Sı́mbolo Descripción Valor Unidades
u 1 , u2 Voltaje de entrada al sistema V
KA Ganancia del ampliﬁcador 15
Va1 , Va2 , Voltaje de armadura V
Ra Resistencia de armadura 2 Ω
La Inductancia de armadura 0.002 H
ia 1, ia2 Corriente de armadura A
Km Constante del torque motor 31.071×10−3 N-m/A
Tm1 , Tm2 Torque motor N-m
Tg1 Torque de entrada a los engranajes N-m
Tg2 Torque de salida de los engranajes N-m
Jm Momento de inercia del motor 1.9062×10−6 kg-m2
Jg Momento de inercia de los engranajes ∼
=0 kg-m2
Jp Momento de inercia de la polea kg-m2
Jh Momento de inercia del efector kg-m2
JL Momento de inercia en la carga kg-m2
Jb Momento de inercia del brazo kg-m2
Jeq1 , Jeq2 Momento de inercia equivalente 4.2×10−6 kg-m2
Beq1 , Beq2 Constante de fricción equivalente 3.36×10−6 N-m-s/rad
Bm Constante de fricción del motor 1.8338×10−6 N-m/rad/s
Bg Constante de fricción en engranajes N-m/rad/s
BL Constante de fricción en la carga N-m-s/rad
Bp Constante de fricción (punto pivote) 1.92×10−3 kg-m2 /s
Bj Constante de fricción de la articulación 1.92×10−3 kg-m2 /s
F Fuerza aplicada al carro N
Ff Fuerza de rozamiento N
Fc Constante de fricción del carro 2.81 kg/s
mh Masa del efector kg
mb Masa del brazo 0.103 kg
mc masa del carro 0.9574 kg
mp masa de la polea 0.2 kg
L Longitud del brazo 0.225 m
rh Distancia: C.M. del efector al brazo ∼
=0 m
rp Radio de la polea 0.05 m
r Posición del carro m
L Longitud del brazo 0.225 m
xh , xb Posiciones horizontales m
yh , yb Posiciones verticales m
Vb1 , Vb2 Voltaje contraelectromotriz V
Kb Constante contraelectromotriz 25×10−3 V-s/rad
g Aceleración de la gravedad 9.81 m/s2
N 1 , N2 N o de dientes de los engranajes N2 > N 1
n Relación de engranajes (n = N2 /N1 ) 12.5
θm Posición angular del motor rad
θ Posición angular del brazo rad
ω Velocidad angular de la carga rad/s
ωm Velocidad angular del motor rad/s
1.2 Método de Las Ecuaciones de Lagrange 27

Ecuaciones de Lagrange del Sistema MRT

Las ecuaciones de Lagrange del sistema MRT mostrado en la ﬁgura 1.11 se
determinan empleando el método descrito en la sección 1.2.

Ecuaciones de Energı́a del Carro

El carro está conﬁnado a moverse en la dirección horizontal. Su energı́a cinética
V1 y su energı́a potencial U1 vienen dadas por:
1
V1 = mc ṙ2 U1 = 0 (1.90)
2

Ecuaciones de Energı́a del Brazo

Sea mh la masa del efector ﬁnal más su carga. La energı́a cinética almacenada
por el brazo es:
1 1
V2 = mh ẋ2h + ẏh2 + mb ẋ2b + ẏb2 (1.91)
2 2
De la ﬁgura 1.11 obtenemos:
L L
xh = r + Lsen θ xb = r + sen θ yh = Lcos θ yb = cos θ
2 2
Por consiguiente, V2 como una función de las coordenadas generalizadas r y θ se
expresa como:

1 2 1 1 1
V2 = (mh + mb )ṙ + (2mh + mb )Lṙθ̇cos θ + mh + mb L21 θ̇2 (1.92)
2 2 2 4

La energı́a potencial almacenada en el brazo es:

L mb
U2 = mh g Lcos θ + mb g cos θ = mh + gLcos θ (1.93)
2 2
La función lagrangiana toma la forma:

L = V − U = (V1 + V2 ) − (U1 + U2 )

Las Ecuaciones de Lagrange del Sistema MRT

Las ecuaciones de Lagrange para las coordenadas generalizadas r y θ del MRT se
formulan como:

d ∂L ∂L
− = F − Ff Ff = Fc ṙ (1.94)
dt ∂ ṙ ∂r

d ∂L ∂L
− = TL − T p Tp = Bp θ̇ (1.95)
dt ∂ θ̇ ∂θ

donde F es la fuerza generada para mover al carro, Ff es la fuerza de fricción actuando

en el carro, Fc es la constante de fricción, TL es el torque generado para accionar el
brazo, Tp = Bp θ̇ es el torque de fricción actuando en el punto pivote localizado en el
28 Modelado de Sistemas No Lineales

carro, y Bp es su correspondiente constante de fricción viscosa. Reemplazando L en

(1.94) y (1.95) y operando, se obtiene:
mb mb 2
F = (mc + mh + mb )r̈ + mh + Lθ̈cos θ − mh + Lθ̇ sin θ + Fc ṙ (1.96)
2 2

1 2 mb mb
TL = mh + mb L θ̈ + mh + Lr̈cos θ − mh + Lg sin θ + Bp θ̇ (1.97)
4 2 2
Partiendo de (1.96) y (1.97) podemos determinar el modelo de Lagrange del sistema
TRM. Sin embargo, si estamos interesados en tener como fuerzas de control los volta-
jes de armadura u1 y u2 en lugar de F y TL respectivamente, entonces se requiere
modelar los susbsistemas eléctricos del sistema en la forma usual.

Modelado del Servomotor M1 Accionando la Polea

La ﬁgura 1.12 muestra el servomotor M1 articulado a la polea. Despreciando la
inductancia de armadura La , el voltaje de entrada KA u1 aplicado a la armadura es:

Ra ia1 + Vb1 = KA u1 (1.98)

El voltaje de fuerza contraelectromotriz es proporcional a la velocidad del servomotor,

es decir:
Vb1 = Kb θ̇m1 (1.99)
La ecuación del torque motor Tm1 está dada por (ver ﬁgura 1.12):

Ra La θ m1

+ + 111
000
Tm1 Tg1
J
000 B gg Pulley
111
u1 Vb 1
- KA - 111
000
B
000
111
n 000
111
Ia 1 Jm m F1
Rp
Tg2

Figura 1.12: Servomotor M1 articulado a la polea.

Tm1 = Jm θ̈m1 + Bm θ̇m1 + Tg1 (1.100)

El torque Tg2 requerido para mover a la polea se expresa como:

θ̈m1 θ̇m1
Tg2 = nTg1 = (Jg + Jp ) + (Bg + Bp ) + F Rp (1.101)
n n
donde n > 1 es la relación de dientes de los engranajes del mecanismo de reducción,
Jm , Jg y Jp son los momentos of inercia de la armadura, del mecanismo de reducción
y de la polea respectivamente, mientras que Bm , Bg y Bp son las constantes de
fricción de la armadura, del mecanismo de reducción y de la polea respectivamente.
1.2 Método de Las Ecuaciones de Lagrange 29

La relación Tg2 = nTg1 se obtiene asumiendo que los engranajes son ideales. En esta
situación, el principio de conservación de energı́a requiere que:

θm1
Tg1 θm1 = Tg2
n
El torque servomotor Tm1 es proporcional a ia1 :

Tm1 = Km ia1 (1.102)

El movimiento rotacional de la polea se puede transformar en el movimiento trasla-

cional del carro usando la relación (ver ﬁgura 1.12):

θm1
r= rp (1.103)
n
Usando las ecuaciones (1.98), (1.99), (1.100), (1.101), (1.102) y (1.103) podemos
obtener:
Km KA Jeq1 Beq1 nKm Kb
F = u1 − r̈ − + ṙ (1.104)
rp Ra nrp2 nrp2 nrp2
donde:
Jeq1 = n2 Jm + Jg + Jp Beq1 = n2 Bm + Bg + Bp

Modelado del Servomotor M2 Accionando el Brazo

La ﬁgura 1.13 muestra al servomotor M2 articulado al punto pivote localizado
en el CG del carro. Sabemos que M1 y M2 poseen los mismos parámetros por ser
similares. Despreciando la inductancia de armadura La , podemos formular:

Ra ia2 + Vb2 = KA u2 (1.105)

donde:
Vb2 = Kb nθ̇ (1.106)
La ecuación del torque motor Tm2 es (ver ﬁgura 1.13):

Ra La
nθ1
Tm2 Tg1
Jg
000
111
+ + +
Bg
u Va2 Vb2
-
2
KA - - 111
000
Bm
00 θ 1
11
Ia2
Jm n 11T
00
Tg2 L

Figura 1.13: Servomotor M2 articulado al punto pivote del carro

Tm2 = Jm nθ̈1 + Bm nθ̇ + Tg1 (1.107)

30 Modelado de Sistemas No Lineales

El torque Tg2 requerido para mover el brazo se expresa como:

Tg2 = nTg1 = Jg θ̈1 + Bg θ̇1 + TL (1.108)

donde TL es el torque de carga. El torque motor Tm2 es proporcional a ia2 :

Tm2 = Km ia2 (1.109)

Empleando las ecuaciones (1.105), (1.106), (1.107), (1.108) y (1.109) se puede de-
mostrar que:

n2 Km Kb nKm Kb
TL = −Jeq2 θ̈1 − Beq2 + θ̇1 + u2 (1.110)
Ra Ra

donde:
Jeq2 = n2 Jm + Jg Beq2 = n2 Bm + Bg

El Modelo de Lagrange del Sistema MRT

Igualando (1.96) con (1.104) y (1.97) con(1.110) el modelo de Lagrange del

proceso MRT toma la forma:

u1 = m11 r̈ + p11 ṙ + m12 θ̈cos θ + p12 θ̇2 sin θ (1.111)

u2 = m22 θ̈ + p22 θ̇ + m21 r̈ cos θ + d2 sin θ (1.112)

Las ecuaciones (1.111) y (1.112) se pueden transformar en su forma matricial como

sigue:

r u1
M(q)q̈ + P(q, q̇)q̇ + d(q) = u q= u= (1.113)
θ u2

donde:

m11 m12 cos θ p11 p12 θ̇sin θ 0
M= P= d(q) =
m21 cos θ m22 0 p22 d2 sin θ

Ra r p Jeq1 Ra r p L mb
m11 = mc + mh + mb + 2 2 ; m12 = mh +
Km KA n rp Km KA 2
Ra L mb Ra mb 2
m21 = mh + ; m22 = Jeq2 + mh L2 + L
nKA Km 2 nKA Km 4

Ra r p Beq1 nKm Kb Ra rp L mb
p11 = Fc + 2 2 + ; p 12 = − m h +
KA Km n rp Ra rp2 KA Km 2

Ra n2 Km Kb Ra Lg mb
p22 = Beq2 + Bp + ; d2 = − mh +
nKa Km Ra nKa Km 2

Ejemplo 1.2
1.2 Método de Las Ecuaciones de Lagrange 31

Para el sistema péndulo mostrado en las ﬁguras 1.5 y 1.6 asuma que lv = le = l y
mv = 0. Determinar el modelo en el espacio de estado del sistema para variaciones
pequeñas de la posición θ, empleando primero las ecuaciones de Lagrange y luego las
leyes de la fı́sica.

Solución: De la ﬁgura 1.6 se observa que:

ze = z + l senθ ye = l cosθ

El carro sólo se mueve en la dirección horizontal. Su energı́a cinética es:

1
Vc = mc z 2
2
Como la esfera se mueve en las direcciones horizontal y vertical, su energı́a cinética
es:
1
Ve = me (że2 + ẏe2 )
2
La única energı́a potencial se almacena en la esfera:

Ue = me gye

Operando las relaciones anteriores se puede demostrar que la función de Lagrange L

toma la forma:
1 1
L = Vc + Ve − Ue = (mc + me )ż 2 + me lcosθ ż θ̇ + me l2 θ̇2 − me glcosθ
2 2
Las ecuaciones de Lagrange para las coordenadas generalizadas (z, θ) son:

d ∂L ∂L d ∂L ∂L
− =F − =0
dt ∂ ż ∂z dt ∂ θ̇ ∂θ
Efectuando las operaciones correspondientes, resulta:

(mc + me )z̈ + me l cosθθ̈ − me lθ̇2 senθ = F

me l cosθz̈ + me l2 θ̈ − me gl senθ = 0 (1.114)

Para pequeñas variaciones de theta, podemos asumir que:

sen θ ∼
=θ cos θ ∼
=1 θ̇2 θ ∼
=0

Por lo tanto, las ecuaciones anteriores se convierten en:

(mc + me )z̈ + me lθ̈ = F me z̈ + me lθ̈ − mgθ = 0

Seleccionado como variables de estado x1 = z, x2 = θ, x3 = ż y x4 = θ̇, empleando las

ecuaciones anteriores se puede encontrar la siguiente ecuación de estado con u = F :

ẋ = Ax + Bu
   
0 0 1 0 0
 0 0 0 1   0 
A=
 0 −me g 
 B=
 1


mc 0 0 mc
0 g(mc +me )
M cl 0 0 − m1c l
32 Modelado de Sistemas No Lineales

Aplicando las leyes fı́sicas, para los movimientos horizontal y rotacional, de acuerdo
a las relaciones (1.37) y (1.41) se obtiene:

d2 d2
mc z + me 2 ze = F
dt2 dt
Je θ̈ = me gl sen θ − me z̈l cos θ
Sustituyendo las relaciones ze = z + l senθ, ye = l cosθ en la primera ecuación y
Je = me l2 en la segunda, se obtienen las ecuaciones dadas en (1.114). ♣

1.3. El Método de Lagrange–Euler

El método de Lagrange-Euler (o simplemente método L-E) usado básicamente
para modelar manipuladores robóticos, emplea el el procedimiento de Denavit–Hartenberg
(o simplemente procedimiento D–H) conjuntamente con el procedimiento L–E. Mien-
tras que el procedimiento D–H permite representar los sistemas de coordenadas de
un manipulador mediante cadenas cinemáticas de lazo abierto, el procedimiento L–
E determina el modelo dinámico del proceso, el cual denominaremos modelo L–E.
Un estudio completo del método de L–E se puede encontrar en [4], [5], [6], [7]. El
resultado ﬁnal de este estudio se describe a continuación.

1.3.1. El Procedimiento de Denavit–Hartenberg

Un manipulador robótico se compone de una secuencia de cuerpos rı́gidos (los
eslabones) unidos mediante articulaciones rotatorias o prismáticas (de deslizamien-
to). Cada par eslabón–articulación representa un Grado de Libertad (GDL). Por con-
siguiente, un manipulador con n GDL posee n pares eslabón–articulación. Se puede
establecer un sistema de coordenadas ortonormales dextrógiro (xi , yi , zi ) para ca-
da articulación i, donde i = 1, . . . , n. Como se sabe, los sistemas de coordenadas
dextrógiro cumplen con la regla de la mano derecha. El manipulador normalmente
está articulada a una base soporte (el eslabón 0). El sistema de coordenadas de la
base se define como (x0 , y0 , z0 ) y es también el sistema de coordenadas inerciales
del manipulador. El sistema de coordenadas aumentado de la base se define como
(x0 , y0 , z0 , 0).
Usualmente, en el último eslabón del manipulador se articula una mano o efector
final (por ejemplo, una herramienta). Esto significa que el sistema de coordenadas
(xn , yn , zn ) corresponde al efector final del manipulador.
El procedimiento de D–H (Denavit-Hartenberg) produce una matriz de trans-
formación homogénea de 4 × 4, la cual representa las coordenadas inerciales del ma-
nipulador. Para obtener dicha matriz de transformación, se requiere establecer las
coordenadas (xi , yi , zi ) del manipulador para i = 0, . . . , n de modo tal que nos permi-
ta determinar los parámetros correspondientes a cada par eslabón–articulación, tal
como se verá más adelante.

El Sistema de Coordenadas D–H del Manipulador

Cada sistema de coordenadas dextrógiro D–H (xi , yi , zi ), i = 0, . . . , n, se es-
tablece conforme a las siguientes reglas:
1.3 El Método de Lagrange–Euler 33

1. El eslabón 0 corresponde al eslabón de la base ﬁja del manipulador y el es-

labón 1 corresponde al primer eslabón móvil del mismo. Por consiguiente, la
primera articulación corresponde al primer grado de libertad del manipulador
y ası́ sucesivamente.
2. Si una articulación es rotatoria, su eje será su propio eje de giro. En cambio, si
es prismática, el eje se ubica a lo largo del desplazamiento de la articulación.
3. La ubicación del sistema de coordenadas dextrógiro base o ﬁjo (x0 , y0 , z0 ) es de
libre elección, siempre que el eje z0 se ubique a lo largo del eje de movimiento
(rotatorio o prismático) del primer eslabón.
4. El eje zi se alinea con el eje de movimiento (rotatorio o prismático) de la i − 1-
ésima articulación.
5. El origen del i-ésimo sistema de coordenadas se ubica en la intersección de los
ejes zi y zi−1 si ambos se cortan, o en la intersección del eje zi con la normal
común a los ejes zi y zi−1 .
6. El eje xi es normal común a los ejes zi−1 y zi .
7. Aplicar la regla de la mano derecha en la i-ésima articulación para determinar
yi .
8. Generalmente la n-ésima articulación es del tipo rotatorio. El sistema de co-
ordenadas (xn , yn , zn ) se puede ubicar en el extremo del manipulador, siempre
que el eje zn coincida con la dirección del eje zn−1 y apuntando hacia afuera
del manipulador. El eje xn será normal a los ejes zn−1 y zn .

Los Parámetros D–H para cada par Eslabón–Articulación

Para describir completamente una articulación de revolución o una prismática,
se requiere de cuatro parámetros geométricos, a saber: θi , di , ai , y αi . Estos parámet-
ros, denominados los parámetros D–H, están asociados con cada par articulación–
eslabón del manipulador. Luego de establecer los sistemas de coordenadas del ma-
nipulador, los parámetros D–H se pueden determinar como sigue.
1. Obtener θi , el cual es el ángulo que hay que girar desde el eje xi−1 alrededor
del eje zi−1 hasta que los ejes xi−1 y xi queden paralelos. Este ángulo resulta
la variable de la articulación i si dicha articulación es rotatoria.
2. Obtener di , la cual es la distancia medida desde el origen del sistema de co-
ordenadas (i − 1)-ésimo a lo largo del eje zi−1 , necesaria para hacer coincidir
los ejes xi−1 y xi . Esta distancia resulta la variable de la articulación i si dicha
articulación es prismática.
3. Obtener ai , la cual es la distancia medida a lo largo del eje xi necesaria para
hacer coincidir el origen del (i − 1)-ésimo sistema de coordenadas con el origen
del (i)-ésimo sistema de coordenadas.
4. Obtener αi , el cual es el ángulo de rotación desde el eje zi−1 hasta el eje zi
alrededor del eje xi , requerido para hacer coincidir los ejes del (i − 1)-ésimo
sistema de coordenadas con los ejes del (i)-ésimo sistema de coordenadas.
34 Modelado de Sistemas No Lineales

La Matriz de Transformación Homogénea D–H del Manipulador

La matriz de transformación homogénea D–H caracteriza a cada sistema de
coordenadas de un eslabón con su articulación, con respecto al sistema de coorde-
nadas de del eslabón anterior. Por consiguiente, un punto ri del i-ésimo sistema de
coordenadas se puede expresar como ri−1 en el i − 1-ésimo sistema de coordenadas
ejecutando las siguientes operaciones sucesivas:

1. T(z, θi ): rotación de un ángulo θi alrededor del eje zi−1 para alinear el eje xi−1
con el eje xi .

2. T(z, di ): traslación a lo largo del eje zi−1 de una distancia di para hacer coincidir
los ejes xi−1 y xi .

3. T(x, ai ): traslación a lo largo del eje xi de una distancia ai para hacer coincidir
los orı́genes (xi−1 , yi−1 , zi−1 ) y (xi , yi , zi ) ası́ como también el eje xi .

4. T(x, αi ): rotación de un ángulo αi alrededor del eje xi para hacer coincidir los
dos sistemas de coordenadas.

El producto de estas cuatro operaciones básicas produce la matriz de transfor-

mación homogénea D–H Ai−1 i para lograr una transformación completa del eslabón
i con respecto al eslabón i − 1, o de la articulación i con respecto a la articulación
i − 1. Por consiguiente:

Ai−1
i = T(z, θi )T(z, di )T(x, ai )T (x, αi )

    
Cθi −Sθi 0 0 1 0 0 0 1 0 0 ai 1 0 0 0
 Sθi Cθi 0 0   0 0   0   −Sαi 0 

=  0 1  0 1 0   0 Cαi 
0 0 1 0  0 0 1 di   0 0 1 0   0 Sαi Cαi 0 
0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 1
 
Cθi −Cαi Sθi Sαi Sθi ai Cθi
 Sθi Cαi Cθi −Sαi Cθi ai Sθi 
=
 0
 (1.115)
Sαi Cαi di 
0 0 0 1
donde C y S representan las funciones cos y sen respectivamente. La siguiente matriz
de transformación homogénea:

i
A0i = Ajj−1 = A01 A12 · · · Ai−1
i i = 1, 2, . . . , n (1.116)
j=1

determina la ubicación del i-ésimo sistema de coordenadas con respecto al sistema

de coordenadas base.

Ejemplo 1.3

Determinar los parámetros D–H y las matrices de transformación para el manipulador

esférico mostrado en la ﬁgura 1.14 y descrito n la subsección 1.3.3.
1.3 El Método de Lagrange–Euler 35

Tabla 1.5: Los parámetros D–H del manipulador esférico.

Joint θi di ai αi
1 θ1 b+h 0 90o
2 θ2 0 L2 00

Solución: Notar que la ﬁgura 1.14 ilustra los sistemas de coordenadas D–H del
manipulador esférico. La tabla 1.5 muestra los correspondientes parámetros D–H
extraı́dos de dicha ﬁgura. Por consiguiente, las matrices de transformación Ai−1
i (i
= 1, 2) del manipulador esférico toman la forma:
   
Cθ1 0 Sθ1 0 Cθ2 −Sθ2 0 L2 Cθ2
 Sθ1 0 −Cθ1 0   Sθ2 Cθ2 0 L2 Sθ2 
A01 = 
 0
 A12 =  
1 0 b+h   0 0 1 0 
0 0 0 1 0 0 0 1
 
Cθ1 Cθ2 −Cθ1 Sθ2 Sθ1 L2 Cθ1 Cθ2
 Sθ1 Cθ2 −Sθ1 Sθ2 −Cθ1 L2 Sθ1 Cθ2 
A02 = A01 A12 = 
 Sθ2
 ♣
Cθ2 0 L2 Sθ2 + b + h 
0 0 0 1

1.3.2. El Procedimiento de Lagrange–Euler

El procedimiento L–E requiere llevar a cabo los siguientes pasos:

1. Asignar a cada par eslabón–articulación del manipulador un sistema de coor-

denadas D–E.
2. Obtener las matrices de transformación homogénea Ai−1i para i = 1, . . . , n.
3. El efecto del movimiento de la articulación j en todos los puntos del eslabón i
se describe mediante las siguientes matrices Uij :

∂A0i A0j−1 Qj Aj−1
i if j ≤ i
Uij = = (1.117)
∂qj 0 if j > i

con A00 = I (la matriz identidad) y donde A0j−1 relaciona el (j −1)-ésimo sistema
de coordenadas con el sistema de coordenadas base, y:
 
0 −1 0 0
 1 0 0 0 
Qi = 
 0 0 0 0 
 si la articulación i es de rotación
0 0 0 0
 
0 0 0 0
 0 0 0 0 
Qi = 
 0
 si la articulación i es prismática
0 0 1 
0 0 0 0
36 Modelado de Sistemas No Lineales

4. Los efectos de interacción entre las articulaciones se expresan mediante las

siguientes matrices Uijk :
 j−1
 A0j−1 Qj Ak−1 Qk Ai
k−1
if i ≥ k ≥ j
∂Uij ∂ ∂A0i
Uijk = = = Ak−1 Qk Aj−1 Qj Aij−1 if i ≥ j ≥ k
0 k−1 (1.118)
∂qk ∂qk ∂qj 
0 if k > i or j > i

5. Obtener el tensor momento de inercia Ji de la i-ésima articulación (o la matriz

de inercia del eslabón) dada por:
 −Ix x +Iy y +Iz z 
i i
2
i i i i
−Ixi yi −Ixi zi mi x̄i
 Ixi xi −Iyi yi +Izi zi 
 −Ixi yi −Iyi zi mi ȳi 
Ji ==  2
Ixi xi +Iyi yi −Izi zi  (1.119)
 −Ixi zi −Iyi zi mi z̄i 
2
mi x̄i mi ȳi mi z̄i mi

donde (x̄i , ȳi , z̄i ) es el centro de gravedad (CG) del eslabón i con respecto al
i-ésimo sistema de coordenadas, Ixi , Iyi , Izi son los momentos de inercia con
respecto al sistema de coordenadas (xi , yi , zi ), mi es la masa del cuerpo i, x̄i ,
y¯i and z¯i son las distancias desde el CG del cuerpo i hacia el sistema de coor-
denadas (xi , yi , zi ), y Ixi yi , Iyi zi , Ixi zi , Ixi xi , Iyi yi , Izi zi son los correspondientes
momentos de inercia producto.
6. Obtener la matriz simétrica inercial de aceleración H de orden n × n, cuyos
elementos son:

Hik = T r Ujk Jj UTji i, k = 1, 2, . . . , n (1.120)
j=máx(i,k)

donde T r signiﬁca Traza y n es el número de GDL.

7. Obtener los términos hikm deﬁnidos por:

n

hikm = T r Ujkm Jj UTji i, k, m = 1, 2, . . . , n (1.121)
j=máx(i,k,m)

8. Obtener el vector no lineal de fuerzas de Coriolis y centrı́peta c de orden n × 1

cuyos elementos ci toman la forma:

n
n
ci = hikm q̇k q̇m (1.122)
k=1 m=1

9. Obtener el vector fuerza de gravedad d de orden n × 1 con elementos:

n

j j
di = −mj gUji r̄j i = 1, 2, . . . , n (1.123)
j=1

donde g = [gx0 gy0 gz0 0] es el vector ﬁla gravedad expresado en el sistema de

coordenadas base, y r̄jj = [x̄j ȳj z̄j 1]T (el elemento 1 es un factor de escala) es el
centro de masa del eslabón j y expresado en el j-ésimo sistema de coordenadas.
1.3 El Método de Lagrange–Euler 37

10. Finalmente, la ecuación dinámica del manipulador, el modelo L–E, toma la

forma:
T = Hq̈ + c + d (1.124)
donde T es el vector de torques y fuerzas aplicado a cada coordenada genera-
lizada qi . Si en (1.124) se cumple que:

c = Cq̇ (1.125)

entonces se obtiene el modelo de Lagrange del sistema:

T = Hq̈ + Cq̇ + d (1.126)

1.3.3. Manipulador Robótico Esférico (MRE)

Descripción del Proceso
La figure 1.14 muestra el proceso Manipulador Robótico Esférico (MRE) de
2GDL, donde M1 es un servomotor DC con codificador óptico que acciona el movimien-
to rotatorio de una base metálica (la base del MRE) articulada a su eje. Esta base
comprende un disco metálico de espesor d y radio rd unido a una barra metálica o
prisma de longitud b, sección a2 y masa mp y . La barra y el disco conforman un
cuerpo rı́gido con movimiento rotatorio alrededor del eje z0 . M2 es un servomotor
montado en el extremo libre de la barra y se emplea para accionar el movimiento
de rotación de un eslabón de longitud Lb (el brazo del manipulador) y masa mb .
Asumiremos que M1 y M2 son similares, por ello poseen los mismos parámetros. En
la figura 1.14, θ1 es la posición angular de la base y θ2 es la posición angular del
brazo. Al extremo del brazo se puede articular un efector final de de masa mh .
El manipulador MRT representa un sistema multivariable cuadrado, denomina-
do ası́ por poseer dos entradas: los voltajes KA1 u1 y KA2 u2 aplicado a los terminales
de las armaduras de M1 and M2 respectivamente, y dos salida: θ1 y θ2 . Los parámetros
KA1 y KA2 son las ganancias de los amplificadores. La tabla 1.6 muestra los valores
de los parámetros del sistema MRT.

El Modelo L–E del MRE

El modelo L–E del sistema MRE se determina aplicando el procedimiento de
Lagrange–Euler desarrollado en la subsección 1.3.2, como sigue.

Los Parámetros D–H del MRE

Ver la tabla 1.5, la cual se obtuvo en el ejemplo 1.3).

La Matriz de Transformación Homogénea Ai−1

i del MRE

Las matrices de transformación Aii−1 del MRE para i = 1, 2, se determinaron en el

ejemplo 1.3.
38 Modelado de Sistemas No Lineales

Tabla 1.6: Variables y parámetros del sistema MRE. Las abreviaciones C.G. y c.r.
significan centro de gravedad y con respecto, respectivamente.
Sı́mbolo Descripción Valor Unidad
md Masa del disco 0.4 kg
mp Masa de la barra o prisma 1.0 kg
mb Masa del brazo (eslabón) 0.1 kg
mh Masa del efector final kg
d Espesor del disco 0.01 m
rd Radio del disco 0.07 m
b Longitud de la barra 0.21 m
a Lado de la sección de la barra 0.044 m
Lb Longitud del brazo (eslabón) 0.3 m
Ly1 Longitud del C.G. c.r. a (x1 , y1 , z1 ) m
Lx2 Longitud del C.G. c.r. a (x2 , y2 , z2 ) m
Jh Momento de inercia del efector final kg-m2
Jm Momento de inercia de M1 y M2 1.8×10−4 kg-m2
Bm Constante de fricción de M1 y M2 1.83×10−6 N-m-s/rad
Jg1 , Jg2 Momento de inercia de los engranajes 5.63×10−5 kg-m2
Bg1 , Bg2 Constante de fricción en engranajes 7.05×10−5 N-m-s/rad
n Relación de engranajes de M1 y M2 18.5
Ra Resistencia de armadura de M1 y M2 2.8 Ω
La Inductancia de armadura de M1 y M2 1.5×10−3 H
Vb1 , Vb2 Voltaje contraelectromotriz V
Va1 , Va2 Voltaje de armadura 24 V
ia1 , ia2 Corriente de armadura 0.7 A
KA Ganancia del amplificador 14.9
Km Constante del motor de M1 y M2 0.9 N-m/A
Kb Constante contraelectromotriz 0.9 V-s/rad
u 1 , u2 Voltaje de entrada 1.4 V
g Constante gravitacional 9.81 m/s2
1.3 El Método de Lagrange–Euler 39

y
y x2 2
2 M3 x2
z2 Gripper M3
y
1111
0000
1 Link
L2 z2
q
2
M y
2 Lx2 1
z1 z1 x1 M2
x
1

Ly1 a a
Metallic bar b z
z0 0
of lenght b
: Axis is pointing
Disk away from the plane
h x0 y x y0
0 0
q q M1
1 Servomotor M 1 1

Frontal view Lateral view

Figura 1.14: El manipulador robótico esférico (MRE).

Determinación de las Matrices Uij

Para simpliﬁcar la notación, se emplean las relaciones siguientes: Si = senθi y Ci =
cosθi para i = 1, 2. Para el sistema MRE se cumple que:
 
0 −1 0 0
 1 0 0 0 
Q1 = Q2 = 
 0 0 0 0 
 (1.127)
0 0 0 0

Sustituyendo (1.127) en (1.117) se obtiene:

 
−S1 0 C1 0
 C1 0 S1 0 
U11 =   0
 U12 = 0
0 0 0 
0 0 0 0
 
−S1 C2 S1 S2 C1 −L2 S1 C2
 C1 C2 C1 S2 S1 L2 C1 C2 
U21 =  


0 0 0 0
0 0 0 0
 
−C1 S2 −C1 C2 0 −L2 C1 S2
 −S1 S2 S1 C2 0 −L2 S1 S2 
U22 =   C2

−S2 0 L2 C2 
0 0 0 0
40 Modelado de Sistemas No Lineales

Determinación de las Matrices Uijk

El empleo de (1.118) para el MRE produce:
 
−C1 0 −S1 0
 −S1 0 C1 0 
U111 =
 0
 U112 = U121 = U122 = 0
0 0 0 
0 0 0 0
 
−C1 C2 C1 S2 −S1 −L2 C1 C2
 −S1 C2 −S1 S2 C1 −L2 S1 C2 
U211 = 



0 0 0 0
0 0 0 0
 
S1 S2 S1 C2 0 L2 S1 S2
 −C1 S2 C1 C2 0 −L2 S1 C2 
U212 = 


0 0 0 0
0 0 0 0
 
S1 S2 S1 C2 0 L2 S1 S2
 −C1 S2 −C! C2 0 −L2 C1 S2 
U221 = 


0 0 0 0
0 0 0 0
 
−C1 C2 C1 S2 0 −L2 C1 C2
 −S1 C2 S1 S2 0 −L2 S1 C2 
U222 =  −S2

−C2 0 −L2 S2 
0 0 0 0

Determinación de la Matriz de Inercia del Eslabón Ji

La matriz de inercia del eslabón Ji del SRM se computa a partir de la relación (1.119)
con i = 1 para la base (disco más la barra) e i = 2 para el brazo L2 . La base sólo
posee movimiento rotacional alrededor del eje de giro y1 . Por consiguiente:

Ix1 x1 = Iz1 z1 = Ix1 y1 = Ix1 z1 = Iy1 z1 = 0

Iy1 y1 = Iy1d y1d + Iy1b y1b = 2I1

donde Iy1d y1d y Iy1p y1p son los M.I. (momentos de inercia) del disco y de la barra
con respecto al sistema de coordenadas (x1 , y1 , z1 ) (ver ﬁgura 1.14). Despreciando la
longitud del radio del servomotor M2 :

1 h
Iy1d y1d = md rd2 + md ( + b)2
2 2
1 b
Iy1p y1p = mp (a2 + a2 ) + mp ( )2
12 2
donde 12 md rd2 es el M.I. del disco girando en su eje de rotación, md ( h2 + b)2 es el M.I.
1
del disco con respecto al sistema (x1 , y1 , z1 ), 12 mp (a2 + a2 ) es el M.I. de la barra
1.3 El Método de Lagrange–Euler 41

girando en su eje de rotación (paralelo al lado b) y mp ( 2b )2 es el M.I. de la barra con

respecto al sistema (x1 , y1 , z1 ). Por consiguiente, J1 toma la forma:
 
−I1 0 0 0
 0 I1 0 −m1 Ly1 
J1 = 
 0

 (1.128)
0 I1 0
0 −m1 Ly1 0 m1

where m1 = md + mb + mM 2 y Ly1 es la distance desde el origen del sistema de

coordenadas (x1 , y1 , z1 ) al centro de gravedad de m1 .
El brazo presenta movimiento rotatorio alrededor del eje z2 . Por consiguiente:

Ix2 x2 = Iy2 y2 = Ix2 y2 = Ix2 z2 = Iy2 z2 = 0

y considerando al brazo una barra de masa mb y longitud Lb :

1 Lb
Iz2 z2 = mb L2b + mb ( )2 + Jh = 2I2
12 2
1
donde 12 mb L2b es el M.I. del brazo girando en un eje perpendicular a la barra y que
pasa por su C.M. y mb ( L2b )2 es le M.I. del brazo referido al sistema de coordenadas
(x2 , y2 , z2 ) (ver ﬁgura 1.14) y Jh es el M.I. de la mano del manipulador de masa mh ,
la cual incluye también la masa de la carga aplicada a la mano. Luego, la matriz J2
para i = 2 viene a ser:
 
I2 0 0 −m2 Lx2
 0 I2 0 0 
J2 = 

 (1.129)
0 0 −I2 0
−m2 Lx2 0 0 m2

donde: m2 = mb + mh , Lx2 es la distancia del sistema de coordenadas (x2 , y2 , z2 ) al

centro de gravedad de m2 .

Determinación de la matriz simétrica inercial de aceleración H

Empleando (1.120), los elementos de H se determinan como:
T
H11 = T r(U11 J1 U11 T
) + T r(U21 J2 U21 ) = 2I1 + (I2 + 2m2 Lx2 L2 − m2 L22 )cos2 q2
T T
H12 = T r(U22 J2 U21 )=0 H21 = T r(U21 J2 U22 )=0
T
H22 = T r(U22 J2 U22 ) = I2 + 2m2 Lx2 L2 − m2 L22
Por consiguiente:
H11 = 2I1 + H22 cos2 q2

Determinación de los términos hikm

Usando la relación (1.121) para el MRE, se obtiene:
T T
h111 = T r(U111 J1 U11 ) + T r(U211 J2 U21 )=0
42 Modelado de Sistemas No Lineales

T
h112 = T r(U212 J2 U21 ) = (m2 L22 − 2m2 L2 lc2 − I2 )senq2 cosq2
T
h121 = T r(U221 J2 U21 ) = (m2 L22 − 2m2 L2 lc2 − I2 )senq2 cosq2
T
h122 = T r(U222 J2 U21 )=0
T
h211 = T r(U211 J2 U22 ) = (2m2 L2 lc2 − m2 L22 + I2 )senq2 cosq2
T T T
h212 = T r(U212 J2 U22 ) = h221 = T r(U221 J2 U22 ) = h222 = T r(U222 J2 U22 )=0

El Vector Fuerza de Coriolis y Centrı́peta c = [ci ] del MRE

Usando (1.122), los elementos ci vienen a ser:

c1 = h111 q̇12 + h112 q̇1 q̇2 + h121 q̇2 q̇1 + h122 q̇22
= 2(m2 L22 − 2m2 L2 Lx2 − I2 )q̇1 q̇2 sin q2 cos q2 = −2H22 q̇1 q̇2 sin q2 cos q2
c2 = h211 q̇12 + h212 q̇1 q̇2 + h221 q̇2 q̇1 + h222 q̇22
= (2m2 L2 Lx2 − m2 L22 + I2 )q̇12 sin q2 cosq2 = H22 q̇12 sin q2 cosq2

Determinación del Vector Fuerza de Gravedad d

Aplicando (1.123) en el MRE se obtiene:

r̄11 = [0 − Ly1 0 1]T r̄22 = [−Lx2 0 0 1]T

g = [gx0 gy0 gz0 0] = [0 0 − g 0]

d1 = −m1 g U11 r11 − m2 gU21 r22 = 0 d2 = −m2 g U22 r22 = m2 gLx2 cos q2
donde g es la constante gravitacional.

El Modelo de Lagrange–Euler del sistema MRE

De acuerdo a (1.124), el proceso MRE se puede describir como:

T1
T= = H(q)q̈ + c(q, q̇) + d(q) (1.130)
T2
donde (suprimiendo los argumentos por simplicidad):

H11 H12 c1 d1
H= c= d=
H21 H22 c2 d2

T1 = H11 q̈1 + H12 q̈2 + c1 + d1 = H11 q̈1 + c1 (1.131)

T2 = H21 q̈1 + H22 q̈2 + c2 + d2 = H22 q̈2 + c2 + d2 (1.132)

El modelo de Lagrange del Sistema MRE

Siempre que c = Cq, el modelo de Lagrange dado por (1.126) se puede obtener
de (1.130). Sin embargo, si se requiere tener como fuerzas de de control los voltajes de
armadura u1 y u2 en lugar de T1 y T2 respectivamente, necesitamos entonces modelar
los subsistemas eléctricos del MRE como sigue.
1.3 El Método de Lagrange–Euler 43

Modelado de M1 Accionando la Base del SRM

La ﬁgura 1.15 muestra el servomotor M1 accionando la base del MRE. El voltaje de
entrada KA1 u1 aplicado a la armadura está dado por:

Ra1 La1

+ + + 111
000
Tm1 Tg1
000 B g1g1
111
J
u Va1 Vb1
-
1
KA1 - - 111
000
B m1
00 θ 1
11
I a1
J m1 n
1
T
11T
00
g2 1

Figura 1.15: Servomotor M1 accionando la base del MRE

Va1 = KA1 u1 = La1 I˙a1 + Ra1 Ia1 + Vb1 = La1 I˙a1 + Ra1 Ia1 + Kb1 n1 q̇1 (1.133)

en donde n1 es la relación de engranajes. El torque motor Tm1 está dado por:

Tm1 = Km1 Ia1 = Jm1 n1 q̈1 + Bm1 n1 q̇1 + Tg1 (1.134)

mientras que la ecuación del torque Tg2 requerido para accionar el primer eslabón se
expresa como:
Tg2 = nTg1 = Jg1 q̈1 + Bg1 q̇1 + T1 (1.135)
donde T1 es el torque de carga. Substituyendo (1.135) en (1.134) se obtiene:

n1 Km1 Ia1 = Jeq1 q̈1 + Beq1 q̇1 + T1 (1.136)

donde:
Jeq1 = n21 Jm1 + Jg1 Beq1 = n21 Bm1 + Bg1
Reemplazando (1.131) en (1.136) nos conduce a:

n1 Km1 Ia1 = Jeq1 q̈1 + Beq1 q̇1 + H11 q̈1 + C1 (1.137)

La derivada de (1.137) produce:

(3) (3) (3) d 3 q1

n1 Km1 I˙a1 = Jeq1 q1 + Beq1 q̈1 + H11 q1 + Ḣ11 q̈1 + Ċ1 q1 (1.138)
dt3
Empleando (1.133), (1.137), y (1.138), se encuentra que la ley de control u1 es:
(3) (3)
u1 = LT 1 (H11 q1 + Jeq1 q1 + Ḣ11 q̈1 + Beq1 q̈1 + Ċ1 )
+ RT 1 (Jeq1 q̈1 + Beq1 q̇1 + H11 q̈1 + C1 ) + NT 1 q̇1 (1.139)

donde:
La1 Ra1 n1 Kb1
LT 1 = RT 1 = NT 1 =
n1 KA1 Km1 n1 KA1 Km1 Km1
44 Modelado de Sistemas No Lineales

Modelando M2 Accionando el Brazo del MRE

La ﬁgura 1.15 muestra el servomotor M2 accionando el brazo del MRE. Siguiendo el

mismo procedimiento para determinar u1 , el voltaje de control u2 resulta:

u2 = LT 2 (H22 q23 + Jeq2 q23 + Beq2 q̈2 + Ċ2 + d˙2 )

+ RT 2 (Jeq2 q̈2 + Beq2 q̇2 + H22 q̈2 + C2 + d2 ) + NT 2 q̇2 (1.140)

donde:
Jeq2 = n22 Jm2 + Jg2 Beq2 = n22 Bm2 + Bg2

La2 Ra2 n2 Kb2

LT 2 = RT 2 = NT 2 =
n2 KA2 Km2 n2 KA2 Km2 Km2
Despreciando las inductancias de armadura de los servomotores M1 y M2 , es decir,

Ra2 La2

+ + + 111
000
Tm2 Tg1
000
111
J g2
B g2
u Va2 Vb2
-
2
KA1 - - 111
000
B m2
00 θ 2
11
Ia2
J m2 n2
Tg2
11T
00
2

Figura 1.16: Servomotor M2 accionando el brazo del MRE

ﬁjando en cero LT 1 y LT 2 en (1.139) y (1.140) respectivamente, los voltajes de control

u1 y u2 toman la forma:

u1 = RT 1 (Jeq1 q̈1 + Beq1 q̇1 + T1 ) + NT 1 q̇1 (1.141)

u2 = RT 2 (Jeq2 q̈2 + Beq2 q̇2 + T2 ) + NT 2 q̇2 (1.142)

mientras que el modelo de Lagrange del MRE viene a ser:

q1 u1
M(q)q̈ + P(q, q̇)q̇ + d(q) = u q= u= (1.143)
q2 u2

donde:
RT 1 (Jeq1 + 2I1 + H22 cos2 q2 ) 0
M(q) =
0 RT 2 (Jeq2 + H22 )

RT 1 (Beq1 − H22 q̇2 sin q2 cos q2 ) + NT 1 −RT 1 H22 q̇1 sin q2 cos q2
P(q, q̇) =
RT 2 H22 q̇1 sin q2 cos q2 RT 2 Beq2 + NT 2

0
d(q) =
RT 2 m2 g Lx2 cos q2
1.3 El Método de Lagrange–Euler 45

El Modelo No Lineal de Orden n = 4 en el Espacio de Estado

Para obtener un modelo el espacio de estado del MRE de orden n = 4 podemos
seleccionar las siguientes variables de estado: x1 = θ1 (posición angular de la base),
x2 = θ2 (posición angular del brazo), x3 = θ̇1 (velocidad angular de la base), y
x4 = θ̇2 (velocidad angular del brazo). Empleando tales variables de estado el modelo
de Lagrange del MRE dada en (1.143), el modelo no lineal de orden n = 4 en el
espacio de estado resulta:
   
ẋ1 f1 (x, u)
 ẋ2   f2 (x, u) 
ẋ =    
 ẋ3  = f (x, u) =  f3 (x, u)  (1.144)
ẋ4 f4 (x, u)
donde:
f1 (x, u) = x3 f2 (x) = x4
−[RT 1 (Beq1 − 2H22 x4 sin x2 cos x2 ) + NT 1 ]x3 + u1
f3 (x, u) =
RT 1 (Jeq1 + 2I1 + H22 cos2 x2 )
−(RT 2 Beq2 + NT 2 )x4 − RT 2 (H22 x23 sin x2 + m2 gLx2 )cos x2 + u2
f4 (x, u) =
RT 2 (Jeq2 + H22 )
La ecuación de estado para las salidas y1 = x1 and y2 = x2 toma la forma:

y1 h1 (x) 1 0 0 0
y= = = x (1.145)
y2 h2 (x) 0 1 0 0

El Modelo No Lineal de Orden n = 6 en el Espacio de Estado

Para obtener un modelo el espacio de estado del MRE de orden n = 6 podemos
seleccionar las siguientes variables de estado: x1 = θ1 (posición angular de la base),
x2 = θ2 (posición angular del brazo), x3 = θ̇1 (velocidad angular de la base), y
x4 = θ̇2 (velocidad angular del brazo), x5 = θ̈1 (aceleración angular de la base), and
x6 = θ̈2 (aceleración angular del brazo). Empleando las relaciones (1.139) y (1.140),
el modelo no lineal de orden n = 6 en el espacio de estado resulta:
   
ẋ1 f1 (x, u)
   
ẋ =  ...  = f (x, u) =  ..
.  (1.146)
ẋ6 f6 (x, u)
donde:
f1 (x) = x3 f2 (x) = x4 f3 (x) = x5 f4 (x) = x4
−P1 + u1 −P2 + u2
f5 (x) = f6 (x) =
LT 1 (H11 + J1 ) LT 2 (H22 + J2 )

P1 = LT 1 (Ḣ11 q̈1 + Beq1 q̈1 + Ċ1 ) + RT 1 (Jeq1 q̈1 + Beq1 q̇1 + H11 q̈ + C1 ) + NT 1 q̇1
P2 = LT 2 (Beq2 q̈2 + Ċ2 + d˙2 ) + RT 2 (Jeq2 q̈2 + Beq2 q̇2 + H22 q̈ + C2 + d2 ) + NT 2 q̇2
La ecuación de estado para las salidas y1 = x1 and y2 = x2 resulta:

y1 h1 (x) 1 0 0 0 0 0
y= = = x (1.147)
y2 h2 (x) 0 1 0 0 0 0
46 Modelado de Sistemas No Lineales

1.4. PROBLEMAS
Problema 1.1

Determinar el modelo de Lagrange del MRAE (manipulador robótico con articulación

elástica) descrito en la subsección 1.1.2, empleando el método de la ecuaciones de
Lagrange.
Problema 1.2
Para el manipulador robótico con articulación ﬁja mostrado en la ﬁgura 1.1 y descrito
en la subsección 1.1.1, determinar:
(a) Su modelo de Lagrange (ecuación (1.28)) aplicando las leyes fı́sicas.
(b) Su modelo de Lagrange (ecuación (1.28)) aplicando las ecuaciones de Lagrange.
(c) Su descripción no lineal en el espacio de estado (ecuaciones de estado y de salida).

Problema 1.3
Determinar la descripción no lineal en el espacio de estado del manipulador robótico
traslacional descrito en la subsección 1.2.2, para los casos siguientes:
(a) Despreciando la inductancia de armadura La de los servomotores.
(b) Sin despreciar la inductancia de armadura La de los servomotores.
Problema 1.4
Para el manipulador robótico esférico descrito en la subsección 1.2.2:
(a) Veriﬁcar su modelo L–E (ecuación (1.130)) aplicando las leyes fı́sicas.
(b) Veriﬁcar su modelo L–E (ecuación (1.130)) usando las ecuaciones de Lagrange.

Problema 1.5
La figura 1.17 ilustra un Manipulador Robótico Traslacional Subactuado (MRTS)
de 3 GDL. M1 es un servomotor DC que posee un mecanismo de reducción por
engranajes y un codificador óptico articulado a una polea de radio Rp . Esta polea
usa un cable para transmitir la fuerza F1 para accionar el movimiento de traslación
de un carro de masa Mc montado sobre un par de rieles a lo largo de un eje x. M2 es
también un servomotor con codificador óptimo y mecanismo de reducción, empleado
para accionar el movimiento rotatorio del primer eslabón del MRTS alrededor de
un pivote ubicado en el CG del carro. Este primer eslabón es también articulado a
un segundo eslabón. En esta segunda articulación se monta un codificador óptico de
masa despreciables para detectar la posición angular del segundo eslabón.
En la figura 1.17 θ1 es la posición angular del primer eslabón longitud L1 y
masa m1 , θ2 es la posición angular del segundo eslabón longitud L2 y masa m2 , r es
la posición longitudinal del carro y F es la fuerza de fricción opuesta al movimiento
del carro. El sistema MRTS a ser controlado a lazo cerrado, representa un sistema no
cuadrado porque posee dos entradas de control: los voltajes KA1 u1 y KA2 u2 aplicados
los terminales de las armaduras de M1 and M2 respectivamente, y tres salidas por
controlar: r, θ1 y θ2 . Los parámetros KA1 y KA2 son las ganancias de los amplifi-
cadores. La tabla 1.4 muestra los valores de los parámetros del sistema. El MRTS
1.4 PROBLEMAS 47

también se denomina subactuado porque el número de entradas (dos) es menor que

el número de salidas (3).
(a) Determinar el modelo de Lagrange del MRTS.
(b) Determinar las ecuaciones de estado y de salida del MRTS cuando La ∼
= 0.
(c) Determinar las ecuaciones de estado y de salida del MRTS cuando La = 0.

L2 Gripper M3
y
θ2
y M 3 Gripper of mass m H
u1 1 (lateral view)
M1 θ1 Link 2
Pulley Pulley
M2 L1
u2 Link 1
x Rp

F F1

r
x1

Figura 1.17: El manipulador robótico traslacional subactuado (MRTS).

Problema 1.6

La ﬁgure 1.18 muestra un Manipulador Robótico Esférico Subactuado (MRES) de 3

GDL, donde M1 es un servomotor DC con codificador óptico que acciona el movimien-
to rotatorio de una base metálica (la base del MRE) articulada a su eje. Esta base
comprende un disco metálico de espesor h y radio Rd unido a una barra metálica de
longitud b y sección a2 . La barra y el disco conforman un cuerpo rı́gido con movimien-
to rotatorio alrededor del eje z0 . M2 es un servomotor montado en el extremo libre de
la barra y se emplea para accionar el movimiento de rotación del primer eslabón de
longitud L2 y masa m2 . Este primer eslabón está articulado a un segundo eslabón de
longitud L3 y masa m3 . En esta segunda articulación se monta un codificador óptico
de masa despreciable para detectar la posición angular del segundo eslabón.
En la figura 1.18, q1 es la posición angular de la base, q2 es la posición angular
del primer eslabón y q3 es la posición angular del segundo eslabón. Las salidas q1 ,
q2 y q3 del sistema serán controladas a lazo cerrado. El sistema MRES representa
un sistema no cuadrado porque posee dos entradas de control: los voltajes KA1 u1 y
KA2 u2 aplicados los terminales de las armaduras de M1 and M2 respectivamente, y
tres salidas por controlar: q1 , q2 y q3 . Los parámetros KA1 y KA2 son las ganancias
de los amplificadores. La tabla 1.6 muestra los valores de los parámetros del sistema.
El MRES también se denomina subactuado porque el número de entradas (dos) es
menor que el número de salidas (tres).
(a) Determinar modelo L–E del MRES.
48 Modelado de Sistemas No Lineales

x3
y x
3 M3 3 y M3
Gripper 3
Link L 3
y
q
3
z
3 z3 1111
0000
y
2 Lx3 2
x2
y z2 x2
1 Link
L2 Encoder z2 Encoder
q
2
M y
2 Lx2 1
z1 z1 x1 M2
x
1

Ly1 a Metallic bar a

of lenght b b
z0 z0
: Axis is pointing
away from the plane
Disk
h x0 y x y0 h
0 0
q q M1
1 Servomotor M 1 1

Frontal view Lateral view

Figura 1.18: El manipulador robótico esférico subactuado (MRTS).

(b) Determinar el modelo de Lagrange del MRES.

(c) Determinar la ecuación de estado y de salida del MRES para La = 0.
(d) Determinar la ecuación de estado y de salida del MRES para La ∼
= 0.

Problema 1.7

La ﬁgura 1.19 muestra dos plataformas P1 y P2 de masas m1 y m2 acopladas por

resorte y actuadas hidráulicamente. Las salidas de este sistema son las posiciones
individuales y1 e y2 de las plataformas. Las señales de referencia se fijan mediante
los potenmciómetros RP1 y RP2. El objetivo de control en este problema consiste en
diseñar dos fuerzas de control (generadas por dos actuadores hidráulicos rápidos) que
lleven a cero suficientemente rápido los errores de posición e1 = r1 −y1 y e2 = r2 −y2 .
Asumir que el fluido hidráulico disponible proviene de una fuente a presión constante
y que la compresibilidad del fluido es despreciable.
Se sabe también que para desplazamientos pequeños de la salida ci (i = 1,2),
el flujo volumétrico Qi en el actuador está relacionado con el error ei y la presión
diferencial Pi a través del pistón mediante la relación:

dci
Qi = A = ke Gei − kP Pi
dt
donde A es la sección del pistón y G es la ganancia del ampliﬁcador. Para el sistema
descrito:
(a) Determine su modelo de Lagrange.
(b) Determine su modelo en el espacio de estado (ecuaciones de estado y de salida) .
1.4 PROBLEMAS 49

0110 e1

+ 1010 +
u1
0110 1010 0110
P1 0 0110 y
e1
r1 10 or Electric
10
1 1 e2 actuator
0110- R 1

-
Y1
u2
Return
K1 B1
1010+ +
0110 Pressure

P1 0 0110 y source
r2
0110 2
10
2
Return
0110- R2
1010 -
Y2
P 1 or P2
1010 K2 B2

10
y 1 or y 2
e2
111111111111111
000000000000000
Figura 1.19: Plataformas acopladas por resorte (izquierda) y su actuador hidráulico
(derecha).

Problema 1.8

Considere ahora que los dos actuadores hidráulicos del problema 1.7 se reemplazan
por cilindros neumáticos. Las ecuaciones que describen la dinámica de cada cilindro
neumático son:

ẏi = vi
−kyi − bvi + Api
v̇i =
m
RT Rv psupply ui − RT Rv pi − pi Avi
ṗi = i = 1, 2
Ayi

donde m = 0.05 kg es la masa del aire, b = 0.01 kg/s es el coeﬁciente de fricción, k

= 0.9 kg/s2 es el coeﬁciente de rigidez, A = 1.57×10−4 m2 es el área de la sección
del pistón, R = 287.05 m2 /K s2 es la magnitud de la constante para aire seco, Tmax
= 315.15 K y Tmin = 275.15 K son las temperaturas máxima y mı́nima del aire
en el cilindro, Rv max = 3.333×10−9 m s y Rv min = OOJJOOO ×10−9 m s son las
resistencias máxima y mı́nima de la válvula, y psupply es la presión de alimentación
del aire. Para este caso:
(a) Determine el modelo de Lagrange del sistema de plataformas.
(b) Determine el correspondiente modelo en el espacio de estado.

Problema 1.9

La ﬁgura 1.20 ilustra una columna de destilación para fraccionar petróleo pesado. El
modelo con tiempos muertos del fraccionador (ecuación (1.148)), en el cual p es el
operador de Laplace, se describe en [28] y [27]. Tal modelo considera tres variables
que deben de ser controladas: la composición de los productos de la parte superior
50 Modelado de Sistemas No Lineales

Y1 y lateral y2 de la columna, y la temperatura de fondos Y3 . Las señales o fuerzas

de control correspondientes (las variables manipuladas) son: el flujo superior U1 , el
flujo lateral U2 y el reflujo de fondos U3 . Considerar que que se dispone de la energı́a
calorı́fica requerida por la columna. Para el sistema en cuestión:
(b) Determine su modelo en el espacio de estado.
(a) Determine su modelo de Lagrange.
 
  4,05e−27p 1,77e−28p 5,88e−27p  
Y1 (p)  1+50p 1+60p 1+50p 
 5,39e−18p 5,72e−14p 6,9e−15p  U1 (p)
 Y2 (p)  =    U2 (p)  (1.148)
 1+50p 1+60p 1+40p 
Y3 (p)  4,38e−20p
4,42e −22p
7,2
 U 3 (p)
1+33p 1+44p 1+19p

T
LC
FC

Upper Top
Reflux Draw

T
Side
Intermediate
Reflux Stripper
T
T
T LC FC

Side
A Draw
LC
Bottoms
Reflux
F T
Feed Bottoms

Figura 1.20: Columna de destilación para fraccionar petróleo pesado.

Problema 1.10

El modelo dinámico del reactor quı́mico con chaqueta de enfriamiento ha sido tomado
de [29] y [27]. La ﬁgura 1.21 muestra este reactor en el cual ingresa un ﬂuido liquido
que contiene el producto A. Este liquido se revuelve dentro del tanque mediante
un agitador para formar una mezcla perfecta. El producto A en esta condición va a
experimentar una reacción irreversible exotérmica. Debido a que este tipo de reacción
libera calor, es entonces necesario que la temperatura en el interior del tanque sea
controlada por medio del agua de refrigeración que circula en la chaqueta que rodea
1.4 PROBLEMAS 51

al reactor. La reacción quı́mica del producto o componente A dentro del tanque para
formar el componente B se formula como:

A → B

Esta reacción se realiza a una velocidad especı́ﬁca K en horas−1 , cuya expresión se da

más adelante. Los parámetros y variables que intervienen en el sistema de reacción
(ver ﬁgura 1.21) son:

Product A
Ca 0 Fl Tl 0

11
00 11
00
Reactor

00
11 00
11
00
11 00
11
00
11 00
11
Tc Fc

00
11 Tl
00
11
00
11 00
11
00
11 00
11 Jacket
00
11 00
11
Coolant 00
11 A
Ca
B
Cb 00
11
Fc Tc 0 Products A and B
Ca Cb Fl Tl

Figura 1.21: Reactor quı́mico con chaqueta de enfriamiento.

1) A: producto que ingresa al reactor.

2) B: producto resultante de la transformación del producto A dentro del tanque.

3) Ca0 : concentración del producto A que ingresa al reactor.

4) Tl0 : temperatura del liquido que contiene el producto A.
5) F : Flujo del liquido que pasa a través del reactor. Cuando el flujo ingresa al
reactor, contiene solamente el producto A. Cuando el flujo sale del reactor,
contiene los productos A y B. Este flujo es la alimentación al reactor.
6) T : temperatura del liquido que sale del reactor.
7) Cb : Concentración del producto B a la salida del reactor y en el interior.
8) Ca : Concentración del producto A. Siempre debe de cumplirse la desigualdad:
Ca < Ca0 . En el estado estacionario se tiene: Ca + Cb = Ca0 .
9) Tc0 : temperatura del agua de refrigeración que ingresa a la chaqueta.
10) Tc : temperatura del agua de refrigeración en el interior y en la salida de la la
chaqueta.
11) Fc : flujo del agua de refrigeración.
52 Modelado de Sistemas No Lineales

Las concentraciones se dan en kmol/m3 , los ﬂujos en m3 /h y las temperaturas en

o C (grados Celcius). A continuación se muestran las ecuaciones diferenciales que

describen la dinámica del sistema. Para ello se aplican las leyes de conservación de la
masa y de la energı́a. Para hacer esto, se supone que no existe liquido acumulado en
el reactor, que las concentraciones y temperaturas son homogéneas y que las pérdidas
de energı́a hacia el exterior son despreciables. Las ecuaciones de balance de masa son:
d(V Ca )
= F Ca0 − V kCa − F Ca (1.149)
dt
d(V Cb )
= V kCa − F Cb (1.150)
dt
donde: F Ca0 es el flujo del componente A en kmol/h que ingresa al sistema, F Ca es
el flujo de A que sale del sistema, V es el volumen del liquido en el sistema, −V kCa
es la velocidad de formación de A (el signo negativo indica que el componente A
Ca )
se está consumiendo), d(Vdt es el flujo de A (en kmol/h) en transición, F Cb es el
flujo de B que sale del sistema, +V kCb es la velocidad de formación de B a partir
Cb )
de A (por esta razón posee signo positivo) y d(Vdt es el flujo de B (en kmol/h) en
transición. Las ecuaciones de balance de energı́a se formulan como:
d(V ρ Cp T )
= F ρ Cp T0 − F ρ Cp T − Q + V kCa H (1.151)
dt
d(Vc ρc Cp c Tc )
= Fc ρc Cp c (Tc0 − Tc ) + Q (1.152)
dt
donde: F ρ Cp T0 es el flujo calorı́fico entregado al sistema, F ρ Cp T es el flujo
calorı́fico que sale del sistema, Q es el flujo calorı́fico absorbido por el agua de re-
frigeración, V kCa H es flujo calorı́fico producido en la reacción debido a la entalpı́a
H de la reacción, d(V ρ Cp T )/dt es el flujo calorı́fico en transición (acumulado) en
el interior del tanque, Fc ρc Cp c (Tc0 − Tc ) es el flujo calorı́fico absorbido en el sistema
(refrigeración) y d(Vc ρc Cp c Tc )/dt es el flujo calorı́fico en transición (acumulado) en
la chaqueta del tanque. Todos los flujos calorı́ficos están en kJ/h, mientras que la
entalpı́a H posee unidades de kJ/kmol.
El balance de energı́a en el sistema asume que la temperatura Tc es uniforme en
toda la chaqueta. La transferencia de calor entre el sistema de reacción (que se realiza
a la temperatura T ) y el agua de refrigeración (que se realiza a la temperatura Tc ),
se describe mediante la relación:

Q = U S(T − Tc ) (1.153)

donde U es el coeﬁciente global de transmisión de calor en kJ/(h m2 K), S es la

superficie efectiva de transferencia de calor en m2 . Tener en cuenta que en general la
superficie S puede variar debido a los flujos que ingresan al reactor y cuando algunas
superficies dentro del tanque no están completamente cubiertas todo el tiempo con
la masa liquida de la reacción. La velocidad de reacción k en h−1 tiene la forma:

k = αe−Ea /R(272+T ) (1.154)

donde Ea es la energı́a de activación en kJ/kmol y R es la constante universal de los

gases. La tabla 1.7 muestra los valores nominales de los parámetros del sistema.
1.4 PROBLEMAS 53

El objetivo de control es estabilizar la temperatura T , ası́ como también la

concentración Cb a la salida del reactor, cumpliendo determinadas especificaciones
de diseño, tales como tiempo de estabilización, máximo sobrepico de las respuestas
controladas y error en estado estable de las respuestas con respecto a las señales de
referencia o “set points”. Las fuerzas de control para lograr este objetivo son el flujo
F del liquido y el flujo de refrigeración Fc . Para este sistema:

(a) Determine su modelo en el espacio de estado.

(b) Determine su modelo de Lagrange.
(c) Para un cambio escalón de 25 a 26 m3 /h en el flujo de alimentación F , graficar
la respuesta no lineal a lazo abierto correspondiente a Cb , T , Ca y Tc .
(d) Para un cambio de 1 m3 /h en el flujo de enfriamiento Fc , grafique la respuesta a
lazo abierto no lineal del sistema correspondiente a Cb , T , Ca y Tc .

Tabla 1.7: Parámetros nominales del reactor quı́mico con chaqueta de enfriamiento.

Sı́mbolo Descripción Valor Unidades

α Coeﬁciente de la velocidad de reacción 29.063 h−1

R Constante de los gases ideales 8.314 kJ/K kmol
Ea Energı́a de activación 2100 kJ/kmol
H Entalpı́a de reacción 2100 kJ/kmol
U Coeficiente global de transmisión de calor 4300 kJ/(h m2 K)
ρ Densidad del liquido 800 kg/m3
ρc Densidad del refrigerante 1000 kg/m3
Cp Calor especı́fico del lı́quido 3 kJ/(kg K)
Cp c Calor especı́fico del refrigerante 4.1868 kJ/(kg K)
S Superficie efectiva de intercambio de calor 24 m2
V Volumen del tanque 24 m3
Vc Volumen de la chaqueta 8 m3
Tl0 Temperatura del liquido entrante 34 oC

Tc0 Temperatura del refrigerante entrante 20 oC

Ca0 : Concentración del liquido de entrada 8 kmol/m3

Problema 1.11

El modelo dinámico no lineal de la aeronave mostrada en la ﬁgura 1.22 comprende

tres conjuntos de ecuaciones diferenciales de primer orden, involucrando las siguientes
variables:

Los ángulos ψ, θ y φ que caracterizan la posición del avión con respecto a los
54 Modelado de Sistemas No Lineales

llamados ejes del viento. El ángulo ψ, θ y φ se denominan de guiñada (yaw en

inglés), de cabeceo (pitch) y de alabeo (roll) respectivamente.

Las velocidades p, q y r son los componentes del vector velocidad angular w

con respecto a un cuadro referencial ﬁjo con la aeronave. Las componentes p, q
y r se denominan tasa pitch, tasa roll y tasa yaw respectivamente.

La amplitud V de la velocidad a lo largo de la trayectoria de vuelo, y dos ángulos

α y β que identiﬁcan la dirección del vector tangente a la trayectoria de vuelo
con respecto al eje de simetrı́a principal del avión. Tales ángulos se denominan
ángulo de ataque y ángulo de desplazamiento lateral. α es el ángulo entre la
tangente a la trayectoria de vuelo y el eje longitudinal en la dirección pitch, y
β es el ángulo entre la tangente a la trayectoria de vuelo y el eje longitudinal
en la dirección yaw.

Las derivadas con respecto al tiempo de los ángulos ψ, θ y φ son:

   
ψ̇ p∗
 θ̇  = M(ψ, θ, φ) w∗ w∗ =  q ∗ 
φ̇ r∗

donde w∗ es el vector velocidad angular expresado con respecto a los ejes del viento
y M es una matriz de la forma:
 
0 sin φ sec θ cos φ sec θ
M(ψ, θ, φ) =  0 cos φ − sin φ 
1 sin φ tan θ cos φ tan θ

El vector w se puede expresar como:

w∗ = J−1 S(w)Jw + J−1 T

donde S es la matriz de oblicuidad simétrica:

 
0 r −q
S(w) =  −r 0 p 
q −p 0

J es la matriz de inercia:
 
Ix 0 −Ixz
J= 0 Iy 0 
−Ixz 0 Iz

y T representa el vector de torques externos. Finalmente, las derivadas de V , α y β

con respecto al tiempo tienen la forma:

V̇ = −(D/m) − g sin θ
α̇ = q − q ∗ sec β − (p cos α + r sin α) tan β
β̇ = r∗ + p sin α − r cos α
1.4 PROBLEMAS 55

donde D es una cantidad escalar llamada la fuerza de arrastre, m es la masa del

avión y g es la aceleración de la gravedad. Para completar el modelo dinámico es
necesario especiﬁcar la relación de las tasas de p, q y r que aparecen en el primer y
tercer conjunto de ecuaciones, están relacionadas con las otras variables como sigue:

p∗ = p cos α cos β + (q − α̇) sin β + r sin α cos β

1
q∗ = (L − mg cos θ cos φ)
mV
1
r∗ = (−S + mg cos θ sin φ)
mV
en donde S y L son dos cantidades escalares denominadas fuerza lateral y de sus-
tentación respectivamente. Reemplazando p∗ , q ∗ y r∗ en las ecuaciones previas, y
resolviendo para α̇, se obtiene un sistema de nueve ecuaciones diferenciales de primer
orden en las variables ψ, θ, φ, p, q, r, V , α y β), las cuales pueden constituir las
variables de estado del sistema.
El vector de torque externos T y el vector columna fuerzas externas con ele-
mentos D, L y S, contienen las variables de entrada. T puede expresarse como:
    
a11 V 2 sin β + a12 rV + a13 pV b11 cos β 0 b13 cos β δa
T =  a21 V 2 + a22 V 2 sin α + a23 qV  +  0 b22 cos α 0   δe 
2
a31 V sin β + a32 rV + a33 pV 0 0 b33 cos β δr

en donde aij ’s y los bij ’s son los parámetros aerodinámicos ﬁjos que dependen de la
geometrı́a del avión, de la densidad del aire, etc., y δa , δe y δr denotan las deﬂexiones
del alerón, del elevador y del timón. El vector columna con elementos D, L y S se
puede expresar como:
     
D c11 V 2 + c12 V 2 cos α − cos α cos β
 L  =  c21 V 2 + c22 V 2 sin 2α  + P  sin α  δP
S 2
c31 V sin 2β cos α cos β

donde los cij ’s son parámetros de ganancia ﬁja, P indica el máximo empuje y δp la
posición del acelerador. Las ecuaciones presentadas describen un sistema cuyo estado
está deﬁnido en una cierta vecindad abierta U de R9 , sujeto a la acción del vector de
entrada u con elementos δa , δe , δr y δP .

(a) Determine el modelo no lineal en el espacio de estado de la aeronave.

Figura 1.22: Aeronave.

(b) Determine el modelo de Lagrange de la aeronave.

Problema 1.12
56 Modelado de Sistemas No Lineales

La ﬁgura 1.23 muestra un motor DC en el cual el voltaje de armadura se mantiene

constante mientras que el voltaje de campo es variable. El modelo de este motor ha
sido tomado de [11]. El balance eléctrico en el devanado del estator se describe como:

I Ls Φ
+ Rr Lr

Vr
Ω Rs
- I
- Vs +

Figura 1.23: Nonlinear DC motor.

dIs
Ls + Rs If = Vs
dt
donde Is es la corriente del estator, Vs es el voltaje del estator, Rs y Ls son la re-
sistencia e inductancia del devanado del estator respectivamente. El balance eléctrico
en el devanado del rotor resulta:
dIr
Lr + Rr Ir = Vr − E
dt
donde Ir es la corriente del rotor, Vr es el voltaje del rotor, Rr y Lr son la resistencia
e inductancia del devanado del rotor respectivamente, y E es el voltaje de fuerza
contra electromotriz. Considerando sólo fricción viscosa, el balance mecánico en la
carga está dado por:
dΩ
J + FΩ = T
dt
donde Ω representsa la velocidad angular del eje del motor, J denota la inercia de la
carga, F es la constante de fricción viscosa, y T es el torque de carga. Si Φ denota el
ﬂijo asociado con el devanado del estator, entonces:

E = Ke ΦΩ T = Km ΦIr Φ = Ls Is

donde Ke y Km son constantes. Asumiendo 100 % de eﬁciencia en la conversión de

energı́a, entonces Ke = Km = K. Para el sistema descrito considere que el voltaje
u = Vs es la entrada del sistema y seleccione como variables de estado: x1 = Is ,
x2 = Ir , x3 = Ω. Luego:

(a) Determine el modelo de Lagrange del motor DC.

(b) Determine el modelo en el espacio de estado.

Problema 1.13

La ﬁgura 1.24 muestra un manipulador robótico polar vertical de 2 GDL extraı́do de

[22].
(a) Determinar su modelo L–E.
(b) Determinar su modelo de Lagrange empleando las ecuaciones de Lagrange.
1.4 PROBLEMAS 57

Figura 1.24: Manipulador robótico polar vertical de 2GDL.

Problema 1.14

La ﬁgura 1.25 muestra un manipulador robótico polar horizontal de 2GDL extraı́do

de [22].
(a) Determinar su modelo L–E.
(b) Determinar su modelo de Lagrange empleando las ecuaciones de Lagrange.

Figura 1.25: Manipulador robótico polar horizontal de 2GDL.

Problema 1.15

La ﬁgura 1.4 muestra el manipulador robótico con articulación elástica tratado en

la subsección 1.1.2. Formular su modelo dinámico no lineal empleando las ecuaciones
de Lagrange.

Problema 1.16

La ﬁgura 1.26 muestra un servomotor con carga no lineal de dos grados de libertad
(2GDL). Notar que la carga posee dos grados de libertad. La unión de la carga
con el eje del servomotor no es ﬂexible. Asumir que la inductancia de armadura no
es despreciable. Formular el modelo dinámico no lineal del sistema empleando las
ecuaciones de Lagrange y las ecuaciones de la fı́sica.

Mo Ro
L1 τ
m1
’
Union
R θm no
+ Ν1 flexible
Lo θ
u Va eb
m
-
Jm
L Bm θ
Ν2 BL JL

Figura 1.26: Servomotor con carga no lineal de 2GDL. El acoplamiento de la carga

al eje del motor no es ﬂexible.

Problema 1.17 Péndulo Doble

58 Modelado de Sistemas No Lineales

La ﬁgura 1.27 muestra el proceso péndulo doble no lineal. El acoplamiento entre los
dos péndulos no es ﬂexible. Las varillas poseen longitud L1 y L2 . Despreciando la in-
ductancia de armadura, formular el modelo dinámico no lineal del sistema empleando
las ecuaciones de Lagrange y las ecuaciones de la fı́sica.

+ Fuerza de
u control
- τ
Servomotor
D.C. y
θ
z F

Carro

Figura 1.27: Sistema péndulo doble no lineal.

Problema 1.18 Doble Grúa Puente

La ﬁgura 1.28 muestra el proceso doble grúa puente no lineal. El acoplamiento entre
las dos secciones de la varilla no es ﬂexible. Las varillas poseen longitud L1 y L2 .
Despreciando la inductancia de armadura, formular el modelo dinámico no lineal del
sistema empleando las ecuaciones de Lagrange y las ecuaciones de la fı́sica.
+ Fuerza de
u control
-
Servomotor
D.C. y

z F

Carro

θ
z
Doble
y’ ’ puente
τ grua

Figura 1.28: Sistema doble grúa-puente.

1.5 Estructura en Tiempo Real 59

1.5. Estructura en Tiempo Real

La estructura en tiempo real mostrada en la ﬁgura 1.29 se emplea para la
implementación de los sistemas de control de posición de los manipuladores robóticos
y para el sistema de control del tanque de agua.

Figura 1.29: Estructura del sistema de control en tiempo real empleado.

Notar en la ﬁgura 1.29 que cualquier algoritmo de control se implementa en

la PC. De hecho, los algoritmos de control implementados en este trabajo, emplean
el lenguaje del software LabVIEW, versión 7.1. La interfaz entre la PC y el usuario
es una tarjeta de adquisición de datos PCI 6229 de NI (National Instrument). Las
señales medidas y generadas para cada sistema de control se discuten en las siguientes
secciones.

1.6. Sistema de Control del Manipulador de 1GDL

La ﬁgura 1.30 muestra la estructura en tiempo real para controlar la posición
angular del manipulador robótico de 1GDL. El sistema de control requiere la medición
de la posición angular, la cual se logra gracias al sensor de posición en cuadratura
(“encoder”) que posee el servomotor D.C. en su eje. La señal medida ingresa por
uno de los dos contadores que posee la tarjeta PCI 6229, ubicado en sus terminales
PFI (Programmable Function I/O). La señal medida se procesa en la PC empleando
LabVIEW. El detalle de la programación del contador se puede ver en los programas
60 Modelado de Sistemas No Lineales

Figura 1.30: Sistema de control en tiempo real para el manipulador robótico de 1GDL.

en tiempo real para controlar la posición del brazo robótico. Tales programas se
encuentran en el CD adjunto a este trabajo.
El algoritmo de control grabado en la PC procesa tal medición y genera una
señal de control. Esta señal resulta débil para poder alimentar directamente la ar-
madura el servomotor D.C. Por ello es que se procesa empleando la técnica de mod-
ulación por ancho de pulsos (en inglés PWM: Pulse Width Modulation) y luego pasa
a un ampliﬁcador con conﬁguración en H para darle el nivel de potencia adecuado
para hacer girar al servomotor en la dirección adecuada.

1.6.1. Generación de la señal PWM

La señal PWM se genera por software. Para ello se emplea el microcontrolador
PIC 16f877 de Microchip. La sigla PIC (Peripheral Interface Controller) significa que
tal dispositivo es un controlador de la interfaz periférica. El generador de PWM, cuyo
diagrama de flujo se muestra en la figura 1.31, genera pulsos de ancho diverso, en
concordancia con la señal generada por el algoritmo de control. Tal señal de control
puede variar en el rango de - 2.5 a 0 V para giro antihorario del servomotor, y de 0
a 2.5 V para giro horario. Esto significa que la posición (por ende la velocidad) del
servomotor varı́a de acuerdo a la magnitud del ancho del pulso generado.
Para que el PIC 16f877 trabaje con rangos positivos, mediante LabVIEW, el
rango de - 2.5 a 0 V se convierte en uno de 0 a 2.5 V, mientras que el rango de 0 a
2.5 V se convierte en otro de 2.5 a 5 V (ver figura 1.32). De este modo, las señales
de control en el rango de 0 a 5 V ingresan al PIC 16f877 por el pin RAO, tal como
se muestra en la figura 1.33. Estas señales se convierten en pulsos PWM que operan
a una frecuencia aproximada de 7.8 kHz, que luego de pasar por el amplificador en
1.6 Sistema de Control del Manipulador de 1GDL 61

H, obtienen el nivel adecuado de potencia para conmutar el giro del motor tal como
se explica en la siguiente sección. La subsección ?? muestra el código en lenguaje
ensamblador del programa para generar las señales PWM, mientras que la ﬁgura
1.33 muestra el diagrama circuital para realizar la placa del generador de pulsos
PWM empleando ORCAD.

Figura 1.31: Diagrama de ﬂujo para la generación de los pulsos PWM.

62 Modelado de Sistemas No Lineales

Figura 1.32: Rangos de trabajo en el PIC 16f877.

Figura 1.33: Diseño ORCAD para implementar la placa del generador de pulsos
PWM.

1.6.2. El Amplificador de Potencia

El Circuito Amplificador
Un circuito amplificador por conmutación puede ser construido de varias formas,
ya sea cambiando la frecuencia de conmutación, modificando el ciclo de trabajo (“duty
cycle”) o cambiando ambas. El efecto buscado en un método u otro es que el promedio
de voltaje de salida sea proporcional a la tensión de control. El método más común
de un conmutador amplificador es la modulación PWM (por ancho de pulso). En
nuestro caso, los dispositivos conmutadores, conmutan a una frecuencia constante,
dando como resultado la variación de la tensión de salida entre dos valores extremos.
Por variación del ancho de pulso o el duty cycle, el valor promedio de voltaje de salida
puede ser cambiado en forma proporcional a la tensión de control.
El conmutador amplificador implementado es del tipo H y su diagrama se mues-
tra en la figura 1.34. Dicho amplificador emplea dispositivos conmutadores MOSFET
IRFZ34 de 30 A y una fuente de 24 voltios y 8 A. La principal ventaja del conmutador
1.6 Sistema de Control del Manipulador de 1GDL 63

en H es que sólo necesita una fuente. Los dispositivos conmutadores son conmutados
en pares generando una tensión bipolar a la salida. Para disparar los MOSFET se
necesita circuiterı́a adicional para generar la tensión de disparo en cada conmutador.
En sı́ntesis, cuando el sistema de disparo cierra el conmutador (A1 A4 ) y abre
(A2 A3 ), el sentido de la corriente es la lı́nea punteada, induciendo de esta forma una
tensión +Vcc en el servomotor. Luego, si el sistema de disparo abre al conmutador A1,4
y cierra A2,3 , el sentido de la corriente es la lı́nea continua, induciendo ası́ una tensión
−Vcc en el servomotor. Por lo tanto, el servomotor ve en sus terminales una onda de
voltaje cuadrada variando entre ±Vcc y la corriente que pueda absorber dependerá de
la capacidad en corriente de los dispositivos usados en los conmutadores y de la fuente.

Figura 1.34: Esquema del circuito ampliﬁcador con su circuito de control.

El Circuito de Control de Disparo de los MOSFET

El objetivo del circuito de control de disparo mostrado en La ﬁgura 1.34 es
realizar la conmutación de (A1 A4 ) a (A2 A3 ) o viciversa, de forma tal que no se generen
cortocircuitos durante la conmutación. Tales cortocircuitos se pueden generar cuando
los dos pares de conmutadores se encuentran cerrados, ya que en tal situación puede
circular una gran corriente capaz de deteriorar al dispositivo conmutador.
La lógica del circuito de control de disparo de los MOSFET responde a la
tabla 1.8. Notar en esta tabla que cuando las señales PWM1 y PWM2 que salen del
generador de PWM poseen igual amplitud, los conmutadores A1 , A2 , A3 y A4 estarán
siempre en el estado OFF.
Una protección adicional para evitar corrientes de cortocircuito en los conmu-
tadores se logra introduciendo los diodos D1 , D2 , D3 y D4 , tal como se muestra en
64 Modelado de Sistemas No Lineales

Tabla 1.8: Conmutación de los MOSFET’s.

P W M ON P W M OSN A1 A2 A3 A4
0 0 OFF OFF OFF OFF
0 1 ON OFF ON OFF
1 0 OFF ON OFF ON
1 1 OFF OFF OFF OFF

la figura 1.34.
La figura 1.35 muestra los circuitos de disparo de los MOSFET Q14, Q5, Q6
y Q7. Tales circuitos emplean compuertas lógicas de tecnologı́a TTL (Transistor
Transistor Logic) conformado por los integrados 7404, 7486, 7408 y dos resistencias de
500 Ω. El circuito de disparo de Q14 comprende los transistores Q1 y Q3 formando un
amplificador que trabaja en clase B. Este circuito de disparo trabaja simultáneamente
con el circuito de disparo del MOSFET Q6 (transistores Q8 y Q9). Del mismo modo,
los circuitos de disparo de los MOSFET Q5 (transistores Q2 y Q4) y Q7 (transistores
Q10 y Q11) trabajan en conjunto.
Por ejemplo para el MOSFET Q14, cuando en la salida de la compuerta 7417
existe una señal ON, el transistor Q1 se corta mientras que Q3 se satura. De este
modo a la base del MOSFET llega una corriente que lo habilita. En caso contrario,
cuando en la salida de la compuerta 7417 existe una señal OFF, el transistor Q1 se
satura mientras que Q3 se corta. De este modo a la base del MOSFET no llega una
corriente y lo inhabilita. El mismo análisis se puede hacer para todos los circuitos de
disparo.

1.7. Sistema de Control de Manipuladores de 2 y 3GDL

La estructura en tiempo real para controlar la posición angular de los manipu-
ladores robóticos de 2GDL (manipulador traslacional y manipulador esférico) es una
extensión de la estructura mostrada en la figura 1.30. Para el caso de 2GDL, el sis-
tema de control en tiempo real requiere de la medición simultánea de dos posiciones
angulares, la cual se logra gracias al sensor de posición en cuadratura que posee en su
eje cada uno de los dos servomotores D.C. que emplea el manipulador. Estas señales
de posición medidas ingresan por los dos contadores que posee la tarjeta PCI 6229,
ubicado en sus terminales PFI (Programmable Function I/O). La señales medidas se
procesan luego en la PC empleando LabVIEW. El detalle de la programación de los
contadores trabajando simultáneamente se puede ver en los programas en tiempo real
para controlar las posiciones de los brazos de dichos manipuladores. Tales programas
se encuentran en el CD adjunto a este trabajo.
El algoritmo de control multivariable grabado en la PC, procesa tales mediciones
y genera dos señales de control. Estas señales son débiles en potencia para poder hacer
girar convenientemente a los servomotores D.C. Por esta razón es que cada una de
ellas se procesa empleando la técnica de modulación por ancho de pulsos (PWM) y
luego se amplifican por separado empleando para ello un amplificador de potencia
con configuración en H. Las señales de control amplificadas ingresan a los terminales
1.8 El Sistema de Control del Tanque 65

Figura 1.35: Circuitos de control del ampliﬁcador de potencia.

de las armaduras de los servomotores, para hacerlos girar en la dirección adecuada.

Para el caso de 3GDL, el sistema de control en tiempo real requiere de la medición
simultánea de tres posiciones angulares, la cual se logra gracias al sensor de posición
en cuadratura que posee en su eje cada uno de los dos servomotores D.C. que emplea
el manipulador. Dos de estas señales de posición medidas ingresan por los dos conta-
dores que posee la tarjeta PCI 6229, ubicado en sus terminales PFI (Programmable
Function I/O). Debido a que la tarjeta PCI 6229 posee sólo dos contadores de pulsos
para medir posiciones, se ha tenido que realizar un programa ad-hoc en LabVIEW
para poder medir la tercera señal de posición, que también ingresa a uno de los
terminales PFI de la tarjeta. Este programa se encuentra en el CD adjunto a esta
publicación. El procedimiento que sigue a continuación ya es conocido: el algoritmo
de control multivariable grabado en la PC, procesa tales mediciones y genera tres
señales de control que se procesan empleando la técnica PWM y se amplifican por
separado empleando para ello un amplificador de potencia con configuración en H.

1.8. El Sistema de Control del Tanque

La ﬁgura 1.36 muestra La estructura en tiempo real para controlar simultánea-
mente o por separado el nivel y la temperatura del agua contenido en el tanque. Los
66 Modelado de Sistemas No Lineales

sistemas de control a realizarse requieren de la medición del nivel y de la temper-

atura del agua. La medición de nivel se logra empleando un transmisor de presión
Valcom de rango 0 a 1.25 m, mientras que la medición de la temperatura emplea una
termoresistencia con sensor Pt 100 y de rango 0 a 100 o C.
La medición de nivel debe ingresar a la PC a través de la tarjeta de adquisi-
ción de datos en un rango de voltaje adecuado. Para ello se emplea el convertidor e
indicador de nivel Saﬁr tipo P, el cual convierte los 4 a 20 mA que proporciona el
transmisor de nivel Valcom tipo P, a una señal de voltaje de 0 a 10 V, que equivale
al rango de 0 a 1.25 m de medición de nivel. El transmisor usado sirve también como
indicador digital del nivel.
De mismo modo, la señal que proporciona la termoresistencia se convierte al
rango de voltaje de 0 a 10 V empleando para ello el transmisor de temperatura
Valcom tipo T, el cual convierte el rango de temperatura de 0 a 100 o C a una señal
de voltaje de 0 a 10 V. El convertidor usado sirve también como indicador digital de
la temperatura.

Figura 1.36: Sistema de control en tiempo real para el tanque.

El algoritmo de control grabado en la PC procesa tal medición y genera dos

señales de control. Estas señales salen a través de dos de las cuatro salidas analógicas
que posee la tarjeta PCI 6229. La primera señal de rango 0 a 10 V, va directamente
a la válvula motórica Sauter AVM104S, la cual sirve para controlar el ﬂujo de agua
de entrada al tanque. La segunda señal de rango 1 a 5 V, sirve para excitar al
controlador de potencia SPC1-35, el cual genera la corriente adecuada para alimentar
a la resistencia eléctrica con el propósito de producir el calor necesario para calentar
el agua del tanque a una temperatura deseada.
Capı́tulo 2

Control Óptimo

Este capı́tulo trata el problema del control óptimo cuadrático gaussiano, denomi-
nado ası́ porque el ı́ndice de rendimiento o función de costo que emplea es una fun-
ción cuadrática de los estados y de las señales de control. La solución del problema de
control planteado consiste en determinar un extremo de la función de costo mediante
minimización con el propósito de generar la ley de control óptima.
La configuración del sistema de control óptimo no lineal desarrollado en este capı́tu-
lo comprende el modelo no lineal multivariable del sistema a controlar, un observador no
lineal para estimar los estados del sistema y un controlador de realimentación de esta-
dos del tipo proporcional–integral. El diseño del sistema de control óptimo consiste en
producir una fuerza de control u que sea capaz de hacer que el vector de salida y del
sistema (la salida controlada) siga al vector de referencias deseadas r cumpliendo ciertas
especificaciones de diseño, no obstante la presencia de incertidumbres en los parámetros
y de disturbios estocásticos gaussianos actuando sobre el sistema en operación.

2.1. Configuración del Sistema de Control Óptimo

La configuración del sistema de control óptimo no lineal empleada en este
capı́tulo se ilustra en la figura 2.1. Tal configuración combina en su diseño la repre-
sentación de un sistema no lineal, un observador no lineal para estimar los estados del
sistema, y un controlador de realimentación de estados del tipo proporcional–integral.
El objetivo del sistema de control óptimo consiste en seleccionar una fuerza de control
u capaz de minimizar la diferencia entre el vector de salida y del sistema y el vector
de trayectorias de referencia deseadas r, a pesar de la presencia de incertidumbres
en los parámetros y de disturbios estocásticos gaussianos actuando sobre el sistema
controlado.
La implementación en tiempo real del sistema mostrado en la figura 2.1 opera
como sigue: después de cada tiempo de discretización, el observador no lineal estima
los estados x del sistema empleando los datos proporcionados por el vector de entrada
u y el vector de salida y. Invocando el bien conocido teorema de la separación, tales
estados estimados y la integral de la salida y, pueden ser usados para computar el
controlador proporcional–integral de realimentación de estados u (la ley de control)
del sistema. La ley de control actúa sobre el proceso no lineal (pero linealizable) para
hacer que el error entre r (el vector de referencias) y y tienda a cero, cumpliendo
68 Control Óptimo

Nonlinear state
x^ observer
r -
z y
+

State-feedback u MIMO nonlinear

controller process y

Figura 2.1: Conﬁguración de un sistema de control óptimo no lineal.

ciertas especiﬁcaciones de diseño.

2.2. El Sistema Dinámico No Lineal Multivariable

El sistema dinámico no lineal multivariable (de múltiples entradas u múltiples
salidas) se puede describir como:

ẋ = f (x, u) + v x(0− ) = 0
y = h(x) + w (2.1)
        
x1 u1 v1 y1 w1
     ..     .. 
x =  ...  u =  ...  v= .  y =  ...  w= . 
xn um vn yp wp
   
f1 (x, u) h1 (x)
 ..   .. 
f = .  h= . 
fn (x, u) hp (x)
donde x es el vector de estado, u es el vector de control (la entrada al sistema) e y
es el vector de salida. Asumiremos que las funciones vectoriales de variable vectorial
f (x, u) y h(x) son operadores no lineales diferenciables que representan la dinámica
del sistema y la dinámica de la salida respectivamente. Los vectores v de orden n × 1
y w de orden p × 1 son los disturbios en los estados del sistema (ruidos en los estados)
y en sus salidas (ruidos de medición) respectivamente.
Sean x0 , u0 e y0 los vectores de referencia (o nominales) correspondientes a x,
u e y respectivamente. Si la entrada del sistema se selecciona exactamente igual a
u0 , su respuesta será x0 . Entonces x0 satisface:

ẋ0 = f (x0 , u0 ) + v x0 (0− ) = 0

y0 = h(x0 ) + w (2.2)

Si la entrada del sistema u no es exactamente, pero sı́ muy cercana a u0 , el vector

de trayectorias x resultante, el vector de estado, diﬁere muy poco de x0 . Para tal
situación, las trayectorias actuales pueden formularse como:

x = x0 + δx u = u0 + δu y = y0 + δy (2.3)
2.3 El Controlador PI de Realimentación de Estados 69

donde los vectores residuales δx, δu y δy representan desviaciones con respecto a los
correspondientes vectores de estado, de control y de salida respectivamente. Reem-
plazando (2.3) en (2.1) produce:

ẋ0 + δ ẋ = f (x0 + δx, u0 + δu) + v

y0 + δy = h(x0 + δx) + w (2.4)

Como hemos asumido que las desviaciones actuales son pequeñas, entonces el sistema
(2.4) admite ser linealizado alrededor de un vector de trayectorias nominales o de
referencia x0 . La expansión de (2.4) en series de Taylor alrededor de x0 y u0 resulta:

δ ẋ ≈ Aδx + Bδu + v δx(0− ) = 0

δy ≈ Cδx + w (2.5)

donde:
 ∂f1 ∂f1   ∂f1 ∂f1 
∂x1 ··· ∂xn ∂u1 ··· ∂um
 .. .. ..   .. .. .. 
A =  . . .  B= . . . 
∂fn ∂fn ∂fn ∂fn
∂x1 ··· ∂xn (x0 ,u0 ) ∂u1 ··· ∂um (x0 ,u0 )
 
∂h1
∂x1 ··· ∂h1
∂xn
 .. .. .. 
C =  . . .  (2.6)
∂hp ∂hp
∂x1 ··· ∂xn (x0 )

Observar que las matrices jacobianas Ann , Bnm , Cpn y Dpm necesitan ser evaluadas
alrededor de los vectores de referencia x0 y u0 . Para resolver el problema del control
óptimo en consideración, se requiere diseñar una apropiada ley de control de reali-
mentación de estados de la forma u = −Gx, donde G de dimensión m × n, es la
la matriz de ganancia de realimentación de estados, la cual se diseña empleando el
siguiente sistema linealizado:

δ ẋ = Aδx + Bδu + v δx(0− ) = 0

δy = Cδx + w
δu = −Gδx (2.7)

2.3. El Controlador PI de Realimentación de Estados

De acuerdo a la referencia [12], el controlador proporcional de realimentación de
estados mostrado en la ﬁgura 2.2 es una matriz de ganancia de realimentación de
estados G, de modo tal que la ley de control de realimentación de estados que genera
y expresada como:
δu = −Gδx (2.8)
minimiza la siguiente función de costo cuadrática:
∞
I= e2αt [δxT (t)Q δx(t) + δuT (t)R δu(t)]dt (2.9)
0
70 Control Óptimo

sujeta a la ecuación de restricción:

δ ẋ = Aδx + Bδu + v δx(0− ) = 0 (2.10)

donde A de orden n × n y B de orden n × m son matrices constantes, Q = QT de

orden n × n y R = RT de orden m × m son matrices de peso deﬁnidas positivas.
También, α ≥ 0 es una constante de peso.

u x y
g h
+
+
f(.)
f(x)
u
-D

Figura 2.2: Sistema de control óptimo con un controlador proporcional de reali-

mentación de estados.

La bien conocida condición de controlabilidad establece que un sistema lineal

de la forma δ ẋ = Aδx + Bδu es de estado controlable siempre que su matriz de
controlabilidad M posea rango completo:

rango M = rango [B AB ··· An−1 B] = n (2.11)

Cuando el sistema linealizado dado en (2.10) es de estado controlable, la matriz de

ganancia de realimentación de estados G se determina de:

G = R−1 BT K (2.12)

donde K = KT de orden n × n es la única matriz deﬁnida positiva solución de la

siguiente ecuación asociada de Riccati:

K(A + αI) + (A + αI)T K − KBR−1 BT K + Q = 0 (2.13)

donde I es la matriz identidad de dimensiones apropiadas. Para mejorar el rendimien-

to del controlador proporcional de realimentación de estados, se le puede añadir acción
integral ubicando un integrador a la salida del sistema, tal como se muestra en la
ﬁgura 2.3; es decir: δz = δydt. Luego:

δ ż = δy = Cδx + w (2.14)

Combinando ( 2.14) con el sistema descrito en (2.7), la descripción aumentada en el

espacio de estado de (2.7) toma la forma:

δ ẋa = Aa δxa + Ba δu + va
δy = Ca δxa + w (2.15)
2.3 El Controlador PI de Realimentación de Estados 71

x
u x y z
g h z
+
+
f(.)
f(x) x
u a z
-D

Figura 2.3: Sistema de control óptimo con controlador PI (Proporcional–Integral) de

realimentación de estados.

donde el superı́ndice a signiﬁca aumentado. Los vectores xa de orden n + p, va de

orden n + p y las matrices Aa de orden (n + p) × (n + p), Ba de orden (n + p) × m y
Ca de orden p × (n + p) toman la forma:

a δx a v a A 0 a B
δx = ; v = ; A = ; B = ; Ca = C 0
δz w C 0 0
(2.16)
Siempre que el sistema descrito por:

δ ẋa = Aa δxa + Ba δu + va δxa (0− ) = 0 (2.17)

cumpla la condición de controlabilidad dada en (2.11), que para este caso es:

rango Ma = rango Ba Aa Ba · · · (Aa )n−1 Ba = n + p (2.18)

entonces, la matriz de ganancia de realimentación de estados aumentada Ga de orden

m × (n + p) puede ser computada de:

Ga = R−1 (Ba )T Ka (2.19)

donde Ka = (Ka )T de orden (n + p) × (n + p) es la única matriz solución deﬁnida

positiva de la siguiente ecuación de Riccati:

Ka (Aa + αI) + (Aa + αI)T Ka − Ka Ba R−1 (Ba )T Ka + Qa = 0 (2.20)

Por consiguiente, la ley de control de realimentación de estados aumentada (el con-

trolador PI de realimentación de estados):

δx
δu = −G δx = − G1 G2
a a
(2.21)
δz

minimiza la siguiente función de costo cuadrática aumentada:

∞
Ia = e2αt [(δxa )T (t)Qa δxa (t) + δuT (t)R δu(t)]dt (2.22)
0

sujeto a la ecuación de restricción dada en (2.17), donde Qa = (Qa )T de orden

(n + p) × (n + p) y R = RT de orden m × m son matrices de peso deﬁnidas positiva y
72 Control Óptimo

α ≥ 0 es una constante de peso exponencial. Observar que las matrices para ponderar
el rendimiento del sistema (las matrices de sintonización) son R, Q y Qa .
De acuerdo al teorema de la separación [12], los controladores de realimentación
de estado se pueden implementar empleando los estimados de los estados en lugar de
los estados actuales del sistema. Por consiguiente, las leyes de control (2.8) y (2.21)
se pueden implementar también como:

δu = −Gδ
x

δ
x
xa = −
δu = −Ga δ Gx Gz (2.23)
δ
z

Para obtener el vector actual de estado estimado δ x emplearemos un observador no

lineal (section 2.4). El vector estimado actual δ
z se obtiene directamente integrando
la salida actual δy. Sin embargo, para calcular la matriz de ganancia del observador,
se emplea el sistema linealizado dado en 2.7, como veremos a continuación.

2.4. El Observador No Lineal Multivariable

Consideremos la estructura de la ﬁgura 2.4 para la estimación de estados y con-
trol del sistema descrito en (2.1). El observador no lineal ilustrado se puede describir
por:
˙x = f (
δ )
x, u) + H(y − y x(0− ) = 0
δ
δ
y = h(
x) (2.24)

donde δ x e δy son los vectores estimados de δx e δy respectivamente, y H es una

matriz residual de ganancia de orden n × p a ser determinada.
Por otra parte, asumamos que los disturbios v y w en (2.1) sean ruido blanco
gaussiano con media (o esperanza) nula. El ruido blanco gaussiano posee la propiedad
de ser no correlacionado en cada instante de tiempo. En otras palabras, no existe una
interrelación (correlación) entre v y w. La propiedad de la media nula implica que
toda la información estadı́stica del ruido se acumula en la covarianza de los disturbios.
En términos matemáticos:

E[v(t)vT (τ )] = Vδ(t − τ ) E[v] = 0

E[w(t)w (τ )] = Wδ(t − τ )
T
E[w] = 0 (2.25)

donde E[.] es la operación matemática esperanza, δ(t − τ ) es la función delta de

Kronecker deﬁnida como: δ(t − τ ) = 1 para t = τ y nula en otro caso. También, V
de orden n × n y W de orden p × p son matrices de covarianza deﬁnidas positivas.
Es un hecho conocido que un sistema lineal de la forma dada en (2.7) pero con
v = w = 0, es observable siempre que su correspondiente matriz de observabilidad
N posea rango completo:
 
C
 CA 
 
rango N = rango  .. =n (2.26)
 . 
CAn−1
2.5 Procedimiento de Diseño 73

v + w
+
u + x + y z
g h
+
+ -
f(.) r=0
f(x)

u ^
x
-D a z^ = z
z^

^
x ^
y y
u g C
+ + - +
+ +
f(.)
f(x)
E

Figura 2.4: Estructura del sistema de control óptimo para estimación de estados y
control.

Cuando el modelo linealizado de (2.7) es observable, la matriz residual de ganancia

H del observador no lineal descrito en (2.24), se calcula de:

H = SCT W−1 (2.27)

donde S = ST de orden n × n es la única matriz deﬁnida positiva solución de la

siguiente ecuación asociada de Riccati:

0 = S(A + αI)T + (A + αI)S − SCT W−1 CS + V (2.28)

El estimador de estados resultante mostrado en la ﬁgura 2.4 es conocido también

como el ﬁltro extendido de Kalman de ganancia constante H [12].

2.5. Procedimiento de Diseño

En sistemas de control óptimo del mundo real, generalmente estamos interesa-
dos que la salida controlada y(t) siga a una trayectoria deseada r(t) cumpliendo las
especiﬁcaciones de diseño. Como el diseño del sistema de control óptimo minimiza
una función de costo, entonces el objetivo de control se cumple cuando la fuerza
de control logre que todos los estados del sistema se minimicen (tiendan al estado
cero), incluyendo el vector de salida y(t). Cuando trabajamos con variables residuales
(conocidas también como perturbacionales), tales variables se pueden considerar co-
mo señales de error con respecto a las variables reales. Por ejemplo, para la variable
residual de salida δy(t) se formula:

δr(t) = y(t) − r(t)

74 Control Óptimo

donde y(t) es la salida real del sistema que debe de seguir a la trayectoria de referencia
r(t) cumpliendo ciertas especiﬁcaciones de diseño previamente establecidas. Es claro
que cuando se cumpla el objetivo de control del sistema, es decir, cuando δy(t) ∼ = 0,
entonces: y(t) ∼
= r(t).
El procedimiento de diseño del sistema de control óptimo desarrollado sigue los
pasos siguientes:

(1) Formular el problema: describir el sistema a controlar, deﬁnir las especiﬁca-

ciones de diseño y determinar el modelo no lineal del sistema en la forma dada
en (2.1).
(2) Determinar el modelo linealizado del sistema (ecuación (2.5)).
(3) Determinar la controlabilidad y observabilidad del sistema linealizado (ecua-
ciones (2.18) y (2.26) respectivamente).
(4) Computar la matriz de ganancia Ga de la ley de control PI del sistema (ecua-
ciones (2.19) y (2.20)).
(5) Computar la matriz de ganancia Ha del observador no lineal del sistema (ecua-
ciones (2.27) y (2.28)).
(6) Simular el sistema de control óptimo empleando las ecuaciones dinámicas no
lineales (2.1) y (2.24).
(7) Implementar el sistema de control óptimo (hardware).
(8) Desarrollar el software de control en tiempo real del sistema.
(9) Ejecutar pruebas de funcionamiento en tiempo real.

Ejemplo 2.1 Design and Simulation of an Optimal Control System for the
EJRM.

IN PROGRESS

Ejemplo 2.2 Design and Simulation of an Optimal Control System for the
TRM.

IN PROGRESS

Ejemplo 2.3 Diseño y Simulación de un Sistema de Control Óptimo para

el MRT.

Las matrices A, B y C dadas en (2.5) se pueden obtener empleando las matrices

jacobianas, a partir del modelo no lineal (de orden n = 4) en el espacio de estado del
MRT mostrado en las ecuaciones (1.144) and (1.145)). Esto es:
 
0 0 1 0
 0 0 0 1 
 
A= +NT 1
0 − RTR1T(J1 b11+a 
 0 1 +a2 )
0 
RT 2 b2 +NT 2
0 0 0 −R T 2 (J2 +a2 )
2.5 Procedimiento de Diseño 75

 
0 0
 
 0 0  1 0 0 0
B= 1  C=
 RT 1 (J1 +a1 +a2 ) 0  0 1 0 0
1
0 RT 2 (J2 +a2 )

Por consiguiente:

a A 0 a B
A = B = Ca = C 0
C 0 0
Las matrices de sintonización se pueden elegir como: Q = 4I, R = 10I, Qa = 0,01I,
V = 0,1I, W = 0,1I. La ganancia Da del controlador y la ganancia H del observador
fueron determinadas usando los comandos de MATLAB lqr y lqe, respectivamente,
usando el hecho de que el sistema es completamente controlable y completamente
observable. El parámetro α del ı́ndice de rendimiento se ﬁjó en 5. La simulación se
llevó a cabo ejecutando el archivo srm4opt.m (que se encuentra en el CD adjunto),
para las siguientes trayectorias deseadas: xd1 (t) = sin t + 0,1t y xd2 (t) = cos t. La
t
relación z = 0 ydτ se aproximó en el dominio discreto como z(k + 1) = z(k) + T x(k),
donde T = 0,0014 s es el tiempo de muestreo y k = t/T es el tiempo discreto. Los
resultados de la simulación se muestran en las ﬁguras 2.5 y 2.6.
2.5

2
Base trayectory (rad)

1.5

0.5

0
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2
Time (s)

2
Control signal (volt)

−1

−2

−3

−4
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2
Time (s)

Figura 2.5: Posición angular de la base del MRE controlada.

PROBLEMAS
Problema 2.1

Con relación a las plataformas acopladas con actuadores hidráulicos descrito en el

problema 1.7 y mostrado en la ﬁgura 1.19, determine la estabilidad y controlabilidad
del modelo linealizado para un punto de operación apropiado y diseñe un sistema de
control óptimo cuya salida sea capaz de seguir a una trayectoria determinada. Asumir
valores mı́nimo y máximo de las masas de las plataformas m1 and m2 .
76 Control Óptimo

Problema 2.2

Diseñe un sistema de control óptimo cuya salida sea capaz de seguir a una trayectoria
determinada a las plataformas acopladas con actuadores neumáticos descrito en el
problema 1.8 y mostrado en la ﬁgura 1.19. Asumir valores mı́nimo y máximo de las
masas de las plataformas m1 and m2 .

Problema 2.3

Diseñe un sistema de control óptimo cuya salida sea capaz de seguir a una trayectoria
determinada, para la plataforma inercial descrita en el problema ?? e ilustrada en la
ﬁgura ??. Asumir valores mı́nimo y máximo de ... IN PROGRESS

Problema 2.4

Design a robust nonlinear optimal control system for the heavy oil fractionator de-
scribed in the problem 1.9 and depicted in ﬁgure 1.20. Assume minimum and maxi-
mum values of the ... IN PROGRESS

Problema 2.5

Design a robust nonlinear optimal control system for the chemical jacket reactor
described in the problem 1.10 and depicted in ﬁgure 1.21. Assume minimum and
maximum values of the ... IN PROGRESS

Problema 2.6

Design a robust nonlinear optimal control system for the high purity distillation
column described in the problem ?? and depicted in ﬁgure ??. Assume minimum
and maximum values of the ... IN PROGRESS

1.5
Arm trajectory (rad)

0.5

−0.5
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2
Time (s)

15
Control signal (volt)

−5
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2
Time (s)

Figura 2.6: Posición angular del brazo del MRE controlada.

2.5 Procedimiento de Diseño 77

Problema 2.7

Design a robust nonlinear optimal control system for the aircraft described in the
problem 1.11 and depicted in ﬁgure 1.22. Assume minimum and maximum values of
the ... IN PROGRESS

Problema 2.8

Design a robust nonlinear optimal control system for the spacecraft described in the
problem ?? and depicted in ﬁgure ??. Assume minimum and maximum values of the
... IN PROGRESS

Problema 2.9

Design a robust nonlinear optimal control system for the nonlinear DC motor de-
scribed in the problem 1.12 and depicted in ﬁgure 1.23. Assume minimum and max-
imum values of the ... IN PROGRESS
Capı́tulo 3

Control Adaptativo con Modelo

Referencial

3.1. Configuración ode un SCAMR

La ﬁgura 3.1 ilustra la conﬁguración de un Sistema de Control Adaptativo con
Modelo Referencial (SCAMR) que puede ser empleado en una gran variedad de apli-
caciones. El SCAMR se compone básicamente de un modelo de referencia, un contro-
lador adaptativo, el sistema a controlar y un mecanismo de adaptación . El esquema
básico en consideración se denomina un SCAMR paralelo debido a la ubicación rel-
ativa del modelo referencial con respecto al sistema.

Reference
model
r -
Adaptive +
Process
controller

Adaptation
mechanism

Figura 3.1: Conﬁguración de un Sistema de Control Adaptativo con Modelo Refer-

encial (SCAMR).

El modelo de referencia, el cual está excitado por una entrada externa r, es un

sistema dinámico auxiliar usado para especiﬁcar la respuesta deseada del sistema. Tal
respuesta debe de ser lograda por el SCAMR a pesar de las restricciones generadas
por inexactitudes en el modelado de la estructura del modelo de referencia y el modelo
del sistema.
La ley de adaptación es la relación entre el error e y el vector estimado de
El error e es a la vez, la diferencia entre la salida del modelo y la del
parámetros θ.
sistema. el mecanismo de adaptación es un conjunto de bloques interconectados usado
80 Control Adaptativo con Modelo Referencial

para implementar la ley de adaptación. De hecho, la ley de adaptación es el algoritmo

de control empleado para modiﬁcar los parámetros del controlador adaptativo, de
modo tal que el SCAMR permanezca estable y que el error de seguimiento converja
a cero en la presencia de parámetros del sistema variantes con el tiempo y disturbios
externos.
Se asume que el sistema es no lineal. Por consiguiente, su descripción puede ser
imprecisa; esto es, el modelo dinámico del sistema puede presentar incertidumbres en
su estructura o dinámica no modelada en su representación. Ya que la descripción del
sistema permite incertidumbres, el control adaptativo (en general) se puede considerar
una aproximación particular de control robusto.
El controlador debe de ser capaz de realizar un seguimiento perfecto en la
presencia de incertidumbres en los parámetros. Esto es, en presencia de parámetros
conocidos o desconocidos, los parámetros del controlador requieren ser reajustados
por el mecanismo de adaptación con el ﬁn de hacer cero el error de seguimiento
e. El método directo de Lyapunov será empleado para determinar que el SCAMR
diseñado garantice convergencia global de las señales controladas con respecto a sus
trayectorias deseadas. Si la ley de control (el algoritmo de control) posee estructura
lineal con parámetros ajustables, estaremos frente a una parametrización lineal.

3.2. Estabilidad vı́a el Método Directo de Lyapunov

A. M. Lyapunov trata el problema de la estabilidad de sistemas descritos median-
te ecuaciones diferenciales empleando dos métodos. El denominado primer método
analiza el comportamiento de la estabilidad de una solución explı́cita del modelo no
lineal del sistema y se aplica solamente a ciertos casos. El segundo método, o método
directo de Lyapunov, es de gran generalidad y potencia porque no requiere de la
solución de la descripción del sistema, como sı́ lo requiere el primer método.

3.2.1. Conceptos de Estabilidad

Un sistema no lineal de la forma:

ẋ = f (x, t) (3.1)

se dice que es no autónomo si f depende del tiempo, por ejemplo, si f posee parámetros
variantes con el tiempo. por consiguiente, un sistema autónomo puede ser descrito
por: ẋ = f (x). Las trayectorias de estado para procesos autónomos son independientes
del tiempo inicial, mientras que para los no autónomos generalmente no lo son.
Un estado o punto de equilibrio xe (realmente un vector constante) de un
sistema autónomo se puede determinar de:

0 = f (xe ) (3.2)

Ya que nosotros debemos de tratar la estabilidad en el origen del sistema autónomo

básico:
ẋ = f (x) x(0) = 0 (3.3)
Entonces debemos de hacer ciertas suposiciones con relación a al ﬁgura 3.2. Deno-
taremos como B(R) a la región esférica (balón) ||x|| < R y como S(R) a la esfera
3.2 Estabilidad vı́a el Método Directo de Lyapunov 81

||x|| = R en sı́. La región esf0rica anular cerrada r ≤ ||x|| ≤ R será denotada co-
mo BrR . Asumiremos que en una cierta región esférica Ω : ||x|| < B(R), todas las
derivadas parciales ∂xi /∂xj existen y son continuas en Ω. Entonces diremos que el
origen es:
estable si alguna trayectoria que empieza en B(r) en un punto arbitrario xo
nunca logra alcanzar la esfera frontera S(R) de B(R);
asintóticamente estable cuando es estable y en adición cada trayectoria de es-
tado que empieza en B(R) en un punto arbitrario xo , tiende hacia le origen
conforme el tiempo se incremente indeﬁnidamente;
inestable cuando para algún R y r, ya sea grande o pequeño, alguna trayectoria
de estado que empieza en B(R) en un punto arbitrario x0 logra alcanzar la
esfera frontera S(R). Observar en la ﬁgura 3.2 que para la trayectoria T el
origen es inestable en el sentido de Lyapunov, a pesar de que tal trayectoria de
estado muestre convergencia.

Asymptotically
stable
Stable

B(r) S(R)
0 r
x0 R
Unstable

H(A)
B(R) T
S(A)

Figura 3.2: Estabilidad en sistemas autónomos.

3.2.2. Funciones de Lyapunov

Un tipo especial de función escalar V (x), la denominada función de Lyapunov
juega un importante rol en el análisis de la estabilidad y el diseño de sistemas de
control. Una función de Lyapunov V (x) veriﬁca las siguientes propiedades:
(a) V (x) y sus primeras derivadas parciales
∂V (x)
= ∇ V (x)
∂x
son continuas en una cierta región abierta Ω alrededor del origen.
82 Control Adaptativo con Modelo Referencial

(b) V (0) = 0

(d) V̇ (x) = ∇ V (x) ẋ = ∇ V (x) f (x) ≤ 0 in Ω.

V (x) es una función definida positiva si satisface las propiedades (a)–(c). La figura
3.3 ilustra una función de Lyapunov para un sistema de segundo orden. Notar que
V (x1 , x2 ) tiene el aspecto general de un espejo parabólico apuntando hacia arriba. Si
V fuera definida negativa, el espejo parabólico deberı́a de apuntar hacia abajo. Por
consiguiente, V (x) es definida negativa si −V (x) es definida positiva. También, V (x)
es semidefinida positiva si V (0) = 0 y V (x) ≥ 0 para x = 0; V (x) es semidefinida
negativa si −V (x) es semidefinida positiva.
Para una matriz cuadrada V de orden n × n, las expresiones V > 0, V ≥ 0,
V < 0 y V ≤ 0 denotan que V es definida positiva, semidefinida positiva, definida
negativa y semidefinida negativa respectivamente, siempre y cuando V esté asociada
a su forma cuadrática.
V es definida positiva (V > 0), es decir, xT Vx > 0, si la función cuadrática
T
x Vx es definida positiva para x = 0. También, V es definida positiva si todos sus
eigenvalores o sus menores principales son mayores que cero.
En general, los menores principales mi de V = [vij ] (de orden n × n) son:
 
v11 v12 v13
v11 v12
m0 = 1; m1 = v11 ; m2 = det ; m3 = det  v21 v22 v23  ;
v21 v22
v31 v32 v33

y ası́ sucesivamente hasta llegar a mn = det(V).

V es semideﬁnida positiva (V ≥ 0), es decir, xT Vx ≥ 0, si la función cuadrática
x Vx es semideﬁnida positiva para x = 0. También, V ≥ 0 si V es singular de rango
T

r < n, y r eigenvalores o r menores principales de V son positivos y el resto (n − r)

son nulos.
V definida negativa (V < 0), es decir, xT Vx < 0, si la función cuadrática
xT Vx es definida negativa para x = 0. También, V < 0 si V es no singular y todos
los eigenvalores o los menores principales de V son negativos.
V semidefinida negativa (V ≤ 0), es decir, xT Vx ≤ 0, si la función cuadrática
xT Vx ≤ 0 a para x = 0. V ≤ 0 si V es singular de rango r < n, y r eigenvalores o r
menores principales de V son negativos y el resto (n − r) son nulos.
Si la matriz cuadrada V de orden n×n posee eigenvalores positivos y negativos,
entonces V es indefinida.

Ejemplo 3.1

La función V (x) = (x1 + x2 )2 con x = [x1 x2 ]T es semideﬁnida positiva desde

que V (0) = 0 y V (x) ≥ 0 para x = 0 (por ejemplo, para x1 = −x2 , V (x) = 0),
mientras que la función V (x) = −x21 + x22 no es deﬁnida positiva ni negativa porque
V (x) > 0 for x1 = 0 and V (x) < 0 for x2 = 0. Es fácil de demostrar que la función
V (x) = x21 + x22 es deﬁnida positiva.

Ejemplo 3.2
3.2 Estabilidad vı́a el Método Directo de Lyapunov 83

V(x1 , x 2) x2

V(x1 , x 2)

x2 x1

Figura 3.3: Graphical representation of a Lyapunov function.

El circuito mostrado en la ﬁgura 3.4 contiene un resistor no lineal RN que obedece

la ley i = N e3 , N > 0. Determine si la energı́a almacenada en el capacitor C es una
función de Lyapunov.

R i
+
+
u C e RN
- -

Figura 3.4: Circuito no lineal.

Solución: Sumando las corrientes que salen del nodo superior derecho (ver la ﬁgura
3.4) produce:
e−u
C ė + + N e3 = 0
R
La energı́a almacenada en el capacitor está dada por V (e) = 12 Ce2 . Para el sistema
no actuado (u = 0) tenemos:

2 1 2
V̇ (e) = Ceė = −e + Ne ≤ 0
R
Por consiguiente, la función V (e) es una función de Lyapunov.

Ejemplo 3.3

La ﬁgura 3.5 muestra un sistema masa–amortiguador–resorte no lineal cuyo modelo

dinámico es:
M ẍ + Bo ẋ + B1 ẋ|ẋ| + K0 x + K1 x3 = 0
donde (B0 ẋ+B1 ẋ|ẋ|) caracteriza un amortiguador no lineal con coeﬁcientes de amor-
tiguación B0 , B1 > 0 constantes, y donde (K0 x + K1 x3 ) representa un resorte no
lineal con coeﬁcientes de resorte K0 , K1 > 0 constantes. Demostrar que la energı́a
total almacenada en el sistema es una función de Lyapunov.
84 Control Adaptativo con Modelo Referencial

K0 B
K1 b(t)

111111111111
000000000000
Figura 3.5: Sistema masa–amortiguador–resorte.

Solución: La energı́a del sistema es:

x
1 1 1 1
V (x) = M ẋ2 + (K0 x + K1 x3 )dx = M ẋ2 + K0 x2 + K1 x4
2 0 2 2 4

Se puede demostrar fácilmente que:

V̇ (x) = M ẋẍ + (K0 x + K1 x3 )ẋ = [−B0 ẋ − B1 ẋ|ẋ|]ẋ = −B0 ẋ2 − B1 |ẋ|3 ≤ 0

Por consiguiente, V (x) es una función de Lyapunov.

Funciones de Lyapunov para Sistemas No Autónomos

El sistema no autónomo en consideración se describe en la región Ω: ||x|| < A
mediante:
ẋ = f (x, t) f (0, t) = 0 t≤0 (3.4)
Siempre que W (x) es una función de Lyapunov en Ω, entonces V (x, t) es una
función de Lyapunov si:

(a) V (x, t) está deﬁnida en Ω para algún t ≥ 0;

(b) V (0, t) = 0 para algún t ≥ 0;

(c) V (x, t) ≥ W (x) para algún t ≤ t0 ;

(d) V̇ (x, t) ≤ 0 para algún t ≥ 0, donde:

dV ∂V ∂V ∂V ∂V
V̇ = = + ẋ = + f (x, t)
dt ∂t ∂x ∂t ∂x

Se dice que una función V (x, t) es definida positiva si satisface las condiciones
(a)–(c). También se dice que V (x, t) es una función definida positiva si esta función
domina a otra función definida positiva W (x), por ejemplo, cuando V (x, t) ≥ W (x).
También, V (x, t) es definida negativa si −V (x, t) es definida positiva; V (x, t) es
semidefinida positiva si esta función domina a otra función semidefinida positiva
W (x); V (x, t) es semidefinida negativa si −V (x, t) es semidefinida positiva.

Ejemplo 3.4
3.2 Estabilidad vı́a el Método Directo de Lyapunov 85

Desprecie el término no lineal ẋ|ẋ| del amortiguador descrito en el ejemplo 3.3 y

considere un coeﬁciente de amortiguación b(t) variante con el tiempo en lugar de
B0 , de modo tal que el sistema se convierta en uno no autónomo. Demostrar que la
siguiente función V (x, t) es una función de Lyapunov.

M 2 1 1 2
V (x, t) = (ẋ + αx) + K0 + K1 − M α + α b(t) x2
2
2 2 2

Solución: El cómputo de V̇ (x, t) produce:

1
V̇ (x, t) = (M α − b(t))ẋ2 + α(ḃ(t) − 2k0 ) − αK1 x4 < 0
2
siempre que α > 0, b(t) > M α y ḃ(t) < 2K0 . De acuerdo al ejemplo 3.3, la energı́a
del sistema es una función de Lyapunov, a saber:
1 1 1
W (x) = M ẋ2 + K0 x2 + K1 x4
2 2 4
Podemos observar que V (x, t) > W (x). Por consiguiente, V (x, t) es una función de
Lyapunov.

3.2.3. Teoremas de Estabilidad de Lyapunov

Los teoremas de estabilidad de Lyapunov generalizan la idea de que cerca al estado
de equilibrio de un sistema f1sico, la energı́a del sistema es siempre decreciente.

Teoremas de Estabilidad para Sistemas Autónomos

I. Teorema de Estabilidad. El equilibrio en el origen es estable si allı́ existe
en alguna vecindad Ω del origen, una función de Lyapunov V (x).

II. Teorema de Estabilidad Asintótica. El equilibrio en el origen es asintótica-

mente estable si −V̇ es deﬁnida positiva (esto es: −V̇ > 0) en Ω.

III. Teorema de Estabilidad Completa (Global). Considere una función

escalar V (x) con primeras derivadas parciales continuas para todo x = 0 tal que
V (x) > 0, V̇ (x) < 0, y V (x) → ∞ cuando ||x|| → ∞. entonces el sistema autónomo
(3.4) es completamente (globalmente) asintóticamente estable.

IV. teorema de Inestabilidad of Cĕteav. Sea Ω una vecindad en el origen.

Sea Ω una región en Ω. Dada una función V (x) en Ω, entonces el equilibrio en el
origen es inestable si:
(a) V (x) posee derivadas parciales continuas en Ω .

(b) V (x) y V̇ (x) son deﬁnidas positivas en Ω .

(c) V (x) = 0 en los puntos de frontera de Ω dentro de Ω.

(d) El origen es un punto de frontera de Ω . La ﬁgura 3.6 ilustra el teorema de

inestabilidad de Cĕteav.
86 Control Adaptativo con Modelo Referencial

El teorema de inestabilidad de Cĕteav se convierte en el denominado primer teorema

de inestabilidad si Ω = Ω1 , cuando Ω es una cierta vecindad del origen. Si, en adición
a la condición Ω = Ω , la condición V̇ > 0 es reemplazada por:

V̇ (x) − λV (x) ≥ 0 ∀t≥0 ∀x Ω

donde λ es una constante positiva, de este modo el teorema de inestabilidad de Cĕteav

se convierta en el denominado segundo teorema de inestabilidad. Las demostraciones
de los teoremas descritos anteriormente se realizan básicamente en forma geométrica
en [16], [3].

V=0
. . 0
Ω
x0
V = constant
Ω1

Figura 3.6: Representación gráﬁca del teorema de estabilidad de Cĕteav.

Teoremas de Estabilidad de Lyapunov para Sistemas no Autónomos

V. teorema de Estabilidad. El equilibrio en el origen es estable, si allı́ existe
en alguna vecindad Ω del origen, una función de Lyapunov V (x, t).

VI. Teorema de Estabilidad Asintótica Uniforme. El equilibrio en el origen

es uniformemente asintóticamente estable si la función definida positiva V (x, t) ies
decreciente (lo que significa que V está dominado por una función definida positiva
W (x) para algún t ≥ 0) y −V̇ (x, t) es definida positiva(es decir, −V̇ > 0) en Ω.

VII. Teorema de Inestabilidad. Sea Ω una vecindad del origen. Sea Ω una
región en Ω. Dada una funci2n V (x, t) en Ω, entonces el equilibrio del origen en el
tiempo t0 es inestable si:

(a) V (x, t) posee derivadas parciales continuas en Ω .

(b) V (x, t) y V̇ (x, t) son deﬁnidas positivas en Ω1 .

(c) V (x, t) = 0 para algún t ≥ t0 en los puntos de frontera de Ω dentro de Ω.

(d) El origen es un punto de frontera de Ω dentro de Ω.

En forma similar, el teorema de inestabilidad anterior se convierte en el deno-

minado primer teorema de inestabilidad si Ω = Ω , donde Ω es una cierta vecindad
3.2 Estabilidad vı́a el Método Directo de Lyapunov 87

del origen. Si en adición a la condición Ω = Ω , la condición V̇ > 0 es reemplazada

por
V̇ (x, t) − λV (x, t) ≥ 0 ∀ t ≥ t0 ∀x Ω
donde λ es una constante positiva, entonces el teorema de inestabilidad se convierte
en el denominado segundo teorema de inestabilidad. Las demostraciones de estos
teoremas se pueden encontrar en [3].

Ejemplo 3.5

Determine la estabilidad del sistema autónomo descrito en los ejemplos 3.2 y 3.3
aplicando el método directo de Lyapunov.

Solución: Del ejemplo 3.2 podemos establecer que la función de Lyapunov V (e) =
1 2
2 Ce → ∞ cuando ||e|| → ∞. Por consiguiente, el sistema autónomo no lineal
descrito en dicho ejemplo es completamente (globalmente) asintóticamente estable.
Del ejemplo 3.3 podemos establecer que la función de Lyapunov:
1 1 1
V (x) = M ẋ2 + K0 x2 + K1 x4 → ∞
2 2 4
cuando ||x|| → ∞. Por consiguiente, el sistema autónomo no lineal descrito en dicho
ejemplo es completamente (globalmente) asintóticamente estable.

Ejemplo 3.6

Determine la estabilidad el sistema no autónomo descrito en el ejemplo 3.4 aplicando

el método directo de Lyapunov.

Solución: Del ejemplo 3.4 se puede establecer que la función de Lyapunov:

M 1 1
V (x, t) = (ẋ + αx)2 + K0 + K12 − M α2 + α b(t) x2 → ∞
2 2 2

conforme ||x|| → ∞, siempre que α > 0, b(t) > M α, y ḃ(t) < 2K0 . Por consigu-
iente, el sistema no autónomo descrito en tal ejemplo es completamente (globalmente)
asintóticamente estable.

3.2.4. Teoremas del Conjunto Invariante

En aplicaciones relacionadas con sistemas de control, estabilidad asintótica es más
importante que estabilidad. Claramente, pequeñas desviaciones de las salidas contro-
ladas con respecto a señales de referencia deseadas se pueden cancelar como resultado
de la operación de un sistema asintóticamente estable. Sin embargo, la aplicación del
segundo teorema de estabilidad nos conduce a menudo a la relación −V̇ ≥ 0 en lugar
de la requerida condición −V̇ > 0 para estabilidad asintótica. Para tales casos, puede
ser de gran utilidad emplear el denominado teorema del conjunto invariante atribuido
a La Salle [16] con la ﬁnalidad de obtener más conclusiones acerca de la estabilidad
asintótica.
88 Control Adaptativo con Modelo Referencial

Conjunto Invariante. Se dice que un conjunto G es el conjunto invariante de un

sistema dinámico ẋ = f (x) si cada trayectoria de estado x(t) que comienza desde un
punto x0 en G permanece en G para todo tiempo. por consiguiente, una trayectoria
de estado cerrada en G es un conjunto invariante. De acuerdo a tal deﬁnición, algún
punto de equilibrio es un conjunto invariante. El dominio de atracción del punto de
equilibrio es también un conjunto invariante.

VIII. Teorema del Conjunto Invariante Local. Considere el sistema dado en

(3.3). Sea V (x) una función escalar con primeras derivadas parciales continuas. Sea
Ω una región acotada deﬁnida por V (x) < , con > 0. Asumamos que:

V̇ (x) ≤ 0 (3.5)

para todo x en Ω . Sea R el conjunto de todos los puntos dentro de Ω donde V̇ (x) = 0,
y sea M el más grande conjunto invariante en R. Entonces, cada solución x(t) en Ω
tiende a M conforme t → ∞.

Que M sea el conjunto invariante más grande en R signiﬁca que M es la unión

de todos conjuntos invariantes dentro de R. La interpretación geométrica de este
teorema se ilustra en la ﬁgura 3.7.

V
V=l

Ωl

x0
x1

Figura 3.7: Interpretación geométrica del teorema del conjunto invariante.

Si la condición (3.5) se sustituye por

V̇ (x) < 0 for all x = 0 in Ω (3.6)

y el origen está en Ω , entonces tal origen es asintóticamente estable, y cada solución

en Ω tiende hacia el origen conforme t → ∞.
3.3 SCAMR para Sistemas No Lineales de una Entrada 89

IX. Teorema del Conjunto Invariante Global. Considere el sistema dado

en (3.3). Sea V (x) una función escalar con primeras derivadas parciales continuas.
Suponga que V (x) > 0 para todo x = 0 y V̇ (x) ≤ 0. Sea R el conjunto de todos
los puntos donde V̇ (x) = 0, y M el conjunto invariante más grande en R. Entonces
todas las soluciones convergen completamente (globalmente) asintóticamente en M
conforme t → ∞.
En vista de los teoremas del conjunto invariante, una función de Lyapunov V
tiene que desaparecer gradualmente. Esto es, V̇ tiene que converger a cero debido a
que V es acotado inferiormente. Demostración de los teoremas del conjunto invariante
se pueden encontrar en [16], [3].

Ejemplo 3.7

Considere el sistema dinámico:

ẋ1 = x1 (x21 + x22 − 4) − 4x1 x22

ẋ2 = 4x21 x2 + x2 (x21 + x22 − 4)

para el punto de equilibrio x = 0 considere la función:

V (x) = x21 + x22

A lo largo de una trayectoria de estado, su derivada V̇ es:

V̇ (x) = 2(x21 + x22 )(x21 + x22 − 4)

Observe que V̇ (x) < 0 dentro de un cı́rculo de radio 2. Por consiguiente, usando el
teorema de estabilidad II de Lyapunov, podemos inferir que el origen es asintótica-
mente estable. Para = 4, la región Ω deﬁnida por V (x) = x21 +x22 < 4 es acotada y el
conjunto R es el origen, el cual es un conjunto invariante. Por consiguiente, cualquier
trayectoria que se inicia dentro del cı́rculo de radio 2 converge hacia el origen y esta
región constituye el dominio de atracción.

3.3. SCAMR para Sistemas No Lineales de una Entrada

3.3.1. Formulación del Problema y de la Ley de Control
Consideremos el siguiente sistema no lineal en su forma asociada:

m
dn y
(n)
y + αi∗ fi (x, t) = bu y (n) (3.7)
dtn
i=1

donde x = [y ẏ . . . y (n) ]T es el vector de estado de orden n, αi∗ y b son constantes

desconocidas, y fi son funciones no lineales conocidas. Dividiendo ambos miembros
de (3.7) por b, se obtiene:

m
1 αi∗
h y (n) + αi fi (x, t) = u h= αi = (3.8)
b b
i=1
90 Control Adaptativo con Modelo Referencial

Deﬁnamos el error de seguimiento a la salida:

e = y − yd

donde yd es la trayectoria deseada, de modo tal que el error combinado s se pueda

expresar como:

s = e(n−1) + λn−2 e(n−2) + · · · + λ0 e = ∆(p)e = y (n−1) − yr(n−1) (3.9)

donde:
∆(p) = pn−1 + λn−2 pn−2 + · · · + λ0 = (p − p1 ) . . . (p − pn )
(n−1)
yr(n−1) = yd − λn−2 e(n−2) − · · · − λ0 e
en el cual p es el operador de Laplace y ∆(p) es un polinomio estable Hurwitz, lo
cual signiﬁca que todas las raı́ces complejas pi = σi + jωi , i = 1, . . . , n de ∆(p) = 0
veriﬁcan la condición σi < 0. Asumamos la siguiente ley de control:

m
u = h yr(n) − k s + αi fi (x, t) (3.10)
i=1

(n)
donde las constantes k y h poseen el mismo signo. La variable yr , denotada como
la variable de referencia de y (n) , se determina de:
(n−1)
(n) dyr
yr(n) = yd − λn−2 e(n−1)
− ··· − λ0 ė yr(n) =
dt
Sustituyendo (3.10) en (3.8) nos conduce al error de seguimiento dinámico:

h ṡ + k s = 0 (3.11)

Observar que (3.11) es exponencialmente convergente en s, lo cual a la vez garantiza

la convergencia del error de seguimiento e.

3.3.2. La Ley de Adaptación

Reemplazando los parámetros h y αi de (3.10) por sus valores estimados
hy
i respectivamente, entonces la ley de control del SCAMR toma la forma:
α

m
u=
h yr(n) − k s + i fi (x, t)
α (3.12)
i=1

Ahora deﬁnamos % h= h − h and α %i = α

i − αi . Sustituyendo (3.12) en (3.8) produce
el error de seguimiento dinámico:

m
hṡ + k s = %
h yr(n) + %i fi (x, t)
α (3.13)
i=1

el cual se puede reescribir como:

1/h
m
s= %h yr(n) + %fi (x, t)
α (3.14)
p + (k/h)
i=1
3.3 SCAMR para Sistemas No Lineales de una Entrada 91

donde p es el operador de Laplace. Considere la siguiente ley de adaptación:

˙
h = −γ sgn(h)s yr(n)
α̂˙ = −γ sgn(h)s fi (3.15)

donde γ es la ganancia de adaptación. Para determinar si el SCAMR garantiza con-

vergencia de seguimiento global, consideremos la siguiente función de Lyapunov:

m
V = |h|s2 + γ −1 % h2 + %i2
α (3.16)
i=1

Usando el hecho de que h sign(h) = |h| y k sign(k) = |k| y dado que k y h poseen el
mismo signo, se puede demostrar fácilmente que:

V̇ = −2|k|s2 < 0 (3.17)

lo cual garantiza convergencia de seguimiento global del SCAMR en el sentido del

método directo de Liapunov (subsección 3.2.3). Ahora, considere la ley de adaptación:
˙

h = −γh sgn(h)s yrn
˙ i = −γα sgn(h)s fi
α (3.18)

donde las ganancias de adaptación γh y γk son diferentes para cada parámetro des-
conocido. Seleccionando la siguiente candidata para función de Lyapunov:

m
V = |h|s2 + γh−1%
h2 + γk−1 %i2
α (3.19)
i=1

se puede demostrar fácilmente que V̇ nos conduce a (3.17), lo cual garantiza conver-
gencia de seguimiento global del SCAMR.

3.3.3. Zona–Muerta para Evitar Corrimiento de Parámetros

El análisis de los SCAMR hasta ahora realizado sólo ha tomado en cuenta in-
certidumbre en los parámetros. Sin embargo, en el mundo real, sistemas controlados
tienen que trabajar en la presencia de incertidumbres no paramétricas tales como:
dinámica de alta frecuencia no modelada en actuadores o estructuras sujetas a vi-
bración, dinámica de baja frecuencia no modelada tales como las fricciones estática y
de Coulomb, ruido de medición, retardos en el dominio discreto, error computacional
de redondeo, etc.
En sistemas de control es intuitivamente comprensible que mientras más grande
sean las incertidumbres paramétricas, más grande será el error de seguimiento. Con-
secuentemente, los SCAMR se pueden volver inestables en presencia de grandes in-
certidumbres paramétricas. Por otro lado, estudios de simulación han demostrado
que cuando un SCAMR es persistentemente excitado, entonces el sistema muestra
cierta robustez con respecto a las incertidumbres no paramétricas. Por el contrario,
aún pequeñas incertidumbres paramétricas pueden causar problemas de estabilidad
si el SCAMR no está excitado permanentemente.
92 Control Adaptativo con Modelo Referencial

El problema del corrimiento de parámetros hacia valores peligrosos está asoci-

ado con las incertidumbres no paramétricas. Tal problema se origina principalmente
cuando el SCAMR no está excitado permanentemente o debido a la presencia del
ruido de medición. El corrimiento de los valores de los parámetros puede causar que
el SCAMR se torne inestable si se permite que los parámetros estimados desplacen
sus valores hacia valores que puedan provocar que los polos del SCAMR realimentado
se vuelvan inestables.
La experiencia dicta que la presencia de pequeños errores de seguimiento pueden
originar el corrimiento de los parámetros a valores peligrosos. La técnica más simple
de modiﬁcación de la ley de control para evitar este problema es detener el mecanismo
de adaptación en presencia de pequeño errores de seguimiento. Esta técnica conocida
como “zona–muerta”, sustituye los términos de (3.18):
˙

h = −γh sgn(h)s yr(n) ˙ i = −γk sgn(h)s fi
α

por:
&
(n)
˙
−γh sgn(h)s yr |s| > ∆y
h =
0 |s| < ∆y

−γα sgn(h)s fi |s| > ∆f
˙ i =
α (3.20)
0 |s| < ∆f

donde ∆h y ∆f representan el tamaño de la zona–muerta. Las expresiones dadas en

˙ (n)
3.20 nos indican que cuando |s| < ∆y , entonces
h debe de tomar el valor −γh sgn(h)s yr
previamente computado. Del mismo modo, cuando |s| < ∆f , entonces α ˙ i debe de
tomar el valor −γk sgn(h)s fi computado en el tiempo de muestreo anterior.

Ejemplo 3.8

El modelo dinámico del MRAF (manipulador robótico con articulación elástica)

mostrado en la ﬁgura 1.4 se muestra en (1.30). Determinar su forma asociada (ecuación
(3.7)).

Solución: Deﬁnamos y = θ y x = [ y ẏ ÿ y (3) ], entonces (1.30) se puede expresar

en su forma asociada como:
4

(3)
hy + αi fi (x) = u
i=1

donde:
Jeq La Beq La Ra Jeq
h= α1 = +
KA KA nKA Km

nKb Ra Beq meq gLLa meq gLRa
α2 = + α3 = α4 =
KA nKA Km KA nKA Km
1
meq = m + mH f1 = ÿ f2 = ẏ f3 = ẏ cos y f4 = sen y
2
3.4 SCAMR para Sistemas No Lineales Multivariables 93

Aplicación 3.1 Implementar un SCAMR para el Manipulador de 1GDL

En esta aplicación se diseña e implementa en tiempo real un SCAMR para el

manipulador robótico de 1GDL mostrado en la ﬁgura 1.1 y descrito en la subsección
1.1.1. Deﬁnamos y = θ y x = [ y ẏ ÿ y (3) ], entonces (1.30) se puede expresar en su
forma asociada como:
4

(3)
hy + αi fi (x) = u
i=1

donde:
Jeq La Beq La Ra Jeq
h= α1 = +
KA KA nKA Km

nKb Ra Beq meq gLLa meq gLRa
α2 = + α3 = α4 =
KA nKA Km KA nKA Km
1
meq = m + mH f1 = ÿ f2 = ẏ f3 = ẏ cos y f4 = sen y
2

3.4. SCAMR para Sistemas No Lineales Multivariables

Del capı́tulo 1 sabemos que una gran clase de sistemas no lineales electro–
mecánicos, tales como manipuladores robóticos, se pueden describir mediante su
modelo L–E (por ejemplo ver (1.113) and (1.143)), a saber:
   
q1 u1
   
M(q)q̈ + P(q, q̇)q̇ + d(q) = u q =  ...  u =  ...  (3.21)
qm um

donde las matrices M, P y d representan la inercia del sistema a controlar, los torques
centrı́petos y de Coriolis, y los torques gravitacionales respectivamente. También, q
es el vector de coordenadas generalizadas y u es el vector de control.
El objetivo de control del SCAMR es diseñar una ley de control u capaz de
hacer que la salida del sistema q(t) siga a la taryectoria deseada qd (t) con velocidad
suﬁciente a pesar de la presencia de incertidumbres en los parámetros. Asumamos
que todos los términos en (3.21) dependen linealmente de un vector de parámetros a
con elementos conocidos, a saber:
Ya = u (3.22)
donde Y es una matriz conocida. Considere la siguiente ley de control:

a − KD s
u = Y (3.23)

donde KD s es el término derivativo y Y a es el término anticipativo. En los términos

es el vector estimado de parámetros, KD (la ganancia derivativa) es una
descritos, a
matriz simétrica constante deﬁnida positiva y s es un vector de superﬁcies deslizantes
94 Control Adaptativo con Modelo Referencial

cuyos elementos si , i = 1, . . . , m se deﬁnen mediante la ecuación escalar si (q, t) = 0,

de modo tal que:

d
si = ( + λi )n−1 q%i = (p + λi )n−1 q%i (3.24)
dt
donde λi > 0 es una constante (el ancho de banda), p es el operador de Laplace y:

q%i = qi − qdi

es el error de seguimiento. Por ejemplo, para n = 2, (3.24) se convierte en un error

de seguimiento compuesto de velocidad y posición:

%̇ + Λ%
s=q q = q̇ − q̇r q̃ = q − qd q̇r = q̇d − Λ%
q (3.25)

donde:

s = [s1 ... sm ]T %̇ = [q%̇1

q ... q%̇m ]T %̇r = [q%̇r1
q ... q%̇rm ]T
 
λ1 0 ... 0
 0 λ2 ... 0 
 
qd = [qd1 ... qdm ]T Λ= .. .. ..  (3.26)
 . . ... . 
0 0 . . . λm
La conservación de la energı́a requiere que:

1 d T
[q̇ Mq̇] = q̇T (u − d) (3.27)
2 dt
donde q̇T Mq̇ es la energı́a cinética del sistema y q̇T (u − d) es la potencia de entrada
generada por el actuador. Diferenciando el miembro izquierdo de (3.27):

1
q̇T Mq̈ + q̇T Ṁq̇ = q̇T (u − d) (3.28)
2
De (3.21) obtenemos: Mq̈ = u − d − Pq̇. Sustituyendo este término en (3.28):

q̇T (Ṁ − 2P)q̇ = 0 (3.29)

Ha sido establecido en [24], [3] que (Ṁ − 2P) = J es antisimétrica. Por consiguiente:

Ṁ = 2P + J (3.30)

Considere la siguiente candidata para función de Lyapunov:

1 T
V (t) = T Γ−1 a
s Ms + a % (3.31)
2
%=a
donde Γ es una matriz simétrica deﬁnida positiva y a −a es el error de estimación
de parámetros. Diferenciando (3.31) se obtiene:

1 T
˙ Γ−1 a
V̇ (t) = sT Mṡ + sT Ṁ + a %
2
3.4 SCAMR para Sistemas No Lineales Multivariables 95

y empleando la relación s = q̇ − q̇r (ecuación (3.25)) en la expresión anterior se

obtiene:
1 T
V̇ (t) = sT (Mq̈ + Mq̈r ) + sT Ṁs + a˙ Γ−1 a
%
2
Sustituyendo (3.30), (3.23) y Mq̈ de (3.21) en V̇ produce:

T
˙ Γ−1 a
a − KD s − Mq̈r − Pq̇r − d) + a
V̇ (t) = sT (Y % (3.32)

en donde hemos usado el hecho de que sT Js = 0, dado que J es antisimétrica1 . La

se puede formular como:
actualización de los parámetros estimados a

˙ = −ΓYT s
a (3.33)

mientras que la propiedad de parametrización lineal en (3.32) establece que:

Y(q, q̇, q̇r , q̈r )a = M(q)q̈r + P(q, q̇)q̇r + d(q) (3.34)

Reemplazando (3.34)y (3.33) en (3.32) produce:

V̇ (t) = −sT KD s ≤ 0 (3.35)

Dado que s = q %̇ + Λ%q (ver (3.25)), entonces (3.35) garantiza que los errores de
seguimiento de posición q% y de velocidad q%̇ tiendan a 0 conforme t → ∞. En otras
palabras, los errores de seguimiento convergen en la superﬁcie s = 0.
El resultado establecido en (3.35) es también válido para el modelo L–E dado
en (1.130). Para este caso, las relaciones (3.22), (3.23) y (3.34) toman las formas
siguientes:
Ya = T (3.36)

a − KD s
u = Y (3.37)

T = Y(q, q̇, q̇r , q̈r )a = H(q)q̈r + C(q, q̇)q̇r + d(q) (3.38)

dado en (3.33) se pueden emplear

La actualización de los parámetros estimados a
también para este caso.

Aplicación 3.2 Diseño e Implementación de un SCAMR para el MRT

En esta aplicación el objetivo es diseñar e implementar en tiempo real un

SCAMR para el MRT (manipulador robótico traslacional), cuyo modelo L–E se da
en (1.113), donde m12 = −p12 y d2 = g m21 . Empleando la deﬁnición dada en (3.34),
el modelo L–E tome la forma:

rr u1
M(q)q̈r + P(q, q̇)q̇r + d(q) = u qr = u= = Ya
θr1 u2
1
Suponga que sT Js = c = 0, donde c es una constante. Como J es antisimétrica: J = −JT ; luego
sT Js = ±c. Entonces, la única solución posible para la constante es: c = 0
96 Control Adaptativo con Modelo Referencial

Deﬁniendo a1 = m11 , a2 = p12 , a5 = p11 , a3 = m21 , a4 = m22 y a6 = p22 , el modelo

paramétrico lineal correspondiente u = Ya se formula como:
 
a1
 
 a2 
r̈ θ̈1 cos θ1 − θ̇12 sin θ1 0 0 ṙ 0  a
 3 

u=
0 0 cos θ1 − g sin θ1 θ̈1 0 θ̇1  a4 


 a5 
a6
La ley de control (3.23) se puede escribir como:
a − KD s = Y
u = Y a − KD q %
%̇ − Ks q
donde, por simplicidad, KD = diag[KD ] y KP = KD Λ = diag[KP ]. La simulación
del SCAMR diseñado ( archivo trmmrac.m) asume las siguientes condiciones iniciales:
r(0) = 0 m (posición del carro) y θ1 = 0 rad (posición del brazo). Para un tiempo
de muestreo de T = 0,01 s, los parámetros de la ley de control se fijan en KD = 1,5
y KP = 2, mientras que la matriz Γ de la ley de adaptación (3.33) se fija en Γ =
diag 0,09 0,16 0,3 0,01 4,1 0,05 . Las trayectorias deseadas son:
π π
cos(0,2π kT )
rd (t) = θ1d (t) = cos(0,2π kT )
4 4
donde k es el tiempo discreto. Los resultados de la simulación se muestran en las
figuras 3.8, 3.9 y 3.10.
1

0.5
Cart position (m)

−0.5

−1
0 1 2 3 4 5 6 7 8 9 10
Time (s)

3
Control voltage u1

−1

−2
0 1 2 3 4 5 6 7 8 9 10
Time (s)

Figura 3.8: Posición controlada del carro del MRT.

Aplicación 3.3 Implementar un SCAMR para el MRS

De acuerdo con la ecuación (3.38), el modelo de Lagrange–Euler del manipu-

lador robótico esférico dado en (1.130) se puede redeﬁnir como:
T = Y(q, q̇, q̇r , q̈r )a = H(q)q̈r + C(q, q̇)q̇r + d(q) (3.39)
3.4 SCAMR para Sistemas No Lineales Multivariables 97

0.5

Link position (rad)

−0.5

−1

−1.5
0 1 2 3 4 5 6 7 8 9 10
Time (s)

6
Control voltage u2

−2

−4

−6
0 1 2 3 4 5 6 7 8 9 10
Time (s)

Figura 3.9: Posición controlada del brazo del MRT.

0.04 0.05

0
0.02
ae1

ae2

−0.05
0
−0.1

−0.02 −0.15
0 2 4 6 8 10 0 2 4 6 8 10

0.2 0.05

0.1
ae3

ae4

0 0

−0.1

−0.2 −0.05
0 2 4 6 8 10 0 2 4 6 8 10

0.6 0.02

0.4
0.01
ae5

ae6

0.2
0
0

−0.2 −0.01
0 2 4 6 8 10 0 2 4 6 8 10
Time (s) Time (s)

Figura 3.10: Parámetros estimados del MRT.

Deﬁniendo:

a1 = 2T1 a2 = H22 a3 = m2 gLx2

98 Control Adaptativo con Modelo Referencial

entonces (3.39) se determina como:

 

a1
T1 Y11 Y12 Y13   a1 + a2 cos2 q2 0 q̈r1
= a2 +
T2 Y21 Y22 Y23 0 a2 q̈r2
a3

a2 q̇2 sin q2 cos q2 a2 q̇1 sin q2 cos q2 q̇r1 0
+
a2 q̇1 sin q2 cos q2 0 q̇r2 a3 cos q2

donde:

Y11 = q̈r1 Y12 = q̈r1 cos2 q2 − q̇r1 q̇2 sin q2 cos q2 − q̇r2 q̇1 sin q2 cos q2

Y13 = 0 Y21 = 0 Y22 = q̈r2 + q̇r1 q̇1 sin q2 cos q2 Y23 = cos q2
La ley de control está dada por (3.36):

a − KD s
T = Y

Sin embargo, los voltajes de control se computan de (1.141) y (1.141):

u1 = RT 1 (Jeq1 q̈1 + Beq1 q̇1 + T1 ) + NT 1 q̇1

u2 = RT 2 (Jeq2 q̈2 + Beq2 q̇2 + T2 ) + NT 2 q̇2

La simulación del SCAMR diseñado (archivo srmmrac.m) asume las siguientes condi-
ciones iniciales: q1 (0) = 0 rad (posición de la base) y q2 (0) = −π/2 rad (posición del
brazo). Para un tiempo de muestreo de T = 0,01 s, los parámetros de la ley de control
se ﬁjaron en KD = diag[1,5]. Las trayectorias deseadas están dadas por:

qd1 (k) = sin 2kT qd2 (k) = cos 2kT

donde k = t/T es el tiempo discreto. La matriz Γ de la ley de adaptación (3.33) se

ﬁjó en Γ = diag 0,05 0,075 0,1 . Los resultados de la simulación se muestran en
las ﬁguras 3.11, 3.12 y 3.13.

PROBLEMAS
IN PROGRESS
3.4 SCAMR para Sistemas No Lineales Multivariables 99

1.5

Base position (rad)

0.5

−0.5

−1

−1.5
0 1 2 3 4 5 6 7 8 9 10

6
Voltage control u1

−2

−4
0 1 2 3 4 5 6 7 8 9 10
Time (s)

Figura 3.11: Trayectoria θ1 (t) controlada y su señal de control.

1.5

1
Link position (rad)

0.5

−0.5

−1

−1.5

−2
0 1 2 3 4 5 6 7 8 9 10

8
Voltagr control u2

−2

−4
0 1 2 3 4 5 6 7 8 9 10
Time (s)

Figura 3.12: Trayectoria θ2 (t) controlada y su señal de control.

100 Control Adaptativo con Modelo Referencial

0.15

0.1
ae1

0.05

−0.05
0 1 2 3 4 5 6 7 8 9 10

0.6

0.4
ae2

0.2

−0.2
0 1 2 3 4 5 6 7 8 9 10

1.3
ae3

1.25

0 1 2 3 4 5 6 7 8 9 10
Time (s)

Figura 3.13: Parámetros estimados.

Capı́tulo 4

Linealización por
Realimentación de Estados

4.1. Herramientas de la Geometrı́a Diferencial

Los métodos de la geometrı́a diferencial se aplican principalmente a sistemas no
lineales para determinar si tales sistemas son linealizables mediante realimentación de
estados; esto es, si la descripción dinámica de un sistema en particular se puede hacer
que parezca lineal, luego de efectuar una apropiada transformación de coordenadas
y aplicar la correspondiente linealización de estados no lineal. En concordancia con
la terminologı́a empleada en geometrı́a diferencial [10], [3], [11], la siguiente función
vectorial n-dimensional:
   
f1 (x) f1 (x1 , . . . , xn )
 ..   .. 
f (x) =  . = .  (4.1)
fn (x) fn (x1 , . . . , xn )

se denomina un campo vectorial, si a cada función vectorial f le corresponde un

campo de vectores en un espacio n-dimensional Rn . En lo que sigue, nosotros nos
ocuparemos sólo de campos vectoriales suaves de la forma f (x), signiﬁcando que
tales funciones vectoriales poseen derivadas parciales continuas de cualquier orden.
El concepto de suavidad se aplica también a funciones.
El gradiente de una función escalar suave h(x) se deﬁne como:

∂h ' (
∇h(x) = = ∂h
∂x1 ··· ∂h
∂xn (4.2)
∂x

Los elementos de ∇h son (∇h)i = ∂h/∂xi . De la misma manera, el jacobiano de f (x),

de elementos (∇f )ij = ∂fi /∂xj , se deﬁne como:
 ∂f1 ∂f1 
∂x1 ··· ∂xn
∂f (x)  .. .. .. 
∇f (x) = = . . .  (4.3)
∂x ∂fn ∂fn
∂x1 ··· ∂xn
102 Linealización por Realimentación de Estados

4.1.1. Derivadas y Corchetes de Lie

Derivadas de Lie

La derivada de Lie de una función escalar h(x) con respecto al campo vectorial
f (x) es una nueva función escalar Lf h deﬁnida como:

∂h ∂h
Lf h = ∇h f = f1 + · · · + fn (4.4)
∂x1 ∂xn

Observar que la derivada de Lie es el producto interno entre ∇h(x) y f (x). Derivadas
de Lie repetidas se pueden formular en forma recursiva como:

L0f h = h
f h) = ∇(Lf h) f
Lif h = Lf (Li−1 i−1
for i = 1, 2, . . . (4.5)

Si f y g son campos vectoriales, entonces:

Lg Lf = ∇(Lf ) g (4.6)

Corchetes de Lie

El corchete de Lie de dos campos vectoriales f y g es otro campo vectorial [f , g]

deﬁnido como:
[f , g] = ∇g f − ∇f g (4.7)

La notación adf g (donde ad signiﬁca adjunta) se emplea frecuentemente en lugar de

[f , g]. Corchetes de Lie repetidos se pueden formular en forma recursiva:

adf0 g = g
adfi g = [f , adfi−1 g] para i = 1, 2, . . . (4.8)

Siempre que f , f1 , f2 , g, g1 y g2 sean campos vectoriales suaves, α1 and α2 sean

constantes escalares, y h(x) sea una función escalar suave de x, se puede formular la
siguiente propiedad del corchete de Lie:

1) Bilinealidad:

[α1 f1 + α2 f2 , g] = α1 [f1 , g] + α2 [f2 , g]

[f , α1 g1 + α2 g2 ] = α1 [f , g1 ] + α2 [f , g2 ] (4.9)

2) Anti-conmutatividad:

[f , g] = −[g, f ] (4.10)

3) Identidad de Jacoby:
Ladf g h = Lf Lg h − Lg Lf h (4.11)
4.1 Herramientas de la Geometrı́a Diferencial 103

4.1.2. Difeomorfismos y Transformación de Coordenadas

Una función Φ definida en una región Ω se conoce como un difeomorfismo si
ambos, Φ y su inversa Φ−1 son funciones suaves. Si la región Ω es Rn (el espa-
cio total), entonces, Φ(x) se denomina un difeomorfismo global. Por otra parte, un
difeomorfismo local se defined sólo en una vecindad finita de un punto dado x0 .
Una función suave Φ(x) definida en una región Ω en Rn es un difeomorfismo
local, siempre que la matriz jacobiana ∇x sea no singular en un punto x = x0 de la
región Ω.
Empleando difeomorfismo, nosotros podemos transformar los estados de un
sistema no lineal en un nuevo conjunto de estados correspondiente al sistema no lineal
transformado. La metodologı́a es bien conocida. Consideremos un sistema SISO (de
una entrada y una salida) no lineal descrito por:
ẋ = f (x) + g(x)u y = h(x) (4.12)
donde u es la única entrada e y es la única salida. Definamos un nuevo conjunto de
estados z = Φ(x). Efectuando diferenciación en z:
∂Φ ∂Φ
ż = ẋ = (f (x) + g(x)u) = f ∗ (z) + g∗ (z)u y = h∗ (z) (4.13)
∂x ∂x
donde
∂Φ ∂Φ
f∗ = f g∗ = g x = Φ−1 (z) h∗ = h
∂x ∂x

4.1.3. El Teorema de Frobenius

Suponga que f1 , f2 , . . ., fm es un conjunto de campos vectoriales linealmente
independientes en Rn . El teorema de Frobenius establece que tal conjunto es com-
pletamente integrable sı́ y sólo si dicho conjunto es involutivo.
Se dice que el conjunto de campos vectoriales arriba deﬁnido es completamente
integrable sı́ y sólo si existen n − m funciones escalares h1 (x), h2 (x), . . ., hn−m (x)
que satisfacen el siguiente sistema de ecuaciones diferenciales parciales.
∇hi fj = 0 1 ≤ i ≤ n − m, 1≤j≤m (4.14)
donde los gradientes ∇h1 , ∇h2 , . . ., ∇hn−m son también linealmente independientes.
El conjunto de campos vectoriales en consideración se dice que es involutivo,
sı́ y sólo si existen funciones escalares αijk en R (el espacio unidimensional) que
satisfacen:

m
[fi , fj ](x) = αijk (x) fk (x) ∀ i, j (4.15)
k=1
La última ecuación indica que el campo vectorial resultante [fi , fj ](x) es una com-
binación lineal del conjunto original de campos vectoriales f1 , f2 , . . ., fm . De (4.15),
podemos postular:
1) El conjunto de campos vectoriales constantes f1 , f2 , . . ., fm es siempre involutivo
porque el corchete de Lie de cualquier par de de tales campos siempre es nulo,
esto es:
[fi , gj ] = 0
104 Linealización por Realimentación de Estados

lo cual signiﬁca que estos campos se pueden representar como una combinación
lineal.
2) Un conjunto que contiene un único campo vectorial f es involutivo porque:
[f , f ] = 0.
3) El conjunto de campos vectoriales f1 , f2 , . . ., fm es involutivo si ∀ x y ∀ i, j
' ( ' (
rank f1 (x) . . . fm (x) = rank f1 (x) . . . fm (x) [fi (x), fj ](x)
'(
donde la notación rank . representa el rango de una matriz de campos vecto-
riales columna.

4.2. Linealización por Realimentación. Caso: SISO

Esta sección presenta la metodologı́a para generar una relación entrada–salida
para procesos SISO no lineales con el propósito de diseñar controladores estables. El
sistema no lineal en consideración se puede describir como:
ẋ = f (x) + g(x)u y = h(x) (4.16)
     
x1 f1 (x) g1
     
x =  ...  f = ..
.  g =  ... 
xn fn (x) gn
donde x es el vector de estado de orden n × 1, u es la entrada de control, y es la
salida del sistema, f y g son campos vectoriales suaves de orden n × 1, y h es una
función suave.

4.2.1. Condiciones para Linealización

El sistema no lineal ẋ = f (x) + g(x)u es linearizable por realimentación de
estados, sı́ y sólo si las siguientes condiciones son verdaderas para una región Ω:
1) Los campos vectoriales g, adf g, . . ., adfn−1 g son linealmente independientes en
la región Ω.
2) El conjunto {g, adf g, . . ., adfn−2 g } es involutivo en Ω.
Para sistemas SISO lineales se sabe que f (x) = Ax y g(x) = B, donde A de orden
n × n y B de orden n × 1 son las matrices de estado y de control (o de distribución)
respectivamente. Por consiguiente, la primera condición se convierte en la bien cono-
cida condición de estabilidad completa dada en (2.11), a saber, un sistema lineal de
la forma:
ẋ = Ax + Bu y = Cx (4.17)
es controlable en sus estados si su matriz de controlabilidad C posee rango completo:
rank C = rank [B AB ··· An−1 B] = n (4.18)

La primera condición descrita arriba puede ser interpretada como la Condición de

Estabilidad Generalizada.
4.2 Linealización por Realimentación. Caso: SISO 105

4.2.2. El Grado Relativo de un Sistema

Diferenciemos la salida y de (4.16):

ẏ = ∇h(x)(f + gu) = Lf h(x) + Lg h(x)u

Si Lg h(x) = 0 para algún x = x0 , entonces la siguiente transformación en la entrada:

1
u= (−Lf h(x) + v)
Lg h(x)

genera una relación diferencial lineal entre la salida y y la nueva entrada v, de la

forma: ẏ = v. Por el contrario, si Lg h(x) = 0 para todo x, la diferenciación de ẏ
produce:
ÿ = L2f h(x) + Lg Lf h(x)u

Si Lg Lf h(x) = 0 para todo x, necesitamos diferenciar y (3) , . . ., y (i) como sigue:

d iy
y (i) = = Lif h(x) + Lg Li−1
f h(x)u
dt i

hasta que para algún entero r = i y para algún x = x0

Lg Lr−1
f h(x) = 0

Sustituyendo la siguiente ley de control:

1
u= r−1 (−Lrf h(x) + v)
Lg Lf h(x)

en:
y (r) = Lrf h(x) + Lg Lr−1
f h(x)u

genera una relación diferencial lineal entre la salida y y la nueva entrada v de la

forma: y (r) = d r y/dt r = v.
Por consiguiente, un sistema SISO posee un grado relativo r en el punto x0
en una región Ω si, para todo x Ω:

Lg Lif h(x) = 0 0≤i<r−1 (4.19)

Lg Lr−1
f h(x) = 0 (4.20)

Observar que r es el número de diferenciaciones ejecutadas en la salida y requeridas

para que la entrada u aparezca. En general: r ≤ n (recordar que n es el orden del
sistema). Si r = n, entonces la linealización entrada–salida se denomina exacta y
en esta situación todos los estados se realimentan.
Por otra parte, el grado relativo de un sistema no lineal es indeﬁnido en x0 si
el coeﬁciente of u (equation (4.20)) is zero en x0 , pero no es cero en algunos puntos
x cercanos a x0 .
106 Linealización por Realimentación de Estados

4.2.3. Forma Normal SISO con Linealización Exacta

El sistema no lineal (4.16) se puede transformar a su forma normal usando los
resultados establecidos en la subsección 4.1.2. Sabemos que linealización exacta de
un sistema no lineal descrito por (4.16) ocurre cuando el grado relativo r es igual al
orden del sistema n. Para linealización exacta, la transformación de estados:
       
z1 φ1 (x) h(x) y
 z2   φ2 (x)   Lf h(x)   ẏ 
       
z =  .  = Φ(x) =  .. = ..  =  ..  (4.21)
 ..   .   .   . 
zn φn (x) Lfn−1 h(x) yn

conduce a la siguiente descripción en el espacio de estado:

   
ż1 z2
 ż2   z3 
   
 ..   . 
ż =  .  =  .
.  y = z1 (4.22)
   
 żn−1   zn 
żn b(z) + a(z)u

donde:

a(z) = Lg Lfn−1 h(Φ−1 (z))

b(z) = Lnf h(Φ−1 (z)) (4.23)

4.2.4. La Ley de Control SISO para Linealización

Consideremos la siguiente ley de control de linealización:
1
u= [−b(z) + v] (4.24)
a(z)

donde v es una nueva entrada a ser determinada, a(z) y b(z) están dadas en (4.23),
y z es el nuevo estado para linealización. Substituyendo (4.24) en (4.22) produce la
siguiente representación canónica invariante con el tiempo:

ż = Mz + Nv y = Cz (4.25)

donde:
   
0 1 0 ··· 0 0
 0 0 1 ··· 0   0 
   
 .. .. .. .. ..  .. 
M= . . . . . N= .  C 1 0 ··· 0 0
   
 0 0 0 0 1   0 
0 0 0 0 0 1

La función de transferencia del sistema es:

y(s) 1
= H(s) = C(sI − M)−1 N = n (4.26)
v(s) s
4.3 Linealización por Realimentación: Caso MIMO 107

donde s es el operador de Laplace. La entrada v se diseña para ubicar los polos

del sistema lineal equivalente. Entonces, la entrada u se computa usando (4.24).
Empleando (4.26), el sistema lineal equivalente se puede seleccionar de:

d ny
v= = y (n) = ρ(n) + K1 ȳ (n−1) + · · · + Kn−1 ȳ˙ + Kn ȳ (4.27)
dt n

donde ρ(t) es la trayectoria deseada e ȳ(t) = ρ(t) − y(t) es la señal de error de

seguimiento. La ecuación caracterı́stica del sistema lineal equivalente es:

ȳ (n) + K1 ȳ (n−1) + · · · + Kn−1 ȳ˙ + Kn ȳ = 0 (4.28)

Para comportamiento asintótico estable, es decir, ȳ = (ρ − y) → 0 para t → ∞,

ninguna de las raı́ces de (4.28) se deben de localizar en el semiplano derecho del plano
s, incluyendo el eje imaginario. Los parámetros Ki , i = 1, . . . , n del controlador se
seleccionan para cumplir este requerimiento.

4.3. Linealización por Realimentación: Caso MIMO

4.3.1. Modelando Sistemas MIMO Cuadrados
Un sistema MIMO no lineal se denomina cuadrado cuando el número de sus
entradas iguala al número de sus salidas. El sistema cuadrado por considerar, en la
vecindad del punto x0 , se describe por:

m
ẋ = f (x) + G(x)u = f (x) + gj (x)uj (x) y = h(x) (4.29)
j=1

     
x1 f1 (x) u1
     
x =  ...  f (x) =  ..
.  u =  ... 
xn fn (x) um
   
y1 h1 (x)
   
y =  ...  h(x) =  ..
. 
ym hm (x)
 
G11 (x) . . . G1m (x)
 .. 
G(x) =  . ...  = g1 (x) · · · gm (x)
Gm1 (x) . . . Gmm (x)

donde x es el vector de estado de orden n × 1, u es el vector de control (la entrada)

de orden m × 1, y es el vector de salida de orden m × 1, f es un campo vectorial suave
de orden n × 1, h es un campo vectorial suave de orden m × 1, y G es una matriz de
dimensión n × m cuyas columnas son campos vectoriales gj de orden of order n × 1.
Los elementos de gj y h son funciones suaves.
108 Linealización por Realimentación de Estados

4.3.2. Grado Relativo Total

En la referencia [11], se establece que el sistema cuadrado descrito por (4.29)
posee un grado relativo total r = r1 + . . . + rm si:
1) Para todo x en una vecindad de x0
Lgj Lkf hi (x) = 0 j, i = 1, . . . , m k < ri − 1

2) La siguiente matriz de orden m × m es no singular en x = x0 :

 
Lg1 Lfr1 −1 h1 (x) · · · Lgm Lfr1 −1 h1 (x)
 Lg Lr2 −1 h2 (x) · · · Lg Lr2 −1 h2 (x) 
 1 f m f 
A(x) =  .. . ..  (4.30)
 . . . . 
rm −1 rm −1
Lg1 Lf hm (x) · · · Lgm Lf hm (x)

Observando las ﬁlas de A, podemos postular que cada entero ri está relacionado con
la i-ésima salida del sistema. También, notar que ri es el número de diferenciaciones
ejecutadas en la salida yi requeridas para que aparezca al menos uno de los compo-
nentes del vector de entrada u. La no singularidad de A(x) en x = x0 es la versión
multivariable de la condición impuesta por la ecuación (4.20).
Ejemplo 4.1
La descripción en el espacio de estado del sistema MRE (manipulador robótico esféri-
co) de dos entradas y dos salidas se da en (1.146) y (1.147). Determinar el grado
relativo total del MRE.

Solución: Las primeras tres derivadas de la salida y1 = h1 (x) = x1 produce:

∂h1 (x)
ẏ1 = ẋ = Lf h1 (x) = f1 (x) = ẋ1 = x3 Lg1 h1 (x) = 0
∂x
∂(Lf h1 (x))
ÿ1 = ẋ = Lf (Lf h1 (x)) = f3 (x) = ẋ3 = x5 Lg1 (Lf h1 (x)) = 0
∂x
(3) ∂(Lf (Lf h1 (x)))
y1 = ẋ = Lf (Lf (Lf h1 (x))) = f5 (x)
∂x
Lg1 (Lf (Lf h1 (x))) = G51 (x) = 0
Por consiguiente, el grado relativo para y1 resulta r1 = 3. También, las primeras tres
derivadas de la salida y2 = h2 (x) = x2 produce:
∂h2 (x)
ẏ2 = ẋ = Lf h1 (x) = f1 (x) = ẋ2 = x4 Lg2 h2 (x) = 0
∂x
∂(Lf h2 (x))
ÿ2 = ẋ = Lf (Lf h2 (x)) = f4 (x) = ẋ4 = x6 Lg2 (Lf h2 (x)) = 0
∂x
(3) ∂(Lf (Lf h2 (x)))
y2 = ẋ = Lf (Lf (Lf h2 (x))) = f6 (x)
∂x
Lg2 (Lf (Lf h2 (x))) = G62 (x) = 0
Por consiguiente, el grado relativo para y2 resulta r2 = 3 y el grado relativo total del
sistema viene a ser: r = r1 + r2 = 6.
4.3 Linealización por Realimentación: Caso MIMO 109

4.3.3. Forma Normal MIMO para Linealización Exacta

Si el grado relativo total del sistema cuadrado descrito en (4.29) es r, entonces:

r = r1 + r2 + · · · + rm ≤ n

Un sistema MIMO descrito por (4.29) posee linealización exacta, si su grado relativo
total r = r1 + . . . + rm es igual al orden n del sistema, es decir, la dimensión n del
vector de estados. Para linealización exacta, la transformación de estados:
   
φ1 (x) z1
 ..   .. 
 .   . 
   
 φr1 (x)   z 
   r 1 
 ψ1 (x)   zr1 +1 
   
 ..   .. 
 .   . 
z = Φ(x) =  ψr (x)  
= 
 (4.31)
 2   zr1 +r2 
 ..   .. 
 .   . 
   
 ξ1 (x)   zr +r +···+1 
   1 2 
 ..   .. 
 .   . 
ξrm (x) zr1 +r2 +···+rm

donde

φ1 (x) = h1 (x) = y1 (x); φ2 (x) = Lf h1 (x); · · · ; φr1 (x) = Lfr1 −1 h1 (x)

ψ1 (x) = h2 (x) = y2 (x); ψ2 (x) = Lf h2 (x); · · · ; ψr2 (x) = Lfr2 −1 h2 (x)
..
.
ξ1 (x) = hm (x) = ym (x); ξ2 (x) = Lf hm (x); · · · ; ξrm (x) = Lfrm −1 hm (x)

conduce a la siguiente descripción en el espacio de estado:

ẏ1 = φ̇1 (x) = φ2 (x)

..
.
(r1 −1)
y1 = φ̇r1 −1 (x) = φr1 (x)

(r )

m
y1 1 = φ̇r1 (x) = Lrf 1 h1 (Φ−1 (z)) + Lgj Lfr1 −1 h1 (Φ−1 (z))uj
j=1

ẏ2 = ψ̇1 (x) = ψ2 (x)

..
.
(r2 −1)
y2 = ψ̇r2 −1 (x) = ψr2 (x)

(r )

m
y2 2 = ψ̇r2 (x) = Lrf 2 h2 (Φ−1 (z)) + Lgj Lfr2 −1 h2 (Φ−1 (z))uj
j=1

..
.
110 Linealización por Realimentación de Estados

ẏm = ξ˙1 (x) = ξ2 (x)

..
.
(rm −1)
ym = ξ˙rm −1 (x) = ξrm (x)

m
(rm )
ym = ξ˙rm (x) = Lrf m hm (Φ−1 (z)) + Lgj Lfrm −1 hm (Φ−1 (z))uj
j=1
(4.32)

Ejemplo 4.2 La forma normal MIMO del MRE

Determinar la forma normal MIMO del proceso MRE.

Solución: Del ejemplo 4.1, la condición para linealización exacta se cumple para el
sistema MRE porque r = 6 = n (orden del sistema). Aplicación de las relaciones
(4.31) y (4.32) en el sistema MRE nos conduce a:
         
z1 h1 x1 y1 z1
 z2   Lf h1 (x)   x3   ẏ1   z4 
         
 z3   L2f h1 (x)   x5   ÿ1   z2 
z=

 = Φ(x) = 
 
=
 
=
 

 x = Φ (z) = 
−1



 z4   h2 (x)   x2   y2   z5 
 z5   Lf h2 (x)   x4   ẏ2   z3 
z6 L2f h2 (x) x6 ÿ2 z6

(4.33)
   
ż1 z2
 ż2   z3 
   
 ż3   v1  y1 z1
ż = 

=
 
 = Mz + Nv
 y= = = Cz (4.34)
 ż4   z5  y2 z4
 ż5   z6 
ż6 v2
donde:  
0 1 0 0 0 0
 0 0 1 0 0 0 
 
v1  0 0 0 0 0 0 
v= M=



v2  0 0 0 0 1 0 
 0 0 0 0 0 1 
0 0 0 0 0 0
 
0 0
 0 0 
 
 1 0  1 0 0 0 0 0
N=


 C=
 0 0  0 0 0 1 0 0
 0 0 
0 1
4.3 Linealización por Realimentación: Caso MIMO 111

4.3.4. La Ley de Control MIMO Desacoplada

Es importante anotar que el grado relativo ri , i = 1, . . . , m, es el entero más
pequeño requerido para que al menos una de las entradas aparezca en (seever (4.32)):

m
yiri = Lrf i hi (Φ−1 (z)) + Lgj Lfri −1 hi (Φ−1 (z))uj
j=1

Por consiguiente, Lfri −1 hi (Φ−1 (z))uj = 0 para al menos un j en la vecindad de x0 .

Ahora consideremos la siguiente ley de control desacoplada:

u = A−1 (z)[−B(z) + v] (4.35)

donde v = [v1 . . . vm ]T es una nueva entrada por determinar, y A(z) (ver (4.30)) y
B(z) son matrices con elementos:
r −1
aij = Lgi Lf j hj (Φ−1 (z)) i, j = 1, . . . , m

bi = Lrf i hi (Φ−1 (z)) i = 1, . . . , m

respectivamente. Sustitución de los elementos ui , i = 1, . . . , m (ecuación (4.35)) en

(4.32) conduce a la representación canónica invariante con el tiempo del sistema
(r )
MIMO, es decir, ecuación (4.32) con yi i = vi .
Por otra parte, de la relación y(s) = H(s)v(s), fácilmente se puede demostrar
que la matriz de transferencia H(s) del sistema MIMO linealizado es:
 
1/sr1 0 ··· 0
 0 1/sr2 ··· 0 
 
H(s) =  .. .. .. ..  (4.36)
 . . . . 
0 0 · · · 1/srm

(r )
lo cual signiﬁca que yi i = d ri yi /dt ri = vi , i = i, . . . , m, donde cada entrada vi se
diseña para ubicar los polos del correspondiente subsistema lineal equivalente. Tal
subsistema se puede seleccionar como:

d r i yi (r ) (r ) (r −1)
vi = r
= yi i = ρi i +Ki,1 ȳi i +· · ·+Ki,ri −1 ȳ˙ i +Ki,ri ȳi i = 1, . . . , m (4.37)
dt i

donde ρi (t) es la i-ésima trayectoria deseada y, ȳi (t) = ρi (t) − yi (t) es la i-ésima señal
de error de seguimiento. La i-ésima ecuación caracterı́stica del subsistema resulta:
(ri ) (ri −1)
ȳi + Ki,1 ȳi + · · · + Ki,ri −1 ȳ˙ i + Ki,ri ȳi = 0 i = 1, . . . , m (4.38)

Para comportamiento asintótico estable, es decir, cuando ȳi → 0 o cuando yi → ρi

para t → ∞, ninguna de las raı́ces de (4.38) debe de estar localizada en el semiplano
derecho del plano-s, incluyendo el eje imaginario.

Ejemplo 4.3
112 Linealización por Realimentación de Estados

Determinar la ley de control MIMO desacoplada para el proceso MRE.

Solución: Conforme a (4.34), la nueva entrada v = [v1 v2 ]T para el sistema MRE

es:

(3) (3)
ż3 = z1 = y13 = ẋ5 = q1 = v1
(3) (3)
ż6 = z2 = y23 = ẋ6 = q2 = v2 (4.39)

Usando (4.37), las entradas v1 y v2 toman la forma:

(3)
v1 = ρ1 + K13 ρ̈12 + K12 ρ̇1 + K11 ρ1 − K13 ÿ12 − K2 ẏ1 − K11 y1
(3)
v2 = ρ2 + K23 ρ̈2 + K22 ρ̇2 + K21 ρ2 − K23 ÿ2 − K22 ẏ2 − K21 y2 (4.40)

donde ρ1 y ρ2 son las trayectorias deseadas. Empleando (4.39), y (4.40) en (1.139) y

(1.140), la ley de control desacoplada del MRE viene a ser:

u1 = v1 LT1 (H11 + J1 ) + P1
u2 = v2 LT2 (H22 + J2 ) + P2 (4.41)

4.4. Observadores No Lineales con Polos Prescritos

El diseño de controladores por ubicación de polos para sistemas lineales [13], [14]
asume que todos los estados del sistema están disponibles en la realimentación. En
este caso, es posible forzar para que el sistema posea polos predeterminados a lazo
cerrado, es decir, polos prescritos (o eigenvalores) en localizaciones deseadas. En la
práctica, sólo parte de los estados son disponibles para procesamiento, y además, no
debemos de dejarnos tentar en la diferenciación de variables de estado con el ﬁn de
generar una nueva. Es bien conocido que la simple diferenciación de una señal pude
hacer decrecer por varias veces la relación señal a ruido.
Los observadores de estado para sistemas lineales estiman estados no medibles
sin un sistema de diferenciación. El diseño de un observador de estado lineal es muy
similar al diseño de un controlador por ubicación de polos. En otras palabras, la
expresión de la matriz de ganancia del observador de estados es la expresión dual de
la matriz de ganancia del controlador de realimentación de estados.
Vimos en la subsección 4.3.3 que linealización exacta nos permite diseñar una
ley de control desacoplada (subsección 4.3.4) usando eigenvalores prescritos para
asegurar la estabilización del sistema descrito por (4.29). Apelando al concepto de
dualidad como en el caso lineal discutido lı́neas arriba, nosotros enfrentaremos el
problema de sı́ntesis de observadores no lineales con eigenvalores prescritos para la
estimación de estados. estimation.
4.4 Observadores No Lineales con Polos Prescritos 113

4.4.1. Observador SISO No Lineal con Polos prescritos

Sistemas lineales SISO de la forma dada en (4.17) o (4.25) son observables si
su matriz de observabilidad O posee rango completo (see also (2.26)), es decir:
 
C
 CM 
 
rank O = rank  .. =n (4.42)
 . 
CMn−1

Se puede demostrar fácilmente que la matriz de observabilidad del sistema (4.25)

posee rango completo. Para sistemas no lineales con entrada y salida escalares de-
scritos por:
ẋ = f (x) + g(x)u y = h(x) (4.43)
la matriz de observabilidad generalizada se puede formular como;
   
h(x) h(x)

∂  L h(x)   L f h(x)

f   
O(x)  ..  z = Φ(x) =  ..  (4.44)
∂x  .   . 
n−1 n−1
Lf h(x) Lf h(x)

donde O es de orden n×n, z = Φ(x) es la transformación de estados descrita en (4.22).

Es fácil de veriﬁcar que la ecuación (4.42)) se convierte en (4.44)) para f (x) = Ax
and h(x) = Cx.
la descripción en el espacio de estado del sistema en el dominio-z está dado por
la ecuación (4.22)mientras que la ecuación (4.25) describe su correspondiente rep-
resentación canónica invariante en el tiempo. Empleando (4.22) y la transformación
z = Φ(x), podemos formular:

∂Φ
ż = ẋ = O(x)(f (x) + g(x)u) = Mz + Nv
∂x
v = Lnf h(Φ−1 (z)) + Lg Lfn−1 h(Φ−1 (z))u
y = Cz (4.45)

El observador no lineal para el sistema descrito por las ecuaciones 4.22) y (4.25) posee
la forma:

ẑ˙ = Mẑ + Nv + P(y − Cẑ)

ŷ = Cẑ (4.46)

donde ẑ y ŷ son los estimados de z y y, respectivamente, y P de orden n × 1 es la

matriz de ganancia del observador. Notar que (4.46) se convierte en un observador
lineal cuando v es una entrada lineal.
Asumamos la existencia de O−1 (x). Para z = ẑ and x = x̂, y usando el hecho
de que y = Cẑ = h(x̂), entonces la ecuación (4.45) toma la forma:

O(x̂)(f (x̂) + g(x̂)u) = Mẑ + Nv Cẑ = h(x̂) (4.47)

114 Linealización por Realimentación de Estados

Substituyendo (4.47) en (4.46) nos conduce al siguiente observador no lineal en el

dominio de x̂.
x̂˙ = f (x̂) + g(x̂)u + O−1 (x̂)P(y − h(x̂)) (4.48)
Sea e = ẑ − z el error de estimación. Substrayendo (4.25) de (4.47) y usando el hecho
de que y = Cz, es fácil de veriﬁcar que:
ė = (M − PC)e (4.49)
La matriz de ganancia P requiere ser seleccionada de modo tal que los eigenvalores
de la ecuación caracterı́stica del observador no lineal:
det [sI − M + PC] = 0
haga el error de estimación e ∼
= 0 con suﬁciente rapidez. Tal matriz de ganancia P
se puede computar de [13]:
P = Ψ(M)O−1 [0 0 ··· 0 1]T (4.50)
Ψ(M) = Mn + α1 Mn−1 + · · · + αn−1 M + αn I
donde los parámetros αi , . . . , αn se pueden determinar de:
(s − µ1 ) . . . (s − µn ) = sn + α1 sn−1 + · · · + αn−1 s + αn
donde µ1 , . . . , µn son los polos a lazo cerrado del observador no lineal.

4.4.2. Observadores MIMO No Lineales con Polos Prescritos

Considere que el sistema MIMO no lineal cuadrado descrito por (4.29) posee un
grado relativo total r = r1 + · · · + rm . Para linealización exacta, la transformación de
estados dada en (4.31) nos conduce a la descripción en el espacio de estado dada por
(4.32). Por consiguiente, la correspondiente matriz de obsevabilidad generalizada se
puede formular como:
∂Φ(x)
O(x) z = Φ(x) (4.51)
∂x
por consiguiente (ver ecuación (4.45)):
∂Φ
ż = ẋ = O(x)(f (x) + g(x)u) = Mz + Nv
∂x
v = Lnf h(Φ−1 (z)) + Lg Lfn−1 h(Φ−1 (z))u v = [v1 . . . vm ]T
y = Cz (4.52)
El observador MIMO toma la forma:
ẑ˙ = Mẑ + Nv + P(y − Cẑ)
ŷ = Cẑ (4.53)
donde ẑ y ŷ son los estimados de z y y, respectivamente, y P de orden n × m es la
matriz de ganancia del observador. La ecuación no lineal del observador en el dominio
de x̂ está dado por:
x̂˙ = f (x̂) + G(x̂)u + O−1 (x̂)P(y − h(x̂)) (4.54)
4.4 Observadores No Lineales con Polos Prescritos 115

Sea e = ẑ − z el error de estimación. Sustraendo (4.52) de (4.53), obtenemos:

ė = (M − PC)e (4.55)

Como en el caso SISO, la matriz de ganancia P requiere ser seleccionado de modo tal
que los eigenvalores de la ecuación caracterı́stica del observador no lineal: eigenvalues
of the characteristic equation of the nonlinear observer

det [sI − M + PC] = 0

∼ 0 con suﬁciente rapidez. Tal matriz de ganancia P
haga el error de estimación e =
se puede computar de OOOOOOJJJJJOOOOO:

det [sI − M + PC] = (s − µ1 ) . . . (s − µn ) = 0 (4.56)

donde µ1 , . . . , µn son los polos deseados a lazo cerrado del observador no lineal.

Ejemplo 4.4 El observador MIMO no lineal MIMO para el MRE

Determinar el observador MIMO no lineal para el proceso MRE.

Solución: La matriz de observabilidad generalizada del MRE posee la forma (ver

(4.51)):
     
h1 () x1 1 0 0 0 0 0
 Lf h1 (x)   x3   0 0 1 0 0 0 
 2     
∂ 
 L h1 (x) 
 ∂ 
 x5  
= 0 0 0 0 1 0 

O(x) = f = (4.57)
∂x  h2 (x)  ∂x 
 
 x2  
  0 1 0 0 0 0 

 Lf h2 (x)   x4   0 0 0 1 0 0 
L2f h2 (x) x6 0 0 0 0 0 1

La inversa de (4.57) is:

 
1 0 0 0 0 0
 0 0 0 1 0 0 
 
 0 1 0 0 0 0 
O (x) = 
−1



 0 0 0 0 1 0 
 0 0 1 0 0 0 
0 0 0 0 0 1

Luego, el observador no lineal dado por (4.54) toma la forma:

x̂˙ = f (x̂) + G(x̂)u + O−1 (x̂)P(y − ŷ) (4.58)

     
x̂˙ 1 f1 (x̂) 0 0
 x̂˙ 2     
   f2 (x̂)   0 0 
      u1
 x̂˙ 3   f3 (x̂) + 0 0 
 =    u2 +
 x̂˙ 4   f4 (x̂)   0 0 
     
 x̂˙ 5  f5 (x̂) G51 (x̂) 0
x̂˙ 6 f6 (x̂) 0 G62 (x̂)
116 Linealización por Realimentación de Estados

  
1 0 0 0 0 0 P11 P12
 0 0 0 1 0 0  P21 P22 
  
 0 1 0 0 0 0  P31 P32  x1 − x̂1
  
 0 0 0 0 1 0  P41 P42  x2 − x̂2
  
 0 0 1 0 0 0  P51 P52 
0 0 0 0 0 1 P61 P62

Las funciones fi , i = 1, . . . , 6, G51 y G62 fueron deﬁnidas en (1.146).

Ejemplo 4.5

Diseñar y simular el sistema de control del proceso MRE empleando linealización de

la realimentación.

Solución: La figura 4.1 ilustra el diagrama de bloques usado para la simulación del
sistema de control de trayectoria no lineal MIMO para el MRE. Dicha simulación
emplea los resultados obtenidos en los ejemplos 4.1 a 4.4. Los polos del sistema
a lazo cerrado controlado se ubican en −2,2 ± 0,85 and −6500. Las trayectorias
deseadas seleccionadas son: ρ1 = sin(0,75kT ) y ρ2 = cos(0,75kT ). Los valores de los
parámetros se dan en la tabla 1.6. En adición, considere una masa de la muñeca de la
mano del manipulador de 0.2 kg y una masa de la pinza de of 0.4 kg. La pinza puede
llevar consigo una carga de 0.2 kg of mass. Las condiciones iniciales para la base es
de o rad, mientras que para el brazo (el eslabón) es de π/2 rad.
Las figures 4.1 y 4.2 muestran los resultados de la simulación obtenidos con
el programa srm4fl.m. El tiempo de estabilización y la fuerza de control máxima en
la salida y1 del sistema son 2 s y 2.2 V, mientras que para la segunda salida y2 son
4 s y 26 V. Una segunda simulación sin considerar la carga revela que se obtienen
aproximadamente los mismos resultados..

Linear controller
ρ u x
v = v ( ρ , z) u = u( ^
x, v) x=fx+Gu

Nonlinear process
Pole-placement
loop Nonlinear
observer
^ ^
x
z
z = ψ (x)
^ ^
Linearization
Transformation loop

Figura 4.1: Diagrama de bloques del sistema de control no lineal por realimentación
de estados.

donde a(z) y b(z) están dadas en (4.23).

IN PROGRESS
4.4 Observadores No Lineales con Polos Prescritos 117

1.5

BASE POSITION (rad)

0.5

−0.5

−1

−1.5
0 1 2 3 4 5 6 7 8 9 10
TIME (s)

2.5
CONTROL VOLTAGE u1 (vol)

1.5

0.5

−0.5

−1
0 1 2 3 4 5 6 7 8 9 10
TIME (s)

Figura 4.2: Trayectoria controlada y1 y la correspondiente fuerza de control u1 .

1.5
LINK POSITION (rad)

0.5

−0.5

−1

−1.5
0 1 2 3 4 5 6 7 8 9 10
TIME (s)

30
CONTROL VOLTAGE u1 (vol)

−10
0 1 2 3 4 5 6 7 8 9 10
TIME (s)

Figura 4.3: Trayectoria controlada y2 y la correspondiente fuerza de control u2 ..

PROBLEMAS
IN PROGRESS
Capı́tulo 5

Control Deslizante

Esate capı́tulo se ocupa del control de sistemas no lineales usando la metodolog1a

del denominado control por modos deslizante, o simplemente control deslizante. Para
el control deslizante, la descripción dinámica del sistema puede ser imprecisa; esto
es, el modelo dinámico del sistema puede presentar incertidumbre paramétrica en su
estructura o dinámica no modelada en su representación. Dado que la descripción
del proceso permite incertidumbres, el control deslizante puede ser considerado una
aproximación particular del control robusto.
La metodologı́a del control deslizante incluye una ley de control no lineal de
realimentación que conmuta discontinuamente sobre una superficie que pertenece al
espacio de estad del sistema, de forma tal que si una trayectoria de estado que se orig-
ina en su superficie (como respuesta al comportamiento natural del sistema dinámico
a lazo abierto), tarta de desviarse de dicha superficie, entonces se aplica una fuerza
de control co el fin hacer retornar el estado de nuevo a su sistema. Por consiguiente,
trayectorias de estado naturales del sistema controlado están restringidos a deslizarse
a lo largo de su superficie.
Cualquier trayectoria de estado en la superficie dada debe de satisfacer la
relación algebraica que describe dicha superficie. Por otro lado, es posible introducir
una ecuación algebraica deseada en el espacio de estado del sistema a lazo abierto
que sea capaz de confinar la dinámica del sistema en una determinada superficie. La
relación introducida debe de ser independiente de ciertos disturbios, incertidumbre
en los parámetros y dinámica no modelada.
De hecho, el control deslizante es un tipo particular de Control con Estructura
Variable (CEV) [8], [9]. Tal tipo de control emplea en su diseño dos o más leyes de
control de realimentación y una regla de decisión: la función de conmutación. En el
control deslizante, el CEV se diseña para conducir y entonces confinar el compor-
tamiento el comportamiento del sistema de control dentro de una vecindad de la
función de conmutación.
La primera parte de este capı́tulo sigue la metodologı́a presentada en [3],donde
un problema de control de n-ésimo orden (esto es,, un problema donde el sistema se
describe mediante ecuaciones diferenciales de orden n) se sustituye por un problema
de control equivalente pero de primer orden. Luego, el problema de control transfor-
mado se resuelve para lograr estabilidad y rendimiento consistente en la presencia de
incertidumbre paramétrica y dinámica no modelada, sin embargo, pagando el precio
120 Control Deslizante

de una gran actividad de la ley de control que a la larga le es perjudicial. Modiﬁ-

caciones apropiadas en la ley de control pueden lograr que la ley de control tenga
moderada actividad. to moderate control activity.
En la mayor parte del libro, especı́ﬁcamente en las aplicaciones del control
deslizante para sistemas multivariables, se emplea el modelo de Lagrange del sistema
a controlar. Tal técnica de modelado fue desarrollada en la sección . Cabe anotar que
el modelo de Lagrange de un sistema también se puede determinar empleando las
leyes de la fı́sica.

5.1. Control Deslizante para Sistemas de una Entrada

5.1.1. Conceptos Básicos y Notación
Considere el sistema dinámico de una entrada y lineal en u:

dxn
x(n) = = f (x) + b(x)u (5.1)
dtn
donde el escalar x es ;la salida de interés del sistema, el escalar u es la entrada de
control, x = [x ẋ x(2) . . . x(n−1) ] es el vector de estado, y las funciones f (x)
y g(x) no son exactamente conocidas pero son acotadas por funciones conocidas
dependientes de x. En adición, b(x) es de signo conocido. Dada una trayectoria de
(2) (n−1)
estado variante con el tiempo xd = [xd ẋd xd . . . xd ], con:

xd (0) = x(0) (5.2)

el problema de control a resolver es diseñar un control ﬁnito u que fuerce al estado

x seguir a la trayectoria deseada xd a pesar de la presencia de incertidumbres en los
parámetros y dinámica no modelada.
Deﬁnamos el error de seguimiento x̃ y el vector de error de seguimiento x̃ como:

x̃ = x − xd x̃ = x − xd = [x̃ x̃˙ x̃(2) . . . x̃(n−1) ]T (5.3)

Además, consideremos la superﬁcie S(t) variante con el tiempo en el espacio de estado
Rn deﬁnido mediante la ecuación escalar s(x, t) = 0, tal que:

d
s(x, t) = ( + λ)n−1 x̃ = (p + λ)n−1 x̃ = x(n−1) − xr(n−1) (5.4)
dt
donde λ es una constante positiva cuya selección se discutirá luego, p es el operador
(n−1)
de L:aplace y xr es una función que puede ser computada de x y xd . Por ejemplo,
para un sistema de orden n = 3, s toma la forma:

s = (p + λ)2 x̃ = (p2 + 2λp + λ2 )x̃ = x̃

¨ + 2λx̃˙ + λ2 x̃
= ẍ + ẍr
ẍr = ẍd − 2λx̃˙ − λ2 x̃ (5.5)

¨ del error de veloci-

Notar que s resulta la suma ponderada del error de aceleración x̃,
dad x̃˙ y el error de posición x̃.
5.1 Control Deslizante para Sistemas de una Entrada 121

La relación (5.4) establece que un problema de control de trayectoria de orden

n se puede reemplazar por problema de estabilización de primer orden, es decir, por
el problema de mantener el escalar s en cero. Tal problema de estabilización se puede
resolver seleccionando la ley de control u de (5.1) de forma que fuera de la superficie
S(t):
1d 2
s = ṡ s ≤ −η|s| (5.6)
2 dt
donde η es una constante positiva. Como se ilustra en la figura 5.1(a) para el caso
n = 2, todas las trayectorias de estado que satisfacen la condición (5.6), la condición
de deslizamiento, hacen de la superficie S(t) un conjunto invariante en el sentido
de Lyapunov, implicando que las trayectorias del sistema fuera de S(t) apuntarán
tal superficie, y las trayectorias del sistema en S(t) permanecerán en ella. También
se puede establecer que dinámica no modelada, incertidumbre paramétrica o ciertos
disturbios, serán tolerados por un sistema que satisfaga la condición dada en (5.6).
S(t) es conocida como la superficie de deslizamiento porque satisface la condición de
deslizamiento. El comportamiento del sistema sobre una superficie de deslizamiento
se denominad modo de deslizamiento.

S(t)

(a)
dx
dt s=0

. xd

x
0

(b)
dx
s=0
dt

. xd

x
0
(c)

Figura 5.1: (a) La superﬁcie de deslizamiento S(t). (b) Convergencia exponencial. (c)
Fenómeno del “chattering”.

Consideremos el caso de aquellos sistemas que satisfacen la condición (5.6),

pero no la condición (5.2), esto es, xd (0) = x(0). Para tales sistemas, la superﬁcie de
deslizamiento s(t) = 0 será golpeada por alguna trayectoria del sistema en un tiempo
thit , el cual se puede computar como sigue. Asumiendo ques(t = 0) > 0 e integrando
122 Control Deslizante

(5.6) entre t = 0 y t = thit :

thit s(t=thit ) thit
ṡ dt = ds ≤ − η dt (5.7)
0 s(t=0) 0

nos conduce a thit ≤ s(t = 0)/η. Se puede obtener el mismo resultado si se arranca
con s(t = 0) < 0. Por consiguiente:

th ≤ |s(t = 0)|/η (5.8)

La figure 5.1(b) ilustra el caso de una trayectoria de estado que evoluciona con una
condición inicial arbitraria, y luego golpea a la superficie s(t) = 0 en un tiempo finito
thit ≤ |s(t = 0)|/η. En el modo de deslizamiento, tal trayectoria “se desliza.a lo largo
de S(t) con el objeto de alcanzar exponencialmente a xd con una constante de tiempo
igual a 1/λ. Por cierto, la expresión de (5.4) para n = 2:

1/λ
s = (p + λ)x̃ → x̃ = s
(1/λ)p + 1

posee una constante de tiempo igual a 1/λ.

La implementación de sistemas de control deslizantes requiere de una ley de
control realimentado , la cual se puede obtener de (5.4) y (5.1) de modo tal que s2 en
la ecuación (5.6) se comporte muy parecido a una función de Lyapunov con e fin de
garantizar estabilidad asintótica del sistema a lazo cerrado. En modo deslizante para
el caso ideal, por ejemplo, cuando el modelo del sistema (5.1) representa exactamente
al sistema actual, la ley de control diseñada forzará a todas las trayectorias de estado
a deslizarse a lo largo de s = 0 tal como se observa en la figura 5.1(b).
Sin embargo, debido a la presencia de imprecisiones en el modelado (incertidum-
bres en los parámetros y dinámica no modelada) y de disturbios, la ley de control
forzará a todas las trayectorias de estado a deslizarse discontinuamente a lo largo
de s = 0 tal como se muestra en la figura 5.1(c), es decir, la ley de control en mo-
do deslizante necesita ser discontinua a través de S(t), produciendo ası́ el fenómeno
conocido como chattering. Desde que el chattering implica unamuy elevada actividad
de control, entonces, por consideraciones prácticas, la fuerza de control u necesita ser
suavizada adecuadamente, a pesar de la pérdida de precisión en el seguimiento y en
el ancho de banda.

Ejemplo 5.1

Para el sistema ẋ = u deﬁnamos la superﬁcie s(t) = x(t). Consideremos una ley

de control de la forma:
+
u = −1 if s(t) > 0
u = ẋ = −sgn(x) =
u− = +1 if s(t) < 0

donde sgn(.) es la función signo deﬁnida como:

sgn(x) = +1 if x > 0

sgn(x) = −1 if x < 0
5.1 Control Deslizante para Sistemas de una Entrada 123

La figura 5.2 muestra las trayectorias del sistema x(t) = −t y x(t) = t originadas
por la ley de control u+ y u− respectivamente. La superficie s(t) = x(t) = 0 es
una superficie de deslizamiento porque satisface la condición (5.6) para η ≤ 1. Tal
superficie será golpeada por alguna trayectoria de estado del sistema en estudio en
un tiempo (5.7).
x

s=0

Figura 5.2: La superﬁcie de deslizamiento s(t) = 0, por ejemplo 5.1.

5.1.2. Control deslizante para Sistemas de la Forma x(n) = fi + u
Considere el sistema de orden n:
dxn
x(n) = = fi + u (5.9)
dtn
i

donde el escalar x es la salida de interés del sistema, el escalar u es la entrada de

control, x = [x ẋ x(2) . . . x(n) ] es le vector de estados, y fi es una función no
conocida exactamente, pero si estimada como fi . El error de estimación (o incer-
tidumbre) correspondiente a fi se deﬁne como ∆fi = |fi − fi | y se asume que es
acotado por alguna función conocida Fi = Fi (x) como sigue:

∆fi = |fi − fi | ≤ Fi (5.10)

Con el ﬁn de lograr perfecto seguimiento, es decir, x(t) = xd (t), necesitamos deﬁnir

una nueva superﬁcie de deslizamiento s = 0 de conformidad con (5.4), como sigue:

s = (p + λ)(n−1) x
% = x(n−1) − xr(n−1) (5.11)

Entonces:
ṡ = x(n) − x(n)
r = fi + u − x(n)
r (5.12)
i

la mejor aproximación de una ley de control continua para alcanzar ṡ = 0. Por

Sea u
consiguiente:
=−
u fi + x(n)
r (5.13)
i

La ley de control estimada u es también conocida como la ley de control equivalente

Ley de control equivalente. Co la ﬁnalidad de satisfacer la condición de deslizamiento
124 Control Deslizante

(5.6) en la presencia de incertidumbres descrita por (5.10), necesitamos adicionar a

un término discontinuo de la forma k(x)sgn(s) a través de s = 0, a saber:
u

− k(x)sgn(s)
u=u (5.14)

La condición de deslizamiento (5.6) se veriﬁca reemplazando (5.14) en (5.12), luego,

usando la expresión resultante en:

1 d 2
s = ṡ s = (fi − fi ) − k sgn(s) s ≤ |fi − fi ||s| − k |s| (5.15)
2 dt
i i

Finalmente, sustituyendo:

k= Fi + η (5.16)
i

en (5.15) nos conduce a la condición de deslizamiento. (5.6).

Ejemplo 5.2

Considere un sistema descrito por:

ẍ + a1 |x|ẋ2 + a2 (t)ẋ2 cos 2x + a3 (t)x3 cos 3x = u

donde a1 = 2,1, a2 (t) y a3 (t) son desconocidas pero veriﬁcan que 2,5 < a2 (t) < 5 y
2 < a3 (t) < 4 respectivamente. Por consiguiente,

f1 = −a1 |x|ẋ2 f2 = −a2 (t)ẋ2 cos 2x f3 = −a3 x3 cos 3x

f1 = f1 f2 = −3,75ẋ2 cos 2x f3 = −3x3 cos 3x

F1 = 0 F2 = 1,25ẋ2 cos 2x F3 = x3 cos 3x

Desde que el orden del sistema es n = 2, entonces: s = (p + λ)% %̇ + λ%

x = x x. Por
consiguiente:

ṡ = ẍ − ẍd + λx
%̇ = fi + u − ẍd + λx
%̇
i

La ley de control equivalente es:

=−
u fi + ẍd − λx
%̇
i

La ley de control posee la forma u = u − k sign(s) con k = F2 + F3 + η. La ﬁgura

5.3 muestra el resultado de la simulación obtenido ejecutando el archivo scexa.m con
λ = 10, η = 2,4, xd = sin(πt/2) y condiciones iniciales x(0) = 0 y ẋ(0) = π/2.
5.1 Control Deslizante para Sistemas de una Entrada 125

POSITION x(t)
1

−1

−2
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5

20
CONTROL INPUT u(t)
10

−10
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5

0.2
s(t)−TRAJECTORIES

0.1

−0.1

−0.2
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5
TIME (s)

Figura 5.3: Resultados de la simulación del ejemplo 5.2.

Suavizando La Ley de Control Discontinua u

Co el ﬁn de eliminar una alta actividad de control por consideraciones prácticas,
el fenómeno chattering debe de evitarse suavizando la discontinuidad de la ley de
control, es decir, reemplazando en (5.14) el término sgn(s) por sat(s/Φ) como sigue:

− k(x)sat(s/Φ)
u=u (5.17)

donde la función de saturación sat(.) se deﬁne como:

sat(s/Φ) = s/Φ if |s/Φ| ≤ 1

sat(s/Φ) = sign(s/Φ) otherwise (5.18)

y la frontera de Φ > 0 veriﬁca:

|s(t)| ≤ Φ ∀ t≥0 (5.19)

En realidad, la frontera de Φ deﬁne una capa de frontera de atracción B(t) siempre

que la ley de control u satisfaga la condición de deslizamiento (5.6). En concordancia
con lo expuesto, B(t) resulta en un conjunto invariante (tener en cuenta que la su-
perficie de deslizamiento S(t) es también un conjunto invariante), es decir, todas las
trayectorias del sistema que se inician en el interior de B(t = 0) permanecen en B(t)
para todo t ≥ 0. La figura 5.4 ilustra la relación entre u y s en B(t).
Cuando Φ es variante con el tiempo, y al mismo tiempo B(t) pude permanecer
como un conjunto invariante, entonces necesitamos modificar la condición (5.6) de
modo tal que la distancia a la capa de frontera B(t) siempre sea decreciente, a saber:

d
s≥Φ → (s − Φ) ≤ −η
dt
d
s≤Φ → (s − (−Φ)) ≤ η
dt
126 Control Deslizante

−φ φ
s
B(t)

Figura 5.4: Suavizando la ley de control en el interior de la capa de frontera B(t).

Therefore
1d 2
|s| ≥ Φ → s ≤ (Φ̇ − η)|s| (5.20)
2 dt
Para veriﬁcar (5.20), se requiere adicionar la cantidad −Φ̇ a la ganancia de control
discontinua k(x). La ganancia de control modiﬁcada k̄(x) es entonces:

k̄(x) = k(x) − Φ̇ (5.21)

consecuentemente, el control (5.17) toma la forma:

− k̄(x)sat(s/Φ)
u=u (5.22)

En el interior de la capa de frontera B(t), sat(s/Φ) pasa a ser s/Φ. Sustituyendo

(5.22) con sat(s/Φ) ∼
= s/Φ en (5.12) produce:
s
ṡ = fi + u − x(n)
r = −k̄(x) − ∆fi (5.23)
Φ
i i

donde ∆fi = fi − fi . Usando el hecho de que: x = x̃ + xd , entonces (5.23) se puede

reescribir como:
s
ṡ = − k̄(xd ) − T (∆fi (xd ), x̃, xd ) (5.24)
Φ
donde T (∆f (xd ), x̃, xd ) representa todos los otros términos dependientes de x̃ y xd .
Por otra parte, deﬁnamos el ancho de banda λ (recordar que λ es la frecuencia de
corte del ﬁltro (5.4)) como sigue:

k̄(xd )
λ= (5.25)
Φ
Reemplazando (5.25) en (5.24) se obtiene:
1
s= (−T (∆fi (xd ), x̃, xd )) (5.26)
p+λ
Sabemos que la variable s es una medida de la distancia algebraica a la superﬁcie de
deslizamiento S(t) y, de acuerdo a (5.26), constituye la salida de un ﬁltro de primer
5.1 Control Deslizante para Sistemas de una Entrada 127

orden filter, cuya dinámica (p + λ) depende de xd (ver (5.25)), y cuyas entradas son
perturbaciones e incertidumbres. Por consiguiente, tal filtro puede librar al sistema
del fenómeno chattering.
La estructura del error dinámico a lazo cerrado cuando Φ = Φ(t) se muestra
en la figura 5.5, donde el primer filtro se diseña de acuerdo a (5.26) para eliminar
perturbaciones e incertidumbres, de modo tal que el segundo filtro pasa bajo, de
acuerdo a la definición (5.4) pueda proporcionar el error de seguimiento x̃. De (5.25)
podemos deducir que el espesor Φ de la capa de frontera requiere ser sintonizada tal
que (5.26) pueda representar un filtro de primer orden con ancho de banda λ. Ahora,
~
T(∆f (x d ),x~ , x d ) 1 s 1 x
(p + λ) (p + λ)
n-1

Figura 5.5: Estructura del error dinámico a lazo cerrado para Φ = Φ(t).

reemplazando (5.25) en (5.21) nos conduce a:

Φ̇ + λΦ = k(xd ) (5.27)

Claramente, la ecuación (5.27) representa la dinámica deseada del espesor Φ de la

capa de frontera. Dado que la selección de Φ afecta el ancho de banda λ (por cierto,
ver la ﬁgura 5.5), la ecuación (5.25) será denominada la condición de balance. De
hecho, λ requiere ser sintonizado de modo tal que la dinámica del ﬁltro de orden n:
x̃ 1
=
s (p + λ)n

se comporte como un sistema de orden n crı́ticamente amortiguado. Ahora, usando

(5.27) en (5.21), k̄(x) se obtiene:

k̄(x) = k(x) − k(xd ) + λΦ (5.28)

De acuerdo a (5.4), x̃ es una versión ﬁltrada de s. Sin embargo, la trayectoria

s, es decir, s = s(t) representa más que ello. En realidad, s(t) se puede considerar
como un descriptor del comportamiento a lazo cerrado del sistema, en vista de que la
actividad de control regulada por la ley de control depende de s (ver (5.22) y (5.14)).
(n−1)
En adición, de acuerdo a (5.4), s(t) = x(n−1) − xr , donde xrn−1 es una función que
se puede computar de x y xd . Por consiguiente, s(t) es una representación dinámica
de las suposiciones relacionadas con las imprecisiones del modelo.

Ejemplo 5.3

Considere nuevamente el ejemplo 5.2 con un espesor de la capa de frontera φ(t)

variante con el tiempo. Entonces, la ley de control u = u − k sign(s) requiere ser
reemplazada por u = u − k̄(x) sat(s/φ) con k̄(x) = k(x)−k(xd )+λφ y φ̇+λφ = k(xd ),
en donde:
k(xd ) = 1,25ẋ2d |cos 2xd | + |x3d cos 3xd | + η
128 Control Deslizante

La ﬁgura 5.6 muestra los resultados de la simulación obtenidos ejecutando el archivo

scexc.m para λ = 10, η = 2,4, xd = sin(πt/2) y las condiciones iniciales x(0) = 0,
ẋ(0) = π/2 y φ(0) = 0,55. El valor 0.365 se obtuvo usando la relación φ̇ + λφ = k(xd )
for t = 0.
2

POSITION x(t)
1

−1
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5

20
CONTROL INPUT u(t)

−10
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5

1
s(t)−TRAJECTORIES

a
0.5

0
b
−0.5
c
−1
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5
TIME (s)

Figura 5.6: Resultados de la simulación para el ejemplo 5.3. Las trayectorias a, b y c

corresponden a φ(t), s(t) y −φ(t) respectivamente.

Control Integral
t
Let 0 x̃(q)dq instead of x̃ be the variable of interest in the surface (5.4). Therefore,
the process (5.9) turns into a nth -order process with respect to the variable of interest,
namely
t
d
s(x, t) = ( + λ) n
x̃(q)dq = (p + λ)n x̃ = x(n−1) − xr(n−1) (5.29)
dt 0

Since equations (5.29) and (5.11) possess the same form, then relations (5.14) and
(n−1)
(5.16) remain unchanged. Note that the term xr in (5.29) contains the variable
of interest.

IN PROGRESS

5.1.3. Control Deslizante para Sistemas de la Forma x(n) = fi + bu
Considere ahora el sistema de orden n:
dxn
x(n) = = fi + bu (5.30)
dtn
i

donde el escalar x es la salida de interés del sistema, el escalar u es la entrada de

control y la función fi no es exactamente conocida, pero si estimada como fi y
5.1 Control Deslizante para Sistemas de una Entrada 129

con incertidumbre dada en (5.10). La ganancia de la ley de control b = b(x, t) es

desconocida pero con umbrales (o cotas) conocidos:

0 < bmin ≤ b ≤ bmax (5.31)

Recordar que |fi − fi | es una incertidumbre tipo aditivo. Dado que la ganancia de
control b multiplica la entrada de control u, parece entonces razonable deﬁnir un
estimado de tipo multiplicativo b:
b = (bmin bmax )1/2 (5.32)

Es fácil veriﬁcar que los lı́mites (5.31) toman la forma:

b b
β −1 ≤ ≤β β −1 ≤ ≤β (5.33)
b b
donde:
β = (bmax /bmin )1/2 (5.34)
Con el propósito de conseguir un seguimiento perfecto, es decir que x(t) = xd (t),
debemos usar la superﬁcie de deslizamiento s = 0 descrita en (5.4) o (5.11):

s = (p + λ)(n−1) x̃ = x(n−1) − xr(n−1)

Entonces:
ṡ = x(n) − x(n)
r = fi + bu − x(n)
r (5.35)
i
b el control equivalente que puede lograr que ṡ = 0; por consiguiente:
Sea u

b = b−1 ( −
u fi + x(n) −1
r )= b u (5.36)
i
(n)
=−
donde u fi + xr (ver ecuación (5.13)). Con u deﬁnida como:

u = b−1 (
u − k sgn(s)) (5.37)

el lı́mite:

k≥β Fi + η + |β − 1||
u| β = b b−1 (5.38)
i
satisface la condición de deslizamiento (5.6). Para demostrar este hecho, reemplazar
(5.37) en (5.35):

ṡ = fi − b b−1 fi − (1 − b b−1 )x(n) −1
r − b b k sgn(s)
i i

= (fi − fi ) + fi − b b−1 fi − (1 − b b−1 )x(n) −1
r − b b k sgn(s)
i i i

= (fi − fi ) − (1 − β −1
u − β −1 k sign(s)
) (5.39)
i

Sustituyendo (5.38) en (5.39), entonces multiplicando ambos miembros de la relación

resultante por s y usando el hecho de que s sign(s) = |s|, se puede fácilmente de-
mostrar que ṡs ≤ −η|s| (la condición de deslizamiento).
130 Control Deslizante

Ejemplo 5.4

El modelo dinámico del sistema MRAF mostrado en la ﬁgura ?? y dado por (??) se
puede reformular con x = θ como:
4

x(3) = fi + bu = −a1 ẍ − a2 ẋ − a3 cos x ẋ − a4 sin x + bu (5.40)
i=1

donde:
Beq Ra nKb Ra Beq meq gL
a1 = + a2 = + a3 =
Jeq nKm La Jeq La nKm La Jeq Jeq
meq gL Ka
a4 = b=
nKm Jeq La Jeq La

IN PROGRESS

Suavizando la Ley de Control Discontinua u

Se sabe del la subsección 5.1.2 que el fenómeno de chattering se puede elimi-
nar suavizando la discontinuidad del control como sigue. Reemplazando en (5.37) el
término sgn(s) por sat(s/Φ), se obtiene:

u = b−1 (
u − k(x)sat(s/Φ)) (5.41)

donde la función de saturación sat(.) fue definida en (5.18). Con el objeto de verificar
(5.20) para el caso β = 0 en la ganancia de control, la ganancia de control modificada
k̄(x) dada en (5.42) necesita ser reformulada como (ver problema 5.1):

Φ̇ > 0 → k̄(x) − Φ̇/β

Φ̇ < 0 → k̄(x) − β Φ̇ (5.42)

La condición de balance (5.25) se puede modiﬁcar como:

b(xd ) k̄(xd ) k̄(xd )
λ= = βd (5.43)
b(xd ) Φ Φ
max

con una condición inicial deﬁnida por:

Φ(0) = βd k(xd (0))/λ (5.44)

Sustituyendo (5.43) en (5.42) con x y β reemplazado por xd y βd respectivamente,

produce el comportamiento deseado de Φ̇, a saber:

λΦ
Φ̇ > 0 → = k̄(x) − Φ̇/βd
βd
λΦ
Φ̇ < 0 → = k̄(x) − βd Φ̇ (5.45)
βd
5.2 Control Deslizante para Sistemas Multivariables 131

Es fácil veriﬁcar que (5.45) se puede reescribir como:

λΦ
k̄(xd ) ≥ → Φ̇ + λΦ = βd (xd )
βd
λΦ λΦ
k̄(xd ) ≤ → Φ̇ + = βd (xd ) (5.46)
βd βd2

Finalmente, o bien la ecuación (5.28) o (5.21) se puede reformular como:

λΦ
k̄(x) = (k̄(x) − k̄(xd )) + k̄(xd ) = k(x) − k(xd ) + (5.47)
βd

Ejemplo 5.5

IN PROGRESS

5.1.4. Rendimiento del Seguimiento vs. Errores de Modelado

Se estipuló que ∀ t ≥ 0, |s(t)| ≤ Φ, donde la frontera de Φ es realmente el
espesor de la capa de fontera. Por consiguiente, (5.4) se convierte en la siguiente
relación acotada:
|(p + λ)n−1 x̃| ≤ Φ (5.48)
donde λ es una constante positiva conocida como el ancho de banda. Una aproxi-
mación razonable para determinar el lı́mite del error de seguimiento |x̃| es ﬁjar p = 0
en (5.48), lo cual corresponde al comportamiento en estado estable de tal lı́mite. Por
consiguiente:
Φ
|x̃| ≤ n−1 = ε (5.49)
λ
donde ε es conocido como la precisión del seguimiento. Empleando (5.49) en la condi-
ción de balance (5.43) implica que:

λn ε ≈ βd k(xd )
bandwidthn × tracking precision ≈ parametric uncertainty along xd

5.2. Control Deslizante para Sistemas Multivariables

5.2.1. El Sistema a Controlar
Esta sección sigue el procedimiento desarrollado en [25]. La representación
dinámica del sistema no lineal multivariable, el modelo de Lagrange, está dado por
(1.143):
M(q)q̈ + P(q, q̇)q̇ + d(q) = u (5.50)
donde q es un m × 1 vector de coordenadas generalizadas, M(q) es una matriz
de inercia deﬁnida positiva de orden m × m, P(q, q̇) es una matriz de orden m ×
m que representa las fuerzas de Coriolis y centrı́peta, d(q) es un vector de orden
m × 1 que representa las fuerzas gravitacionales y u es un vector de orden m × 1
de fuerzas generalizadas. El vector de estado correspondiente a (5.50) posee la forma
x = [q q̇]T . Sean qdi (t) y q̇di (t) para i = 1, . . . , m las trayectorias deseadas, las
132 Control Deslizante

cuales se suponen ser funciones del tiempo continuamente diferenciables. Los vectores
de error se deﬁnen como:

%(t) = q − qdi
q %̇ = q̇ − q̇di
q(t)

o lo que es lo mismo empleando sus componentes:

q%i (t) = qi (t) − qdi (t) q%̇i (t) = q̇i (t) − q̇di (t)

5.2.2. La Superficie de Conmutación

Sea la siguiente superﬁcie de conmutación:

si (x, t) = si (q, q̇, t) = %i (t)

ii q + q%̇i (t) i = 1, . . . , m (5.51)

o en forma matricial:
%̇ =
s(x, t) = s(q, q̇, t) = Lq̃ + q (5.52)
        
s1 (x, t) s1 (q, q̇, t) 11 · · · 0 q%1 q%̇1
 ..   ..   .. . . ..   ..  +  .. 
 . = . = . . .  .   . 
sm (x, t) sm (q, q̇, t) 0 · · · mm q%m q%̇m
donde las constantes positivas ii son los elementos de una matriz diagonal L de
orden m × m. Asumiendo que una fuerza de control diseñada es capaz de conﬁnar
todas las trayectorias que se originan en la intersección de tales superﬁcies y hacerlas
permanecer allı́, entonces en tal situación se cumple, de acuerdo a 5.51, que:

si (q, q̇, t) = 0 = %i (t)

ii q + q%̇i (t) i = 1, . . . , m

Esta última relación nos indica que q̃i (t) y q̃˙ i (t) deben converger exponencialmente a
cero, esto es:

q̃i (t) = qi (t) − qdi (t) = 0 q̃˙ i (t) = q̇i (t) − q̇di (t) = 0

Por consiguiente: qi (t) = qdi (t) y q̇i (t) = q̇di (t), con lo cual se logra el objetivo de
control.

5.2.3. Diseño de la Fuerza de Control Multivariable

El diseño de la fuerza o ley de control requerida para confinar las trayectorias del
sistema que se originan en la intersección de las superficies de deslizamiento y hacerlas
permanecer allı́ emplea el método directo de Lyapunov. Omitiendo por simplicidad
la dependencia de los argumentos, consideremos la siguiente candidata para función
de Lyapunov:
1
V = sT Ms
2
Definamos ahora la siguiente ley de control:

u = u0 − Usgn(s) (5.53)
5.2 Control Deslizante para Sistemas Multivariables 133

   +   +  
u1 u1 − u−
1 u1 + u− 1 ··· 0 sign(s1 )
 ..  1  ..  1 .. .. ..  .. 
 . =  . −  . . .  . 
2 + −
2 + −
um um − um 0 · · · um − um sign(sm )
o en función de sus elementos:
1 + 1 +
u0i = ui + u−
i Ui = ui − u−
i
2 2
La derivada de s (ecuación 5.52) produce:

%̇ + q
ṡ = Lq %̈ = Lq
%̇ + (q̈ − q̈d )

Despejando q̈ de (5.50) y reemplazando la expresión resultante en la ecuación anterior

se obtiene:
ṡ = M−1 (u0 − U sgn(s) − ueq )
donde:
%̇ + Pq̇ + d + Mq̈d
ueq = −MLq
Por consiguiente:
1 T 1
V̇ = sT Mṡ + s Ṁs = sT [u0 − Usgn(s) − ueq ] + sT Ṁs (5.54)
2 2
En la referencia [24] se establece que:
1' (
P= Ṁ − J (5.55)
2
donde J es una matriz antisimétrica, es decir: J = −JT . Empleando (5.55) en (5.54)
nos conduce a:
1
V̇ = sT [u0 − Usgn(s) + Ps − ueq ] + sT Js
2
Dado que sT Js = 0 debido a que J es antisimétrica, entonces:

m
m
V̇ = sT [u0 + Ps − ueq ] − sT Usgn(s) = sj [u0 + Ps − ueq ]j − Ui |sj |
j=1 j=1

m
m
≤ |sj [u0 + Ps − ueq ]j | − Ui |sj | (5.56)
j=1 j=1

Seleccionando:
Ui ≤ |[u0 + Ps − ueq ]j | + ε ε>0 (5.57)
y reemplazando esta última expresión en (5.56) se obtiene:

m
V̇ ≤ −ε |sj | ε>0
j=1

lo que signiﬁca que se ha cumplido la condición de deslizamiento y a la vez se garantiza

˙
que q̃(t) y q̃(t) convergen exponencialmente a cero. Partiendo de la desigualdad (5.57)
se obtienen otras dos:

[u0 + Ps − ueq ]i ≤ Ui − ε [u0 + Ps − ueq ]i ≥ −(Ui − ε) (5.58)

134 Control Deslizante

Usando (5.58), es fácil demostrar que:

u− +
i + ε ≤ [ueq − Ps]i ≤ ui − ε (5.59)

Por consiguiente, los controles u− +

i y ui se pueden seleccionar para satisfacer (5.59).
Si ûeq y P̂ son los estimados de u y P respectivamente, podemos formular:
)
u+ = [
u eq − i + ū+
Ps]
i i i = 1, . . . , m (5.60)
u− i + ū−
ueq − Ps]
i = [ i

Reemplazando (5.60) en (5.59) se obtiene:

ū− +
i + ε ≤ [ūeq − P̄ s]i ≤ ūi − ε (5.61)

eq
ūeq = ueq − u
P̄ = P − P
lo cual veriﬁque (5.59). Si seleccionamos ū− +
i = Ki y ūi = − Ki , entonces de (5.60)
obtenemos:
1 i
u0i = (u+ + u−
i ) = [ueq − Ps] Ui = Ki
2 i
o lo que es lo mismo, en forma matricial:
 + 
u1 + u− 1
1 .. 
u0 =  . =u eq − Ps
2
u+m + um
−
 +   
u1 − u− 1 ··· 0 K1 · · · 0
1 .. .. ..   .. . . .. 
U =  . . . = . . .  (5.62)
2 + −
0 · · · um − um 0 · · · Km

Asumiendo que el término gravitacional se puede expresar como:

d=u
eq − Ps (5.63)

entonces la ley de control dada por (5.53) toma la forma:

 
K1 · · · 0
 ..  sgn(s)
u = u0 − Usign(s) = d −  ... . . . .  (5.64)
0 · · · Km

y la relación (5.61) con ū− +

i = Ki y ūi = −Ki se expresa como:

Ki ≥ [ueq − Ps − d]i + ε

Ahora, dado que ueq − Ps = −MLq̃˙ + Pq̇ + d + Mq̇d − Ps, entonces las ganancias
Ki se pueden seleccionar siempre que:

Ki ≥ |(−M Lq̃˙ + P q̇ + M q̇d − P s)i | + ε (5.65)

en donde M and P son las cotas superiores de M y P respectivamente.

5.2 Control Deslizante para Sistemas Multivariables 135

Ejemplo 5.6 Design and Simulation of a Sliding Control for the Process
TRM
The elements of the matrices M and P given by (1.113) may be upper-bounded as
|M11 | ≤ m11 M 11 |M12 | ≤ m12 M 12 |M21 | ≤ m21 M 21
|M22 | ≤ m22 M 22 |P11 | ≤ p11 P 11 |P12 | ≤ |p12 θ̇1 | |P 12 |
|P21 | = 0 P 21 |P22 | ≤ m22 P 22
Using (5.65), the variable Ki is computed from
2

Ki = (M ij |q̈dj − jj q̃ j |
˙ + P ij |q̇j − sj |) + ε
j=1

where q1 is the car position r and q2 is the angular position θ1 of the arm. The
switching control force given by (5.64) is found to be

u1 0 K1 sgn(s1 )
= −
u2 d2 sin θ1 K2 sgn(s2 )
in which d2 was found in (1.113).
The simulation of the sliding control system was performed for the following
initial conditions: r(0) = 0 m, θ1 (0) = −π/2 rad. The desired trajectories are set
to: rd (t) = 1 m and θd1 (t) = π4 cos(2πt) rad. The parameter ε takes on the value of
0.1 while the gripper carries out a payload of 0.2 kg of mass. Figure 5.7 depicts the
simulation results. Such results can be obtained executing the m-ﬁle trmsc.m.
Ejemplo 5.7 Design and Simulation of a Sliding Control for the Process
SRM
The elements of matrices M and P given by (1.143) can be upper-bounded as
follows
|M11 | ≤ RT 1 (Jeq1 + 2I1 + H22 ) M 11 |M12 | = 0 M̄12
|M21 | = 0 M̄21 |M22 | ≤ RT 2 (Jeq2 + H22 ) M 22
|P11 | ≤ |RT 1 (Beq1 − H22 q̇2 ) + NT 1 | P 11 |P12 | ≤ |RT 1 H22 q̇1 | P 12
|p21 | ≤ |RT 2 H22 q̇1 | P̄21 |P22 | ≤ RT 2 Beq2 + NT 2 P 22
Using (5.65), the variable Ki can be computed from
2

Ki = (M ij |q̈dj − %̇j |
jj q + P ij |q̇j − sj |) + ε
j=1

The switching control force given by (5.53) (see also (1.143))is found to be

u1 0 K1 sat(s1 /φ)
= −
u2 RT 2 m2 g Lx2 cos q2 ) K2 sat(s2 /phi)
where φ = 0.5. The simulation of the sliding control system was performed for the
following initial conditions: q1 (0) = q2 (0) = 0,1 rad. The desired trajectories are:
qd1 (t) = 0.1745 rad and qd2 (t) = (0,1745/2)t2 rad. The parameter ε takes on the
value of 0.2 while the gripper carries out a payload of 0.2 kg of mass.
Figure 5.8 shows the simulation results. Such results can be obtained executing
the m-ﬁle srmsc.m.
136 Control Deslizante

1.5 5

LINK POSITION (rad)

CART POSITION (M)

1 0

0.5 −5

0 −10
0 2 4 6 8 10 0 2 4 6 8 10
Entradas
CONTROL VOLTAGE u1

CONTROL VOLTAGE u2
5 4

0 0

−2

−5 −4
0 2 4 6 8 10 0 2 4 6 8 10

5 5
SURFACE s1

SURFACE s2

0 0

−5 −5

−10 −10
0 2 4 6 8 10 0 2 4 6 8 10
TIME (seconds) TIME (seconds)

Figura 5.7: Simulation results corresponding to the example 5.6.

PROBLEMS
Problema 5.1

Verify relations ... IN PROGRESS

5.2 Control Deslizante para Sistemas Multivariables 137

1.5 0.18
POSITION q1 (rad)

POSITION q2 (rad)
0.16
1
0.14
0.5
0.12

0 0.1
0 1 2 3 4 0 1 2 3 4

0.02 0.04
Control u1 (V)

Control u2 (V)

0 0.03

−0.02 0.02

−0.04 0.01

−0.06 0
0 1 2 3 4 0 1 2 3 4

0.3 0.05
SURFACE s1

SURFACE s2

0.2 0

0.1 −0.05

0 −0.1

−0.1 −0.15
0 1 2 3 4 0 1 2 3 4
TIME (seconds) TIME (seconds)

Figura 5.8: Simulation results corresponding to the example 5.7.

Bibliografı́a

[1] H. Goldstain, Mecánica Clásica, segunda edición. Editorial Reverté, S.A., 1996,
ISBN: 84-291-4306-8

[2] , Dinámica de Lagrange. McGraw-Hill de México, S.A., 1972

[3] Jean-Jacques E. Slotine and Weiping Li, Applied Nonlinear Control, Prentice
Hall, Englewood Cliﬀs, New Jersey 07632, 1991.

[4] K. S. Fu, R. C. Gonzáles, and C. S. G. Lee, “Dinámica del Brazo

del Robot,” Robótica, Control,Detección, Visión e Inteligencia, McGraw-
Hill/Interamericana, Madrid, 1988.

[5] R. P. Paul, “Dynamics,” Robot Manipulators, Mathematics, Programming and

Control, The MIT Press, Massachussets, 1982.

[6] J. J. Craig, “Manipulator Dynamics,” Introduction to Robotics, Addisson Wesley,

2nd edition, 1989.

[7] Mohsen Shahinpoor, A Robot Engineering Textbook, Harper & Row, Publishers,
New York, Cambridge, Philadelphia, and others, 1987.

[8] V. I. Utkin, “Variable structure systems with sliding modes,” IEEE Trans. Au-
tomat. Contr., vol. 22, pp. 2-22, Feb. 1993.

[9] J. Y. Hung, W. Gao, and A. Homaifa, “Variable structure control: a survey,”

IEEE Trans. Ind. Electron., vol. 42, pp. 212-222, Feb. 1986.

[10] M. Vidyasagar, Nonlinear Systems Analysis (Second Edition), Prentice Hall,

Englewood Cliﬀs, New Jersey 07632, 1993.

[11] Alberto Isidori, Nonlinear Control Systems (Second Edition), Springer-Verlag

Berlin Heidelberg New York London Paris Tokyo Hong Kong, 1989.

[12] M. G. Sofonov, Stability and Robustness of Multivariable Feedback Systems, The

MIT Press Cambridge, MA, and London, England, 1980.

[13] Katsuhiko Ogata, Designing Linear Control Systems with MATLAB, Prentice
Hall, Englewood Cliﬀs, New Jersey 07632, 1944.

[14] Bernard Friedland, Control System Design. An Introduction to State-Space

Methods, McGraw-Hill, Inc., New York St. Louis y otras, 1986.
140 BIBLIOGRAFÍA

[15] A. M. Lyapunov, Probléme géneral de la stabilité du mouvement. Reprinted in

Annals of Mathematics Study No. 17 (Princeton Univ. Press, Princeton, New
Jersey) of the 1907 French translation of the fundamental Russian paper by
Lyapunov, published in 1892. 1980.

[16] Joseph La Salle and Solomon Lefschetz, Stability by Liapunov’s Direct Method
With Applications, Academic Press new York, London, 1961.

[17] I. Gustavsson, “Comparison of diﬀerent methods for identiﬁcation of linear mod-

els for industrial processes,” in Preprints IFAC Symp. on Identif., 1970, paper
11.4.

[18] G. N. Saridis, “Comparison of ﬁve popular identiﬁcation algorithms,” Automat-

ica, vol. 10, no. 1, pp. 69–79, Jan. 1974.

[19] B. D. O. Anderson, “Exponential stability of linear systems arising from adaptive

identiﬁcation,” IEEE Trans. on Auto. Contr., 22-2 (1977).

[20] A. P. Morgan and K. S. Narendra, “On the uniform asymptotic stability of

certain linear nonautonomous diﬀerential equations,” S.I.A.M. of Control and
Optimization, 15 (1977).

[21] Olle I. Elgerd, Control Systems Theory, McGraw-Hill Kogakusha, Ltd., Tokyo,
Auckland, Dusseldorf, and others, 1967.

[22] A. Barrientos, L. F. Peñin, C. Balaguer, and R. Aracil, Fundamentos de Robótica,

McGraw-Hill/Interamericana de España, S. A., Madrid, Buenos aires, Caracas,
and others, 1997.

[23] A. F. Filippov, “Diﬀerential Eequations with discontinuous right-hand sides,”

Mathematicheskii Sbornik, 51.1 (1960), in Russian. Trnaslated in English, Aw.
Math. Soc. Trans., 62, 199 (1964). Addisson Wesley, 2nd edition, 1989.

[24] D. E. Koditschek, Proc. 23rd I.E.E.E. Conf. on Decision and Control, Las Vegas,
p. 733, 1984.

[25] E. Bailey and A. Arapostathis, “Simple sliding mode control scheme applied to
robot manipulators,” Int. J. Control, 1987, vol. 45, No. 4, p. 1197–1209.

[26] Lab-PC+ User Manual, National Instruments Corporation, Part Number

320502B-01, August 1994.

[27] Eduardo F. Camacho y Carlos Bordons, Model Predictive Control, Springer-

Verlag London Limited 1999.

[28] D.M. Prett and M. Morari, “Shell Process Control Workshop,”Butterworths,

1987.

[29] T. Alvarez, M. Sanzo, and C. Prada, “Identiﬁcation and Constrained Multivaria-

ble Predictive Control of Chemical Reactors,”4th IEEE Conference on Control
Applications, Albany, pages 21:577-582, 1977.
BIBLIOGRAFÍA 141

[30] Manfred Morari y Evanghelos Zaﬁriou, Robust Process Control. PTR Prentice
Hall, Englewood Cliﬀs, New Jersey 07632, 1989.

[31] William H. Press, Brian P. Flannery y Saul A. Teukolosky, Numerical Recipes

in C, Cambridge University Press, Cambridge, 1988.

[32] MathWorks, Inc., MATLAB Reference Guide, Prentice Hall, Englewood Cliﬀs,
New Jersey, primera edición, 1998.

[33] MathWorks, Inc., SIMULINK User’s Guide, Prentice Hall, Englewood Cliﬀs,
New Jersey, primera edición, 1996.

[34] R. De Keyser, “A Gentle Introduction to Model Based Predictive Control”. In

PADI2 International Conference on Control Engineering and Signal Processing,
Piura, Perú, 1998.

[35] A. Rojas-Moreno, Design of Self-tuning Controllers for Processes Having Multi-

ple Unknown Time-varying Delays, Ph.D. Thesis, Utah State University, Logan,
UT, 1995.
Índice alfabético

Autonomous system, 68 Función lagrangiana, 2

Balance condition, 112, 115 Instability theorem, 73, 74

Invariant set, 107
CGEKF: Constant-Gain Extended Kalman Invariant set theorems, 75
Filter, 61 Involutive vector fields, 89
Chattering, 108
Complete (global) stability, 73 Kalman filter gain, 61
Composite adaptation
for MIMO processes, 84 Lagrange–Euler
Control law procedure, 5
the MIMO decoupling , 96 Lie brackets, 88
the SISO linearizing, 92 Lie derivatives, 87
Controllability LQG: Linear quadratic gaussian prob-
condition, 57, 90 lem, 55
generalized condition, 90 Lyapunov equation, 60, 62
matrix, 57, 90 Lyapunov function, 78
Coordenadas generalizadas, 1 Lyapunov’s
Covariance matrices, 61 first method, 68
second or direct method, 68
Diffeomorphism, 88 stability theorems, 72
Differential geometry, 87 Lyapunov,s
functions, 69
Ecuaciones de Lagrange, 1, 2
del proceso MRT, 12, 15 Método de Lagrange–Euler, 2
El modelo de Lagrange, 9 Manipulador robótico traslacional sub-
Equilibrium state, 68 actuado, 27
Equivalent control, 109, 117 Manipulador robótico con articulación
Equivalent linear system, 92, 97 elástica, 7
characteristic equation, 92, 97 Manipulador robótico esférico, 18
Exact linearization Manipulador robótico esférico subactu-
of MIMO processes, 94 ado (MRTS).–, 28
of SISO processes, 91 Manipulador Robótico Translacional, 12
Matriz de inercia del eslabón, 6, 21
Feedback linearization, 87 Matriz de transformación homogénea,
of MIMO processes, 93 18
of SISO processes, 90 Matriz de transformación homogénea
partial, 102 de Denavit–Hartenberg, 4
Frobenius Theorem, 89 Matriz simétrica inercial de aceleración,
Frobenius-Perron theorem, 119 6, 22
ÍNDICE ALFABÉTICO 143

MIMO normal form, 94 undeﬁned, 91

Modelo de Lagrange, 7, 23 Riccati equation, 58, 59, 61
del MRTS, 28
del proceso MRT, 17 SFC: State-Feedback Controller, 57
Modelo de Lagrange–Euler, 7, 23 SISO normal form, 91
Modelo en el espacio de estado for relative degree r < n, 102
del MRAE, 10 Sistema de coordenadas D–H (Denavit–
del MRE, 25, 26 Hartenberg), 3
Modelo L–E, 7 Sliding
Modelo L–E del MRE, 18 condition, 107, 111, 118
MRACS: Model-reference adaptive con- control, 105
trol system mode, 107, 117
conﬁguration, 67 surface, 107, 109, 114, 117, 118
the adaptation mechanism, 68 surface vector, 80
the controller, 68 Smoothness, 87
the reference model, 67 Stability
in autonomous systems, 72
Nonautonomous system, 68 in nonautonomous systems, 73
Nonlinear observer in the sense of Lyapunov, 69
characteristic equation of the, 99, Stability margins
100 and nondivergency for the NSO, 62
Nonlinear observer:with prescribed poles, and Robustness for LQSFC, 60
98, 99 by state-feedback, 59
NSO: Nonlinear State Observer, 60 State-feedback gain matrix, 58, 59
Surface equation, 114
Observability
condition, 61 Tracking error, 77, 106
matrix, 61
Unmodeled dynamics, 68, 105
Observability matrix, 98
generalized, 98, 99 Variable structure, 117
Variable Structure Control, 105
Parámetros D–H (Denavit–Hartenberg), Vector Coriolis y fuerza centrı́fuga, 7
3 Vector fuerza de Coriolis y centrı́peta,
Parámetros de Denavit–Hartenberg, 18 22
Parametric uncertainties, 68, 105 Vector fuerza de gravedad, 7, 23
PISFC: Proportional-Integral State-Feedback
Controller, 59
Positive/negative deﬁnite functions, 70
Procedimiento de Denavit–Hartenberg,
2
PSFC: Proportional State-Feedback Con-
troller, 57

Quadratic cost function, 57

augmented, 59

Relative degree, 90, 102

total, 93, 96

También podría gustarte

A. Rojas M - 2
Aún no hay calificaciones
A. Rojas M - 2
153 páginas
Control NLV10
Aún no hay calificaciones
Control NLV10
156 páginas
Con A Van
Aún no hay calificaciones
Con A Van
473 páginas
Arturo Rojas Moreno 2001 Control Avanzado 2
100% (1)
Arturo Rojas Moreno 2001 Control Avanzado 2
473 páginas
Análisis de Sistemas de Control
Aún no hay calificaciones
Análisis de Sistemas de Control
155 páginas
Control de Procesos V3
Aún no hay calificaciones
Control de Procesos V3
256 páginas
Ldesc2e PDF
Aún no hay calificaciones
Ldesc2e PDF
318 páginas
Control de Proceso
100% (1)
Control de Proceso
262 páginas
ControlDeProcesosV10 Arturo Rojas
Aún no hay calificaciones
ControlDeProcesosV10 Arturo Rojas
314 páginas
Control de Proceso SV 10
Aún no hay calificaciones
Control de Proceso SV 10
314 páginas
Control de Sistemas No Lineales Hebertt Sira
Aún no hay calificaciones
Control de Sistemas No Lineales Hebertt Sira
10 páginas
Introducción al Control Automático
Aún no hay calificaciones
Introducción al Control Automático
173 páginas
Sistemas No Lineales: Notas de Clase
100% (1)
Sistemas No Lineales: Notas de Clase
27 páginas
Ecuaciones y Polos en Control Automático
Aún no hay calificaciones
Ecuaciones y Polos en Control Automático
283 páginas
Análisis de Sistemas de Control
Aún no hay calificaciones
Análisis de Sistemas de Control
141 páginas
Control Multivariable
Aún no hay calificaciones
Control Multivariable
22 páginas
Control de Sistemas No Lineales
Aún no hay calificaciones
Control de Sistemas No Lineales
292 páginas
Universidad Nacional de Ingenieria
Aún no hay calificaciones
Universidad Nacional de Ingenieria
153 páginas
Book Control I
Aún no hay calificaciones
Book Control I
153 páginas
Teoría de Estabilidad y Control PDF
Aún no hay calificaciones
Teoría de Estabilidad y Control PDF
140 páginas
Teoria de Estabilidad y Control PDF
100% (2)
Teoria de Estabilidad y Control PDF
140 páginas
Teoría de Control - Giraldo y Tabares PDF
Aún no hay calificaciones
Teoría de Control - Giraldo y Tabares PDF
400 páginas
Te Control Di
100% (2)
Te Control Di
400 páginas
Sist No Lin
Aún no hay calificaciones
Sist No Lin
221 páginas
Sistemas Mecatronicaos MATLAB
Aún no hay calificaciones
Sistemas Mecatronicaos MATLAB
221 páginas
Cap 1 - Introducción A Los Sistemas de Control - Decrypted
Aún no hay calificaciones
Cap 1 - Introducción A Los Sistemas de Control - Decrypted
48 páginas
Control de Movimiento en Sistemas SISO
Aún no hay calificaciones
Control de Movimiento en Sistemas SISO
181 páginas
Apuntes de Control No Lineal Mecatrónica y Control
Aún no hay calificaciones
Apuntes de Control No Lineal Mecatrónica y Control
102 páginas
Seminario en Teorías de Control Moderno
100% (1)
Seminario en Teorías de Control Moderno
512 páginas
Control de Sistemas No Lineales Por Modos Deslizantes PDF
Aún no hay calificaciones
Control de Sistemas No Lineales Por Modos Deslizantes PDF
199 páginas
Control
Aún no hay calificaciones
Control
181 páginas
Sistema de Levitacion Neumatica PDF
100% (1)
Sistema de Levitacion Neumatica PDF
146 páginas
Control SISO-LIT en Ingeniería Electrónica
Aún no hay calificaciones
Control SISO-LIT en Ingeniería Electrónica
202 páginas
Control Optimo
Aún no hay calificaciones
Control Optimo
26 páginas
Regulación Automática y Teoría de Control
Aún no hay calificaciones
Regulación Automática y Teoría de Control
315 páginas
Manual IngCtrlAuto
Aún no hay calificaciones
Manual IngCtrlAuto
190 páginas
Tesis
Aún no hay calificaciones
Tesis
44 páginas
Control de Sistemas Discretos
Aún no hay calificaciones
Control de Sistemas Discretos
174 páginas
Apuntes para Econometria
Aún no hay calificaciones
Apuntes para Econometria
13 páginas
Practica 5
Aún no hay calificaciones
Practica 5
8 páginas
A1t1 CGF (Parcial) 2021 Ucv
Aún no hay calificaciones
A1t1 CGF (Parcial) 2021 Ucv
4 páginas
Informe de Pasantías en Informática UPTJAA
100% (1)
Informe de Pasantías en Informática UPTJAA
17 páginas
Curso Fotogrametría con Drones
Aún no hay calificaciones
Curso Fotogrametría con Drones
1 página
Guía de Alta de Productos Fijos en Believe
Aún no hay calificaciones
Guía de Alta de Productos Fijos en Believe
32 páginas
Manual de Usuario Zafirplan
Aún no hay calificaciones
Manual de Usuario Zafirplan
140 páginas
Enrique Merino CV 2024 2
Aún no hay calificaciones
Enrique Merino CV 2024 2
1 página
Syllabus de Java Avanzado UTP
Aún no hay calificaciones
Syllabus de Java Avanzado UTP
4 páginas
Teoría Del Color Y Semiótica: Producción Audiovisual
Aún no hay calificaciones
Teoría Del Color Y Semiótica: Producción Audiovisual
21 páginas
M05
Aún no hay calificaciones
M05
53 páginas
Manual de Usuario Televisor LCD 19-32"
Aún no hay calificaciones
Manual de Usuario Televisor LCD 19-32"
120 páginas
Teluria Caso+Real+Propuesta+Epp
Aún no hay calificaciones
Teluria Caso+Real+Propuesta+Epp
76 páginas
Evaluacion Excel
100% (1)
Evaluacion Excel
4 páginas
Informe Programacion Del Software en La Estacion Total
Aún no hay calificaciones
Informe Programacion Del Software en La Estacion Total
47 páginas
Fundamentos de Programación
Aún no hay calificaciones
Fundamentos de Programación
28 páginas
Gestión Documental USAR INSARAG
Aún no hay calificaciones
Gestión Documental USAR INSARAG
19 páginas
Guía de Programación para Sexto Grado
100% (3)
Guía de Programación para Sexto Grado
8 páginas
Manual Voucher Verde Dependientes Af 1023 0
Aún no hay calificaciones
Manual Voucher Verde Dependientes Af 1023 0
6 páginas
Estados Unidos Mexicanos Acta de Nacimiento: Identificador Electrónico
Aún no hay calificaciones
Estados Unidos Mexicanos Acta de Nacimiento: Identificador Electrónico
1 página
UNED - Tema 1 2 3
Aún no hay calificaciones
UNED - Tema 1 2 3
14 páginas
Anexo Tablas Militar y Aleatorias
Aún no hay calificaciones
Anexo Tablas Militar y Aleatorias
9 páginas
Algoritmos en PSeInt y DFD
100% (1)
Algoritmos en PSeInt y DFD
10 páginas
Gestion Del Conocimiento - Proyecto Final G2
100% (1)
Gestion Del Conocimiento - Proyecto Final G2
30 páginas
CATALOGO ORIGINAL - Im3
Aún no hay calificaciones
CATALOGO ORIGINAL - Im3
2 páginas
Inspección Gancho Grúa FASSI F33OD.25
Aún no hay calificaciones
Inspección Gancho Grúa FASSI F33OD.25
2 páginas
Practica Algebra Relacional
Aún no hay calificaciones
Practica Algebra Relacional
7 páginas
Foro 1
Aún no hay calificaciones
Foro 1
2 páginas
Lh-T3602se Ja4clla Spa 03e
Aún no hay calificaciones
Lh-T3602se Ja4clla Spa 03e
24 páginas
Formación de Imagen de Ultrasonido
Aún no hay calificaciones
Formación de Imagen de Ultrasonido
7 páginas