Controladores para Péndulos Invertidos
Controladores para Péndulos Invertidos
TESIS
Presenta:
M. en C. Oscar Octavio Gutiérrez Frías
Director de Tesis:
Dr. Carlos F. Aguilar Ibáñez
por
Director de Tesis
Dr. Carlos Fernando Aguilar Ibáñez
ii
Para solucionar la estabilización del sistema PEI se propuso una estrategia de con-
trol muy simple basada en el método de Lyapunov y en combinación con el teorema
de invariancia de LaSalle. La ley de control propuesta garantiza la estabilidad local
y asintótica del sistema en lazo cerrado alrededor del punto de equilibrio inestable,
con una región de atracción muy grande. La estabilización del sistema PMRM se
logró mediante un controlador proporcional derivativo PD. El diseño de este contro-
lador se basó en el método de Lyapunov tomando en consideración que el péndulo
esta restringido a moverse únicamente dentro de un conjunto admisible predefinido.
La efectividad y eficiencia de las leyes de control obtenidas para los cuatro sistemas
no lineales subactuados se verificó mediante simulaciones numéricas.
iii
Abstract
The under-actuated systems class object of this dissertation is the one formed by the
inverted pendulums. Particularly, the Inverted Pendulum Mounted on a Cart (IPC),
the Inertial Wheel Pendulum (IWP), the Spherical Inverted Pendulum (SIP) and
the Inverted Pendulum with Moving Mass (IPMM). The main contribution of this
dissertation is the stabilization around the unstable equilibrium point of these four
under-actuated nonlinear system.
The stabilization strategy used for the IPC is based on the model-matching. This
method consists of forcing that the closed-loop system behaves as an Euler-Lagrange
system, where the inertia characteristic matrix is constant. The technique based on
nested saturation functions was used in a second stability solution for the IPC. The
same ideas used in this second solution were applied to control the IWP. The appli-
cation of nested saturation functions was able because, both the IPC and the IWP,
could be approximatively expressed as a chain of integrators with a nonlinear pertur-
bation.
iv
To solve the stabilization of the SIP system a very simple control strategy was
proposed, based on the Lyapunov method in conjunction with LaSalle’s theorem.
The proposed control law guaranties locally asymptotically stability of the system in
closed-loop around the unstable equilibrium point, with a very large domain of attrac-
tion. The stabilization of the IPMM was accomplished by means of a proportional
derivative controller PD. The design of this controller was based on the Lyapunov
method, taking into consideration that the pendulum was restricted to only move
inside of a predefined admissible set.
The effectiveness and efficiency of the obtained control laws of the four under-actuated
nonlinear system were verified by numerical simulations.
v
Glosario
Notación Matemática
vi
p Vector de momentos generalizados dado por p = [p1 , p2 , · · · , pn ]T
en un sistema mecánico de n grados de libertad.
h iT
∂f ∂f ∂f
∇q f Vector gradiente de la función escalar f : ∂q1 , ∂q2 , · · · , ∂qn
∂f
∂qk
Elemento k-ésimo de ∇q f.
L Función de Lagrange o Lagrangiano.
Lq Véase la sección 2.3.2.
L2 Véase la sección 2.3.2.
H(q, q̇) Función de Hamilton de un sistema en lazo abierto.
M (q) Matriz de inercia en lazo abierto.
K(q, q̇) Energı́a cinética en lazo abierto.
V (q) Energı́a potencial en lazo abierto.
rango(A) Rango de la matriz A.
σm (s) Función de saturación lineal.
vii
Terminologı́a matemática
viii
Función propia: Función V (x) definida en X tal que los conjuntos
{x ∈ X |0 ≤ V (x) ≤ c} son compactos para cada
c ∈ R+ . Equivale al término radialmente no acotada.
Linealización: En muchos casos, la proporcionalidad que existe en-
tre la variable de entrada del transductor y su señal
de salida no es lineal. Las no linealidades reales cau-
san errores en los datos medidos, para reducir esos
errores, la salida del transductor se puede linealizar
como parte del proceso de acondicionamiento de señal
analógica. Para corregir (linealizar) las señales de sa-
lida del transductor se emplean varias técnicas de
linealización, incluyendo la modificación de los cir-
cuitos del transductor o el procesamiento analógico
de la señal del transductor.
Planta: Es una parte del equipo o máquina que se va a con-
trolar.
Robustez: El grado en el cual un sistema o el componente
pueden funcionar correctamente en la presencia de
entradas inválidas o condiciones no deseadas, a los
sistemas que tienen esta propiedad se les denomina
sistemas tolerantes a fallas.
Sistema: Los sistemas fı́sicos en un sentido más amplio, son una
interconexión de componentes, dispositivos o subsis-
temas. Un sistema puede considerarse como un proce-
so en el cual las señales de entrada son transformadas
por el sistema o provocan que éste responda de alguna
forma, lo que da como resultado otras señales como
salida.
ix
Sistema en lazo abierto: Es aquel sistema en el que no hay una realimentación
de la información para ajustar y mantener la salida
deseada.
Sistema en lazo cerrado: Es aquel sistema en el que hay una realimentación de
la información (por medio de sensores), que permiten
ajustar y mantener la salida deseada.
Sistema de control: Es aquel que se encarga de gobernar la respuesta de
una planta sin que el operador intervenga directa-
mente sobre los elementos de salida.
x
Abreviaturas y acrónimos
CD Corriente directa.
EDO Ecuación diferencial ordinaria.
EDP Ecuación diferencial en derivadas parciales.
EL Ecuaciones de Euler-Lagrange.
GL Grado de libertad.
IDA-PBC PBC con interconexión y asignación de amortiguamiento (Intercon-
nection and Damping Assigmnment-PBC ).
MATLAB MATh LABoratory software.
MIMO Sistema de múltiples entradas y salidas.
PBC Control basado en pasividad.
PCH Sistema Hamiltoniano Controlado por Puertos (Port-Controlled
Hamiltonian System).
PEI Péndulo Esférico Invertido (Spherical Inverted Pendulum).
PIC Péndulo Invertido sobre un Carro (Inverted Pendulum Cart Sys-
tem).
PDI Péndulo con Disco Inercial (Inertial Wheel Pendulum).
PMRM Péndulo con Masa Radialmente Móvil.
PVTOL Sistema de aterrizaje y despegue de un avión (Planar Vertical Take-
off and Landing).
SISO Sistema de una entrada y una salida.
SPI Sistemas tipo Péndulo Invertido.
SMU Sistema Mecánico Subactuado.
xi
Agradecimientos
A mi hija Raquel: Por ser la fuerza para continuar cada dı́a y por el tiempo que
no pude dedicarle.
A mi Padre: Por que gracias a él y a Dios pude realizar mi formación profesional.
xii
A los Sinodales: Por sus valiosos consejos y por compartir sus conocimientos
conmigo.
xiii
Con amor y cariño para Raquel
Los estudios doctorales no son más que el primer paso de una vida dedicada
a la investigación cientı́fica y a la búsqueda de la verdad en la ciencia.
Anónimo
xiv
Índice general
Resumen II
Abstract IV
Glosario VI
Agradecimientos XII
Índice de tablas XX
1. Introducción 1
1.1. Motivación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2. Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2.1. Objetivo general . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2.2. Objetivos especifı́cos . . . . . . . . . . . . . . . . . . . . . . . 5
1.3. Hipótesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.4. Planteamiento del problema . . . . . . . . . . . . . . . . . . . . . . . 7
1.5. Contribuciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.6. Lı́mites y alcances . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.7. Estructura de la tesis . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
xv
2.3.1. Estabilidad de Lyapunov . . . . . . . . . . . . . . . . . . . . . 39
2.3.2. Pasividad y Disipatividad . . . . . . . . . . . . . . . . . . . . 45
2.3.3. Sistemas No holonómicos . . . . . . . . . . . . . . . . . . . . . 48
xvi
6.3. Estrategia de control . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
6.3.1. Cómo proponer una función de Lyapunov . . . . . . . . . . . 119
6.3.2. Obtención de la ley de control . . . . . . . . . . . . . . . . . . 121
6.3.3. Análisis de estabilidad . . . . . . . . . . . . . . . . . . . . . . 123
6.4. Simulaciones numéricas . . . . . . . . . . . . . . . . . . . . . . . . . 125
8. Conclusiones 140
8.1. Desarrollos futuros . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
Referencias 170
xvii
Índice de figuras
3.1. Acrobot. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
3.2. Pendubot. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
3.3. Péndulo Invertido sobre un Carro. . . . . . . . . . . . . . . . . . . . . 64
3.4. Péndulo Esférico Invertido. . . . . . . . . . . . . . . . . . . . . . . . . 66
3.5. Péndulo con Disco Inercial. . . . . . . . . . . . . . . . . . . . . . . . 68
3.6. Péndulo de Furuta. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
3.7. PVTOL. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
xviii
A.1. Péndulo Invertido sobre un Carro. . . . . . . . . . . . . . . . . . . . . 145
A.2. Péndulo con Disco Inercial . . . . . . . . . . . . . . . . . . . . . . . . 152
A.3. Sistema Péndulo Esférico Invertido . . . . . . . . . . . . . . . . . . . 155
xix
Índice de tablas
xx
Capı́tulo 1
Introducción
1.1. Motivación
Desde muchas décadas atrás hasta la actualidad el desarrollo de técnicas de control
para sistemas mecánicos es uno de los campos de investigación más activos en la inge-
nierı́a, esto debido a que su desarrollo ha permitido crear maquinas automáticas con
un fuerte impacto en áreas tales como producción, almacenaje y supervisión de ma-
teriales peligrosos, construcción, tele-operación y vehı́culos autónomos por nombrar
sólo algunas. No obstante, las soluciones a problemas existentes no se han agotado
ni problemas nuevos han dejado de surgir por ello la necesidad de desarrollar nuevas
técnicas de control sigue siendo una tarea vigente y en algunos casos urgente.
En esta tesis se aplica la Teorı́a de Control de sistemas no-lineales a una clase muy im-
portante de sistemas mecánicos denominados sistemas mecánicos subactuados,1
que se caracterizan fundamentalmente por tener menos actuadores que grados de li-
bertad. En particular, me enfoqué a resolver el problema de estabilización alrededor
del punto de equilibrio inestable de algunos sistemas pertenecientes a la familia de
péndulos invertidos, que son una subclase de sistemas subactuados como el Péndulo
Invertido sobre un Carro (PIC), el Péndulo con Disco Inercial (PDI), el Péndulo
Esférico Invertido (PEI) y el Péndulo con Masa Radialmente Móvil (PMRM).
1
Una bicicleta o una avión son ejemplo cotidianos de esta clase de sistemas.
1
2 Capı́tulo 1. Introducción
Actualmente existen técnicas de control desarrolladas a finales del siglo pasado para
sistemas completamente actuados2 como los robots manipuladores clásicos. Por ejem-
plo, las técnicas basadas en pasividad [46, 31, 158]; la teorı́a de Lyapunov [112, 181]
o la linealización por retroalimentación [190, 188]. Desafortunadamente, un sistema
subactuado es considerablemente más complejo que un sistema completamente actua-
do, por lo que las técnicas usadas para controlar a estos últimos no pueden aplicarse
de forma directa a un sistema subactuado.
Ası́, en los últimos años una serie de aplicaciones cientı́ficas, militares e industriales
han motivado a los investigadores ha estudiar los sistemas mecánicos subactuados, con
la finalidad de desarrollar algoritmos de control que estabilicen sistemas como barcos,
vehı́culos acuáticos, helicópteros, aeronaves, aerodeslizadores, satélites o robots, los
cuales pueden ser considerados como “subactuados”, por alguna de las siguientes
razones:
Por lo anterior, en este trabajo se desarrollan estrategias de control para los Sistemas
Subactuados tipo Péndulo Invertido (SPI) que consisten en un péndulo situado sobre
una base móvil que gira libremente por uno de sus extremos mediante una articu-
lación,3 debido a que la aceleración del péndulo no puede ser controlada directamente,
los SPI se consideran sistemas subactuados. Estos sistemas mecánicos son una familia
de dispositivos que constituyen un banco de prueba muy completo e interesante en la
Ingenierı́a de control no-lineal, algunos de los integrantes de esta familia son: el Péndu-
lo Invertido sobre un Carro [20]; el Péndulo con Rueda de Inercia [187]; el Péndulo
Esférico Invertido [15]; el Péndulo de Furuta [72]; el Pendubot [39], entre otros de
interés para los investigadores, debido a que su modelo matemático puede modelar el
comportamiento de sistemas aplicados en la vida real más complejos, como el control
de cohetes [210]; el modelo del control de posición de un propulsor primario espacial
para despegues [148]; los robots caminantes de dos pies [102, 217]; el movimiento de
los pies del ser humano [113]; los vehı́culos terrestres [200]; los sistemas antisı́smicos en
construcciones [191, 134], o bien, los sistemas de absorción de vibraciones mecánicas.
Cabe destacar que el sistema Péndulo Invertido tiene caracterı́sticas importantes que
lo convierten en un tópico de investigación muy interesante, resaltando las siguientes:
Lo anterior provoca que sea complicado realizar maniobras de control como las que
permitan estabilizar el péndulo alrededor de la posición de equilibrio inestable y las
relacionadas a la estabilización alrededor de órbitas homoclı́nicas [128, 174, 184]. Sin
embargo, se conoce que el modelo lineal del Péndulo Invertido es localmente contro-
lable alrededor del punto de equilibrio inestable, por lo tanto, el problema de esta-
bilización puede ser solucionado utilizando la técnica de desplazamiento de polos [175].
1.2. Objetivos
Resolver el problema de estabilización del Péndulo con Disco Inercial por medio
del método de control por funciones de saturación anidadas, considerando la
presencia de fuerzas disipativas en la coordenada no actuada, ya que estas tien-
den a desestabilizar la solución en lazo cerrado especialmente en la posición
superior [78, 209].
1.3. Hipótesis
Partiendo de la idea de que los sistemas tipo Péndulo Invertido (tales como el
Péndulo Invertido sobre un Carro y el Péndulo con Disco Inercial) pueden expresarse
como una cadena de integradores con una perturbación no-lineal, permitirá proponer
6 Capı́tulo 1. Introducción
2. Se debe considerar que el desplazamiento del carro o la base son acotados, es de-
cir, están restringidos a moverse en cierta región definida por las caracterı́sticas
fı́sicas del sistema.
Se establece a partir del objetivo planteado una metodologı́a a seguir como se muestra
a continuación:
1.5. Contribuciones
La principal aportación del presente trabajo es proporcionar herramientas analı́ticas
que permitan solucionar el problema de establización de Sistemas tipo Péndulo Inver-
tido (SPI) alrededor del punto de equilibrio inestable.
d ) Además, el sistema en lazo cerrado tiene una región de atracción que puede
ser tan grande como se desee para cualquier posición inicial por encima del
plano horizontal.
Como una motivación del estudio de los sistemas tipo péndulo invertido; una
aportación adicional de este trabajo, es proponer una solución sencilla al problema
de atenuación de vibraciones de un péndulo invertido sin fricción con masa móvil,
utilizado el enfoque basado en Lyapunov para estabilizar asintóticamente el sistema4
bajo la suposición de que el sistema es inicializado en su dominio de atracción. La
estrategia de control propuesta explota las propiedades fı́sicas del sistema original
que se utilizan para moldear la energı́a total del sistema en lazo cerrado. En lo que se
refiere a la aplicabilidad de la ley de control propuesta, el modelo no lineal presentado
es una versión simplificada de la dinámica de edificios rı́gidos, restringidos a oscilar
en el plano (excitaciones externas). Siendo un problema interesante la atenuación
de los efectos provocados por perturbaciones desconocidos (fuerzas sı́smicas) en las
estructuras civiles por medio de un control activo.
4
El péndulo está anclado al pivote, por medio de un resorte torsional, que mantiene el sistema
en la posición vertical estable, como consecuencia el sistema es estable en el sentido de Lyapunov.
10 Capı́tulo 1. Introducción
El apéndice A describe cómo se obtienen los modelos matemáticos del Sistema Péndu-
lo Invertido sobre un Carro, Péndulo con Disco Inercial y Péndulo Esférico Invertido
utilizando las ecuaciones de Euler-Lagrange.
13
14 Capı́tulo 2. Estado del Arte
1
E.J. Routh fue ganador del premio Adams en 1877 por su criterio de estabilidad.
2.1. Antecedentes históricos de la Teorı́a de Control 15
2
El criterio estabilidad Hurwitz es equivalente al de Routh, y en Teorı́a de Control se denomina
Criterio de Routh-Hurwitz la demostración de dicha equivalencia se puede encontrar en el libro
de Ingenierı́a de Control Moderna del autor Katsuhiko Ogata [148].
3
La ecuación caracterı́stica que se cumple con el criterio de estabilidad de Hurwitz se le conoce
en Teorı́a de Control como polinomio Hurwitz
16 Capı́tulo 2. Estado del Arte
Todas las técnicas previamente descritas que involucran conceptos relacionados con
métodos basados en frecuencia corresponden a lo que se conoce como Teorı́a de
Control Clásica, pero a partir de las nuevas e importantes herramientas teóricas
que R. E Kalman y otros investigadores introdujeron a principios de los años 60’s
del siglo pasado se dio el paso a una nueva era en la Teorı́a de Control que se ha
denominado Teorı́a de Control Moderna, cuyo diseño es realizado en el dominio
del tiempo y su método principal es el modelo en espacio de estado, el cual permite
representar sistemas de múltiples entradas y salidas (MIMO por sus siglas en inglés)
como un sistema de una entrada y una salida (SISO) y sus herramientas principales
son el álgebra lineal y matrices.
Cabe resaltar que la Teória de Control Moderna dio la pauta para que se generaran
diversas ramas del Control Automático como son: Control Lineal [53], Control No li-
neal [97], Control Óptimo [207], Control Robusto [51], Control Adaptable [21], Control
2.2. Control de Sistemas No lineales 19
4 5
Jerárquico y Control Inteligente
Por lo anterior, el interés de los investigadores aumentó dando lugar a nuevas dis-
ciplinas como la Mecatrónica6 y debido al rápido avance en la informática y las
comunicaciones, hoy dı́a se ofrecen oportunidades sin precedentes para que el campo
de control amplié sus contribuciones,7 como las que se han realizado en áreas diferen-
tes a la ingenierı́a como sistemas biológicos [178, 179, 180], aplicaciones biomédicas
[75, 208, 28] y sistemas socieconómicos [44, 132, 204, 49].
4
Un sistema de control jerárquico es una forma de sistema de control en el cual un conjunto
de dispositivos y software toman la forma de un árbol en donde cada nodo opera por separado,
realizando tareas de un nodo superior, ordenando las tareas de sus nodos subordinados, enviando
señales resumidas a su nodo superior y recibiendo señales de sus nodos subordinados. Las hojas de
los nodos son sensores o actuadores.
5
Abarca diversos tópicos de inteligencia artificial para controlar un sistema dinámico como redes
neuronales, lógica difusa, algoritmos genéticos, cómputo evolutivo, entre otras.
6
La Mecatrónica surge de la combinación sinérgica de distintas ramas de la ingenierı́a, entre las
que destacan la mecánica, la electrónica, la ingenierı́a de cómputo y los sistemas de control. Siendo su
principal propósito el análisis y diseño de productos, y los procesos de manufactura automatizados.
7
Un informe que presenta las conclusiones y recomendaciones de los nuevos desafı́os y oportu-
nidades que afronta la comunidad de Control, se presenta en el libro “Control in an Information
Rich World Report of the Panel on Future Directions in Control, Dynamics, and Systems”[22].
20 Capı́tulo 2. Estado del Arte
En seguida, presentamos el estado del arte de cada uno de los temas mencionados.
Existe una extensa literatura de investigación dedicada a este tipo de sistemas [59].
Para una introducción al problema y una clasificación interesante desde el punto de
vista de posibles estrategias para la solución de sistemas subactuados se recomienda
revisar [152, 203, 185]. Otros trabajos en los cuales se presentan diversas estrategias
de control aplicadas a los sistemas subactuados, se pueden encontrar en [39, 2, 85,
76, 30, 119].
8
El Acrobot es robot de 2 eslabones, el cual tiene un actuador en el eslabón 2 (codo).
22 Capı́tulo 2. Estado del Arte
de punto fijo. Fantoni et. al. [60] presentan una técnica de control para estabilizar
el sistema en una orbita homoclı́nica. En [12] se propone un controlador que rea-
liza la estabilización y seguimiento de trayectoria utilizando el enfoque de platitud
diferencial. Un trabajo interesante fue el desarrollado en [145], donde se deriva un
controlador usando la idea de que el sistema puede ser representado como un péndu-
lo plano más una fuerza giroscópica. Gordillo et al. [79] proponen una solución al
problema de trasladar el péndulo de la posición colgante, hasta la posición invertida
aplicando el método del gradiente de velocidad de Fradkov [17, 68] para el modelo de
dimensión 4. Además, se compara esta ley con la estrategia de Åström-Furuta [24]
que utiliza un modelo de dimensión 2. En 2006, C. Aguilar et. al. [9] propusieron una
estrategia para estabilizar el péndulo de Furuta utilizando el método de Lyapunov.
Por otra parte, un sistema subactuado es un ejemplo de sistema mecánico con res-
tricciones no holonómicas de segundo orden [154] que no cumple con la condición
de Brockett [115] en la cual propone un teorema que proporciona las condiciones
necesarias para que exista una ley de control por retroalimentación que estabilice
asintóticamente un sistema [45]. Como consecuencia en muchos sistema subactua-
dos es imposible utilizar una ley de control por retroalimentación para estabilizarlos
alrededor de sus puntos de equilibrio, aunque sea localmente.
Como conclusión, pese a los grandes avances teóricos y experimentales que se han
logrado en los últimos años los resultados distan de tener gran generalidad, aunque
existen trabajos que han logrado generalizar los sistemas subactuados en dos tipos:
Uno es la forma normal en cascada introducido por Olfati-Saber [150] en donde mues-
tra un método que transforma el sistema completo en dos subsistemas no lineales,
reduciendo el problema de control del sistema completo, al de controlar cada subsis-
tema. El otro tipo, propuesto por Murray y Sastry [144], proporciona las condiciones
suficientes para convertir por medio de retroalimentación de estado y transformación
de coordenadas un sistema no holonómico con dos entradas a una forma de cadena.
Por lo tanto, el estado del arte de sistemas subactuados esta muy lejos de encontrar
24 Capı́tulo 2. Estado del Arte
métodos de control que resuelvan toda la gama de esta clase de sistemas, ya que el
desarrollo actual solo ha resuelto cada ejemplo de manera particular. Por lo cual este
trabajo pretende contribuir al estado del arte.
Como se ha mencionado, los Sistemas tipo Péndulo Invertido (SPI) están formados
por un péndulo en el cual uno de sus extremos esta unido mediante una articulación
a una base móvil lo que le permite girar libremente y, debido a que la aceleración
angular del péndulo no puede ser controlada, estos sistemas son considerados ejemplos
de sistemas subactuados.
Inercial, ası́ como al Péndulo Esférico Invertido que son los sistemas que se abordan
en este trabajo.
Comenzaremos con el Péndulo Invertido sobre un Carro (PIC) que es uno de los
sistemas tipo péndulo invertido más estudiados y consiste en un péndulo que gira
libremente por uno de sus extremos mediante una ariculación situada sobre un carro
que se mueve sobre una guı́a rectilı́nea por la acción de una fuerza horizontal. Ini-
cialmente, en los años 60’s del siglo pasado se podia observar el Péndulo Invertido
sobre un Carro en los laboratorios de control de las universidades más prestigiadas
[20]. La demostración consistı́a en situar de manera manual el péndulo en la posición
vertical invertida y soltarlo para que de manera autónoma, retroalimentando su posi-
ción, continuara en la posición invertida mediante la adecuada actuación del carro.
Por ser este un problema de carácter local, únicamente se utilizan métodos lineales
para resolver este problema, como por ejemplo, la técnica de desplazamiento de polos
[85].
Otros enfoques que se han utilizado para resolver la estabilización del Péndulo In-
vertido sobre un Carro son los basados en lógica difusa y redes neuronales. Como
por ejemplo, S. Horikawa et. al [92] proponen un controlador difuso para el péndu-
lo invertido utilizando redes neuronales difusas que son capaces de identificar au-
tomáticamente las reglas difusas. En [131] se presenta un controlador difuso usando
retroalimentación visual permitiendo observar que es posible controlar el sistema por
medio de lógica difusa y retroalimentación visual. Un trabajo donde se utiliza una red
neuronal back-propagation como controlador para estabilizar el péndulo invertido se
presenta en [96]. Otros trabajos interesantes que utilizan los métodos libres de modelo
pueden revisarse en [16, 142, 136].
10
El péndulo con disco (o rueda) inercial en inglés se denomina Inertial Wheel Pendulum (IWP)
28 Capı́tulo 2. Estado del Arte
Para controlar este sistema en el año 2000, Albouy y Praly [15] diseñaron un con-
trolador basado en pasividad para llevar el péndulo a la posición superior con poca
velocidad y cambiar de un controlador no-lineal a uno lineal, para mantener el péndu-
lo en la posición superior. Bloch et.al. [35] solucionan el problema de estabilización
no local por medio de un controlador Lagrangiano. Sin embargo, no garantizan la
convergencia asintótica al origen. Otro trabajo interesante fue desarrollo por G. Liu
et. al. [122] donde se presenta un controlador que es capaz de estabilizar las posi-
ciones angulares del péndulo garantizando la estabilidad local del sistema completo
por medio de saturaciones anidadas. Hoshino et.al. [93] describen la estabilización de
un triple péndulo esférico alrededor de la posición superior usando un manipulador
planar y sensores de visión. Para obtener mejores resultados, los autores diseñaron
el péndulo y el controlador. En [172], se presenta un nuevo modelo para el péndulo
en tres dimensiones y se soluciona el problema de control, considerando al sistema
como un caso de cuerpo rı́gido. Además, en este trabajo se comentan algunos retos
de investigación interesantes de este sistema. Otros trabajos interesantes que abarcan
este tópico se pueden encontrar en [124, 120, 123, 121]. En las siguientes secciones de
esta tesis se presentan una serie de desarrollos para solucionar el problema de esta-
bilización de algunos sistemas tipo péndulo invertido tales como el péndulo invertido
sobre un carro, el péndulo con rueda inercial y el péndulo esférico invertido alrededor
del punto de equilibrio inestable. Contribuyendo al estado del arte de este tema.
Una metodologı́a similar a la anterior fue desarrollada a principios del año 2000 por
R. Ortega et. al [162, 161, 159, 77, 156] cuyas ideas se basan en los formalismos de
los Sistemas Hamiltonianos controlados por puertos (port-controlled Hamiltonian),
llamándolo Método de Control Basado en Pasividad con Interconexión y
Asignación de Amortiguamiento (IDA-PBC) y su objetivo también es encon-
trar una ley de control que conserve la estructura del sistema a partir de un conjunto
de EDP, con la diferencia que al utilizar la estructura hamiltoniana es posible encon-
trar una gama más amplia de soluciones a estas EDP, permitiendo encontrar diversas
funciones de energı́a modificada.
A. Método IDA-PBC
Para aplicar el método, considere un sistema subactuado con una función energı́a en
la forma Hamilton descrita como sigue:
1
H(q, p) = pT M −1 (q)p + V (q) (2.1)
2
Donde q ∈ Rn , p ∈ Rn , son las posiciones y momentos generalizados respectiva-
mente, M (q) = M (q)T > 0 es la matriz de inercia, y V (q) es la energı́a potencial. Si
suponemos que el sistema no tiene amortiguamiento natural, entonces las ecuaciones
de movimiento pueden escribirse como
" # " #" # " #
q̇ 0 In ∇q H 0
= + u (2.2)
ṗ −In 0 ∇p H G(q)
El método IDA-PBC sigue dos pasos básicos del Control Basado en Pasividad (PBC)
[158]:
1. Moldeo de energı́a: esto significa modificar la función total de energı́a del sistema
para asignar el punto de equilibrio (q ∗ , 0).
Enseguida, comentaremos los aspectos más importantes de este método para un es-
tudio más detallado consultar [159].
En este método se persigue una dinámica en lazo cerrado con función de energı́a de
la forma:
1
Hd (q, p) = pT Md−1 (q)p + Vd (q) (2.3)
2
Donde Md (q) = Md (q)T > 0 y Vd (q) representan la matriz de inercia y la energı́a
potencial en lazo cerrado respectivamente.
" # " #
q̇ ∇q Hd
= [Jd (q, p) − Rd (q, p)] (2.4)
ṗ ∇p H d
Siendo,
" # " #
0 M −1 Md 0 0
Jd (q, p) = −JdT (q, p) = ; Rd = RdT =
−1
−Md M J2 (q, p) 0 GKv GT
11
Para una justificación analı́tica y fı́sica ver [160, 198].
32 Capı́tulo 2. Estado del Arte
que representan una matriz antisimétrica que permite aumentar los grados de libertad
en el diseño, también llamada de interconexión generalizada y la matriz de disipación
en lazo cerrado, respectivamente.
Para poder obtener la ley de control que conserve la estructura del sistema, las ecua-
ciones de estado en lazo abierto y cerrado se deben ajustar exactamente. Esto quiere
decir que la ley de control debe calcularse de modo que:
Podemos mencionar que este método presenta dificultades cuando los sistemas son
subactuados, ya que el conjunto de funciones de Hamilton Hd alcanzables en lazo
cerrado es limitado y depende de la facilidad para resolver un sistema de Ecuaciones
Diferenciales Parciales (EDP). Por lo cual, en el caso subactuado existe una matriz
G⊥ de rango r < n siendo n el número de grados de libertad que representa las
direcciones en las que la ley de control no tiene efecto, cumpliéndose que:
G⊥ G = 0 (2.6)
Esta ecuación deben cumplirse para cualquier valor de la ley de control, y por lo
tanto, representa una restricción en el conjunto de sistemas hamiltonianos alcanza-
bles en lazo cerrado definidos por las matrices (Hd , Jd ,Rd ). Como consecuencia, los
parámetros (Hd , Jd ,Rd ) deben ser seleccionados de tal manera que se cumplan las
ecuaciones de ajuste derivadas de (2.7) y al mismo tiempo representar una dinámica
2.2. Control de Sistemas No lineales 33
Donde, eventualmente, algunos de los términos de control ui pueden ser nulos. Suponien-
do que el objetivo es estabilizar el sistema en un punto de equilibrio deseado (q ∗ , q̇ ∗ ),
34 Capı́tulo 2. Estado del Arte
µ ¶ µ ¶
d ∂Lc ∂Lc
− = ũi (2.10)
dt ∂ q˙i ∂qi
Con, i= (1,....n).
Por tanto, este método consiste en encontrar una ley de control u que transforme al
sistema (2.9) en el sistema en lazo cerrado (2.10) a partir de la solución de un conjunto
de ecuaciones diferenciales llamadas condiciones de ajuste. Esto significa que las
soluciones q(t) de las trayectorias del sistema (2.9) sean también las trayectorias de
(2.10).
En [37, 86, 35] se enuncian algunos teoremas que establecen las condiciones que debe
cumplir el conjunto de Lagrangianos controlados, este resultado es conocido como
teorema de ajuste o matching theorem, a continuación se resume brevemente.
1
L(q, q̇) = gij (q)q̇ i q̇ j − V (q) (2.11)
2
1
Lc (q, q̇) = g̃ij (q)q̇ i q̇ j − Ṽ (q) (2.12)
2
donde, gij y g̃ij representan los elementos de la matriz de inercia en lazo abierto y
cerrado, respectivamente. En caso de que el sistema presentado en (2.11) sea subac-
tuado implica la existencia de una variedad no nula denominada subespacio de las
direcciones no actuadas (Λ). La proyección en este espacio se representa por ΛiA ui = 0
(A = 1 · · · m). Empleando los sı́mbolos de Christoffel Γijk y Γ̃ijk de las matrices gij y
g̃ij [1], y definiendo
2.2. Control de Sistemas No lineales 35
i
Tjk = Γ̃ijk − Γijk
hji = gik g̃ kj
h̃ji = g̃ik g̃ kj
Tijk = hpi hqj hrk g̃pn Tqr
n
L̃c está ajustado (es decir, cumple (2.10) cuando ũi = 0) si y solo si las siguientes
condiciones se cumplen.
∂V ∂ Ṽ
ui = − hji l j k
− gil Tjk q̇ q̇
∂qi ∂qj
Por otro parte, este método también comprende la adición de un término de amor-
tiguamiento para lograr la estabilidad asintótica de sus puntos de equilibrio, el si-
guiente teorema da las condiciones para cumplir lo anterior.
Se tiene un ajuste generalizado (es decir, ũi (q, q̇)q̇ i ≤ 0 ) si las siguientes condi-
ciones se cumplen:
Además, con el fin de obtener estabilidad asintótica del punto de equilibrio inestable
utilizando el método de Lagrangianos controlados y el ajuste generalizado, se debe
12
asegurar que la energı́a Ẽ tenga un mı́nimo en el punto de equilibrio.
1. sσ(s) > 0 ∀s 6= 0
3. |σ(s)| ≤ M ∀s ∈ R
ẋ1 = x2
ẋ2 = x3
.. (2.13)
.
ẋn = u
12 ∂ L̃ i
La energı́a Ẽ se define como Ẽ , ∂ q̇ i q̇ − L̃
2.2. Control de Sistemas No lineales 37
La idea fundamental de esta técnica es encontrar una ley de control que estabilice
asintóticamente de forma global el sistema (2.13), derivándose el siguiente teorema
Teorema 2.2.3 Existe una función lineal hi : Rn → R tal que, para cualquier con-
Li+1
junto de constantes {(L, M )} donde Li ≤ Mi para i = 1, ...., n y Mi < 2
para
i = 1, ...., n − 1, y para cualquier conjunto de funciones {σi } que son saturaciones
lineales para {(Li , Mi )}, el control acotado
dé como resultado una estabilización asintótica global del sistema (2.13)
i
à !
X i
yn−i = xn−i
j=0 j
donde à !
i i!
=
j j!(i − j)!
i
à !
X i
xn−i = (−1)i+j yn−i
j=0 j
38 Capı́tulo 2. Estado del Arte
ẏ1 = y2 + · · · + yn + u
ẏ2 = y3 + · · · + yn + u
..
. (2.15)
ẏn−1 = yn + u
ẏn = u
Ahora consideremos la evolución del estado yn−1 . Y observemos que yn ahora es parte
de Qn , por lo cual el argumento de σn esta acotado por
Ln
|yn + σn−1 (yn−1 + · · · + σ1 (y1 )) · · · )| ≤ + Mn−1
2
≤ Ln
ẏ1 = −y1
ẏ2 = −y1 − y2
..
.
ẏn = −y1 − y2 − · · · − yn
Se puede observar de manera clara que el sistema anterior es exponencialmente estable
después de un tiempo finito.
ẋ = f (x) (2.16)
0 = f (x∗ ) (2.17)
2.3. Fundamentos Teóricos 41
Inestable, si no es estable.
Las definiciones anteriores corresponden a una propiedad local del sistema alrededor
del punto de equilibrio. Por tanto, los conceptos de estabilidad llegan a ser globales
cuando se satisfacen las condiciones correspondientes para cualquier estado inicial.
42 Capı́tulo 2. Estado del Arte
Una función escalar V (x) se dice localmente definida positiva si V (0) = 0 y V (x) > 0
para x 6= 0.
De manera similar, V (x) es definida negativa si −V (x) es definida positiva.
Además, si V (x) es igual a cero para x 6= 0, se puede decir que la función es semi-
definida positiva o negativa:
Si en una bola B que contiene el origen, V (x) es definida positiva y tiene deriva-
da parcial continua.
dV ∂V ∂V
V̇ (x) = = ẋ = f (x) ≤ 0
dt ∂x ∂x
ó bien,
V̇ (x) ≤ 0
Los siguientes teoremas pueden ser usados para el análisis de estabilidad local ó global.
Si en una bola B existe una función escalar continuamente diferenciable V (x) tal que:
Supongamos que existe una función escalar V del estado x con primera derivada
continua tal que:
Cuando V (x) es definida positiva los siguientes dos corolarios son válidos exten-
diendo los teoremas de estabilidad.
Los conceptos que se describirán enseguida pueden ser estudiados con mayor de-
talle en: [199] para estabilidad L2 , [198] para pasividad e interconexión de sistemas
pasivos, [157] para control basado en pasividad de sistemas EL, y [125] para sistemas
disipativos.
A. Estabilidad Lq
Z ∞
|f (t)|q dt < ∞
0
Además, se conoce que para estos espacios es posible definir las siguientes normas:
13
Una función es medible si es el lı́mite punto por punto de una secuencia de funciones constantes
a trozos, excepto un conjunto de medida cero.
46 Capı́tulo 2. Estado del Arte
¡R ∞ ¢ 1q
kf kq = 0
|f (t)|q dt q = 1, 2, · · ·
kf k∞ = sup |f (t)|
t∈[0,∞)
1
kf k2 =< f |f > 2
Por otro lado, para las funciones no acotadas sin tiempo de escape finito se define el
espacio extendido Lqe
G : Lqe (U ) → Lqe (Y )
u 7→ y = G(u)
u ∈ Lq (U ) ⇒ G(U ) ∈ Lq (y)
B. Pasividad y Ganancia L2
P ẋ = f (x, u) , u ∈ U
:
y = h(x, u) , y ∈ Y
donde x = (x1 , ..., xn ) son las coordenadas locales en una variedad X y U e Y son
espacios lineales, de dimensiones m y p, respectivamente. En el espacio de estados
U × Y de variables externas se define la función
s:U ×Y
Este término fue concebido por Hertz en 1894 [168]. Y los ejemplo más tı́picos son
sistemas ó vehı́culos móviles [38].
q̈ = f (q, q̇, u)
supongamos que existen restricciones que limitan el movimiento del sistema. Si las
condiciones de restricción pueden expresarse como ecuaciones que conectan las coor-
denadas (y posiblemente el tiempo) de la forma
h(q, t) = 0 (2.19)
Por otra parte, podemos mencionar que las restricciones No holonómicas se dividen
en dos tipos:
Considere el sistema
ẋ1 = ux2
(2.20)
ẋ2 = −ux1
Tome en cuenta que el sistema (2.20) tiene una restricción de velocidades de la forma:
1 2 1 2
x + x =c (2.22)
2 1 2 2
donde c es una constante, por tanto la restricción (2.20) es una restricción holonómica
ẋ1 = u1
ẋ2 = u2 (2.23)
ẋ3 = x1 u2 − x2 u1
donde (x1 , x2 , x3 ) son los estados y (u1 , u2) son las entradas. El sistema (2.23) también
tiene un restricción de velocidades de la siguiente manera:
1
i = 1, 2...n
52
3.1. Sistemas Euler-Lagrange 53
tal que las trayectorias q(t) del sistema satisfacen la siguiente condición[114]:
Supongamos que en los instantes t = t1 y t = t2 , el sistema ocupa posiciones deter-
minadas, definidas por los conjuntos de coordenadas q (1) y q (2) . Entonces, entre estas
posiciones, el sistema se moverá de forma que la integral
Z t2
S= L(q, q̇, t) (3.2)
t1
Z t2 Z t2 Z t2
δS = L(q + δq, q̇ + δ q̇, t)dt − L(q(t), q̇, t)dt = δ L(q(t), q̇, t)dt = 0 (3.5)
t1 t1 t1
Z t2 µ ¶
∂L ∂L
δq + δ q̇ dt (3.6)
t1 ∂q ∂ q̇
d
Y tomando en cuenta que δ q̇ = dt
δq, entonces, integrando por partes el segundo
término de (3.6) se obtiene:
¯t Z t2 µ ¶
∂L ¯¯ 2 ∂L d ∂L
δS = δq + − δqdt (3.7)
∂ q̇ ¯t1 t1 ∂q dt ∂ q̇
Al evaluar la condición (3.4), en el primer término de la ecuación (3.7) este desaparece.
Por tanto, la condición necesaria y suficiente para que δS = 0 será
d ∂L ∂L
− =0 (3.8)
dt ∂ q̇ ∂q
Para el caso que el sistema posea varios grados de libertad, la expresión anterior queda
de la siguiente manera
d ∂L ∂L
− = 0, i = (1, 2, ...., n) (3.9)
dt ∂ q˙i ∂qi
d ∂L ∂L
− = F (q)u (3.11)
dt ∂ q˙i ∂qi
donde u ∈ Rm y F (q) = (f1 (q), ....., fm (q)) representa el conjunto de fuerzas y momen-
tos externos que no derivan de un potencial, entre los que habitualmente se incluyen:
3.1. Sistemas Euler-Lagrange 55
Los efectos de fricción que tienen como consecuencia una disipación de energı́a.
Σj mkj (q)q̈j + Σi,j Γkij (q)q̇i q̇j + gk (q) = eTk F (q)u, k = 1, ...., n (3.12)
Donde ek es la base estándar en Rn , gk (q) = ∂V (q)/∂qk , y Γkij (q) son llamados sı́mbolos
de Christoffel definidos como:
µ ¶
1 ∂mkj (q) ∂mki (q) ∂mij (q)
Γkij (q) = + −
2 ∂qi ∂qj ∂qk
Entonces, la forma vectorial que representa la ecuación de movimiento del sistema se
expresa como:
Donde M (q) es la matriz de inercia del sistema y cij = Σnk=1 Γikj (q)q̇k es un elemento
de C(q, q̇)
Cabe mencionar que C(q, q̇)q̇ contiene dos tipos de términos que involucran a q˙i q˙j
denominados Centrı́fugo (i = j) y de Coriolisis (i 6= j) además, G(q) es el componente
provocado por la fuerza de gravedad que esta relacionado con la energı́a potencial
como: G(q) = ∂V (q)/∂q [190].
Por otro lado, la matriz M (q) es una matriz simétrica y definida positiva para todo
q, y existe una interesante relación entre las matrices M y C definida de la siguiente
forma: S = Ṁ (q) − 2C(q.q̇), la cual es una matriz anti-simétrica que se usa para
establecer la propiedad de pasividad del sistema.
Por otra parte, cuando ocurre una falla en los actuadores o por la ausencia de los
mismos debido a consideraciones de diseño del sistema fı́sico (falta de espacio, exceso
de peso y por cuestiones de presupuesto, entre otras), el sistema se considera sub-
actuado. Una solución para evitar el problema de ausencia (o falla) de un actuador
se logra equipando el sistema con actuadores redundantes o cambiando la ley de con-
trol para que trabaje solamente con los actuadores restantes cuando se detecta una
3.2. Sistemas Subactuados 57
Es importante mencionar que las consideraciones anteriores son algunas razones para
continuar con el desarrollo de nuevas técnicas de control aplicadas a sistemas subac-
tuados.
Esta definición concuerda con la usada por Oriolo y Nakamura [154], la cual dice que
los sistemas subactuados son sistemas con menor cantidad de actuadores indepen-
dientes que grados de libertad a controlar.
µ ¶
d ∂L ∂L
− = 0, i = m + 1, · · · , n
dt ∂ q̇i ∂qi
µ ¶
d ∂L ∂L
− = u, j = 1, · · · , m (3.14)
dt ∂ q̇j ∂qj
58 Capı́tulo 3. Sistemas Mecánicos Subactuados
Donde
" #
m11 (q) m21 (q)
M (q) = (3.17)
m21 (q) m12 (q)
es una matriz positiva y simétrica. Además, las funciones h1 (q, q̇) ∈ Rl y h2 (q, q̇) ∈ Rm
contienen los términos de Coriolisis y Centrı́fugos del sistema, los términos φ1 (q, q̇) ∈
Rl y φ2 (q, q̇) ∈ Rm representan los efectos gravitacionales y u ∈ Rm corresponde a las
fuerzas generalizadas producidas por los m actuadores.
3.3. Ejemplos de Sistemas Subactuados 59
la cual representa las restricciones del sistema provocadas por las coordenadas sub-
actuadas.
Siendo entonces una restricción no holonómica de segundo orden, debido a que no se
puede encontrar una función por integración que relacione las velocidades y posiciones
de las coordenadas subactuadas y actuadas [155].
θ1 = m1 lc21 + m2 l12 + I1
θ2 = m2 lc22 + I2
θ3 = m2 l1 lc2
θ4 = m1 lc1 + m2 l1
θ5 = m2 lc2
1. Acrobot
Este dispositivo es un robot plano de dos eslabones, el cual tiene un único actuador
en eslabón 2 (codo) como se observa en la figura 3.1. El eslabón 1 (hombro) se mueve
libremente alrededor del eslabón 2.
3.3. Ejemplos de Sistemas Subactuados 61
Y
l2
q2
l1 m2 , I 2
lc 2
1
lc
1
m1 , I 1
q1
Modelo Matemático
Las ecuaciones dinámicas del sistema son descritas de la siguiente manera [183]:
Donde
" # " #
q1 θ1 + θ2 + 2θ3 cos q2 θ2 + θ3 cos q2
q = M (q) =
q2 θ2 + θ3 cos q2 θ2
" #
−θ3 sen q2 q̇2 −θ3 sen q2 q̇2 − θ3 sen q2 q̇1
C (q, q̇) =
θ3 sen q2 q̇1 0
62 Capı́tulo 3. Sistemas Mecánicos Subactuados
Y
l2
q2
l1 m2 , I 2
lc 2
lc
1
m1 , I 1
q1
X
1
" # " #
θ4 g cos q1 + θ5 g cos (q1 + q2 ) 0
G (q) = y τ =
θ5 g cos (q1 + q2 ) τ1
2. Pendubot
Un sistema mecánico similar al anterior se denomina Pendubot, la diferencia entre
estos sistemas radica en que éste dispositivo tiene un actuador en el primer eslabón
(hombro) y, en este caso el eslabón 2 (codo) se mueve libremente alrededor del eslabón
1 como se observa en la figura 3.2. El objetivo del control es llevar el mecanismo a su
punto de equilibrio inestable [59, 63, 152, 186].
Modelo Matemático
Las ecuaciones de movimiento que describen al sistema son [40]:
Donde
" # " #
q1 θ1 + θ2 + 2θ3 cos q2 θ2 + θ3 cos q2
q = M (q) =
q2 θ2 + θ3 cos q2 θ2
" #
−θ3 sen q2 q̇2 −θ3 sen q2 q̇2 − θ3 sen q2 q̇1
C (q, q̇) =
θ3 sen q2 q̇1 0
" # " #
θ4 g cos q1 + θ5 g cos (q1 + q2 ) τ1
G (q) = y τ =
θ5 g cos (q1 + q2 ) 0
Comentario:
Además, el Acrobot y el Pendubot son sistemas que cuenta con dos grados de
libertad y un sólo actuador. Donde, para el caso del Acrobot q1 es la coordenada
subactuada y q2 la coordenada actuada; y en el Pendubot la coordenada actuada
se representa por q1 y la subactuada por q2 .
mg
M
f
literatura [6, 54, 61, 81, 149] y su estudio está motivado por las diversas aplicaciones
como el control de posición de los sistemas de despegue de cohetes y el control de
vibraciones mecánicas en construcciones.
Este dispositivo consiste en un péndulo con libertad para rotar montado encima de
un carro que se mueve a lo largo de una vı́a debido al impulso de una fuerza, como
se muestra en la figura 3.3.
Modelo Matemático
Las ecuaciones de movimiento del sistema están dadas por [85]:
Además, el sistema puede ser escrito en la forma estándar de los Sistemas de Lagrange
definido como:
Donde
" # " #
x M + m ml cos θ
q = M (q) =
θ ml cos θ ml2
" #
0 −ml sen θθ̇
C (q, q̇) =
0 0
" # " #
0 f
G (q) = y τ =
−mgl sen θ 0
Comentario
x
y uy
ux
Una versión más general del péndulo invertido en dos dimensiones es el llamado
Péndulo Esférico Invertido (3D Cart-Pole System) [152]. El cual es un sistema no
lineal que permite ilustrar una versión académica simplificada del propulsor de un
cohete [70, 71, 175, 212].
Modelo Matemático
Este sistema puede ser descrito por el siguiente conjunto de ecuaciones diferenciales
normalizadas [152].
3.3. Ejemplos de Sistemas Subactuados 67
ẍ = ux (3.25)
ÿ = uy (3.26)
θ̈ = Sθ Cϕ − Sθ Cθ ϕ2 − Cθ ux + Sθ Sϕ uy (3.27)
1 ³ ´
ϕ̈ = Cθ Sϕ + 2Sθ Cϕ θ̇ϕ̇ − Cθ Cϕ uy (3.28)
Cθ2
Donde los parámetros del sistema son:
Comentario
Este sistema fue introducido y estudiado por M. Spong et. al. [187] y está constituido
por un péndulo fı́sico unido a un disco giratorio en la parte final, el cual está girando
68 Capı́tulo 3. Sistemas Mecánicos Subactuados
1
x
l2
m 1, I 1
l1
I2
m2
libremente sobre un eje paralelo al eje de rotación del péndulo (ver figura 3.5). El
disco es accionado por un motor de DC y el péndulo es subactuado. El torque del
motor usado como entrada de control produce una aceleración angular del disco, lo
que genera un torque de acoplamiento en el eje del péndulo.
Existen dos problemas de control relacionados con este sistema, el primero es ba-
lancear el péndulo en el semi-plano superior y equilibrarlo en la posición invertida
[3, 59] y el segundo consiste en estabilizar el sistema alrededor del punto de equilibrio
inestable, con las dos posiciones angulares del sistema en el origen [151, 152, 159].
Modelo Matemático
La ecuaciones dinámicas del sistema son descritas como [59]:
¡ ¢
I1 + I2 + m1 l22 + m2 l12 θ̈1 + I2 θ̈2 − ηg sen θ1 = 0 (3.29)
I2 θ̈1 + I2 θ̈2 = τ (3.30)
3.3. Ejemplos de Sistemas Subactuados 69
D (q) q̈ + g (q) = u
Donde
" # " #
θ1 I1 + I2 + m1 l22 + m2 l12 I2
q = D (q) =
θ2 I2 I2
" # " #
−ηg sen θ1 0
g (q) = y u =
0 τ
Comentario
El Péndulo con Disco Inercial cuenta con dos grados de libertad y una entrada
de control (τ ), donde θ1 es la coordenada subactuada y θ2 es la coordenada
actuada.
Además, una caracteristica importante del sistema, es que puede ser linealizable
por retroalimentación [187].
70 Capı́tulo 3. Sistemas Mecánicos Subactuados
Este sistema cuenta con un motor que funciona como actuador y el péndulo está unido
a la flecha del motor como se muestra en la figura 3.6, algunos autores lo denominan
péndulo rotacional [152] y existen diversos trabajos en la literatura relacionados con
el control de este tipo de péndulo [9, 69, 79, 111, 145, 149].
Modelo Matemático
El modelo matemático del sistema se obtiene a partir de las ecuaciones de Euler-
Lagrange [59] suponiendo que la fricción es despreciable. La notación descrita en la
figura 3.6 se muestra en la siguiente tabla :
£ ¡ ¢¤
τ1 = I0 + m1 L2o + l12 sen2 θ1 θ̈0 + m1 l1 L0 cos θ1 θ̈1 + m1 l12 sen 2θ1 θ̇0 θ̇1
− m1 l1 L0 sen θ1 θ̇12 (3.31)
£ ¤
0 = m1 l1 L0 cos θ1 θ̈0 + J1 + m1 l12 θ̈1 − m1 l12 sen θ1 cos θ1 θ̇02 − m1 gl1 sen θ1 (3.32)
3.3. Ejemplos de Sistemas Subactuados 71
q1
j
1
m1 g
q0
t l1
l0 , L0
Motor
Donde
" # " #
θ0 Io + m1 (L2o + l12 sen2 θ1 ) m1 l1 L0 cos θ1
q = D (q) =
θ1 m1 l1 L0 cos θ1 J1 + m1 l12
" #
1 1
m l2 sen 2θ1 θ̇1
2 1 1
m l2
2 1 1
sen 2θ1 θ̇0 − m1 l1 L0 sen θ1 θ̇1
C (q, q̇) =
−m1 l12 sen θ1 cos θ1 θ̇0 0
" # " #
0 τ1
g (q) = y τ =
−m1 gl1 sen θ1 0
Las ecuaciones anteriores definen un sistema subactuado por que tienen una sola
entrada τ1 y dos grados de libertad θ0 y θ1 . Donde θ0 corresponde a la coordenada
actuada y θ1 a la subactuada.
72 Capı́tulo 3. Sistemas Mecánicos Subactuados
Y u2 e u2
u1
q
y
-1
0 x
X
Modelo Matemático
Las ecuaciones de movimiento del sistema son [59]:
Donde:
Comentario
4.1. Introducción
El problema de estabilización del sistema Péndulo Invertido sobre un Carro ha
recibido la atención de los investigadores en los últimos años debido a que este dis-
positivo es un banco de pruebas muy interesante en la ingenierı́a de control no lineal
74
4.2. Modelo del Péndulo Invertido sobre un Carro 75
El resto del capı́tulo se organiza del siguiente modo. En la sección 4.2 presentamos el
modelo dinámico del PIC. La sección 4.3 muestra la obtención del ajuste de modelo
y la solución de la condiciones de ajuste. En la sección 4.4 se describe el análisis
de estabilidad del sistema en lazo cerrado y en la sección 4.5 se observan algunas
simulaciones computacionales.
M
f
donde
" # " # " #
− sen θ β 0 − cos θ
F (θ) = , B= , G(θ) = (4.4)
0 0 0 1
y xT = (θ, q).
∂
Md ẍ = −Kd (x)ẋ − Vd (x), (4.5)
∂x
donde Md y Kd (x) son matrices simétricas definidas positivas y Vd (x) es una función
estrictamente positiva.3
Entonces, se dice que los sistemas (4.3) y (4.5) están ajustados para la ley de control
u, si la solución de los dos sistemas es la misma. Es decir, (x, u) es una solución de
(4.3), si y solo si x es una solución de (4.5). Por consiguiente, se asegura que (4.3) y
(4.5) están ajustados, si cumplen
∂
−F (θ) + G(θ)u = −Md−1 Kd (x)ẋ − Md−1 Vd (x). (4.6)
∂x
µ· ¸ ¶
∂ £ −1 ¤
0=G ⊥
Md−1
Vd (x) − F (θ) + Md Kd (x) ẋ . (4.7)
∂x
Por consiguiente, si se encuentran los términos Kd y Vd para el vector F , la ley de
control u se puede calcular directamente por:
·µ ¶ ¸
GT −1 ∂ −1
u=− T Md Vd (x) − F (θ) + Md Kd (x)ẋ . (4.8)
G G ∂x
Finalmente, la estrategia de control consiste en resolver las condiciones de ajuste
(4.7), las cuales se pueden dividir en las dos ecuaciones
· ¸
∂
0=G ⊥
Md−1 Vd (x) − F (θ) , (4.9)
∂x
y
£ ¤
0 = G⊥ Md−1 Kd (x) ẋ, (4.10)
6
γ es una constante positiva y la función Vd (x) se selecciona como
1 1 kp
Vd (x) = ln(−1 + µ2 ) − ln(−1 + µ2 cos θ) + s2 (4.13)
µ2 µ2 2
donde
µ ¶
µ3 2(µ3 −µ22 )
s=q+ µ2
θ + √ arctan h √1+µ2 tan θ
2
, (4.14)
µ2 −1+µ22 −1+µ22
6
En este caso escogemos γ = 1.
7
El valor más grande de α, tal que Vd (x) < α sea un conjunto compacto, permite tener una
estimación del dominio de estabilidad, donde E(x, ẋ) ≤ α define un conjunto compacto invariante,
y por lo tanto E es una función decreciente.
4.4. Análisis de estabilidad 81
1
E(x, ẋ) = ẋT Md ẋ + Vd (x) (4.16)
2
donde Md y Vd (x) son definidos en (4.5) y (4.13), respectivamente. Calculando la
Capı́tulo 4. Estabilización del Péndulo Invertido
82 utilizando un ajuste de modelo
derivada de E con respecto al tiempo, alrededor del sistema (4.5), se obtiene lo si-
guiente
¡ ¢
= −ẋT Kd (x)ẋ + ∂x ∂
Vd (x) + ẋT ∂V∂x
d (x)
(4.17)
= −ẋT Kd (θ)ẋ.
Cabe notar que los signos de E y Ė dados en (4.16) y (4.17) están bien definidos
mientras que el ángulo θ se encuentre dentro del conjunto Iµ (ver lema 4.3.2). Lo cual
se asegura si las condiciones iniciales (x0 , ẋ0 ) con θ0 ∈ Iµ , pertenecen a una vecindad
del origen, tal que
El conjunto Ω tiene la propiedad de que todas las soluciones del sistema en lazo cerrado
(4.5) que comienzan en Ω permanecen en Ω para todo el tiempo.
la cual es equivalente a
Tome en cuenta que en el conjunto S se tiene que θ ∈ Iµ . Por lo tanto, las variables
θ̇ y q̇ no cambian su signo como se estableció en el lema 4.3.2. Ahora, si θ̇ y q̇ son
diferentes de cero y tienen el mismo signo dentro de S, entonces, (θ, q) tiende a salirse
del conjunto invariante Ω, siendo este caso una contradicción, ya que se asume que
(x, ẋ) ∈ Ω. En el caso que ẋ = 0 y x sea un vector constante fijo en S. Y definiendo
a x = x9 . Siendo x uno de los dos puntos de equilibrio del sistema (4.3). Es decir,
x = (0, 0) o x = (θ = π, q = 0). Sin embargo, de la definición del conjunto invariante Ω
descrito en (4.19), necesariamente se obtiene que x = 0. Por consiguiente, el conjunto
invariante más grande es M = 0.
Proposición 4.4.2 Considere el modelo no lineal (4.3) en lazo cerrado con (4.8),
donde Md , Kd y Vd son seleccionadas de acuerdo al lema (4.3.2). Entonces, el origen
(x = 0, ẋ = 0) del sistema en lazo cerrado es localmente estable asintóticamente con
un dominio de atracción definido por (4.19).
Por supuesto, q debe ser seleccionada a partir de las restricciones fı́sicas del movimien-
to del carro. En otras palabras, es posible llevar todos los estados a la posición inestable
si el ángulo y el movimiento del carro se confinan dentro del conjunto Q.
Figura 4.3 Comportamiento en lazo cerrado de las posiciones del sistema para dos
valores diferentes de kp .
Figura 4.4 Comportamiento en lazo cerrado de las velocidades del sistema para dos
valores diferentes de kp .
Esta estrategia parte de la idea que los sistemas pueden ser expresados como una
cadena de integradores con una pertubación no lineal que permite aplicar una ley
de control basada en funciones de saturación anidadas, que garantiza que todos lo
estados converjan a cero. La mayor parte de lo que expuesto en este capı́tulo aparece
publicado en los artı́culos [8, 14].
5.1. Introducción
La estabilización de los Sistemas Subactuados tipo Péndulo es uno de los proble-
mas más interesantes en Teorı́a de Control no lineal y se ve reflejado en la literatura
87
Capı́tulo 5. Control de Sistemas Subactuados tipo Péndulo Invertido
88 por funciones de Saturación Anidadas
por la gran gama de trabajos que abordan este tema [6, 54, 59, 72, 81, 152], entre
otros.
El resto del capı́tulo se organiza como sigue. En las secciones 5.2 y 5.3 presentamos la
estabilización de los sistemas Péndulo Invertido sobre un Carro y Péndulo con Disco
Inercial, respectivamente.
5.2. Control del Sistema Péndulo Invertido sobre un Carro 89
M
u
µ ¶
1+δ
u = (1 + δ) tan θ1 − θ22 sen θ1 + v cos θ1 − ,
cos θ1
en el sistema (5.1) se obtiene:
ẋ1 = x2 ,
v
ẋ2 = tan θ1 − cos θ1
,
(5.2)
θ̇1 = θ2 ,
θ̇2 = v.
Donde x = x1 , θ = θ1 y v es un controlador auxiliar ficticio que actúa en la coordenada
θ1 . Por supuesto, el sistema anterior solo es valido para todo θ1 ∈ (−π/2, π/2). En lo
sucesivo, ésta restricción se denominará suposición A1 y al sistema (5.2) como un
modelo parcialmente linealizado del PIC.
donde la función g será escogida, tal que la derivada de la variable z2 no depende del
control v, es decir,
µ ¶
0 1
ż2 = tan θ1 + v g (θ1 ) − + θ22 g 00 (θ1 ). (5.4)
cos θ1
Ası́, µ ¶
0 1 1 + tan(θ1 /2)
g (θ1 ) = ; g(θ1 ) = log , (5.5)
cos θ1 1 − tan(θ1 /2)
y están definidas para |θ1 | < π/2.
Por lo tanto, de las expresiones (5.3) y (5.5), el sistema (5.2) puede escribirse de la
siguiente manera:
ż1 = z2 ,
θ22
ż2 = tan(θ1 )(1 + cos θ1
),
(5.6)
θ̇1 = θ2 ,
θ̇2 = v.
Entonces, para expresar el sistema anterior como una cadena de integradores con una
pertubación no lineal, es necesario definir las siguientes transformaciones globales no
lineales
w1 = tan θ1 , w2 = sec2 θ1 θ2 ,
(5.7)
vf = sec2 θ1 v + 2θ22 tan θ1 sec2 θ1
con las cuales obtenemos el siguiente sistema:
ż1 = z2 ,
w1 w22
ż2 = w1 + (1+w12 )3/2
,
(5.8)
ẇ1 = w2 ,
ẇ2 = vf .
Capı́tulo 5. Control de Sistemas Subactuados tipo Péndulo Invertido
92 por funciones de Saturación Anidadas
Comentario 5.2.2 Una representación similar del modelo (5.8) fue propuesta en
[127]. En donde, el control y la coordenada no actuada no están completamente des-
acopladas. Esto significa que el control actúa directamente sobre la perturbación no
lineal y como consecuencia el sistema en lazo cerrado tiene un dominio de atracción
más restringido. Por otra parte, en nuestro caso la acción de control está desacoplada
completamente de la pertubación no lineal, de modo que, es posible aumentar el do-
minio de estabilidad para todas las condiciones iniciales que pertenecen al semi-plano
superior.
y
w
G(w) = , (5.13)
(1 + w2 )3/2
por simplicidad, q = [q1 , q2 , q3 , q4 ].
2
Comentario 5.2.3 Es importante notar que el max |G(w)| ≤ k0 = 33/2
, y se obtiene
√
cuando w = 1/ 2.
Primer paso: Definamos la siguiente función de definida positiva, para mostrar que
el estado q4 es acotado.
V4 = q42 /2 (5.15)
Se puede observar claramente que V̇4 < 0, cuando |q4 | ≥ αk. Por consecuencia, existe
un tiempo finito T1 > 0 tal que:
V3 = q32 /2 (5.18)
donde α y β son escogidos, tal que α > 2β. Y claramente, si |q3 | > β, entonces V̇3 < 0
y existirá un tiempo finito T2 > T1 después del cual
2
Cabe destacar que |q4 (t)| ≤ q4 (0)e−t + α y |G(q3 − q4 )| ≤ k0 . Por lo tanto, el lado derecho
del sistema en lazo cerrado (5.14) y (5.11) es localmente Lipschitz. Por consiguiente, los estado
{q1 , q2 , q3 } no pueden tener un tiempo de escape finito [110].
5.2. Control del Sistema Péndulo Invertido sobre un Carro 95
V2 = q22 /2 (5.23)
V1 = q12 /2 (5.28)
donde el parámetro γ debe escogerse, tal que γ > 3k0 α2 k 2 . Y si q1 > 3k0 α2 k 2 ,
entonces V̇1 < 0, Por lo cual, existirá un tiempo finito T4 > T3 en donde:
Enseguida, demostraremos que el sistema en lazo cerrado dado por (5.11) y (5.14)
es asintóticamente estable y exponencialmente estable localmente si lo parámetros del
controlador satisfacen las ecuaciones definida en (5.31).
5.2. Control del Sistema Péndulo Invertido sobre un Carro 97
Cabe notar que después del tiempo t > T4 , la ley de control ya no está saturada, es
decir:
vf = −q1 − q2 − q3 − q4 ,
1
V = q T q, (5.35)
2
Y diferenciando V a lo largo de las trayectorias del sistema (5.34), obtenemos:
donde
1 1 1
1 2 2 2
1
1 1 1
2 2 2
M = . (5.37)
1 1
1 1
2 2 2
1 1 1
2 2 2
1
siendo M definida positiva con λmin {M } = 1/2.
k0
|(3q1 + q2 )δ(q)| < 2
|(3q1 + q2 )q42 | ;
(5.38)
k0 4
< 2
(q4 + (3q1 + q2 )2 ).
Capı́tulo 5. Control de Sistemas Subactuados tipo Péndulo Invertido
98 por funciones de Saturación Anidadas
1£ 2 ¤ q42 1
V̇ < − q1 + q2 − k0 (3q1 + q2 ) − (1 − k0 q42 ) − q32 .
2 2
(5.39)
2 2 2
y
−1 + k0 q42 ≤ −1 + 14k0 k 2 < 0. (5.41)
Del procedimiento descrito se obtiene que el sistema (5.11) en lazo cerrado con el
controlador (5.14) es asintóticamente estable semi-globalmente, ası́ como exponen-
cialmente estable localmente, cuando los parámetros cumplen con la (5.31). Sin em-
bargo, podemos solo asegurar que los estados originales (x, θ, ẋ, θ̇) convergen a cero, si
suponemos que el ángulo del péndulo se encuentra en el semi-plano superior, debido
a que (5.2) y (5.7) únicamente están definidas para θ ∈ (−π/2, π/2). Es decir, la
suposición A1 se necesita para evitar los puntos singulares del sistema definidos en
θ = ±π/2.
con
w1 = tan θ1 ; w2 = θ2 sec2 θ1 ;
³ ´ (5.44)
1+tan(θ1 /2)
z1 = log 1−tan(θ 1 /2)
+ x1 ; z2 = θ2 / cos θ1 + x2 .
Tiempo Tiempo
Figura 5.2 Respuesta en lazo cerrado del ángulo y velocidad angular del péndulo.
Tiempo Tiempo
Tiempo Tiempo
1
x
l2
m 1, I 1
l1
I2
m2
El sistema conocido como Péndulo con Disco Inercial (PDI) mostrado en la figura
5.5, fue definido por M. Spong [187] y consiste en un péndulo fı́sico con un disco
equilibrado situado al extremo. El par motor produce una aceleración angular de la
masa del extremo lo cual genera un par de acoplamiento en el eje del péndulo.
Capı́tulo 5. Control de Sistemas Subactuados tipo Péndulo Invertido
102 por funciones de Saturación Anidadas
4
La obtención de las ecuaciones dinámicas del sistema utilizando las ecuaciones de Euler-Lagrange
se describen en el apéndice A.2
5.3. Control del Péndulo con Disco Inercial 103
z1 = (1 + κ1 ) θ1 + θ2 ; ż1 = p1 ;
(5.48)
z2 = θ 1 ; ż2 = p2 ,
de las cuales se obtiene el siguiente sistema no lineal
ẋ = A0 x + ∆(x) + b0 u (5.49)
Capı́tulo 5. Control de Sistemas Subactuados tipo Péndulo Invertido
104 por funciones de Saturación Anidadas
donde
z1 0 1 0 0
p 0 0 κ −δ
1 2
x= ; Ao = ;
z2 0 0 0 1
p2 0 0 0 0
0 0
κ φ(z ) 0
2 2
∆(x) = ; b0 = .
0 0
0 1
φ(z2 ) = sen(z2 ) − z2 ;
(5.50)
1
u= κ1
(−v − δ ż2 + κ2 sen(z2 )).
Cabe destacar que la estructura del sistema (5.49) tiene una forma similar a la de
una cadena de integradores con una pertubación no lineal. Por otra parte, el nuevo
controlador u actuada directamente en la coordenada no actuada θ1 , la cual es la
posición del péndulo. Contrario a lo que sucedı́a en el sistema (5.46) en donde el torque
τ manejaba directamente la posición del disco. Por consiguiente, se han realizado
pequeños cambios a la estructura original del péndulo con rueda de inercia fuertemente
amortiguado.
Como se ha comentado esta técnica fue propuesta en [192, 195], y ha sido usada
para estabilizar una cadena de integradores lineal, ası́ como para controlar diversos
sistemas subacutuados [8, 50, 127, 126, 194].
0 1 1 1 1
0 0 1 1 1
SAo S −1 = y Sb0 = .
0 0 0 1 1
0 0 0 0 1
1
V1 = q42 (5.55)
2
Entonces, derivando (5.55) y usando la cuarta ecuación diferencial de (5.53), se tiene
que:
Y si |q4 | > kα entonces, de la expresión anterior se obtiene que V̇1 ≤ 0. Por tanto,
habrá un tiempo finito T1 después del cual se tenga que:
1
V2 = q32 . (5.56)
2
Por lo cual, sustituyendo el controlador propuesto (5.54) en la tercera ecuación dife-
rencial de (5.53), se tiene lo siguiente:
· ¸
1
q̇3 = −kσα (q3 + σβ [q2 + σγ [q1 ]]) . (5.57)
k
Capı́tulo 5. Control de Sistemas Subactuados tipo Péndulo Invertido
108 por funciones de Saturación Anidadas
w = q3 + σβ [q2 + σγ [q1 ]] ,
de la cual se tiene que |w(t)| ≤ |q3 (t)| + β, para todo t > 0, y evidentemente, |w(t)| <
2β después de t > T2 . Y debido que α > 2β/k entonces
· ¸
1
kσα w = w; t > T2 .
k
De lo anterior, el control u toma la siguiente forma:
αk
|q3 − q4 | < β + kα < + αk = µk . (5.59)
2
por lo cual, el parámetro k se puede seleccionar como se desee, y µk < 1. Por conse-
cuencia, |q3 (t) − q4 (t)| < µk < 1, para todo t > T2 . Entonces, aplicando la siguiente
desigualdad
1
V3 = q22 . (5.63)
2
Por lo cual, derivando (5.63) y utilizando (5.62), se produce la expresión siguiente:
Obviamente, si |q2 | > γ + θµ2k se cumplirı́a que V̇3 ≤ 0 y existirá un tiempo finito
T3 > T2 , después del cual se obtendrá la siguiente desigualdad:
1
V4 = q12 . (5.66)
2
Capı́tulo 5. Control de Sistemas Subactuados tipo Péndulo Invertido
110 por funciones de Saturación Anidadas
A continuación, resumimos esta sección con el siguiente lema que permitirá calcular
los parámetros del controlador adecuadamente definidos como {α, β, γ, µk }, los cuales
son necesarios para garantizar el acotamiento de todos los estados.
Lema 5.3.3 Dadas las constantes positivas δ y κ2 ; y considerando que µk ∈ (0, 1)6
se obtienen las siguientes desigualdades:
³ ´
δ
α > 2β; β > 2γ + θµ2k ; γ > κ2
+ 3 θµ2k , (5.68)
Para probar que el sistema en lazo cerrado descrito por (5.53) y (5.58) es asintótica-
mente estable y exponencialmente estable localmente de acuerdo con las suposiciones
del lema 5.3.3. Es decir, si los parámetros, k, γ y β son escogidos de acuerdo al lema
5.3.3, entonces el vector de estado q converge a cero.
6
Cabe recordar que k = 2µk /3α.
5.3. Control del Péndulo con Disco Inercial 111
Cabe destacar que después del tiempo t > T4 , la ley de control ya no está saturada,
es decir:
u = −q1 − q2 − q3 − q4 ,
Cabe notar que λmin {M } = 1/2 , por tanto M > 0. Y recordando que después del
tiempo t > T4 , los estados q1 , q2 y la función φ satisfacen las siguientes desigualdades:
³ ´ ³ ´
δ δ
|q1 | < θµ2k κ2
+3 ; |q2 | < θµ2k κ2
+4 ;
|φ(q3 − q4 )| < θ(q3 − q4 )2 .
donde
Es importante comentar que K puede ser tan pequeño como se necesite, ya que
µk ∈ (0, 1) puede seleccionar como se desee.
1£ 2 ¤
V̇ < − q1 + q22 + q32 + q42 + 2K(q32 + q42 ).
2
y si forzamos a que K < 1/4, se obtendrá que V̇ < 0, para todo q 6= 0. Por lo tanto,
si K se escoge tal que K < 1/4, entonces el vector de estado q convergirá a cero
exponencialmente de manera local.
Proposición 5.3.4 Considere el sistema péndulo con disco inercial descrito por (5.46),
en lazo cerrado con
· ¸
1
v = κ1 q4 + κ1 kσα (q3 + σβ [q2 + σγ [q1 ]]) − δ θ̇1 + κ2 sen(θ1 ),
k
x1 = z1 = (1 + κ1 ) θ1 + θ2 , x2 = p1 = ẋ1 , x3 = z2 = θ1 , x4 = p2 = θ̇1 .
5.3. Control del Péndulo con Disco Inercial 113
En la figura 5.6 se muestra la respuesta en lazo cerrado del sistema y se puede observar
que el estado θ1 converge a cero más rápido que el estado θ2 . Esto significa que,
mientras la posición angular de la rueda decrece, la posición angular del péndulo se
mueve hacia una vecindad del origen. Y, ya que el péndulo esta muy cerca del origen,
la acción de control regula la dinámica de la rueda.
Capı́tulo 5. Control de Sistemas Subactuados tipo Péndulo Invertido
114 por funciones de Saturación Anidadas
En otras palabras, primero la acción de control lleva al péndulo a una vecindad de cero,
mientras la posición angular de la rueda decrece hasta alcanzar su valor mı́nimo para
posteriormente llevar de manera lenta la posición de la rueda al origen. Cabe notar
que la maniobra de control descrita no podrı́a realizarse si se usaran métodos basados
en energı́a, debido a que la posición inferior está fuera del dominio de estabilidad de
este tipo de estrategias [59, 159].
En el segundo experimento se toman las mismas condiciones iniciales, ası́ como los
parámetros fı́sicos y del controlador propuestos en el experimento anterior, excepto
los valores para δ y µk , los cuales se han modificado para tomar los valores de δ = 3,5
y µk = 0,4. En la figura 5.7 se presenta la respuesta en lazo cerrado de todos lo estados
y se puede ver que θ1 y θ̇1 tienen un comportamiento similar al primer experimento
pero con la caracterı́stica que tardan menos tiempo en alcanzar el cero. Sin embargo,
los valores numéricos de θ2 y θ̇2 son más pequeños que en el primer experimento,
esto se debe a que la compensación para el amortiguamiento lineal es directamente
proporcional al numero de vueltas de la rueda, ası́ como a su velocidad angular. Es
decir, si el efecto indeseable del amortiguamiento se incrementa, la acción de control
de la rueda tiene que ser más fuerte para poder realizar la maniobra de control.
Obviamente, si el efecto es más pequeño, se require una acción con menor fuerza.
5.3. Control del Péndulo con Disco Inercial 115
6.1. Introducción
En las ultimas décadas, el sistema Péndulo Esférico Invertido (PEI) ha atraı́do
la atención de los investigadores. Su interés se debe a que el sistema permite probar
diversas estrategias de control. Además de ilustrar una versión académica simplificada
del propulsor de un cohete [19, 70, 71, 175]. En lo que se refiere al control de este
sistema existen en la literatura muchos trabajos dedicados a este tópico [10, 15, 19,
173, 122, 121].
La principal contribución de este capitulo es desarrollar una ley de control para re-
solver el problema de estabilización del PEI. La estrategia de control está basada en
el método de Lyapunov combinado con el Teorema de LaSalle. Con la cual se obtiene
un estabilidad local y asintótica para el sistema en lazo cerrado con un dominio de
atracción muy grande.
117
Capı́tulo 6. Estabilización del Péndulo Esférico Invertido
118 mediante el método de Lyapunov
El resto del capı́tulo se organizará del siguiente modo: En la sección 6.2 se presenta el
modelo normalizado parcialmente linealizado del sistema. La sección 6.3 está dedicada
a construir la función de Lyapunov que permitirá obtener el controlador. Además de
mostrar el análisis de estabilidad del sistema en lazo cerrado . Por último, en la sección
6.4 se muestran algunas simulaciones numéricas. Los resultados del capı́tulo dieron
lugar a una publicación [84].
x
y uy
ux
ẍ = ux ,
ÿ = uy ,
(6.1)
θ̈ = Sθ Cϕ − Sθ Cθ ϕ̇2 − Cθ ux + Sθ Sϕ uy ,
³ ´
ϕ̈ = C12 Cθ Sϕ + 2Sθ Cθ θ̇ϕ̇ − Cθ Cϕ uy ,
θ
1
La obtención del modelo por medio de las ecuaciones de Euler-Lagrange se puede encontrar en
el apéndice A.3.
6.3. Estrategia de control 119
donde x e y son los desplazamientos normalizados del centro de masa de la base móvil
en las direcciones x e y, respectivamente.2 Los ángulos θ y ϕ denotan las rotaciones
alrededor del eje-y y del eje-x. Los sı́mbolos Sx y Cx representan al sen(x) y cos(x).
Las entradas ux y uy son las aceleraciones de la base en cada una de las direcciones.
Entonces, podemos escribir el sistema anterior de la siguiente manera:
con q = (x, y, θ, ϕ, ẋ, ẏ, θ̇, ϕ̇)T y u = [ux , uy ]T . Cabe notar que el sistema está bien
definido para todo θ ∈ Is = (−π/2, π/2).
1 1 k1 k2
V (q) = ξ˙2 + µ̇2 + ξ 2 + µ2 + lφ(q), (6.3)
2 2 2 2
donde {k1 , k2 , l} son constantes estrictamente positivas y la función φ(q) se escogerá tal
que:3
∂
∂q
φ(q)g(q)u = ux ξ˙ + uy µ̇, ∂
∂q
φ(q)f (q) = 0. (6.4)
Por consiguiente, para solucionar las ecuaciones anteriores, proponemos a φ tal que
∂φ/∂ ẋ = ẋ y ∂φ/∂ ẏ = ẏ. Y de la ecuación de la izquierda de (6.4), después de realizar
algunas manipulaciones, se obtiene lo siguiente
ξ˙ = (ẋ − Cθ ∂φ
∂ θ̇
), µ̇ = (ẏ − Cϕ Cθ ∂∂φϕ̇ + Sθ Sϕ ∂φ
∂ θ̇
). (6.5)
0
g1 (θ)θ̇ = −Cθ ∂φ
∂ θ̇
,
(6.6)
∂
g (θ, ϕ)θ̇
∂θ 2
+ ∂
g (θ, ϕ)ϕ̇
∂ϕ 2
= Sθ Sϕ ∂φ
∂ θ̇
− Cϕ Cθ ∂∂φϕ̇ .
h1 2 h2 2 2 ẋ 2 ẏ 2
φ(q) = θ̇ + Cθ ϕ̇ + + + w(θ, ϕ), (6.7)
2 2 2 2
donde la función escalar w(θ, ϕ), y las constantes h1 y h2 se determinarán ensegui-
da. Entonces, sustituyendo a φ dada en (6.7), en la ecuación de la derecha de (6.4),
³ ´
3 ∂ ∂w ∂w ∂w ∂w ∂w ∂w ∂w ∂w
Recuerde que ∂q w(q) = ∂x , ∂y , ∂θ , ∂ϕ , ∂ ẋ , ∂ ẏ , ∂ θ̇ , ∂ ϕ̇ .
6.3. Estrategia de control 121
obtenemos
ϕ̇2 θ̇Cθ Sθ (−h1 + h2 ) = 0,
∂w (6.8)
ϕ̇(h2 Cθ Sϕ + ∂ϕ
) = 0,
∂w
θ̇(h1 Sθ Cϕ + ∂θ
) = 0.
Por lo tanto, h1 = h2 = h y w(θ, ϕ) = h(Cθ Cϕ − 1), donde h = −kp y kp > 0.
El siguiente lema proporciona las condiciones suficientes para garantizar que la función
candidata de Lypuanov sea positiva.
ẋ 2 ẏ 2 kp 2 kp 2 2
φ(q) = + − θ̇ − Cθ ϕ̇ + kp (1 − Cθ Cϕ ). (6.9)
2 2 2 2
Y supongamos que
−1 − l + kp > 0 (6.10)
ξ = x + kp Sθ µ = y + kp Cθ Sϕ . (6.12)
Entonces, utilizando la relación (6.13), se propone la ley de control tal que se cumplan
las siguientes expresiones:
à !
∂ ξ˙ ∂ ξ˙ ˙
f (q) + g(q) + (l, 0) u + k1 ξ = −ξ, (6.14)
∂q ∂q
y
µ ¶
∂ µ̇ ∂ µ̇
f (q) + g(q) + (0, l) u + k2 µ = −µ̇, (6.15)
∂q ∂q
con lo cual define a V̇ como:
V̇ (q) = −ξ˙2 − µ̇2 . (6.16)
Comentario 6.3.2 De acuerdo con las condiciones del lema 6.3.1, se deduce que la
matriz
" # " #
∂ ξ̇
∂q
g(q) + (l, 0) 1 + l − kp Cθ2 kp Cθ Sθ Sϕ
N (θ, ϕ) = ∂ µ̇
= ,
∂q
g(q) + (0, l) kp Cθ Sθ Sϕ 1 + l − kp Cϕ2 − kp Sθ2 Sϕ2
(6.17)
Evidentemente de la definición de α (ver lema 6.3.1) se deduce que det N (θ, ϕ) > 0,
para todo θ, ϕ ∈ Iα . Por lo tanto, el controlador propuesto en (6.14) y (6.15) no tiene
singularidades cuando θ, ϕ ∈ Iα .
6.3. Estrategia de control 123
k1 k2
V (q0 ) < Vs = lkp Sα2 + (kp Sα )2 + (kp Cα Sα )2 . (6.19)
2 2
y sustituyendo
ξ¨ = ∂ ξ̇
∂q
(f (q) + ∂ ξ̇
∂q
g(q)u)
∂ µ̇ ∂ ξ̇
µ̈ = ∂q
(f (q) + ∂q
g(q)u),
en la ecuación (6.22), obtenemos que k1 ξ + lux = 0 y k2 µ + luy = 0. Por tanto, si
ux = ux y uy = uy son constantes en S, se tiene que ξ y µ son constantes.4 Ahora,
supongamos que ux 6= 0 y que uy 6= 0, entonces, de las dos primeras ecuaciones de
(6.1) obtenemos que ẍ = ux y que ÿ = uy , y obviamente, las constantes ux y uy deben
ser cero, bajo la suposición que las variables {x, y, ẋ, ẏ} están acotadas en el conjunto
S.
Por consiguiente, del Teorema de LaSalle garantizamos que todas la soluciones en lazo
cerrado que inician en Ω convergen asintóticamente hacia el conjunto invariante más
4
z denota que z es una constante en el conjunto S.
5
Recuerde que ux = 0 y uy = 0 en S.
6.4. Simulaciones numéricas 125
k1 = 1 k2 = 1,5 kp = 5 l = 1 .
Además, las condiciones iniciales se han seleccionado como cero, excepto los ángulos
definidos como θ0 = 0,5[rad] y ϕ0 = −0,5[rad]. La figura 6.2 muestra la respuesta
en lazo cerrado de los ángulos y sus derivadas. De igual forma, en la figura 6.3 se
puede observar el comportamiento en lazo cerrado de las posiciones y sus respectivas
velocidades.
Como podemos ver, la ley de control encierra al péndulo en el origen por medio de
movimientos suaves, mientras que la base inicia su movimiento de tal forma que las
oscilaciones tiene amplitudes grandes pero con movimiento suaves. Y, en ambos casos
se reducen gradualmente sus amplitudes.
Capı́tulo 6. Estabilización del Péndulo Esférico Invertido
126 mediante el método de Lyapunov
Figura 6.2 Respuesta en lazo cerrado de las variables angulares del sistema.
Figura 6.3 Respuesta en lazo cerrado de las posiciones y velocidades del sistema.
7.1. Introducción
Los sistemas mecánicos que vibran constituyen una importante clase de sistemas
dinámicos: edificios, puentes, suspensiones de coche, marcapasos, generadores de vien-
to y altavoces son algunos ejemplos comunes de este tipo de sistemas.
En términos fı́sicos todos los sistemas que vibran tiene un componente que almacena
energı́a y otro que la transforma. Por lo tanto, el comportamiento de estos puede ser
descrito en término de cambios energéticos, es decir, el movimiento del sistema resul-
ta de la conversión de energı́a. Por razones teóricas y tecnológicas el control de este
tipo de sistemas ha resultado un campo de investigación importante, debido a que
ha proporcionado diversas soluciones a problemas que involucran comportamientos
oscilatorios, como por ejemplo el control de vibraciones se ha aplicado para atenuar
las oscilaciones no deseadas en edificios producidas por fuerzas externas; tales como
fuertes vientos o terremotos [13, 55, 95, 137, 176], ası́ como en suspensiones de autos
127
Capı́tulo 7. Control del comportamiento oscilatorio de un sistema
128 mecánico no lineal: Caso Péndulo Invertido con Masa Móvil
El resto del capı́tulo se organiza como sigue. En la sección 7.2, se presenta el modelo
matemático no-lineal del sistema obtenido por medio de las expresiones de Euler-
Lagrange.
El controlador lineal Proporcional Derivativo (PD) se expone en la sección 7.3. Final-
mente en la sección 7.4 se muestran las simulaciones del comportamiento del sistema
en lazo cerrado. Los resultados expuestos en este capı́tulo dieron lugar a una publi-
cación [4] y pretenden mostrar una ejemplo sencillo de la importancia que tiene el
estudio del Sistema Péndulo Invertido.
Para describir el movimiento del péndulo el origen del marco inercial es escogido
en el punto O. Los ejes x e y corresponden a las direcciones horizontal y vertical,
respectivamente. Y el vector q = [r, θ]T describe las coordenadas generalizadas, donde:
r es el desplazamiento de la masa m medido desde el punto O y θ denota el ángulo
formado por el eje y y el eje OC.
Entonces, la energı́a cinética y potencial del sistema son definidas como:
1 1 ³ ´
Kc = I0 θ̇2 + m ṙ2 + r2 θ̇2 (7.1)
2 2
y
κ1 2
Kp = M grc (cos θ − 1) + mgr cos θ + θ (7.2)
2
1
Se supone que el sistema es estable en el sentido de Lyapunov (pero no asintóticamente estable).
Capı́tulo 7. Control del comportamiento oscilatorio de un sistema
130 mecánico no lineal: Caso Péndulo Invertido con Masa Móvil
L(q, q̇) = Kc − Kp
f = mg + v (7.4)
donde
" # " # " #
m 0 0 −mrθ̇ 1
M (q) = C(q, q̇) = G=
0 mr2 + I0 mrθ̇ mrṙ 0
y
κ1 2
Ki (q) := −κ3 (1 − cos θ) − κ2 r(1 − cos θ) + θ
2
con κ2 = mg y κ3 = M grc .
" #
0 −mrθ̇
H=
mrθ̇ 0
P3: El operador v → ṙ es pasivo.
La propiedades P1 y P2 son compartidas por cualquier sistema Euler-Lagrange.
Además, para probar la propiedad P3 definimos la siguiente función de almacenamien-
to.
1
E(q, q̇) = q̇ T M (q)q̇ + Ki (q) (7.6)
2
Calculando la derivada con respecto al tiempo de (7.6) y usando las propiedades P1
y P2.
Ė = v ṙ
perturbaciones externas. Entonces, para atenuar los efectos indeseables de dichas per-
turbaciones se propone un controlador que haga al sistema en lazo cerrado asintótica-
mente estable alrededor del origen x.
κ1 > κ3 + κ2 (r + ε) (7.7)
Comentario 7.3.1 La desigualdad (7.7) significa que la fuerza del resorte es mayor
que la fuerza debido a la gravedad de todo el sistema para cualquier posición de m.
Es decir, A1 es una condición estructural que está relacionada con la rigidez interna
del sistema.
1
ET (x) = ET (q, q̇) = q̇ T M (q)q̇ + Km (q) (7.9)
2
donde Km es la energı́a potencial modificada definida como:
kp
Km (q) = Ki (q) + (r − r)2 (7.10)
2
con kp > 0.
Tomando en cuenta las propiedades de pasividad del sistema (7.5), la primera derivada
de ET a lo largo la trayectoria del sistema esta dada por
Y, debido a que se necesita que la derivada sea definida negativa, la entrada de control
v se propone como una ley de control proporcional derivativa
v = −kp (r − r) − kd ṙ (7.13)
Entonces del hecho, que ET es definida positiva y ĖT es semi-definida negativa pode-
mos establecer la estabilidad del punto de equilibrio x en el sentido de Lyapunov. Es
decir, q y q̇ están acotados.
Lema 7.3.5 Considere el sistema en lazo cerrado formado por las ecuaciones (7.5)
y (7.13).
De acuerdo con la suposición A1 y la restrición del parámetro kp definida como:
κ2
(1 − cos θ) < ε (7.15)
kp
y si las condiciones iniciales x0 = (q0 , q˙0 ); con q0 ∈ Q satisfacen
ET (x0 ) ≤ E (7.16)
7.3. Control lineal PD 135
E =max{c
b > 0 : Km (q) = c, con q ∈ Q} (7.17)
³ ε ´
E = Km r + , θ = λεκ2 (1 − cos θ). (7.18)
λ
donde λ > 1.
Entonces, podemos garantizar que:
con q(t) ∈ Q; para t ≥ 0 (La demostración de este lema se puede ver en el apéndice
C.4).
Comentario 7.3.6 El conjunto Ω tiene la propiedad que todas las soluciones del
sistema en lazo cerrado que inicia en Ω permanece en Ω por todo el tiempo.
En particular, todas las condiciones iniciales x0 = (q0 , q̇0 ) tal que ET (x0 ), E, con
q0 ∈ Q. Esto implica que q(t) ∈ Q para todo el tiempo.
n o
Γ = x ∈ Ω : ĖT (x) = 0 = {x ∈ Ω : ṙ = 0} (7.21)
y
(mr2 )θ̈ − (κ3 + κ2 r) sen θ + κ1 θ = 0 (7.23)
De las ecuaciones anteriores podemos decir que la trayectoria que satisface a (7.22),
se obtienen cuando θ y θ̇ son iguales a cero en el conjunto Γ, siendo |θ| < θ < π/2,
κ2 > 0 y r > 0. Por lo tanto, se concluye que el conjunto invariante más grande
contenido en Γ ⊂ Ω, es decir, M está constituido por el punto de equilibrio x = (r =
r, θ = 0, ṙ = 0, θ̇ = 0). Y de acuerdo con el Teorema de LaSalle todas las trayectorias
que comienzan en Ω convergen asintóticamente al conjunto M definido por el punto
x.
Proposición 7.3.7 De acuerdo con la suposiciones del lema 7.3.5, del sistema (7.3)
en lazo cerrado, con
F = mg − kp (r − r) − kd ṙ
7,43 < kp
Para asegurar que las condiciones iniciales se encuentren dentro del máximo dominio
de atracción, los parámetros λ y kp se escogen de acuerdo a las relaciones (7.18) y
(C.19), respectivamente. Como λ = 4,1 y kp = 30,46. Por lo tanto, para mantener
Capı́tulo 7. Control del comportamiento oscilatorio de un sistema
138 mecánico no lineal: Caso Péndulo Invertido con Masa Móvil
Figura 7.3 Simulación del sistema en lazo cerrado para la condición inicial q(0) =
(0,6, 0,8) y q̇(0) = 0.
Figura 7.4 Simulación del sistema en lazo cerrado para la condición inicial x(0) =
(0,7, 0,6, 0, 2).
Capı́tulo 8
Conclusiones
Llegado a este punto de la tesis se puede afirmar que, en función de los objetivos,
el control de los Sistemas tipo Péndulo Invertido planteado y presentado en este
documento es una alternativa más en el estudio de la Teorı́a de Control no lineal, ya
que provee una serie de mecanismos y herramientas para realizar el control de una
clase de sistemas subactuados, considerando que no sólo pueden ser aplicados a este
tipo de sistemas.
Como primer aportación se presentó una estrategia de control para estabilizar el sis-
tema Péndulo Invertido sobre un Carro alrededor del punto de equilibrio inestable,
suponiendo que el péndulo está inicialmente por encima del plano horizontal.
Esta estrategia se basa en encontrar una linealización parcial por retroalimentación
del sistema, para posteriormente aplicar un adecuado ajuste de modelo. La idea pri-
mordial del método es encontrar una ley de control que transforme el modelo parcial-
mente linealizado en un sistema denominado objetivo, el cual tiene ciertas propiedades
de estabilidad. Para realizar lo anterior, fue necesario solucionar dos condiciones de
ajuste (matching conditions), relacionadas con las energı́as potencial y cinética del
sistema objetivo. Podemos mencionar que las condiciones de ajuste obtenidas son
140
141
Es importante comentar que en el caso del Péndulo con Disco Inercial, debido a que
está fuertemente amortiguando, no es posible asegurar la estabilización del sistema,
si se usaran estrategias como el moldeo de energı́a o aquellas basadas en pasividad
[78, 156].
de forma local alrededor del punto de equilibrio inestable suponiendo que el péndu-
lo se encuentra inicialmente por encima del plano horizontal. Esta ley de control
tiene un dominio de atracción que puede ser calculado a partir del lema 6.3.1. Cabe
destacar que la obtención del controlador se basó en la construcción de una función
de Lyapunov, cuya derivada resultó ser disipativa con respecto a las variables auxi-
liares definidas en (6.12). El análisis de convergencia fue llevado a cabo mediante el
Teorema de LaSalle y el desempeño de la estrategia de control se evaluó por medio
simulaciones numéricas.
1
El péndulo está anclado al pivote por medio de un resorte torsional que mantiene el sistema en
la posición vertical estable, como consecuencia, el sistema es estable en el sentido de Lyapunov.
8.1. Desarrollos futuros 143
Consideremos las coordenadas del sistema como (x, y), ası́ como las coordenadas del
centro de masa del péndulo (xG , yG ) definidas en (A.1).
144
A.1. Sistema Péndulo Invertido sobre un Carro 145
mg
M
f
Donde:
xG = x + l sen θ
(A.1)
yG = l cos θ
Como primer paso para aplicar el método de Euler-Lagrange es necesario obtener la
energı́a cinética y potencial del sistema que serán usadas para calcular la función de
Lagrange ó Lagrangiano (L).
1
K1 (q) = M ẋ2 (A.2)
2
La energı́a cinética del péndulo K2 (q) esta dada por:
1 1 2 1
K2 (q) = mẋ2G + mẏG + I θ̇2 (A.3)
2 2 2
Apéndice A. Modelos Dinámicos de Sistemas Subactuados
146 tipo Péndulo Invertido
1 1
K(q) = K1 (q) + K2 (q) = (M + m)ẋ2 + mlẋθ̇ cos θ + (I + ml2 )θ̇2 (A.4)
2 2
La energı́a potencial del sistema V (q) es definida como:
L = K(q) − V (q)
Entonces,
1 1
L = (M + m)ẋ2 + mlẋθ̇ cos θ + (I + ml2 )θ̇2 − mgl(cos θ − 1) (A.6)
2 2
Las ecuaciones del sistema se derivan de la ecuación de Euler-lagrange definida como:
µ ¶
d ∂L(q, q̇) ∂L(q, q̇)
− =F (A.7)
dt ∂ q̇ ∂q
donde, q = (q1 , · · · , qn )T representan las coordenadas generalizadas, una para cada
grado de libertad del sistema y F = (f1 , · · · , f n)T denotan las fuerza externas apli-
cadas al sistema.
∂L
= (M + m)ẋ + mlθ̇ cos θ
∂ ẋ
∂L
=0
∂x
∂L
= mlẋ cos θ + (I + ml2 θ̇)
∂ θ̇
∂L
= mgl sen θ − mlẋθ̇ sen θ
∂θ
A.1. Sistema Péndulo Invertido sobre un Carro 147
Y sustituyendo para cada variable, cada uno de los términos anteriores en la ecuación
(A.7), se obtiene:
µ ¶
d ∂L ∂L
− =f
dt ∂ ẋ ∂x
d ³ ´
(M + m)ẋ + ml cos θ̇ cos θ − 0 = f
dt
µ ¶
d ∂L ∂L
− =0
dt ∂ θ̇ ∂θ
d ³ 2
´
mlẋ cos θ + (I + ml θ̇) − mgl sen θ + mlẋθ̇ sen θ = 0
dt
Por lo tanto, las ecuaciones (A.10) y (A.11) describen el movimiento del Sistema
Péndulo Invertido sobre un Carro y constituyen el modelo matemático no lineal del
sistema.
Además, el sistema formado por las expresiones (A.10) y (A.11) puede ser escrito en
la forma estándar de los Sistemas de Lagrange definido como:
Por otra parte, las estrategias de control propuestas en este trabajo son aplicadas
a un modelo normalizado del sistema (capı́tulos 4 y 5). Con el fin de simplificar
la manipulación algebraica en los análisis y generalizarlo, es decir, no limitarlo a
parámetros especı́ficos. Esto se logra por medio de una serie de procedimientos al-
gebraicos que permiten normalizar las ecuaciones (A.10) y (A.11) (es decir manejar
cantidades adimensionales) por lo que es necesario definir las siguientes relaciones de
transformación [6].
p
q = x/l, u = f /mg, dτ = dt g/l δ = M/m (A.16)
Entonces, para realizar la simplificación del sistema con las relaciones anteriores, es
necesario obtener las diferenciales con respecto al tiempo adimensional τ , las cuales
se definen como sigue [85].
1
q̇ = ẋ √ (A.17a)
gl
ẍ
q̇ = (A.17b)
g
r
g
θ̇ = θ̇ (A.18a)
l
g
θ̈ = θ̈ (A.18b)
l
A.1. Sistema Péndulo Invertido sobre un Carro 149
Es importante recordar que las variables q̇ y q̈ son las derivadas con respecto al tiempo
adimensional τ . Ası́ como, para evitar confusiones, las variables del lado derecho de
(A.18a) y (A.18b) son la primera y segunda derivada con respecto a τ , respectiva-
mente.
¡ ¢g
mglq̈ cos θ + ml2 θ̈ − mgl sen θ = 0
l
Dividiendo entre mgl se obtiene la ecuación normalizada
El sistema normalizado que describe al sistema péndulo invertido sobre un carro esta
formado por las ecuaciones (A.19) y (A.20) como sigue:
q̈ cos θ + θ̈ − sen θ = 0
(A.21)
(1 + δ)q̈ − θ̇2 sen θ + (cos θ)θ̈ = u
Apéndice A. Modelos Dinámicos de Sistemas Subactuados
150 tipo Péndulo Invertido
1 h i
2
ẍ = m sen θ(l θ̇ − g cos θ) + f (A.22)
M + m sen2 θ
1 £ ¤
θ̈ = 2
−mlθ2 sen θ cos θ + (M + m)g sen −f cos θ (A.23)
l(M + m sen θ)
las cuales tienen un punto de equilibrio inestable en (x, ẋ, θ, θ̇)T = (0, 0, 0, 0)T .
A continuación utilizaremos el modelo lineal del sistema para mostrar que el sistema
es inestable en lazo abierto. Para lo cual obtendremos la linealización del modelo no
lineal representado en (A.22) alrededor del punto de equilibrio inestable.1 .
x1 = x x2 = ẋ
x3 = θ x4 = θ̇
Por lo tanto, para mostrar que el sistema en lazo abierto es inestable es necesario
conocer la ubicación de polos de la función de transferencia en lazo abierto, que para
1
Para una explicación más detallada de la obtención del modelo lineal del péndulo invertido
revisar [85, 148].
A.2. Sistema Péndulo con Disco Inercial 151
Esto significa, que debemos calcular los valores propios de A utilizando la siguiente
ecuación:
det(sI − A) (A.26)
1
x
l2
m 1, I 1
l1
I2
m2
Entonces, como primer paso se define la energı́a cinética del péndulo como:
1 2
K1 (q) = (m1 l22 + I1 )θ˙1
2
y la energı́a cinética del disco de la forma:
1 2 1
K2 (q) = m2 l12 θ˙1 + I2 (θ˙1 + θ˙2 )2
2 2
Por lo tanto, la energı́a cinética total es:
1 2 1 2
K(q) = K1 (q) + K2 (q) = (m1 l22 + m2 l12 + I1 + I2 )θ˙1 + I2 θ˙1 θ˙2 + I2 θ˙2 (A.27)
2 2
1 2 1 2
L = (m1 l22 + m2 l12 + I1 + I2 )θ˙1 + I2 θ˙1 θ˙2 + I2 θ˙2 − ηg(cos θ1 − 1) (A.28)
2 2
A.2. Sistema Péndulo con Disco Inercial 153
∂L
= (m1 l22 + m2 l12 + I1 + I2 )q˙1 + I2 q˙2
∂ θ˙1
∂L
= ηg sen θ1
∂θ1
∂L
= I2 q̇1 + I2 q̇2
∂ θ˙2
∂L
=0
∂θ2
µ ¶
d ∂L∂L
=0 −
dt ∂ θ˙1
∂θ1
d ¡ ¢
(m1 l22 + m2 l12 + I1 + I2 )q˙1 + I2 q˙2 − ηg sen θ1 = 0
dt
¡ ¢
I1 + I2 + m1 l22 + m2 l12 θ̈1 + I2 θ̈2 − ηg sen θ1 = 0 (A.30)
µ ¶
d ∂L ∂L
− =0
dt ∂ θ˙2 ∂θ2
d
(I2 q̇1 + I2 q̇2 ) − 0 = τ
dt
D (q) q̈ + g (q) = u
Donde
" # " #
θ1 I1 + I2 + m1 l22 + m2 l12 I2
q = D (q) = (A.34)
θ2 I2 I2
" # " #
−ηg sen θ1 0
g (q) = y u = (A.35)
0 τ
Además, las velocidades del sistema asociadas con xGM y xGm , son de la siguiente
forma:
ẋ ẋ + l cos θθ̇
ẋGM =
ẏ , ẋGm = ẏ − l sen θ sen ϕθ̇ + l cos θ cos ϕϕ̇
0 −l sen θ cos ϕθ̇ − l cos θ sen ϕϕ̇
M
x
y
fy
fx
Para evitar las estrictas condiciones de la linealización por realimentación [97, 133,
165], ası́ como la inconveniencia de no proporcionar elementos constructivos para el
diseño de la ley de control, se desarrollaron nuevas lı́neas de investigación entre las
que destaca el trabajo de M. Spong [184] que consiste en linealizar parcialmente los
sistemas mecánicos subactuados usando un cambio variable en la señal de control.
Enseguida presentamos sus resultados.
es una matriz simétrica definida positiva, ası́ como las funciones h1 (q, q̇) ∈ Rl y
h2 (q, q̇) ∈ Rm contienen los términos Centrı́fugos y de Coriolisis del sistema, los
157
158 Apéndice B. Linealización Parcial por Retroalimentación
siendo m11 (q) invertible, debido a que la matriz M (q) es definida positiva. Por lo
tanto, podemos resolver de la ecuación (B.3) a q̈1 como sigue:
q̈1 = −m−1 −1
11 (q)m12 (q)q̈2 − m11 (q)[h1 (q, q̇) + φ1 (q)]. (B.4)
donde los términos m̄22 (q), h̄2 (q, q̇) y φ̄2 (q) son de la forma:
Además, para poder definir un controlador u es necesario que la matriz m̄22 (q) de
m × m sea simétrica y definida positiva. La cual puede ser calculada de forma simple
con la siguiente relación [82, 83]
m̄22 = T T M T (B.6)
q̈2 = u (B.10)
q̇1 = q̇1
q̈1 = f (q, q̇) + g(q)u
(B.11)
q̇2 = q̇2
q̈2 = u
donde,
g(q) = −m−1
11 (q)m12 (q)
De la discusión anterior podemos concluir que la propiedad principal del sistema sub-
actuado (B.11) es que al aplicar la linealización parcial por retroalimentación la nue-
va entrada de control u transforma la dinámica del sistema (B.1), en el subsistema
160 Apéndice B. Linealización Parcial por Retroalimentación
(q1 , q̇1 ) (subsistema no lineal) y en el subsistema (q2 , q̇2 ) (subsistema lineal). Por lo
cual se puede escribir como:
Demostraciones de lemas y
comentarios adicionales
£ ¤ ∂Vd
G⊥ Md−1 ∂x
∂
Vd (x) − F (θ) = ∂θ
(1 − µ2 cos θ)
. (C.1)
+ ∂V
∂q
d
(−µ2 + µ3 cos θ) + sen θ = 0
1
Vd (x) = k1 − ln(−1 + µ2 cos θ) + Φp (s) (C.2)
µ2
es una solución de la EDP descrita en (C.1), donde k1 es una constante, s es una
variable auxiliar definida en (4.14), y Φp es una función arbitraria.1
1
La EDP fue solucionada con ayuda del programa Mathematica TM .
161
162 Apéndice C. Demostraciones de lemas y comentarios adicionales
¯ ¯
∂Vd ¯ ∂ 2 Vd ¯
Vd (0) = 0, ∂x x=0
= 0, ∂x2 ¯
> 0. (C.3)
x=0
k1 = ln(−1 + µ2 )/µ2 , Φ0p (0) = 0, Φ00p (0) > 0, µ2 > 1, µ3 > µ22 . (C.4)
Entonces, sustituyendo la matriz Md−1 definida en el lema 4.3.2 se obtienen dos ecua-
ciones lineales, de las cuales se puede observar fácilmente, que la matriz Kd propuesta
satisface la ecuación (C.7).
Las condiciones de ajuste fueron solucionadas fácilmente, ya que sólo hemos soluciona-
do una EDP y un conjunto de ecuaciones algebraicas que estaban relacionadas con
C.2. Comentario 4.2.2 163
Md ẍ = −γHd ẋ − Hp x (C.8)
(µ2 −µ3 )2 (−1+µ2 )(−µ2 +µ3 )
2 2
(µ22 −µ3) (µ22 −µ3)
Hd = (−1+µ2 )(−µ2 +µ3 ) (−1+µ2 )2
2 2
(µ22 −µ3) (µ22 −µ3)
y Hp es una matriz definida positiva definida por:
−1+µ2 +kp µ22 −2kp µ2 µ3 +kpµ23 kp(−µ2+µ3)
(−1+µ2 )2
Hp = kp(−µ2+µ3)
−1+µ2
−1+µ2
kp .
Las afirmaciones anteriores son sencillas de demostrar, ya que el det(Hd )=0 y det(Hp )=
kp /(−1 + µ2 ) > 0, con µ2 > 1. Ahora, introduciendo la siguiente función candidata a
Lyapunov:
164 Apéndice C. Demostraciones de lemas y comentarios adicionales
1
V = ẋT Md ẋ + xT Hp x,
2
cuya derivada con respecto al tiempo alrededor de la trayectoria (C.8), tiene la si-
guiente forma:
V̇ = −γ ẋT Hd ẋ.
k1
Kp (q) = (x + kp Sθ )2
2 (C.11)
k2
+ (y + kp Cθ Sϕ )2 + lkp (1 − Cθ Cϕ )
2
y Kc define la energı́a cinética
1³ ´2
Kc (q) = ẋ + kp Cθ θ̇
2
1³ ´2
+ ẏ + kp (Cθ Cϕ ϕ̇ − Sθ Sϕ θ̇) (C.12)
2
l l lkp 2 lkp 2 2
+ ẋ2 + ẏ 2 − θ̇ − C ϕ̇
2 2 2 2 θ
∂Km
(q) = −(κ3 + κ2 r) sen θ + κ1 θ = 0 (C.17)
∂θ
y
∂Km
(q) = −κ2 (1 − cos θ) + kp (r − r) = 0 (C.18)
∂r
Podemos concluir de A1, que la solución de (C.17) es dada por θ = 0. Por consi-
guiente, los puntos extremos en la dirección de θ son definidos como q1 = (r + ε, 0)
C.4. Demostración del lema 7.3.5 167
kp
Km (q3 ) = Km (q4 ) = λκ2 (1 − cos θ)ε = ε.
2
Entonces, después de solucionar la ecuación (C.18) y forzando a que las dos soluciones
pertenezcan a ∂Q, se tiene que q = (r∗ , ±θ) ∈ ∂Q; donde r∗ = r + κ2 (1 − cos θ)/kp .
Por lo tanto, kp se define como:
λκ2 (1 − cos θ)
kp = (C.19)
ε
con λ > 1 y E = kp ε2 /2, por lo cual los valores de r∗ y E se pueden expresar como:
1
Km (q(t)) ≤ Km (q(t)) + q̇ T (t)M q̇(t) ≤ ET (x(t)) ≤ ET (x0 ) ≤ E; ∀t ≥ 0.
2
De la desigualdad anterior obtenemos que q(t) ∈ SE ⊂ Q, para todo t ≥ 0. Por lo
tanto, el lema 7.3.5 se cumple.
3
∂Q representa el conjunto de todos los puntos frontera de Q.
Apéndice D
Publicaciones y congresos
generados del trabajo de
investigación
Publicaciones en Revistas
168
169
Participación en Congresos
170
REFERENCIAS 171
[15] X. Albouy and L. Praly. On the use of dynamic invariants and forwarding for
swinging up a spherical inverted pendulum. In Proceedings of 39th IEEE Con-
ference on Decision and Control, volume 2, pages 1667–1672, Sydney, Australia,
2000.
[18] D. Angeli. Almost global stabilization of the inverted pendulum via continuous
state feedback. Automatica, 37(7):1103–1108, 2001.
[21] K. J. Åström. Adaptive control around 1960. IEEE, Control Systems Magazine,
16(3):44–49, 1996.
[26] D. Auckly and L. Kapitanski. On the λ equations for matching control laws.
SIAM J. Control Optim, 41(5):1372–1388, 2002.
[28] M. Barão and J. M. Lemos. Nonlinear control of HIV-1 infection with a singular
perturbation model. Biomedical Signal Processing and Control, 2(3):248–257,
2007.
[29] R. Bellman. Dynamic Programming. New Jersey: Princeton Univ. Press, 1957.
[32] G. Blankenstein, R. Ortega and A. Van der Schaft. The matching conditions of
controlled lagrangians and IDA passivity based control. International Journal
of Control, 75(9):645–665, 2002.
[39] D. J. Block. Mechanical design and control of the pendubot. Master´s Thesis,
University of Illinois, Urbana-Champaign, IL,USA, 1996.
[40] D. J. Block and M. W. Spong. Mechanical design & control of the pendubot.
In SAE 46th annual Earthmoving Industry Conference, Peoria, IL, USA, 1995.
[41] H. W. Bode. Feedback amplifier design. Bell Syst. Technol. J., 19:42, 1940.
[42] H. W. Bode. Network Analysis and Feedback Amplifier Design. New York: Van
Nostrand, 1945.
[50] P. Castillo, R. Lozano and A. Dzul. Modelling and Control of Mini Flying
Machines. Springer-Verlag, Berlin, 2005.
[53] C. T. Chen. Linear System Theory and Design. Oxford University Press, 3rd
edition, 1998.
[58] W. R. Evans. Graphical analysis of control system. Trans. Am. Inst. Electr.
Eng., 67:547–551, 1948.
[59] I. Fantoni and R. Lozano. Nonlinear Control for the Underactuated Mechanical
Systems. Springer-Verlag, London, UK, 2002.
[60] I. Fantoni and R. Lozano. Stabilization of the Furuta pendulum around its
homoclinic orbit. International Journal of Control, 45(6):390–398, 2002.
[62] I. Fantoni, R. Lozano and F. Mazenc. Control of the PVTOL aircraft using the
forwarding technique and a Lyapunov approach. In European Control Confer-
ence, ECC2001, pages 3032–3037, Porto, Portugal, 2001.
[63] I. Fantoni, R. Lozano and M. Spong. Energy based control of the pendubot.
IEEE Trans. on Automatic Control, 45(4):725–729, 2000.
[64] I. Fantoni, R. Lozano and M. W. Spong. Passivity based control of the pen-
dubot. In Proceedings of the 1999 American Control Conference, volume 1,
pages 268–272, San Diego, California, USA, 1999.
REFERENCIAS 177
[66] R. Fierro, F. L. Lewis and A. Lowe. Hybrid control for a class of underactuated
mechanical systems. IEEE Transactions on Systems, Man and Cybernetics,
Part A, 29(6):649–654, 1999.
[71] K. Furuta and M. Iwase. Swing-up time analysis of pendulum. Bulletin of the
Polish Academy of Sciences Technical Sciences., 52(3), 2004.
[79] F. Gordillo, J. A. Acosta and J. Aracil. A new swing-up law for the furuta
pendulum. International Journal of Control, 76(8):836–844, 2003.
[80] F. Gordillo and J. Aracil. A new controller for the inverted pendulum on a cart.
International Journal of Robust and Nonlinear Control, 18(17):1607–1621, 2008.
[81] F. Gordillo, J. Aracil and J. A. Acosta. Control strategy for the cart-pendulum
system. In Proceedings of Controlo 2004, volume 6, pages 214–219, Faro, Por-
tugal, 2004.
[82] Y. Gu and N. Loh. Control system modeling for robot manipulators by use of a
canonical transformation. In Proceedings. 1987 IEEE International Conference
on Robotics and Automation., volume 4, pages 484– 489, 1987.
[88] J. Hauser and R. Murray. Nonlinear controllers for non-integrable systems: The
acrobot example. In Proc. American Control Conference, pages 669–671, 1990.
[89] J. Hauser, S. Sastry and P. Kokotovic. Nonlinear control via approximate input-
output linearization: the ball and beam example. IEEE Transactions on Auto-
matic Control, 37(3):392–398, 1992.
[90] J. Hauser, S. Sastry and G. Meyer. Nonlinear control design for slightly nonmi-
nimum phase system: Application to v/stol aircraft. Automatica, 28(4):665–679,
1992.
[91] T. Henmi, M. Deng and A. Inoue. Swing-up control of the acrobot using a new
partial linearization controller based on the Lyapunov Theorem. In Procee-
dings of the 2006 IEEE International Conference on Networking, Sensing and
Control, 2006. ICNSC ’06., pages 60–65, Ft. Lauderdale, FL, 2006.
[93] T. Hoshino, K. Kawai and K. Furuta. Stabilization of the triple spherical pen-
dulum - a simultaneous design approach. Automatisierungstechnik, 48:577–587,
2000.
[94] A. Hurwitz. On the conditions under which an equation has only roots with
negative real parts. Mathematische Annalen, 46:273–284, 1895.
[97] A. Isidori. Nonlinear Control Systems. Springer Verlag, London, 3rd edition,
1995.
[101] Z. P. Jiang, D. J. Hill and Y. Guo. Stabilization and tracking via output
feedback for the nonlinear benchmark system. Automatica, 34(7):907–915, 1998.
[103] R. E. Kalman. Contributions to the theory of optimal control. Bol. Soc. Mat.
Mex., 5:102–119, 1960.
[105] R. E. Kalman and J. E. Bertram. Control system analysis and design via the
‘second method’ of Lyapunov I. continuous-time systems. Trans. ASME J.
Basic Eng., pages 371–393, 1960.
[106] R. E. Kalman and R. S. Bucy. New results in lineal filtering and prediction
theory. ASME Trans., Part D (Journal of Basic Engineering), pages 95–108,
1961.
[108] I. Kanellakopoulos and J. Zhao. Tracking and disturbance rejection for the
benchmark nonlinear control problem. In Proceedings of the American Control
Conference, 1995., volume 6, pages 4360–4362, Seattle, WA, USA, 1995.
[110] H. Khalil. Nonlinear Systems. Prentice Hall., Upper Sadler River, NJ, 3rd
edition, 2002.
[114] L. Landau and E. Lifchitz. Curso de fı́sica teórica, Tomo I: Mecánica. Ediciones
MIR, Moscú., 1964.
[116] Wei Li, K.Tanaka and H. O. Wang. Acrobatic control of a pendubot. IEEE
Transactions on Fuzzy Systems, 12(4):549–554, 2004.
[117] F. Lin, W. Zhang and R. D.Brandt. Robust hovering control of a PVTOL air-
craft. IEEE Transactions on Control Systems Technology, 7(3):343–351, 1999.
[120] G. Liu and L. Marconi. High-low gain redesign for a 4 DOF spherical inverted
pendulum. In 17th IFAC World Congress, pages 5921–5926, Seoul, Korea, 2008.
[121] G. Liu, I. Mareels and D. Nesic. Way point tracking of a spherical inver-
ted pendulum. In ICCA 2007, IEEE International Conference on Control and
Automation, 2007.
REFERENCIAS 183
[123] G. Liu, D. Nesic and I. Mareels. Nonlinear stable inversion-based output track-
ing control for a spherical inverted pendulum. In The 6th Asian Control, 2006.
[126] R. Lozano, P. Castillo and A. Dzul. Global stabilization of the PVTOL: real-
time application to a mini-aircraft. Int. Journal of Control, 77(8):735–740,
2004.
[128] R. Lozano, I. Fantoni and D.J. Block. Stabilization on the inverted pendulum
around its homoclinic orbit. System & Control Letter, 40(3):197–204, 2000.
[130] Xiao Qing Ma and Chun-Yi Su. A new fuzzy approach for swing up control of
pendubot. In Proceedings of the 2002 American Control Conference, volume 2,
pages 1001–1006, Anchorage Alaska, USA, 2002.
184 REFERENCIAS
[133] R. Marino and P. Tomei. Nonlinear Control design: geometric, adaptive and
robust. Prentice-Hall, 1995.
[135] P. Martin, S. Devasia and B. Paden. A different look at output tracking: Control
of a vtol aircraft. Automatica, 32(1):101–107, 1996.
[139] O. Mayr. The Originis of Feedback Control. Cambrigde, MA: MIT Press, 1970.
[140] F. Mazenc and L. Praly. Adding integrations, saturated controls, and stabi-
lization for feedforward systems. IEEE Transactions on Automatic Control,
41(11):1559–1578, 1996.
REFERENCIAS 185
[142] T. Miyagawa and Y. Ishida. Neural network-based model reference control for
inverted pendulum. In Proceedings of the IEEE International Conference on
Neural Networks, volume 1, pages 640–644, Perth, WA, Australia, 1995.
[145] S. Nair and N. E. Leonard. A normal form for energy shaping: Application
to the Furuta pendulum. In Proc. of the 41th Conf. on Decision and Control,
volume 1, pages 516–521, Vegas Nev, USA, December 2002.
[147] H. Nyquist. Regeneration theory. Bell Syst. Technol. J., 11:126–147, 1932.
[149] R. Olfati-Saber. Fixed point controllers and stabilization of the cart-pole and
rotating pendulum. In Proc. of the 38th Conf. on Decision and Control, volu-
me 2, pages 1174–1181, Phoenix, Az., 1999.
[160] R. Ortega, A. van der Schaft and B. Maschke. Stability and Stabilization of Non-
linear Systems, volume 246 of LNCIS, chapter Stabilization of port-controlled
Hamiltonian systems via energy balancing, pages 239–260. Springer Berlin,
1999.
[162] R. Ortega, A. J. van der Schaft, I. Mareels and B. Maschke. Putting energy
back in control. IEEE Control Systems Magazine, 21(2):18–31, 2001.
[164] N. Qaiser, N. Iqbal and N. Qaiser. Stabilization of the acrobot via multiple
sliding surface control. In IMCAS’07: Proceedings of the 6th WSEAS Inter-
national Conference on Instrumentation, Measurement, Circuits and Systems,
pages 175–180, Hangzhou, China, 2007.
[168] E. J. Routh. Dynamics of a system of rigid bodies., page 371. Dover, New
York,, 7th edition, 1960.
188 REFERENCIAS
[177] J. Slotine and W. Li. Applied nonlinear control. Prentice Hall, Englewood Cliffs,
N.J., 1990.
[178] E. D. Sontag. Some new directions in control theory inspired by systems biology.
IEE Proceedings Systems Biology, 1(1):9–18, 2004.
[182] M. W. Spong. Swing up control of the acrobot. In 1994 IEEE Int. Conf. on
Robotics and Automation, volume 3, pages 2356–2361, 1994.
[183] M. W. Spong. The swing up control problem for the acrobot. IEEE Control
Systems Magazine, 15(1):49–55, 1995.
[186] M. W. Spong and D. J. Block. The pendubot: a mechatronic system for control
research and education. In Proceedings of the 34th IEEE Conference on Decision
and Control, volume 1, pages 555–556, New Orleans, USA, 1995.
[187] M. W. Spong, P. Corke and R. Lozano. Nonlinear control inertial wheel pen-
dulum. Automatica, 37:1845–1851, 2001.
[190] M. W. Spong and M. Vidyasagar. Robot Dynamics and Control. John Wiley &
Sons, 1989.
[191] Ilaria Taurasi. Inverted pendulum studies for seismic attenuation. Surf final
report, California Institute of Technology, 2005.
[192] A. R. Teel. Global stabilization and restricted tracking for multiple integrators
with bounded controls. System & Control Letter, 18(3):165–171, 1992.
[194] A. R Teel. Semi-global stabilization of the ‘ball and beam’ using ‘output’ feed-
back. In Proceeding of the American Control Conference, San Francisco, CA,
USA, 1993.
[195] A. R. Teel. A nonlinear small gain theorem for the analysis of control system
with saturation. IEEE Transaction on Automatic. Control, 41(9):1256–1270,
1996.
[196] A. R. Teel and L Praly. Tools for semiglobal stabilization by partial state and
output feedback. SIAM Journal of Control and Optimization, 33:1443–1488,
1995.
[198] A. J. van der Schaft. L2 -Gain and Passivity Techniques in Nonlinear Control.
Springer-Verlag, Berlin, 2nd edition, 2000.
[204] W. Wenqing and F. Cheong. Using system dynamics to simulate the strategic
planning of the mobile commerce terminal (MCT) industry and mobile com-
merce diffusion. In International Conference on Mobile Business, 2005. ICMB
2005., pages 420–426, Sydney, Australia, 2005.
[207] J. C. Willems. 1696: the birth of optimal control. In Proceedings of the 35th
IEEE Decision and Control, volume 2, pages 1586–1587, Kobe, Japan, 1996.
[213] H. Ye, H. Wang and H. Wang. Stabilization of a PVTOL aircraft and an inertia
wheel pendulum using saturation technique. IEEE Transactions on Control
Systems Technology, 15(6):1143–1150, 2007.
[215] J. Zhao and M. W. Spong. Hybrid control for global stabilization of the cart
pendulum system. Automatica, 37(12):1941–1951, 2001.
[216] Y. Zheng and Y. Jing. Fuzzy variable structure control for acrobot based on T-S
model. In 2005 IEEE International Conference Mechatronics and Automation,
volume 2, pages 842–846, 2005.