0% encontró este documento útil (0 votos)
73 vistas215 páginas

Controladores para Péndulos Invertidos

Este documento presenta la tesis doctoral de Oscar Octavio Gutiérrez Frías sobre el diseño de controladores para sistemas mecánicos subactuados del tipo péndulo invertido. La tesis estudia cuatro sistemas subactuados: el péndulo invertido sobre un carro, el péndulo con disco inercial, el péndulo esférico invertido y el péndulo con masa radialmente móvil. La contribución principal es el desarrollo de leyes de control no lineales que logran la estabilización de estos cu

Cargado por

Sebastian Gamboa
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
73 vistas215 páginas

Controladores para Péndulos Invertidos

Este documento presenta la tesis doctoral de Oscar Octavio Gutiérrez Frías sobre el diseño de controladores para sistemas mecánicos subactuados del tipo péndulo invertido. La tesis estudia cuatro sistemas subactuados: el péndulo invertido sobre un carro, el péndulo con disco inercial, el péndulo esférico invertido y el péndulo con masa radialmente móvil. La contribución principal es el desarrollo de leyes de control no lineales que logran la estabilización de estos cu

Cargado por

Sebastian Gamboa
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

INSTITUTO POLITÉCNICO NACIONAL

CENTRO DE INVESTIGACIÓN EN COMPUTACIÓN

DISEÑO DE CONTROLADORES PARA SISTEMAS


SUBACTUADOS DEL TIPO PÉNDULO INVERTIDO

TESIS

QUE PARA OBTENER EL GRADO DE

DOCTOR EN CIENCIAS DE LA COMPUTACIÓN

Presenta:
M. en C. Oscar Octavio Gutiérrez Frías

Director de Tesis:
Dr. Carlos F. Aguilar Ibáñez

México, D.F. Diciembre de 2009.


Diseño de Controladores para Sistemas Subactuados
del Tipo Péndulo Invertido

por

M. en C. Oscar Octavio Gutiérrez Frı́as

Director de Tesis
Dr. Carlos Fernando Aguilar Ibáñez

Programa de Doctorado en Ciencias de la Computación


Centro de Investigación en Computación
Instituto Politécnico Nacional
México, D.F.
Diciembre, 2009
Resumen

La presente tesis doctoral está dedicada a la aplicación de la Teorı́a de Control


No-lineal a una clase muy importante de sistemas mecánicos, denominados sistemas
mecánicos subactuados, caracterizados por tener menos controles que grados de li-
bertad. De ahı́ la dificultad para controlarlos y razón por la cual son considerados
banco de prueba para la verificación de diversas estrategias de control.

La subclase de sistemas subactuados objeto de esta tesis es la formada por los


péndulos invertidos. En particular, se estudiaron el Péndulo Invertido sobre un Carro
(PIC), el Péndulo con Disco Inercial (PDI), el Péndulo Esférico Invertido (PEI) y
el Péndulo con Masa Radialmente Móvil (PMRM). La aportación de esta tesis es la
estabilización alrededor del punto de equilibro inestable de estos cuatro sistemas no
lineales subactuados.

La estrategia de estabilización empleada para el PIC se basa en el método de ajuste


de modelo. Este método consiste en forzar a que el sistema en lazo cerrado se com-
porte como un sistema Euler-Lagrange, donde la matriz caracterı́stica de inercia es
constante. La técnica basada en funciones de saturación anidadas fue empleada en
una segunda forma de estabilización del PIC. Las mismas ideas empleadas en esta
segunda solución fueron aplicadas para controlar al PDI. El uso de funciones de satu-
ración anidadas fue posible porque, tanto el PIC como el PDI, se pudieron expresar
en forma aproximada como una cadena de integradores con una perturbación no lineal.

ii
Para solucionar la estabilización del sistema PEI se propuso una estrategia de con-
trol muy simple basada en el método de Lyapunov y en combinación con el teorema
de invariancia de LaSalle. La ley de control propuesta garantiza la estabilidad local
y asintótica del sistema en lazo cerrado alrededor del punto de equilibrio inestable,
con una región de atracción muy grande. La estabilización del sistema PMRM se
logró mediante un controlador proporcional derivativo PD. El diseño de este contro-
lador se basó en el método de Lyapunov tomando en consideración que el péndulo
esta restringido a moverse únicamente dentro de un conjunto admisible predefinido.

La efectividad y eficiencia de las leyes de control obtenidas para los cuatro sistemas
no lineales subactuados se verificó mediante simulaciones numéricas.

iii
Abstract

The present doctoral dissertation is devoted to the application of the Nonlinear


Control Theory to a very important class of mechanical systems known as under-
actuated mechanical systems, characterized for having fewer controllers than degrees
of freedom. From there the difficulties to be able to control them and, for this reason,
they are considered a test bed to verify several control strategies.

The under-actuated systems class object of this dissertation is the one formed by the
inverted pendulums. Particularly, the Inverted Pendulum Mounted on a Cart (IPC),
the Inertial Wheel Pendulum (IWP), the Spherical Inverted Pendulum (SIP) and
the Inverted Pendulum with Moving Mass (IPMM). The main contribution of this
dissertation is the stabilization around the unstable equilibrium point of these four
under-actuated nonlinear system.

The stabilization strategy used for the IPC is based on the model-matching. This
method consists of forcing that the closed-loop system behaves as an Euler-Lagrange
system, where the inertia characteristic matrix is constant. The technique based on
nested saturation functions was used in a second stability solution for the IPC. The
same ideas used in this second solution were applied to control the IWP. The appli-
cation of nested saturation functions was able because, both the IPC and the IWP,
could be approximatively expressed as a chain of integrators with a nonlinear pertur-
bation.

iv
To solve the stabilization of the SIP system a very simple control strategy was
proposed, based on the Lyapunov method in conjunction with LaSalle’s theorem.
The proposed control law guaranties locally asymptotically stability of the system in
closed-loop around the unstable equilibrium point, with a very large domain of attrac-
tion. The stabilization of the IPMM was accomplished by means of a proportional
derivative controller PD. The design of this controller was based on the Lyapunov
method, taking into consideration that the pendulum was restricted to only move
inside of a predefined admissible set.

The effectiveness and efficiency of the obtained control laws of the four under-actuated
nonlinear system were verified by numerical simulations.

v
Glosario

Notación Matemática

R+ Conjunto de números reales no negativos.


R>0 Matriz simétrica definida positiva.
R≥0 Matriz simétrica semidefinida positiva.
M (q) Matriz uniformemente definida positiva. (Matriz dependiente del
estado q donde los autovalores cumplen λi > ², ∀i,∀q para una
cierta constante ² > 0.)
G Matriz que multiplica al vector de control en sistemas del tipo ẋ =
f (x) + Gu.

G Matriz cuyas filas son ortogonales a las columnas de G, tal que
G⊥ G = 0 y cuyo rango es r = n − rango(G).
u Ley de control (vector).
τ Par de control (vector).
g Aceleración de la gravedad en la superficie terrestre de valor
9,8m/s2 .
In Matriz identidad de orden n.
mij Elemento de la fila i, columna j de la matriz M .
mi. Fila i-ésima de la matriz M .
m.j Columna j-ésima de la matriz M .
q Vector de coordenadas articulares dado por q = [q1 , q2, · · · , qn]T en
un sistema mecánico de n grados de libertad.

vi
p Vector de momentos generalizados dado por p = [p1 , p2 , · · · , pn ]T
en un sistema mecánico de n grados de libertad.
h iT
∂f ∂f ∂f
∇q f Vector gradiente de la función escalar f : ∂q1 , ∂q2 , · · · , ∂qn
∂f
∂qk
Elemento k-ésimo de ∇q f.
L Función de Lagrange o Lagrangiano.
Lq Véase la sección 2.3.2.
L2 Véase la sección 2.3.2.
H(q, q̇) Función de Hamilton de un sistema en lazo abierto.
M (q) Matriz de inercia en lazo abierto.
K(q, q̇) Energı́a cinética en lazo abierto.
V (q) Energı́a potencial en lazo abierto.
rango(A) Rango de la matriz A.
σm (s) Función de saturación lineal.

vii
Terminologı́a matemática

Actuador: Es aquel dispositivo o subsistema que se encarga de


regular la potencia de una planta. La gama de ac-
tuadores que se pueden controlar es muy extensa y
variada. Entre los más habituales se encuentran los
destinados a producir movimientos (motores y cilin-
dros), los destinados a trasiego de fluidos (bombas) y
los de tipo térmico.
Control: Es la manipulación indirecta de las magnitudes de un
sistema denominado planta a través de otro sistema
llamado sistema de control.
Curva de nivel: Lugar geométrico de dimensión n - 1 en el espacio de
estados donde la energı́a permanece constante.
Conjunto de nivel: Lugar geométrico donde una función toma valores in-
feriores a una determinada constante.
Trayectoria acotada: Trayectoria donde la norma euclidiana del vector q
está acotada.
Conjunto abierto: Conjunto en el que para cada elemento x, existe una
bola de radio r contenida en él.
Conjunto cerrado: Conjunto cuyo complemento es un conjunto abierto.
Conjunto acotado: Conjunto donde existe una cota M ∈ Rn tal que
kxk ≤ M para todo elemento x contenido en él.
Conjunto compacto: Conjunto cerrado y acotado.
Conjunto conexo: Conjunto donde para cada par de puntos existe una
sucesión de segmentos que los une plenamente con-
tenida en él.
Error: Es la diferencia entre el valor leı́do o transmitido por
el instrumento y el valor real de la variable medida.

viii
Función propia: Función V (x) definida en X tal que los conjuntos
{x ∈ X |0 ≤ V (x) ≤ c} son compactos para cada
c ∈ R+ . Equivale al término radialmente no acotada.
Linealización: En muchos casos, la proporcionalidad que existe en-
tre la variable de entrada del transductor y su señal
de salida no es lineal. Las no linealidades reales cau-
san errores en los datos medidos, para reducir esos
errores, la salida del transductor se puede linealizar
como parte del proceso de acondicionamiento de señal
analógica. Para corregir (linealizar) las señales de sa-
lida del transductor se emplean varias técnicas de
linealización, incluyendo la modificación de los cir-
cuitos del transductor o el procesamiento analógico
de la señal del transductor.
Planta: Es una parte del equipo o máquina que se va a con-
trolar.
Robustez: El grado en el cual un sistema o el componente
pueden funcionar correctamente en la presencia de
entradas inválidas o condiciones no deseadas, a los
sistemas que tienen esta propiedad se les denomina
sistemas tolerantes a fallas.
Sistema: Los sistemas fı́sicos en un sentido más amplio, son una
interconexión de componentes, dispositivos o subsis-
temas. Un sistema puede considerarse como un proce-
so en el cual las señales de entrada son transformadas
por el sistema o provocan que éste responda de alguna
forma, lo que da como resultado otras señales como
salida.

ix
Sistema en lazo abierto: Es aquel sistema en el que no hay una realimentación
de la información para ajustar y mantener la salida
deseada.
Sistema en lazo cerrado: Es aquel sistema en el que hay una realimentación de
la información (por medio de sensores), que permiten
ajustar y mantener la salida deseada.
Sistema de control: Es aquel que se encarga de gobernar la respuesta de
una planta sin que el operador intervenga directa-
mente sobre los elementos de salida.

x
Abreviaturas y acrónimos

CD Corriente directa.
EDO Ecuación diferencial ordinaria.
EDP Ecuación diferencial en derivadas parciales.
EL Ecuaciones de Euler-Lagrange.
GL Grado de libertad.
IDA-PBC PBC con interconexión y asignación de amortiguamiento (Intercon-
nection and Damping Assigmnment-PBC ).
MATLAB MATh LABoratory software.
MIMO Sistema de múltiples entradas y salidas.
PBC Control basado en pasividad.
PCH Sistema Hamiltoniano Controlado por Puertos (Port-Controlled
Hamiltonian System).
PEI Péndulo Esférico Invertido (Spherical Inverted Pendulum).
PIC Péndulo Invertido sobre un Carro (Inverted Pendulum Cart Sys-
tem).
PDI Péndulo con Disco Inercial (Inertial Wheel Pendulum).
PMRM Péndulo con Masa Radialmente Móvil.
PVTOL Sistema de aterrizaje y despegue de un avión (Planar Vertical Take-
off and Landing).
SISO Sistema de una entrada y una salida.
SPI Sistemas tipo Péndulo Invertido.
SMU Sistema Mecánico Subactuado.

xi
Agradecimientos

A mi hija Raquel: Por ser la fuerza para continuar cada dı́a y por el tiempo que
no pude dedicarle.

A mi esposa Rosario: Que me tuvo paciencia y me apoyó cuando me faltaban


fuerzas para seguir adelante (con r = sen 2θ ).

A mi Padre: Por que gracias a él y a Dios pude realizar mi formación profesional.

A mi Madre: Que aunque no esta ya conmigo, me cuida he intercede ante Dios


por mi.

A mis Hermanos: Porque han compartido su tiempo y apoyo cuando lo he


necesitado.

Al Dr. Carlos Aguilar Ibáñez: Mi director de tesis, porque me ha apoyado y


tenido paciencia en mi trabajo, ası́ como confianza, guiándome de una manera muy
valiosa en este proyecto compartiendo su sabidurı́a conmigo.

Al Dr. Santiago Suárez Castañón: Por su valiosa ayuda, apoyo y colaboración,


ası́ como las sugerencias en la difı́cil preparación de los artı́culos que contribuyeron a
esta tesis.

A mis compañeros y amigos del CIC: Porque me ofrecieron su valiosa amistad


y siempre me dieron un consejo cuando lo necesité, y por compartir conmigo su tiempo
y espacio.

xii
A los Sinodales: Por sus valiosos consejos y por compartir sus conocimientos
conmigo.

Al CIC y al IPN: Por ser las instituciones que me brindaron la oportunidad de


superarme académica y profesionalmente.

Al Consejo Nacional de Ciencia y Tecnologı́a: Por el apoyo económico


brindado para realizar estos estudios.

A todas las demás personas que en algún momento me apoyaron.

xiii
Con amor y cariño para Raquel

Gracias por tu comprensión Rosario (con r = sen 2θ)

Los estudios doctorales no son más que el primer paso de una vida dedicada
a la investigación cientı́fica y a la búsqueda de la verdad en la ciencia.
Anónimo

xiv
Índice general

Resumen II

Abstract IV

Glosario VI

Agradecimientos XII

Índice de figuras XVIII

Índice de tablas XX

1. Introducción 1
1.1. Motivación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2. Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2.1. Objetivo general . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2.2. Objetivos especifı́cos . . . . . . . . . . . . . . . . . . . . . . . 5
1.3. Hipótesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.4. Planteamiento del problema . . . . . . . . . . . . . . . . . . . . . . . 7
1.5. Contribuciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.6. Lı́mites y alcances . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.7. Estructura de la tesis . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

2. Estado del Arte 13


2.1. Antecedentes históricos de la Teorı́a de Control . . . . . . . . . . . . 13
2.2. Control de Sistemas No lineales . . . . . . . . . . . . . . . . . . . . . 19
2.2.1. Control de Sistemas No lineales Subactuados . . . . . . . . . . 20
2.2.2. Control del Sistema Subactuado tipo Péndulo Invertido . . . . 24
2.2.3. Método de Sı́ntesis de Controladores que preservan la estruc-
tura Lagrangiana/Hamiltoniana . . . . . . . . . . . . . . . . . 28
2.2.4. Control por medio de funciones de Saturación Anidadas . . . . 36
2.3. Fundamentos Teóricos . . . . . . . . . . . . . . . . . . . . . . . . . . 39

xv
2.3.1. Estabilidad de Lyapunov . . . . . . . . . . . . . . . . . . . . . 39
2.3.2. Pasividad y Disipatividad . . . . . . . . . . . . . . . . . . . . 45
2.3.3. Sistemas No holonómicos . . . . . . . . . . . . . . . . . . . . . 48

3. Sistemas Mecánicos Subactuados 52


3.1. Sistemas Euler-Lagrange . . . . . . . . . . . . . . . . . . . . . . . . . 52
3.2. Sistemas Subactuados . . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.2.1. Definición de Sistema Subactuado . . . . . . . . . . . . . . . . 56
3.2.2. Dinámica de los Sistemas Subactuados . . . . . . . . . . . . . 57
3.3. Ejemplos de Sistemas Subactuados . . . . . . . . . . . . . . . . . . . 59
3.3.1. Acrobot y Pendubot . . . . . . . . . . . . . . . . . . . . . . . 60
3.3.2. Péndulo Invertido sobre un Carro (Cart-Pole System) . . . . . 63
3.3.3. Péndulo Esférico Invertido (3D Cart-Pole System) . . . . . . . 66
3.3.4. Péndulo con Disco Inercial (Inertial Wheel Pendulum) . . . . 67
3.3.5. Péndulo de Furuta . . . . . . . . . . . . . . . . . . . . . . . . 70
3.3.6. PVTOL (Planar Vertical Take-off and Landing) . . . . . . . . 72

4. Estabilización del Péndulo Invertido


utilizando un ajuste de modelo 74
4.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
4.2. Modelo del Péndulo Invertido sobre un Carro . . . . . . . . . . . . . 75
4.3. Estrategia de control . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
4.3.1. Solución de las condiciones de ajuste . . . . . . . . . . . . . . 79
4.4. Análisis de estabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . 81
4.5. Resultados de la simulación . . . . . . . . . . . . . . . . . . . . . . . 84

5. Control de Sistemas Subactuados tipo Péndulo Invertido


por funciones de Saturación Anidadas 87
5.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
5.2. Control del Sistema Péndulo Invertido sobre un Carro . . . . . . . . 89
5.2.1. Modelo no lineal . . . . . . . . . . . . . . . . . . . . . . . . . 89
5.2.2. Estrategia de Control . . . . . . . . . . . . . . . . . . . . . . . 92
5.2.3. Resultados de Simulación . . . . . . . . . . . . . . . . . . . . 99
5.3. Control del Péndulo con Disco Inercial . . . . . . . . . . . . . . . . . 101
5.3.1. Modelo no lineal del Péndulo con Disco Inercial . . . . . . . . 101
5.3.2. Estrategia de control . . . . . . . . . . . . . . . . . . . . . . . 104
5.3.3. Simulación Computacional . . . . . . . . . . . . . . . . . . . . 113

6. Estabilización del Péndulo Esférico Invertido


mediante el método de Lyapunov 117
6.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
6.2. Modelo del Péndulo Esférico Invertido . . . . . . . . . . . . . . . . . 118

xvi
6.3. Estrategia de control . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
6.3.1. Cómo proponer una función de Lyapunov . . . . . . . . . . . 119
6.3.2. Obtención de la ley de control . . . . . . . . . . . . . . . . . . 121
6.3.3. Análisis de estabilidad . . . . . . . . . . . . . . . . . . . . . . 123
6.4. Simulaciones numéricas . . . . . . . . . . . . . . . . . . . . . . . . . 125

7. Control del comportamiento oscilatorio de un sistema mecánico no


lineal: Caso Péndulo Invertido con Masa Móvil 127
7.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
7.2. Ecuación de movimiento . . . . . . . . . . . . . . . . . . . . . . . . . 128
7.3. Control lineal PD . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
7.3.1. Control basado en energı́a . . . . . . . . . . . . . . . . . . . . 133
7.4. Resultados de simulación . . . . . . . . . . . . . . . . . . . . . . . . . 137
7.4.1. Parámetros de simulación . . . . . . . . . . . . . . . . . . . . 137
7.4.2. Comentarios sobre las simulaciones . . . . . . . . . . . . . . . 138

8. Conclusiones 140
8.1. Desarrollos futuros . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143

A. Modelos Dinámicos de Sistemas Subactuados


tipo Péndulo Invertido 144
A.1. Sistema Péndulo Invertido sobre un Carro . . . . . . . . . . . . . . . 144
A.1.1. Ecuaciones de movimiento . . . . . . . . . . . . . . . . . . . . 144
A.1.2. Inestabilidad del péndulo invertido en lazo abierto . . . . . . . 150
A.2. Sistema Péndulo con Disco Inercial . . . . . . . . . . . . . . . . . . . 151
A.3. Sistema Péndulo Esférico Invertido . . . . . . . . . . . . . . . . . . . 154

B. Linealización Parcial por Retroalimentación 157

C. Demostraciones de lemas y comentarios adicionales 161


C.1. Demostración del lema 4.3.2 . . . . . . . . . . . . . . . . . . . . . . . 161
C.2. Comentario 4.2.2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163
C.3. Demostración del lema 6.3.1 . . . . . . . . . . . . . . . . . . . . . . . 165
C.4. Demostración del lema 7.3.5 . . . . . . . . . . . . . . . . . . . . . . . 166

D. Publicaciones y congresos generados del trabajo de investigación 168

Referencias 170

xvii
Índice de figuras

3.1. Acrobot. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
3.2. Pendubot. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
3.3. Péndulo Invertido sobre un Carro. . . . . . . . . . . . . . . . . . . . . 64
3.4. Péndulo Esférico Invertido. . . . . . . . . . . . . . . . . . . . . . . . . 66
3.5. Péndulo con Disco Inercial. . . . . . . . . . . . . . . . . . . . . . . . 68
3.6. Péndulo de Furuta. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
3.7. PVTOL. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

4.1. Sistema Péndulo Invertido sobre un Carro. . . . . . . . . . . . . . . . 76


4.2. Curvas de nivel para α = 0,25, α = 0,5, α = 0,1 y α = 3. . . . . . . . 81
4.3. Comportamiento en lazo cerrado de las posiciones del sistema para dos
valores diferentes de kp . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
4.4. Comportamiento en lazo cerrado de las velocidades del sistema para
dos valores diferentes de kp . . . . . . . . . . . . . . . . . . . . . . . . 86
4.5. Robustez del controlador propuesto. . . . . . . . . . . . . . . . . . . 86

5.1. Péndulo Invertido sobre un Carro. . . . . . . . . . . . . . . . . . . . . 89


5.2. Respuesta en lazo cerrado del ángulo y velocidad angular del péndulo. 100
5.3. Respuesta en lazo cerrado de la posición y velocidad carro. . . . . . . 100
5.4. Comportamiento del controlador v y de la función de energı́a V . . . . 100
5.5. Péndulo con Disco Inercial. . . . . . . . . . . . . . . . . . . . . . . . 101
5.6. Respuesta del sistema en lazo cerrado cuando δ = 35,71. . . . . . . . 115
5.7. Respuesta en del sistema en lazo cerrado para δ = 3,5. . . . . . . . . 116

6.1. Sistema Péndulo Esférico Invertido. . . . . . . . . . . . . . . . . . . 118


6.2. Respuesta en lazo cerrado de las variables angulares del sistema. . . . 126
6.3. Respuesta en lazo cerrado de las posiciones y velocidades del sistema. 126

7.1. Péndulo Invertido con Masa Radialmente Móvil . . . . . . . . . . . . 129


7.2. Curvas de nivel alrededor del origen. . . . . . . . . . . . . . . . . . . 133
7.3. Simulación del sistema en lazo cerrado para la condición inicial q(0). . 139
7.4. Simulación del sistema en lazo cerrado para la condición inicial x(0). 139

xviii
A.1. Péndulo Invertido sobre un Carro. . . . . . . . . . . . . . . . . . . . . 145
A.2. Péndulo con Disco Inercial . . . . . . . . . . . . . . . . . . . . . . . . 152
A.3. Sistema Péndulo Esférico Invertido . . . . . . . . . . . . . . . . . . . 155

xix
Índice de tablas

2.1. Panorama histórico de la Teorı́a de Control . . . . . . . . . . . . . . . 18

xx
Capı́tulo 1

Introducción

1.1. Motivación
Desde muchas décadas atrás hasta la actualidad el desarrollo de técnicas de control
para sistemas mecánicos es uno de los campos de investigación más activos en la inge-
nierı́a, esto debido a que su desarrollo ha permitido crear maquinas automáticas con
un fuerte impacto en áreas tales como producción, almacenaje y supervisión de ma-
teriales peligrosos, construcción, tele-operación y vehı́culos autónomos por nombrar
sólo algunas. No obstante, las soluciones a problemas existentes no se han agotado
ni problemas nuevos han dejado de surgir por ello la necesidad de desarrollar nuevas
técnicas de control sigue siendo una tarea vigente y en algunos casos urgente.

En esta tesis se aplica la Teorı́a de Control de sistemas no-lineales a una clase muy im-
portante de sistemas mecánicos denominados sistemas mecánicos subactuados,1
que se caracterizan fundamentalmente por tener menos actuadores que grados de li-
bertad. En particular, me enfoqué a resolver el problema de estabilización alrededor
del punto de equilibrio inestable de algunos sistemas pertenecientes a la familia de
péndulos invertidos, que son una subclase de sistemas subactuados como el Péndulo
Invertido sobre un Carro (PIC), el Péndulo con Disco Inercial (PDI), el Péndulo
Esférico Invertido (PEI) y el Péndulo con Masa Radialmente Móvil (PMRM).
1
Una bicicleta o una avión son ejemplo cotidianos de esta clase de sistemas.

1
2 Capı́tulo 1. Introducción

Actualmente existen técnicas de control desarrolladas a finales del siglo pasado para
sistemas completamente actuados2 como los robots manipuladores clásicos. Por ejem-
plo, las técnicas basadas en pasividad [46, 31, 158]; la teorı́a de Lyapunov [112, 181]
o la linealización por retroalimentación [190, 188]. Desafortunadamente, un sistema
subactuado es considerablemente más complejo que un sistema completamente actua-
do, por lo que las técnicas usadas para controlar a estos últimos no pueden aplicarse
de forma directa a un sistema subactuado.

Ası́, en los últimos años una serie de aplicaciones cientı́ficas, militares e industriales
han motivado a los investigadores ha estudiar los sistemas mecánicos subactuados, con
la finalidad de desarrollar algoritmos de control que estabilicen sistemas como barcos,
vehı́culos acuáticos, helicópteros, aeronaves, aerodeslizadores, satélites o robots, los
cuales pueden ser considerados como “subactuados”, por alguna de las siguientes
razones:

1. La dinámica del sistema.

2. Reducir el costo en el diseño o por un propósito práctico.

3. Falla en los actuadores.

4. Provocar la creación artificial de sistemas no-lineales complejos de bajo orden


con el propósito de mejorar el control de sistemas subactuados de alto orden.

Esto ha provocado que las investigaciones se enfoquen en la obtención de algoritmos


de control para sistemas no-lineales subactuados generales, pero debido a la dificultad
para lograr este objetivo, se ha optado por estudiar sistemas mecánicos mas simples
los cuales son ejemplos representativos en el área académica y de experimentación
como el Péndulo Invertido [189]; el Péndulo con Disco Inercial [187]; el Pendubot
[186]; el Acrobot [183]; el Péndulo de Furuta [23]; el sistema bola-viga [170], y el
sistema de aterrizaje y despegue plano de un avión (PVTOL) [90].
2
Es decir, son sistemas con el mismo número de actuadores que grados de libertad.
1.1. Motivación 3

Por lo anterior, en este trabajo se desarrollan estrategias de control para los Sistemas
Subactuados tipo Péndulo Invertido (SPI) que consisten en un péndulo situado sobre
una base móvil que gira libremente por uno de sus extremos mediante una articu-
lación,3 debido a que la aceleración del péndulo no puede ser controlada directamente,
los SPI se consideran sistemas subactuados. Estos sistemas mecánicos son una familia
de dispositivos que constituyen un banco de prueba muy completo e interesante en la
Ingenierı́a de control no-lineal, algunos de los integrantes de esta familia son: el Péndu-
lo Invertido sobre un Carro [20]; el Péndulo con Rueda de Inercia [187]; el Péndulo
Esférico Invertido [15]; el Péndulo de Furuta [72]; el Pendubot [39], entre otros de
interés para los investigadores, debido a que su modelo matemático puede modelar el
comportamiento de sistemas aplicados en la vida real más complejos, como el control
de cohetes [210]; el modelo del control de posición de un propulsor primario espacial
para despegues [148]; los robots caminantes de dos pies [102, 217]; el movimiento de
los pies del ser humano [113]; los vehı́culos terrestres [200]; los sistemas antisı́smicos en
construcciones [191, 134], o bien, los sistemas de absorción de vibraciones mecánicas.
Cabe destacar que el sistema Péndulo Invertido tiene caracterı́sticas importantes que
lo convierten en un tópico de investigación muy interesante, resaltando las siguientes:

Es un sistema multivariable subactuado con dinámicas de movimiento no-lineales.

El sistema no es linealizable por medio de la relación de entrada-salida, esto


significa que no podemos encontrar una relación directa y simple entre la salida
del sistema y la entrada de control [99].

El sistema linealizado en lazo abierto presenta las caracterı́sticas de inestabilidad


y de fase no mı́nima en el punto más alto del sistema [148]. Por otra parte, si
se estudia la energı́a de sistema no-lineal, su forma representa una punto silla
en el punto de equilibrio inestable demostrando la inestabilidad [57].

El sistema pierde controlabilidad y otras propiedades geométricas cuando el


sistema cruza la horizontal [128].
3
La base móvil puede ser un carro que se mueve a lo largo de una guı́a rectilı́nea horizontal bajo
la acción de una fuerza horizontal o un disco que gira libremente en un eje paralelo al eje de rotación
del péndulo.
4 Capı́tulo 1. Introducción

Es importante comentar que estos sistemas tiene un rango de controlabilidad res-


tringido a una pequeña vecindad alrededor del punto de equilibrio inestable [165].
Esto hace que muchas leyes clásicas de control no puedan ser completamente llevadas
a cabo [175]. Por ejemplo, en general el problema de seguimiento a una trayectoria
puede ser realizado alrededor de una pequeña vecindad del punto de equilibrio in-
estable. Además, la mayorı́a de estos sistemas pierden la controlabilidad en ciertas
regiones del espacio de trabajo y no son robustos en presencia de fuerzas disipativas.

Lo anterior provoca que sea complicado realizar maniobras de control como las que
permitan estabilizar el péndulo alrededor de la posición de equilibrio inestable y las
relacionadas a la estabilización alrededor de órbitas homoclı́nicas [128, 174, 184]. Sin
embargo, se conoce que el modelo lineal del Péndulo Invertido es localmente contro-
lable alrededor del punto de equilibrio inestable, por lo tanto, el problema de esta-
bilización puede ser solucionado utilizando la técnica de desplazamiento de polos [175].

Por consiguiente, lo anterior motiva la necesidad de desarrollar nuevas técnicas de


control aplicadas a sistemas subactuados y en especial a los sistemas tipo Péndulo
Invertido que son uno de los problemas clásicos de sistemas subactuados [20], ya que el
péndulo no recibe directamente ninguna señal de control debido a que toda la acción
es aplicada a la base móvil, convirtiéndose en un modelo de referencia para evaluar
un amplia gama de métodos de control no-lineales [72, 54, 118].

1.2. Objetivos

1.2.1. Objetivo general

Proporcionar algunas herramientas analı́ticas que permitan resolver el problema


de estabilización de Sistemas Subactuados tipo Péndulo Invertido (SPI) alrede-
dor del punto de equilibrio inestable tales como el Péndulo Invertido sobre un
Carro, el Péndulo con Disco Inercial y el Péndulo Esférico Invertido.
1.3. Hipótesis 5

1.2.2. Objetivos especifı́cos


Proponer un controlador estabilizador capaz de llevar el Sistema del Péndulo
Invertido sobre un Carro alrededor del punto de equilibrio inestable, evitando la
necesidad de resolver el conjunto de ecuaciones diferenciales de las condiciones
de ajuste que en general son muy complejas [26, 32, 33].

Desarrollar un controlador que estabilize al Sistema Péndulo Invertido sobre


un Carro alrededor del punto de equilibrio inestable por medio de un control
por funciones de saturación anidadas sin que sea necesario tener una función
candidata de Lyapunov para todo el sistema.

Resolver el problema de estabilización del Péndulo con Disco Inercial por medio
del método de control por funciones de saturación anidadas, considerando la
presencia de fuerzas disipativas en la coordenada no actuada, ya que estas tien-
den a desestabilizar la solución en lazo cerrado especialmente en la posición
superior [78, 209].

Solucionar la estabilización del Péndulo Esférico Invertido alrededor del punto


de equilibrio inestable utilizando el método de Lyapunov caracterizado porque
el dominio de atracción puede ser tan grande como se desee.

Proponer un controlador asintótico estabilizador para atenuar las vibraciones en


un sistema mecánico subactuado no-lineal sin fricción, el cual esta restringido
a moverse dentro de un conjunto admisible predefinido. El sistema mencionado
representa una versión simplificada de la dinámica de edificios rı́gidos restringi-
dos a oscilar en el plano.

1.3. Hipótesis
Partiendo de la idea de que los sistemas tipo Péndulo Invertido (tales como el
Péndulo Invertido sobre un Carro y el Péndulo con Disco Inercial) pueden expresarse
como una cadena de integradores con una perturbación no-lineal, permitirá proponer
6 Capı́tulo 1. Introducción

una estrategia de Control basado en funciones de saturación anidadas.


Por otra parte, si el sistema Péndulo Invertido sobre un Carro en lazo cerrado puede
ser forzado a comportarse como otro sistema no-lineal con ciertas propiedades de es-
tabilidad, entonces será posible utilizar el ajuste de modelo.
Además, en el caso del Péndulo Esférico Invertido, si se puede encontrar un función
definida positiva, tal que su derivada sea semi-definida negativa entonces existe la
posibilidad de obtener una ley de control que estabilice el sistema.

Como consecuencia, resolveremos el problema de estabilización de sistemas tipo Péndu-


lo Invertido alrededor del punto de equilibrio inestable por medio de diversas técnicas
de control.
Las siguientes consideraciones serán tomadas en cuenta para proponer las estrategias
de control.

1. El Péndulo Invertido sobre un Carro y el Péndulo Esférico Invertido se pueden


mover únicamente por encima del plano horizontal, es decir es valido para va-
lores de ángulo entre −π/2 y π/2.

2. Se debe considerar que el desplazamiento del carro o la base son acotados, es de-
cir, están restringidos a moverse en cierta región definida por las caracterı́sticas
fı́sicas del sistema.

3. En el Péndulo con Disco Inercial, el ángulo del péndulo puede variar de −π a


π.

4. Además, se considera la presencia de una fuerza disipativa en la coordenada no


actuada del Péndulo con Disco Inercial.
1.4. Planteamiento del problema 7

1.4. Planteamiento del problema


En este trabajo abordamos el problema de estabilización de Sistemas tipo Péndulo
Invertido (SPI), el cual consiste en estabilizar el sistema alrededor del punto de
equilibrio inestable bajo la suposición que el sistema está inicializado dentro de su
dominio de atracción.

Se establece a partir del objetivo planteado una metodologı́a a seguir como se muestra
a continuación:

1. Estudio y obtención del modelo matemático del sistema mecánico.

2. Análisis de las caracterı́sticas dinámicas del modelo obtenido.

3. Diseño de los algoritmos de control.

4. Simulación numérica de los algoritmos de control.

5. Evaluación de las estrategias de control tomando como referencia los resultados


de las simulaciones numéricas.

1.5. Contribuciones
La principal aportación del presente trabajo es proporcionar herramientas analı́ticas
que permitan solucionar el problema de establización de Sistemas tipo Péndulo Inver-
tido (SPI) alrededor del punto de equilibrio inestable.

Para lograr lo anterior, se proponen diferentes estrategias de control. A continuación


los aportes más relevantes de cada una:

1. Ajuste de modelo (Model Matching)

a) Desarrollar un ajuste de modelo (Model Matching) para obtener un contro-


lador que lleve el Sistema Péndulo Invertido sobre un Carro a su posición
de equilibrio inestable.
8 Capı́tulo 1. Introducción

b) Presentar una manera sencilla de solucionar las condiciones de ajuste


(Matching Conditions) derivadas de la energı́a cinética y la energı́a
potencial de sistema, necesarias para encontrar un controlador que esta-
bilice el Sistema Péndulo Invertido sin tener que resolver un conjunto de
ecuaciones diferenciales muy complejo como lo realizan en otras trabajos
donde se utiliza este enfoque [26, 33, 32, 109].

c) La estrategia de estabilización consiste en forzar al sistema en lazo cerrado


a que se comporte como un sistema Euler-Lagrange, donde la matriz de
inercia es constante. Proponer una matriz de inercia con esta caracterı́stica
elimina la necesidad de solucionar tres ecuaciones diferenciales no lineales
como lo realizó Gómez-Estern [77].

d ) La estrategia de control propuesta permite que el sistema en lazo cerrado


sea asintóticamente estable localmente y exponencialmente estable local-
mente alrededor del origen.

2. Control por funciones de saturación anidadas

a) Presentar un conjunto de transformaciones que permitan aplicar un con-


trolador basada en saturaciones anidadas para solucionar el problema de
estabilización del Sistema Péndulo Invertido, ası́ como del Péndulo con
Disco Inercial.

b) Esta técnica permite proponer un controlador estabilizador sin que sea


necesario tener una función candidata de Lyapunov para el sistema com-
pleto.

c) El análisis de estabilidad del sistema completo es sencillo comparado con


el que se realiza en otros trabajos [127, 149].

d ) Además, el controlador propuesto permite que los sistemas en lazo cerrado


sean asintóticamente estables de forma global y exponencialmente estables
de forma local alrededor del punto de equilibrio inestable o posición vertical
inestable.
1.5. Contribuciones 9

e) Fı́sicamente, la estrategia de control consiste en llevar el péndulo cerca de


la posición invertida y mover gradualmente el carro o el disco al origen.

3. Control basado en el método de Lyapunov

a) Desarrollar una ley de control que estabilice al Sistema Péndulo Esférico


Invertido alrededor del punto de equilibrio inestable.

b) Proponer una metodologı́a para obtener una función de Lyapunov definida


positiva cuya derivada sea semi-definida negativa (disipativa).

c) La ley de control propuesta garantiza la estabilidad local y asintótica del


sistema en lazo cerrado.

d ) Además, el sistema en lazo cerrado tiene una región de atracción que puede
ser tan grande como se desee para cualquier posición inicial por encima del
plano horizontal.

Como una motivación del estudio de los sistemas tipo péndulo invertido; una
aportación adicional de este trabajo, es proponer una solución sencilla al problema
de atenuación de vibraciones de un péndulo invertido sin fricción con masa móvil,
utilizado el enfoque basado en Lyapunov para estabilizar asintóticamente el sistema4
bajo la suposición de que el sistema es inicializado en su dominio de atracción. La
estrategia de control propuesta explota las propiedades fı́sicas del sistema original
que se utilizan para moldear la energı́a total del sistema en lazo cerrado. En lo que se
refiere a la aplicabilidad de la ley de control propuesta, el modelo no lineal presentado
es una versión simplificada de la dinámica de edificios rı́gidos, restringidos a oscilar
en el plano (excitaciones externas). Siendo un problema interesante la atenuación
de los efectos provocados por perturbaciones desconocidos (fuerzas sı́smicas) en las
estructuras civiles por medio de un control activo.
4
El péndulo está anclado al pivote, por medio de un resorte torsional, que mantiene el sistema
en la posición vertical estable, como consecuencia el sistema es estable en el sentido de Lyapunov.
10 Capı́tulo 1. Introducción

1.6. Lı́mites y alcances


Este trabajo está enfocado a desarrollar leyes de control estabilizadoras para los
Sistemas tipo Péndulo Invertido (SPI).

El alcance del presente trabajo de investigación se limita, a los Sistemas tipo


Péndulo Invertido por ser considerados problemas clásicos de sistemas subactuados,
ya que el péndulo no recibe directamente ninguna señal de control. Es importante co-
mentar que por medio de simulación computacional se observará el desempeño de las
estrategias de control propuestas en esta tesis usando la plataforma de MATLABTM ,
los objetivos y alcances de este trabajo no contemplan el desarrollo de una plataforma
virtual o una implementación de las estrategias en un sistema real debido a que no
se cuenta con dicho sistema, por lo tanto, se da la pauta a una serie de lı́neas de
investigación futuras destinadas primordialmente a la extensión de los razonamientos
teóricos aquı́ expuestos y a perfeccionar los resultados.

1.7. Estructura de la tesis

Este trabajo consta de ocho capı́tulos complementados con cuatro apéndices. En


este primer capı́tulo se ofrece una exposición de motivos y las contribuciones del
trabajo.

El capı́tulo 2 muestra de manera general los antecedentes históricos de la Teorı́a de


Control, ası́ como una revisión del estado del arte del estudio de sistemas subactuados
y en particular de los Sistemas tipo Péndulo Invertido resaltando las técnicas de con-
trol que se utilizan en las aportaciones de la tesis. Además, se presentan formalmente
los fundamentos teóricos necesarios para la comprensión del texto subsiguiente.

El capı́tulo 3 presenta los conceptos de los sistemas Euler-Lagrange, ası́ como la


definición, caracterı́sticas y ejemplos de los sistemas subactuados.
1.7. Estructura de la tesis 11

El capı́tulo 4 muestra el control de un sistema mecánicos subactuado simple emplean-


do el método de ajuste de modelo. Se presenta el método con rigor teórico y se aplica
a la resolución del problema ampliamente conocido en la comunidad del control como
Péndulo Invertido sobre un Carro. Se aporta una manera sencilla de solucionar las
condiciones de ajuste (matching conditions), con las cuales se encuentra la ley de
control que estabiliza el sistema en el punto de equilibrio inestable. Lo expuesto en
este capı́tulo ha dado lugar a una serie publicaciones [7, 11].

El capı́tulo 5 está dedicado a la estabilización de los sistemas subactuados Péndulo


Invertido sobre un Carro y Péndulo con Disco Inercial por medio de funciones de
saturación anidadas. Esta técnica parte de la idea de expresar el sistema como una
cadena de cuatro integradores con una perturbación no-lineal para posteriormente
proponer un controlador. Los resultados de este capı́tulo han sido publicados [8] y
dieron la pauta para un artı́culo en congreso [14].

En el capı́tulo 6 se presenta la estabilización del Sistema Péndulo Esférico Invertido


por medio del método de Lyapunov y el teorema de LaSalle. Lo expuesto en este
capı́tulo dio lugar a una publicación [84].

El capı́tulo 7 aborda el problema de control de vibraciones mecánicas de un sistema


no-lineal subactuado mediante el enfoque de Lyapunov, para obtener un controlador
que estabilice asintóticamente el sistema. Los resultados de este capı́tulo han sido
publicados en un artı́culo de congreso [4].

En el siguiente capı́tulo se muestra conclusiones del trabajo de investigación y se


exponen algunas posibles lı́neas de investigación posteriores a esta tesis.

El apéndice A describe cómo se obtienen los modelos matemáticos del Sistema Péndu-
lo Invertido sobre un Carro, Péndulo con Disco Inercial y Péndulo Esférico Invertido
utilizando las ecuaciones de Euler-Lagrange.

En el apéndice B se muestra el procedimiento de cómo realizar la linealización parcial


por retroalimentación.
12 Capı́tulo 1. Introducción

En el apéndice C se detallan los procedimientos de las pruebas de los Lemas que en


los capı́tulos anteriores se presentan, ası́ como un comentario del capı́tulo 4.

El apéndice D muestra las publicaciones en revistas y congresos derivadas del trabajo


de tesis.
Capı́tulo 2

Estado del Arte

2.1. Antecedentes históricos de la Teorı́a


de Control
La teorı́a de control ha desempeñado un papel vital en el avance de la ingenierı́a
y la ciencia. Hoy en dı́a es parte importante e integral en los procesos industriales y
de manufactura. Por ejemplo, en el diseño de los sistemas de pilotos automáticos en
aeronaves y la construcción de automóviles. También es esencial en las operaciones
industriales para el control de variables fı́sicas como presión, temperatura, humedad,
viscosidad y flujo para mantener un desempeño óptimo en los procesos productivos.

Entonces, para iniciarse en el estudio de un área la mejor manera de entenderla es


examinar su evolución y los motivos para su existencia. Enseguida mostramos una
breve revisión histórica del control automático.

Una interesante trabajo que muestra el panorama histórico de la teorı́a de Control


fue escrito por O. Mayr en 1970 [139], el cual describe detalladamente el control de
diversos mecanismos utilizados en la edad media, ası́ como otros creados hace 300
años. A continuación, se describen algunos de los trabajos más significativos en el
área de control automático que han tenido un impacto relevante en desarrollo de la
disciplina.

13
14 Capı́tulo 2. Estado del Arte

Año Propuesto Descripción


1788 James Watt Desarrolló el regulador de velocidad centrı́fugo para el con-
trol de velocidad de una máquina de vapor.
1868 J. C. Maxwell Se le atribuye realizar el primer estudio de estabilidad
en control automático en su artı́culo denominado “On
Governors”[138], en el cual desarrolló las ecuaciones diferen-
ciales del regulador centrı́fugo de Watt y linealizando dichas
ecuaciones cerca del punto de equilibrio, encontró la ecuación
caracterı́stica del sistema, permitiéndole estudiar el efec-
to que tienen los parámetros del sistema en la estabilidad
mostrando que el sistema es estable si las raı́ces tienen parte
real negativa. Maxwell encontró solo resultados satisfactorios
en sistemas hasta de tercer orden.
1
1877 E.J. Routh Este investigador propuso una técnica numérica para deter-
minar cuando la ecuación caracterı́stica del sistema tiene
raı́ces con parte real negativa (estables) sin tener que ob-
tenerlas por medio de factorización, conocido como Crite-
rio de estabilidad de Routh en un ensayo denominado
“Tratado sobre la estabilidad de un estado de movimiento
dado”(A Treatise on the Stability of a Given State of Mo-
tion) [167]. Este criterio de estabilidad sólo se aplica a los
polinomios con una cantidad finita de términos. Cuando se
aplica el criterio a un sistema de control, la información so-
bre la estabilidad se obtiene directamente de los coeficientes
de la ecuación caracterı́stica.
Cont...

1
E.J. Routh fue ganador del premio Adams en 1877 por su criterio de estabilidad.
2.1. Antecedentes históricos de la Teorı́a de Control 15

Año Propuesto Descripción


1893 A. M. Lyapunov El trabajo de Lyapunov se considera uno de los más rele-
vantes en la Teorı́a de Control, su estudio estuvo basado en
la ecuación no-lineal de movimiento y la noción generalizada
de energı́a [129], incluyendo resultados para ecuaciones dife-
renciales lineales que son equivalentes al criterio de Routh.
Desafortunadamente su trabajo no apareció en la literatura
de control hasta 1958.
1895 A. Hurwitz Planteó una manera de determinar la estabilidad de la
ecuación caracterı́stica denominándolo criterio de estabi-
lidad de Hurwitz2 [94], que ofrece la condición suficiente
para que todas la raı́ces tengan parte real negativa. El crite-
rio define una matriz llamada Matriz Hurwitz con los coefi-
cientes de la ecuación y enuncia el polinomio de la ecuación
caracterı́stica tiene raı́ces con parte real negativa si y sólo
si los menores principales diagonales de la matriz son todos
positivos.3
Cont...

2
El criterio estabilidad Hurwitz es equivalente al de Routh, y en Teorı́a de Control se denomina
Criterio de Routh-Hurwitz la demostración de dicha equivalencia se puede encontrar en el libro
de Ingenierı́a de Control Moderna del autor Katsuhiko Ogata [148].
3
La ecuación caracterı́stica que se cumple con el criterio de estabilidad de Hurwitz se le conoce
en Teorı́a de Control como polinomio Hurwitz
16 Capı́tulo 2. Estado del Arte

Año Propuesto Descripción


1932 H. Nyquist Nyquist desarrolló la Teorı́a de Regeneración para el diseño
de amplificadores estables derivándose el criterio de esta-
bilidad de Nyquist [147], el cual se basa en un teorema de
la teorı́a de variable compleja. El criterio de Nyquist deter-
mina la estabilidad de un sistema en lazo cerrado a partir de
la respuesta en frecuencia en lazo abierto y los polos en lazo
abierto, este criterio es útil en la ingenierı́a de control, debido
a que permite determinar gráficamente la estabilidad del sis-
tema en lazo cerrado a partir de las curvas de respuesta en
frecuencia en lazo abierto sin que sea necesario determinar
los polos en lazo cerrado.
1940 H. W. Bode Hendrik Wade Bode usó las gráficas de respuesta frecuencial
de magnitud y fase de una función compleja e investigó la
estabilidad en lazo cerrado usando las nociones de margen de
ganancia y fase [41]. En 1945 aparecen los detalles completos
de su trabajo en el libro “Network Analysis and Feedback
Amplifier Design”[42].
Cont...
2.1. Antecedentes históricos de la Teorı́a de Control 17

Año Propuesto Descripción


1948 W. R. Evans Propuso otro enfoque para diseñar sistemas de control. Evans
trabajó en el área de control y guiado de aviones en donde
se dio cuenta que la utilización de métodos frecuenciales era
muy compleja, por lo cual se vio en la necesidad desarrollar
técnicas y reglas para encontrar la raı́ces de la ecuación ca-
racterı́stica de una manera gráfica [58]. A este método se le
conoce como método lugar de las raı́ces, y en él se re-
presentan las raı́ces de la ecuación caracterı́stica para todos
los valores de un parámetro del sistema. El método debe su
nombre al lugar de las raı́ces del polinomio caracterı́stico del
sistema en lazo cerrado cuando un determinado parámetro
(por lo general la ganancia) varı́a de cero a infinito. Dicho
gráfico muestra de manera clara la contribución de cada polo
o cero en lazo abierto a las posiciones de los polos en lazo
cerrado.
1957 R. Bellman Bellman aplicó la programación dinámica al control óptimo
de sistemas discretos demostrando que la manera natural
de solucionar el problema de control óptimo es por retrasos
en el tiempo. Su procedimiento resultó en esquemas en lazo
cerrado generalmente no lineales [29].
1958 L. S. Pontryagin Desarrolló el principio máximo de Pontryagin, el cual solu-
ciona el problema de control partiendo del calculo variacional
desarrollado por L. Euler (1707-1783)[163].
Cont...
18 Capı́tulo 2. Estado del Arte

Año Propuesto Descripción


1960 R. E. Kalman Kalman y sus colaboradores publicaron una serie de artı́culos
de gran relevancia. En el primero hizo público el trabajo de
Lyapunov sobre control de sistemas no lineales en el dominio
de tiempo [105]. Además, abordó el tema de control óptimo
proporcionando el diseño de las ecuaciones para el Regulador
Cuadrático Lineal (LQR) [103]. Otros trabajos interesantes
fueron el filtrado óptimo y la teorı́a de estimación en los
cuales proporcionó el diseño de las ecuaciones para el filtro
de Kalman discreto [104] y posteriormente desarrolló el filtro
de Kalman continuo [106].
Tabla 2.1: Panorama histórico de la Teorı́a de Control

Todas las técnicas previamente descritas que involucran conceptos relacionados con
métodos basados en frecuencia corresponden a lo que se conoce como Teorı́a de
Control Clásica, pero a partir de las nuevas e importantes herramientas teóricas
que R. E Kalman y otros investigadores introdujeron a principios de los años 60’s
del siglo pasado se dio el paso a una nueva era en la Teorı́a de Control que se ha
denominado Teorı́a de Control Moderna, cuyo diseño es realizado en el dominio
del tiempo y su método principal es el modelo en espacio de estado, el cual permite
representar sistemas de múltiples entradas y salidas (MIMO por sus siglas en inglés)
como un sistema de una entrada y una salida (SISO) y sus herramientas principales
son el álgebra lineal y matrices.

Cabe resaltar que la Teória de Control Moderna dio la pauta para que se generaran
diversas ramas del Control Automático como son: Control Lineal [53], Control No li-
neal [97], Control Óptimo [207], Control Robusto [51], Control Adaptable [21], Control
2.2. Control de Sistemas No lineales 19

4 5
Jerárquico y Control Inteligente

Por lo anterior, el interés de los investigadores aumentó dando lugar a nuevas dis-
ciplinas como la Mecatrónica6 y debido al rápido avance en la informática y las
comunicaciones, hoy dı́a se ofrecen oportunidades sin precedentes para que el campo
de control amplié sus contribuciones,7 como las que se han realizado en áreas diferen-
tes a la ingenierı́a como sistemas biológicos [178, 179, 180], aplicaciones biomédicas
[75, 208, 28] y sistemas socieconómicos [44, 132, 204, 49].

2.2. Control de Sistemas No lineales


En esta sección se presenta una revisión de algunas investigaciones realizadas en
control de sistemas subactuados que son sistemas que poseen menor cantidad de
entradas de control (actuadores) que grados de libertad. Y de manera particular
se presentan algunos trabajos dedicados al control de sistema tipo péndulo invertido,
que son tema central de este trabajo. Por lo tanto, el enfoque principal de esta tesis es
la sı́ntesis de controladores para estabilizar sistema tipo péndulo invertido y ası́ lograr
una contribución al estado del arte en este tema.

Por tanto, la aportación de este trabajo consiste en estudiar y desarrollar técnicas de


control no lineal para resolver el problema de estabilización del sistema subactuado
tipo péndulo invertido alrededor del punto de equilibrio inestable.

4
Un sistema de control jerárquico es una forma de sistema de control en el cual un conjunto
de dispositivos y software toman la forma de un árbol en donde cada nodo opera por separado,
realizando tareas de un nodo superior, ordenando las tareas de sus nodos subordinados, enviando
señales resumidas a su nodo superior y recibiendo señales de sus nodos subordinados. Las hojas de
los nodos son sensores o actuadores.
5
Abarca diversos tópicos de inteligencia artificial para controlar un sistema dinámico como redes
neuronales, lógica difusa, algoritmos genéticos, cómputo evolutivo, entre otras.
6
La Mecatrónica surge de la combinación sinérgica de distintas ramas de la ingenierı́a, entre las
que destacan la mecánica, la electrónica, la ingenierı́a de cómputo y los sistemas de control. Siendo su
principal propósito el análisis y diseño de productos, y los procesos de manufactura automatizados.
7
Un informe que presenta las conclusiones y recomendaciones de los nuevos desafı́os y oportu-
nidades que afronta la comunidad de Control, se presenta en el libro “Control in an Information
Rich World Report of the Panel on Future Directions in Control, Dynamics, and Systems”[22].
20 Capı́tulo 2. Estado del Arte

Para lograr este resultado es importante comentar los siguientes temas:

1. Control de Sistemas No lineales Subactuados.

2. Control del Sistemas Subactuado tipo Péndulo Invertido.

3. Método de control por moldeo de energı́a.

4. Control de sistemas por funciones de saturación anidadas.

En seguida, presentamos el estado del arte de cada uno de los temas mencionados.

2.2.1. Control de Sistemas No lineales Subactuados


Los sistemas subactuados están compuestos por una amplia gama de sistemas
mecánicos. Por ejemplo, robots móviles no holonómicos, robots bı́pedos, vehı́culos
submarinos, manipuladores con estructura flexible, misiles, satélites de comunica-
ciones, etc. [185]. El término subactuado se refiere a que no todas las uniones o
grados de libertad (GL) del sistema tienen un actuador o son directamente contro-
ladas. Por lo tanto, los investigadores han puesto bastante atención a los problemas
de control asociados con sistemas subactuados y han propuesto diversas estrategias de
control para resolverlo tales como, control por back-stepping [171], control basado en
energı́a o pasividad [63, 128], control adaptable [107], control difuso [116] o inteligente
[47], control hı́brido [66], control por modos deslizantes [211], entre otras.

Existe una extensa literatura de investigación dedicada a este tipo de sistemas [59].
Para una introducción al problema y una clasificación interesante desde el punto de
vista de posibles estrategias para la solución de sistemas subactuados se recomienda
revisar [152, 203, 185]. Otros trabajos en los cuales se presentan diversas estrategias
de control aplicadas a los sistemas subactuados, se pueden encontrar en [39, 2, 85,
76, 30, 119].

En la práctica un pequeño conjunto de sistemas subactuados ha cobrado gran po-


pularidad por el desafió que representan, para los que existe una amplia gama de
2.2. Control de Sistemas No lineales 21

controladores en la literatura. Evidentemente hay una infinidad de ejemplos inexplo-


rados, tantos como queramos idear para lo cual las técnicas existentes se muestran
insuficientes. A continuación, comentaremos algunas investigaciones efectuadas para
solucionar problemas relacionados con el control de sistemas subactuados que han
tenido un impacto considerable en las áreas educativas y de invetigación. Como primer
ejemplo podemos mencionar que M. Spong [182, 183, 184] presenta una excelente in-
troducción al sistema Acrobot 8 utilizando la linelización parcial por retroalimentación
(ver apendice B). Otro trabajo interesante para este sistema es el propuesto por Yan
Zheng et. al. [216], el cual desarrolla una ley de control difusa de estructura varia-
ble que utiliza la teorı́a de Lyapunov para garantizar estabilidad asintótica global.
También [47] presenta un esquema de control inteligente para resolver el problema
de trasladar de la posición colgante hasta la posición invertida del Acrobot, ası́ como
el de mantener el sistema en la posición inestable cuando inicia muy cerca de esta
posición. Otro trabajos dedicados al control de este sistema se pueden encontrar en
[43, 88, 91, 164].

Para un sistema similar al anterior denominado Pendubot, [186] presenta el diseño


y control del sistema usando conceptos tales como linealización parcial por retroali-
mentación, dinámica cero y se comenta su uso con fines eductivos. Fantoni et. al. [63]
proponen un algoritmo de estabilización considerando las propiedades de pasividad
del pendubot y utilizan métodos basados en energı́a para diseñar la ley de control.
Además, el análisis de convergencia se realiza por medio de la Teorı́a de Lyapunov.
Un sistema subactuado muy interesante es el Péndulo de Furuta (péndulo rotacional)
desarrollado por K. Furuta en el Instituto Tecnológico de Tokio. Algunos trabajos re-
levantes sobre el control de este sistema se comentan enseguida. En 1992, Furuta et.
al. [72] propusieron un controlador que utiliza el método de control por retroalimen-
tación del seudo-estado. En 1996, Iwashiro et. al. [98] consideraron el uso de métodos
basado en energı́a para controlar el sistema. En 1999, Olfati-Saber [149] propuso una
estabilización semi-global para el péndulo invertido rotacional usando controladores

8
El Acrobot es robot de 2 eslabones, el cual tiene un actuador en el eslabón 2 (codo).
22 Capı́tulo 2. Estado del Arte

de punto fijo. Fantoni et. al. [60] presentan una técnica de control para estabilizar
el sistema en una orbita homoclı́nica. En [12] se propone un controlador que rea-
liza la estabilización y seguimiento de trayectoria utilizando el enfoque de platitud
diferencial. Un trabajo interesante fue el desarrollado en [145], donde se deriva un
controlador usando la idea de que el sistema puede ser representado como un péndu-
lo plano más una fuerza giroscópica. Gordillo et al. [79] proponen una solución al
problema de trasladar el péndulo de la posición colgante, hasta la posición invertida
aplicando el método del gradiente de velocidad de Fradkov [17, 68] para el modelo de
dimensión 4. Además, se compara esta ley con la estrategia de Åström-Furuta [24]
que utiliza un modelo de dimensión 2. En 2006, C. Aguilar et. al. [9] propusieron una
estrategia para estabilizar el péndulo de Furuta utilizando el método de Lyapunov.

Un sistema que ha atraı́do la atención de los investigadores es el sistema viga-bola


[153] para el cual existen diversos trabajos en donde se proponen estrategias como el
método por retroalimentación aproximada desarrollado por Hauser et al. [89], satura-
ciones anidadas pequeñas [193] y establización por retroalimentación de salida [196].
Sin embargo, la establización del sistema viga-bola por medio de funciones de Lya-
punov se puede encontrar en [170]. El cual está basado en el trabajo de Mazenc y
Praly presentado en [140]. Otro sistema interesante es el Sistema Oscilador Trasla-
cional con Actuador Rotacional (TORA), el cual fue introducido por primera vez en
[201] y ha sido utilizado como un sistema no-lineal estándar en diversos trabajos con
el propósito de comparar y realizar pruebas entre diferentes metodologı́as de con-
trol [48, 100, 108, 197]. Por ejemplo, Escobar et. al. [56] proponen una establización
asintótica global utilizando el moldeo de energı́a y la inyección de amortiguamiento.
En [101] solucionan el problema de establización semi-global por retroalimentación
de la salida y el de seguimiento de trayectoria del sistema TORA, considerando que
el ángulo de la masa y/o la posición de carro son las salidas. Además, en [143] se
presenta un trabajo que incluye una estrategia de control adaptable por medio de
redes neuronales dinámicas.
2.2. Control de Sistemas No lineales 23

El sistema de aterrizaje y despegue de un avión (PVTOL) [90] es otro ejemplo de


sistema subactuado y diversas metodologı́as para controlar este sistema se pueden
encontrar en la literatura. En 1996, Teel [195] ilustró los resultados del teorema de
pequeña ganancia aplicados al sistema PVTOL. Además, este teorema proporciona
los formalismos para analizar el comportamiento de sistemas de control que incluyan
saturaciones. También en 1996, Martin et. al [135] propusieron una extension de los
resultados presentados por Hauser [90]. La idea que presentan es encontrar una salida
plana para el sistema dividiendo el problema de seguimiento en dos etapas. En 2000, R.
Olfati-Saber [151] presenta una configuración de establización global para el sistema
de aterrizaje y despegue de un avión (VTOL) con un acoplamiento de entrada fuerte
usando retroalimentación de estado estática. Otros métodos utilizados para controlar
este sistema se han basado en el método de Lyapunov [62] y en métodos de control
hı́brido [141].

Por otra parte, un sistema subactuado es un ejemplo de sistema mecánico con res-
tricciones no holonómicas de segundo orden [154] que no cumple con la condición
de Brockett [115] en la cual propone un teorema que proporciona las condiciones
necesarias para que exista una ley de control por retroalimentación que estabilice
asintóticamente un sistema [45]. Como consecuencia en muchos sistema subactua-
dos es imposible utilizar una ley de control por retroalimentación para estabilizarlos
alrededor de sus puntos de equilibrio, aunque sea localmente.

Como conclusión, pese a los grandes avances teóricos y experimentales que se han
logrado en los últimos años los resultados distan de tener gran generalidad, aunque
existen trabajos que han logrado generalizar los sistemas subactuados en dos tipos:
Uno es la forma normal en cascada introducido por Olfati-Saber [150] en donde mues-
tra un método que transforma el sistema completo en dos subsistemas no lineales,
reduciendo el problema de control del sistema completo, al de controlar cada subsis-
tema. El otro tipo, propuesto por Murray y Sastry [144], proporciona las condiciones
suficientes para convertir por medio de retroalimentación de estado y transformación
de coordenadas un sistema no holonómico con dos entradas a una forma de cadena.
Por lo tanto, el estado del arte de sistemas subactuados esta muy lejos de encontrar
24 Capı́tulo 2. Estado del Arte

métodos de control que resuelvan toda la gama de esta clase de sistemas, ya que el
desarrollo actual solo ha resuelto cada ejemplo de manera particular. Por lo cual este
trabajo pretende contribuir al estado del arte.

2.2.2. Control del Sistema Subactuado tipo Péndulo


Invertido
Los sistemas tipo péndulo invertido son un conjunto de dispositivos mecánicos
tales como el Péndulo Invertido sobre un Carro [20], el Péndulo con Rueda de Inercia
[187], el Péndulo Esférico Invertido [15], el Péndulo de Furuta [72] que han sido
utilizados en las ultimas décadas por los investigadores como banco de pruebas para
evaluar una amplia gama de métodos de control [18, 19, 34, 205, 109].

Como se ha mencionado, los Sistemas tipo Péndulo Invertido (SPI) están formados
por un péndulo en el cual uno de sus extremos esta unido mediante una articulación
a una base móvil lo que le permite girar libremente y, debido a que la aceleración
angular del péndulo no puede ser controlada, estos sistemas son considerados ejemplos
de sistemas subactuados.

Existen básicamente dos problemas relacionados con el control de péndulos invertidos


que se han estudiado. El primero, es el de llevar el péndulo desde cualquier posición
y en particular de la posición colgante natural hasta la posición invertida. A este
problema se le conoce como swing up.9 El segundo problema consiste en estabilizar
al péndulo alrededor del punto de equilibrio inestable.

De lo anterior, la aportación principal que se presenta en esta tesis, consiste en de-


sarrollar técnicas para resolver el problema de estabilización de algunos sistemas del
tipo péndulo invertido alrededor del punto de equilibrio inestable.

A continuación, comentaremos el estado del arte de algunas investigaciones que se


han realizado al Sistema Péndulo Invertido sobre un Carro, al Péndulo con Disco
9
Por su denominación en inglés
2.2. Control de Sistemas No lineales 25

Inercial, ası́ como al Péndulo Esférico Invertido que son los sistemas que se abordan
en este trabajo.

Comenzaremos con el Péndulo Invertido sobre un Carro (PIC) que es uno de los
sistemas tipo péndulo invertido más estudiados y consiste en un péndulo que gira
libremente por uno de sus extremos mediante una ariculación situada sobre un carro
que se mueve sobre una guı́a rectilı́nea por la acción de una fuerza horizontal. Ini-
cialmente, en los años 60’s del siglo pasado se podia observar el Péndulo Invertido
sobre un Carro en los laboratorios de control de las universidades más prestigiadas
[20]. La demostración consistı́a en situar de manera manual el péndulo en la posición
vertical invertida y soltarlo para que de manera autónoma, retroalimentando su posi-
ción, continuara en la posición invertida mediante la adecuada actuación del carro.
Por ser este un problema de carácter local, únicamente se utilizan métodos lineales
para resolver este problema, como por ejemplo, la técnica de desplazamiento de polos
[85].

Existe en la literatura una amplia gama de trabajos dedicados ha resolver el pro-


blema de control del Péndulo Invertido sobre un Carro. Por lo que, a continuación,
mencionamos algunos trabajos interesantes que han estudiado este problema. Wei et.
al. en [202] presentan una estrategia de control que descompone en etapas la manera
de llevar el péndulo desde la posición de equilibrio estable inferior a la posición de
equilibrio inestable superior, tomando en cuenta que el movimiento horizontal del
carro está restringido. Chung y Hauser [54] proponen una ley de control no-lineal
para regular la posición del carro y la energı́a de oscilación del péndulo, obteniendo
como resultado un sistema en lazo cerrado que posea una órbita periódica localmente
estable. En 1996, Fradkov [67] propuso una estrategia de control para las oscilaciones
no lineales, en particular este método puede ser aplicado para estabilizar el péndulo
invertido. Mazenc y Praly presentan una ley de control que consiste en agregar in-
tegradores, la cual es usada en la estabilización del péndulo invertido en la posición
de equilibrio inestable, cuando éste se encuentra por el encima del plano horizontal
[140]. En 1999, Olfati-Saber [149] fundamentó su trabajo en la linealización parcial
por retroalimentación para desarrollar un procedimiento de estabilización global o
26 Capı́tulo 2. Estado del Arte

semiglobal (fixed point backstepping) el cual se aplicó para estabilizar el sistema en


un punto de equilibrio sobre el plano superior. En contraste con los autores anteriores,
Fantoni y Lozano [59] proponen un enfoque de control muy sencillo comparado con
otras estrategias de control, debido a que sólo considera la energı́a total del sistema
llevando al péndulo a una orbita homoclı́nica mientras el desplazamiento del carro
converge a cero. Por otro lado, en 2003 Salas et. al. [169] diseñaron una ley de con-
trol utilizando técnicas de control no-lineal basadas en forwarding [170], provocando
que la posición superior del péndulo invertido pase a ser asintóticamente estable para
condiciones iniciales que estén dentro de un dominio de atracción predeterminado.
C. Aguilar et. al. [6] proponen una función candidata a Lyapunov para diseñar un
controlador que permite obtener un sistema en lazo cerrado asintóticamente estable
localmente alrededor del punto de equilibrio inestable. Un trabajo recientemente pu-
blicado presenta una solución a los dos problemas de control del péndulo invertido
por medio de una única entrada de control. Teniendo como caracterı́stica que al tener
una sola ley, se evita la necesidad de realizar una comutación entre distintas leyes [80].

Otros enfoques que se han utilizado para resolver la estabilización del Péndulo In-
vertido sobre un Carro son los basados en lógica difusa y redes neuronales. Como
por ejemplo, S. Horikawa et. al [92] proponen un controlador difuso para el péndu-
lo invertido utilizando redes neuronales difusas que son capaces de identificar au-
tomáticamente las reglas difusas. En [131] se presenta un controlador difuso usando
retroalimentación visual permitiendo observar que es posible controlar el sistema por
medio de lógica difusa y retroalimentación visual. Un trabajo donde se utiliza una red
neuronal back-propagation como controlador para estabilizar el péndulo invertido se
presenta en [96]. Otros trabajos interesantes que utilizan los métodos libres de modelo
pueden revisarse en [16, 142, 136].

Como comentario adicional, el Péndulo Invertido sobre un Carro es un sistema que ha


tenido una repercusión importante en la educación, siendo utilizado como base para
el desarrollo de herramienta software/hardware destinada al estudio de sistemas de
control [73, 146], ası́ como el desarrollo de un vehı́culo basado en la estabilización de
2.2. Control de Sistemas No lineales 27

un péndulo invertido, en el cual se prueban diversas estrategias de control con fines


educativos [200].

A continuación, mencionaremos algunos trabajos de otro sistema que se aborda en


esta tesis denominado Péndulo con Disco Inercial (PDI)10 introducido por M. Spong
[187]. Este dispositivo esta constituido por un péndulo unido a un disco giratorio en
uno de sus extremos, el cual gira libremente sobre un eje paralelo al eje de rotación
del péndulo. El disco es accionado por un motor de corriente directa (CD), mientras
que el péndulo es subactuado. El torque del motor produce una aceleración angular
del disco, lo que genera un torque de acoplamiento en el eje del péndulo.

En [187] se presentan un esquema de control basado en métodos de energı́a para


resolver el problema de traslación desde la posición más baja, hasta la posición inver-
tida del sistema Péndulo con Rueda de Inercia, permitiendo mantener el sistema en la
posición inestable cuando inicia su movimiento muy cerca de dicha posición, además,
se muestra que este sistema es linealizable por retroalimentación con respecto a una
salida, suponiendo que el ángulo del péndulo se encuentra encima del plano superior.
Olfati-Saber [151] transforma la dinámica del sistema en un sistema no-lineal en cas-
cada mediante un cambio de coordenadas globales, para proponer una estabilización
asintótica global alrededor del punto de equilibrio superior. Fantoni y Lozano [59]
presentan una estrategia con la cual solucionan la oscilación y balanceo del péndulo
alrededor del punto de equilibrio. La estrategia se basa en la energı́a total del sis-
tema y garantiza la convergencia del péndulo a una orbita homoclı́nica. En [159], el
método de Control Basado en Pasividad con Interconexión y Asignación de Amor-
tiguamiento (IDA-PBC) se utilizó para estabililzar asintóticamente el PDI alrededor
del punto de equilibrio inestable superior. Para lograr lo anterior, se solucionaron dos
condiciones de ajuste que permiten obtener de manera directa el controlador. Cabe
mencionar que en ninguno de los trabajos mencionados se toma en cuenta el efecto
de la fuerza de amortiguamiento en la coordenada no actuada.

10
El péndulo con disco (o rueda) inercial en inglés se denomina Inertial Wheel Pendulum (IWP)
28 Capı́tulo 2. Estado del Arte

Para complementar esta sección mencionaremos algunos trabajos dedicados al control


del sistema Péndulo Esférico Invertido [119], el cual es un miembro más de la familia
de Sistemas subactuados tipo Péndulo Invertido. Este sistema es una versión más
general que el péndulo en dos dimensiones.

Para controlar este sistema en el año 2000, Albouy y Praly [15] diseñaron un con-
trolador basado en pasividad para llevar el péndulo a la posición superior con poca
velocidad y cambiar de un controlador no-lineal a uno lineal, para mantener el péndu-
lo en la posición superior. Bloch et.al. [35] solucionan el problema de estabilización
no local por medio de un controlador Lagrangiano. Sin embargo, no garantizan la
convergencia asintótica al origen. Otro trabajo interesante fue desarrollo por G. Liu
et. al. [122] donde se presenta un controlador que es capaz de estabilizar las posi-
ciones angulares del péndulo garantizando la estabilidad local del sistema completo
por medio de saturaciones anidadas. Hoshino et.al. [93] describen la estabilización de
un triple péndulo esférico alrededor de la posición superior usando un manipulador
planar y sensores de visión. Para obtener mejores resultados, los autores diseñaron
el péndulo y el controlador. En [172], se presenta un nuevo modelo para el péndulo
en tres dimensiones y se soluciona el problema de control, considerando al sistema
como un caso de cuerpo rı́gido. Además, en este trabajo se comentan algunos retos
de investigación interesantes de este sistema. Otros trabajos interesantes que abarcan
este tópico se pueden encontrar en [124, 120, 123, 121]. En las siguientes secciones de
esta tesis se presentan una serie de desarrollos para solucionar el problema de esta-
bilización de algunos sistemas tipo péndulo invertido tales como el péndulo invertido
sobre un carro, el péndulo con rueda inercial y el péndulo esférico invertido alrededor
del punto de equilibrio inestable. Contribuyendo al estado del arte de este tema.

2.2.3. Método de Sı́ntesis de Controladores que preservan la


estructura Lagrangiana/Hamiltoniana
En la literatura de control existen técnicas que permiten estabilizar en el punto
de equilibrio deseado a los sistemas subactuados mediante leyes de control diseñadas
2.2. Control de Sistemas No lineales 29

por medio de procedimientos relativamente sistemáticos. La idea principal de estos


métodos es buscar una ley de control que transforme el sistema en lazo cerrado origi-
nal en otro sistema mecánico con ciertas propiedades de estabilidad. Es decir, que se
conserve la estructura fı́sica del sistema. Para lograr la establización de sistemas sub-
actuados mediante estos métodos es necesario moldear la energı́a cinética y energı́a
potencial del sistema y obtener un sistema en lazo cerrado con una energı́a modifica-
da. Estos métodos se han basado en la estructura Hamiltoniana y Lagrangiana para
abordar este tipo de problemas.

El método que utiliza los formalismos de Euler-Lagrange fue desarrollado por el


grupo de Marsden, Bloch y Leonard [36] dando pauta para un serie de artı́culos
[37, 34, 35, 33, 209] y fue extendido por D. Auckly [27, 25, 26], J. Hamberg [86, 87] y
Zenkov [214, 38] denominándolo Método de Lagrangianos Controlados. La prin-
cipal caracterı́stica de este método es determinar una ley de control que transforme
el sistema en lazo cerrado original en otro sistema mecánico a partir de solucionar un
conjunto de Ecuaciones Diferenciales Parciales (EDP) denominadas condiciones de
ajuste (Matching Condition), cuya solución es una función total de energı́a modifi-
cada, que permite obtener de forma directa dicha ley de control.

Una metodologı́a similar a la anterior fue desarrollada a principios del año 2000 por
R. Ortega et. al [162, 161, 159, 77, 156] cuyas ideas se basan en los formalismos de
los Sistemas Hamiltonianos controlados por puertos (port-controlled Hamiltonian),
llamándolo Método de Control Basado en Pasividad con Interconexión y
Asignación de Amortiguamiento (IDA-PBC) y su objetivo también es encon-
trar una ley de control que conserve la estructura del sistema a partir de un conjunto
de EDP, con la diferencia que al utilizar la estructura hamiltoniana es posible encon-
trar una gama más amplia de soluciones a estas EDP, permitiendo encontrar diversas
funciones de energı́a modificada.

Como comentario adicional, en la literatura se describe de manera clara la equivalencia


entre el método de control basado en pasividad con interconexión y asignación de
30 Capı́tulo 2. Estado del Arte

amortiguamiento y el método de Lagrangianos Controlados [32, 52]. A continuación,


describiremos brevemente cada uno de los métodos.

A. Método IDA-PBC

El método de sı́ntesis Basado en Pasividad denominado Interconexión y Asig-


nación de Amortiguamiento [159] o IDA-PBC tiene las siguientes caracterı́sticas:

1. Está formulado para la clase de sistemas Hamiltonianos Controlados por Puertos


(PHC), que es una clase que contiene estrictamente los sistemas de Euler-
Lagrange

2. La función de energı́a en lazo cerrado se obtiene al resolver un sistema de


Ecuaciones Diferenciales Parciales (EDP), parametrizadas en términos de las
matrices de interconexión y amortiguamiento, las cuales pueden ser elegidas
cuidadosamente invocando consideraciones fı́sicas para resolverlas.

Para aplicar el método, considere un sistema subactuado con una función energı́a en
la forma Hamilton descrita como sigue:

1
H(q, p) = pT M −1 (q)p + V (q) (2.1)
2
Donde q ∈ Rn , p ∈ Rn , son las posiciones y momentos generalizados respectiva-
mente, M (q) = M (q)T > 0 es la matriz de inercia, y V (q) es la energı́a potencial. Si
suponemos que el sistema no tiene amortiguamiento natural, entonces las ecuaciones
de movimiento pueden escribirse como
" # " #" # " #
q̇ 0 In ∇q H 0
= + u (2.2)
ṗ −In 0 ∇p H G(q)

La matriz G ∈ Rn×m es determinada por el modo en que el controlador u ∈ Rn


actúa sobre el sistema.
2.2. Control de Sistemas No lineales 31

El método IDA-PBC sigue dos pasos básicos del Control Basado en Pasividad (PBC)
[158]:

1. Moldeo de energı́a: esto significa modificar la función total de energı́a del sistema
para asignar el punto de equilibrio (q ∗ , 0).

2. Inyección de amortiguamiento para lograr estabilidad asintótica en el sistema.


Además, para mantener la interpretación del mecanismo de estabilización se re-
quiere que el sistema en lazo cerrado sea en la forma de Hamiltoniano controlado
por puertos [198].

Enseguida, comentaremos los aspectos más importantes de este método para un es-
tudio más detallado consultar [159].

En este método se persigue una dinámica en lazo cerrado con función de energı́a de
la forma:

1
Hd (q, p) = pT Md−1 (q)p + Vd (q) (2.3)
2
Donde Md (q) = Md (q)T > 0 y Vd (q) representan la matriz de inercia y la energı́a
potencial en lazo cerrado respectivamente.

Además, la dinámica de un sistema Hamiltoniano Controlado por Puertos debe ser


de la siguiente manera.11

" # " #
q̇ ∇q Hd
= [Jd (q, p) − Rd (q, p)] (2.4)
ṗ ∇p H d
Siendo,

" # " #
0 M −1 Md 0 0
Jd (q, p) = −JdT (q, p) = ; Rd = RdT =
−1
−Md M J2 (q, p) 0 GKv GT
11
Para una justificación analı́tica y fı́sica ver [160, 198].
32 Capı́tulo 2. Estado del Arte

que representan una matriz antisimétrica que permite aumentar los grados de libertad
en el diseño, también llamada de interconexión generalizada y la matriz de disipación
en lazo cerrado, respectivamente.

Para poder obtener la ley de control que conserve la estructura del sistema, las ecua-
ciones de estado en lazo abierto y cerrado se deben ajustar exactamente. Esto quiere
decir que la ley de control debe calcularse de modo que:

" # " # " #" # " #


q̇ ∇q H d 0 In ∇q H 0
= [Jd (q, p) − Rd (q, p)] = + u (2.5)
ṗ ∇p H d −In 0 ∇p H G(q)

Podemos mencionar que este método presenta dificultades cuando los sistemas son
subactuados, ya que el conjunto de funciones de Hamilton Hd alcanzables en lazo
cerrado es limitado y depende de la facilidad para resolver un sistema de Ecuaciones
Diferenciales Parciales (EDP). Por lo cual, en el caso subactuado existe una matriz
G⊥ de rango r < n siendo n el número de grados de libertad que representa las
direcciones en las que la ley de control no tiene efecto, cumpliéndose que:

G⊥ G = 0 (2.6)

es decir, si G es una matriz constante, las filas de G⊥ forman el núcleo de G.

Si multiplicamos (2.5) por G⊥ se obtiene:

" # " #" # " #



∇q H d ⊥
0 In ∇q H 0
G [Jd (q, p) − Rd (q, p)] =G + (2.7)
∇p H d −In 0 ∇p H G(q)

Esta ecuación deben cumplirse para cualquier valor de la ley de control, y por lo
tanto, representa una restricción en el conjunto de sistemas hamiltonianos alcanza-
bles en lazo cerrado definidos por las matrices (Hd , Jd ,Rd ). Como consecuencia, los
parámetros (Hd , Jd ,Rd ) deben ser seleccionados de tal manera que se cumplan las
ecuaciones de ajuste derivadas de (2.7) y al mismo tiempo representar una dinámica
2.2. Control de Sistemas No lineales 33

en lazo cerrado con las propiedades de estabilidad deseadas.

Entonces, si existe un solución para las ecuaciones de ajuste obtenidas de (2.7), es


decir, la solución de (2.2) es igual a la de (2.4), podemos decir que la ley de control
esta dada por:

u = (GT G)−1 GT (∇q H − Md M −1 ∇q Hd + J2 Md−1 p) (2.8)

Como conclusión, la esencia de el método IDA-PBC es proporcionar métodos de


cálculo para determinar los valores más adecuados de Hd , Jd y Rd, y ası́ obtener leyes
de control para el ajuste lazo abierto-lazo cerrado.

B. Método de lagrangianos controlados

El método de Lagrangianos Controlados fue introducido por Bloch et.al. [36]


para controlar sistemas subactuados y posteriormente fue extendido y formalizado
[37, 34, 86, 35, 33, 27].

Este método es una técnica constructiva para estabilizar sistemas subactuados, en la


cual se modifica el Lagrangiano del sistema original para construir un Lagrangiano
controlado. Definiéndose el Lagrangiano (L) como la diferencia entre la energı́a cinética
y la energı́a potencial. Las ecuaciones de Euler-Lagrange derivadas del Lagrangiano
controlado describen al sistema en lazo cerrado, donde los nuevos términos que apare-
cen en las ecuaciones de movimiento permiten determinar las entradas de control.
A continuación expondremos brevemente sus fundamentos. Dado un sistema mecánico,
descrito por las ecuaciones de Euler-Lagrange
µ ¶ µ ¶
d ∂L ∂L
− = ui (2.9)
dt ∂ q˙i ∂qi
Siendo, i= (1,....n).

Donde, eventualmente, algunos de los términos de control ui pueden ser nulos. Suponien-
do que el objetivo es estabilizar el sistema en un punto de equilibrio deseado (q ∗ , q̇ ∗ ),
34 Capı́tulo 2. Estado del Arte

para lograr lo anterior, el método de Lagrangianos controlados propone una mane-


ra de encontrar un sistema Euler-Lagrange, definido por el Lagrangiano Lc , tal que
(q ∗ , q̇ ∗ ) es un punto de equilibrio estable de la dinámica en lazo cerrado.

µ ¶ µ ¶
d ∂Lc ∂Lc
− = ũi (2.10)
dt ∂ q˙i ∂qi

Con, i= (1,....n).
Por tanto, este método consiste en encontrar una ley de control u que transforme al
sistema (2.9) en el sistema en lazo cerrado (2.10) a partir de la solución de un conjunto
de ecuaciones diferenciales llamadas condiciones de ajuste. Esto significa que las
soluciones q(t) de las trayectorias del sistema (2.9) sean también las trayectorias de
(2.10).

En [37, 86, 35] se enuncian algunos teoremas que establecen las condiciones que debe
cumplir el conjunto de Lagrangianos controlados, este resultado es conocido como
teorema de ajuste o matching theorem, a continuación se resume brevemente.

Utilizando la notación de [86, 37], los Lagrangianos en lazo abierto y cerrado


toman, respectivamente, la forma

1
L(q, q̇) = gij (q)q̇ i q̇ j − V (q) (2.11)
2

1
Lc (q, q̇) = g̃ij (q)q̇ i q̇ j − Ṽ (q) (2.12)
2

donde, gij y g̃ij representan los elementos de la matriz de inercia en lazo abierto y
cerrado, respectivamente. En caso de que el sistema presentado en (2.11) sea subac-
tuado implica la existencia de una variedad no nula denominada subespacio de las
direcciones no actuadas (Λ). La proyección en este espacio se representa por ΛiA ui = 0
(A = 1 · · · m). Empleando los sı́mbolos de Christoffel Γijk y Γ̃ijk de las matrices gij y
g̃ij [1], y definiendo
2.2. Control de Sistemas No lineales 35

i
Tjk = Γ̃ijk − Γijk
hji = gik g̃ kj
h̃ji = g̃ik g̃ kj
Tijk = hpi hqj hrk g̃pn Tqr
n

donde, g ij y g̃ ij representan las inversas de gij y g˜ij , respectivamente. Enseguida,


presentamos los Teoremas de ajuste propuesto por J. Hamberg [86].

Teorema 2.2.1 [Teorema 2.1]Teorema de ajuste (Matching Theorem)

L̃c está ajustado (es decir, cumple (2.10) cuando ũi = 0) si y solo si las siguientes
condiciones se cumplen.

ΛiA gil Tjk


l
=0
ΛiA hji ∂q
∂ Ṽ i ∂V
j = ΛA ∂q i

Cuando las condiciones anteriores se cumplen, la ley de control en lazo cerrado es de


la forma:

∂V ∂ Ṽ
ui = − hji l j k
− gil Tjk q̇ q̇
∂qi ∂qj
Por otro parte, este método también comprende la adición de un término de amor-
tiguamiento para lograr la estabilidad asintótica de sus puntos de equilibrio, el si-
guiente teorema da las condiciones para cumplir lo anterior.

Teorema 2.2.2 [Teorema 2.2]Teorema de Ajuste Generalizado (Generalized


Matching Theorem)

Se tiene un ajuste generalizado (es decir, ũi (q, q̇)q̇ i ≤ 0 ) si las siguientes condi-
ciones se cumplen:

symm(Tijk ΛiA ΛjB ΛkC ) = 0


ABC
ΛiA hji ∂q
∂ Ṽ i ∂V
j ≡ ΛA ∂q i
36 Capı́tulo 2. Estado del Arte

donde symm denota la parte simétrica.

Además, con el fin de obtener estabilidad asintótica del punto de equilibrio inestable
utilizando el método de Lagrangianos controlados y el ajuste generalizado, se debe
12
asegurar que la energı́a Ẽ tenga un mı́nimo en el punto de equilibrio.

2.2.4. Control por medio de funciones de Saturación


Anidadas
Esta técnica fue introducida por A. R. Teel para estabilizar una cadena de in-
tegradores lineal y recientemente ha sido utilizado para controlar algunos sistemas
subactuados. Enseguida, ilustraremos de manera breve sus fundamentos, un expli-
cación más detallada se puede encontrar en [192].

Como primer aspecto, definiremos la función de saturación como sigue:

Definición 2.2.1 (Función de saturación lineal)


Dadas dos constantes positivas L, M con L ≤ M , una función σ : R → R se
denomina un saturación lineal para (L, M ) si es función continua, no decreciente y
satisface:

1. sσ(s) > 0 ∀s 6= 0

2. σ(s) = 0 cuando |s| ≤ L

3. |σ(s)| ≤ M ∀s ∈ R

Consideremos un sistema lineal constituido por multiples integradores de la forma:

ẋ1 = x2
ẋ2 = x3
.. (2.13)
.
ẋn = u
12 ∂ L̃ i
La energı́a Ẽ se define como Ẽ , ∂ q̇ i q̇ − L̃
2.2. Control de Sistemas No lineales 37

La idea fundamental de esta técnica es encontrar una ley de control que estabilice
asintóticamente de forma global el sistema (2.13), derivándose el siguiente teorema

Teorema 2.2.3 Existe una función lineal hi : Rn → R tal que, para cualquier con-
Li+1
junto de constantes {(L, M )} donde Li ≤ Mi para i = 1, ...., n y Mi < 2
para
i = 1, ...., n − 1, y para cualquier conjunto de funciones {σi } que son saturaciones
lineales para {(Li , Mi )}, el control acotado

u = −σn (hn (x) + σn−1 (hn−1 (x) + · · · + σ1 (h1 (x))) · · · )

dé como resultado una estabilización asintótica global del sistema (2.13)

A continuación, la demostración del teorema anterior para una mejor comprensión.

Demostración Consideremos la siguiente transformación de coordenadas y = T x la


cual transforma el sistema (2.13) en ẏ = Ay + Bu donde A y B son definidas como:
 
0 1 ··· 1  
. .  1
 .. . . . . . ...  .
 
A=  B= .
.
 0 · · · 0 1
  1
0 ··· ··· 0
Teniendo la transformación la siguiente caracterı́sticas

i
à !
X i
yn−i = xn−i
j=0 j
donde à !
i i!
=
j j!(i − j)!

y la transformación inversa se caracteriza por

i
à !
X i
xn−i = (−1)i+j yn−i
j=0 j
38 Capı́tulo 2. Estado del Arte

Entonces, a partir de la siguiente ley de control u

u = −σn (yn + σn−1 (yn−1 + · · · + σ1 (y1 )) · · · ) (2.14)

se obtiene el siguiente sistema en lazo cerrado

ẏ1 = y2 + · · · + yn + u
ẏ2 = y3 + · · · + yn + u
..
. (2.15)
ẏn−1 = yn + u
ẏn = u

Enseguida, consideremos la evolución del estado yn , para lo cual se propone la función


de Lyapunov Vn = yn2 , donde su derivada V̇n es de la forma:

V̇n = −2yn [σn (yn + σn−1 (yn−1 + · · · + σ1 (y1 )) · · · )]

Entonces, si aplicamos la condición 1 de la definición 2.2.1, a σn y la condición 3 a


σn−1 , ası́ como el hecho que Mn−1 < L2n , entonces V˙n < 0 ∀yn ∈ / Qn {yn : |yn | ≤ L2n }.
Por consiguiente, existirá un tiempo finito en el cual yn pertenece y permanece en Qn .
Además, debido a que el lado derecho de (2.15) es globalmente Lipschiz, los estados
restantes son acotados.

Ahora consideremos la evolución del estado yn−1 . Y observemos que yn ahora es parte
de Qn , por lo cual el argumento de σn esta acotado por
Ln
|yn + σn−1 (yn−1 + · · · + σ1 (y1 )) · · · )| ≤ + Mn−1
2
≤ Ln

Por tanto, σn opera en la región lineal como se establece en la condición 2 de la


definición (2.2.1). Quedando la evolución de yn−1 como:

ẏn−1 = −σn−1 (yn−1 + · · · + σ1 (y1 )) · · · )


2.3. Fundamentos Teóricos 39

Utilizando el mismo razonamiento de yn se puede demostrar que yn−1 pertenece y


permanece en el conjunto Qn−1 después de un tiempo finito. Por tanto, este procedi-
miento puede ser utilizado para mostrar que después de un tiempo finito el argumento
de las funciones σi se comporta como una función lineal. Como consecuencia, después
de un tiempo finito, la ecuación de lazo cerrado tiene la siguiente forma:

ẏ1 = −y1
ẏ2 = −y1 − y2
..
.
ẏn = −y1 − y2 − · · · − yn
Se puede observar de manera clara que el sistema anterior es exponencialmente estable
después de un tiempo finito.

Cabe comentar, que recientemente el control por funciones de saturación anidadas


se ha utilizado para solucionar el problema de estabilización en algunos sistemas
subactuados, tales como: el PVTOL [65, 126, 50, 213], el Péndulo Invertido sobre un
Carro [127, 61], el Péndulo con Rueda de Inercia [213] y el sistema viga-bola [194].

2.3. Fundamentos Teóricos

2.3.1. Estabilidad de Lyapunov


En los sistemas de control una de las interrogantes más importantes consiste en
saber si el sistema es estable o no, debido a que si el sistema de control es inestable,
tı́picamente éste es inútil.

En el siglo XIX, el matemático Ruso Mikhailovich Lyapunov introdujo la aproxi-


mación más útil y general para el estudio de la estabilidad en los sistemas no-lineales
en su trabajo denominado “El problema general de la estabilidad en el movimien-
to”(The General Problem of Motion Stability) [129], en el que incluyó dos
métodos para el análisis de la estabilidad (denominados, Método de linealización y
40 Capı́tulo 2. Estado del Arte

Método directo). El método de linealización describe la estabilidad local de los sis-


temas no-lineales alrededor de un punto de equilibrio a partir de las propiedades de
estabilidad de su aproximación lineal. Por otro lado, el método directo no se restringe
a un movimiento local, y determina las propiedades de estabilidad del sistema par-
tiendo de la construcción de una función escalar de energı́a examinando su variación
en el tiempo. En la actualidad, estos métodos son de gran interés en la Teorı́a de Con-
trol debido a que el método de linealización es la justificación teórica de la estabilidad
en los sistemas lineales mientras que el método directo es una de las herramientas
más importantes para el análisis y diseño de sistemas no-lineales, por lo que ambos
constituyen la Teorı́a de estabilidad de Lyapunov .

Los resultados presentados en esta sección son ampliamente conocidos y empleados en


la literatura del control no-lineal [110, 177, 97]. Por lo que el propósito de este apartado
no es presentar un tratado sobre la Teorı́a de Lyapunov, sino mostrar algunas de las
definiciones y conceptos básicos. Incluyéndose únicamente con el propósito de crear
un texto de autocontenido, ya que son esenciales para los desarrollos de esta tesis.

Considérese un sistema autónomo de la forma:

ẋ = f (x) (2.16)

donde x ∈ Rn . De manera mas general, x denota un conjunto de coordenadas locales


en un espacio m-dimensional X . Además, suponemos que f : D → Rn es localmente
continua en el sentido de Lipschitz en el dominio D ⊂ Rn , implicando la existencia y
unicidad de soluciones.

Definición 2.3.1 [E. Stoline, 1991, Definición 3.2](Punto de Equilibrio)


Un estado x∗ es un estado de equilibrio (o punto de equilibrio) del sistema si alguna
solución x(t) es igual a x∗ y permanece igual a x∗ para todo el tiempo futuro.
Matemáticamente esto significa que el vector constante x∗ satisface:

0 = f (x∗ ) (2.17)
2.3. Fundamentos Teóricos 41

con, f (x) de la forma (2.16)

Lo anterior significa que los puntos de equilibrio se determinan solucionando la ecuación


algebraica (2.17).

Definición 2.3.2 [Khalil, 1996, Definición 3.1]


El punto de equilibrio del sistema (2.16) es:

Estable, si para cada ² > 0 hay un δ = δ(²) > 0 tal que:

kx (0)k < δ ⇒ kx (t)k < ε, ∀t ≥ 0

Inestable, si no es estable.

Asintóticamente estable, si el punto de equilibrio es estable y δ puede elegirse


tal que:

kx (0)k < δ ⇒ lı́m x (t) = 0


t→∞

Exponencialmente estable, si existen dos números estrictamente positivos


independientes del tiempo α y λ tal que:

kx (t)k ≤ α kx (0)k e(−λt) , ∀t > 0

en alguna bola B alrededor del origen.


Esto significa que el vector de estado de un sistema exponencialmente estable converge
al origen más rápido que una función exponencial. El número positivo λ es llamado
razón de convergencia exponencial.

Las definiciones anteriores corresponden a una propiedad local del sistema alrededor
del punto de equilibrio. Por tanto, los conceptos de estabilidad llegan a ser globales
cuando se satisfacen las condiciones correspondientes para cualquier estado inicial.
42 Capı́tulo 2. Estado del Arte

Método directo de Lyapunov (Definiciones y Teoremas)

El método directo de Lyapunov es una extensión matemática de las observaciones


fı́sicas, es decir, si la energı́a total de un sistema mecánico (o eléctrico) se disipa de
manera continua, entonces dicho sistema, ya sea lineal o no lineal, se estabiliza en un
punto de equilibrio, concluyendo que la estabilidad de un sistema se puede determinar
con la variación de una sola función escalar.
Las siguientes definiciones y teoremas son parte importante para el estudio de la es-
tabilidad en los sistemas y resumen de manera general el método directo de Lyapunov.

Definición 2.3.3 [E. Stoline, 1991, Definición 3.7]


(Funciones definidas o semidefinidas)

Una función escalar V (x) se dice localmente definida positiva si V (0) = 0 y V (x) > 0
para x 6= 0.
De manera similar, V (x) es definida negativa si −V (x) es definida positiva.

Además, si V (x) es igual a cero para x 6= 0, se puede decir que la función es semi-
definida positiva o negativa:

Si V (0) = 0 y V (x) ≥ 0 para x 6= 0 se le llama semi-definida positiva; de la misma


manera V (x) es semi-definida negativa, si −V (x) es semi-definida positiva.

Definición 2.3.4 [E. Stoline, 1991 Definición 3.8](Función de Lyapunov)

V (x) se llama función de Lyapunov para el sistema de la forma (2.16)

Si en una bola B que contiene el origen, V (x) es definida positiva y tiene deriva-
da parcial continua.

Si la derivada con respecto al tiempo a lo largo de cualquier trayectoria de estado


del sistema (2.16) es semi-definida negativa, es decir:
2.3. Fundamentos Teóricos 43

dV ∂V ∂V
V̇ (x) = = ẋ = f (x) ≤ 0
dt ∂x ∂x
ó bien,
V̇ (x) ≤ 0

Los siguientes teoremas pueden ser usados para el análisis de estabilidad local ó global.

Teorema 2.3.1 [E. Stoline, 1991, Teorema 3.2](Estabilidad local)

Si en una bola B existe una función escalar continuamente diferenciable V (x) tal que:

V (x) sea definida positiva (localmente en B)

V̇ (x) sea semi-definida negativa (locamente en B)

Entonces, el punto de equilibrio 0 es estable.

Más aun, si la derivada V̇ (x) es definida negativa localmente en B, es decir,

V (x) < 0 en B − {0}

entonces, el punto de equilibrio 0 es asintóticamente estable.

Teorema 2.3.2 [E. Stoline, 1991, Teorema 3.3](Estabilidad Global)

Supongamos que existe una función escalar V del estado x con primera derivada
continua tal que:

V (x) es definida positiva

V̇ (x) es definida negativa

V (x) → ∞ como kxk → ∞

Entonces, el punto de equilibrio en el origen es asintóticamene estable global-


mente.
44 Capı́tulo 2. Estado del Arte

Teoremas de conjuntos invariantes

Krasovskii-LaSalle extendieron el análisis de estabilidad anterior cuando V̇ (x) es


sólo semi-definida negativa. El punto central en estos teoremas es el conjunto inva-
riante, el cual es una generalización del concepto de punto de equilibrio.

Definición 2.3.5 [E. Stoline, 1991, Definición 3.9](Conjuntos invariantes)


Un conjunto S es un conjunto invariante para un sistema dinámico si para cada
trayectoria del sistema la cual comienza desde un punto en S permanece en S todo el
tiempo.

Teorema 2.3.3 [Khalil, 1996, Teorema 3.4](Principio de invariancia de LaSalle)


Sea Ω un conjunto compacto (cerrado y acotado) con la propiedad de que cada solu-
ción del sistema (2.16) que comienza en Ω permanece en Ω todo el tiempo. Sea V :
Ω → R una función continua y diferenciable tal que V̇ (x) ≤ 0 en Ω.
Sea E el conjunto de todos los puntos de Ω donde V̇ (x) = 0. Sea M el mayor conjunto
invariante, entonces toda solución que comienza en Ω tiende a M cuando t → ∞.

Cuando V (x) es definida positiva los siguientes dos corolarios son válidos exten-
diendo los teoremas de estabilidad.

Corolario 2.3.4 [Khalil, 1996, Corolario 3.1] (Barbashin-LaSalle)

Sea x = 0 un punto de equilibrio de (2.16). Sea V : D → R una función definida


positiva, contı́nuamente diferenciable en un dominio D que contiene al origen x = 0,
tal que V̇ (x) ≤ 0 en D. Sea S = {x ∈ D | V̇ (x) = 0} y supongamos que ninguna
solución, excepto la trivial x(t) = 0, puede permanecer idénticamente en S, entonces,
el origen es asintóticamente estable.

Corolario 2.3.5 [Khalil, 1996, Corolario 3.2] (Krasovskii-LaSalle)

Sea x = 0 un punto de equilibrio de (2.16). Sea V : Rn → R una función definida


positiva continuamente diferenciable y radialmente no acotada, tal que V̇ (x) ≤ 0 para
2.3. Fundamentos Teóricos 45

todo x ∈ Rn . Sea S = {x ∈ Rn | V̇ (x) = 0} y supongamos que ninguna solución,


excepto la trivial x(t) = 0, puede permanecer idénticamente en S, entonces, el origen
es asintóticamente estable globalmente.

Es importante mencionar que cuando V̇ (x) es definida negativa, S = {0} , entonces


los corolarios 2.3.4 y 2.3.5 coinciden con los teoremas 2.3.1 y 2.3.2 respectivamente.

2.3.2. Pasividad y Disipatividad

Los conceptos que se describirán enseguida pueden ser estudiados con mayor de-
talle en: [199] para estabilidad L2 , [198] para pasividad e interconexión de sistemas
pasivos, [157] para control basado en pasividad de sistemas EL, y [125] para sistemas
disipativos.

A. Estabilidad Lq

Definición 2.3.6 (Espacios Lq )


Para cada q ∈ {1, 2, · · · } se define Lq [0.∞] = Lq como el conjunto de funciones
13
medibles f : R+ → R que satisfagan

Z ∞
|f (t)|q dt < ∞
0

A su vez, L∞ [0, ∞] = L∞ consiste en un conjunto de funciones medibles f : R+ →


R acotadas, es decir

sup |f (t)| < 0


t∈R+

Además, se conoce que para estos espacios es posible definir las siguientes normas:
13
Una función es medible si es el lı́mite punto por punto de una secuencia de funciones constantes
a trozos, excepto un conjunto de medida cero.
46 Capı́tulo 2. Estado del Arte

Definición 2.3.7 (Norma Lq )


Para toda función f : R+ → R contenida en Lq se definen las normas

¡R ∞ ¢ 1q
kf kq = 0
|f (t)|q dt q = 1, 2, · · ·

kf k∞ = sup |f (t)|
t∈[0,∞)

Asimismo, en el caso del espacio L2 la norma esta asociada al producto interior de


dos funciones f , g contenidas en L2 definido como
Z ∞
< f |g >= f (t)T g(t)dt
0
de donde se deduce:

1
kf k2 =< f |f > 2

Por otro lado, para las funciones no acotadas sin tiempo de escape finito se define el
espacio extendido Lqe

Definición 2.3.8 (Espacios Lqe )

Sea f : R+ → R. Entonces, para cualquier T ∈ R+ la función fT : R+ → R se


define como

f (t) , 0 ≤ t < T
fT (t) =
0 , t≥T
denominándose la truncación de f en el intervalo [0, T ].
Para cada q = 1, 2, ..., ∞, el espacio Lqe consiste en todas las funciones medibles
f : R+ → R tal que fT ∈ Lq para todo T con 0 ≤ T < ∞. Lqe se denomina el espacio
extendido de Lq .

Lo expuesto anteriormente se puede extender trivialmente a funciones f : R+ → R


suponiendo la existencia de una norma definida en Rn . Los conceptos presentados son
2.3. Fundamentos Teóricos 47

elementales para las siguientes definiciones de estabilidad Lq entrada-salida.


Para representar la dinámica de un sistema haremos uso del concepto más general,
mapa de entrada-salida. Sea U un espacio lineal m-dimensional con norma k.kU , e
Y otro espacio lineal p-dimensional con norma k.kY y considere el espacio de señal
de entrada Lqe (U ) y el el espacio de señales de salida Lqe (Y ) junto a una aplicación
entrada-salida

G : Lqe (U ) → Lqe (Y )
u 7→ y = G(u)

Definición 2.3.9 (Estabilidad Lqe )

Sea un sistema representado por el mapeo G : Lqe (U ) → Lqe (Y ). Entonces, se dice


que G es Lq -estable si

u ∈ Lq (U ) ⇒ G(U ) ∈ Lq (y)

es decir, G aplica el subconjunto Lq (U ) ⊂ Lqe (U ) en el subconjunto Lq (Y ) ⊂


Lqe (Y )

B. Pasividad y Ganancia L2

Considere un sistema descrito en variables de estado de la forma

P ẋ = f (x, u) , u ∈ U
:
y = h(x, u) , y ∈ Y
donde x = (x1 , ..., xn ) son las coordenadas locales en una variedad X y U e Y son
espacios lineales, de dimensiones m y p, respectivamente. En el espacio de estados
U × Y de variables externas se define la función

s:U ×Y

denominada tasa de suministro.


48 Capı́tulo 2. Estado del Arte

Definición 2.3.10 (Disipatividad)


P
Un sistema en variables de estado se dice que es disipativo con respecto a la tasa de
suministro w si existe una función S : X → R+ , llamada función de almacenamiento,
tal que para todo x ∈ X , ∀t1 ≥ t0 y todas las funciones de entrada u
Z t1
S(x(t1 ) ≤ S(x(t0 ) + w(u(t), y(t))dt (2.18)
t0

La desigualdad (2.18) se conoce como desigualdad de disipatividad [206].

Definición 2.3.11 (Pasividad)


P
Un sistema en variables de estado con U = Y = Rm es pasivo si es disipativo
P
con respecto a la tasa de suministro w(u, y) = uT y. es estrictamente pasivo a la
P
entrada si existe δ > 0, tal que es disipativo con respecto a w(u, y) = uT y − δkuk2 .
P P
es estrictamente pasivo a la salida si existe ² > 0, tal que es disipativo con
P
respecto a w(u, y) = uT y − ²kyk2 . Finalmente, es conservativo si se cumple (2.18)
con el signo de igualdad con respecto a la función w(u, y) = uT y.
P
Definición 2.3.12 (Ganancia L2 ) Un sistema en variables de estado con U =
Rm , Y = Rp , tiene ganancia L2 ≤ γ si es disipativo con respecto a la tasa de suminis-
P P P
tro w(u, y) = 12 γ 2 kuk2 − kyk2 . La ganancia L∈ de se define como γ( )=inf{γ|
P
tiene ganancia L2 ≤ γ} Se dice que tiene ganancia L2 < γ si existe γ̃ < γ, tal que
P
tenga ganancia L2 < γ̃

Existe un resultado fundamental que relaciona la pasividad con la ganancia L2 y se


menciona a continuación.
P
Proposición 2.3.6 Si el sistema es pasivo estrictamente a la salida, entonces
tiene ganancia L2 finita.

2.3.3. Sistemas No holonómicos


Los sistemas no holómicos son sistemas mecánicos que tienen restricciones de ve-
locidades o aceleración las cuales no pueden ser integradas.
2.3. Fundamentos Teóricos 49

Este término fue concebido por Hertz en 1894 [168]. Y los ejemplo más tı́picos son
sistemas ó vehı́culos móviles [38].

A continuación, comentaremos las definiciones de los sistemas holonómicos y no


holonómicos.

Definición 2.3.13 [Goldstein, 2001 [74]](Sistemas Holonómicos)


Considere un sistema de coordenadas generalizadas q

q̈ = f (q, q̇, u)

supongamos que existen restricciones que limitan el movimiento del sistema. Si las
condiciones de restricción pueden expresarse como ecuaciones que conectan las coor-
denadas (y posiblemente el tiempo) de la forma

h(q, t) = 0 (2.19)

entonces las restricciones se denominan holonómicas, las cuales pueden integrarse


para obtener la derivada de alguna función de las coordenadas generalizadas.

Definición 2.3.14 [Goldstein, 2001 [74]](Sistemas No holonómicos)

Cuando no es posible expresar las ecuaciones de restricciones de la forma (2.19)


se les denomina No holonómicas, esto significa que las restricciones no pueden
expresarse como la derivada de alguna función de las coordenadas generalizadas y por
tanto no puede ser resuelta por intregración.

Por otra parte, podemos mencionar que las restricciones No holonómicas se dividen
en dos tipos:

Las restricciones no holonómicas de primer orden definidas como restricciones de


las coordenadas generalizadas y sus velocidades, las cuales se pueden encontrar
en los robots móviles.
50 Capı́tulo 2. Estado del Arte

Y las restricciones no holonómicas de segundo orden o restricciones de acelera-


ción definidas como restricciones de las coordenadas generalizadas, velocidades
y aceleraciones, las cuales se presentan en los sistemas subactuados.

Enseguida, se muestran ejemplos que ilustran de manera sencilla los conceptos de


sistemas holonómicos y no holonómicos propuestos por Lefeber [115].

Considere el sistema

ẋ1 = ux2
(2.20)
ẋ2 = −ux1

donde (x1 , x2 ) son los estados y u es la entrada.

Tome en cuenta que el sistema (2.20) tiene una restricción de velocidades de la forma:

x1 ẋ1 + x2 ẋ2 = 0 : (2.21)

Podemos observar que esta restricción puede integrarse para obtener

1 2 1 2
x + x =c (2.22)
2 1 2 2
donde c es una constante, por tanto la restricción (2.20) es una restricción holonómica

Ahora consideremos el siguiente sistema:

ẋ1 = u1
ẋ2 = u2 (2.23)
ẋ3 = x1 u2 − x2 u1

donde (x1 , x2 , x3 ) son los estados y (u1 , u2) son las entradas. El sistema (2.23) también
tiene un restricción de velocidades de la siguiente manera:

x1 ẋ2 − x2 ẋ1 − ẋ3 = 0 (2.24)


2.3. Fundamentos Teóricos 51

Sin embargo, la restricción (2.24) no puede integrarse como en el caso de la restricción


(2.21), es decir, la restricción (2.24) no puede expresarse como la derivada de alguna
función del estado y se denomina restricción no holonómica.
Capı́tulo 3

Sistemas Mecánicos Subactuados

Los sistemas mecánicos subactuados se pueden encontrar en diversas aplicaciones


de control, como, Robótica (ej. robots flexibles, robots móviles), vehı́culos aéreos (ej.
helı́copteros, aviones y satélites), vehı́culos acuáticos y algunas aplicaciones en la
construcción (ej. edificios, puentes). Debido a esta gran variedad de aplicaciones estos
sistemas han tomado gran importancia en los últimos años. Por tanto, el control de
sistemas subactuados aún es un problema interesante para la investigación, como se
puede observar en las siguientes referencias [76, 85, 152, 184].

En este capı́tulo se presenta una breve descripción de los sistemas Euler-Lagrange.


Para posteriormente, comentar la definición y caracterı́sticas de los sistemas subac-
tuados, ası́ como algunos ejemplos representativos de éstos.

3.1. Sistemas Euler-Lagrange

Una interesante definición de los sistemas de Euler-Lagrange (EL) se enuncia


mediante el principio de mı́nima acción (o de Hamilton)[114]. Entonces, en virtud
de este principio todo sistema mecánico está caracterizado por una función de las
coordenadas generalizadas qi ,1 sus derivadas y el tiempo t definida como:

1
i = 1, 2...n

52
3.1. Sistemas Euler-Lagrange 53

L(qi , q̇i , t) (3.1)

tal que las trayectorias q(t) del sistema satisfacen la siguiente condición[114]:
Supongamos que en los instantes t = t1 y t = t2 , el sistema ocupa posiciones deter-
minadas, definidas por los conjuntos de coordenadas q (1) y q (2) . Entonces, entre estas
posiciones, el sistema se moverá de forma que la integral
Z t2
S= L(q, q̇, t) (3.2)
t1

tome el menor valor posible. La función L se conoce como función de Lagrange y la


integral S como integral de acción.

A continuación, se deducirán las ecuaciones diferenciales que dan solución al pro-


blema de minimización de la integral (3.2), por facilidad supondremos que el sistema
posee un solo grado de libertad, definido por la función q(t).

Sea, precisamente, q = q(t) la función (trayectoria) para la cual S se minimiza, esto


significa que S aumenta si el sistema se sustituye por cualquier trayectoria alternativa
a q(t) de la forma.
q(t) + δq(t) (3.3)

Donde δq(t) es una función pequeña en todo el intervalo de tiempo entre t1 a t2 ;2 y


puesto que para t = t1 y t = t2 todas la funciones de la forma (3.3) deben tomar los
mismos valores de q (1) y q (2) , ocurriendo las siguiente condición:

δq(t1 ) = δq(t2 ) = 0 (3.4)

La variación que experimenta S al sustituir q por q + δq esta dada por

Z t2 Z t2 Z t2
δS = L(q + δq, q̇ + δ q̇, t)dt − L(q(t), q̇, t)dt = δ L(q(t), q̇, t)dt = 0 (3.5)
t1 t1 t1

desarrollando la variación de la integral (3.5) se tiene


2
δq(t) se denomina variación de la función q(t)
54 Capı́tulo 3. Sistemas Mecánicos Subactuados

Z t2 µ ¶
∂L ∂L
δq + δ q̇ dt (3.6)
t1 ∂q ∂ q̇
d
Y tomando en cuenta que δ q̇ = dt
δq, entonces, integrando por partes el segundo
término de (3.6) se obtiene:
¯t Z t2 µ ¶
∂L ¯¯ 2 ∂L d ∂L
δS = δq + − δqdt (3.7)
∂ q̇ ¯t1 t1 ∂q dt ∂ q̇
Al evaluar la condición (3.4), en el primer término de la ecuación (3.7) este desaparece.
Por tanto, la condición necesaria y suficiente para que δS = 0 será

d ∂L ∂L
− =0 (3.8)
dt ∂ q̇ ∂q
Para el caso que el sistema posea varios grados de libertad, la expresión anterior queda
de la siguiente manera

d ∂L ∂L
− = 0, i = (1, 2, ...., n) (3.9)
dt ∂ q˙i ∂qi

donde la función L se define de manera general como la diferencia entre la energı́a


cinética (T (q, q̇)) y la energı́a potencial (V (q)), es decir

L(q, q̇) = T (q, q̇) − V (q) (3.10)

Por otra parte, de manera general si existieran m fuerzas externas,fi (q) : Q → Rn ,


i = {1, · · · , m} independientes que son aplicadas al sistema, entonces la ecuación de
Euler-Lagrange para un sistema mecánico con estas caracterı́sticas serı́a de la siguiente
forma:

d ∂L ∂L
− = F (q)u (3.11)
dt ∂ q˙i ∂qi

donde u ∈ Rm y F (q) = (f1 (q), ....., fm (q)) representa el conjunto de fuerzas y momen-
tos externos que no derivan de un potencial, entre los que habitualmente se incluyen:
3.1. Sistemas Euler-Lagrange 55

Los efectos de fricción que tienen como consecuencia una disipación de energı́a.

Fuerzas y pares de control.

Estas ecuaciones representan las ecuaciones de movimiento para un sistema mecánico,


pudiendo ser representadas como:

Σj mkj (q)q̈j + Σi,j Γkij (q)q̇i q̇j + gk (q) = eTk F (q)u, k = 1, ...., n (3.12)

Donde ek es la base estándar en Rn , gk (q) = ∂V (q)/∂qk , y Γkij (q) son llamados sı́mbolos
de Christoffel definidos como:
µ ¶
1 ∂mkj (q) ∂mki (q) ∂mij (q)
Γkij (q) = + −
2 ∂qi ∂qj ∂qk
Entonces, la forma vectorial que representa la ecuación de movimiento del sistema se
expresa como:

M (q)q̈ + C(q, q̇)q̇ + G(q) = F (q)u (3.13)

Donde M (q) es la matriz de inercia del sistema y cij = Σnk=1 Γikj (q)q̇k es un elemento
de C(q, q̇)

Cabe mencionar que C(q, q̇)q̇ contiene dos tipos de términos que involucran a q˙i q˙j
denominados Centrı́fugo (i = j) y de Coriolisis (i 6= j) además, G(q) es el componente
provocado por la fuerza de gravedad que esta relacionado con la energı́a potencial
como: G(q) = ∂V (q)/∂q [190].

Por otro lado, la matriz M (q) es una matriz simétrica y definida positiva para todo
q, y existe una interesante relación entre las matrices M y C definida de la siguiente
forma: S = Ṁ (q) − 2C(q.q̇), la cual es una matriz anti-simétrica que se usa para
establecer la propiedad de pasividad del sistema.

Como comentario adicional, el modelo de Euler-Lagrange ha dado lugar a una serie de


métodos de sı́ntesis de controladores que además de perseguir la estabilidad asintótica
56 Capı́tulo 3. Sistemas Mecánicos Subactuados

de los puntos de equilibrio preservan la estructura de Euler-Lagrange en lazo cerrado.


Logrando con esto [76]:

1. Una función de Lyapunov natural como es la función de energı́a.

2. Estructuras pasivas que permiten obtener resultados de robustez.

3. Generalizar teorı́as de sı́ntesis para el control de sistemas subactuados.

4. Separación entre energı́as cinética y potencial en lazo cerrado, lo que permite


hacer análisis en espacios de dimensión reducida.

3.2. Sistemas Subactuados

3.2.1. Definición de Sistema Subactuado


En los últimos años en aplicaciones como barcos, helicópteros, satélites, robots, etc.;
el peso y el espacio son parámetros importantes y debido a que es posible disminuir el
peso ó tamaño mediante la reducción del número de actuadores que contenga, ya que
algunas ocasiones son difı́ciles de manejar y muy pesados, dichos sistemas se pueden
considerar sistemas subactuados por diseño.

Además, la dinámica de muchos sistemas mecánicos, como los manipuladores robóticos,


se construyen suponiendo que sus eslabones o miembros son rı́gidos. Esta suposición
para algunos casos es correcta mientras que en otros no. Es decir, si se tomara en
cuenta en los modelos una dinámica de que no fueran rı́gidos, muchos de estos modelos
serı́an esencialmente subactuados.

Por otra parte, cuando ocurre una falla en los actuadores o por la ausencia de los
mismos debido a consideraciones de diseño del sistema fı́sico (falta de espacio, exceso
de peso y por cuestiones de presupuesto, entre otras), el sistema se considera sub-
actuado. Una solución para evitar el problema de ausencia (o falla) de un actuador
se logra equipando el sistema con actuadores redundantes o cambiando la ley de con-
trol para que trabaje solamente con los actuadores restantes cuando se detecta una
3.2. Sistemas Subactuados 57

falla en el actuador. Como se puede observar la segunda solución es menos costosa


en comparación con la primera y puede ser muy importante en algunas aplicaciones,
motivando la creación de vehı́culos subactuados.

Finalmente, provocar artificialmente la creación de sistemas complejos no-lineales de


bajo orden con el propósito de mejorar el control de sistemas subactuados de alto
orden.
El Acrobot, el Pendubot, el sistema viga-bola, el Péndulo Invertido sobre un carro y
el Péndulo Rotacional son algunos ejemplos de esta idea.

Es importante mencionar que las consideraciones anteriores son algunas razones para
continuar con el desarrollo de nuevas técnicas de control aplicadas a sistemas subac-
tuados.

De lo anterior, en este trabajo simplemente definiremos a los Sistemas Subactuados


como aquellos sistemas que tienen menor cantidad de entradas (controles)
que grados de libertad. En algunos sistemas subactuados la ausencia de un actua-
dor en alguna dirección puede ser interpretada fı́sicamente como una restricción no
holonómica de segundo orden (o de aceleración).

Esta definición concuerda con la usada por Oriolo y Nakamura [154], la cual dice que
los sistemas subactuados son sistemas con menor cantidad de actuadores indepen-
dientes que grados de libertad a controlar.

3.2.2. Dinámica de los Sistemas Subactuados


Considere un sistema de n grados de libertad y m actuadores con la caracterı́stica
que m < n, cuyas ecuaciones de Euler-Lagrange son:

µ ¶
d ∂L ∂L
− = 0, i = m + 1, · · · , n
dt ∂ q̇i ∂qi
µ ¶
d ∂L ∂L
− = u, j = 1, · · · , m (3.14)
dt ∂ q̇j ∂qj
58 Capı́tulo 3. Sistemas Mecánicos Subactuados

Donde u ∈ Rm = (u1 , · · · , um )T son las entradas de control

Evidentemente, la ecuación de movimiento del sistema anterior derivada de las ecua-


ciones de Euler-lagrange puede expresarse de la siguiente manera [152]:

M (q) q̈ + C (q, q̇) q̈ + G (q) = F (q) u (3.15)

y se denomina Sistema Mecánico Subactuado (SMU) si m = rango(F (q)) < n =


dim(q) (ver la definición para la ecuación (3.11)). Dicho de otra forma, los sistemas
subactuados son sistemas mecánicos con menor cantidad de actuadores que grados
de libertad.

Entonces, asumiendo que F (q) = [0, Im ]T y dividiendo al vector de coordenadas ge-


neralizadas como q T = (q1T , q2T ) ∈ Rn−m × Rm , donde q1 ∈ Rn−m corresponde a las
coordenadas generalizadas subactuadas y q2 ∈ Rm expresa las coordenadas actuadas
del sistema.

Por tanto, después de tomar en cuenta dicha división en la matriz de inercia, se


obtiene la ecuación dinámica del sistema subactuado de la siguiente forma [184]:

" #" # " # " # " #


m11 (q) m21 (q) q1 h1 (q, q̇) φ1 (q) 0
+ + = (3.16)
m21 (q) m12 (q) q2 h2 (q, q̇) φ2 (q) u

Donde

" #
m11 (q) m21 (q)
M (q) = (3.17)
m21 (q) m12 (q)

es una matriz positiva y simétrica. Además, las funciones h1 (q, q̇) ∈ Rl y h2 (q, q̇) ∈ Rm
contienen los términos de Coriolisis y Centrı́fugos del sistema, los términos φ1 (q, q̇) ∈
Rl y φ2 (q, q̇) ∈ Rm representan los efectos gravitacionales y u ∈ Rm corresponde a las
fuerzas generalizadas producidas por los m actuadores.
3.3. Ejemplos de Sistemas Subactuados 59

Un inconveniente que tienen los sistema subactuados de la forma (3.16), es que la


primera ecuación diferencial no tiene una entrada de la control, es decir

m11 (q)q̈1 + m12 (q)q̈2 + h1 (q, q̇) + φ1 (q) = 0 (3.18)

la cual representa las restricciones del sistema provocadas por las coordenadas sub-
actuadas.
Siendo entonces una restricción no holonómica de segundo orden, debido a que no se
puede encontrar una función por integración que relacione las velocidades y posiciones
de las coordenadas subactuadas y actuadas [155].

Entonces, estos sistemas no pueden ser linealizados por retroalimentación usando un


cambio en la señal de control; sin embargo Spong [184] estudió que estos sistemas
puede ser linealizados parcialmente de tal forma que la dinámica del sistema se trans-
forme en dos subsistemas, uno no-lineal y otro lineal. La aplicación de esta técnica se
muestra en [85, 152, 185].

Cabe notar que la ecuación (3.16) es similar a la estructura dinámica de un robot de


n eslabones, con la diferencia de que la primera ecuación no tiene entradas de control
[190].

3.3. Ejemplos de Sistemas Subactuados


A continuación, presentamos algunos ejemplos de sistemas subactuados de la fa-
milia de los péndulos invertidos que se han utilizado para estudiar conceptos de Teorı́a
de Control no-lineal, Robótica, y en el diseño de nuevos esquemas de control. Los
ejemplos que se muestran enseguida son el Acrobot, el Pendubot, el Péndulo Inver-
tido sobre un Carro, el Péndulo Esférico Invertido, el Péndulo con Rueda de Inercia,
el Péndulo de Furuta y el PVTOL (Planar Vertical Take-off and Landing), de los
cuales se presentará el modelo matemático no-lineal identificando la propiedad de
subactuado. [59, 152].
60 Capı́tulo 3. Sistemas Mecánicos Subactuados

3.3.1. Acrobot y Pendubot


El Acrobot y el Pendubot son robots subactuados de dos eslabones usados en las
investigaciones de control no-lineal y para estudiar algunos conceptos como dinámica
no-lineal, robótica y diseño de sistemas de control [39, 43, 64, 130, 183].

Los parámetros más importantes del Acrobot y el Pendubot son:

m1 : Masa del eslabón 1


m2 : Masa del eslabón 2
l1 : Longitud del eslabón 1
l2 : Longitud del eslabón 2
l c1 : Distancia del centro de masa del eslabón 1
l c2 : Distancia del centro de masa del eslabón 2
I1 : Momento de inercia del eslabón 1 cerca de su centroide
I2 : Momento de inercia del eslabón 2 cerca de su centroide
g : Aceleración debida a la gravedad
q1 : Ángulo del eslabón 1 respecto a la horizontal
q2 : Ángulo del eslabón 2 respecto al eslabón 1
τ1 : Fuerza aplicada al eslabón 1 o eslabón 2

Para simplificar la representación de los modelos del Acrobot y el Pendubot se definen


las siguientes cinco variables:

θ1 = m1 lc21 + m2 l12 + I1
θ2 = m2 lc22 + I2
θ3 = m2 l1 lc2
θ4 = m1 lc1 + m2 l1
θ5 = m2 lc2

Enseguida, se mostrará el modelo matemático de cada uno de los sistemas.

1. Acrobot
Este dispositivo es un robot plano de dos eslabones, el cual tiene un único actuador
en eslabón 2 (codo) como se observa en la figura 3.1. El eslabón 1 (hombro) se mueve
libremente alrededor del eslabón 2.
3.3. Ejemplos de Sistemas Subactuados 61

Y
l2
q2

l1 m2 , I 2
lc 2
1
lc
1

m1 , I 1
q1

Figura 3.1 Acrobot.

Modelo Matemático
Las ecuaciones dinámicas del sistema son descritas de la siguiente manera [183]:

0 = (θ1 + θ2 + 2θ3 cos q2 ) q̈1 + (θ2 + θ3 cos q2 ) q̈2 − θ3 sen q2 q̇22


− 2θ3 sen q2 q̇1 q̇2 + θ4 g cos q1 + θ5 g cos (q1 + q2 ) (3.19)

τ1 = (θ2 + θ3 cos q2 ) q̈1 + θ2 q̈2 + θ3 sen q2 q̇12 + θ5 g cos (q1 + q2 ) (3.20)

Expresando el modelo del sistema en la forma vectorial:

M (q) q̈ + C (q, q̇) q̈ + G (q) = τ

Donde
" # " #
q1 θ1 + θ2 + 2θ3 cos q2 θ2 + θ3 cos q2
q = M (q) =
q2 θ2 + θ3 cos q2 θ2

" #
−θ3 sen q2 q̇2 −θ3 sen q2 q̇2 − θ3 sen q2 q̇1
C (q, q̇) =
θ3 sen q2 q̇1 0
62 Capı́tulo 3. Sistemas Mecánicos Subactuados

Y
l2
q2

l1 m2 , I 2
lc 2
lc
1

m1 , I 1
q1

X
1

Figura 3.2 Pendubot.

" # " #
θ4 g cos q1 + θ5 g cos (q1 + q2 ) 0
G (q) = y τ =
θ5 g cos (q1 + q2 ) τ1

2. Pendubot
Un sistema mecánico similar al anterior se denomina Pendubot, la diferencia entre
estos sistemas radica en que éste dispositivo tiene un actuador en el primer eslabón
(hombro) y, en este caso el eslabón 2 (codo) se mueve libremente alrededor del eslabón
1 como se observa en la figura 3.2. El objetivo del control es llevar el mecanismo a su
punto de equilibrio inestable [59, 63, 152, 186].

Modelo Matemático
Las ecuaciones de movimiento que describen al sistema son [40]:

τ1 = (θ1 + θ2 + 2θ3 cos q2 ) q̈1 + (θ2 + θ3 cos q2 ) q̈2 − θ3 sen q2 q̇22


− 2θ3 sen q2 q̇1 q̇2 + θ4 g cos q1 + θ5 g cos (q1 + q2 ) (3.21)

0 = (θ2 + θ3 cos q2 ) q̈1 + θ2 q̈2 + θ3 sen q2 q̇12 + θ5 g cos (q1 + q2 ) (3.22)


3.3. Ejemplos de Sistemas Subactuados 63

Las ecuaciones dinámicas del sistema en la forma vectorial son:

M (q) q̈ + C (q, q̇) q̈ + G (q) = τ

Donde
" # " #
q1 θ1 + θ2 + 2θ3 cos q2 θ2 + θ3 cos q2
q = M (q) =
q2 θ2 + θ3 cos q2 θ2

" #
−θ3 sen q2 q̇2 −θ3 sen q2 q̇2 − θ3 sen q2 q̇1
C (q, q̇) =
θ3 sen q2 q̇1 0

" # " #
θ4 g cos q1 + θ5 g cos (q1 + q2 ) τ1
G (q) = y τ =
θ5 g cos (q1 + q2 ) 0

Comentario:

Es importante notar que la matriz M (q) es simétrica y definida positiva para


todo q.

Además, el Acrobot y el Pendubot son sistemas que cuenta con dos grados de
libertad y un sólo actuador. Donde, para el caso del Acrobot q1 es la coordenada
subactuada y q2 la coordenada actuada; y en el Pendubot la coordenada actuada
se representa por q1 y la subactuada por q2 .

Por otro lado, la diferencia entre un manipulador de dos eslabones [190] y el


Acrobot ó Pendubot es la ausencia de una entrada de control en alguna de las
ecuaciones.

3.3.2. Péndulo Invertido sobre un Carro (Cart-Pole System)


Este sistema es uno de los más populares para diseñar leyes de control no lineal
en los laboratorios y se ve reflejado en la gran cantidad de articulos publicados en la
64 Capı́tulo 3. Sistemas Mecánicos Subactuados

mg

M
f

Figura 3.3 Péndulo Invertido sobre un Carro.

literatura [6, 54, 61, 81, 149] y su estudio está motivado por las diversas aplicaciones
como el control de posición de los sistemas de despegue de cohetes y el control de
vibraciones mecánicas en construcciones.

Este dispositivo consiste en un péndulo con libertad para rotar montado encima de
un carro que se mueve a lo largo de una vı́a debido al impulso de una fuerza, como
se muestra en la figura 3.3.

Existen dos problemas relacionados con la estabilización de este dispositivo: el primero


es llevar el péndulo desde cualquier posición y en particular de la posición colgante na-
tural, hasta la posición invertida [20, 128, 174, 184] y el segundo consiste en establizar
el sistema alrededor del punto de equilibrio inestable suponiendo que el péndulo
está inicialmente encima del semi-plano superior [6, 33, 140, 195].
Los parámetros de péndulo invertido descritos en la figura 3.3 son:

M : Masa del carro


m : Masa del péndulo
l : Distancia desde el pivote al centro de gravedad del péndulo
g : Aceleración debida a la gravedad
x : Distancia del centro de masa del carro desde su posición inicial
θ : Ángulo del péndulo respecto a la vertical
f : Fuerza aplicada al carro
3.3. Ejemplos de Sistemas Subactuados 65

Modelo Matemático
Las ecuaciones de movimiento del sistema están dadas por [85]:

(M + m) ẍ − ml sen θθ̇2 + ml cos θθ̈ = f (3.23)

mẍl cos θ + ml2 θ̈ − mgl sen θ = 0 (3.24)

Además, el sistema puede ser escrito en la forma estándar de los Sistemas de Lagrange
definido como:

M (q) q̈ + C (q, q̇) q̇ + G (q) = τ

Donde
" # " #
x M + m ml cos θ
q = M (q) =
θ ml cos θ ml2

" #
0 −ml sen θθ̇
C (q, q̇) =
0 0

" # " #
0 f
G (q) = y τ =
−mgl sen θ 0
Comentario

Es importante notar que la matriz M (q) es simétrica y definida positiva para


todo q.

Además, el sistema péndulo invertido sobre un carro es un sistema subactuado


porque tiene dos grados de libertad denominados como x y θ, y una sola entrada
de control f .

Donde x y θ representan las coordenadas actuada y subactuada, respectiva-


mente.
66 Capı́tulo 3. Sistemas Mecánicos Subactuados

x
y uy
ux

Figura 3.4 Péndulo Esférico Invertido.

3.3.3. Péndulo Esférico Invertido (3D Cart-Pole System)

Una versión más general del péndulo invertido en dos dimensiones es el llamado
Péndulo Esférico Invertido (3D Cart-Pole System) [152]. El cual es un sistema no
lineal que permite ilustrar una versión académica simplificada del propulsor de un
cohete [70, 71, 175, 212].

El Péndulo Esférico Invertido es un sistema de cuatro grados de libertad integrado


por un péndulo esférico libre montado sobre una base móvil (ver figura 3.4). Está base
puede ser idealmente un punto y se mueve en el plano horizontal por la influencia de
una fuerza.
En lo que se refiere al control de este sistema, existe en la literatura una amplia gama
de trabajos [10, 15, 19, 121, 122, 173].

Modelo Matemático
Este sistema puede ser descrito por el siguiente conjunto de ecuaciones diferenciales
normalizadas [152].
3.3. Ejemplos de Sistemas Subactuados 67

ẍ = ux (3.25)
ÿ = uy (3.26)
θ̈ = Sθ Cϕ − Sθ Cθ ϕ2 − Cθ ux + Sθ Sϕ uy (3.27)
1 ³ ´
ϕ̈ = Cθ Sϕ + 2Sθ Cϕ θ̇ϕ̇ − Cθ Cϕ uy (3.28)
Cθ2
Donde los parámetros del sistema son:

x : Desplazamiento normalizado del centro de masa de la base móvil en el eje-x


y : Desplazamiento normalizado del centro de masa de la base móvil en el eje-y
θ : Rotación alrededor del eje-y
ϕ : Rotación alrededor del eje-x
Sx : sen (x)
Cx : cos (x)
ux : Aceleración de la base en la dirección x
uy : Aceleración de la base en la dirección y

Comentario

El sistema péndulo esférico invertido es un sistema subactuado, ya que tiene


cuatro grados de libertad x, y, ϕ y θ y cuenta con dos entradas de control ux y
uy .

Siendo (x,y) y (ϕ, θ) las coordenadas actuadas y subactuadas, respectivamente.

3.3.4. Péndulo con Disco Inercial (Inertial Wheel Pendulum)


El Péndulo con Disco Inercial (o rueda inercial) es uno de los sistemas subactuados
más simples que ha atraı́do la atención en el área educativa y de investigación, debido a
que su dinámica es muy sencilla comparada con la de otro tipo de péndulos y al mismo
tiempo permite, gracias a que es un sistema no-lineal y subactuado, ser utilizado como
un elemento de experimentación para el estudio de técnicas avanzadas de control.

Este sistema fue introducido y estudiado por M. Spong et. al. [187] y está constituido
por un péndulo fı́sico unido a un disco giratorio en la parte final, el cual está girando
68 Capı́tulo 3. Sistemas Mecánicos Subactuados

1
x

l2

m 1, I 1
l1

I2
m2

Figura 3.5 Péndulo con Disco Inercial.

libremente sobre un eje paralelo al eje de rotación del péndulo (ver figura 3.5). El
disco es accionado por un motor de DC y el péndulo es subactuado. El torque del
motor usado como entrada de control produce una aceleración angular del disco, lo
que genera un torque de acoplamiento en el eje del péndulo.

Existen dos problemas de control relacionados con este sistema, el primero es ba-
lancear el péndulo en el semi-plano superior y equilibrarlo en la posición invertida
[3, 59] y el segundo consiste en estabilizar el sistema alrededor del punto de equilibrio
inestable, con las dos posiciones angulares del sistema en el origen [151, 152, 159].

Modelo Matemático
La ecuaciones dinámicas del sistema son descritas como [59]:

¡ ¢
I1 + I2 + m1 l22 + m2 l12 θ̈1 + I2 θ̈2 − ηg sen θ1 = 0 (3.29)
I2 θ̈1 + I2 θ̈2 = τ (3.30)
3.3. Ejemplos de Sistemas Subactuados 69

Los parámetros del sistemas se describen en la siguiente tabla:

m1 : Masa del péndulo


m2 : Masa de la rueda
l1 : Longitud del péndulo
l2 : Distancia al centro de masa del péndulo
δ1 : Coeficiente de amortiguamiento de la coordenada subactuada
δ2 : Coeficiente de amortiguamiento de la coordenada actuada
θ1 : Ángulo que forma el péndulo con la vertical
θ2 : Ángulo del disco
I1 : Momento de Inercia del péndulo
I2 : Momento de Inercia de la rueda
τ : Torque del motor aplicado al disco
η = m1 l2 + m2 l1

En forma vectorial el sistema puede ser escrito como sigue:

D (q) q̈ + g (q) = u

Donde
" # " #
θ1 I1 + I2 + m1 l22 + m2 l12 I2
q = D (q) =
θ2 I2 I2

" # " #
−ηg sen θ1 0
g (q) = y u =
0 τ
Comentario

El Péndulo con Disco Inercial cuenta con dos grados de libertad y una entrada
de control (τ ), donde θ1 es la coordenada subactuada y θ2 es la coordenada
actuada.

Es importante notar que la matriz D(q) es constante y definida positiva.

Además, una caracteristica importante del sistema, es que puede ser linealizable
por retroalimentación [187].
70 Capı́tulo 3. Sistemas Mecánicos Subactuados

3.3.5. Péndulo de Furuta


Un sistema diferente al Péndulo Invertido sobre un Carro es el Péndulo de Furuta,
desarrollado por el profesor K. Furuta en el Instituto de Tecnologı́a de Tokio [72].

Este sistema cuenta con un motor que funciona como actuador y el péndulo está unido
a la flecha del motor como se muestra en la figura 3.6, algunos autores lo denominan
péndulo rotacional [152] y existen diversos trabajos en la literatura relacionados con
el control de este tipo de péndulo [9, 69, 79, 111, 145, 149].

Modelo Matemático
El modelo matemático del sistema se obtiene a partir de las ecuaciones de Euler-
Lagrange [59] suponiendo que la fricción es despreciable. La notación descrita en la
figura 3.6 se muestra en la siguiente tabla :

I0 : Momento de inercia del brazo


L0 : Longitud total del brazo
m1 : Masa del péndulo
l1 : Distancia al centro de gravedad del péndulo
J1 : Momento de inercia del péndulo alrededor de su centro de gravedad
θ0 : Ángulo rotacional del brazo
θ1 : Ángulo de rotacion del péndulo
τ1 : Torque aplicado al brazo

El sistema es descrito por las siguientes ecuaciones:

£ ¡ ¢¤
τ1 = I0 + m1 L2o + l12 sen2 θ1 θ̈0 + m1 l1 L0 cos θ1 θ̈1 + m1 l12 sen 2θ1 θ̇0 θ̇1
− m1 l1 L0 sen θ1 θ̇12 (3.31)

£ ¤
0 = m1 l1 L0 cos θ1 θ̈0 + J1 + m1 l12 θ̈1 − m1 l12 sen θ1 cos θ1 θ̇02 − m1 gl1 sen θ1 (3.32)
3.3. Ejemplos de Sistemas Subactuados 71

q1
j
1

m1 g
q0
t l1
l0 , L0
Motor

Figura 3.6 Péndulo de Furuta.

El sistema puede ser agrupado en la forma:

D (q) q̈ + C (q, q̇) q̇ + g (q) = τ

Donde

" # " #
θ0 Io + m1 (L2o + l12 sen2 θ1 ) m1 l1 L0 cos θ1
q = D (q) =
θ1 m1 l1 L0 cos θ1 J1 + m1 l12

" #
1 1
m l2 sen 2θ1 θ̇1
2 1 1
m l2
2 1 1
sen 2θ1 θ̇0 − m1 l1 L0 sen θ1 θ̇1
C (q, q̇) =
−m1 l12 sen θ1 cos θ1 θ̇0 0

" # " #
0 τ1
g (q) = y τ =
−m1 gl1 sen θ1 0

Las ecuaciones anteriores definen un sistema subactuado por que tienen una sola
entrada τ1 y dos grados de libertad θ0 y θ1 . Donde θ0 corresponde a la coordenada
actuada y θ1 a la subactuada.
72 Capı́tulo 3. Sistemas Mecánicos Subactuados

Y u2 e u2
u1

q
y

-1

0 x
X

Figura 3.7 PVTOL.

3.3.6. PVTOL (Planar Vertical Take-off and Landing)


El sistema conocido como PVTOL (Planar Vertical Take-off and Landing) es un
modelo simplificado de un aeronave que tiene el numero de estados y entradas mı́nimo
para mantener las caracterı́sticas principales que se deben de tomar en cuenta en el
diseño de leyes de control en aeronaves reales. La figura 3.7 muestra un representación
del sistema [62, 65, 89, 117, 140, 152, 195].

Modelo Matemático
Las ecuaciones de movimiento del sistema son [59]:

ẍ = − sen (θ) u1 + ε cos (θ) u2 (3.33)


ÿ = cos (θ) u1 + ε sen (θ) u2 − 1 (3.34)
θ̈ = u2 (3.35)
3.3. Ejemplos de Sistemas Subactuados 73

Donde:

x : Posición horizontal del centro de masa de la aeronave


y : Posición vertical del centro de masa de la aeronave
θ : Es el ángulo de giro que la aeronave hace con la horizontal
u1 : Empuje
u2 : Acelereración angular
−1 : Aceleración gravitacional normalizada
ε : Coeficiente pequeño que caracteriza el acoplamiento entre el mo-
mento de giro y la aceleración lateral de la aeronave

Comentario

El sistema PVTOL cuenta con tres grados de libertad x, y y θ, y dos entradas


de control u1 y u2 , entonces es un sistema subactuado donde las coordenadas
actuadas son y y θ y la coordenada subactuada es x.
Capı́tulo 4

Estabilización del Péndulo


Invertido utilizando un ajuste de
modelo

En este capı́tulo, se aborda el problema de estabilización del sistema Péndulo In-


vertido sobre un Carro mediante el método de ajuste de modelo (model matching).
La estrategia de control consiste en forzar al sistema en lazo cerrado a comportarse
como otro sistema no-lineal con ciertas propiedades de estabilidad.
Para lograr esto, se propone una manera sencilla de solucionar las condiciones de
ajuste (Matching Conditions) derivadas de la energı́a cinética y la energı́a poten-
cial de sistema, necesarias para encontrar un controlador que estabilice el Sistema
Péndulo Invertido en el punto de equilibrio inestable.
La mayor parte de lo que se expone en este capı́tulo aparece publicado en un artı́culo
de revista [11].

4.1. Introducción
El problema de estabilización del sistema Péndulo Invertido sobre un Carro ha
recibido la atención de los investigadores en los últimos años debido a que este dis-
positivo es un banco de pruebas muy interesante en la ingenierı́a de control no lineal

74
4.2. Modelo del Péndulo Invertido sobre un Carro 75

[20]. En general, consiste en llevar el péndulo a la posición vertical invertida con en


carro en el origen [33, 35, 81, 127, 140, 149, 189, 195, 215].

En este capı́tulo, se aborda el desarrollo de un ajuste de modelo para estabilizar el


sistema Péndulo Invertido sobre un Carro alrededor del punto de equilibrio inestable.
El controlador propuesto tiene dos principales caracterı́sticas:

1. El dominio de estabilidad puede ser tan grande como se desee.

2. El sistema en lazo cerrado es robusto con respecto a pequeñas fuerzas de amor-


tiguamiento, obteniendo un sistema exponencialmente estable localmente.

La principal contribución de este capı́tulo es proponer una manera sencilla de solu-


cionar las condiciones de ajuste, necesarias para encontrar un controlador que estabi-
lice el sistema sin resolver un conjunto de Ecuaciones Diferenciales Parciales (EDP).
Como es el caso de otros trabajos que utilizan este tipo de enfoque [32, 33, 26, 109].
La principal diferencia entre esta propuesta y el ajuste de modelo presentado por
Gómez-Estern [77], consiste en forzar al sistema en lazo cerrado a comportarse como
un sistema Euler-Lagrange, donde la matriz caracterı́stica de inercia es constante.

El resto del capı́tulo se organiza del siguiente modo. En la sección 4.2 presentamos el
modelo dinámico del PIC. La sección 4.3 muestra la obtención del ajuste de modelo
y la solución de la condiciones de ajuste. En la sección 4.4 se describe el análisis
de estabilidad del sistema en lazo cerrado y en la sección 4.5 se observan algunas
simulaciones computacionales.

4.2. Modelo del Péndulo Invertido sobre un Carro


Consideremos el sistema Péndulo Invertido sobre un Carro PIC (Figura 4.1), el
cual se describe por el siguiente conjunto de ecuaciones diferenciales normalizado [6].1
1
En el apéndice A.1 se muestra la obtención de este modelo.
Capı́tulo 4. Estabilización del Péndulo Invertido
76 utilizando un ajuste de modelo

M
f

Figura 4.1 Sistema Péndulo Invertido sobre un Carro.

cos θq̈ + θ̈ − sen θ + β θ̇ = 0,


(4.1)
(1 + δ)q̈ + cos θθ̈ − θ̇2 sen θ = f,
donde q es el desplazamiento normalizado del carro; θ es el ángulo que forma con la
vertical; f es la fuerza aplicada al carro siendo la entrada de control del sistema; β θ̇
es un fuerza disipativa lineal que actúa sobre la coordenada no actuada θ 2 ; δ es un
parámetro estructural relacionado con las masas del carro y del péndulo, respectiva-
mente [175].

Después de aplicar la siguiente retroalimentación

f = cos θ sen θ − θ̇2 sen θ + v(sen2 θ + δ)

en el sistema (4.1), obtenemos el siguiente modelo

θ̈ = sen θ − cos θv − β θ̇,


(4.2)
q̈ = v.
Evidentemente, el sistema (4.2) puede expresarse como:

ẍ = −F (θ) − B ẋ + G(θ)u, (4.3)


2
La fuerza disipativa en coordenada actuada q puede ser compensada de manera sencilla, por lo
tanto, no se incluye en el modelo.
4.2. Modelo del Péndulo Invertido sobre un Carro 77

donde
" # " # " #
− sen θ β 0 − cos θ
F (θ) = , B= , G(θ) = (4.4)
0 0 0 1
y xT = (θ, q).

Comentario 4.2.1 El modelo (4.3) es un sistema parcialmente linealizado que no


conserva la estructura original del sistema PIC, debido a que se cancelan no linea-
lidades importantes como la fuerza de Coriolisis y provoca que el sistema no sea
de la forma Euler-Lagrange. Esto es una diferencia importante con los métodos de
Lagrangianos y Hamiltonianos controlados, donde se conserva la estructura original
[52]. Cabe destacar que la cancelación de estas no linealidades puede provocar que el
proceso de ajuste sea difı́cil. Sin embargo, en nuestra estrategia de control es sencillo
encontrar las condiciones de ajuste relacionadas con la estructura del sistema objetivo
(sistema en lazo cerrado). Dicho sistema está formado por un sistema Euler-Lagrange
asintóticamente estable con matriz de inercia constante.

Comentario 4.2.2 La fuerza de disipación puede hacer al sistema en lazo cerrado


inestable [209]. Y en general, esta fuerza no puede ser compensada por la acción de la
ley de control u. Sin embargo, el efecto indeseable de amortiguamiento puede ser par-
cialmente eliminado usando un controlador estabilizador robusto, como se menciona
en el Apéndice C.2.

Comentario 4.2.3 El modelo parcialmente linealizado del péndulo invertido repre-


sentado en (4.2) tiene una caracterı́stica muy importante, ya que si lo linealizamos
en el punto de equilibrio inestable, podemos observar que tiene lo siguientes polos
s = 0, s = 0, s = 1 y s = −1, y debido a que cuenta con un polo en el semiplano
derecho se puede decir que el sistema es inestable en lazo abierto (la obtención de
los polos se encuentra en el apendice A.1.2) provocando que sea necesario aplicar un
control realimentado para estabilizarlo. Además, cabe mencionar que utilizando esta
metodologı́a se puede mostrar que los demás sistemas estudiados en esta tesis tienen
la caracterı́stica mencionada.
Capı́tulo 4. Estabilización del Péndulo Invertido
78 utilizando un ajuste de modelo

4.3. Estrategia de control


El objetivo de la estrategia de control propuesta es llevar el péndulo a la posición
invertida y el carro al origen, suponiendo que la posición inicial del ángulo está por
encima del plano horizontal. Para lograr esto se propone un ajuste de modelo que
consiste en encontrar un controlador u que transforme el sistema (4.2) en otro sistema
no lineal con ciertas propiedades de estabilidad. Es decir, buscamos una ley de control
tal que el sistema en lazo cerrado puede ser expresado en la forma:


Md ẍ = −Kd (x)ẋ − Vd (x), (4.5)
∂x

donde Md y Kd (x) son matrices simétricas definidas positivas y Vd (x) es una función
estrictamente positiva.3
Entonces, se dice que los sistemas (4.3) y (4.5) están ajustados para la ley de control
u, si la solución de los dos sistemas es la misma. Es decir, (x, u) es una solución de
(4.3), si y solo si x es una solución de (4.5). Por consiguiente, se asegura que (4.3) y
(4.5) están ajustados, si cumplen


−F (θ) + G(θ)u = −Md−1 Kd (x)ẋ − Md−1 Vd (x). (4.6)
∂x

Si G4 es invertible, entonces se puede obtener directamente el controlador u para


cualquier Kd y Vd . Sin embargo, como G es de una sola columna no es invertible
sino sólamente de rango completo por columnas, y u puede sólo influenciar a los
términos dentro del espacio imagen de G. De lo anterior, multiplicando los dos lados
de la ecuación (4.6) por el anulador de G5 se obtienen las siguientes ecuaciones de
restricción
3
Posteriormente se discutirá por qué el sistema (4.5) es asintóticamente estable.
4
Por simplicidad, usamos G para denotar G(θ).
5
Se entiende como anulador por la izquierda de una matriz A, otra matriz B cuyas filas están en
el espacio núcleo de A. Dicho anulador es de rango completo si el espacio generado por las filas de B
coincide con el núcleo de A. Entonces, debido a que GT = [− cos θ, 1], el anulador por la izquierda
de G se define como G⊥ = δ(x, ẋ)[1, cos θ], donde δ puede ser una función estrictamente positiva,
pero por simplicidad se ha seleccionado como δ = 1. Además, es importante tomar en cuenta que
G⊥ G = 0.
4.3. Estrategia de control 79

µ· ¸ ¶
∂ £ −1 ¤
0=G ⊥
Md−1
Vd (x) − F (θ) + Md Kd (x) ẋ . (4.7)
∂x
Por consiguiente, si se encuentran los términos Kd y Vd para el vector F , la ley de
control u se puede calcular directamente por:
·µ ¶ ¸
GT −1 ∂ −1
u=− T Md Vd (x) − F (θ) + Md Kd (x)ẋ . (4.8)
G G ∂x
Finalmente, la estrategia de control consiste en resolver las condiciones de ajuste
(4.7), las cuales se pueden dividir en las dos ecuaciones
· ¸

0=G ⊥
Md−1 Vd (x) − F (θ) , (4.9)
∂x
y
£ ¤
0 = G⊥ Md−1 Kd (x) ẋ, (4.10)

Por lo tanto, el control u se puede obtener por medio de la relación (4.8).

Comentario 4.3.1 En esta sección, no se consideran los efectos de la fuerza disi-


pativa, y se puede mostrar por medio de algebra lineal que no es posible compensar
está fuerza. Esto significa que no existe una variable de control que conserve las
propiedades de estabilidad del sistema objetivo y asegure las condiciones de ajuste
necesarias simultáneamente ya que este tipo de fuerzas rompen las propiedades simétri-
cas de sistema objetivo [209]. Sin embargo, este efecto puede ser parcialmente evitado
usando una linealización del sistema en lazo cerrado en lugar de buscar una función
de Lyapunov para el sistema que incluye dicha fuerza.

4.3.1. Solución de las condiciones de ajuste


Enseguida, encontraremos las matrices Md , Kd y la función Vd que satisfacen las
dos condiciones de ajuste. Para lograr esto, establecemos el siguiente lema:

Lema 4.3.2 Si las matrices Md−1 y Kd (θ) son de la siguiente manera:


" #
−1 1 −µ2
Md = ; Kd (θ) = γMd G(θ)GT (θ)Md (4.11)
−µ2 µ3
Capı́tulo 4. Estabilización del Péndulo Invertido
80 utilizando un ajuste de modelo

donde los coeficientes de la matriz Md−1 satisfacen las desigualdades

µ2 > 1 ; µ3> µ22 , (4.12)

6
γ es una constante positiva y la función Vd (x) se selecciona como

1 1 kp
Vd (x) = ln(−1 + µ2 ) − ln(−1 + µ2 cos θ) + s2 (4.13)
µ2 µ2 2
donde
µ ¶
µ3 2(µ3 −µ22 )
s=q+ µ2
θ + √ arctan h √1+µ2 tan θ
2
, (4.14)
µ2 −1+µ22 −1+µ22

entonces, las dos condiciones de ajuste se cumplen simultáneamente para todo θ ∈


Iµ = (−θµ , θµ ), con µ ¶
−1 1
θµ = cos . (4.15)
µ2
Es importante tomar en cuenta que, si θ ∈ Iµ y µ3> µ22 entonces Kd (θ) > 0 para todo
θ ∈ Iµ .

La demostración del lema anterior se encuentra en el apéndice C.1.


¯ ¯
d¯ ∂ 2 Vd ¯
Comentario 4.3.3 Como ∂V ∂x x=0
= 0 y ∂x2 ¯
> 0, entonces el conjunto forma-
x=0
do por Vd (x) ≤ α (con α > 0) es un conjunto convexo.7 Por otra parte, la función
de energı́a cinética en lazo cerrado es una función convexa globalmente de mane-
ra estricta, por lo tanto, el conjunto E(x, ẋ) ≤ α define un conjunto compacto.
Esta propiedad es importante para aplicar el Teorema de LaSalle. En la figura 4.2
mostramos las curvas de nivel obtenidas de Vd (x). Cabe notar, que cuando α ≥ 3,
el conjunto {x ∈ R2 : Vd (x) ≤ 3} no es un conjunto convexo o compacto. De otra
manera, cuando α ≤ 1, el conjunto {x ∈ R2 : Vd (x) ≤ 1} es compacto. Lo anterior
se interpreta fı́sicamente como que cualquier solución tal que, E(x, ẋ) ≤ 1 siempre
permanecerá en el conjunto compacto.

6
En este caso escogemos γ = 1.
7
El valor más grande de α, tal que Vd (x) < α sea un conjunto compacto, permite tener una
estimación del dominio de estabilidad, donde E(x, ẋ) ≤ α define un conjunto compacto invariante,
y por lo tanto E es una función decreciente.
4.4. Análisis de estabilidad 81

Figura 4.2 Curvas de nivel para α = 0,25, α = 0,5, α = 0,1 y α = 3.

Comentario 4.3.4 En el apéndice 4.2.2 se muestra que el sistema en lazo cerrado


obtenido es exponencialmente estable localmente; por lo tanto, el sistema en lazo cerra-
do es robusto con respecto a dinámicas pequeñas no modeladas. Esto significa que si la
fuerza disipativa es muy pequeña y el sistema inicia cerca del origen podemos esperar
que el sistema alcanza el punto de equilibrio inestable. En la sección de simulaciones
numéricas se muestra lo anterior.

4.4. Análisis de estabilidad


Es importante notar que la estabilidad del sistema (4.3) en lazo cerrado con el
controlador u expresado en (4.8), es equivalente a la estabilidad del sistema en lazo
cerrado deseado (4.5). Siendo consecuencia de la definición de las condiciones de
ajuste. Por lo tanto, se realizará el análisis de estabilidad para el sistema en lazo
cerrado deseado (4.5). Y para conseguir esto, proponemos la siguiente función de
Lyapunov:

1
E(x, ẋ) = ẋT Md ẋ + Vd (x) (4.16)
2
donde Md y Vd (x) son definidos en (4.5) y (4.13), respectivamente. Calculando la
Capı́tulo 4. Estabilización del Péndulo Invertido
82 utilizando un ajuste de modelo

derivada de E con respecto al tiempo, alrededor del sistema (4.5), se obtiene lo si-
guiente

Ė(x, ẋ) = ẋT Md ẍ + ẋT ∂V∂x


d (x)

¡ ¢
= −ẋT Kd (x)ẋ + ∂x ∂
Vd (x) + ẋT ∂V∂x
d (x)
(4.17)
= −ẋT Kd (θ)ẋ.

Cabe notar que los signos de E y Ė dados en (4.16) y (4.17) están bien definidos
mientras que el ángulo θ se encuentre dentro del conjunto Iµ (ver lema 4.3.2). Lo cual
se asegura si las condiciones iniciales (x0 , ẋ0 ) con θ0 ∈ Iµ , pertenecen a una vecindad
del origen, tal que

E(x0 , ẋ0 ) < Vd (θµ , 0) = Cµ (4.18)

donde θµ fue previamente definida en la ecuación (4.15).

Comentario 4.4.1 La desigualdad anterior definen una región de estabilidad para el


sistema en lazo cerrado, es decir, si las condiciones iniciales cumplen que E(x0 , ẋ0 ) <
Cµ con θ0 ∈ Iµ . Entonces, necesariamente θ(t) ∈ Iµ . Considerando esto podemos
definir el conjunto compacto Ω como:8

Ω = {(x, ẋ) : E(x, ẋ) < Cµ } (4.19)

El conjunto Ω tiene la propiedad de que todas las soluciones del sistema en lazo cerrado
(4.5) que comienzan en Ω permanecen en Ω para todo el tiempo.

Entonces, continuando con el análisis de estabilidad afirmamos que el sistema en lazo


cerrado deseado (4.5) es estable localmente con una región de estabilidad definida
por la desigualdad (4.18). Por supuesto, si se selecciona Md−1 , Kd y Vd de acuerdo al
lema 4.3.2. En otras palabras, la solución en lazo cerrado es acotado para cualquier
condición inicial que satisfaga la desigualdad (4.18).
8
Este conjunto será utilizado posteriormente para aplicar el Teorema de invariancia de LaSalle.
4.4. Análisis de estabilidad 83

Para garantizar que la solución en lazo cerrado converja asintóticamente a cero se


necesita usar el Teorema de LaSalle. Para este fin, definimos el conjunto

S = {(x, ẋ) ∈ Ω : −ẋT Md GGT Md ẋ = 0}, (4.20)

siendo M el conjunto invariante más grande en S. Esto significa que el Teorema de


LaSalle garantiza que todas las soluciones que comienzan el conjunto compacto Ω
tiende a M como t → ∞ [110].

Entonces, para calcular el conjunto invariante más grande M en S se realiza lo si-


guiente.

De la ecuación (4.20) se obtiene que

S = {(x, ẋ) ∈ Ω : GT Md ẋ = 0} (4.21)

la cual es equivalente a

(−µ3 cos θ + µ2 )θ̇ + (−µ2 cos θ + 1)q̇ = 0 (4.22)

Tome en cuenta que en el conjunto S se tiene que θ ∈ Iµ . Por lo tanto, las variables
θ̇ y q̇ no cambian su signo como se estableció en el lema 4.3.2. Ahora, si θ̇ y q̇ son
diferentes de cero y tienen el mismo signo dentro de S, entonces, (θ, q) tiende a salirse
del conjunto invariante Ω, siendo este caso una contradicción, ya que se asume que
(x, ẋ) ∈ Ω. En el caso que ẋ = 0 y x sea un vector constante fijo en S. Y definiendo
a x = x9 . Siendo x uno de los dos puntos de equilibrio del sistema (4.3). Es decir,
x = (0, 0) o x = (θ = π, q = 0). Sin embargo, de la definición del conjunto invariante Ω
descrito en (4.19), necesariamente se obtiene que x = 0. Por consiguiente, el conjunto
invariante más grande es M = 0.

Concluimos que el conjunto invariante más grande M contenido en S está constituido


por un solo punto de equilibrio (x = 0, ẋ = 0). Y de acuerdo con el Teorema de LaSalle
9
El sı́mbolo y indica que la variable y es una constante.
Capı́tulo 4. Estabilización del Péndulo Invertido
84 utilizando un ajuste de modelo

todas las soluciones que comienzan en Ω convergen asintóticamente hacia el conjunto


invariante más grande M , el cual esta definido por (x = 0, ẋ = 0).

Para resumir lo anterior, presentamos la siguiente proposición:

Proposición 4.4.2 Considere el modelo no lineal (4.3) en lazo cerrado con (4.8),
donde Md , Kd y Vd son seleccionadas de acuerdo al lema (4.3.2). Entonces, el origen
(x = 0, ẋ = 0) del sistema en lazo cerrado es localmente estable asintóticamente con
un dominio de atracción definido por (4.19).

Es importante notar que si la constante kp es grande,10 entonces el dominio de


atracción Ω se incrementa. Es decir, se puede incrementar el dominio de atracción
para casi todos los estados que inicien por encima del plano horizontal.

Comentario 4.4.3 Si las posiciones del sistema están inicialmente dentro de Ω


(comentario 4.4.1) con velocidades cero, entonces sintonizando adecuadamente los
parámetros de control se asegura que la posición del carro y el ángulo del péndulo
permanecerán dentro del conjunto Q ⊂ Ω donde

Q = {x = (θ, q) ⊂ Ω : |θ| < θµ < π/2 y|q| < q}

Por supuesto, q debe ser seleccionada a partir de las restricciones fı́sicas del movimien-
to del carro. En otras palabras, es posible llevar todos los estados a la posición inestable
si el ángulo y el movimiento del carro se confinan dentro del conjunto Q.

4.5. Resultados de la simulación


A fin de probar el desempeño de la ley de control obtenida realizamos algunas
simulaciones numéricas utilizando el programa MATLABTM .

En el primer experimento mostramos cómo afecta el parámetro kp sobre el compor-


tamiento transitorio y lo realizamos para dos diferentes valores que son kp = 1 y
10
La constante kp se relaciona con la energı́a potencial (4.13)
4.5. Resultados de la simulación 85

Figura 4.3 Comportamiento en lazo cerrado de las posiciones del sistema para dos
valores diferentes de kp .

kp = 2. Los valores asignados a los parámetros del controlador se proponen como


sigue: µ2 = 2,5, µ3 = 7. Las condiciones iniciales del sistema son θ0 = 1,1[rad],
θ̇0 = 0,1[rad/sec], q0 = 0 y q̇0 = 0, mientras que el coeficiente de amortiguamiento β
es cero. Las figuras 4.3 y 4.4 muestran el comportamiento transitorio de las posiciones
y velocidades del sistema, respectivamente. Como se puede observar, el incremento en
el valor de kp produce una mayor cantidad de oscilaciones y provoca que los estados
converjan lentamente al punto de equilibrio deseado. Intuitivamente el controlador
inyecta energı́a potencial, de modo que el sistema disipe toda la energı́a potencial
inicial mediante movimientos oscilatorios.

En el segundo experimento utilizamos los parámetros y condiciones iniciales del ex-


perimento anterior. Para ilustrar la robustez del sistema no lineal en lazo cerrado se
considera la presencia de una fuerza disipativa en la dirección subactuada. La figura
4.5 muestra el comportamiento de las posiciones del sistema, cuando el coeficiente de
amortiguamiento toma los valores de β = 0,1 y β = 0. Como se puede ver, el efecto de
la fuerza disipativa provoca una desestabilización del sistema en lazo cerrado; es decir,
el sistema converge más lentamente al origen en comparación con el caso cuando la
fuerza no existe, ya que el sistema tiene una convergencia más rápida.
Capı́tulo 4. Estabilización del Péndulo Invertido
86 utilizando un ajuste de modelo

Figura 4.4 Comportamiento en lazo cerrado de las velocidades del sistema para dos
valores diferentes de kp .

Figura 4.5 Robustez del controlador propuesto.


Capı́tulo 5

Control de Sistemas Subactuados


tipo Péndulo Invertido
por funciones de Saturación
Anidadas

En este capı́tulo se presenta una técnica sencilla que resuelve el problema de


estabilización de dos sistemas subactuados no lineales tipo péndulo invertido como
son el Péndulo Invertido sobre un Carro y el Péndulo con Disco de Inercia.

Esta estrategia parte de la idea que los sistemas pueden ser expresados como una
cadena de integradores con una pertubación no lineal que permite aplicar una ley
de control basada en funciones de saturación anidadas, que garantiza que todos lo
estados converjan a cero. La mayor parte de lo que expuesto en este capı́tulo aparece
publicado en los artı́culos [8, 14].

5.1. Introducción
La estabilización de los Sistemas Subactuados tipo Péndulo es uno de los proble-
mas más interesantes en Teorı́a de Control no lineal y se ve reflejado en la literatura

87
Capı́tulo 5. Control de Sistemas Subactuados tipo Péndulo Invertido
88 por funciones de Saturación Anidadas

por la gran gama de trabajos que abordan este tema [6, 54, 59, 72, 81, 152], entre
otros.

En este capı́tulo, nos centraremos en resolver el problema de estabilización de este de


tipo de sistemas subactuados aplicando la técnica de control basada en funciones de
saturación anidadas. Con el fin de ilustrar la metodologı́a se diseñarán controladores
para el clásico problema del Péndulo Invertido sobre un Carro [6], y para un sistema
subactuado presentado hace algunos años denominado Péndulo con Rueda Inercial
[187]. Esta técnica fue propuesta por A. R. Teel [192] para estabilizar una cadena de
integradores lineal y recientemente se ha utilizado para controlar algunos sistemas
subactuados como el PVTOL [50, 213]; el Péndulo Invertido sobre un Carro [127, 61];
el Péndulo con Rueda de Inercia [213] y el sistema viga-bola [194].

Una de las principales contribuciones de este capı́tulo es presentar un conjunto de


transformaciones lineales que permitan aplicar un controlador basado en funciones de
saturación anidadas para solucionar el problema de establización del sistema péndu-
lo invertido, ası́ como del péndulo con disco inercial. Además, esta técnica permite
proponer un controlador estabilizador sin que sea necesario tener una función candi-
data de Lyapunov para el sistema completo, provocando que el análisis de estabilidad
del sistema completo sea bastante sencillo, comparado con otros trabajos [127, 149].
Por otra parte, el controlador propuesto permite que los sistemas en lazo cerrado
sea asintóticamente estables de forma global y exponencialmente estables localmente
alrededor de la posición vertical inestable. Cabe destacar que la aportación más re-
levante es solucionar el problema de estabilización del Péndulo con Disco Inercial
considerando la presencia de fuerzas disipativas en la coordenada no actuada, ya
que estos términos destruyen la propiedades estructurales originales de los sistemas
Euler-Lagrange o Hamilton [78, 209].

El resto del capı́tulo se organiza como sigue. En las secciones 5.2 y 5.3 presentamos la
estabilización de los sistemas Péndulo Invertido sobre un Carro y Péndulo con Disco
Inercial, respectivamente.
5.2. Control del Sistema Péndulo Invertido sobre un Carro 89

5.2. Control del Sistema Péndulo Invertido sobre


un Carro
En esta sección se propone una estrategia sencilla para estabilizar el Péndulo
Invertido sobre un Carro alrededor del punto de equilibrio inestable, suponiendo que
el péndulo inicia su movimiento por encima del semi-plano superior. Inspirados por el
procedimiento presentado por R. Olfati-Saber [149], transformamos el sistema original
en una cadena de cuatro integradores con una pertubación no lineal. Y entonces,
aplicando el método de Lyapunov, introducimos un controlador basado en funciones
de saturación anidadas. Para posteriormente, mostrar que el sistema en lazo cerrado es
acotado, permitiendo probar que el sistema es localmente estable exponencialmente.
Además, el análisis de estabilidad del sistema completo de cuarto orden es bastante
simple comparado con otros análisis [127, 149]. Debido a que únicamente utilizamos
el enfoque de Lyapunov.

5.2.1. Modelo no lineal

M
u

Figura 5.1 Péndulo Invertido sobre un Carro.

Consideremos el modelo tradicional del PIC como se muestra en la Figura 5.1.


Este sistema se describe por el siguiente conjunto de ecuaciones diferenciales norma-
lizadas [85]:1
1
La obtención del modelo se puede encontrar de manera detallada en el apéndice A
Capı́tulo 5. Control de Sistemas Subactuados tipo Péndulo Invertido
90 por funciones de Saturación Anidadas

cos θẍ + θ̈ − sen θ = 0,


(5.1)
(1 + δ)ẍ + cos θθ̈ − θ̇2 sen θ = u,
donde, x es el desplazamiento normalizado del carro, θ es el ángulo del péndulo con
respecto al eje vertical, u es la fuerza normalizada aplicada al carro, y δ > 0 es una
constante que depende directamente de las masas del carro y del péndulo.

Si definimos v = θ̈ y cancelamos a ẍ de la segunda ecuación diferencial de (5.1), y


después de sustituir a:

µ ¶
1+δ
u = (1 + δ) tan θ1 − θ22 sen θ1 + v cos θ1 − ,
cos θ1
en el sistema (5.1) se obtiene:

ẋ1 = x2 ,
v
ẋ2 = tan θ1 − cos θ1
,
(5.2)
θ̇1 = θ2 ,
θ̇2 = v.
Donde x = x1 , θ = θ1 y v es un controlador auxiliar ficticio que actúa en la coordenada
θ1 . Por supuesto, el sistema anterior solo es valido para todo θ1 ∈ (−π/2, π/2). En lo
sucesivo, ésta restricción se denominará suposición A1 y al sistema (5.2) como un
modelo parcialmente linealizado del PIC.

Problema 5.2.1 El principal objetivo es controlar el sistema parcialmente linealiza-


do (5.2), de acuerdo a la suposición A1. En otras palabras, queremos llevar el ángulo
del péndulo y la posición del carro a cero.
5.2. Control del Sistema Péndulo Invertido sobre un Carro 91

A. Transformación del modelo parcialmente lineal en una cadena de inte-


gradores

Introducimos el siguiente cambio de coordenadas [149].

z1 = g(θ1 ) + x1 z2 = g 0 (θ1 )θ2 + x2 (5.3)

donde la función g será escogida, tal que la derivada de la variable z2 no depende del
control v, es decir,
µ ¶
0 1
ż2 = tan θ1 + v g (θ1 ) − + θ22 g 00 (θ1 ). (5.4)
cos θ1
Ası́, µ ¶
0 1 1 + tan(θ1 /2)
g (θ1 ) = ; g(θ1 ) = log , (5.5)
cos θ1 1 − tan(θ1 /2)
y están definidas para |θ1 | < π/2.
Por lo tanto, de las expresiones (5.3) y (5.5), el sistema (5.2) puede escribirse de la
siguiente manera:

ż1 = z2 ,
θ22
ż2 = tan(θ1 )(1 + cos θ1
),
(5.6)
θ̇1 = θ2 ,
θ̇2 = v.
Entonces, para expresar el sistema anterior como una cadena de integradores con una
pertubación no lineal, es necesario definir las siguientes transformaciones globales no
lineales

w1 = tan θ1 , w2 = sec2 θ1 θ2 ,
(5.7)
vf = sec2 θ1 v + 2θ22 tan θ1 sec2 θ1
con las cuales obtenemos el siguiente sistema:

ż1 = z2 ,
w1 w22
ż2 = w1 + (1+w12 )3/2
,
(5.8)
ẇ1 = w2 ,
ẇ2 = vf .
Capı́tulo 5. Control de Sistemas Subactuados tipo Péndulo Invertido
92 por funciones de Saturación Anidadas

Comentario 5.2.2 Una representación similar del modelo (5.8) fue propuesta en
[127]. En donde, el control y la coordenada no actuada no están completamente des-
acopladas. Esto significa que el control actúa directamente sobre la perturbación no
lineal y como consecuencia el sistema en lazo cerrado tiene un dominio de atracción
más restringido. Por otra parte, en nuestro caso la acción de control está desacoplada
completamente de la pertubación no lineal, de modo que, es posible aumentar el do-
minio de estabilidad para todas las condiciones iniciales que pertenecen al semi-plano
superior.

5.2.2. Estrategia de Control


En este apartado se propone una función de saturación anidada para controlar
un sistema no lineal que puede ser expresado aproximadamente como una cadena
de integradores con una perturbación no lineal. Esta técnica fue propuesta por A.
Teel [192] para estabilizar una cadena de integradores lineal, y además ha sido usa-
da para controlar pequeñas maquinas voladoras [50]. Por lo tanto, para solucionar
nuestro problema de estabilización realizaremos los siguientes pasos. Primero usamos
una transformación lineal que permite proponer el controlador. Posteriormente, se
demostrará que ésta ley de control garantiza que todos los estados sean acotados y
después de un tiempo finito se asegure que todos los estados converjan a cero.

Definición 5.2.1 σm (s) : R → R es una función de saturación lineal, si satisface:


(
s if |s| ≤ m
σm (s) = (5.9)
m sign(s) if |s| > m
5.2. Control del Sistema Péndulo Invertido sobre un Carro 93

A. Diseño de la ley de control

En primer lugar, proponemos la siguiente transformación lineal:


    
q1 1 3 3 1 z1
    
 q   0 1 2 1  z 
 2    2 
 =  . (5.10)
 q3   0 0 1 1   w1 
    
q4 0 0 0 1 w2
Por lo tanto, aplicando la transformación anterior, el sistema (5.8) se expresa de la
siguiente manera,

q̇1 = vf + q2 + q3 + q4 + 3δa (q)


q̇2 = vf + q3 + q4 + δa (q)
(5.11)
q̇3 = vf + q4
q̇4 = vf
donde la perturbación δa se define como:

δa (q) = q42 G(q3 − q4 ), (5.12)

y
w
G(w) = , (5.13)
(1 + w2 )3/2
por simplicidad, q = [q1 , q2 , q3 , q4 ].

2
Comentario 5.2.3 Es importante notar que el max |G(w)| ≤ k0 = 33/2
, y se obtiene

cuando w = 1/ 2.

Finalmente, el controlador se propone como sigue:


µ ¶
q3 + σβ (q2 + σγ (q1 ))
vf = −q4 − kσα . (5.14)
k
donde, k es una constante positiva.
Capı́tulo 5. Control de Sistemas Subactuados tipo Péndulo Invertido
94 por funciones de Saturación Anidadas

B. Acotamiento de los estados

A continuación, mostramos en cuatro pasos que el controlador propuesto (5.14) ase-


gura que todos lo estados son acotados; sin embargo, el acotamiento de cada estado
depende directamente de los parámetros del controlador.2

Primer paso: Definamos la siguiente función de definida positiva, para mostrar que
el estado q4 es acotado.

V4 = q42 /2 (5.15)

Entonces, calculando la derivada de V4 con respecto al tiempo se obtiene la expresión:

V̇4 = −q42 − kq4 σα (q3 /k + σβ (q2 + σγ (q1 ))/k). (5.16)

Se puede observar claramente que V̇4 < 0, cuando |q4 | ≥ αk. Por consecuencia, existe
un tiempo finito T1 > 0 tal que:

|q4 (t)| < αk; ∀ t > T1 . (5.17)

Segundo paso: Para analizar el comportamiento del estado q3 . Consideremos la


función definida positiva

V3 = q32 /2 (5.18)

Por tanto, diferenciando V3 , y sustituyendo (5.14) en la tercera ecuación diferencial


de (5.11) se obtiene lo siguiente:

V̇3 = −q3 kσα (q3 /k + σβ (q2 + σγ (q1 ))/k), (5.19)

donde α y β son escogidos, tal que α > 2β. Y claramente, si |q3 | > β, entonces V̇3 < 0
y existirá un tiempo finito T2 > T1 después del cual
2
Cabe destacar que |q4 (t)| ≤ q4 (0)e−t + α y |G(q3 − q4 )| ≤ k0 . Por lo tanto, el lado derecho
del sistema en lazo cerrado (5.14) y (5.11) es localmente Lipschitz. Por consiguiente, los estado
{q1 , q2 , q3 } no pueden tener un tiempo de escape finito [110].
5.2. Control del Sistema Péndulo Invertido sobre un Carro 95

|q3 (t)| < β; ∀ t > T2 . (5.20)

Cuando la condición anterior se satisface, la ley de control vf toma la siguiente forma.

vf = −q4 − q3 − σβ (q2 + σγ (q1 )) ∀ t > T2 . (5.21)

Tercer paso: Sustituyendo (5.21) en la segunda ecuación de (5.11), obtenemos

q̇2 = −σβ (q2 + σγ (q1 )) + δa (q). (5.22)

Además, definiendo la función definida positiva.

V2 = q22 /2 (5.23)

Y derivando V2 a lo largo de las trayectorias de la ecuación (5.22) se produce lo


siguiente:3

V̇2 = −q2 (σβ (q2 + σγ (q1 )) + δa (q)) (5.24)

donde β y γ deben satisfacer la relación β > 2γ + k0 α2 k 2 . Y obviamente, si |q2 | >


γ + k0 α2 k 2 , entonces V̇2 < 0. Por lo tanto, existe un tiempo finito T3 > T2 despúes
del cual |q2 | satisface lo siguiente:

|q2 | < γ + k0 k 2 α2 , ∀t > T3 . (5.25)

Por consiguiente, q2 es acotado y el control vf se convierte en:

vf = −q4 − q3 − q2 − σγ (q1 ), ∀t > T3 . (5.26)

Cuarto paso: Sustituyendo (5.26) en la primera ecuación de (5.11), se obtiene:

q̇1 = −σγ (q1 ) − 3δa (q). (5.27)


3
Recordando que después de t > T3 , se tiene que |δa (q)| ≤ k0 α2 k 2 .
Capı́tulo 5. Control de Sistemas Subactuados tipo Péndulo Invertido
96 por funciones de Saturación Anidadas

Ahora, introduciendo la función definida positiva

V1 = q12 /2 (5.28)

Y derivando V1 a lo largo de las trayectorias de (5.27), obtenemos

V̇1 = −q1 (σγ (q1 ) + 3δa (q)), (5.29)

donde el parámetro γ debe escogerse, tal que γ > 3k0 α2 k 2 . Y si q1 > 3k0 α2 k 2 ,
entonces V̇1 < 0, Por lo cual, existirá un tiempo finito T4 > T3 en donde:

|q1 | < 3k0 α2 k 2 , ∀t > T4 . (5.30)

Por consecuencia q1 también es acotado. Entonces, todas las restricciones de los


parámetros α, β y γ se pueden resumir como:

α > 2β, β > 2γ + k0 k 2 α2 , γ > 3k0 k 2 α2 . (5.31)

Entonces, manipulando las desigualdades anteriores, tenemos que

α < 1/(14k0 k 2 ). (5.32)

Por lo tanto, el parámetro k se puede tomar como 14k0 k 2 = 1 y el conjunto de


parámetros de control se pueden escoger como

α = r, β = r/2, γ = 3r/14, (5.33)

para todo 0 < r ≤ 1.

C. Convergencia de los estados a cero

Enseguida, demostraremos que el sistema en lazo cerrado dado por (5.11) y (5.14)
es asintóticamente estable y exponencialmente estable localmente si lo parámetros del
controlador satisfacen las ecuaciones definida en (5.31).
5.2. Control del Sistema Péndulo Invertido sobre un Carro 97

Cabe notar que después del tiempo t > T4 , la ley de control ya no está saturada, es
decir:

vf = −q1 − q2 − q3 − q4 ,

y el sistema en lazo cerrado toma la forma siguiente:

q̇1 = −q1 + 3δa (q),


q̇2 = −q1 − q2 + δa (q),
(5.34)
q̇3 = −q1 − q2 − q3 ,
q̇4 = −q1 − q2 − q3 − q4 ,
con δa descrita en (5.12).

Definamos la siguiente función de Lyapunov:

1
V = q T q, (5.35)
2
Y diferenciando V a lo largo de las trayectorias del sistema (5.34), obtenemos:

V̇ = −q T M q + (3q1 + q2 )δa (q) (5.36)

donde
 
1 1 1
1 2 2 2
 
 1
1 1 1 
 2 2 2 
M = . (5.37)
 1 1
1 1 
 2 2 2 
1 1 1
2 2 2
1
siendo M definida positiva con λmin {M } = 1/2.

Es importante destacar que del comentario 5.2.3 y de la expresión (5.12), podemos


determinar fácilmente que el segundo termino de la ecuación (5.36) satisface:

k0
|(3q1 + q2 )δ(q)| < 2
|(3q1 + q2 )q42 | ;
(5.38)
k0 4
< 2
(q4 + (3q1 + q2 )2 ).
Capı́tulo 5. Control de Sistemas Subactuados tipo Péndulo Invertido
98 por funciones de Saturación Anidadas

Por lo tanto, V̇ cumple:

1£ 2 ¤ q42 1
V̇ < − q1 + q2 − k0 (3q1 + q2 ) − (1 − k0 q42 ) − q32 .
2 2
(5.39)
2 2 2

De la definición de k0 y recordando que 14k0 k 2 = 1, obtenemos que la desigualdad


anterior es definida negativa estrictamente, si:

q12 + q22 − k0 (3q1 + q2 )2 > 0, (5.40)

y
−1 + k0 q42 ≤ −1 + 14k0 k 2 < 0. (5.41)

Por consiguiente, V̇ es estrictamente negativa y el vector de estados q converge a


cero de manera exponencial localmente despúes de un tiempo t > T4 .

Del procedimiento descrito se obtiene que el sistema (5.11) en lazo cerrado con el
controlador (5.14) es asintóticamente estable semi-globalmente, ası́ como exponen-
cialmente estable localmente, cuando los parámetros cumplen con la (5.31). Sin em-
bargo, podemos solo asegurar que los estados originales (x, θ, ẋ, θ̇) convergen a cero, si
suponemos que el ángulo del péndulo se encuentra en el semi-plano superior, debido
a que (5.2) y (5.7) únicamente están definidas para θ ∈ (−π/2, π/2). Es decir, la
suposición A1 se necesita para evitar los puntos singulares del sistema definidos en
θ = ±π/2.

Entonces, de lo anterior se deriva:

Proposición 5.2.4 Considere el modelo parcialmente linealizado del Sistema Péndu-


lo Invertido sobre un Carro (5.2), de acuerdo con la suposición A1 y en lazo cerrado
con la ley de control:
µ ¶
q3 + σβ (q2 + σγ (q1 ))
v = −θ2 − kσα cos2 θ1 − 2θ22 tan θ1 , (5.42)
k
p
donde k = 1/(14 × (2/33/2 )) y los estados q1 , q2 y q3 se definen como:
5.2. Control del Sistema Péndulo Invertido sobre un Carro 99

q1 = z1 + 3z2 + 3w1 + w2 ; q2 = z2 + 2w1 + w2 ; q3 = w1 + w2 , (5.43)

con
w1 = tan θ1 ; w2 = θ2 sec2 θ1 ;
³ ´ (5.44)
1+tan(θ1 /2)
z1 = log 1−tan(θ 1 /2)
+ x1 ; z2 = θ2 / cos θ1 + x2 .

Entonces, el sistema en lazo cerrado es globalmente estable ası́ como exponencial-


mente estable localmente; si los parámetros del controlador α, β y γ cumplen con las
desigualdades definidas en (5.31).

5.2.3. Resultados de Simulación


La eficiencia de la estrategia de control propuesta ha sido probada mediante si-
mulaciones computacionales implementadas en el programa MATLABT M . Los pa-
rámetros de controlador usados son α = 0,99, β = 0,49 y γ = 0,214, además, las
condiciones iniciales toman los siguientes valores: θ1 (0) = 1,18 [rad], θ2 (0) = −0,05
[rad/ sec], x1 (0) = −0,6 y x2 (0) = 0,5.
La figuras 5.2 y 5.3 muestran las respuestas en lazo cerrado del controlador (5.42)
cuando se aplica al modelo parcialmente linealizado (5.2). De las figuras se puede
observar que el estado x1 converge muy lentamente a cero, comparado con el estado θ1 .
Esto significa que la posición del carro se incrementa hasta que el ángulo del péndulo
se aproxima a cero. Esto se puede explicar de la siguiente manera: el controlador
primero lleva al péndulo a colocarse en una vecindad muy cercana a cero, mientras que
la posición del carro alcanza su valor máximo para que posteriormente el controlador
mueva el carro lentamente al origen. Cabe destacar que la estrategia de control sólo
realiza movimientos lentos del sistema.

Finalmente, la figura 5.4 representa el comportamiento de la ley de control v y de la


función de energı́a. Como se puede ver en la gráfica, la entrada de control v, ası́ como
la función de Lyapunov que decrece después de t > 10 convergen a cero.
Capı́tulo 5. Control de Sistemas Subactuados tipo Péndulo Invertido
100 por funciones de Saturación Anidadas

Tiempo Tiempo

Figura 5.2 Respuesta en lazo cerrado del ángulo y velocidad angular del péndulo.

Tiempo Tiempo

Figura 5.3 Respuesta en lazo cerrado de la posición y velocidad carro.

Tiempo Tiempo

Figura 5.4 Comportamiento del controlador v y de la función de energı́a V .


5.3. Control del Péndulo con Disco Inercial 101

5.3. Control del Péndulo con Disco Inercial


En esta seccı́on se aborda el problema de estabilización del sistema conocido como
Péndulo con Disco de Inercia alrededor del punto de equilibrio inestable, el cual tiene
la caracterı́stica de estar fuertemente amortiguado.

Siendo la principal contribución de esta sección una serie de transformaciones que


permitirán utilizar un controlador basado en funciones de saturación anidadas para
llevar al sistema a su punto de equilibrio inestable. Obteniendo un sistema en lazo
cerrado globalmente asintótico y exponencialmente estable localmente.

5.3.1. Modelo no lineal del Péndulo con Disco Inercial


y

1
x

l2

m 1, I 1
l1

I2
m2

Figura 5.5 Péndulo con Disco Inercial.

El sistema conocido como Péndulo con Disco Inercial (PDI) mostrado en la figura
5.5, fue definido por M. Spong [187] y consiste en un péndulo fı́sico con un disco
equilibrado situado al extremo. El par motor produce una aceleración angular de la
masa del extremo lo cual genera un par de acoplamiento en el eje del péndulo.
Capı́tulo 5. Control de Sistemas Subactuados tipo Péndulo Invertido
102 por funciones de Saturación Anidadas

El modelo de este sistema puede ser descrito como sigue [59]:4

(I1 + I2 + m1 l22 + m2 l12 ) θ̈1 + I2 θ̈2 − ηg sen(θ1 ) + δ1 θ̇1 = 0


(5.45)
I2 θ̈1 + I2 θ̈2 + δ2 θ̇2 = τ

donde, θ1 es el ángulo del péndulo, θ2 es el ángulo de disco y τ el torque aplicado al


disco. Los parámetros restantes se describen en la siguiente tabla:

m1 : Masa del péndulo


m2 : Masa de la rueda
l1 : Longitud del péndulo
l2 : Distancia al centro de masa del péndulo
δ1 : Coeficiente de amortiguamiento de la coordenada subactuada
δ2 : Coeficiente de amortiguamiento de la coordenada actuada
I1 : Momento de Inercia del péndulo
I2 : Momento de Inercia del disco
η = m1 l2 + m2 l1

Como puede verse, θ1 y θ2 son las coordenadas subactuada y actuada, respectiva-


mente. Y τ actúa directamente en la posición angular del disco. Entonces, para
simplificar las manipulaciones algebraicas en desarrollos posteriores reescribiremos
el sistema (5.45) como:

(1 + κ1 ) θ¨1 + θ̈2 − κ2 sen(θ1 ) + δ θ̇1 = 0


(5.46)
θ̈1 + θ̈2 = v
donde
κ1 = (I1 + m1 l22 + m2 l12 )/I2 ; κ2 = ηg/I2 ;
(5.47)
δ1
τ = vI2 + δ2 θ̇2 δ= I2
.

El objetivo principal de este apartado es encontrar una retroalimentación v que


lleve el péndulo a la posición invertida con la posición del disco en el origen, aun si
se presentara una fuerza disipativa lineal en la coordenada no actuada.

4
La obtención de las ecuaciones dinámicas del sistema utilizando las ecuaciones de Euler-Lagrange
se describen en el apéndice A.2
5.3. Control del Péndulo con Disco Inercial 103

Comentario 5.3.1 Cuando δ = 0, en la literatura se puede encontrar la solución al


problema de estabilización asintótico del sistema alrededor del punto de equilibrio in-
estable por medio de métodos basados en energı́a u otro procedimiento [151, 59, 159].
Ya que, si el amortiguamiento se presentara en el sistema utilizando estos métodos
se perderı́an las propiedades de platitud y pasividad, provocando que el sistema en
lazo cerrado pudiera ser inestable o convergiera a otro punto de equilibrio [209, 166].
Lo anterior puede demostrarse por medio de una linealización del sistema alrededor
de la posición invertida. Por otra parte, tampoco es posible resolver la estabilización
asintótica del sistema utilizando enfoques basados en ajuste de modelo [78, 156]. Es
decir, los métodos de Lagrangiano o Hamiltoniano controlado no son adecuados para
solucionar la estabilización del sistema cuando el amortiguamiento se presenta en el
sistema. Esto se debe a que la fuerza de amortiguamiento rompe las propiedades de
simetrı́a de los sistemas Euler-Lagrange o Hamilton. Para evitar este obstáculo intro-
ducimos una transformación global que permita expresar el sistema (5.46) como una
cadena de integradores con una pertubación no lineal. Para posteriormente, utilizar
un controlador basado en funciones de saturación anidadas que haga asintóticamente
estable el origen del sistema transformado.

A. Transformación de la estructura original del sistema:

Introducimos el siguiente cambio de coordenadas globales:

z1 = (1 + κ1 ) θ1 + θ2 ; ż1 = p1 ;
(5.48)
z2 = θ 1 ; ż2 = p2 ,
de las cuales se obtiene el siguiente sistema no lineal

ẋ = A0 x + ∆(x) + b0 u (5.49)
Capı́tulo 5. Control de Sistemas Subactuados tipo Péndulo Invertido
104 por funciones de Saturación Anidadas

donde
   
z1 0 1 0 0
   
 p   0 0 κ −δ 
 1   2 
x= ; Ao =  ;
 z2   0 0 0 1 
   
p2 0 0 0 0

   
0 0
   
 κ φ(z )   0 
 2 2   
∆(x) =  ; b0 =   .
 0   0 
   
0 1

La pertubación φ y el nuevo controlador u se definen como sigue

φ(z2 ) = sen(z2 ) − z2 ;
(5.50)
1
u= κ1
(−v − δ ż2 + κ2 sen(z2 )).
Cabe destacar que la estructura del sistema (5.49) tiene una forma similar a la de
una cadena de integradores con una pertubación no lineal. Por otra parte, el nuevo
controlador u actuada directamente en la coordenada no actuada θ1 , la cual es la
posición del péndulo. Contrario a lo que sucedı́a en el sistema (5.46) en donde el torque
τ manejaba directamente la posición del disco. Por consiguiente, se han realizado
pequeños cambios a la estructura original del péndulo con rueda de inercia fuertemente
amortiguado.

5.3.2. Estrategia de control


En esta sección establecemos la estructura de nuestra estrategia de control. La
idea primordial es llevar todos los estados a una vecindad cercana del origen, donde
la pertubación no lineal puede ser acotada por el cuadrado de la posición angular
del péndulo para, posteriormente, realizar el análisis de estabilidad por medio de la
estabilidad de sistema lineal robusto. En otras palabras, forzamos los estados del sis-
tema (5.49) a comportarse como un sistema lineal exponencial con una perturbación
5.3. Control del Péndulo con Disco Inercial 105

pequeña. Para lograrlo usamos un controlador basado en funciones de saturación


anidadas semejante al que se utilizó para resolver el problema de estabilización del
sistema Péndulo Invertido sobre una Carro presentado en las secciones anteriores de
este capı́tulo.

Como se ha comentado esta técnica fue propuesta en [192, 195], y ha sido usada
para estabilizar una cadena de integradores lineal, ası́ como para controlar diversos
sistemas subacutuados [8, 50, 127, 126, 194].

El procedimiento que se utilizará es el siguiente: Primero, usamos una transforma-


ción lineal para proponer un controlador estabilizador, después, se mostrará que el
controlador propuesto garantiza el acotamiento de todos los estados. Y finalmente, se
demuestra que el sistema en lazo cerrado es asintóticamente estable exponencialmente
de manera local después de un tiempo finito.

Antes de efectuar los desarrollos de la estrategia de control introducimos la siguiente


definición:

Definición 5.3.1 Decimos que la función σm [s] : R → R es una función de satu-


ración lineal, si satisface
(
s if |s| ≤ m
σm [s] = . (5.51)
msign(s) if |s| > m

A. Controlador basado en saturaciones anidadas.

Inspirados en el trabajo presentado por A. R. Teel [192], proponemos una trans-


formación lineal que permitirá obtener el controlador u que estabilizará al sistema no
lineal (5.49).
Capı́tulo 5. Control de Sistemas Subactuados tipo Péndulo Invertido
106 por funciones de Saturación Anidadas

Por tanto, la transformación lineal q = Sx, se escogerá de tal manera se cumpla lo


siguiente:

   
0 1 1 1 1
   
 0 0 1 1   1 
   
SAo S −1 =  y Sb0 =   .
 0 0 0 1   1 
   
0 0 0 0 1

Realizando, algunas manipulaciones algebraicas proponemos a S como


 
1 δ+3κ2 δ2 3δ
κ2 κ22
3+ κ22
+ κ2
1
 
 0 1
2+ δ
1 
 k2 κ2 
S= , (5.52)
 0 0 1 1 
 
0 0 0 1
Por lo tanto, el sistema (5.49) se puede escribir de la siguiente forma:
³ ´
δ+3κ2
q̇1 = u + q2 + q3 + q4 + κ2
φ(q3 − q4 )
q̇2 = u + q3 + q4 + φ(q3 − q4 )
(5.53)
q̇3 = u + q4
q̇4 = u
Entonces, para estabilizar el sistema (5.53), se propone la siguiente ley de control u
basada en saturaciones anidadas, como:
· ¸
1
u = −q4 − kσα (q3 + σβ [q2 + σγ [q1 ]]) , (5.54)
k
donde k es una constante positiva.
Cabe señalar que el sistema en lazo cerrado definido por las ecuaciones (5.53) y (5.54),
5
es globalmente Lipschitz. Por consecuencia, todos los estados {qi } no pueden tener
un tiempo de escape finito [110].
5
{xi } denota a x = [x1 , x2, x3 , x4 ]T .
5.3. Control del Péndulo con Disco Inercial 107

B. Acotamiento de los estados.

A continuación, mostraremos en cuatro sencillos pasos que la solución del sistema


en lazo cerrado formado por (5.53) y (5.54) garantiza que todos los estados sean
acotados. Además, el acotamiento de cada estado depende de manera directa del
diseño de los parámetros del controlador (5.54).

Paso 1: Para mostrar que el estado q4 es acotado introducimos la función auxiliar


V1 , definida como:

1
V1 = q42 (5.55)
2
Entonces, derivando (5.55) y usando la cuarta ecuación diferencial de (5.53), se tiene
que:

V̇1 = −q42 − q4 kσα [q3 /k + σβ [q2 + σγ [q1 ]] /k]

Y si |q4 | > kα entonces, de la expresión anterior se obtiene que V̇1 ≤ 0. Por tanto,
habrá un tiempo finito T1 después del cual se tenga que:

|q4 (t)| < kα; ∀t > T1 .

Es decir, q4 es acotado después de un tiempo finito T1 .

Paso 2: Para poder analizar el comportamiento del estado q3 se necesita definir la


función auxiliar positiva V2 , como:

1
V2 = q32 . (5.56)
2
Por lo cual, sustituyendo el controlador propuesto (5.54) en la tercera ecuación dife-
rencial de (5.53), se tiene lo siguiente:
· ¸
1
q̇3 = −kσα (q3 + σβ [q2 + σγ [q1 ]]) . (5.57)
k
Capı́tulo 5. Control de Sistemas Subactuados tipo Péndulo Invertido
108 por funciones de Saturación Anidadas

Diferenciando (5.56) y usando (5.57), obtenemos:


· ¸
1
V̇2 = −q3 kσα (q3 + σβ [q2 + σγ [q1 ]])
k
donde los parámetros de control α y β han sido seleccionados tal que, α > 2β/k. Y si
|q3 | > β entonces, V̇2 ≤ 0. Por consiguiente, existirá un tiempo finito T2 > T1 , después
del cual se tiene que la |q3 (t)| cumpla lo siguiente:

|q3 (t)| < β; ∀t > T2 .

Consiguientemente, q3 también es acotado después de un tiempo finito T2 . Por otra


parte definimos la siguiente variable auxiliar

w = q3 + σβ [q2 + σγ [q1 ]] ,

de la cual se tiene que |w(t)| ≤ |q3 (t)| + β, para todo t > 0, y evidentemente, |w(t)| <
2β después de t > T2 . Y debido que α > 2β/k entonces
· ¸
1
kσα w = w; t > T2 .
k
De lo anterior, el control u toma la siguiente forma:

u = −q4 − q3 − σβ [q2 + σγ [q1 ]] ; t > T2 . (5.58)

Comentario 5.3.2 Después de t > T2 , tenemos que

αk
|q3 − q4 | < β + kα < + αk = µk . (5.59)
2
por lo cual, el parámetro k se puede seleccionar como se desee, y µk < 1. Por conse-
cuencia, |q3 (t) − q4 (t)| < µk < 1, para todo t > T2 . Entonces, aplicando la siguiente
desigualdad

|sen(x) − x| ≤ |sen(1) − 1| x2 = θ x2 ; ∀ |x| < 1, (5.60)

en la definición de la función φ, se obtiene que

|φ(q3 − q4 )| ≤ θ |q3 − q4 |2 < θµ2k ; ∀t > T2 . (5.61)


5.3. Control del Péndulo con Disco Inercial 109

Paso 3: Ahora, sustituyendo (5.58) en la segunda ecuación diferencial de (5.53) se


obtiene:

q̇2 = −σβ [q2 + σγ [q1 ]] + φ(q3 − q4 ); t > T2 , (5.62)

donde β y γ satisfacen la relación β > 2γ + θµ2k . Entonces, para mostrar que q2 es


acotado se necesita introducir la función auxiliar V3 , como:

1
V3 = q22 . (5.63)
2
Por lo cual, derivando (5.63) y utilizando (5.62), se produce la expresión siguiente:

V̇3 = −q2 (σβ [q2 + σγ [q1 ]] + φ(q3 − q4 )) .

Obviamente, si |q2 | > γ + θµ2k se cumplirı́a que V̇3 ≤ 0 y existirá un tiempo finito
T3 > T2 , después del cual se obtendrá la siguiente desigualdad:

|q2 (t)| < γ + θµ2k ; ∀t > T3 .

Como consecuencia, q2 es acotado y el control u se convierte en:

u = −q4 − q3 − q2 − σγ [q1 ] ; ∀t > T3 . (5.64)

Paso 4: Para analizar el comportamiento de q1 , sustituimos (5.64) en la primera


ecuación diferencial de (5.53), obteniendo:
µ ¶
δ
q̇1 = −σγ [q1 ] + + 3 φ(q3 − q4 ); ∀t > T3 . (5.65)
κ2
Entonces, para mostrar que q1 es acotado, definimos la función auxiliar positiva V4
de la siguiente manera:

1
V4 = q12 . (5.66)
2
Capı́tulo 5. Control de Sistemas Subactuados tipo Péndulo Invertido
110 por funciones de Saturación Anidadas

Por lo tanto, derivando (5.66) y usando (5.65) se obtiene que:


µ µ ¶ ¶
δ
V̇4 = −q1 σγ [q1 ] + + 3 φ(q3 − q4 ) . (5.67)
κ2
Donde γ tiene que ser seleccionada tal que, γ > (δ/κ2 + 3) θµ2k . Y si |q1 | > (δ/κ2 +
3)θµ2k se obtiene que V4 ≤ 0, y habrá un tiempo T4 > T3 tal que:
µ ¶
δ
|q1 (t)| < + 3 θµ2k ; ∀t > T4 .
κ2
Entonces, de los pasos anteriores podemos concluir que los estados {qi } son acotados
después del tiempo t > T4

A continuación, resumimos esta sección con el siguiente lema que permitirá calcular
los parámetros del controlador adecuadamente definidos como {α, β, γ, µk }, los cuales
son necesarios para garantizar el acotamiento de todos los estados.

Lema 5.3.3 Dadas las constantes positivas δ y κ2 ; y considerando que µk ∈ (0, 1)6
se obtienen las siguientes desigualdades:

³ ´
δ
α > 2β; β > 2γ + θµ2k ; γ > κ2
+ 3 θµ2k , (5.68)

que se cumplirán si los parámetros γ, β y α son escogidos como sigue:


³ ´
δ 2δ
γ= λθµ2k κ2
+ 3 ; β = λθµ2k (7 + κ2
);
(5.69)

α = 2λθµ2k (7 + κ2
),
donde λ > 1.

C. Convergencia de los estados a cero

Para probar que el sistema en lazo cerrado descrito por (5.53) y (5.58) es asintótica-
mente estable y exponencialmente estable localmente de acuerdo con las suposiciones
del lema 5.3.3. Es decir, si los parámetros, k, γ y β son escogidos de acuerdo al lema
5.3.3, entonces el vector de estado q converge a cero.
6
Cabe recordar que k = 2µk /3α.
5.3. Control del Péndulo con Disco Inercial 111

Cabe destacar que después del tiempo t > T4 , la ley de control ya no está saturada,
es decir:

u = −q1 − q2 − q3 − q4 ,

y el sistema en lazo cerrado toma la siguiente forma:


³ ´
δ
q̇1 = −q1 + κ2
+ 3 φ(q3 − q4 ),
q̇2 = −q1 − q2 + φ(q3 − q4 ),
(5.70)
q̇3 = −q1 − q2 − q3 ,
q̇4 = −q1 − q2 − q3 − q4 ,
Entonces, para demostrar la convergencia de los estados a cero, usaremos la siguiente
función de Lyapunov
1
V = q T q, (5.71)
2
Derivando (5.71) a lo largo de las trayectorias del sistema (5.70), se obtiene que
µ ¶
T δ
V̇ = −q M q + q2 + ( + 3)q1 φ(q3 − q4 ) (5.72)
κ2
donde M se define como sigue:
 
1 1 1
1 2 2 2
 
 1
1 1 1 
 2 2 2 
M = .
 1 1
1 1 
 2 2 2 
1 1 1
2 2 2
1

Cabe notar que λmin {M } = 1/2 , por tanto M > 0. Y recordando que después del
tiempo t > T4 , los estados q1 , q2 y la función φ satisfacen las siguientes desigualdades:
³ ´ ³ ´
δ δ
|q1 | < θµ2k κ2
+3 ; |q2 | < θµ2k κ2
+4 ;
|φ(q3 − q4 )| < θ(q3 − q4 )2 .

Entonces, sustituyendo las desigualdades anteriores en el segundo término de (5.72)


y después de usar la desigualdad del triángulo tenemos que:
Capı́tulo 5. Control de Sistemas Subactuados tipo Péndulo Invertido
112 por funciones de Saturación Anidadas

|(δ/κ2 + 3)q1 + q2 | |φ(q3 − q4 )| < K(q3 − q4 )2 ≤ 2K(q32 + q42 ); (5.73)

donde

K = θµ2k (δ/κ2 + 3)2 + θµ2k (δ/κ2 + 4) . (5.74)

Es importante comentar que K puede ser tan pequeño como se necesite, ya que
µk ∈ (0, 1) puede seleccionar como se desee.

Por lo cual, aplicando las desigualdades (5.73) en la derivada de V expresada en


(5.72), es evidente que tengamos lo siguiente

1£ 2 ¤
V̇ < − q1 + q22 + q32 + q42 + 2K(q32 + q42 ).
2

y si forzamos a que K < 1/4, se obtendrá que V̇ < 0, para todo q 6= 0. Por lo tanto,
si K se escoge tal que K < 1/4, entonces el vector de estado q convergirá a cero
exponencialmente de manera local.

De la discusión anterior se deriva la siguiente proposición:

Proposición 5.3.4 Considere el sistema péndulo con disco inercial descrito por (5.46),
en lazo cerrado con

· ¸
1
v = κ1 q4 + κ1 kσα (q3 + σβ [q2 + σγ [q1 ]]) − δ θ̇1 + κ2 sen(θ1 ),
k

donde q se obtiene por medio de la relación {qi } = S {xi }, la matriz S es dada en


(5.52), y el conjunto xi está definido como

x1 = z1 = (1 + κ1 ) θ1 + θ2 , x2 = p1 = ẋ1 , x3 = z2 = θ1 , x4 = p2 = θ̇1 .
5.3. Control del Péndulo con Disco Inercial 113

Suponiendo que los parámetros de control {α, β, γ, k} se han seleccionado de acuerdo


con el lema 5.3.3. Entonces, se obtiene que el sistema en lazo cerrado es globalmente
asintótico y exponencialmente estable localmente, siempre que K < 1/4 donde la
estimación de K se define en (5.74).

Comentario 5.3.5 Podemos mencionar que el torque τ es parcialmente acotado.


Debido a que el controlador propuesto incluye las velocidades angulares del sistema
como se puede observar en (5.47) y la proposición 5.3.4.

5.3.3. Simulación Computacional


Para ilustrar el desempeño de la ley de control obtenida realizamos dos simu-
laciones usando el programa de MATLABTM . Los parámetros fı́sicos del sistema se
seleccionan como m1 = 0,01[kg], m2 = 0,1[kg], l1 = 0,5[m], l2 = 0,35[m], I1 =
3,5 × 10−3 [kgm2 ] y I2 = 1,4 × 10−2 [kgm2 ]. Sin embargo, en el primer experimento
el término correspondiente al amortiguamiento lineal fue escogido como δ1 = 0,5,
mientras en el segundo se le dio el valor de δ1 = 0,05.

En el primer experimento, transferimos el sistema de la posición de equilibrio inferior


estable a la posición invertida inestable. Esto significa que las condiciones iniciales se
proponen de la siguiente manera: θ1 (0) = π[rad], θ2 (0) = 0[rad], θ̇1 (0) = 0[rad/s] y
θ̇2 (0) = 0[rad/s]. Además, los parámetros estructurales definidos en (5.47) toman los
siguientes valores κ1 = 0,80357, κ2 = 36,75 y δ = 35,71. Los parámetros de contro-
lador se han diseñado de acuerdo al lema 5.3.3 y la proposición 5.3.4, seleccionándolos
como α = 0,23, β = 0,1171, γ = 0,05195 y µk = 0,33.

En la figura 5.6 se muestra la respuesta en lazo cerrado del sistema y se puede observar
que el estado θ1 converge a cero más rápido que el estado θ2 . Esto significa que,
mientras la posición angular de la rueda decrece, la posición angular del péndulo se
mueve hacia una vecindad del origen. Y, ya que el péndulo esta muy cerca del origen,
la acción de control regula la dinámica de la rueda.
Capı́tulo 5. Control de Sistemas Subactuados tipo Péndulo Invertido
114 por funciones de Saturación Anidadas

En otras palabras, primero la acción de control lleva al péndulo a una vecindad de cero,
mientras la posición angular de la rueda decrece hasta alcanzar su valor mı́nimo para
posteriormente llevar de manera lenta la posición de la rueda al origen. Cabe notar
que la maniobra de control descrita no podrı́a realizarse si se usaran métodos basados
en energı́a, debido a que la posición inferior está fuera del dominio de estabilidad de
este tipo de estrategias [59, 159].

En el segundo experimento se toman las mismas condiciones iniciales, ası́ como los
parámetros fı́sicos y del controlador propuestos en el experimento anterior, excepto
los valores para δ y µk , los cuales se han modificado para tomar los valores de δ = 3,5
y µk = 0,4. En la figura 5.7 se presenta la respuesta en lazo cerrado de todos lo estados
y se puede ver que θ1 y θ̇1 tienen un comportamiento similar al primer experimento
pero con la caracterı́stica que tardan menos tiempo en alcanzar el cero. Sin embargo,
los valores numéricos de θ2 y θ̇2 son más pequeños que en el primer experimento,
esto se debe a que la compensación para el amortiguamiento lineal es directamente
proporcional al numero de vueltas de la rueda, ası́ como a su velocidad angular. Es
decir, si el efecto indeseable del amortiguamiento se incrementa, la acción de control
de la rueda tiene que ser más fuerte para poder realizar la maniobra de control.
Obviamente, si el efecto es más pequeño, se require una acción con menor fuerza.
5.3. Control del Péndulo con Disco Inercial 115

Figura 5.6 Respuesta del sistema en lazo cerrado cuando δ = 35,71.


Capı́tulo 5. Control de Sistemas Subactuados tipo Péndulo Invertido
116 por funciones de Saturación Anidadas

Figura 5.7 Respuesta en del sistema en lazo cerrado para δ = 3,5.


Capı́tulo 6

Estabilización del Péndulo Esférico


Invertido mediante el método de
Lyapunov

6.1. Introducción
En las ultimas décadas, el sistema Péndulo Esférico Invertido (PEI) ha atraı́do
la atención de los investigadores. Su interés se debe a que el sistema permite probar
diversas estrategias de control. Además de ilustrar una versión académica simplificada
del propulsor de un cohete [19, 70, 71, 175]. En lo que se refiere al control de este
sistema existen en la literatura muchos trabajos dedicados a este tópico [10, 15, 19,
173, 122, 121].

La principal contribución de este capitulo es desarrollar una ley de control para re-
solver el problema de estabilización del PEI. La estrategia de control está basada en
el método de Lyapunov combinado con el Teorema de LaSalle. Con la cual se obtiene
un estabilidad local y asintótica para el sistema en lazo cerrado con un dominio de
atracción muy grande.

117
Capı́tulo 6. Estabilización del Péndulo Esférico Invertido
118 mediante el método de Lyapunov

El resto del capı́tulo se organizará del siguiente modo: En la sección 6.2 se presenta el
modelo normalizado parcialmente linealizado del sistema. La sección 6.3 está dedicada
a construir la función de Lyapunov que permitirá obtener el controlador. Además de
mostrar el análisis de estabilidad del sistema en lazo cerrado . Por último, en la sección
6.4 se muestran algunas simulaciones numéricas. Los resultados del capı́tulo dieron
lugar a una publicación [84].

6.2. Modelo del Péndulo Esférico Invertido

x
y uy
ux

Figura 6.1 Sistema Péndulo Esférico Invertido.

El sistema Péndulo Esférico Invertido (Figura 6.1) se describe por el siguiente


conjunto de ecuaciones diferenciales normalizadas [152].1

ẍ = ux ,
ÿ = uy ,
(6.1)
θ̈ = Sθ Cϕ − Sθ Cθ ϕ̇2 − Cθ ux + Sθ Sϕ uy ,
³ ´
ϕ̈ = C12 Cθ Sϕ + 2Sθ Cθ θ̇ϕ̇ − Cθ Cϕ uy ,
θ

1
La obtención del modelo por medio de las ecuaciones de Euler-Lagrange se puede encontrar en
el apéndice A.3.
6.3. Estrategia de control 119

donde x e y son los desplazamientos normalizados del centro de masa de la base móvil
en las direcciones x e y, respectivamente.2 Los ángulos θ y ϕ denotan las rotaciones
alrededor del eje-y y del eje-x. Los sı́mbolos Sx y Cx representan al sen(x) y cos(x).
Las entradas ux y uy son las aceleraciones de la base en cada una de las direcciones.
Entonces, podemos escribir el sistema anterior de la siguiente manera:

q̇ = f (q) + g(q)u, (6.2)

con q = (x, y, θ, ϕ, ẋ, ẏ, θ̇, ϕ̇)T y u = [ux , uy ]T . Cabe notar que el sistema está bien
definido para todo θ ∈ Is = (−π/2, π/2).

Problema 6.2.1 El objetivo primordial de la estrategia de control es llevar el sistema


al punto de equilibrio inestable q = 0, suponiendo que el péndulo está inicialmente
encima del plano horizontal, es decir |θ(0)| < π/2 y |ϕ(0)| < π/2.

6.3. Estrategia de control


En ésta sección buscamos una función definida positiva localmente (o función de
Lyapunov) V , con la condición de que su derivada con respecto al tiempo a lo largo
de la trayectoria (6.2) sea semi-definida negativa para un dominio de atracción muy
grande. En otras palabras, obtendremos un control estabilizador u para que el punto
de equilibrio inestable q = 0 sea asintóticamente estable de manera local suponiendo
que las posiciones angulares del péndulo están sobre el plano xy.

6.3.1. Cómo proponer una función de Lyapunov


Inspirados en el trabajo presentado por C. Aguilar et. al. [6], se construirá una
función definida positiva localmente V , tal que su derivada sea disipativa.
A continuación, definamos las siguientes variables auxiliares ξ y µ como ξ = x + g1 (θ)
y µ = y + g2 (ϕ, θ), donde las funciones g1 y g2 son suaves y se determinarán poste-
riormente.
2
La base idealmente puede ser un punto.
Capı́tulo 6. Estabilización del Péndulo Esférico Invertido
120 mediante el método de Lyapunov

Intuitivamente la idea de está estrategia es hacer que los valores de ξ y µ simultánea-


mente tomen el valor de cero. Para lograr esto, primero proponemos la siguiente
función candidata de Lyapunov:

1 1 k1 k2
V (q) = ξ˙2 + µ̇2 + ξ 2 + µ2 + lφ(q), (6.3)
2 2 2 2

donde {k1 , k2 , l} son constantes estrictamente positivas y la función φ(q) se escogerá tal
que:3


∂q
φ(q)g(q)u = ux ξ˙ + uy µ̇, ∂
∂q
φ(q)f (q) = 0. (6.4)

Por consiguiente, para solucionar las ecuaciones anteriores, proponemos a φ tal que
∂φ/∂ ẋ = ẋ y ∂φ/∂ ẏ = ẏ. Y de la ecuación de la izquierda de (6.4), después de realizar
algunas manipulaciones, se obtiene lo siguiente

ξ˙ = (ẋ − Cθ ∂φ
∂ θ̇
), µ̇ = (ẏ − Cϕ Cθ ∂∂φϕ̇ + Sθ Sϕ ∂φ
∂ θ̇
). (6.5)

Entonces, tomando en cuenta que ξ˙ = ẋ +g1 (θ)θ̇ y µ̇ = ẏ + ∂g


0
∂θ
2
θ̇ + ∂g
∂ϕ
2
ϕ̇, y después de
sustituir a ξ˙ y µ̇ en (6.5), se obtienen la siguientes dos relaciones

0
g1 (θ)θ̇ = −Cθ ∂φ
∂ θ̇
,
(6.6)

g (θ, ϕ)θ̇
∂θ 2
+ ∂
g (θ, ϕ)ϕ̇
∂ϕ 2
= Sθ Sϕ ∂φ
∂ θ̇
− Cϕ Cθ ∂∂φϕ̇ .

De las relaciones anteriores φ se expresa como

h1 2 h2 2 2 ẋ 2 ẏ 2
φ(q) = θ̇ + Cθ ϕ̇ + + + w(θ, ϕ), (6.7)
2 2 2 2
donde la función escalar w(θ, ϕ), y las constantes h1 y h2 se determinarán ensegui-
da. Entonces, sustituyendo a φ dada en (6.7), en la ecuación de la derecha de (6.4),
³ ´
3 ∂ ∂w ∂w ∂w ∂w ∂w ∂w ∂w ∂w
Recuerde que ∂q w(q) = ∂x , ∂y , ∂θ , ∂ϕ , ∂ ẋ , ∂ ẏ , ∂ θ̇ , ∂ ϕ̇ .
6.3. Estrategia de control 121

obtenemos
ϕ̇2 θ̇Cθ Sθ (−h1 + h2 ) = 0,
∂w (6.8)
ϕ̇(h2 Cθ Sϕ + ∂ϕ
) = 0,
∂w
θ̇(h1 Sθ Cϕ + ∂θ
) = 0.
Por lo tanto, h1 = h2 = h y w(θ, ϕ) = h(Cθ Cϕ − 1), donde h = −kp y kp > 0.

El siguiente lema proporciona las condiciones suficientes para garantizar que la función
candidata de Lypuanov sea positiva.

Lema 6.3.1 Consideremos la función de Lyapunov V descrita en (6.3), donde φ


está dada por

ẋ 2 ẏ 2 kp 2 kp 2 2
φ(q) = + − θ̇ − Cθ ϕ̇ + kp (1 − Cθ Cϕ ). (6.9)
2 2 2 2
Y supongamos que
−1 − l + kp > 0 (6.10)

Por lo tanto, V es definida positiva localmente para todo θ ∈ (−α, α) = Iα y ϕ ∈


Iα , donde α está dada por

α = max{γ} = {0 < γ < π/2 : (−1 − l + kp Cγ4 ) ≥ 0}. (6.11)

(La prueba de este lema se puede encontrar en apéndice C.3).

Finalmente, las variables auxiliares se proponen como:

ξ = x + kp Sθ µ = y + kp Cθ Sϕ . (6.12)

6.3.2. Obtención de la ley de control


Basándonos en la función de Lyapunov V descrita en (6.3), calculamos su derivada
con respecto al tiempo a lo largo de la trayectoria del sistema (6.2).
Capı́tulo 6. Estabilización del Péndulo Esférico Invertido
122 mediante el método de Lyapunov

Y usando (6.4) se obtiene la siguiente expresión.


³ . ³ ´ ´
V̇ (q) = ξ˙ ∂ξ
∂q
f (q) + ∂ ξ̇
g(q)
+ (l, 0) u + k1 ξ +
∂q
³ ³ ´ ´ (6.13)
∂ µ̇
µ̇ ∂∂qµ̇ f (q) + ∂q g(q) + (0, l) u + k2 µ .

Entonces, utilizando la relación (6.13), se propone la ley de control tal que se cumplan
las siguientes expresiones:
à !
∂ ξ˙ ∂ ξ˙ ˙
f (q) + g(q) + (l, 0) u + k1 ξ = −ξ, (6.14)
∂q ∂q
y

µ ¶
∂ µ̇ ∂ µ̇
f (q) + g(q) + (0, l) u + k2 µ = −µ̇, (6.15)
∂q ∂q
con lo cual define a V̇ como:
V̇ (q) = −ξ˙2 − µ̇2 . (6.16)

Comentario 6.3.2 De acuerdo con las condiciones del lema 6.3.1, se deduce que la
matriz

" # " #
∂ ξ̇
∂q
g(q) + (l, 0) 1 + l − kp Cθ2 kp Cθ Sθ Sϕ
N (θ, ϕ) = ∂ µ̇
= ,
∂q
g(q) + (0, l) kp Cθ Sθ Sϕ 1 + l − kp Cϕ2 − kp Sθ2 Sϕ2
(6.17)

es invertible para todo θ, ϕ ∈ Iα , y su determinante es de la siguiente forma

det(N (θ, ϕ)) = (−1 − l + kp )(−1 − l + kp Cθ2 Cϕ2 ). (6.18)

Evidentemente de la definición de α (ver lema 6.3.1) se deduce que det N (θ, ϕ) > 0,
para todo θ, ϕ ∈ Iα . Por lo tanto, el controlador propuesto en (6.14) y (6.15) no tiene
singularidades cuando θ, ϕ ∈ Iα .
6.3. Estrategia de control 123

Consiguientemente, para garantizar que la función de Lyapunov V sea positiva y evi-


tar las singularidades del controlador (ver relaciones (6.14) y (6.15)), es importante
mantener a |θ(t)| < α y |ϕ(t)| < α, para todo t > 0. Para conseguir esto es sufi-
ciente que las condiciones iniciales, q0 = (x0 , y0 , θ0 , ϕ0 , ẋ0 , ẏ0 , θ̇0 , ϕ̇0 ) con θ0 , ϕ0 ∈ Iα ,
pertenezcan a una vecindad del origen, tal que

k1 k2
V (q0 ) < Vs = lkp Sα2 + (kp Sα )2 + (kp Cα Sα )2 . (6.19)
2 2

lo anterior se deriva del hecho que la función V sea decreciente (6.16).

Comentario 6.3.3 La desigualdad anterior define una región de estabilidad para el


sistema en lazo cerrado propuesto, ya que para todas las condiciones iniciales q0 , tal
que V (q0 ) < Vα , con la restricción que |θ0 | < α y |ϕ0 | < α. Lo anterior implica que
V (q) < Vα con |θ(t)| < α y |ϕ(t)| < α. Por lo tanto, podemos definir al conjunto
compacto Ω como sigue:

Ω = {q = (x, y, θ, ϕ, ẋ, ẏ, θ̇, ϕ̇) : V (q) < Vα } (6.20)

Cabe mencionar que Ω es un conjunto compacto con la propiedad que cualquier


solución del sistema en lazo cerrado ((6.2), (6.14) y (6.15)) que inicia en Ω per-
manecen en Ω.

6.3.3. Análisis de estabilidad


Partiendo del hecho que V (q) es definida positiva para todo q ∈ Ω, y que su
derivada V̇ (q) es sólo semi-definida negativa, únicamente es posible asegurar estabi-
lidad en el sentido de Lyapunov para cualquier condición inicial q0 ∈ Ω.

Por lo tanto, aplicando el Teorema de LaSalle aseguraremos que el punto de equilibrio


q = 0 sea asintóticamente estable. Entonces, definiendo al conjunto S como

S = {q ∈ Ω : ξ˙2 + µ̇2 = 0} (6.21)


Capı́tulo 6. Estabilización del Péndulo Esférico Invertido
124 mediante el método de Lyapunov

y sea M el conjunto invariante más grande contenido en S. Por consiguiente, el


Teorema de LaSalle garantizará que cada solución que inicia en Ω se aproximará a M
como t → ∞ [110].

Como primer aspecto, calcularemos al conjunto M en S. Consideremos que en el


conjunto S, las variables ξ y µ son constantes, y evidentemente, ξ¨ = 0 y µ̈ = 0.
Además, de las ecuaciones (6.14) y (6.15), el vector u se ha seleccionado, tal que,
∂ ξ̇ ∂ ξ̇
∂q
f (q) + ∂q
g(q)u + k1 ξ + lux = 0,
∂ µ̇ ∂ µ̇
(6.22)
∂q
f (q) + ∂q
g(q)u + k2 µ + luy = 0.

y sustituyendo
ξ¨ = ∂ ξ̇
∂q
(f (q) + ∂ ξ̇
∂q
g(q)u)
∂ µ̇ ∂ ξ̇
µ̈ = ∂q
(f (q) + ∂q
g(q)u),
en la ecuación (6.22), obtenemos que k1 ξ + lux = 0 y k2 µ + luy = 0. Por tanto, si
ux = ux y uy = uy son constantes en S, se tiene que ξ y µ son constantes.4 Ahora,
supongamos que ux 6= 0 y que uy 6= 0, entonces, de las dos primeras ecuaciones de
(6.1) obtenemos que ẍ = ux y que ÿ = uy , y obviamente, las constantes ux y uy deben
ser cero, bajo la suposición que las variables {x, y, ẋ, ẏ} están acotadas en el conjunto
S.

De manera similar, es sencillo mostrar que en S, ẋ = 0 y ẏ = 0 es decir, las variables x


e y son constantes en el conjunto S. Entonces, de la definición de ξ y µ dada en (6.12)
se tiene que x + kp sen θ = 0 y que µ = y + kp sen ϕ = 0. Finalmente, si x 6= 0 y θ 6= 0
significarı́a que el péndulo puede mantenerse en un ángulo θ y en un desplazamiento
x (en dirección-x), sin aplicar un acción de control. Esto es imposible por que se
necesita una acción de control para mantener el ángulo fijo en θ.5 Por consiguiente,
los valores posibles para x y θ son x = 0 y θ = 0 en el conjunto S. Además, de forma
similar se puede mostrar que y y ϕ tienen que ser cero en S.

Por consiguiente, del Teorema de LaSalle garantizamos que todas la soluciones en lazo
cerrado que inician en Ω convergen asintóticamente hacia el conjunto invariante más
4
z denota que z es una constante en el conjunto S.
5
Recuerde que ux = 0 y uy = 0 en S.
6.4. Simulaciones numéricas 125

grande M contenido en S, que está constituido por el punto de equilibrio inestable.


q = 0.
De la discusión anterior, se obtiene la siguiente proposición:

Proposición 6.3.4 Considere el sistema del péndulo esférico parcialmente linealiza-


do (6.2) en lazo cerrado con el controlador (6.14) y (6.15), donde l, k1 ,k2 y kp son
constantes estrictamente positivas. Suponga que las condiciones iniciales pertenecen
(o inician) en el conjunto compacto Ω definido en (6.20). Entonces, podemos decir
que el origen del sistema en lazo cerrado es local y asintóticamente estable con un
dominio de atracción definido por la desigualdad (6.19).

6.4. Simulaciones numéricas


Para probar el desempeño del controlador propuesto se han realizado algunas
simulaciones computacionales usando MATLABT M .

En la simulación aplicamos el controlador (6.14) y (6.15) al sistema (6.2) con los


siguientes parámetros:

k1 = 1 k2 = 1,5 kp = 5 l = 1 .

Además, las condiciones iniciales se han seleccionado como cero, excepto los ángulos
definidos como θ0 = 0,5[rad] y ϕ0 = −0,5[rad]. La figura 6.2 muestra la respuesta
en lazo cerrado de los ángulos y sus derivadas. De igual forma, en la figura 6.3 se
puede observar el comportamiento en lazo cerrado de las posiciones y sus respectivas
velocidades.

Como podemos ver, la ley de control encierra al péndulo en el origen por medio de
movimientos suaves, mientras que la base inicia su movimiento de tal forma que las
oscilaciones tiene amplitudes grandes pero con movimiento suaves. Y, en ambos casos
se reducen gradualmente sus amplitudes.
Capı́tulo 6. Estabilización del Péndulo Esférico Invertido
126 mediante el método de Lyapunov

Figura 6.2 Respuesta en lazo cerrado de las variables angulares del sistema.

Figura 6.3 Respuesta en lazo cerrado de las posiciones y velocidades del sistema.

Intuitivamente, podemos decir que la energı́a total del péndulo es transferida a la


base móvil por medio de movimientos largos de dicha base. Para que, finalmente, la
energı́a total sea disipada lentamente por el controlador.
Capı́tulo 7

Control del comportamiento


oscilatorio de un sistema mecánico
no lineal: Caso Péndulo Invertido
con Masa Móvil

7.1. Introducción
Los sistemas mecánicos que vibran constituyen una importante clase de sistemas
dinámicos: edificios, puentes, suspensiones de coche, marcapasos, generadores de vien-
to y altavoces son algunos ejemplos comunes de este tipo de sistemas.
En términos fı́sicos todos los sistemas que vibran tiene un componente que almacena
energı́a y otro que la transforma. Por lo tanto, el comportamiento de estos puede ser
descrito en término de cambios energéticos, es decir, el movimiento del sistema resul-
ta de la conversión de energı́a. Por razones teóricas y tecnológicas el control de este
tipo de sistemas ha resultado un campo de investigación importante, debido a que
ha proporcionado diversas soluciones a problemas que involucran comportamientos
oscilatorios, como por ejemplo el control de vibraciones se ha aplicado para atenuar
las oscilaciones no deseadas en edificios producidas por fuerzas externas; tales como
fuertes vientos o terremotos [13, 55, 95, 137, 176], ası́ como en suspensiones de autos

127
Capı́tulo 7. Control del comportamiento oscilatorio de un sistema
128 mecánico no lineal: Caso Péndulo Invertido con Masa Móvil

para mejorar el manejo en caminos complicados. Por consiguiente, este capı́tulo se


enfoca en el control activo de un sistema mecánico vibratorio no lineal subactuado y
subamortiguado utilizando el enfoque de Lyapunov [5, 6, 13, 59], es decir, el control
del comportamiento vibratorio se aborda por medio de un moldeo del flujo de energı́a,
el cual caracteriza al sistema en términos dinámicos.

Entonces, el objetivo principal de este capı́tulo es proponer un controlador estabi-


lizador asintótico para la vibración activa amortiguada en un sistema mecánico no
lineal subactuado sin fricción, el cual estará restringido a moverse dentro de un con-
junto admisible predefinido.
Este sistema consiste en un péndulo fı́sico invertido que rota alrededor de un pivote
localizado en la parte inferior del péndulo. Además, cuenta con un masa que se mueve
a lo largo del brazo del péndulo y para mantener la estructura en la posición estable
superior se incluye un resorte torsional.
La estrategia de estabilización consiste en amortiguar el movimiento péndulo ejer-
ciendo una fuerza sobre la masa radialmente móvil.

El resto del capı́tulo se organiza como sigue. En la sección 7.2, se presenta el modelo
matemático no-lineal del sistema obtenido por medio de las expresiones de Euler-
Lagrange.
El controlador lineal Proporcional Derivativo (PD) se expone en la sección 7.3. Final-
mente en la sección 7.4 se muestran las simulaciones del comportamiento del sistema
en lazo cerrado. Los resultados expuestos en este capı́tulo dieron lugar a una publi-
cación [4] y pretenden mostrar una ejemplo sencillo de la importancia que tiene el
estudio del Sistema Péndulo Invertido.

7.2. Ecuación de movimiento


El sistema dinámico consiste en un péndulo fı́sico de masa M , que gira sobre
el pivote O. Además, cuenta con una masa auxiliar m que se desliza a lo largo del
péndulo. Por otra parte, para mantener la estructura en la posición estable superior,
7.2. Ecuación de movimiento 129

Figura 7.1 Péndulo Invertido con Masa Radialmente Móvil .

un resorte torsional con constante κ1 1 produce un momento de restablecimiento, como


se puede ver en la figura 7.1. El momento de inercia del péndulo se define como I0
y el centro de masa C está localizado a una distancia rc del pivote. La masa m se
mueve debido a la aplicación de una fuerza f paralela a OC. Es decir, f es la entrada
de control que actúa sobre la masa m.

Para describir el movimiento del péndulo el origen del marco inercial es escogido
en el punto O. Los ejes x e y corresponden a las direcciones horizontal y vertical,
respectivamente. Y el vector q = [r, θ]T describe las coordenadas generalizadas, donde:
r es el desplazamiento de la masa m medido desde el punto O y θ denota el ángulo
formado por el eje y y el eje OC.
Entonces, la energı́a cinética y potencial del sistema son definidas como:

1 1 ³ ´
Kc = I0 θ̇2 + m ṙ2 + r2 θ̇2 (7.1)
2 2
y

κ1 2
Kp = M grc (cos θ − 1) + mgr cos θ + θ (7.2)
2

1
Se supone que el sistema es estable en el sentido de Lyapunov (pero no asintóticamente estable).
Capı́tulo 7. Control del comportamiento oscilatorio de un sistema
130 mecánico no lineal: Caso Péndulo Invertido con Masa Móvil

Por lo tanto, el Lagrangiano L(q, q̇) tiene la forma

L(q, q̇) = Kc − Kp

Consiguientemente, las expresiones obtenidas de la ecuaciones de Euler-Lagrange


son:2

mr̈ − mrθ̇2 + mg cos θ = f


(7.3)
(mr2 + I0 )θ̈ + 2mrṙθ̇ − g(M rc + mr) sen θ + κ1 θ = 0
siendo F = [f, 0]T vector de fuerzas externas.

Entonces, definiendo la fuerza f como

f = mg + v (7.4)

donde, v es una nueva variable de control y mg es un término que compensa la fuerza


de gravedad. Sustituyendo (7.4) en (7.3) podemos expresar las ecuaciones diferenciales
anteriores como:

M (q)q̈ + C(q, q̇)q̇ + ∇q Ki (q) = Gv (7.5)

donde
" # " # " #
m 0 0 −mrθ̇ 1
M (q) = C(q, q̇) = G=
0 mr2 + I0 mrθ̇ mrṙ 0
y
κ1 2
Ki (q) := −κ3 (1 − cos θ) − κ2 r(1 − cos θ) + θ
2
con κ2 = mg y κ3 = M grc .

Cabe destacar que el sistema (7.5) satisface las siguientes propiedades:


P1: M(q) es una matriz definida positiva.
P2: La matriz H = Ṁ (q) − 2C(q, q̇) es una matriz antisimétrica con:
³ ´
2 d dL dL
Es decir, dt ∂ q̇ (q, q̇) − ∂q (q, q̇) =F
7.3. Control lineal PD 131

" #
0 −mrθ̇
H=
mrθ̇ 0
P3: El operador v → ṙ es pasivo.
La propiedades P1 y P2 son compartidas por cualquier sistema Euler-Lagrange.
Además, para probar la propiedad P3 definimos la siguiente función de almacenamien-
to.

1
E(q, q̇) = q̇ T M (q)q̇ + Ki (q) (7.6)
2
Calculando la derivada con respecto al tiempo de (7.6) y usando las propiedades P1
y P2.

Ė = v ṙ

De acuerdo a los resultados anteriores ([110], pp 236) el operador v → ṙ es pasivo.

Comentario 7.2.1 Note que, si v = 0, θ ∈ (−π/2, π/2) y r > 0 entonces, el sistema


(7.5) tiene un conjunto de puntos de equilibrio definidos por (r = r,θ = 0,ṙ = 0,θ̇ =
0).
Donde r es una constante positiva, es importante mencionar que estos puntos son
estables en el sentido de Lyapunov, pero no asintóticamente estables.
Para desarrollos posteriores, los sı́mbolos x y x se definen como

x = (q, q̇)T = (r, θ, ṙ, θ̇)T , xT = (q, 0)T = (r, 0, 0, 0)T

con r > 0, y además z0 indica a z(0)

7.3. Control lineal PD


El sistema anterior es subactuado y pobremente amortiguado debido a que tiene
una sola entrada de control y dos grados de libertad, además de no tener una fuerza
disipativa en la coordenada no actuada θ. Por tanto este sistema es muy sensible a las
Capı́tulo 7. Control del comportamiento oscilatorio de un sistema
132 mecánico no lineal: Caso Péndulo Invertido con Masa Móvil

perturbaciones externas. Entonces, para atenuar los efectos indeseables de dichas per-
turbaciones se propone un controlador que haga al sistema en lazo cerrado asintótica-
mente estable alrededor del origen x.

Antes de establecer el objetivo de control es necesario introducir la siguiente suposi-


ción:
A1: Los parámetros del sistema original deben satisfacer la siguiente relación

κ1 > κ3 + κ2 (r + ε) (7.7)

Comentario 7.3.1 La desigualdad (7.7) significa que la fuerza del resorte es mayor
que la fuerza debido a la gravedad de todo el sistema para cualquier posición de m.
Es decir, A1 es una condición estructural que está relacionada con la rigidez interna
del sistema.

El problema de control se define como sigue:

Problema 7.3.2 Encontrar un controlador v que forzará al sistema (7.5) a com-


portarse asintóticamente estable alrededor del punto de equilibrio x, restringiéndolo a
moverse dentro del conjunto Q ⊂ R2 , definido como:

Q = {q = (r > 0, θ) : |r − r| < ε y |θ| < θ} (7.8)

donde ε, θ y r son constantes positivas; con θ < π/2.

Comentario 7.3.3 Debemos destacar que las restricciones fı́sicas incluidas en la


formulación del problema son necesarias para garantizar que el péndulo invertido sólo
pueda moverse en el plano superior, mientras que la masa m se mantiene en el brazo
del péndulo. Esto significa que la masa auxiliar m se mueve a lo largo del péndulo y
la posición angular está restringida a moverse dentro del intervalo (−θ, θ).
En otras palabras, pedimos que al mismo tiempo la masa m se mueve a largo del
péndulo y el ángulo se confine en una vecindad cerca de la posición invertida.

Enseguida resolveremos el problema propuesto.


7.3. Control lineal PD 133

Figura 7.2 Curvas de nivel alrededor del origen.

7.3.1. Control basado en energı́a


Consideremos la siguiente función candidata a Lyapunov:

1
ET (x) = ET (q, q̇) = q̇ T M (q)q̇ + Km (q) (7.9)
2
donde Km es la energı́a potencial modificada definida como:

kp
Km (q) = Ki (q) + (r − r)2 (7.10)
2
con kp > 0.

Comentario 7.3.4 De acuerdo con la suposición A1, la energı́a potencial modificada


Km tiene un mı́nimo local en q = (r,0). Esto se debe a lo siguiente:

Km (q) = 0, ∇qKm (q) = 0 ∇q 2 Km (q) > 0 (7.11)

Lo anterior implica que Km es una función convexa alrededor de q. En términos


geométricos las curvas de nivel de Km constituyen el conjunto de curvas en lazo cerra-
do alrededor de q (Figura 7.2). Esta propiedad permite definir el conjunto invariante
compacto que será usado para el análisis de convergencia.
Capı́tulo 7. Control del comportamiento oscilatorio de un sistema
134 mecánico no lineal: Caso Péndulo Invertido con Masa Móvil

Tomando en cuenta las propiedades de pasividad del sistema (7.5), la primera derivada
de ET a lo largo la trayectoria del sistema esta dada por

ĖT (q, q̇) = v ṙ + kp (r − r)ṙ (7.12)

Y, debido a que se necesita que la derivada sea definida negativa, la entrada de control
v se propone como una ley de control proporcional derivativa

v = −kp (r − r) − kd ṙ (7.13)

con kp > 0 y kd > 0. Por lo tanto, sustituyendo (7.13) en (7.12) se obtiene

Ė(q, q̇) = −kd ṙ2 (7.14)

Entonces del hecho, que ET es definida positiva y ĖT es semi-definida negativa pode-
mos establecer la estabilidad del punto de equilibrio x en el sentido de Lyapunov. Es
decir, q y q̇ están acotados.

Para asegurar que la solución en lazo cerrado converja asintóticamente al origen x,


utilizaremos el Teorema de LaSalle [110]. Pero antes de aplicarlo introducimos el
siguiente lema que permitirá seleccionar adecuadamente a la constante kp que propi-
ciará que todas las soluciones del sistema en lazo cerrado se mantengan dentro del
conjunto Q.

Lema 7.3.5 Considere el sistema en lazo cerrado formado por las ecuaciones (7.5)
y (7.13).
De acuerdo con la suposición A1 y la restrición del parámetro kp definida como:

κ2
(1 − cos θ) < ε (7.15)
kp
y si las condiciones iniciales x0 = (q0 , q˙0 ); con q0 ∈ Q satisfacen

ET (x0 ) ≤ E (7.16)
7.3. Control lineal PD 135

donde la cota E se define como

E =max{c
b > 0 : Km (q) = c, con q ∈ Q} (7.17)

y puede estimarse a partir de solucionar la igualdad

³ ε ´
E = Km r + , θ = λεκ2 (1 − cos θ). (7.18)
λ
donde λ > 1.
Entonces, podemos garantizar que:

ET (q(t), q̇(t)) ≤ ET (x0 ) ≤ E (7.19)

con q(t) ∈ Q; para t ≥ 0 (La demostración de este lema se puede ver en el apéndice
C.4).

Enseguida describiremos la aplicación del Teorema de LaSalle.

Como primer paso, definamos el conjunto compacto Ω

Ω = {x = (q, q̇) : ET (x) < E} (7.20)

donde E > 0 escogido de acuerdo al lema 7.3.5.

Comentario 7.3.6 El conjunto Ω tiene la propiedad que todas las soluciones del
sistema en lazo cerrado que inicia en Ω permanece en Ω por todo el tiempo.
En particular, todas las condiciones iniciales x0 = (q0 , q̇0 ) tal que ET (x0 ), E, con
q0 ∈ Q. Esto implica que q(t) ∈ Q para todo el tiempo.

Entonces, definiendo a Γ como

n o
Γ = x ∈ Ω : ĖT (x) = 0 = {x ∈ Ω : ṙ = 0} (7.21)

Y sea M el conjunto invariante más grande en Γ. Por tanto, el Teorema de LaSalle


garantiza que todas las soluciones que comienzan en el conjunto compacto Ω tienden
Capı́tulo 7. Control del comportamiento oscilatorio de un sistema
136 mecánico no lineal: Caso Péndulo Invertido con Masa Móvil

a M como t → ∞ [110]. Enseguida, calcularemos el conjunto M . Del conjunto Γ


se tiene que r̈ = 0 y r = r,3 donde r es una constante, tal que |r − r| < ε. Aho-
ra suponga que en Γ, r 6= r. Entonces, de la definición de v (7.13); tenemos que
v = −kp (r − r) 6= 0, siendo esto una contradicción, por que existirı́a una fuerza cons-
tante que eventualmente producirá un desplazamiento de la masa m y el estado r no
seria acotado (observar la primera ecuación de (7.5)).

Ahora, si suponemos el caso que en Γ, r = r, el sistema (7.5) toma la forma:

−mrθ̇2 + κ2 (cos θ − 1) = 0 (7.22)

y
(mr2 )θ̈ − (κ3 + κ2 r) sen θ + κ1 θ = 0 (7.23)

De las ecuaciones anteriores podemos decir que la trayectoria que satisface a (7.22),
se obtienen cuando θ y θ̇ son iguales a cero en el conjunto Γ, siendo |θ| < θ < π/2,
κ2 > 0 y r > 0. Por lo tanto, se concluye que el conjunto invariante más grande
contenido en Γ ⊂ Ω, es decir, M está constituido por el punto de equilibrio x = (r =
r, θ = 0, ṙ = 0, θ̇ = 0). Y de acuerdo con el Teorema de LaSalle todas las trayectorias
que comienzan en Ω convergen asintóticamente al conjunto M definido por el punto
x.

Esta sección finaliza con la siguiente proposición:

Proposición 7.3.7 De acuerdo con la suposiciones del lema 7.3.5, del sistema (7.3)
en lazo cerrado, con
F = mg − kp (r − r) − kd ṙ

se obtiene que el origen del sistema en lazo cerrado es asintóticamente estable de


manera local con un dominio de atracción definido por la desigualdad (7.19).
Además, la solución del sistema en lazo cerrado está restringida a moverse dentro del
conjunto Q.
3 d
Por simplicidad, usamos el sı́mbolo x para denotar que dt x = 0.
7.4. Resultados de simulación 137

Comentario 7.3.8 Es fácil comprobar que si la suposición A1 no se cumple del todo,


podemos asegurar estabilidad asintótica del sistema en lazo cerrado. Sin embargo, no
se puede asegurar que x(t) pertenezca a Q, ∀t > 0. Por otra parte, si los parámetros
fı́sicos no cumplen a A1 tendrı́amos tres puntos de equilibrio y sólo se podrı́a asegurar
estabilidad en el sentido de Lyapunov.

Para ilustrar el desempeño de la ley de control propuesto, en la siguiente sección


realizamos algunas simulaciones computacionales.

7.4. Resultados de simulación

7.4.1. Parámetros de simulación


Para llevar a cabo la simulaciones del sistema en lazo cerrado los parámetros del
sistema se definen como sigue:

m = 1[kg] M = 4[kg] I0 = 0,5[kgm2 ] rc = 0,5


r = 0,5[m] ε = 0,4[m] θ = 0,8[rad] κ1 = 31,25
En este caso κ2 = 9,8 y κ3 = 19,6, satisfaciéndose las suposición A1.

El valor del parámetro kp se ha escogido de tal manera que se cumpla la restricción


(7.15), la cual produce:

7,43 < kp

Tómese en cuenta que el conjunto admisible Q está dado por:

Q = {q = (r > 0, θ) : |r − 0,5| < 0,4 y |θ| < 0,8}

Para asegurar que las condiciones iniciales se encuentren dentro del máximo dominio
de atracción, los parámetros λ y kp se escogen de acuerdo a las relaciones (7.18) y
(C.19), respectivamente. Como λ = 4,1 y kp = 30,46. Por lo tanto, para mantener
Capı́tulo 7. Control del comportamiento oscilatorio de un sistema
138 mecánico no lineal: Caso Péndulo Invertido con Masa Móvil

el movimiento en lazo cerrado dentro del dominio de atracción se debe cumplir la


condición ET (q0 , q̇0 ) < E ∼
= 2,43 con q ∈ Q.

7.4.2. Comentarios sobre las simulaciones


Para simular el comportamiento del sistema no lineal se utilizó plataforma de
MATLABT M y se derivan los siguientes comentarios:

En el primer experimento se escogieron las siguientes condiciones iniciales q0 =


(0,6[m], 0,8[rad]) y q̇0 = 0, las cuales satisfacen a ET (q0 , 0) = 2,36 (el vector q0
se seleccionó muy cerca de uno de los extremos en la dirección de θ que pertenece
a ∂Q ).

La figura 7.3 muestra el comportamiento transitorio de las posiciones y las


velocidades del sistema. Como se puede observar las posiciones están dentro del
conjunto Q, ya que el vector de condiciones iniciales pertenece al dominio de
atracción del sistema en lazo cerrado.

Para el segundo experimento, las condiciones iniciales que se eligieron son x0 =


(0,7[m], 0, 6[rad], 0,2[rad/s]) para la cual ET = 3,75 > E.

En este caso en particular aunque la condición inicial pertenece a Q, la respuesta


del sistema en lazo cerrado está fuera del conjunto Q debido a que ET > E.

El comportamiento del sistema se muestra en la figura 7.4 y podemos observar


que θ ' 1[rad], cuando t = 2[s] aproximadamente.
7.4. Resultados de simulación 139

Figura 7.3 Simulación del sistema en lazo cerrado para la condición inicial q(0) =
(0,6, 0,8) y q̇(0) = 0.

Figura 7.4 Simulación del sistema en lazo cerrado para la condición inicial x(0) =
(0,7, 0,6, 0, 2).
Capı́tulo 8

Conclusiones

Llegado a este punto de la tesis se puede afirmar que, en función de los objetivos,
el control de los Sistemas tipo Péndulo Invertido planteado y presentado en este
documento es una alternativa más en el estudio de la Teorı́a de Control no lineal, ya
que provee una serie de mecanismos y herramientas para realizar el control de una
clase de sistemas subactuados, considerando que no sólo pueden ser aplicados a este
tipo de sistemas.

Este capı́tulo se dedica a la exposición resumida de las aportaciones de esta tesis a


modo de conclusión. Al final del capı́tulo se presenta una serie de trabajos futuros
que continuarán con la investigación desarrollada en esta tesis.

Como primer aportación se presentó una estrategia de control para estabilizar el sis-
tema Péndulo Invertido sobre un Carro alrededor del punto de equilibrio inestable,
suponiendo que el péndulo está inicialmente por encima del plano horizontal.
Esta estrategia se basa en encontrar una linealización parcial por retroalimentación
del sistema, para posteriormente aplicar un adecuado ajuste de modelo. La idea pri-
mordial del método es encontrar una ley de control que transforme el modelo parcial-
mente linealizado en un sistema denominado objetivo, el cual tiene ciertas propiedades
de estabilidad. Para realizar lo anterior, fue necesario solucionar dos condiciones de
ajuste (matching conditions), relacionadas con las energı́as potencial y cinética del
sistema objetivo. Podemos mencionar que las condiciones de ajuste obtenidas son

140
141

solucionadas de manera sencilla comparadas con otras estrategias donde se utiliza


este tipo de enfoque. Además, con esta propuesta se obtuvo un sistema en lazo cerra-
do asintóticamente y exponencialmente estable localmente alrededor del origen con
un dominio de atracción grande. Para mostrar que el sistema es localmente estable
asintóticamente se utilizó el Teorema de LaSalle y, para demostrar que el sistema
es exponencialmente estable localmente se usó una linealización. Por consiguiente, el
sistema en lazo cerrado es robusto con respecto a fuerzas externas pequeñas, como
serı́a el efecto producido por un amortiguamiento en la coordenada no actuada.

Posteriormente, se desarrolló una técnica que permite solucionar el problema de es-


tabilización de algunos sistemas subactuados utilizando un controlador basado en
funciones de saturación anidadas, cuya caracterı́stica más importante es proponer
una ley de control sin que sea necesario tener un función de Lyapunov para todo el
sistema. En este caso, hemos aplicado dicha estrategia para estabilizar los sistemas
Péndulo Invertido sobre un Carro y Péndulo con Disco Inercial alrededor del punto
de equilibrio inestable.
Fı́sicamente, la estrategia de control propuesta en los dos sistemas consiste en dos
etapas. La primera, es llevar al péndulo lo más cercano a la posición de equilibrio
inestable para regular la posición del carro o del disco hasta que todos los estados
se confinen en una vecindad de cero, provocando que el sistema en lazo cerrado se
comporte como un sistema lineal exponencial con una pertubación no lineal pequeña
pudiendo fácilmente aplicar el método de Lypunov para garantizar que los estados
converjan a cero.

Es importante comentar que en el caso del Péndulo con Disco Inercial, debido a que
está fuertemente amortiguando, no es posible asegurar la estabilización del sistema,
si se usaran estrategias como el moldeo de energı́a o aquellas basadas en pasividad
[78, 156].

Otra aportación del trabajo presentada en el capı́tulo 6, es proponer una metodologı́a


muy simple pero efectiva para diseñar un controlador estabilizador para el PEI. Di-
cho controlador permite obtener un sistema en lazo cerrado asintóticamente estable
142 Capı́tulo 8. Conclusiones

de forma local alrededor del punto de equilibrio inestable suponiendo que el péndu-
lo se encuentra inicialmente por encima del plano horizontal. Esta ley de control
tiene un dominio de atracción que puede ser calculado a partir del lema 6.3.1. Cabe
destacar que la obtención del controlador se basó en la construcción de una función
de Lyapunov, cuya derivada resultó ser disipativa con respecto a las variables auxi-
liares definidas en (6.12). El análisis de convergencia fue llevado a cabo mediante el
Teorema de LaSalle y el desempeño de la estrategia de control se evaluó por medio
simulaciones numéricas.

Además, en el capı́tulo 7 se ha obtenido la estabilización asintótica de un péndulo


fı́sico invertido con una masa radialmente móvil1 por medio del método de Lyapunov.
El movimiento del péndulo está restringido a moverse dentro de un conjunto deno-
minado Q expresado en (7.8) que representa las restricciones fı́sicas del sistema. La
estrategia de control Proporcional Derivativo explota las propiedades fı́sicas del sis-
tema original que se utilizan para moldear la energı́a del sistema en lazo cerrado.
Además, el análisis de estabilidad del sistema ha sido realizado por medio del Teo-
rema de invariancia de LaSalle. Cabe mencionar que si se hubiera considerado una
fuerza de amortiguamiento en la coordenada subactuada, la estabilidad asintótica del
dispositivo se hubiera reforzado.

Por otra parte, es importante comentar que la aplicabilidad de la ley de control


propuesta en dicho capı́tulo, es consecuencia de que el modelo no lineal del sistema
representa una versión simplificada de la dinámica de edificios rı́gidos, restringidos a
oscilar en el plano (excitaciones externas). Siendo un problema interesante la atenua-
ción de los efectos provocados por perturbaciones desconocidas (fuerzas sı́smicas o
vientos) en las estructuras civiles por medio de un control activo. En nuestro modelo
la masa móvil representa el elemento de control, y en lo que se refiere a su potencia-
lidad, debe ser aclarada a través de la evaluación del consumo de energı́a de la ley de
control.

1
El péndulo está anclado al pivote por medio de un resorte torsional que mantiene el sistema en
la posición vertical estable, como consecuencia, el sistema es estable en el sentido de Lyapunov.
8.1. Desarrollos futuros 143

De lo expuesto anteriormente, podemos concluir que los métodos desarrollados en es-


ta tesis son una forma de solucionar el problema de estabilización de los Sistemas
tipo Péndulo Invertido en el punto del equilibrio inestable, que permite generar
conocimiento cientı́fico, el cual es un objetivo importante en los propósitos del Insti-
tuto Politécnico Nacional.

8.1. Desarrollos futuros


Los problemas que se abordan en esta tesis abren las puertas a una serie de lı́neas
de investigación futuras destinadas básicamente a extender el área de aplicación de
los razonamientos teóricos aquı́ expuestos y refinar los resultados.

Algunas trabajos a realizar para continuar el desarrollo en esta lı́nea de investigación


son:

1. Diseñar y construir una plataforma experimental para el control y análisis del


Sistema Péndulo Invertido sobre un Carro, con el fin de tener un dispositivo de
pruebas para verificar los resultados de las estrategias obtenidas.

2. Implementar las estrategias de control propuestas en plataformas reales para


verificar su funcionamiento.

3. Aplicar la estrategia de control presentada en el capı́tulo 4 para estabilizar al


Sistema Péndulo Invertido sobre un plano inclinado por ser una versión más
general que el sistema presentado en este trabajo.

4. Resolver la estabilización del Péndulo Esférico Invertido utilizando las técnicas


propuestas en los capı́tulos 4 y 5.
Apéndice A

Modelos Dinámicos de Sistemas


Subactuados tipo Péndulo
Invertido

En este apéndice se presenta la obtención del modelo dinámico de los Sistemas


Subactuados tipo Péndulo Invertido estudiados en esta tesis utilizando las ecuaciones
de Euler-Lagrange.

A.1. Sistema Péndulo Invertido sobre un Carro

A.1.1. Ecuaciones de movimiento

En esta sección presentamos las ecuaciones de movimiento del Sistema Péndu-


lo Invertido sobre un Carro (PIC), derivadas de las ecuaciones de Euler-lagrange.
Considerando la existencia de condiciones ideales, es decir, sin fricción ni fuerzas
disipativas. Este sistema se describe en la figura A.1.

Consideremos las coordenadas del sistema como (x, y), ası́ como las coordenadas del
centro de masa del péndulo (xG , yG ) definidas en (A.1).

144
A.1. Sistema Péndulo Invertido sobre un Carro 145

mg

M
f

Figura A.1 Péndulo Invertido sobre un Carro.

Donde:

M : Masa del carro


m : Masa del péndulo
l : Distancia desde el pivote al centro de gravedad del péndulo
g : Aceleración debida a la gravedad
x : Distancia del centro de masa del carro desde su posición inicial
θ : Ángulo del péndulo respecto a la vertical
f : Fuerza aplicada al carro

xG = x + l sen θ
(A.1)
yG = l cos θ
Como primer paso para aplicar el método de Euler-Lagrange es necesario obtener la
energı́a cinética y potencial del sistema que serán usadas para calcular la función de
Lagrange ó Lagrangiano (L).

La energı́a cinética del carro K1 (q) es de la forma:

1
K1 (q) = M ẋ2 (A.2)
2
La energı́a cinética del péndulo K2 (q) esta dada por:

1 1 2 1
K2 (q) = mẋ2G + mẏG + I θ̇2 (A.3)
2 2 2
Apéndice A. Modelos Dinámicos de Sistemas Subactuados
146 tipo Péndulo Invertido

Por lo tanto, la energı́a cinética total del sistema K(q) es:

1 1
K(q) = K1 (q) + K2 (q) = (M + m)ẋ2 + mlẋθ̇ cos θ + (I + ml2 )θ̇2 (A.4)
2 2
La energı́a potencial del sistema V (q) es definida como:

V (q) = mgl(cos θ − 1) (A.5)


Además, se conoce que la función de Lagrange (L) se define como la diferencia entre
la energı́a cinética y la energı́a potencial dada como sigue:

L = K(q) − V (q)

Entonces,
1 1
L = (M + m)ẋ2 + mlẋθ̇ cos θ + (I + ml2 )θ̇2 − mgl(cos θ − 1) (A.6)
2 2
Las ecuaciones del sistema se derivan de la ecuación de Euler-lagrange definida como:
µ ¶
d ∂L(q, q̇) ∂L(q, q̇)
− =F (A.7)
dt ∂ q̇ ∂q
donde, q = (q1 , · · · , qn )T representan las coordenadas generalizadas, una para cada
grado de libertad del sistema y F = (f1 , · · · , f n)T denotan las fuerza externas apli-
cadas al sistema.

En este caso, las coordenadas generalizadas son x y θ, es decir, q = (x, θ)T y F =


(f, 0)T .

Por lo tanto, tenemos que:

∂L
= (M + m)ẋ + mlθ̇ cos θ
∂ ẋ
∂L
=0
∂x
∂L
= mlẋ cos θ + (I + ml2 θ̇)
∂ θ̇
∂L
= mgl sen θ − mlẋθ̇ sen θ
∂θ
A.1. Sistema Péndulo Invertido sobre un Carro 147

Y sustituyendo para cada variable, cada uno de los términos anteriores en la ecuación
(A.7), se obtiene:

µ ¶
d ∂L ∂L
− =f
dt ∂ ẋ ∂x
d ³ ´
(M + m)ẋ + ml cos θ̇ cos θ − 0 = f
dt

(M + m)ẍ − ml(sen θ)θ̇2 + ml(cos θ)θ̈ = f (A.8)

µ ¶
d ∂L ∂L
− =0
dt ∂ θ̇ ∂θ
d ³ 2
´
mlẋ cos θ + (I + ml θ̇) − mgl sen θ + mlẋθ̇ sen θ = 0
dt

mlẍ cos θ + (I + ml2 )θ̈ − mgl sen θ = 0 (A.9)

Finalmente, se asumirá que el momento de inercia del péndulo es insignificante, por


lo que es cancelado de la ecuación (A.9) quedando el sistema de la siguiente forma:

(M + m)ẍ − ml(sen θ)θ̇2 + ml(cos θ)θ̈ = f (A.10)

mlẍ cos θ + ml2 θ̈ − mgl sen θ = 0 (A.11)

Por lo tanto, las ecuaciones (A.10) y (A.11) describen el movimiento del Sistema
Péndulo Invertido sobre un Carro y constituyen el modelo matemático no lineal del
sistema.

Además, el sistema formado por las expresiones (A.10) y (A.11) puede ser escrito en
la forma estándar de los Sistemas de Lagrange definido como:

M (q)q̇ + C(q, q̇)q̇ + G(q) = F (A.12)


Apéndice A. Modelos Dinámicos de Sistemas Subactuados
148 tipo Péndulo Invertido

Donde " # " #


x M + m ml cos θ
q= M (q) = (A.13)
θ ml cos θ ml2
" #
0 −ml(sen θ)θ̇
C(q, q̇) = (A.14)
0 0
" # " #
0 f
G(q) = y F = (A.15)
−mgl sen θ 0
Es importante notar que es M (q) simétrica y definida positiva para todo q.

Por otra parte, las estrategias de control propuestas en este trabajo son aplicadas
a un modelo normalizado del sistema (capı́tulos 4 y 5). Con el fin de simplificar
la manipulación algebraica en los análisis y generalizarlo, es decir, no limitarlo a
parámetros especı́ficos. Esto se logra por medio de una serie de procedimientos al-
gebraicos que permiten normalizar las ecuaciones (A.10) y (A.11) (es decir manejar
cantidades adimensionales) por lo que es necesario definir las siguientes relaciones de
transformación [6].

p
q = x/l, u = f /mg, dτ = dt g/l δ = M/m (A.16)

Entonces, para realizar la simplificación del sistema con las relaciones anteriores, es
necesario obtener las diferenciales con respecto al tiempo adimensional τ , las cuales
se definen como sigue [85].

1
q̇ = ẋ √ (A.17a)
gl

q̇ = (A.17b)
g

r
g
θ̇ = θ̇ (A.18a)
l
g
θ̈ = θ̈ (A.18b)
l
A.1. Sistema Péndulo Invertido sobre un Carro 149

Es importante recordar que las variables q̇ y q̈ son las derivadas con respecto al tiempo
adimensional τ . Ası́ como, para evitar confusiones, las variables del lado derecho de
(A.18a) y (A.18b) son la primera y segunda derivada con respecto a τ , respectiva-
mente.

Sustituyendo (A.16), (A.17a), (A.17b), (A.18a) y (A.18b) en la ecuaciones (A.10) y


(A.11) se encuentra el sistema normalizado.

Primero, realizamos la sustitución para (A.11) de la siguiente forma:

¡ ¢g
mglq̈ cos θ + ml2 θ̈ − mgl sen θ = 0
l
Dividiendo entre mgl se obtiene la ecuación normalizada

q̈ cos θ + θ̈ − sen θ = 0 (A.19)

Efectuando un procedimiento similar para (A.10) de la siguiente manera:


g g
(M + m)g q̈ − ml(sen θ) θ̇2 + ml(cos θ) θ̈ = f
µ ¶ l l
M
mg + 1 q̈ − mg(sen θ)θ̇2 + mg(cos θ)θ̈ = f
m
y dividiendo ambos miembros entre mg se obtiene:
µ ¶
M f
+ 1 q̈ − (sen θ)θ̇2 + (cos θ)θ̈ =
m mg

Finalmente, utilizando las relaciones de transformación (A.16) obtenemos la expresión


normalizada

(1 + δ)q̈ − θ̇2 sen θ + (cos θ)θ̈ = u (A.20)

El sistema normalizado que describe al sistema péndulo invertido sobre un carro esta
formado por las ecuaciones (A.19) y (A.20) como sigue:

q̈ cos θ + θ̈ − sen θ = 0
(A.21)
(1 + δ)q̈ − θ̇2 sen θ + (cos θ)θ̈ = u
Apéndice A. Modelos Dinámicos de Sistemas Subactuados
150 tipo Péndulo Invertido

A.1.2. Inestabilidad del péndulo invertido en lazo abierto


Las ecuaciones no lineales del sistema del péndulo obtenidas de (A.10) y (A.11)
son:

1 h i
2
ẍ = m sen θ(l θ̇ − g cos θ) + f (A.22)
M + m sen2 θ
1 £ ¤
θ̈ = 2
−mlθ2 sen θ cos θ + (M + m)g sen −f cos θ (A.23)
l(M + m sen θ)

las cuales tienen un punto de equilibrio inestable en (x, ẋ, θ, θ̇)T = (0, 0, 0, 0)T .

A continuación utilizaremos el modelo lineal del sistema para mostrar que el sistema
es inestable en lazo abierto. Para lo cual obtendremos la linealización del modelo no
lineal representado en (A.22) alrededor del punto de equilibrio inestable.1 .

Entonces, definiendo las siguientes variables de estado para el sistema:

x1 = x x2 = ẋ
x3 = θ x4 = θ̇

se obtiene el siguiente sistema lineal:


      
ẋ1 0 1 0 0 x 0
      
ẋ  0 0 − mg 0 ẋ  1 
 2  M    M 
 =   +  f (A.24)
ẋ3  0 0 0 1 θ   0 
      
(M +m)g 1
ẋ4 0 0 lm
0 θ̇ −M
que tiene la siguiente forma:
Ẋ = AX + Bf (A.25)

siendo A y B matrices, y X = (x1 , x2 , x3 , x4 )T ,

Por lo tanto, para mostrar que el sistema en lazo abierto es inestable es necesario
conocer la ubicación de polos de la función de transferencia en lazo abierto, que para
1
Para una explicación más detallada de la obtención del modelo lineal del péndulo invertido
revisar [85, 148].
A.2. Sistema Péndulo con Disco Inercial 151

el caso de la representación en espacio de estado corresponden a los valores carac-


terı́sticos (propios) de la matriz A.

Esto significa, que debemos calcular los valores propios de A utilizando la siguiente
ecuación:

det(sI − A) (A.26)

Consiguientemente, para la matriz A definida en (A.24), y utilizando (A.26) se obtie-


nen los siguientes valores caracterı́sticos o polos.
√ √ √ √
g m+M g m+M
s = 0; s = 0; s = − √√
l M
; s= √√
l M
;

Evidentemente, el sistema tiene un polo en el semiplano derecho. Entonces, se puede


decir que el sistema es inestable en lazo abierto.

A.2. Sistema Péndulo con Disco Inercial


El Péndulo con Disco Inercial (PDI) es un robot subactuado de dos grados de
libertad como muestra la figura A.2. En el cual, el primer eslabón es el péndulo,
mientras que el segundo es el disco.
Los parámetros del sistema se describen en la siguiente tabla.

m1 : Masa del péndulo


m2 : Masa de la rueda
l1 : Longitud del péndulo
l2 : Distancia al centro de masa del péndulo
δ1 : Coeficiente de amortiguamiento de la coordenada subactuada
δ2 : Coeficiente de amortiguamiento de la coordenada actuada
θ1 : Ángulo que forma el péndulo con la vertical
θ2 : Ángulo del disco
I1 : Momento de Inercia del péndulo
I2 : Momento de Inercia de la rueda
τ : Torque del motor aplicado al disco
η = m1 l2 + m2 l1
Apéndice A. Modelos Dinámicos de Sistemas Subactuados
152 tipo Péndulo Invertido

1
x

l2

m 1, I 1
l1

I2
m2

Figura A.2 Péndulo con Disco Inercial .

Entonces, como primer paso se define la energı́a cinética del péndulo como:

1 2
K1 (q) = (m1 l22 + I1 )θ˙1
2
y la energı́a cinética del disco de la forma:
1 2 1
K2 (q) = m2 l12 θ˙1 + I2 (θ˙1 + θ˙2 )2
2 2
Por lo tanto, la energı́a cinética total es:

1 2 1 2
K(q) = K1 (q) + K2 (q) = (m1 l22 + m2 l12 + I1 + I2 )θ˙1 + I2 θ˙1 θ˙2 + I2 θ˙2 (A.27)
2 2

Además, la energı́a potencial del sistema es V (q) = ηg(cos θ1 − 1). Finalmente, el


Lagrangiano (L) es de la forma:

1 2 1 2
L = (m1 l22 + m2 l12 + I1 + I2 )θ˙1 + I2 θ˙1 θ˙2 + I2 θ˙2 − ηg(cos θ1 − 1) (A.28)
2 2
A.2. Sistema Péndulo con Disco Inercial 153

Usando la ecuación de Euler-Lagrange


µ ¶
d ∂L(q, q̇) ∂L(q, q̇)
− =u (A.29)
dt ∂ q̇ ∂q

Donde, para este sistema, las coordenadas generalizadas son θ1 y θ2 , es decir, q =


(θ1 , θ2 )T y u = (0, τ )T .

Por lo tanto, tenemos que.

∂L
= (m1 l22 + m2 l12 + I1 + I2 )q˙1 + I2 q˙2
∂ θ˙1
∂L
= ηg sen θ1
∂θ1
∂L
= I2 q̇1 + I2 q̇2
∂ θ˙2
∂L
=0
∂θ2

Y sustituyendo cada uno de los términos anteriores en la ecuación (A.29) se obtiene:

µ ¶
d ∂L∂L
=0 −
dt ∂ θ˙1
∂θ1
d ¡ ¢
(m1 l22 + m2 l12 + I1 + I2 )q˙1 + I2 q˙2 − ηg sen θ1 = 0
dt

¡ ¢
I1 + I2 + m1 l22 + m2 l12 θ̈1 + I2 θ̈2 − ηg sen θ1 = 0 (A.30)

µ ¶
d ∂L ∂L
− =0
dt ∂ θ˙2 ∂θ2
d
(I2 q̇1 + I2 q̇2 ) − 0 = τ
dt

I2 θ̈1 + I2 θ̈2 = τ (A.31)


Apéndice A. Modelos Dinámicos de Sistemas Subactuados
154 tipo Péndulo Invertido

Consiguientemente, las ecuaciones dinámicas del sistemas son de la siguiente forma:


¡ ¢
I1 + I2 + m1 l22 + m2 l12 θ̈1 + I2 θ̈2 − ηg sen θ1 = 0 (A.32)

I2 θ̈1 + I2 θ̈2 = τ (A.33)

Este sistema puede ser escrito en forma vectorial como sigue:

D (q) q̈ + g (q) = u

Donde
" # " #
θ1 I1 + I2 + m1 l22 + m2 l12 I2
q = D (q) = (A.34)
θ2 I2 I2

" # " #
−ηg sen θ1 0
g (q) = y u = (A.35)
0 τ

A.3. Sistema Péndulo Esférico Invertido


En esta sección presentamos las ecuaciones de movimiento del sistema Péndulo
Esférico Invertido (PEI), obtenidas por medio de las ecuaciones de Euler-lagrange.
Entonces, consideremos al péndulo invertido montado sobre una plataforma móvil
como se muestra en la figura A.3.
Primero denotemos los centro de masa de la base móvil y del péndulo como xGM y
xGm , respectivamente de la siguiente manera:
   
x x + l sen θ
   
xGM =   
y  , xGm = y + l cos θ sen ϕ
0 l cos θ cos ϕ
A.3. Sistema Péndulo Esférico Invertido 155

Además, las velocidades del sistema asociadas con xGM y xGm , son de la siguiente
forma:

   
ẋ ẋ + l cos θθ̇
   
ẋGM =   
ẏ  , ẋGm = ẏ − l sen θ sen ϕθ̇ + l cos θ cos ϕϕ̇
0 −l sen θ cos ϕθ̇ − l cos θ sen ϕϕ̇

M
x
y
fy
fx

Figura A.3 Sistema Péndulo Esférico Invertido .

Los parámetros del sistema se describen en la siguiente tabla:

M : Masa de la base móvil


m : Masa del péndulo
l : Distancia desde el pivote al centro de gravedad del péndulo
x : Desplazamiento del centro de masa de la base móvil en el eje-x
y : Desplazamiento del centro de masa de la base móvil en el eje-y
θ : Rotación alrededor del eje-y
ϕ : Rotación alrededor del eje-x
fx : Fuerza aplicada a la base en la dirección x
fy : Fuerza aplicada a la base en la dirección y

Por consiguiente, las energı́as cinética y potencial del sistema son:

K = 12 ẋTGM M ẋGM + 12 ẋTGm mẋGm , V (q) = mgl cos θ cos ϕ


Apéndice A. Modelos Dinámicos de Sistemas Subactuados
156 tipo Péndulo Invertido

Y por tanto, la expresión de la energı́a cinética puede simplificarse como sigue:


 T   
ẋ M +m 0 ml cos θ 0 ẋ
    
1 
 ẏ 
 0
 M +m −ml sen θ sen ϕ ml cos θ cos ϕ  
  ẏ 
K=     
2  θ̇  ml cos θ −ml sen θ sen ϕ ml2 0   θ̇ 
    
2 2
ϕ̇ 0 ml cos θ cos ϕ 0 ml cos θ ϕ̇
(A.36)
Es evidente que la matriz de inercia de este sistema solo depende de (θ, ϕ). Por lo
tanto, aplicando la ecuación de Euler Lagrange, descrita en (A.37) donde el vector de
coordenadas generalizadas se define como: q = (x, y, θ, ϕ).
 
fx
 

d ∂L(q, q̇) ∂L(q, q̇) fy 
− =  (A.37)
dt ∂ q̇ ∂q 0
 
0
Se obtienen las siguientes ecuaciones dinámicas para el sistema Péndulo Esférico
Invertido.

(M + m)ẍ + ml cos θθ̈ = ml sen θθ̇2 + fx (A.38)


(M + m)ÿ − ml sen θ sen ϕθ̈ + ml cos θ cos ϕϕ̈ = ml cos θ sen ϕθ̇2 + 2ml sen θ cos ϕθ̇ϕ̇
+ ml cos θ sen ϕϕ̇2 + fy
ml cos θẍ − ml sen θ sen ϕÿ + ml2 θ̈ = mgl sen θ cos ϕ − ml2 sen θ cos θϕ̇2
ml cos θ cos ϕÿ + ml2 cos2 θϕ̈ = mgl cos θ sen ϕ + 2ml2 sen θ cos θθ̇ϕ̇
Apéndice B

Linealización Parcial por


Retroalimentación

Para evitar las estrictas condiciones de la linealización por realimentación [97, 133,
165], ası́ como la inconveniencia de no proporcionar elementos constructivos para el
diseño de la ley de control, se desarrollaron nuevas lı́neas de investigación entre las
que destaca el trabajo de M. Spong [184] que consiste en linealizar parcialmente los
sistemas mecánicos subactuados usando un cambio variable en la señal de control.
Enseguida presentamos sus resultados.

Considere el siguiente sistema subactuado

" #" # " # " # " #


m11 (q) m12 (q) q1 h1 (q, q̇) φ1 (q) 0
+ + = (B.1)
m21 (q) m22 (q) q2 h2 (q, q̇) φ2 (q) τ

donde q1 ∈ Rl y q2 ∈ Rm corresponden a los grados de libertad subactuados y


actuados, respectivamente. Además,
" #
m11 (q) m11 (q)
M (q) = (B.2)
m21 (q) m22 (q)

es una matriz simétrica definida positiva, ası́ como las funciones h1 (q, q̇) ∈ Rl y
h2 (q, q̇) ∈ Rm contienen los términos Centrı́fugos y de Coriolisis del sistema, los

157
158 Apéndice B. Linealización Parcial por Retroalimentación

elementos φ1 (q, q̇) ∈ Rl y φ2 (q, q̇) ∈ Rm contienen componentes gravitacionales y


τ ∈ Rm es el vector que representa las fuerzas producidas por los m actuadores.

A continuación, describimos los fundamentos del método, que se utilizaron en este


trabajo de tesis.

Consideremos que de la primera linea de (B.1) se obtiene:

m11 (q)q̈1 + m12 (q)q̈2 + h1 (q, q̇) + φ1 (q) = 0 (B.3)

siendo m11 (q) invertible, debido a que la matriz M (q) es definida positiva. Por lo
tanto, podemos resolver de la ecuación (B.3) a q̈1 como sigue:

q̈1 = −m−1 −1
11 (q)m12 (q)q̈2 − m11 (q)[h1 (q, q̇) + φ1 (q)]. (B.4)

Sustituyendo (B.4) en la segunda linea de (B.1) obtenemos

m̄22 (q)q̈2 + h̄2 (q, q̇) + φ̄2 (q, q̇) = τ (B.5)

donde los términos m̄22 (q), h̄2 (q, q̇) y φ̄2 (q) son de la forma:

m̄22 (q) = m22 (q) − m21 (q)m−1


11 (q)m12 (q)

h̄2 (q, q̇) = h2 (q, q̇) − m21 (q)m−1


11 (q)h1 (q, q̇)

φ̄2 (q) = φ2 (q) − m21 (q)m−1


11 (q)φ1 (q)

Además, para poder definir un controlador u es necesario que la matriz m̄22 (q) de
m × m sea simétrica y definida positiva. La cual puede ser calculada de forma simple
con la siguiente relación [82, 83]

m̄22 = T T M T (B.6)

donde T es una matriz de n × m definida como:


" #
−m−1
11 m12
T = (B.7)
Im×m
159

Entonces, se define la nueva entrada de control u para la ecuación (B.5) como:

τ = m̄22 u + h̄2 (q, q̇) + φ̄2 (q, q̇) (B.8)

Por lo tanto, el sistema parcialmente linealizado es de la forma:

m11 q̈1 + h1 (q, q̇) + φ1 (q, q̇) (B.9)

q̈2 = u (B.10)

Podemos observar que el sistema entrada-salida de u a q2 es lineal y de segundo orden.


Entonces, de lo anterior se deriva la siguiente proposición

Proposición B.0.1 (Spong [184]) Si existe una señal de control de la forma

τ = γ(q)u + β(q, q̇)

la dinámica de (B.1) se puede linealizar parcialmente obteniendo lo siguiente

q̇1 = q̇1
q̈1 = f (q, q̇) + g(q)u
(B.11)
q̇2 = q̇2
q̈2 = u
donde,

γ(q) = m22 (q) − m21 (q)m−1


11 (q)m12 (q)

β(q, q̇) = h2 (q, q̇) − m21 (q)m−1 −1


11 (q)h1 (q, q̇) + φ2 (q) − m21 (q)m11 (q)φ1 (q)

f (q, q̇) = −m−1


11 (q)[h1 (q, q̇) + φ1 (q, q̇)]

g(q) = −m−1
11 (q)m12 (q)

De la discusión anterior podemos concluir que la propiedad principal del sistema sub-
actuado (B.11) es que al aplicar la linealización parcial por retroalimentación la nue-
va entrada de control u transforma la dinámica del sistema (B.1), en el subsistema
160 Apéndice B. Linealización Parcial por Retroalimentación

(q1 , q̇1 ) (subsistema no lineal) y en el subsistema (q2 , q̇2 ) (subsistema lineal). Por lo
cual se puede escribir como:

ẋ = F (x) + G(x)u (B.12)

Siendo x = (q1 , q̇1 , q2 , q̇2 )T


Apéndice C

Demostraciones de lemas y
comentarios adicionales

C.1. Demostración del lema 4.3.2


Comencemos verificando la primera condición de ajuste relacionada con la energı́a
potencial Vd .

Entonces, sustituyendo los valores de Md−1 y F (θ) en la primera condición de (4.9)


definidos en (4.11) y (4.4), respectivamente y recordando que G⊥ = (1,cos θ) se obtiene
la siguiente ecuación diferencial

£ ¤ ∂Vd
G⊥ Md−1 ∂x

Vd (x) − F (θ) = ∂θ
(1 − µ2 cos θ)
. (C.1)
+ ∂V
∂q
d
(−µ2 + µ3 cos θ) + sen θ = 0

Por lo tanto, es sencillo verificar que la siguiente función

1
Vd (x) = k1 − ln(−1 + µ2 cos θ) + Φp (s) (C.2)
µ2
es una solución de la EDP descrita en (C.1), donde k1 es una constante, s es una
variable auxiliar definida en (4.14), y Φp es una función arbitraria.1
1
La EDP fue solucionada con ayuda del programa Mathematica TM .

161
162 Apéndice C. Demostraciones de lemas y comentarios adicionales

Para garantizar que la energı́a potencial Vd sea definida positiva localmente en la


vecindad de x = 0 se deben cumplir las siguientes condiciones:

¯ ¯
∂Vd ¯ ∂ 2 Vd ¯
Vd (0) = 0, ∂x x=0
= 0, ∂x2 ¯
> 0. (C.3)
x=0

Aplicando las condiciones de (C.3) en (C.2), se obtiene

k1 = ln(−1 + µ2 )/µ2 , Φ0p (0) = 0, Φ00p (0) > 0, µ2 > 1, µ3 > µ22 . (C.4)

Y por simplicidad, la función Φp es escogida como:


kp 2
Φp (z) = z , (C.5)
2
con kp > 0.
Por lo tanto, se valida la expresión de Vd definida en (4.13), la cual es estrictamente
positiva y bien definida si
−1 + µ2 cos θ > 0. (C.6)

Evidentemente, la desigualdad anterior se satisface para todo θ ∈ (−θµ , θµ ) con θµ


definida en (4.15). Por consiguiente, la función Vd propuesta satisface la primera
condición de ajuste, para todo θ ∈ Iµ .

Enseguida, procedemos a mostrar que la matriz Kd propuesta garantiza la segunda


condición de ajuste.

De la expresión (4.10) podemos seleccionar a Kd tal que,

G⊥ Md−1 Kd (x) = 0, (C.7)

Entonces, sustituyendo la matriz Md−1 definida en el lema 4.3.2 se obtienen dos ecua-
ciones lineales, de las cuales se puede observar fácilmente, que la matriz Kd propuesta
satisface la ecuación (C.7).

Las condiciones de ajuste fueron solucionadas fácilmente, ya que sólo hemos soluciona-
do una EDP y un conjunto de ecuaciones algebraicas que estaban relacionadas con
C.2. Comentario 4.2.2 163

la estructura del sistema objetivo. Cabe mencionar que si se empleara la metodologı́a


que utiliza las condiciones de ajuste del método de Lagrangianos controlados, serı́a
necesario resolver tres ecuaciones diferenciales ordinarias relacionadas con el moldeo
de energı́a cinética y una ecuación diferencial parcial no lineal derivada de la energı́a
potencial [32, 33, 52]. Un número similar de ecuaciones se requiere si se usa el en-
foque presentado en [26]. Entonces, cabe destacar que la sencillez para solucionar las
dos condiciones de ajuste que se presentó es una consecuencia de la estructura del
sistema en lazo cerrado deseado (4.5). La principal dificultad para realizar el ajuste
de modelo dependerá de la habilidad que se tenga para escoger el sistema en lazo
cerrado objetivo.

C.2. Comentario 4.2.2


En este apéndice estudiamos algunas ventajas del sistema en lazo cerrado (4.5)
linealizado. Por lo tanto, diferenciando la ecuación (4.5) con respecto a sus estados
evaluados en el origen obtenemos el siguiente sistema lineal.

Md ẍ = −γHd ẋ − Hp x (C.8)

donde Hd es una matriz semi-definida positiva de la forma:

 
(µ2 −µ3 )2 (−1+µ2 )(−µ2 +µ3 )
2 2
 (µ22 −µ3) (µ22 −µ3) 
Hd =  (−1+µ2 )(−µ2 +µ3 ) (−1+µ2 )2

2 2
(µ22 −µ3) (µ22 −µ3)
y Hp es una matriz definida positiva definida por:
 
−1+µ2 +kp µ22 −2kp µ2 µ3 +kpµ23 kp(−µ2+µ3)
(−1+µ2 )2
Hp =  kp(−µ2+µ3)
−1+µ2 
−1+µ2
kp .

Las afirmaciones anteriores son sencillas de demostrar, ya que el det(Hd )=0 y det(Hp )=
kp /(−1 + µ2 ) > 0, con µ2 > 1. Ahora, introduciendo la siguiente función candidata a
Lyapunov:
164 Apéndice C. Demostraciones de lemas y comentarios adicionales

1
V = ẋT Md ẋ + xT Hp x,
2
cuya derivada con respecto al tiempo alrededor de la trayectoria (C.8), tiene la si-
guiente forma:

V̇ = −γ ẋT Hd ẋ.

Y como V̇ es semi-definida negativa podemos asegurar la estabilidad en el sentido


de Lyapunov, para posteriormente aplicando el teorema de LaSalle mostrar fácil-
mente que todas las trayectorias del sistema en lazo cerrado linealizado convergen
asintóticamente al origen. Sin embargo, como el sistema (C.8) es lineal. El sistema en
lazo cerrado es estable asintóticamente de manera local, ası́ como exponencialmente
estable alrededor del punto de equilibrio inestable. Esto implica que el sistema en lazo
cerrado sea robusto con respecto a dinámicas pequeñas no modeladas. Es decir, el sis-
tema es robusto con respecto al efecto del amortiguamiento lineal cuando es pequeño.
Para un análisis de estabilidad más riguroso tenemos que incluir la fuerza de amor-
tiguamiento en el modelo original. Entonces, el sistema linealizado puede expresarse
como:
" # " #" #
ẋ 0 I x
= (C.9)
ẍ −Md−1 Hp −Md−1 (γHd + B) ẋ

Realizando algunas manipulaciones algebraicas es posible mostrar que existen matri-


ces Md y Hp , ası́ como constantes γ tal que el sistema (C.9) sea exponencialmente
estable. Por lo tanto, podemos compensar los efectos indeseables del amortiguamiento
localmente.
C.3. Demostración del lema 6.3.1 165

C.3. Demostración del lema 6.3.1


Tomando como base, la definición de V dada en (6.3) y (6.9), se deduce que V
puede ser expresada como:

V (q) = Kp (q) + Kc (q), (C.10)

donde Kp representa la energı́a potencial del sistema en lazo cerrado

k1
Kp (q) = (x + kp Sθ )2
2 (C.11)
k2
+ (y + kp Cθ Sϕ )2 + lkp (1 − Cθ Cϕ )
2
y Kc define la energı́a cinética

1³ ´2
Kc (q) = ẋ + kp Cθ θ̇
2
1³ ´2
+ ẏ + kp (Cθ Cϕ ϕ̇ − Sθ Sϕ θ̇) (C.12)
2
l l lkp 2 lkp 2 2
+ ẋ2 + ẏ 2 − θ̇ − C ϕ̇
2 2 2 2 θ

Evidentemente, Kp es definida positiva globalmente, ya que para todo q 6= 0 se


tiene que Kp (q) > 0. Enseguida mostraremos que Kc > 0, para todo θ, ϕ ∈ Iα . Como
primer aspecto, expresemos la energı́a cinética como una forma cuadrática de la forma
Kc = X T QX/2, donde X = [ẋ, ẏ, θ̇, ϕ̇]T y
 
1+l 0 kp Cθ 0

Q(θ, ϕ) = [qij ] =  kp0C −k1+l −kp Sθ Sϕ


2 2 2 2 2
kp Cθ Cϕ
p Sθ Sϕ −kp l+kp (Cθ +Sθ Sϕ ) −kp Cθ Sθ Cϕ Sϕ
. (C.13)
θ
0 kp Cθ Cϕ −kp2 Cθ Sθ Cϕ Sϕ −kp lCθ2 +kp2 Cθ2 Cϕ
2

Además,2 cabe notar que la submatriz de orden k de la forma Qk = [qij ], siendo


i, j = 1, · · · , k, con k ≤ 4 servirá para evaluar si la matriz Q es positiva. Entonces, se
puede observar claramente que Q1 y Q2 son estrictamente positivas. Para determinar
2
Recuerde que Q > 0 si el det(Qi ) > 0, para i = 1, 2, 3, 4.
166 Apéndice C. Demostraciones de lemas y comentarios adicionales

el determinante de Q3 y Q4 , nos apoyamos en el programa Mathematica TM obteniendo


lo siguiente:
¡ ¢
det(Q3 ) = kp l(1 + l) −1 − l + (Cθ2 + Sθ2 Sϕ2 )kp ,
(C.14)
det(Q4 ) = det Q(θ, ϕ) = l2 kp2 Cθ2 det(N (θ, ϕ)),
donde el det(N ) está definido en (6.18). Y del lema 6.3.1, podemos garantizar que el
det(Q4 ) > 0, para todo θ, ϕ ∈ Iα . Por otra parte, se puede observar que

kp (Cθ2 + Sθ2 Sϕ2 ) > kp Cθ2 Cϕ2 > 0, ∀θ, ϕ ∈ Iα . (C.15)

Por consiguiente, el det(Q3 ) > 0, para todo θ, ϕ ∈ Iα , y la matriz Q(θ, ϕ) es definida


positiva, ∀θ, ϕ ∈ Iα . Podemos concluir que V (q) es definida positiva localmente para
todo |θ| < α y |ϕ| < α.

C.4. Demostración del lema 7.3.5


En la primer parte de esta sección, estimaremos el valor de la cota E definida en
(7.17). Para realizarlo, construiremos la curva de nivel más grande contenida en el
conjunto Q.
Como primer aspecto, definamos al conjunto Sc como:

Sc = {q ∈ Q : Km (q) ≤ c > 0} (C.16)

Cabe notar, que debido a la suposición A1 y el comentario 7.3.6 el conjunto Sc es un


conjunto convexo. Entonces, calculando los puntos extremos en la dirección de θ y r
del conjunto Sc , obtenemos las siguientes relaciones:

∂Km
(q) = −(κ3 + κ2 r) sen θ + κ1 θ = 0 (C.17)
∂θ
y

∂Km
(q) = −κ2 (1 − cos θ) + kp (r − r) = 0 (C.18)
∂r
Podemos concluir de A1, que la solución de (C.17) es dada por θ = 0. Por consi-
guiente, los puntos extremos en la dirección de θ son definidos como q1 = (r + ε, 0)
C.4. Demostración del lema 7.3.5 167

y q2 = (r − ε, 0). Y si se desea que q1 y q2 pertenezcan a ∂Q3 entonces, tenemos que


Km (q1 ) = Km (q2 ) = kp ε2 /2.
De manera similar, los puntos extremos en la dirección de r que pertenecen a ∂Q son
q3 = (r, λε , θ) y q4 = (r, λε , θ); donde el parámetro λ se escoge como:

kp
Km (q3 ) = Km (q4 ) = λκ2 (1 − cos θ)ε = ε.
2
Entonces, después de solucionar la ecuación (C.18) y forzando a que las dos soluciones
pertenezcan a ∂Q, se tiene que q = (r∗ , ±θ) ∈ ∂Q; donde r∗ = r + κ2 (1 − cos θ)/kp .
Por lo tanto, kp se define como:

λκ2 (1 − cos θ)
kp = (C.19)
ε
con λ > 1 y E = kp ε2 /2, por lo cual los valores de r∗ y E se pueden expresar como:

r∗ = r + λε ; E = λκ2 (1 − cos θ)ε.

Evidentemente, λ > 1 satisface (7.18).

Además, ya que la función ET es decreciente, se deduce que si x0 = (q0 , q˙0 ) con q0 ∈ Q


y ET ≤ E, tenemos que:

1
Km (q(t)) ≤ Km (q(t)) + q̇ T (t)M q̇(t) ≤ ET (x(t)) ≤ ET (x0 ) ≤ E; ∀t ≥ 0.
2
De la desigualdad anterior obtenemos que q(t) ∈ SE ⊂ Q, para todo t ≥ 0. Por lo
tanto, el lema 7.3.5 se cumple.

3
∂Q representa el conjunto de todos los puntos frontera de Q.
Apéndice D

Publicaciones y congresos
generados del trabajo de
investigación

Publicaciones en Revistas

• C. Aguilar-Ibáñez and O. O. Gutiérrez-Frı́as. A simple model matching


for the stabilization of an inverted pendulum cart system, International
Journal of Robust and Nonlinear Control, Vol.18, No. 6, pp. 688-699, 2008.

• C. Aguilar-Ibáñez and O. Gutiérrez-Frı́as. Controlling the inverted pendu-


lum by means of a nested saturation functions, Nonlinear Dynamics, Vol.
53, No. 4, pp. 273-280, 2008.

• C. Aguilar-Ibáñez, O. Gutiérrez F. and H. Sossa-Azuela. Controlled La-


grangian approach to the stabilization of the inverted pendulum system,
Revista Mexicana de Fı́sica, Vol. 54, No. 4, pp. 329-335, 2008.

• O. Octavio Gutiérrez F., Carlos Aguilar Ibáñez and Humberto Sossa A.


Stabilization of the inverted spherical pendulum via Lyapunov approach,
Asian Journal of Control, Vol. 11, No. 6, pp. 587-594, 2009.

168
169

Participación en Congresos

• C. Aguilar-Ibáñez, O. Gutiérrez F. and M. Suárez-C. Stabilization of the


strongly damping inertia wheel pendulum by a nested saturation functions,
In Proceeding of the 2008 American Control Conference, pp. 3434-3439,
Seattle, WA., USA, 2008.

• C. Aguilar, O. Gutiérrez, J. C. Martı́nez, R. Garrido and B. Gómez.


Lyapunov-based PD linear control of the oscillatory behavior of a nonli-
near mechanical system: the inverted physical pendulum with moving mass
case, In 8th International symposium on Mathematical Theory of Networks
and Systems (MTNS2008), Blacksburg, Virginia, USA, 2008.
Referencias

[1] R. Abraham and J. E. Marsden. Foundations of Mechanics. Addison-Wesley,


Redwood City, CA, 2nd edition, 1987.

[2] J. A. Acosta-Rodriguez. Control No Lineal de Sistemas Subactuados. Ph.D.


Thesis, Universidad de Sevilla, España, 2004.

[3] S. Afkhami, M. J. Yazdanpanah and P. J. Maralani. Stabilization of inertia


wheel pendulum using output feedback back-stepping. In Proceedings of 2003
IEEE Conference on Control Applications, volume 2, pages 977–982, Istanbul,
Turkey, 2003.

[4] C. Aguilar, O. Gutiérrez, J. C. Martı́nez, R. Garrido and B. Gómez. Lyapunov-


based PD linear control of the oscillatory behavior of a nonlinear mechani-
cal system: the inverted physical pendulum with moving mass case. In 18th
International Symposium on Mathematical Theory of Networks and Systems
(MTNS2008), Blacksburg, Virginia, USA, 2008.

[5] C. Aguilar-Ibáñez and H. Sossa A. Stabilization of the Furuta pendulum based


on a Lyapunov function. Nonlinear Dynamics, 49(1-2):1–8, 2007.

[6] C. Aguilar-Ibáñez, O. Gutiérrez F. and M. S. Suarez C. Lyapunov based con-


troller for the inverted pendulum cart system. Nonlinear Dynamics, 40(4):367–
374, 2005.

[7] C. Aguilar-Ibáñez, O. Gutiérrez F. and H. Sossa-Azuela. Controlled lagrangian

170
REFERENCIAS 171

approach to the stabilization of the inverted pendulum system. Revista Mexi-


cana de Fı́sica, 54(4):329–335, 2008.

[8] C. Aguilar-Ibáñez and O. O. Gutiérrez F. Controlling the inverted pendulum


by means of a nested saturation functions. Nonlinear Dynamics, 53(4):273–280,
2008.

[9] C. Aguilar-Ibáñez, O. Gutiérrez-F and H. Sossa-Azuela. Control of the Furuta


pendulum by using a Lyapunov function. In Proceedings of the 45th IEEE
Conference on Decision and Control, pages 6128–6132, San Diego,CA, USA,
Dec 2006.

[10] C. Aguilar-Ibáñez, O. Gutiérrez-F and H. Sossa-Azuela. Lyapunov approach


for the stabilization of inverted spherical pendulum. In Proceedings of the 45th
IEEE Conference on Decision and Control, pages 6133–6136, San Diego,CA,
USA, 2006.

[11] C. Aguilar-Ibáñez and O. O. Gutiérrez-Frı́as. A simple model matching for the


stabilization of an inverted pendulum cart system. International Journal of
Robust and Nonlinear Control, 18(6):688–699, 2008.

[12] C. Aguilar-Ibáñez and H. Sira-Ramı́rez. Control of the Furuta pendulum based


on a linear differential flatness approach. In Proceedings of the 2002 American
Control Conference, volume 3, pages 1954–1959, Anchorage Alaska, USA, 2002.

[13] C. Aguilar-Ibáñez and H. Sira-Ramı́rez. PD control for active vibration damping


in an underactuated nonlinear system. Asian Journal of Control, 4(4):502–508,
2002.

[14] C. F. Aguilar-Ibáñez, O. O Gutierrez F. and M. S. Suarez C. Stabilization of the


strongly damping inertia wheel pendulum by a nested saturation functions. In
Proceedings of the 2008 American Control Conference, pages 3434–3439, Seattle,
WA, 2008.
172 REFERENCIAS

[15] X. Albouy and L. Praly. On the use of dynamic invariants and forwarding for
swinging up a spherical inverted pendulum. In Proceedings of 39th IEEE Con-
ference on Decision and Control, volume 2, pages 1667–1672, Sydney, Australia,
2000.

[16] C. W. Anderson. Learning to control an inverted pendulum using neural net-


works. IEEE, Control Systems Magazine, 9(3):31–37, 1989.

[17] B. R. Andrievskii, P. Yu. Guzenko and A. L. Fradkov. Control of nonlinear vi-


brations of mechanical systems via the method of velocity gradient. Automation
and Remote Control, 57(4):456–467, 1996.

[18] D. Angeli. Almost global stabilization of the inverted pendulum via continuous
state feedback. Automatica, 37(7):1103–1108, 2001.

[19] J. Aracil and F. Gordillo. The inverted pendulum: a benchmark in nonlinear


control. In Proceedings World Automation Congress, 2004.

[20] J. Aracil and F. Gordillo. El péndulo invertido: un desafı́o para el control no


lineal. RIAI: Revista Iberoamericana de Automática e Informática Industrial,
2(2):8–19, 2005.

[21] K. J. Åström. Adaptive control around 1960. IEEE, Control Systems Magazine,
16(3):44–49, 1996.

[22] K. J. Åström, S. P. Boyd, R. W. Brockett and G. Stein. Control in an In-


formation Rich World: Report of the Panel on Future Directions in Control,
Dynamics, and Systems. Society of Industrial and Applied Mathematics, 2003.

[23] K. J. Åström and K. Furuta. Swinging up a pendulum by energy control. In


IFAC, San Francisco, 1996.

[24] K. J. Åström and K. Furuta. Swing up a pendulum by energy control. Auto-


matica, 36(2):287–295, 2000.
REFERENCIAS 173

[25] D. Auckly and L. Kapitanski. Nonlinear Dynamics and Renormalization Group-


CRM Proceedings and Lecture Notes, volume 27, chapter Mathematical pro-
blems in the control of underactuated systems, pages 29–40. AMS Bookstore,
2001.

[26] D. Auckly and L. Kapitanski. On the λ equations for matching control laws.
SIAM J. Control Optim, 41(5):1372–1388, 2002.

[27] D. Auckly, L. Kapitanski and W. White. Control of nonlinear underactuated


systems. Communications on Pure and Applied Mathematics, 53(3):354–369,
2000.

[28] M. Barão and J. M. Lemos. Nonlinear control of HIV-1 infection with a singular
perturbation model. Biomedical Signal Processing and Control, 2(3):248–257,
2007.

[29] R. Bellman. Dynamic Programming. New Jersey: Princeton Univ. Press, 1957.

[30] M. Bergerman. Dynamics and control of underactuated manipulators. Ph.D.


Thesis, Carnegie Mellon University,Pittsburgh, USA, 1996.

[31] H. Berghuis and H. Nijmeijer. A passitivy approach to controller-observer design


for robots. IEEE Transactions on Robotics and Automation, 9(6):740–754, 1993.

[32] G. Blankenstein, R. Ortega and A. Van der Schaft. The matching conditions of
controlled lagrangians and IDA passivity based control. International Journal
of Control, 75(9):645–665, 2002.

[33] A. M. Bloch, D. E. Chang, N. E. Leonard and J. E. Marsden. Controlled


lagrangians and the stabilization of mechanical systems II: potential shaping.
IEEE Transactions on Automatic Control, 46:1556–1571, 2001.

[34] A. M. Bloch, N. E. Leonard and J. E. Marsden. Stabilization of the pendulum


on a rotor arm by the method of controlled lagrangians. In Proceedings. 1999
IEEE International Conference on Robotics and Automation, volume 1, pages
500–505, Detroit, MI, USA, 1999.
174 REFERENCIAS

[35] A. M. Bloch, N. E. Leonard and J. E. Marsden. Controlled lagrangians and


the stabilization of mechanical systems I: the first matching theorem. IEEE
Transactions on Automatic Control, 45(12):2253–2270, 2000.

[36] A. M. Bloch, N. E. Leonard and J. E. Marsden. Stabilization of mechanical


systems using controlled lagrangians. In Proceedings of the 36th IEEE Con-
ference on Decision and Control, volume 3, pages 2356–2361, San Diego, CA,
USA, 1997.

[37] A. M. Bloch, N. E. Leonard and J. E. Marsden. Matching and stabilization


by the method of controlled lagrangians. In Proceedings of the 37th IEEE
Conference on Decision and Control, volume 2, pages 1446–1451, Tampa, FL,
USA, 1998.

[38] A. M. Bloch, J. E. Marsden and D. V. Zenkov. Nonholonomic dynamics. Notices


of the American Mathematical Society, 52(3):324–333, 2005.

[39] D. J. Block. Mechanical design and control of the pendubot. Master´s Thesis,
University of Illinois, Urbana-Champaign, IL,USA, 1996.

[40] D. J. Block and M. W. Spong. Mechanical design & control of the pendubot.
In SAE 46th annual Earthmoving Industry Conference, Peoria, IL, USA, 1995.

[41] H. W. Bode. Feedback amplifier design. Bell Syst. Technol. J., 19:42, 1940.

[42] H. W. Bode. Network Analysis and Feedback Amplifier Design. New York: Van
Nostrand, 1945.

[43] S. Bortoff and M. W. Spong. Pseudolinearization of the acrobot using spline


functions. In Proc. 31st IEEE Conf. on Decision and Control, volume 1, pages
593–598, Tucson AZ, USA, 1992.

[44] J. P. Bransa, C. Macharisa, P. L. Kunschb, A. Chevalierc and M. Schwaningerd.


Combining multicriteria decision aid and system dynamics for the control of
socio-economic processes. An iterative real-time procedure. European Journal
of Operational Research, 109(2):428–441, 1998.
REFERENCIAS 175

[45] R. W. Brockett. Differential Geometric Control Theory, chapter Asymptotic


stability and feedback stabilization, pages 181–191. Birkhauser, Boston, MA.,
1983.

[46] B. Brogliato, I. D. Landau and R. Lozano. Adaptive motion control of robot


manipulators: A unified approach based on passivity. Int. J. of Robust and
Nonlinear Control, 1(3):187–202, 1991.

[47] S. C. Brown and K. M. Passino. Intelligent control for an acrobot. Journal of


Intelligent and Robotic Systems, 18(3):209–248, 1997.

[48] R. T. Bupp, D. S. Bernstein, and V. T. Coppola. A benchmark problem for


nonlinear control design. Int. Journal of Robust and Nonlinear Control, 8:307–
310, 1998.

[49] A. Castelletti and R. Soncini-Sessa. Coupling real-time control and socio-


economic issues in participatory river basin planning. Environmental Modelling
& Software, 22(8):1114–1128, 2007.

[50] P. Castillo, R. Lozano and A. Dzul. Modelling and Control of Mini Flying
Machines. Springer-Verlag, Berlin, 2005.

[51] P. C. Chandrasekharan. Robust Control of Linear Dynamical Systems. Aca-


demic Press, 1996.

[52] D. E. Chang, A. M. Bloch, N. E. Leonard, J. E. Marsden and C. A. Woolsey.


The equivalence of controlled lagrangian and controlled hamiltonian systems
for simple mechanical systems. ESAIM: Control, Optimisation, and Calculus
of Variations, 8:393–422, 2002.

[53] C. T. Chen. Linear System Theory and Design. Oxford University Press, 3rd
edition, 1998.

[54] C. C. Chung and J. Hauser. Nonlinear control of a swinging pendulum. Auto-


matica, 31(6):851–862, 1995.
176 REFERENCIAS

[55] P. Dong, H. Benaroya and T. Wei. Integrating experiments into an energy-based


reduced-order model for vortex-induced-vibrations of a cylinder mounted as an
inverted pendulum. Journal of Sound and Vibration, 276(1-2):45–63, 2004.

[56] G. Escobar, R. Ortega and H. Sira-Ramirez. Output-feedback global stabi-


lization of a nonlinear benchmark system using a saturated passivity-based
controller. IEEE Transactions on Control Systems Technology, 7(2):289–293,
1999.

[57] S. Esteban, J. Aracil and F. Gordillo. Estudio para la sintonización de paráme-


tros de leyes de control del péndulo invertido. In Actas de las XXV Jornadas
de Automática (Ja2004), 2004.

[58] W. R. Evans. Graphical analysis of control system. Trans. Am. Inst. Electr.
Eng., 67:547–551, 1948.

[59] I. Fantoni and R. Lozano. Nonlinear Control for the Underactuated Mechanical
Systems. Springer-Verlag, London, UK, 2002.

[60] I. Fantoni and R. Lozano. Stabilization of the Furuta pendulum around its
homoclinic orbit. International Journal of Control, 45(6):390–398, 2002.

[61] I. Fantoni and R. Lozano. Global stabilization of the cart-pendulum system


using saturation functions. In Proccedings of the 42nd IEEE Conference on
Decision and Control, volume 5, pages 4393–4398, Maui, HI, 2003.

[62] I. Fantoni, R. Lozano and F. Mazenc. Control of the PVTOL aircraft using the
forwarding technique and a Lyapunov approach. In European Control Confer-
ence, ECC2001, pages 3032–3037, Porto, Portugal, 2001.

[63] I. Fantoni, R. Lozano and M. Spong. Energy based control of the pendubot.
IEEE Trans. on Automatic Control, 45(4):725–729, 2000.

[64] I. Fantoni, R. Lozano and M. W. Spong. Passivity based control of the pen-
dubot. In Proceedings of the 1999 American Control Conference, volume 1,
pages 268–272, San Diego, California, USA, 1999.
REFERENCIAS 177

[65] I. Fantoni, A. Zavala and R. Lozano. Global stabilization of a PVTOL aircraft


with bounded thrust. In Proceedings of the 41st IEEE Conference on Decision
and Control , December 2002, volume 4, pages 4462–4467, Las Vegas, Nevada
USA, 2002.

[66] R. Fierro, F. L. Lewis and A. Lowe. Hybrid control for a class of underactuated
mechanical systems. IEEE Transactions on Systems, Man and Cybernetics,
Part A, 29(6):649–654, 1999.

[67] A. L. Fradkov. Swinging control of nonlinear oscillations. Int. Jour. Control,


64(6):1189–1202, 1996.

[68] A. L. Fradkov and A. Yu. Pogromsky. Introduction to control of oscillations


and chaos, volume 35. World Scientific Series on Nonlinear Science, Series A -
Vol. 35, 1998.

[69] L. A. Fradkov, O. P. Tomchina and O. L. Nagibina. Swing control of rotating


pendulum. Proceedings of 3rd IEEE Mediterranean Symposium on Control and
Automation, 1:347–351, 1995.

[70] K. Furuta. Control of pendulum: From super mechano-super to human adap-


tive mechatronics. In Proceedings of 42nd IEEE Conference on Decision and
Control., volume 2, pages 1498–1507, Maui, HI, 2003.

[71] K. Furuta and M. Iwase. Swing-up time analysis of pendulum. Bulletin of the
Polish Academy of Sciences Technical Sciences., 52(3), 2004.

[72] K. Furuta, M. Yamakita and S. Kobayashi. Swing up control of inverted pendu-


lum using pseudo-state feedback. Journal of System and Control Engineering,
206:263–269, 1992.

[73] S. Garcı́a-Nieto, M. Martı́nez, Á. Llosá and J. Sanchis. Estrategias de enseñanza


a distancia sobre control no-lineal aplicada al péndulo invertido. Información
Tecnológica, 18(5):85–98, 2007.
178 REFERENCIAS

[74] H. Goldstein, C. Poole and J. Safko. Classical Mechanics. Addison-Wesley, 3rd


edition, 2001.

[75] H. Gollee, D. J. Murray-Smith and J. C. Jarvis. A nonlinear approach to mode-


lling of electrically stimulated skeletal muscle. IEEE transactions on biomedical
engineering, 48(4):406–415, 2001.

[76] F. Gómez-Estern. Control de Sistemas No Lineales Basados en la Estructura


Hamiltoniana. Ph.D. Thesis, Universidad de Sevilla, España, 2003.

[77] F. Gómez-Estern, R. Ortega, F. Rubio and J. Aracil. Stabilization of a class


of underactuated mechanical via total energy shaping. In Proceedings of the
40th IEEE Conference on Decision and Control, volume 2, pages 1137–1143,
Orlando, FL, U.S.A, 2001.

[78] F. Gómez-Estern and A. J. van der Schaft. Physical damping in IDA-PBC


controlled underactuated mechanical systems. European Journal of Control,
10(5):451–468, 2004.

[79] F. Gordillo, J. A. Acosta and J. Aracil. A new swing-up law for the furuta
pendulum. International Journal of Control, 76(8):836–844, 2003.

[80] F. Gordillo and J. Aracil. A new controller for the inverted pendulum on a cart.
International Journal of Robust and Nonlinear Control, 18(17):1607–1621, 2008.

[81] F. Gordillo, J. Aracil and J. A. Acosta. Control strategy for the cart-pendulum
system. In Proceedings of Controlo 2004, volume 6, pages 214–219, Faro, Por-
tugal, 2004.

[82] Y. Gu and N. Loh. Control system modeling for robot manipulators by use of a
canonical transformation. In Proceedings. 1987 IEEE International Conference
on Robotics and Automation., volume 4, pages 484– 489, 1987.

[83] Y. L. Gu and Y. Xu. A normal form augmentation approach to adaptive control


of spacerobot systems. In Proceedings, 1993 IEEE International Conference on
Robotics and Automation, volume 2, pages 731–737, Atlanta, GA, USA, 1993.
REFERENCIAS 179

[84] O. O. Gutiérrez-F, C. Aguilar-Ibáñez and H. Sossa-Azuela. Stabilization of the


inverted spherical pendulum via Lyapunov approach. Asian Journal of Control,
11(6):587–594, 2009.

[85] O. O. Gutiérrez-Frı́as. Diseño de leyes de control de un Péndulo invertido


montado sobre un carro. Tesis de maestrı́a, CIC-IPN, Mexico, 2006.

[86] J. Hamberg. General matching conditions in the theory of controlled la-


grangians. In Proceedings of the 38th IEEE Conference on Decision and Control,
volume 3, pages 2519–2523, Phoenix, AZ, USA, 1999.

[87] J. Hamberg. IFAC Workshop on Lagrangian and Hamiltonian Methods for


Nonlinear Control, chapter Controlled Lagrangians, symmetries and conditions
for strong matching, pages 98–103. Elsevier, Princeton, NJ, USA, 2000.

[88] J. Hauser and R. Murray. Nonlinear controllers for non-integrable systems: The
acrobot example. In Proc. American Control Conference, pages 669–671, 1990.

[89] J. Hauser, S. Sastry and P. Kokotovic. Nonlinear control via approximate input-
output linearization: the ball and beam example. IEEE Transactions on Auto-
matic Control, 37(3):392–398, 1992.

[90] J. Hauser, S. Sastry and G. Meyer. Nonlinear control design for slightly nonmi-
nimum phase system: Application to v/stol aircraft. Automatica, 28(4):665–679,
1992.

[91] T. Henmi, M. Deng and A. Inoue. Swing-up control of the acrobot using a new
partial linearization controller based on the Lyapunov Theorem. In Procee-
dings of the 2006 IEEE International Conference on Networking, Sensing and
Control, 2006. ICNSC ’06., pages 60–65, Ft. Lauderdale, FL, 2006.

[92] S. Horikawa, M. Yamaguchi, T. Furuhashi and Y. Uchikawa. Fuzzy control


for inverted pendulum using fuzzy neural network. Journal of Robotics and
Mechatronics, 17(1):36–44, 1995.
180 REFERENCIAS

[93] T. Hoshino, K. Kawai and K. Furuta. Stabilization of the triple spherical pen-
dulum - a simultaneous design approach. Automatisierungstechnik, 48:577–587,
2000.

[94] A. Hurwitz. On the conditions under which an equation has only roots with
negative real parts. Mathematische Annalen, 46:273–284, 1895.

[95] D. J. Inman. Engineering Vibration. Prentice Hall, 2008.

[96] T. Ishida, N. Shiokawa, T. Nagado and S. Ganeko. Learning control of an in-


verted pendulum using a neural network. In Proceedings. IECON apos;91., 1991
International Conference on Industrial Electronics, Control and Instrumenta-
tion, volume 2, pages 1401–1404, Kobe, Japan, 1991.

[97] A. Isidori. Nonlinear Control Systems. Springer Verlag, London, 3rd edition,
1995.

[98] M. Iwashiro, K. Furuta and K. J. Aström. Energy based control of pendu-


lum. In Proceedings of the 1996 IEEE. International Conference on Control
Applications, pages 715–720, Michigan, USA, 1996.

[99] B. Jakubczyk and W. Respondek. On the linearization of control systems. Bull.


Acad. Polon. Sci. Ser Math. Astron. Physics, 28:517–522, 1980.

[100] M. Jankovic, D. Fontaine and P.V. Kokotovic. TORA example: cascade-and


passivity-based control designs. IEEE Transactions on Control Systems Tech-
nology, 4(3):292–297, 1996.

[101] Z. P. Jiang, D. J. Hill and Y. Guo. Stabilization and tracking via output
feedback for the nonlinear benchmark system. Automatica, 34(7):907–915, 1998.

[102] S. Kajita, F. Kanehiro, K. Kaneko, K. Yokoi and H. Hirukawa. The 3D linear


inverted pendulum mode: a simple modeling for a bipedwalking pattern gene-
ration. In Proceedings. 2001 IEEE/RSJ International Conference on Intelligent
Robots and Systems, volume 1, pages 239–246, Maui, HI, USA, 2001.
REFERENCIAS 181

[103] R. E. Kalman. Contributions to the theory of optimal control. Bol. Soc. Mat.
Mex., 5:102–119, 1960.

[104] R. E. Kalman. A new approach to linear filtering and prediction problems.


ASME Transactions, Part D (Journal of Basic Engineering), 82:35–45, 1960.

[105] R. E. Kalman and J. E. Bertram. Control system analysis and design via the
‘second method’ of Lyapunov I. continuous-time systems. Trans. ASME J.
Basic Eng., pages 371–393, 1960.

[106] R. E. Kalman and R. S. Bucy. New results in lineal filtering and prediction
theory. ASME Trans., Part D (Journal of Basic Engineering), pages 95–108,
1961.

[107] I. Kanellakopoulos, P. V. Kokotovic and A. S. Morse. Systematic design of


adaptive controller for feedback linearizable systems. IEEE Transaction on
Automatic Control, 36(11):1241–1253, 1991.

[108] I. Kanellakopoulos and J. Zhao. Tracking and disturbance rejection for the
benchmark nonlinear control problem. In Proceedings of the American Control
Conference, 1995., volume 6, pages 4360–4362, Seattle, WA, USA, 1995.

[109] A. G. Kelkar, B. Fang, W. White and Xin Guo. Feedback stabilization of


underactuated nonlinear pendulum cart system using matching conditions. In
Proceedings of the 2002 American Control Conference, volume 6, pages 4696 –
4701, Anchorage, Alaska, USA, 2002.

[110] H. Khalil. Nonlinear Systems. Prentice Hall., Upper Sadler River, NJ, 3rd
edition, 2002.

[111] Mojtaba Ahmadieh Khanesar, Mohammad Teshnehlab and Mahdi Aliyari


Shoorehdeli. Sliding mode control of rotary inverted pendulm. In Proceeding
of the 15th Mediterranean Conference on Control and Automation. MED apos
’07., pages 1–6, Athens, Grece, June 2007.
182 REFERENCIAS

[112] D. E. Koditschek. The application of total energy as a Lyapunov function for


mechanical control systems. In J. Marsden, Krishnaprasad, and J. Simo, editors,
Control Theory and Multibody Systems, volume 97, pages 131–158. AMS Series
in Contemporary Mathematics, 1989.

[113] A. D. Kuo, J. M. Donelan and A. Ruina. Energetic consequences of walking like


an inverted pendulum: step-to-step transitions. Exerc. Sport Sci Rev, 33(2):88–
97, 2005.

[114] L. Landau and E. Lifchitz. Curso de fı́sica teórica, Tomo I: Mecánica. Ediciones
MIR, Moscú., 1964.

[115] E. Lefeber. Tracking Control of Nonlinear Mechanical Systems. Ph.D. Thesis,


Faculty of Mathematical Sciences, University of Twente, The Netherlands, 2000.

[116] Wei Li, K.Tanaka and H. O. Wang. Acrobatic control of a pendubot. IEEE
Transactions on Fuzzy Systems, 12(4):549–554, 2004.

[117] F. Lin, W. Zhang and R. D.Brandt. Robust hovering control of a PVTOL air-
craft. IEEE Transactions on Control Systems Technology, 7(3):343–351, 1999.

[118] Z. Lin, A. Saberi, M. Gutmann and Y. A. Shamash. Linear controller for


an inverted pendulum having restricted travel: A high-and-low gain approach.
Automatica, 32(6):933–937, 1996.

[119] G. Liu. Modelling, Stabilizing Control and Trajectory Tracking of a Spherical


Inverted Pendulum. Ph.D. Thesis, The University of Melbourne, Australia,
2006.

[120] G. Liu and L. Marconi. High-low gain redesign for a 4 DOF spherical inverted
pendulum. In 17th IFAC World Congress, pages 5921–5926, Seoul, Korea, 2008.

[121] G. Liu, I. Mareels and D. Nesic. Way point tracking of a spherical inver-
ted pendulum. In ICCA 2007, IEEE International Conference on Control and
Automation, 2007.
REFERENCIAS 183

[122] G. Liu, D. Nesic and I. Mareels. Modelling and stabilisation of a spherical


inverted pendulum. In 16th IFAC World Congress, pages 1–6, Prague, Czeck
Republic, 2005.

[123] G. Liu, D. Nesic and I. Mareels. Nonlinear stable inversion-based output track-
ing control for a spherical inverted pendulum. In The 6th Asian Control, 2006.

[124] G. Liu, D. Nesic and I. Mareels. Non-local stabilization of a spherical inverted


pendulum. International Journal of Control, 81(7):1035–1053, 2008.

[125] R. Lozano, B. Brogliato, B. Maschke and O. Egeland. Dissipative Systems


Analysis and Control Theory and Applications. Communications and Control
Engineering, Springer-Verlag, 2nd edition, 2007.

[126] R. Lozano, P. Castillo and A. Dzul. Global stabilization of the PVTOL: real-
time application to a mini-aircraft. Int. Journal of Control, 77(8):735–740,
2004.

[127] R. Lozano and D. Dimogianopoulos. Stabilization of a chain of integrators with


nonlinear perturbations: Application to the inverted pendulum. In Proccedings
of the 42nd IEEE Conference on Decision and Control, volume 5, pages 5191–
5196, Maui, HI, 2003.

[128] R. Lozano, I. Fantoni and D.J. Block. Stabilization on the inverted pendulum
around its homoclinic orbit. System & Control Letter, 40(3):197–204, 2000.

[129] A. M. Lyapunov. Problème général de la stabilité du mouvement. Ann. Fac. Sci


Univ. Toulouse Sci. Math. Sci. Phys., 9:203–474, 1907:original paper publised
in 1893 in Commnun. Soc. Math. Kharkow, 1893: reprinted as vol. 17 in Annals
of Math studies., Princeton University Press, Princenton N. J.,1949.

[130] Xiao Qing Ma and Chun-Yi Su. A new fuzzy approach for swing up control of
pendubot. In Proceedings of the 2002 American Control Conference, volume 2,
pages 1001–1006, Anchorage Alaska, USA, 2002.
184 REFERENCIAS

[131] M. E. Magana and F. Holzapfel. Fuzzy-logic control of an inverted pendulum


with vision feedback. IEEE Transactions on Education, 41(2):165–170, 1998.

[132] D. I. Makarenko, Z. K. Avdeeva and V. Maximov. Cognitive approach to control


of socio-economic systems security. In 2004 IEEE International Conference on
Systems, Man and Cybernetics,, pages 899–903, The Hague, The Netherlands,
2004.

[133] R. Marino and P. Tomei. Nonlinear Control design: geometric, adaptive and
robust. Prentice-Hall, 1995.

[134] S. Márka, A. Takamori, M. Ando, A. Bertolini, G. Cella, R. DeSalvo,


M. Fukushima, Y. Iida, F. Jacquier, S. Kawamura, Y. Nishi, K. Numata, V. San-
nibale, K. Somiya, R. Takahashi, H. Tariq, K. Tsubono, J. Ugas, N. Viboud,
C. Wang, H. Yamamoto and T. Yoda. Anatomy of the TAMA SAS seismic
attenuation system. Classical and Quantum Gravity, 19(7):1605–1614, 2002.

[135] P. Martin, S. Devasia and B. Paden. A different look at output tracking: Control
of a vtol aircraft. Automatica, 32(1):101–107, 1996.

[136] H. Marzi. Multi-input fuzzy control of an inverted pendulum using an armature


controlled DC motor. Robotica, 23(6):785–788, 2005.

[137] H. Matsuhisa, R. Gu, Y. Wang, O. Nishihara and S. Sato. Vibration control of


a ropeway carrier by passive dynamic vibration absorbers. JSME International
Journal. Series C, Mechanical systems, machine elements and manufacturing,
38C(4):657–662, 1995.

[138] J. C. Maxwell. On governors. Proc. R. Soc. London, 16:273–283, 1868.

[139] O. Mayr. The Originis of Feedback Control. Cambrigde, MA: MIT Press, 1970.

[140] F. Mazenc and L. Praly. Adding integrations, saturated controls, and stabi-
lization for feedforward systems. IEEE Transactions on Automatic Control,
41(11):1559–1578, 1996.
REFERENCIAS 185

[141] N. H. McClamroch and I. Kolmakovsky. A hybrid switched mode control for


v/stol flight control problems. In Proc. 35th IEEE conf. on Decision and Con-
trol, pages 2648–2653, Kobe, Japan, 1996.

[142] T. Miyagawa and Y. Ishida. Neural network-based model reference control for
inverted pendulum. In Proceedings of the IEEE International Conference on
Neural Networks, volume 1, pages 640–644, Perth, WA, Australia, 1995.

[143] M. A. Moreno-Armendariz. Control adaptable del sistema no-lineal TORA


usando redes neuronales dinámicas. Tesis de maestrı́a, CINVESTAV, México,
1999.

[144] R. M. Murray and S. S Sastry. Steering nonholonomic systems in chained form.


In Proceedings of the 30th IEEE Conference on Decision and Control, volume 2,
pages 1121–1126, Brighton, UK, 1991.

[145] S. Nair and N. E. Leonard. A normal form for energy shaping: Application
to the Furuta pendulum. In Proc. of the 41th Conf. on Decision and Control,
volume 1, pages 516–521, Vegas Nev, USA, December 2002.

[146] F. Naranjo, A. Matta, J. C. Acosta and J. D. Colorado. Controlab: Labora-


torio virtual de simulación de algoritmos de control no lineales para sistemas
subactuados. In VII Congreso de la Asociación Colombiana de Automática,
2007.

[147] H. Nyquist. Regeneration theory. Bell Syst. Technol. J., 11:126–147, 1932.

[148] K. Ogata. Ingenierı́a De Control Moderna. Pearson, 2003.

[149] R. Olfati-Saber. Fixed point controllers and stabilization of the cart-pole and
rotating pendulum. In Proc. of the 38th Conf. on Decision and Control, volu-
me 2, pages 1174–1181, Phoenix, Az., 1999.

[150] R. Olfati-Saber. Cascade normal forms for underactuated mechanical systems.


In Proceedings of the 39th IEEE Conference on Decision and Control, volume 3,
pages 2162–2167, Sydney, NSW, Australia, 2000.
186 REFERENCIAS

[151] R. Olfati-Saber. Global stabilization of a flat underactuated system: the iner-


tia wheel pendulum. In Proceedings of the 40th Conference on Decision and
Control, volume 4, pages 3764–3765, Orlando, FL, USA, 2001.

[152] R. Olfati-saber. Nonlinear Control Of Underactuated Mechanical Systems with


Application to Robotics and Aerospace Vehicles. Ph.D. Thesis, MIT, Cambridge,
MA, 2001.

[153] R. Olfati-Saber and A. Megretski. Controller design for the beam-and-ball


system. In Proceedings of the 37th IEEE Conference on Decision and Control,
volume 4, pages 4555–4560, Tampa, FL, US, 1998.

[154] G. Oriolo and Y. Nakamura. Control of mechanical system with second-order


nonholomic constraints: Underactuated manipulators. In Proc. 30th IEEE Conf.
on Decision and Control, volume 3, pages 2398–2403, Brighton, England, 1991.

[155] G. Oriolo and Y. Nakamura. Free-joint manipulators: motion control under


second-order nonholonomic constraints. In Proc. IROS ’91. IEEE/RSJ Interna-
tional Workshop on Intelligent Robots and Systems, volume 3, pages 1248–1253,
1991.

[156] R. Ortega and E. Garcı́a-Canseco. Interconnection and damping assignment


passivity-based control: A survey. European Journal of Control, 10(5):432–450,
2004.

[157] R. Ortega, A. Lorı́a, P. J. Nicklasson and H. Sira-Ramirez. Passivity-based


Control of Euler-Lagrange Systems Mechanical, Electrical and Electromechani-
cal Applications. Springer-Verlag, 1998.

[158] R. Ortega and M. W. Spong. Adaptive control of robot manipulators: A tutorial.


Automatica, 25(6):877–888, 1989.

[159] R. Ortega, M. W. Spong, F. Gómez-Estern and G. Blankenstein. Stabilization


of a class of underactuated mechanical system via interconnection and damping
assignment. IEEE Transactions on Automatic Control, 47(8):1218–1233, 2002.
REFERENCIAS 187

[160] R. Ortega, A. van der Schaft and B. Maschke. Stability and Stabilization of Non-
linear Systems, volume 246 of LNCIS, chapter Stabilization of port-controlled
Hamiltonian systems via energy balancing, pages 239–260. Springer Berlin,
1999.

[161] R. Ortega, A. van der Schaft, B. Maschke and G. Escobar. Interconnection


and damping assignment passivity-based control of port-controlled hamiltonian
systems. Automatica, 38(4):585–596, 2002.

[162] R. Ortega, A. J. van der Schaft, I. Mareels and B. Maschke. Putting energy
back in control. IEEE Control Systems Magazine, 21(2):18–31, 2001.

[163] L. S. Pontryagin, V. G. Boltyansky, R. V. Gamkrelidze and E. F. Mishchenko.


The Mathematical Theory of Optimal Processes. New York: Wiley, 1962.

[164] N. Qaiser, N. Iqbal and N. Qaiser. Stabilization of the acrobot via multiple
sliding surface control. In IMCAS’07: Proceedings of the 6th WSEAS Inter-
national Conference on Instrumentation, Measurement, Circuits and Systems,
pages 175–180, Hangzhou, China, 2007.

[165] F. Rampazzo and H. Sussmann. Set-valued differentials and a nonsmooth ver-


sion of chow’s theorem. In Proceedings of the 40th IEEE Conference on Decision
and Control, 2001.

[166] C. K. Reddy, W. W. Whitacre and C. A. Woolsey. Controlled lagrangians


with gyroscopic forcing: an experimental application. In Proceedings of the
2004 American Control Conference, volume 1, pages 511 – 516, Boston, Mas-
sachusetts, USA, 2004.

[167] E. J. Routh. A Treatise on the Stability of a Given State of Motion. London:


Macmillan & Co., 1877.

[168] E. J. Routh. Dynamics of a system of rigid bodies., page 371. Dover, New
York,, 7th edition, 1960.
188 REFERENCIAS

[169] F. Salas, J. Aracil and F. Gordillo. Control de un péndulo invertido usando


métodos de diseño no lineales. In XXIV Jornadas de Automática., volume 24,
2003.

[170] R. Sepulchre, M. Janković and P. Kokotović. Constructive Nonlinear Control.


Springer-Verlag,, 1997.

[171] D. Seto and J. Baillieul. Control problems in super-articulated mechanical


systems. IEEE Transactions on Automatic Control, 39(12):2442–2453, 1994.

[172] J. Shen, A. K. Sanyal, N. A. Chaturvedi, D. S. Bernstein and N.H. McClamroch.


Dynamics and control of a 3D pendulum. In Proc. of the 43rd IEEE Conference
on Decision and Control, pages 323–328, Paradise Island, Bahamas, 2004.

[173] A. S. Shiriaev, H. Ludvigsen and O. Egeland. Swinging up the spherical pen-


dulum via stabilization of its first integrals. Automatica, 40(1):73–85, 2004.

[174] A. S. Shriaev, A. Pogromsky, H. Ludvigsen and O. Egeland. On global proper-


ties of passivity-based control of an inverted pendulum. Int. J. of Robust and
Nonlinear Control, 10:283–300, 2000.

[175] H. Sira-Ramı́rez and S. K. Agrawal. Differentially Flat Systems. Marcel Dekker,


New York, NY, USA, 2004.

[176] H. Sira-Ramı́rez and O. Llanes-Santiago. Sliding mode control of nonlinear me-


chanical vibrations. Journal of Dynamic Systems, Measurement, and Control,
122(4):674–678, 2000.

[177] J. Slotine and W. Li. Applied nonlinear control. Prentice Hall, Englewood Cliffs,
N.J., 1990.

[178] E. D. Sontag. Some new directions in control theory inspired by systems biology.
IEE Proceedings Systems Biology, 1(1):9–18, 2004.

[179] E. D. Sontag. Molecular systems biology and control. European journal of


control, 11(4-5):396–435, 2005.
REFERENCIAS 189

[180] E. D. Sontag. Molecular systems biology and control: A qualitative-quantitative


approach. In 44th IEEE Conference on Decision and Control, 2005 and 2005
European Control Conference. CDC-ECC apos;05., pages 2314–2319, Seville,
Spain, 2005.

[181] M. W. Spong. On the robust control of robot manipulators. IEEE Transactions


on Automatic Control, AC-37,(11):1782–1786, November 1992.

[182] M. W. Spong. Swing up control of the acrobot. In 1994 IEEE Int. Conf. on
Robotics and Automation, volume 3, pages 2356–2361, 1994.

[183] M. W. Spong. The swing up control problem for the acrobot. IEEE Control
Systems Magazine, 15(1):49–55, 1995.

[184] M. W. Spong. Energy based control of class of underactuated mechanical sys-


tems. In IFAC World Congress, San Francisco, CA, 1996.

[185] M. W. Spong. Control Problems in Robotics and Automation, volume 230,


chapter Underactuated mechanical systems, pages 135–150. Springer Berlin /
Heidelberg, London, UK, 1998.

[186] M. W. Spong and D. J. Block. The pendubot: a mechatronic system for control
research and education. In Proceedings of the 34th IEEE Conference on Decision
and Control, volume 1, pages 555–556, New Orleans, USA, 1995.

[187] M. W. Spong, P. Corke and R. Lozano. Nonlinear control inertial wheel pen-
dulum. Automatica, 37:1845–1851, 2001.

[188] M. W. Spong, S. Hutchinson and M. Vidyasagar. Robot Modeling and Control.


John Wiley & Sons, 2006.

[189] M. W. Spong and L. Praly. Control of underactuated mechanical systems using


switching and saturation. In Springer-Verlag, editor, Proceedings of the Block
island workshop on control using logic based switching, 1996.
190 REFERENCIAS

[190] M. W. Spong and M. Vidyasagar. Robot Dynamics and Control. John Wiley &
Sons, 1989.

[191] Ilaria Taurasi. Inverted pendulum studies for seismic attenuation. Surf final
report, California Institute of Technology, 2005.

[192] A. R. Teel. Global stabilization and restricted tracking for multiple integrators
with bounded controls. System & Control Letter, 18(3):165–171, 1992.

[193] A. R. Teel. Using saturation to stabilize a class of single-input partially linear


composite systems. In IFAC NOLCOS’92 Symposium, pages 269–374, 1992.

[194] A. R Teel. Semi-global stabilization of the ‘ball and beam’ using ‘output’ feed-
back. In Proceeding of the American Control Conference, San Francisco, CA,
USA, 1993.

[195] A. R. Teel. A nonlinear small gain theorem for the analysis of control system
with saturation. IEEE Transaction on Automatic. Control, 41(9):1256–1270,
1996.

[196] A. R. Teel and L Praly. Tools for semiglobal stabilization by partial state and
output feedback. SIAM Journal of Control and Optimization, 33:1443–1488,
1995.

[197] P. Tsiotras, M. Corless and M.A. Rotea. An l2 disturbance attenuation approach


to the nonlinear benchmark problem. In Proceedings of the American Control
Conference, 1995., volume 6, pages 4352–4356, Seattle, WA, USA, 1995.

[198] A. J. van der Schaft. L2 -Gain and Passivity Techniques in Nonlinear Control.
Springer-Verlag, Berlin, 2nd edition, 2000.

[199] M. Vidyasagar. Nonlinear systems analysis. SIAM, 2nd edition, 2000.

[200] A. Viguria, A. Prieto-Yerro, M. Fiacchini, R. Cano, F. Rubio, J. Aracil and


C. Canudas de Wit. Desarrollo y experimentación de un vehı́culo basado en
REFERENCIAS 191

péndulo invertido (PPCar). Revista iberoamericana de automática e informática


industrial (RIAI), 3(4):54–63, 2006.

[201] C. J Wan, D. S. Bernstein and V. T. Coppola. Global stabilization of the


oscillating eccentric rotor. In Proceedings of the 33rd IEEE Conference on
Decision and Control, volume 4, pages 4024–4029, Lake Buena Vista, FL, USA,
1994.

[202] Q. Wei, W. P. Dayawansa and W. S. Levine. Nonlinear controller for an inverted


pendulum having restricted travel. Automatica, 36(6):841–850, 1995.

[203] S. Weibel. Applications of qualitative methods in the nonlinear control of su-


perarticulated mechanical systems. Ph.D. Thesis, Boston University, Boston,
Massachusetts, 1997.

[204] W. Wenqing and F. Cheong. Using system dynamics to simulate the strategic
planning of the mobile commerce terminal (MCT) industry and mobile com-
merce diffusion. In International Conference on Mobile Business, 2005. ICMB
2005., pages 420–426, Sydney, Australia, 2005.

[205] M. Wiklund, A. Kristenson and K. J. Åström. A new strategy for swinging up


an inverted pendulum. In Proc. IFAC 12th World Congress, volume 9, pages
151–154, Sydney, Australia, 1993.

[206] J. C. Willems. Dissipative dynamical systems part i: General theory. Archive


for Rational Mechanics and Analysis, 45(5):321–351, 1972.

[207] J. C. Willems. 1696: the birth of optimal control. In Proceedings of the 35th
IEEE Decision and Control, volume 2, pages 1586–1587, Kobe, Japan, 1996.

[208] O. Wolkenhauer, M. Ullah, P. Wellstead and K . Cho. The dynamic systems


approach to control and regulation of intracellular networks. FEBS Letters,
579(8):1846–1853, 2005.
192 REFERENCIAS

[209] C. Woolsey, C. K. Reddy, A. M. Bloch, D. E. Chang, N. E. Leonard and J. E.


Marsden. Controlled lagrangian systems with gyroscopic forcing and dissipa-
tion. European Journal of Control, 10(5):478–496, 2004.

[210] C. Xu and X. Yu. Mathematical modeling of elastic inverted pendulum control


system. Journal of Control Theory and Applications, 2(3):281–282, 2004.

[211] R. Xu and Ümit Özgüner. Sliding mode control of a class of underactuated


systems. Automatica, 44(1):233–241, 2008.

[212] R. Yang, Y Kuen and Z. Li. Stabilization of 2-DOF spherical pendulum on


x-y table. In Proceedings of the 2000 IEEE International Conference on control
applications, pages 724–729, Anchogare, Alaska, USA, 2000.

[213] H. Ye, H. Wang and H. Wang. Stabilization of a PVTOL aircraft and an inertia
wheel pendulum using saturation technique. IEEE Transactions on Control
Systems Technology, 15(6):1143–1150, 2007.

[214] D. V. Zenkov, A. M. Bloch, N. E. Leonard and J. E Marsden. Matching and


stabilization of low-dimensional nonholonomic systems. In Proceedings of the
39th IEEE Conference on Decision and Control, volume 2, pages 1289–1294,
Sydney, NSW, Australia, 2000.

[215] J. Zhao and M. W. Spong. Hybrid control for global stabilization of the cart
pendulum system. Automatica, 37(12):1941–1951, 2001.

[216] Y. Zheng and Y. Jing. Fuzzy variable structure control for acrobot based on T-S
model. In 2005 IEEE International Conference Mechatronics and Automation,
volume 2, pages 842–846, 2005.

[217] F. Zonfrilli, D. Wollherr and Y. Nakamura. Walking control of the hu-


manoid UT-Theta. In Proceedings, 12th International Conference on Advanced
Robotics, 2005. ICAR ’05, pages 698–704, Seattle, WA, 2005.

También podría gustarte