Control NLV10
Control NLV10
Modelado de Sistemas No Lineales Control Optimo Cuadr atico Control Adaptativo con Modelo Referencial Control con Modos Deslizantes Control Backstepping Linealizaci on por Realimentaci on de Estados DVD: Programas en LabVIEW y MathScript Problemas de Dise no con Solucionario
II
Indice general
III
Prefacio 1. Introducci on 1.1. Estructura 1.2. Estructura 1.3. Estructura 1.4. Estructura General . . . . . . . . . . . . . . . . . para el Manipulador MR1 . . . . . . para los Manipuladores MRE y MRT del Sistema de Control del Tanque . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
IX
1 1 2 3 4 5 5 5 12 16 21 21 28 34 45 45 46 47 50 52 54 54 55 56 57 61 61 62 62 64
2. Modelado de Sistemas No Lineales 2.1. Modelado Empleando las Leyes de la F sica . . . . . . . . . . . . 2.1.1. Manipulador Rob otico de 1GDL . . . . . . . . . . . . . . 2.1.2. Manipulador Rob otico con Articulaci on El astica (MRAE) 2.1.3. Sistema Tanque de Agua . . . . . . . . . . . . . . . . . . 2.2. M etodo de Las Ecuaciones de Lagrange . . . . . . . . . . . . . . 2.2.1. Manipulador Rob otico Traslacional (MRT) . . . . . . . . 2.2.2. Manipulador Rob otico Esf erico (MRE) . . . . . . . . . . . 2.3. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3. Control Optimo 3.1. Conguraci on del Sistema de Control Optimo . . . . . . . . . . . . 3.2. Descripci on din amica del Sistema . . . . . . . . . . . . . . . . . . . 3.3. El Controlador PI Optimo . . . . . . . . . . . . . . . . . . . . . . . 3.4. El Observador No Lineal Multivariable . . . . . . . . . . . . . . . . 3.5. Procedimiento de Dise no . . . . . . . . . . . . . . . . . . . . . . . . 3.6. Aplicaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.6.1. Control Optimo del Manipulador Rob otico de 1GDL (MR1) 3.6.2. Control Optimo del Manipulador Rob otico Esf erico . . . . . 3.6.3. Control Optimo del Manipulador Rob otico Traslacional . . 3.7. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4. Control Adaptativo con Modelo Referencial 4.1. Conguraci on de un SCAMR . . . . . . . . . . . . 4.2. SCAMR para Sistemas No Lineales Multivariables 4.2.1. Dise no del SCAMR . . . . . . . . . . . . . 4.2.2. El Observador de Velocidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
VI
INDICE GENERAL 4.2.3. ZonaMuerta para Evitar Corrimiento de Par ametros . . . 4.2.4. Procedimiento de Dise no del SCAMR . . . . . . . . . . . . 4.3. SCAMR para Sistemas con Forma Asociada . . . . . . . . . . . . . 4.3.1. Formulaci on del Problema y la Ley de Control . . . . . . . 4.3.2. La Ley de Adaptaci on . . . . . . . . . . . . . . . . . . . . . 4.3.3. Procedimiento de Dise no . . . . . . . . . . . . . . . . . . . 4.4. Aplicaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.4.1. Control Adaptativo del Manipulador Rob otico Esf erico . . . 4.4.2. Control Adaptativo del Manipulador Rob otico Traslacional 4.4.3. Control Adaptativo del Manipulador Rob otico MR1 . . . . 4.5. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 65 67 67 69 70 70 70 71 73 75 77 77 81 81 81 82 84 85 85 86 88 90 91
5. Control por Modos Deslizantes 5.1. Conceptos B asicos . . . . . . . . . . . . . . . . . . . . . 5.2. Control Deslizante para Sistemas Multivariables . . . . . 5.2.1. El Sistema a Controlar . . . . . . . . . . . . . . . 5.2.2. La Supercie de Conmutaci on . . . . . . . . . . . 5.2.3. Dise no de la Fuerza de Control Multivariable . . 5.3. Procedimiento de Dise no . . . . . . . . . . . . . . . . . . 5.4. Aplicaciones . . . . . . . . . . . . . . . . . . . . . . . . 5.4.1. Control Deslizante del Manipulador Esf erico . . . 5.4.2. Control Deslizante del Manipulador Traslacional 5.4.3. Control Deslizante del Sistema Tanque con Agua 5.4.4. Control Deslizante del Manipulador MR1 . . . . 5.5. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
6. Control Backstepping 6.1. Introducci on . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.2. Caracter sticas del Modelo . . . . . . . . . . . . . . . . . . . 6.3. Dise no Backstepping No Lineal . . . . . . . . . . . . . . . . 6.4. Procedimiento de Dise no Backstepping . . . . . . . . . . . . 6.5. Aplicaciones . . . . . . . . . . . . . . . . . . . . . . . . . . 6.5.1. Control Backstepping del Manipulador Esf erico . . . 6.5.2. Control Backstepping del Manipulador Traslacional 6.5.3. Control Backstepping del Sistema Tanque con Agua 6.5.4. Control Backstepping del Manipulador MR1 . . . . 6.6. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7. Linealizaci on por Realimentaci on de Estados 7.1. Herramientas de la Geometr a Diferencial . . . . . . . . . 7.1.1. Derivadas y Corchetes de Lie . . . . . . . . . . . . 7.1.2. Difeomorsmos y Transformaci on de Coordenadas 7.1.3. El Teorema de Frobenius . . . . . . . . . . . . . . 7.2. Linealizaci on por Realimentaci on. Caso: SISO . . . . . . . 7.2.1. Condiciones para Linealizaci on . . . . . . . . . . . 7.2.2. El Grado Relativo de un Sistema SISO . . . . . . . 7.2.3. Forma Normal SISO con Linealizaci on Exacta . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
93 . 93 . 96 . 97 . 98 . 98 . 98 . 99 . 100 . 101 . 103 107 107 108 109 109 110 110 112 113
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
INDICE GENERAL 7.2.4. La Ley de Control SISO para Linealizaci on . . . . Linealizaci on por Realimentaci on: Caso MIMO . . . . . . 7.3.1. Modelando Sistemas MIMO Cuadrados . . . . . . 7.3.2. Grado Relativo Total . . . . . . . . . . . . . . . . . 7.3.3. Forma Normal MIMO para Linealizaci on Exacta . 7.3.4. La Ley de Control MIMO Desacoplada . . . . . . . Observadores No Lineales con Polos Prescritos . . . . . . 7.4.1. Observador SISO No Lineal con Polos prescritos . 7.4.2. Observador MIMO No Lineal con Polos Prescritos Procedimiento de Dise no . . . . . . . . . . . . . . . . . . . Aplicaciones . . . . . . . . . . . . . . . . . . . . . . . . . . 7.6.1. Control por Linealizaci on del Manipulador MR1 . 7.6.2. Control por Linealizaci on del Manipulador MRE . Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
VII
7.3.
7.4.
7.5. 7.6.
7.7.
114 115 115 116 117 118 120 121 123 124 125 125 125 127
A. El M etodo Directo de Lyapunov A.1. Estabilidad v a el M etodo Directo de Lyapunov A.1.1. Conceptos de Estabilidad . . . . . . . . A.1.2. Funciones de Lyapunov . . . . . . . . . A.1.3. Teoremas de Estabilidad de Lyapunov . A.1.4. Teoremas del Conjunto Invariante . . . . . Bibliograf a Indice alfab etico
Prefacio
Esta publicaci on est a dirigida a todos los profesionales, cient cos, especialistas y estudiantes interesados en familiarizarse con el dise no e implementaci on de sistemas de control no lineales multivariables operando en tiempo real. El libro presenta y discute la simulaci on e implementaci on en tiempo real de varias conguraciones de sistemas de control no lineal con el prop osito de validar los procedimientos de dise no desarrollados en los cap tulos. Los diversos estudios de simulaci on y los programas de adquisici on de datos y control en tiempo real han sido elaborados con LabVIEW, versi on 8.5. El CD adjunto a esta publicaci on contiene todos los archivos desarrollados en este libro. Tales programas de control permiten sintonizar en l nea y en forma interactiva los par ametros de los algoritmos de control y visualizar en tiempo real las variables en juego del sistema. Se ha dado enfasis a la visualizaci on de las variables de control y de salida con la nalidad de observar en linea que las se nales de salida controladas hacen un seguimiento de las se nales de referencia deseadas, cumpliendo las especicaciones de dise no preestablecidas. Los procedimientos de dise no e implementaci on de los sistemas de control no lineal desarrollados en este libro se pueden aplicar a una gran clase de procesos no lineales, tales como brazos rob oticos (manipuladores), aeronaves de alto rendimiento, veh culos espaciales, procesos qu micos, motores de corriente alterna, entre otros. Al nal de cada cap tulo se propone un conjunto de problemas relacionados con el modelado, simulaci on y dise no del sistema de control no lineal para diversos sistemas. Esta publicaci on emplea el control en tiempo real de sistemas prototipo para vericar mediante experimentaci on la efectividad de los sistemas de control dise nados. Tales sistemas prototipos son: brazos rob oticos de uno y dos grados de libertad y el sistema tanque de agua. En los brazos rob oticos el objetivo de control es lograr que cada brazo alcance posiciones angulares de referencia deseadas. Dichas referencias pueden ser tambi en variantes con el tiempo (problema de seguimiento). En el caso del sistema tanque de agua, el objetivo de control es que la temperatura y nivel del l quido en el tanque sigan a referencias constantes. Este libro est a organizado en los cap tulos siguientes: Cap tulo 1: Modelado de Procesos No Lineales. En este cap tulo se deducen los modelos matem aticos que representan la din amica de los sistemas a ser controlados en tiempo real. Tales modelos matem aticos son necesarios para dise nar las leyes de control no lineal. Cap tulo 2: Implementaci on en Tiempo Real. Este cap tulo describe las
Prefacio
estructuras en hardware de los sistemas de control no lineal multivariables implementados. Cap tulo 3: Control Optimo . El sistema de control optimo considerado combina un proceso no lineal pero linealizable, un controlador de realimentaci on de estados proporcional-integral y un observador no lineal para estimar los estados del proceso. El objetivo del sistema de control optimo es determinar una funci on de fuerza capaz de minimizar la diferencia entre el vector de salida del proceso y el vector de trayectorias deseadas, a pesar de la presencia de disturbios estoc asticos en el sistema. Cap tulo 4: Control Adaptativo con Modelo Referencial. Este sistema de control no lineal se compone principalmente de cuatro partes: el modelo de referencia, el controlador adaptativo, el proceso no lineal y el el mecanismo de adaptaci on. El modelo de referencia es un modelo din amico auxiliar empleado para especicar la respuesta deseada del sistema, mientras que el mecanismo de adaptaci on es un conjunto de bloques interconectados y empleados para implementar la ley de adaptaci on, la cual modica los par ametros del controlador adaptativo de forma tal que el sistema de control adaptativo permanezca estable y que el error de seguimiento converja a cero a pesar de que existan cambios reales en los par ametros del proceso y disturbios externos. El m etodo directo de Liapunov se emplea en este contexto para garantizar estabilidad asint otica en el sistema dise nado. Cap tulo 5: Linealizaci on de la Realimentaci on. Los m etodos de la geometr a diferencial se pueden aplicar a sistemas no lineales para determinar si tales sistemas son linealizables por realimentaci on; esto es, si la descripci on din amica de un sistema en particular se puede hacer que parezca lineal despu es de que se le haya aplicado una transformaci on de coordenadas apropiada y una realimentaci on no lineal de estados. Este cap tulo presenta el m etodo para llevar a cabo la linealizaci on de la realimentaci on con el prop osito de dise nar una ley de control desacoplada. Un observador no lineal con asignaci on de polos se emplea tambi en para estimar los estados del sistema. Cap tulo 6: Control con Modos Deslizantes. En un sistema de control con modos deslizantes la descripci on del sistema puede ser imprecisa. La metodolog a aplicada en este tipo de control incluye una ley de control de realimentaci on no lineal que est a conmutando en forma discontinua sobre una supercie que pertenece al espacio de estado del sistema. Si alguna trayectoria de estado originada en esta supercie, en respuesta al comportamiento natural de la din amica del sistema a lazo abierto, se trata de desviar de la supercie especicada, entonces se deben aplicar acciones de control para hacer retornar a dicha trayectoria a su estado anterior. Es posible modicar la ley de control adecuadamente a n de obtener acciones de control m as moderadas. FALTAN AGRADECIMIENTOS
XI
Cap tulo 1
Introducci on
El control no lineal de sistemas multivariables es un campo de la Ingenier a de Control que ha logrado la madurez gracias a sus innumerables y variadas aplicaciones industriales exitosas. Este hecho ha sido posible por que el control no lineal tiene a disposici on una diversidad de m etodos de an alisis y s ntesis de sistemas de control. En contraposici on con los sistemas de control lineales, un sistema de control no lineal puede operar en grandes rangos de operaci on, a pesar de la presencia de incertidumbres en el modelo din amico del sistema y considerables perturbaciones actuando sobre el sistema controlado. Los sistemas de control no lineales tambi en son capaces de compensar no linealidades inherentes al sistema controlado tales como fricci on de Coulomb, saturaci on, zona muerta, hist erisis, juegos en los engranajes (backlash en ingl es), entre otras. Cabe anotar que todos los sistemas a controlar son no lineales por naturaleza. Los m etodos de dise no de sistemas de control no lineal multivariable a desarrollar en los siguientes cap tulos son: control optimo cuadr atico, control adaptativo con modelo referencial, control con modos deslizantes, control backstepping (terminolog a en ingl es que tambi en se usa en castellano) y control por linealizaci on de la realimentaci on. Esta publicaci on emplea el control en tiempo real de los sistemas siguientes: 1) Manipulador rob otico de 1GDL (1 Grado de Libertad). 2) Manipulador Rob otico Espacial (MRE). 3) Manipulador Rob otico Traslacional (MRT). 4) Sistema Tanque de Agua
1.1.
Estructura General
La estructura mostrada en la gura 1.1 se emplea para la implementaci on en tiempo real de los sistemas de control a ser desarrollados en los cap tulos siguientes. Tal gura nos informa que los algoritmos de control y las se nales deseadas o de referencia se implementan en la computadora personal. Los algoritmos de control implementados en este trabajo emplean el lenguaje del software LabVIEW, versi on 8.5. La interfaz entre la PC y el usuario es una DAQ (Data Acquisition Card) o tarjeta de adquisici on de datos PCI 6229 de NI (National Instrument). Las se nales medidas y generadas para cada sistema de control se discuten en las siguientes secciones.
Introducci on
Computadora Personal DAQ PCI 6229 Salidas Analgicas AO1 AO4 Entradas Analgicas AI00 AI31 Entradas Programables P1
Actuador
Sistema
Medicin
Armadura
Fig. 1.2: Sistema de control en tiempo real para el manipulador rob otico MR1.
1.2.
La gura 1.2 muestra la estructura para controlar la posici on angular del manipulador rob otico de 1GDL (MR1). El sistema de control requiere de la medici on de la posici on angular, la cual se logra gracias al sensor de posici on en cuadratura (encoder) que posee el servomotor D.C. (Direct Current) en su eje. La se nal medida ingresa por uno de los dos contadores que posee la DAQ PCI 6229. Estos contadores se ubican en sus terminales PFI (Programmable Function I/O) y se denominan entradas P1. La se nal medida y el algoritmo de control se procesan en la computadora personal empleando el software LabVIEW previamente instalado. Los detalles del c odigo de programaci on en LabVIEW se encuentran en los listados de los respectivos programas que forman parte del CD (Compact Disk) que se adjunta a esta publicaci on.
Computadora Personal DAQ PCI 6229 Salidas Analgicas AO1 AO4 Entradas Analgicas AI00 AI31 Entradas Programables P1
Fig. 1.3: Sistema de control en tiempo real para los manipuladores MRE y MRT.
La se nal de control generada en la computadora personal es una se nal sin la capacidad de hacer girar al servomotor D.C. Por esta raz on se la potencia usando un amplicador PWM (Pulso Width Modulation). La se nal que sale del amplicador constituye el voltaje de control que que ingresa a los terminales de la armadura del servomotor. Los amplicadores usados son Galil FAAAALTAAA!!!!!!
1.3.
La estructura para controlar las posiciones angulares de los dos brazos de los manipuladores rob oticos esf erico (MRE) y traslacional (MRT) se muestra en la Fig. 1.3. Observar que el sistema de control en tiempo real requiere de la medici on simult anea de dos posiciones angulares para cada manipulador, la cual se logra mediante los sensores de posici on en cuadratura que posee en su eje cada uno de los servomotores. Las se nales medidas ingresan a los dos contadores que posee la DAQ PCI 6229. Se mencion o que estos contadores se ubican en las denominadas entradas P1. Las se nales medidas y el algoritmo de control multivariable se procesan en la computadora personal empleando el software LabVIEW. Los detalles del c odigo de programaci on en LabVIEW se pueden ver en los listados de los respectivos programas que forman parte del CD que se adjunta a este libro. Las se nales de control generada en la computadora personal son se nales sin la potencia requerida para hacer girar al servomotor D.C. Por esta raz on se emplean dos amplicadores PWM (Pulso Width Modulation) para incrementar la potencia de las se nales. Las se nales que salen de los amplicadores son los voltajes de control que que ingresan a los terminales de armadura de los servomotores. Los amplicadores usados son Galil FAAAALTAAA!!!!!!
Introducci on
1.4.
La gura 1.4 muestra La estructura para controlar simult aneamente o por separado el nivel y la temperatura del agua contenido en el tanque. Los sistemas de control a realizarse requieren de la medici on del nivel y de la temperatura del agua. La medici on de nivel se logra empleando un transmisor de presi on Valcom de rango 0 a 1.25 m, mientras que la medici on de la temperatura emplea una termoresistencia de rango 0 a 100 o C con sensor Pt 100. La medici on de nivel debe ingresar a la computadora personal a trav es de la tarjeta de adquisici on de datos en un rango de voltaje adecuado. Para ello se emplea el convertidor e indicador de nivel Sar tipo P, el cual convierte los 4 a 20 mA que proporciona el transmisor de nivel Valcom tipo P a una se nal de voltaje de 0 a 10 V, que equivale al rango de 0 a 1.25 m de medici on de nivel. Tal transmisor sirve tambi en como indicador digital del nivel. De mismo modo, la se nal que proporciona la termoresistencia se convierte al rango de voltaje de 0 a 10 V empleando para ello el transmisor de temperatura Valcom tipo T, el cual convierte el rango de temperatura de 0 a 100 o C a una se nal de voltaje de 0 a 10 V. Tal convertidor sirve tambi en como indicador digital de la temperatura.
Fig. 1.4: Sistema de control en tiempo real para el tanque. El algoritmo de control grabado en la PC procesa tal medici on y genera dos se nales de control. Estas se nales salen a trav es de dos de las cuatro salidas anal ogicas que posee la tarjeta DAQ PCI 6229. La primera se nal de rango 0 a 10 V, va directamente a la v alvula mot orica Sauter AVM104S, la cual sirve para controlar el ujo de agua de entrada al tanque. La segunda se nal de rango 1 a 5 V, sirve como entrada al controlador de potencia SPC1-35, el cual genera la corriente adecuada para alimentar a la resistencia el ectrica con el prop osito de producir el calor necesario para calentar el agua del tanque a una temperatura deseada.
Cap tulo 2
2.1.
2.1.1.
El manipulador rob otico de 1GDL (1 Grado De Libertad) mostrado en la gura 2.1 es uno de los sistemas prototipo a ser utilizado en esta publicaci on para validar mediante experimentaci on algunos de los sistemas de control no lineal desarrollados en
esta publicaci on. Este sistema se compone de un subsistema el ectrico y un subsistema mec anico. El subsistema el ectrico comprende un servomotor D.C. (Direct Current) con codicador (encoder) de posici on incorporado, el cual se emplea para medir la posici on angular del brazo del manipulador en cada instante de tiempo. El servomotor posee una caja de engranajes para reducir la velocidad en su eje de salida; de de esta manera se facilita el control de posici on del manipulador. El subsistema mec anico consiste de un brazo accionado por el torque rotacional generado en el eje de salida del servomotor D.C. (el actuador). En el extremo libre del brazo rob otico se puede acoplar un efector nal, el cual puede ser una pinza para asir objetos, una herramienta para soldar, una herramienta para pintar, etc. En nuestro caso usaremos una pinza con dos grados de libertad: un grado para rotar la pinza y otro para abrirla y cerrarla. para prop ositos de modelado, vamos a suponer que el efector nal y su carga se pueden modelar mediante una masa mh variable. La tabla 2.1 describe las variables y los valores de los par ametros del manipulador mostrado en la gura 2.1. El manipulador de 1GDL es del tipo SISO (Single Input Single Output) ya que solo posee una entrada: el voltaje de control u aplicado a la armadura del servomotor, y una salida: la posici on angular del brazo.
La
ia
m m
mh L mb L L
+ _
u KA
+
vb
N1 111 000 000 111 000 111 000 111 1111 0000 000 111 0000 1111 B m Tg1 Tm 000 111 Jm 000 111 N2 Tg2 Bg Jg
mh
Ra
BL T L JL
Modelo del Subsistema Mec anico Para modelar el subsistema mec anico del manipulador empleamos la segunda ley de Newton para los movimientos lineal y rotacional. La aplicaci on de esta segunda ley se traduce en una ecuaci on de balance mec anico. Con respecto a la gura 2.1, la ecuaci on de balance mec anico en el eje del servomotor articulado al primer engranaje se formula como: m + Bm m + Tg1 Tm = Jm m = dm dt
2 m = d m dt2
(2.1)
donde Jm y Bm representan el momento de inercia y la constante de fricci on viscosa del rotor respectivamente, Tm es el torque del servomotor, Tg1 es el torque de reacci on debido al primer engranaje y m es la posici on angular en el lado del motor. Para los
Tabla 2.1: Par ametros y variables del brazo rob otico de 1 GDL. S mbolo u KA Va Ra La ia Km Tm TL L Tg 1 Tg 2 Jm Jg JL Bm Bg BL mh mb L rh Vb Kb g N1 , N2 n m m Kw Descripci on Voltaje de entrada al sistema Ganancia del amplicador Voltaje de armadura Resistencia de armadura Inductancia de armadura Corriente de armadura Constante del torque motor Torque motor Torque de carga Torque causado por pesos de la carga Torque de entrada a los engranajes Torque de salida de los engranajes Inercia del motor Inercia de los engranajes Inercia de la carga Constante de fricci on del motor Constante de fricci on en engranajes Constante de fricci on en la carga Masa del efector nal Masa del brazo Longitud del brazo Distancia al centro de masa del efector Voltaje contraelectromotriz Constante contraelectromotriz Aceleraci on de la gravedad o N de dientes de los engranajes Relaci on de engranajes (n = N2 /N1 ) Posici on angular del motor Posici on angular de la carga Velocidad angular de la carga Velocidad angular del motor Constante de elasticidad Valor 8.5 3.5 0.004 0.0436 V H A N-m/A N-m N-m N-m N-m N-m kg-m2 kg-m2 kg-m2 N-m/rad/s N-m/rad/s N-m/rad/s kg kg m m V V/rad/s m/s2 Unidades V
0.00059 0.066 0.00014 0.0124 0.0023 0.1 0.4 0.25 0.02 0.0565 9.81 N2 > N1 18.5
m = n 0.052
donde N1 y N2 es el n umero de dientes de los engranajes y n > 1 es la relaci on entre ellos. Para formular la ecuaci on (2.2) se ha tenido en cuenta que el espacio angular recorrido por el engranaje de menor radio es n veces mayor que el espacio recorrido por el engranaje de radio mayor. Por otra parte, el principio de la conservaci on de la energ a establece que el trabajo realizado por el engranaje de la izquierda debe ser igual al trabajo realizado por el engranaje de la derecha, es decir: Tg2 = Tg1 m = Tg1 n; Tg2 = nTg1 (2.3)
donde Tg2 es el torque de reacci on debido al segundo engranaje. El balance mec anico en el eje articulado al brazo del manipulador produce: + Bg + TL Tg2 = Jg (2.4)
donde Jg y Bg representan el momento de inercia y la constante de fricci on viscosa de la caja de reducci on respectivamente. El torque de carga TL se formula como (ver gura 2.2): + BL + L TL = JL L L = mb g sen + mh g (L + rh )sen = Q sen 2 L Q = mb g + mh g (L + rh ) 2 (2.5) (2.6)
donde JL y BL representan el momento de inercia y la constante de fricci on viscosa de la carga no lineal (brazo m as efector nal), g es la constante gravitacional, mb y mh denotan las masas del brazo y del efector nal (esta masa tambi en incluye la masa de la carga en el efector) respectivamente, y rh denota la distancia desde el extremo del brazo al centro de masa de mh . Para nes pr acticos se puede asumir que rh es despreciable con respecto a la longitud L del brazo. Notar en (2.6) que el torque L se debe a las fuerzas ejercidas por los pesos del brazo y de la esfera. As , el torque L sen mb g L sen es el producto del peso m g del brazo por su brazo de palanca b 2 2 , mientras que el torque mh g (L + rh )sen es el producto del peso mb g del efector por su brazo de palanca (L + rh )sen. El momento de inercia JL de la carga es la suma del momento de inercia del brazo Jb m as el momento de inercia del efector Jh . Por otra parte, el teorema de los ejes paralelos, establece que el momento de inercia de una masa m alrededor de un eje de rotaci on que no pasa por su C.M. est a dado por: J = Jo + m a2 (2.7)
donde Jo es el momento de inercia de m alrededor del eje de rotaci on que pasa por su centro de masa y a es la distancia entre los dos ejes. Asumiendo que la masa mb del brazo se concentra en su C.M., su momento de inercia con relaci on a un eje perpendicular que pasa por su C.M. es [8]: Jbo = 1 mb L2 12 (2.8)
rh L _ 2 mhg L _ 2 mb g L
Fig. 2.2: Brazo del manipulador rob otico de 1GDL. Considerando que la masa del brazo est a distribuida a lo largo de su longitud y aplicando el teorema de los ejes paralelos, el momento de inercia Jb con respecto al punto de articulaci on se formula como: Jb = Jbo + mb L 2
2
1 = mb L2 3
(2.9)
Del mismo modo, asumiendo que la masa mh del efector est a concentrada en su C.M., entonces: Jh = Jho + mh (L + rh )2 (2.10) donde Jho es el momento de inercia del efector con relaci on a un eje de rotaci on que pasa por su C.M. Si consideramos por ejemplo, sin perder generalidad, que el efector es una masa esf erica de radio rh , su momento de inercia alrededor de un eje de rotaci on que coincide con su di ametro [8] es: 2 2 Jho = mh rh 5 (2.11)
Empleando (2.5), (2.6), (2.4), (2.3) y (2.2) en (2.1) y operando se obtiene: + Beq + L = Jeq nTm = Jeq + Beq + Q sen donde: Jeq = n2 Jm + Jg + JL Beq = n2 Bm + Bg + BL Las expresiones de Q, Jh y Jb (tener en cuenta que JL = Jh + Jb ) se dan en (2.6), (2.10) y (2.8) respectivamente. Modelo del Subsistema El ectrico El voltaje de armadura Va viene expresado por (ver la descripci on de las variables y par ametros en la Tabla 2.1): Va = ia Ra + La dia + Vb dt (2.13) (2.12)
10
donde ia , Ra y La son la corriente, la resistencia y la inductancia en la armadura del servomotor respectivamente, y Vb es el voltaje de fuerza contraelectromotriz gobernado por la relaci on: Vb = Kb m = Kb n = Kb n (2.14)
donde Kb es la constante de fuerza contra-electromotriz y est a relacionado con la velocidad angular m del motor. El voltaje de armadura Va es: Va = KA u donde KA es la ganancia del amplicador. Conversi on de Energ a El ectrica en Mec anica Sabemos que el torque motor Tm (energ a mec anica) es proporcional a la corriente de armadura ia (energ a el ectrica): + Beq + L Tm = Km ia = T Jeq (2.16) (2.15)
donde Km es la constante del motor. Reemplazando (2.12) en ( 2.16) se obtiene la siguiente ecuaci on de conversi on de energ a el ectrica a energ a mec anica: + Beq + L nKm ia == Jeq Por otra parte, igualando (2.13) con (2.15) obtenemos: dia KA Kb n Ra = u ia dt La La La Empleando (2.16) en (2.12) y despejando = d/dt obtenemos: Beq d Q nKm = sen + ia dt Jeq Jeq Jeq Ecuaci on de Estado del Sistema MR1 con La = 0 Las ecuaciones (2.18) y (2.19) describen el modelo no lineal del sistema de tercer orden. Eligiendo en dichas ecuaciones como variables de estado: x1 = (posici on (velocidad angular) y x3 = ia (corriente de armadura), se obtiene: angular), x2 = x 1 = x2 x 2 = x 3 Beq Q nKm senx1 x2 + x3 Jeq Jeq Jeq nKb Ra KA = x2 x3 + u La La La (2.19) (2.18) (2.17)
(2.20)
2.1 Modelado Empleando las Leyes de la F sica Ecuaci on de Estado del Sistema MR1 con La =0
11
En la Tabla 2.1 podemos observar que la inductancia de armadura La del servomotor es bastante peque na, de modo tal que puede despreciarse sin que se pierda considerable exactitud en los resultados. Considerando el producto x 3 La = 0 en la tercera ecuaci on de (2.20) y despejando la corriente de armadura x3 resulta: x3 = KA nKb u x2 Ra Ra (2.21)
Reemplazando (2.21) en la segunda ecuaci on de (2.20), se obtiene la ecuaci on de estado no lineal de orden dos del manipulador: x 1 = x2 x 2 = a1 sin x1 a2 x2 bu donde: a1 = Q Jeq a2 = Beq Ra + n2 Km Kb Jeq Ra b= nKm KA Jeq Ra (2.22)
Modelo de Lagrange del Sistema MR1 con La =0 La ecuaci on (2.16) tiene la forma: (2.12): + Beq + L nKm ia = Jeq Si despreciamos la inductancia La en (2.18), entonces el producto La cero. Por consiguiente: Ra ia 0 = KA u Kb n
dia dt
iguala a
Combinando las dos u ltimas ecuaciones se obtiene el denominado modelo din amico de Lagrange: + P +d=u M (2.23) donde: M= Jeq Ra nKb + nKm KA KA P = Beq Ra nKm KA d= Ra Q sin nKm KA
Forma Asociada del Sistema MR1 con La =0 de (2.23) resulta: Despreciando la inductancia de armadura La y despejando d + 1 u = P M M M Reemplazando las expresiones de M , P , d y simplicando se obtiene la llamada forma asociada del sistema MR1: + h donde: h= Jeq Ra + n2 Km Kb nKm KA 1 = Beq Ra nKm KA 2 = Ra Q nKm KA f1 = f2 = sin
2 i=1
+ 1 f1 + 2 f2 = u i fi = h
(2.24)
12
Forma Asociada del Sistema MR1 con La = 0 Denamos y = y x = [ y y y y (3) ]. Derivando (2.19) se obtiene: Beq d3 y Q nKm dia = cos y y y + 3 dt Jeq Jeq Jeq dt Reemplazando (2.18) en (2.25) se obtiene: Beq d3 y Q nKm K A n2 Km Kb nKm Ra = cos y y y + u y ia 3 dt Jeq Jeq Jeq La Jeq La Jeq La (2.26) (2.25)
Despejamos ia de ( 2.19), la reemplazamos en (2.26) y luego reordenamos la ecuaci on resultante para obtener la siguiente forma asociada del sistema MR1:
4
h y (3) +
i=1
i fi (x) = u
(2.27)
donde: h= 2 =
Jeq La nKm KA
1 =
3 = f2 = y
1 meq = m + mH 2
f3 = y cos y
2.1.2.
La gura 2.3 muestra el Manipulador Rob otico con Articulaci on El astica (MRAE) de 1GDL. El efecto del acoplamiento el astico entre el eje de salida del servomotor con el brazo (o eslab on) del MRAE, se puede modelar mediante un resorte rotacional con constante de elasticidad Kw . En la gura 2.3, u denota el voltaje de entrada, (la salida del sistema) es la posici on angular del brazo de longitud L y masa mb , m representa la posici on angular del eje del actuador (el servomotor DC) antes de la caja de reducci on. Al extremo del brazo se puede articular un efector nal, como en el caso del manipulador de 1GDL. La tabla 2.1 tambi en describe las variables y los valores de los par ametros del sistema mostrado en la gura 2.1. Ecuaciones Din amicas del MRAE El balance mec anico en el eje del servomotor articulado al primer engranaje se expresa como: m + Bm m + Tg1 Tm = Jm
13
La
ia
m m
mh
mh
+ _
u KA
+ _
vb
N 111 000 L 000 1 111 000 111 mb L Kw 000 111 111 000 000 111 1 0000 1111 00 11 000 111 00 1 0 1 0000 00 11 1111 B m 0 1 0 1 0000 1111 00 11 L Tg1 Tm 01 1 0 0000 1111 00 11 000 111 Jm 0000 00 11 B L 1111 000 111 N 2 T Bg g2 Jg TL J L
Ra
donde Jm y Bm representan el momento de inercia y la constante de fricci on viscosa del rotor, Tm es el torque del servomotor y Tg1 es el torque de reacci on debido al primer engranaje. El balance mec anico del eje articulado a la carga se expresa como: Tg2 = Jg m m + Bg + Kw n n m n
m en donde Kw n es el torque originado por el acoplamiento el astico, Tg2 es el torque debido al segundo engranaje, n = N2 /N1 denota la relaci on de transmisi on de los engranajes, y Jg y Bg representan el momento de inercia y la constante de fricci on viscosa de la caja de reducci on respectivamente. Asumiendo engranajes ideales, la conservaci on de la energ a requiere que el trabajo realizado por cada engranaje debe de ser el mismo, a saber: m Tg1 m = Tg2 n Empleando las relaciones anteriores, la ecuaci on que gobierna el torque servomotor se formula como:
Tm =
Jeq n
m n
Beq n
m n
Kw n
m n
(2.28)
Jeq = n2 Jm + Jg
Beq = n2 Bm + Bg
La ecuaci on que gobierna la din amica del brazo del manipulador se puede expresar como: m + BL + 1 mb gLsen + mh gLsin Kw = JL (2.29) n 2 donde JL y BL representan el momento de inercia y la constante de fricci on viscosa de la carga no lineal (brazo m as efector), g es la constante gravitacional, mb y mh (esta masa tambi en incluye la masa de la carga) denotan la masa del del brazo y del efector respectivamente y, 1 2 mb gLsen y mh gLsin son los torques debido a los pesos del brazo y del efector respectivamente. Los momentos de inercia JL = Jh + Jb ,
14
asumiendo que las masas mh y mb se concentran en sus respectivos C.M., se formulan en las ecuaciones (2.9) y (2.10). Para completar el modelado de la parte el ectrica del sistema MRAE, podemos aseverar que: dia Ra ia + La + Vb = KA u (2.30) dt donde KA es la ganancia del amplicador y Vb es el voltaje de la fuerza contra electromotr z y responde a la relaci on: m Vb = Kb (2.31)
donde Kb es la constante de fuerza contra electromotriz. El torque servomotor Tm es tambi en proporcional a la corriente ia , es decir: Tm = Km ia donde Km es la constante del servomotor. Modelo de Lagrange del MRAE Las ecuaciones (2.28) y (2.29) se pueden reordenar en forma matricial, con el prop osito de obtener el denominado modelo din amico de Lagrange del sistema MRAE: T = H q + Cq +d (2.33) donde: Tm 0 =
Jeq n
(2.32)
0 JL
m n
Beq n
0 BL
m n
Kw n
m n
d2
d2 =
1 mb + mh Lg sin Kw 2
m n
Despreciando la inductancia de armadura La en (2.30), y despejando ia se obtiene: ia = KA Kb m + u Ra Ra (2.34) el modelo de Lagrange (2.35) + d1 d2 m n (2.36)
Sustituyendo ia en Tm = Km ia de (2.33) y despejando u, toma una nueva forma: u = M q + Pq +d m m u m11 0 p 0 11 n n = + 0 0 JL 0 BL m11 = Ra Jeq nKA Km p11 = Ra Beq nKb + KA nKA Km d1 =
Ra Kw nKA Km
2.1 Modelado Empleando las Leyes de la F sica Modelo del MRAE en el Espacio de Estado
15
, x3 = m /n, x4 = Seleccionando como variables de estado: x1 = , x2 = m /n, y x5 = ia , entonces el vector de estado del sistema es de orden 5. Luego, las ecuaciones (2.28), (2.29) y (2.30) (sin despreciar la inductancia La ) producen la siguiente ecuaci on de estado no lineal: f1 (x, u) x 1 f2 (x, u) x 2 = 3 x (2.37) = f (x, u) = f3 (x, u) x x f4 (x, u) 4 f5 (x, u) x 5 f1 (x, u) = x2 Kw BL Kw Lg mb f2 (x, u) = x1 x2 + x3 + mh sen x1 JL JL JL JL 2 f3 (x, u) = x4 Beq Kw Kw nKm f4 (x, u) = x1 x3 x4 + x5 Jeq Jeq Jeq Jeq nKb Ra KA f5 (x, u) = x4 x5 + u La La La donde hemos usado el hecho de que x 1 = x2 y x 3 = x4 . Si la salida del sistema es y = , entonces la ecuaci on de salida del MRAE resulta: y = h(x) = Cx = [1 0 0 0 0] x (2.38)
Despreciando la inductancia de armadura La en (2.37), lo que equivale a eliminar un elemento almacenador de energ a independiente (por consiguiente, eliminar una variable de estado), entonces: La x 5 = 0 = nKb x4 Ra x5 + KA u Reemplazando x5 en la cuarta ecuaci on de no lineal de orden 4: x 1 x 2 = x 3 x 4 x5 = nKb KA x4 + u Ra Ra
(2.37), se obtiene una ecuaci on de estado f1 (x, u) f2 (x, u) (2.39) f3 (x, u) f4 (x, u)
f1 (x) = x2 Kw BL Kw Lg mb f2 (x) = x1 x2 + x3 + mH sin x1 JL JL JL JL 2 f3 (x) = x4 Kw n2 Km Kb Beq nKm KA Kw x1 x3 + x4 + u f4 (x) = Jeq Jeq Jeq Ra Jeq Jeq Ra La salida del sistema en este caso se expresa como: y = h(x) = Cx = [1 0 0 0] x (2.40)
16
2.1.3.
El sistema tanque de agua estudiado aqu se muestra en la gura 2.4. En este sistema, el agua fr a que se env a al tanque se calienta en forma controlada. El agua calentada puede ser usado luego por los consumidores. Este sistema es multivariable porque posee dos entradas y dos salidas. Las variables de entrada (las fuerzas de control) son el ujo de agua de entrada al tanque y el calor suministrado al agua mediante una resistencia el ectrica. Las variables de salida (las se nales controladas) son el nivel del liquido en el tanque y la temperatura de salida del agua calentada. ametros del sistema tanque La tabla 2.2 describe las variables y los valores de los par de agua.
i 0 qi 1
1 0 0 1
1 0 0 1 0 1 0 1 0 1 H 0 1 0 1 0 1 0 1 0 1 0 1 11 00 0 1
A o
Entonces, la ecuaci on de estado del proceso nivel toma la forma: = 1 h + 1 qi h ARh A (2.44)
17
Tabla 2.2: Par ametros y variables del sistema tanque con agua. S mbolo dS A H h Q qi qo Rh g do Ao Av Cc Cv Cd a Cp Ct Rt a o i i T o s c Descripci on Di ametro del tanque Secci on circular del tanque Nivel del agua en estado estacionario Nivel del agua Flujo de agua en estado estacionario Flujo de agua de entrada al tanque Flujo de agua de salida del tanque Resistencia hidr aulica del tanque: Rh = H/Q Aceleraci on de la gravedad Densidad del agua Di ametro del oricio de salida Secci on del oricio de salida Secci on de la vena contracta Coeciente de correcci on entre Ao y Av Coeciente de correcci on por p erdidas Coeciente de descarga:Cd = Cv Cc Factor de ujo turbulento: a = Cd AO 2g Calor espec co del agua Capacitancia t ermica del tanque: Ct = SHCp Resistencia t ermica del tanque: Rt = C 1 Q
p
0.16
2700 9.81 1000 0.0127 0.000126 0.6 a 1 0.8 a 0.99 0.5 0.00028 4186.8 27633 0.0054
m2.5 /s
J kg K
K/W K/W
oC oC oC
Temperatura ambiente Temperatura en el tanque en estado estacionario Temperatura del agua de salida Calor entregado por la resistencia el ectrica Calor en estado estacionario Calor del agua en el tanque Calor que toma el ujo de salida a Calor que se libera al exterior: s = oR t Calor que trae consigo el ujo de entrada
1540
W W W W W W
h(s) Rh = qi (s) ARh s + 1 donde el producto ARh es la constante de tiempo del proceso nivel.
(2.45)
Determinaci on Experimental de Rh
La v alvula de control empleada para regular la entrada de agua al tanque es del tipo VXN015F250, con di ametro nominal DN15, conexi on G1B y actuador mot orico. La abertura m axima se obtiene alimentando con 10 V al actuador, la cual corresponde a un ujo de 0.4 m3 /h, de acuerdo al manual del fabricante. La m nima abertura, con 0 V, corresponde a un ujo de 0 m3 /h. Esto signica que para una abertura de 1 V el ujo que pasa por la v alvula es de 1/90000 m3 /s. Asumiendo una variaci on lineal entre el ujo qi que pasa por la v alvula y la altura h del tanque, se realiz o el siguiente experimento. Con una abertura de v alvula 3 para 4 V (0.16 m /h), se abri o convenientemente la v alvula de descarga hasta lograr una altura estable de 0.12 m. Luego, con una abertura de v alvula para 6 V (0.24 3 m /h), se sigui o abriendo la v alvula de descarga hasta lograr una altura de 0.18 m. Empleando la relaci on: H Rh = Q la resistencia hidr aulica para cada punto result o aproximadamente Rh = 2700 s/m2 . Se asume que los valores en estado estacionario de h y qi son H = 0.12 m y Q = 0.16 m3 /h respectivamente.
La funci on de transferencia del proceso temperatura toma la forma: Rt o (s) = i (s) Ct Rt s + 1 donde el producto Ct Rt es la constante de tiempo de dicho proceso. (2.50)
2.1 Modelado Empleando las Leyes de la F sica Ecuaci on de Estado Lineal del Sistema Tanque
19
Juntando las ecuaciones (2.44) y (2.48), las ecuaciones de estado y de salida lineales del sistema tanque con agua resulta: x = Ax + Bu x= x1 x2 A= = h o 0 Rt1Ct u= u1 u2 B= =
1 A
y = Cx qi i 0
1 Ct
(2.51) y= C= y1 y2 = 1 0 0 1 h o
1 AR h 0
Modelo No Lineal del Proceso Nivel El volumen de agua acumulado en el tanque se modela como: A dh = qi qo = Ah dt (2.52)
donde qi y qo son los ujos de agua de entrada y salida respectivamente y h es la altura del tanque. Para oricios circulares peque nos, se puede formular [12]: qo = Cd Ao 2gh = a hH ; a = Cd Ao 2g (2.53) donde g es la aceleraci on de la gravedad, Cd es el coeciente de descarga y Ao es la secci on del oricio de salida. Se sabe adem as que [12]: Cd = CvCc ; 0.8 Cv 0.99; 0.6 Cc 1 (2.54)
donde Cv es el coeciente de correcci on por p erdidas y Cc es el coeciente de correcci on entre Ao y Av (la secci on de la vena contracta). Para nuestro estudio tomaremos Cd =0.5. De (2.52) se obtiene la primera ecuaci on de estado: = a h + 1 qi h A A Modelo No Lineal del Proceso Temperatura El balance de energ a t ermica dentro del tanque se formula: T = o s + c + i (2.56) (2.55)
donde i es calor entregado por la resistencia el ectrica, T es el calor del agua en el tanque, o es el calor que toma el ujo de salida, s es el calor que se libera al exterior y c es el calor que trae consigo el ujo de entrada. Las relaciones que gobiernan tales ujos calor cos: T o s c do dt = Cp o a h o a = Rt = Cp i qi = AhCp
(2.57)
20
Los par ametros que aparecen en (2.57) se describen en la tabla 2.2. La ecuaci on de do estado del proceso temperatura se obtiene despejando dt = o de (2.56): 1 o = a o h o a + i qi + i Ah AhCp Rt Ah AhCp Ecuaci on de Estado No Lineal del Sistema Tanque Seleccionemos como variables de estado q1 = h, q2 = o y como entradas de control u1 = qi , u2 = i . Introduciendo tales variables en ( 2.55) y (2.58), las ecuaciones de estado del sistema resultan: q 1 q 2 f1 = G11 = a q1 A = f1 f2 + G11 0 G21 G22 u1 u2 (2.59) (2.58)
f2 = G21 = i Aq1
1 A
Modelo de Lagrange del Sistema Tanque Para obtener el modelo de Lagrange del sistema tanque, despejamos u1 de la primera relaci on de (2.59) y lo reemplazamos en la segunda relaci on de dicha ecuaci on. El resultado es la siguiente ecuaci on de estado: q 2 = i a q2 a 1 q2 q1 + (Aq 1 + a q1 ) + u2 Aq1 ACp Rt q1 Aq1 ACp q1 (2.60)
Empleando la primera relaci on de (2.59) y la ecuaci on (2.60), se obtiene el modelo de Lagrange del sistema: u1 u2 P11 = A d11 = a q1 = P11 0 P21 P22 P21 = ACp i q 1 q 2 + d11 d21 P22 = ACp q1 (2.61)
q2 a d21 = Cp a q1 q2 Cp a q1 i + Rt
Determinaci on de las Fuerzas de Control en Estado Estacionario El actuador que emplea el sistema de control de temperatura trabaja en el rango de voltaje de 1 a 5 V. Con 5 V, el calefactor proporciona un ujo m aximo de calor de 7700 W, de acuerdo al manual del fabricante. Se asume una correspondencia lineal entre el voltaje que ingresa al actuador y el ujo de calor entregado. Entonces, para subir 1 V en dicho actuador (de 1 a 2 V o de 4 a 5 V por ejemplo), se debe de proporcionar 7700/4 = 1925 W.
21
2.2.
Las ecuaciones diferenciales que gobiernan el movimiento de complicados sistemas mec anicos, se pueden obtener empleando las ecuaciones de Lagrange, las cuales se derivan de las leyes de Newton del movimiento. El m etodo de las ecuaciones de Lagrange considera cantidades escalares (energ as potencial y cin etica) en lugar de vectores (fuerzas y torques), minimizando as la necesidad de complicados diagramas vectoriales. El modelo din amico del sistema obtenido con el m etodo de las ecuaciones de Lagrange se denomina el modelo de Lagrange. Este modelo tambi en nos permite determinar el modelo en el espacio de estado. El m etodo en cuesti on requiere de la representaci on del sistema mediante un conjunto de coordenadas generalizadas qi (i = 1, 2, . . . , r), una para cada grado de libertad independiente del sistema. Luego, la energ a cin etica V y la energ a potencial U se formulan en t erminos de tales coordenadas y de sus derivadas con el n de establecer la funci on Lagrangiana del sistema, la cual toma la forma: L = V (q1 , . . . , qr , q 1 , . . . , q r ) U (q1 , . . . , qr , q 1 , . . . , q r ) (2.62)
Notar en la ecuaci on (2.62) que L depende de las variables q1 , . . . , qr , q 1 , . . . , q r . Por otra parte, de acuerdo al principio de la m nima acci on de Hamilton para sistemas conservativos, la integral I denida por:
t2
I=
t1
L(q1 , . . . , qr , q 1 , . . . , q r )
es un extremo para la trayectoria de movimiento del sistema desde el tiempo t1 hasta el tiempo t2 . En adici on, la variaci on de I es igual al trabajo realizado por fuerzas externas. Basado en el principio de Hamilton, se puede demostrar que las ecuaciones que gobiernan el movimiento de un sistema din amico constituyen las ecuaciones de Lagrange [1], [2]: d L L = Qi i = 1, 2, . . . , r (2.63) dt q i qi donde Qi indica las fuerzas y torques generalizados que son externos al sistema o no son obtenibles a partir de una funci on potencial escalar. Si asignamos una variable de estado para cada coordenada generalizada qi y otra para su derivada q i , tendremos entonces 2r ecuaciones diferenciales de segundo orden de la forma dada en (2.63) correspondientes al sistema de r grados de libertad.
2.2.1.
22
para accionar el movimiento rotatorio del brazo (el eslab on) del MRT alrededor de una articulaci on ubicada en el centro de masa del carro. Asumiremos que M1 y M2 poseen los mismos par ametros. En la gura 2.5, es la posici on angular del brazo de longitud Lb y masa mb , r es la posici on longitudinal del carro y Ff es la fuerza de fricci on opuesta al movimiento del carro. Al extremo del brazo se puede articular una mano o efector nal para diferentes prop ositos. El sistema MRT es multivariable cuadrado, denominado as por poseer dos entradas: los voltajes KA1 u1 y KA2 u2 aplicados los terminales de las armaduras de ametros KA1 y KA2 son las M1 and M2 respectivamente, y dos salidas: r y . Los par ametros ganancias de los amplicadores. La tabla 2.3 muestra los valores de los par del sistema MRT.
EFECTOR FINAL Lb
mh Lh
M1 POLEA
PIVOTE
BRAZO L b cos mb
00 11 00 11 111 000 CARRO 00 rp 11 000 111 x 000 111 000 111 M2 F F f 0000000000000000000000000 1111111111111111111111111 0000000000000000000000000 1111111111111111111111111 0000000000000000000000000 1111111111111111111111111 11 00 00 11 00 11
r L b sen
Fig. 2.5: El manipulador rob otico traslacional (MRT).
mp
23
Tabla 2.3: Par ametros valorados del sistema MRT. La abreviatura C.M. signica Centro de Masa. S mbolo u1 , u2 KA Va1 , Va2 , Ra La ia1 , ia2 Km Tm1 , Tm2 Tg1 , Tg2 T Jm Jg Jp Jb Jeq Beq Bm Bg Bp F Ff Fc mh ma mc mp rp r Lb Vb1 , Vb2 Kb g N1 , N2 n , m , m Descripci on Voltaje de entrada al sistema Ganancia del amplicador Voltaje de armadura Resistencia de armadura Inductancia de armadura Corriente de armadura Constante del torque motor Torque motor Torque en los engranajes Torque de carga Momento de inercia del motor Momento de inercia de los engranajes Momento de inercia de la polea Momento de inercia del brazo Momento de inercia equivalente Constante de fricci on equivalente Constante de fricci on del motor Constante de fricci on engranajes Constante de fricci on en la polea Fuerza aplicada al carro Fuerza de rozamiento (Ff = Fc r ) Constante de fricci on del carro Masa del efector Masa del brazo masa del carro masa de la polea Radio de la polea Posici on del carro Longitud del brazo Voltajes contraelectromotrices Constante contraelectromotriz Aceleraci on de la gravedad N o de dientes de los engranajes Relaci on de engranajes (n = N2 /N1 ) Posici on angular: brazo y motor Velocidad angular: carga y motor Valor 8.5 3.5 0.002 0.0421 V H A N-m/A N-m N-m N-m kg-m2 kg-m2 kg-m2 kg-m2 kg-m2 N-m-s/rad N-m/rad/s N-m-s/rad N-m-s/rad N N kg/s kg kg kg kg m m m V V-s/rad m/s2 Unidades V
0.0003 0.053
2.81 0.15 0.8 0.95 0.3 0.05 0.225 0.0565 9.81 N2 > N1 12.5
rad rad/s
y=
Lb cos 2
(2.66)
Las Ecuaciones de Lagrange del MRT Reemplazando (2.66) en (2.65), efectuando las operaciones indicadas y simplicando, la funci on de Lagrange L = V U = (V1 + V2 ) (U1 + U2 ) toma la forma: 1 1 L = (mc + mb )r 2 + 2 2 Jb + L2 b 2 2 1 mb Lb r cos 1 mb Lb g cos 2 2 (2.69)
Las ecuaciones de Lagrange para las coordenadas generalizadas r y del MRT se formulan como: d dt d dt L r L L = F Ff r (2.70) L =T (2.71)
donde F es la fuerza generada para mover al carro, Ff es la fuerza de fricci on actuando sobre las ruedas del carro, Fc es la constante de fricci on y TL es el torque generado para accionar el brazo. Reemplazando L en (2.70) y (2.71) y operando, se obtiene: F = (mc + mb ) r T = Lb 2 sin + Lb mb cos + Ff r mb 2 2 L2 b Lb mb sin mb + Jb 4 2 (2.72) (2.73)
Lb mb r cos + 2
Partiendo de (2.72) y (2.73) podemos determinar el modelo de Lagrange del modelo TRM. Sin embargo, si estamos interesados en tener como fuerzas de control los voltajes de armadura u1 y u2 en lugar de F y T respectivamente, entonces se requiere modelar los susbsistemas el ectricos del sistema como sigue. Modelado del Servomotor M1 Accionando la Polea La gura 2.6 muestra el servomotor M1 articulado a la polea. Despreciando la inductancia de armadura La , el voltaje de entrada KA u1 aplicado a la armadura es: Ra ia1 + Vb1 = KA u1 (2.74)
25
La
i a1
m1 m1
+ _1
u KA
+
vb1
N1 111 000 000 111 1 000 111 1 000 111 1111 0000 000 111 0000 1111 Tm1 Bm Tg1 000 111 Jm 000 111 N2 Tg2 Bg Jg
Jp Bp rp F
Ra
Fig. 2.6: Servomotor M1 articulado a la polea. El voltaje de fuerza contraelectromotriz es proporcional a la velocidad del servomotor, es decir: m1 Vb1 = Kb (2.75) La ecuaci on del torque motor Tm1 est a dada por (ver gura 2.6): m1 + Bm m1 + Tg1 Tm1 = Jm El torque Tg2 requerido para mover a la polea se expresa como: Tg2 = nTg1 = (Jg + Jp ) m1 m1 + (Bg + Bp ) + F rp n n (2.77) (2.76)
donde n > 1 es la relaci on de dientes de los engranajes del mecanismo de reducci on, Jm , Jg y Jp son los momentos of inercia de la armadura, del mecanismo de reducci on y de la polea respectivamente, mientras que Bm , Bg y Bp son las constantes de fricci on de la armadura, del mecanismo de reducci on y de la polea respectivamente. La relaci on Tg2 = nTg1 se obtiene asumiendo que los engranajes son ideales. En esta situaci on, el principio de conservaci on de energ a requiere que: Tg1 m1 = Tg2 m1 n
Asumiendo que la polea es un disco que gira sobre su eje, su momento de inercia se puede calcular como: 2 Jp = mp rp /2; (2.78) El torque servomotor Tm1 es proporcional a ia1 : Tm1 = Km ia1 (2.79)
El movimiento rotacional de la polea se puede transformar en el movimiento traslacional del carro usando la relaci on (ver gura 2.6): r= m1 rp n (2.80)
26
Usando las ecuaciones (2.74), (2.75), (2.76), (2.77), (2.79) y (2.80) podemos obtener: F = donde: Jeq1 = n2 Jm + Jg + Jp Beq1 = n2 Bm + Bg + Bp Jeq1 Km KA r u1 2 rp Ra nrp Beq1 nKm Kb + 2 2 nrp nrp r (2.81)
Modelado del Servomotor M2 Accionando el Brazo La gura 2.7 muestra al servomotor M2 articulado al punto pivote localizado en el centro de masa del carro. Sabemos que M1 y M2 poseen los mismos par ametros por ser similares. Despreciando la inductancia de armadura La , podemos formular: Ra ia2 + Vb2 = KA u2 donde: Vb2 = Kb n (2.82) (2.83)
La
i a2
m m
+ _
u2 KA
+
vb2
N1 111 000 000 111 000 111 Articulacin 000 111 1111 0000 000 111 0000 1111 B m Tg1 Tm2 000 111 Jm 000 111 N2 Tg2 Bg Jg
Ra
+ B m n + Tg1 Tm2 = Jm n El torque Tg2 requerido para mover el brazo se expresa como: + Bg +T Tg2 = nTg1 = Jg donde T es el torque de carga. El torque motor Tm2 es proporcional a ia2 : Tm2 = Km ia2
(2.84)
(2.85)
(2.86)
Empleando las ecuaciones (2.82), (2.83), (2.84), (2.85) y (2.116) se puede demostrar que: 2 Beq2 + n Km Kb + nKm Kb u2 T = Jeq2 (2.87) Ra Ra donde: Jeq2 = n2 Jm + Jg Beq2 = n2 Bm + Bg
27
Las ecuaciones (2.88) y (2.89) se pueden transformar en su forma matricial como sigue: M(q)q + P(q, q )q + d(q) = u donde: M= M11 M12 M21 M22 P= P11 P12 0 P22 d(q) = 0 d21 q= q1 q2 = r u= u1 u2 (2.90)
Ra rp Jeq mc + mb + 2 nKm KA rp Ra rp mb Lb cos 2nKA Km Ra mb Lb cos 2nKm KA mb L2 Ra b + Jb + Jeq nKA Km 4 Beq Ra rp n2 Km Kb Fc + 2 + 2 nKm KA rp Ra rp Ra rp mb Lb sin 2nKA Km Ra n2 Km Kb Beq + nKA Km Ra Ra mb Lb g sin 2nKA Km
Ecuaci on de Estado del MRT . Por Seleccionemos como variables de estado: x1 = r, x2 = , x3 = r y x4 = consiguiente, las dos primeras ecuaciones de estado son: x 1 = x3 , x 2 = x4 . Las otras dos ecuaciones de estado no lineales se deducen despejando q = [x 3 x 4 ]T de (2.90), resultando: x 3 = M22 (P11 x3 P12 x4 + u1 )/den M12 (P22 x4 d21 + u2 )/den x 4 = M21 (P11 x3 P12 x4 + u1 )/den + M11 (P22 x4 d21 + u2 )/den den = M11 M22 M12 M21 (2.91)
28
Haciendo en la ecuaci on (2.90) las aproximaciones siguientes: cos = 1 en M12 y M21 , sin = = 0 en P12 y sin = en d21 , la ecuaci on de estado lineal del sistema MRT resulta: x = Ax + Bu y = Cx (2.92) donde: 0 0 1 0 1 0 0 1 0 A= 0 M 12 d21 M 22 P 11 (M 22 P 12 M 12 P 22 ) den 0 M 11 d21 M 21 P 11 (M 22 P 12 M 11 P 22 ) 0 0 1 0 0 B= M 22 M 12 den M 21 M 11 En las relaciones anteriores: M 11 = M11 M 21 = P 11 Ra mb Lb 2nKm KA = P11 M 12 = Ra rp mb Lb 2nKA Km
C=
1 0 0 0 0 1 0 0
den = M 11 M 22 M 12 M 21
P 22 = P22
2.2.2.
29
Tabla 2.4: Variables y par ametros del sistema MRE (C.M.: centro de masa). S mbolo q1 q2 T1 , T2 md mb ma mh m2 d rd b a2 M1 , M2 La Lh L1 L2 Jh Jm Jeq Jg1 , Jg2 J1 , J2 Bm Beq Bg1 , Bg2 n Ra Larm Vb1 , Vb2 Va1 , Va2 ia1 , ia2 KA Km Kb u1 , u2 g Descripci on Posici on angular de la base Posici on angular del brazo Torques generados Masa del disco Masa de la barra Masa del brazo o eslab on Masa del efector nal Masa equivalente del brazo Espesor del disco Radio del disco Longitud de la barra Secci on cuadrada de la barra Servomotores D.C. Longitud del brazo Longitud del efector Ubicaci on C.M. de la base Longitud equivalente del brazo Momento de inercia del efector Momento de inercia de M1 y M2 Momento de inercia equivalente Momentos de inercia de los engranajes Momentos de inercia de la base y del brazo Constante de fricci on de M1 y M2 Constante de fricci on equivalente Constantes de fricci on en engranajes Relaci on de engranajes de M1 y M2 Resistencia de armadura de M1 y M2 Inductancia de armadura de M1 y M2 Voltajes contraelectromotrices Voltajes de armadura Corrientes de armadura Ganancia del amplicador Constante del servomotor Constante contraelectromotr z Voltajes de control Constante gravitacional Valor Unidad rad rad N-m kg kg kg kg kg m m m m2 m m m m kg-m2 kg-m2 kg-m2 kg-m2 kg-m2 N-m-s/rad N-m-s/rad N-m-s/rad H V V A N-m/A V-s/rad V m/s2
0.55 0.9 0.8 0.15 0.01 0.06 0.25 0.044 0.3 0.05
30
mh ma SERVOMOTOR q 2 M2 a b mb a L1 md BASE La
EFECTOR FINAL
BRAZO
rd M1
q1
Fig. 2.8: El manipulador rob otico esf erico (MRE).
(2.94)
y el momento de inercia J1 resulta de la suma de los momentos de inercia del disco (Jd ) y de la barra (Jb ) alrededor del eje z , como sigue [8]: 1 1 2 + mb (a2 + a2 ) J1 = Jd + Jb = md rd 2 12 Ecuaciones de Energ a del Brazo Sean ma y mh las masas del brazo y del efector m as su carga respectivamente. Asumiendo que el brazo y el efector nal forman una unidad de masa m2 = ma + mh y longitud L2 = La + Lh , donde Lh La , la energ a cin etica almacenada en el brazo (2.95)
2.2 M etodo de Las Ecuaciones de Lagrange se formula aproximadamente como: 1 1 2 V2 = J2 q 2 + m2 x 2 + y 2 + z 2 2 2 De acuerdo a la gura 2.8: x= L2 sin q2 cos q1 2 y= L2 sin q2 sin q1 2 z =d+b+ L2 cos q2 2
31
(2.96)
(2.97)
Modelo Din amico de Lagrange del MRE Reemplazando (2.97) en (2.96), efectuando las operaciones indicadas y simplicando, la funci on de Lagrange L = V U = (V1 + V2 ) (U1 + U2 ) toma la forma: L = 1 1 1 2 2 2 2 2 +q 1 sin2 q2 J1 q 1 + J2 q 2 + m2 L2 q 2 2 8 L2 m1 gL1 m2 g d + b + cos q2 2
(2.100)
Las ecuaciones de Lagrange para las coordenadas generalizadas q1 y q2 del MRE se formulan como: d dt d dt L q 1 L q 2 L = T1 q1 L = T2 q2 (2.101) (2.102)
donde T1 y T2 son los torques generados para hacer girar la base y el brazo respectivamente. Reemplazando L en (2.101) y (2.102) y operando se obtiene: 1 J1 + m2 L2 sin2 q2 q 1 + 4 1 J2 + m2 L2 q 2 4 1 m2 L2 sin q2 cos q2 q 1 q 2 = T1 2 = T2 (2.103)
(2.104)
Partiendo de (2.101) y (2.102) podemos determinar el modelo de Lagrange del modelo MRE. Sin embargo, si estamos interesados en tener como fuerzas de control los voltajes de armadura u1 y u2 en lugar de T1 y T2 respectivamente, entonces se requiere modelar los susbsistemas el ectricos del sistema MRE como sigue.
32
Modelado del Servomotor M1 Accionando la Base La gura 2.9 muestra al servomotor M1 articulado al punto pivote en contacto con el disco de la base. Sabemos que M1 y M2 poseen los mismos par ametros por ser similares. Despreciando la inductancia de armadura Larm , podemos formular (ve gura 2.9): Ra ia1 + Vb1 = KA u1 (2.105) donde: Vb1 = Kb q m1 = Kb nq 1 qm1 = nq1 (2.106) donde n = N2 /N1 > 1 es la relaci on de dientes de los engranajes del mecanismo de reducci on. La ecuaci on del torque motor Tm1 es (ver gura 2.9):
L arm i a1
1 0 q m1 q m1
+ _
u1 KA
+
vb1
N1 111 000 000 111 000 111 Articulacin 000 111 1111 0000 000 111 0000 1111 B m Tg1 Tm1 000 111 Jm 000 q 111 N2 Tg2 Bg Jg
1 1
Ra
11 00 q
Tm1 = Jm nq 1 + Bm nq 1 + Tg1 El torque Tg2 requerido para mover la base se expresa como: Tg2 = nTg1 = Jg q 1 + Bg q 1 + T1
(2.107) (2.108)
donde Jm y Jg son los momentos de inercia del motor y del mecanismo de reducci on respectivamente, mientras que Bm y Bg son las constantes de fricci on del motor y del mecanismo de reducci on respectivamente. La relaci on Tg2 = nTg1 se obtiene asumiendo que los engranajes son ideales. En esta situaci on, el principio de conservaci on de energ a requiere que: qm1 qm1 = nq1 Tg1 qm1 = Tg2 n El torque motor Tm1 es proporcional a ia1 : Tm1 = Km ia1 (2.109) Empleando las ecuaciones (2.105), (2.106), (2.107), (2.108) y (2.109) se puede demostrar que: T1 = Jeq q 1 Beq + donde: Jeq = n2 Jm + Jg Beq = n2 Bm + Bg (2.111) n2 Km Kb Ra q 1 + nKm KA u1 Ra (2.110)
2.2 M etodo de Las Ecuaciones de Lagrange Modelado del Servomotor M2 Accionando el Brazo
33
La gura 2.10 muestra al servomotor M2 articulado al punto pivote del segundo brazo. Sabemos que M1 y M2 poseen los mismos par ametros por ser similares. Despreciando la inductancia de armadura Larm , formulamos: Ra ia2 + Vb2 = KA u2 donde: Vb2 = Kb q m2 = Kb nq 2 qm2 = nq2 (2.113) (2.112)
L arm i a 2
1 0 q m2 q m2
+ _2
u KA
+
vb2
N1 111 000 000 111 000 111 Articulacin 000 111 1111 0000 000 111 0000 1111 B m Tm2 Tg1 000 111 Jm 000 q 111 N2 Tg2 Bg Jg
Ra
11 00 q
2
Tm2 = Jm nq 2 + Bm nq 2 + Tg1 El torque Tg2 requerido para mover el brazo se expresa como: Tg2 = nTg1 = Jg q 2 + Bg q 2 + T2
(2.114)
(2.115)
donde T2 es el torque para accionar el brazo. El torque motor Tm2 es proporcional a ia2 : Tm2 = Km ia2 (2.116)
Empleando las ecuaciones (2.112), (2.113), (2.114), (2.115) y (2.116) se puede demostrar que: T2 = Jeq q 2 Beq + donde: Jeq = n2 Jm + Jg Beq = n2 Bm + Bg (2.118) n2 Km Kb Ra q 2 + nKm KA u2 Ra (2.117)
34
Modelo Din amico del Manipulador MRE Igualando (2.103) con (2.110) y (2.104) con (2.117) el modelo de Lagrange del sistema MRE toma la forma: u1 = M11 q 1 + P11 q 1 + P12 q 2 u2 = M22 q 2 + P21 q 1 + P22 q 2 + d21 (2.119) (2.120)
Manipulando las ecuaciones (2.119) y (2.120) se obtiene el modelo din amico de Lagrange del sistema: M(q)q + P(q, q )q + d(q) = u donde: M= M11 0 0 M22 P= P11 P12 P21 P22 d= 0 d21 q= q1 q2 u= u1 u2 (2.121)
Ra 1 J1 + Jeq + m2 L2 sin2 q2 nKm KA 4 Ra 1 J2 + Jeq + m2 L2 nKm KA 4 2 Ra n Km Kb Beq + nKm KA Ra Ra m2 L2 q 1 sin q2 cos q2 2nKm KA Ra m2 L2 q 1 sin q2 cos q2 4nKm KA Ra n2 Km Kb Beq + nKm KA Ra Ra m2 L2 g sin q2 2nKm KA
Ecuaci on de Estado No Lineal del Sistema MRE Deniendo las siguientes variables de estado: x1 = q1 , x2 = q2 , x3 = q 1 y x4 = q 2 , el modelo din amico dado en (2.119) y (2.120) se puede transformar en la siguiente ecuaci on de estado del sistema MRE: x3 f1 (x, u) x 1 x x4 2 = f2 (x, u) = (2.122) 1 x M11 (P11 x3 P12 x4 + u1 ) f3 (x, u) 3 1 f4 (x, u) x 4 M22 (P21 x3 P22 x4 d21 + u2 )
2.3.
Problema 2.1
Problemas
2.3 Problemas
35
Considere el manipulador rob otico con articulaci on ja MR1 mostrado en la gura 2.1 y descrito en la subsecci on 2.1.1. Determine su modelo de Lagrange (ecuaci on (2.23)) aplicando las ecuaciones de Lagrange. Despreciar la inductancia de armadura La . Problema 2.2 Para el manipulador rob otico con articulaci on el astica MRAE descrito en la subsecci on 2.1.2, determine su modelo de Lagrange (ecuaci on (2.33)) aplicando las ecuaciones de Lagrange. Despreciar la inductancia de armadura La . Problema 2.3 En la subsecci on 2.1.3 se determinaron el modelo de Lagrange y la ecuaci on de estado del sistema tanque con agua. Ahora consideremos que se desea controlar el ujo de salida qo = a h y la temperatura en el tanque o . Las fuerzas de control (las entradas), siguen siendo las mismas: qi y i . a) Determinar la ecuaci on de estado y el modelo de Lagrange del sistema para esta situaci on. b) Dena las variables q = Qo + qoe y o = o + oe , donde Qo y o son valores estacionarios de qo y o respectivamente, y qoe y o sus respectivas desviaciones. Realice el siguiente cambio de variables en las ecuaciones din amicas del sistema tanque: qi = (Qo + qoe )(1 + uq ) i = (Qo + qoe )Cp + 1 R Qo a (Qo + qoe )Cpi + u Rt
Determine la ecuaci on de estado y el modelo de Lagrange del sistema transformado, donde las variables a controlar son ahora qoe oe y las nuevas entradas son uq y u . Problema 2.4 : Sistema de Plataformas La gura 2.11 muestra dos plataformas P1 y P2 de masas m1 y m2 acopladas por resorte y amortiguador. Las se nales de referencia r1 y r2 y las salidas de este sistema, las posiciones individuales y1 e y2 de las plataformas, se jan mediante potenci ometros. El sistema de plataformas descrito tiene como entradas de control las se nales u1 y u2 generadas por actuadores, de forma tal que lleven a cero con suciente rapidez los errores de posici on e1 = r1 y1 y e2 = r2 y2 . Asuma Usted los valores de los par ametros del sistema. a) Determine el modelo de Lagrange del sistema. b) Determinar las ecuaciones de estado y de salida del sistema. Problema 2.5 : Columna de Destilaci on
36
r1
1 0 0 1 0 1
+
1 e 1 0 0 0 1 0 1 0 1 0 1 1 0 0 1 1 0 0 0 +1 1 0 0 1 1 0 1 0 1 0 1 0 1
1
u1
1 0 0 1 0 1 0 1 P 1 0 0 1 0 1 0 1 P
R1
Y1 K1 u2 B1
1y 0 0 1 0 1
y 1 0 0 1 0 1 B2
r2
1 0 0 1 0 1
R2
1 0 0 1 0 1 0 1 0 1 0 1 0 1
e2
Y2 K2
1111111111111111 0000000000000000
La gura 2.12 ilustra una columna de destilaci on para fraccionar petr oleo pesado. El modelo con tiempos muertos del fraccionador (ecuaci on (2.123)), en el cual p es el operador de Laplace, se describe en [31] y [30]. Tal modelo considera tres variables que deben de ser controladas: la composici on de los productos de la parte superior Y1 y lateral y2 de la columna, y la temperatura de fondos Y3 . Las se nales o fuerzas de control correspondientes (las variables manipuladas) son: el ujo superior U1 , el ujo lateral U2 y el reujo de fondos U3 . Considerar que que se dispone de la energ a calor ca requerida por la columna. Asumir que los tiempos muertos se pueden representar mediante la siguiente fracci on racional de Pad e de segundo orden: eT s = 12 6T s + T 2 s2 12 6T s + T 2 s2
donde T es el tiempo muerto y s es el operador de Laplace. Para el sistema descrito determine: a) Sus ecuaciones de estado y de salida. b) Su modelo de Lagrange. (b) Determine su modelo en el espacio de estado. (a) Determine su modelo de Lagrange. 4.05e27s 1.77e28s 5.88e27s s 1+60p 1+50s Y1 (s) 1+50 18s 14s 5 . 39 e 5 . 72 e 6 .9e15s Y2 (s) = 1+50 s 1+60 s 1+40 s Y3 (s) 7.2 4.38e20s 4.42e22s
1+33s 1+44s 1+19s
(2.123)
2.3 Problemas
37
PC
T LC FC
Top Draw
FC
Side Draw
Bottoms
Problema 2.6 : Reactor Qu mico El modelo din amico del reactor qu mico con chaqueta de enfriamiento mostrado en la gura 2.13 ha sido tomado de [32] y [30]. En este reactor ingresa un uido liquido que contiene el producto A. Este liquido se revuelve dentro del tanque mediante un agitador para formar una mezcla perfecta. El producto A en esta condici on va a experimentar una reacci on irreversible exot ermica. Debido a que este tipo de reacci on libera calor, es entonces necesario que la temperatura en el interior del tanque sea controlada por medio del agua de refrigeraci on que circula en la chaqueta que rodea al reactor. La reacci on qu mica del producto o componente A dentro del tanque para formar el componente B se formula como: A B
Esta reacci on se realiza a una velocidad espec ca K en horas1 , cuya expresi on se da m as adelante. Los par ametros y variables que intervienen en el sistema de reacci on (ver gura 2.13) son: 1) A: producto que ingresa al reactor. 2) B: producto resultante de la transformaci on del producto A dentro del tanque. 3) Ca0 : concentraci on del producto A que ingresa al reactor. 4) Tl0 : temperatura del liquido que contiene el producto A.
38
Product A Reactor 11 00 00 11 00 11 00 11 Tl 00 11 00 11 00 11 00 11 A 00 C a 11
Coolant Fc Tc 0
B Cb
11 00 00 11 00 11 00 11 00 11 00 11 00 11 00 11 00 11
Ca 0
Fl
Tl 0
Tc Jacket
Fc
Products A and B Ca Cb Fl Tl
5) F : Flujo del liquido que pasa a trav es del reactor. Cuando el ujo ingresa al reactor, contiene solamente el producto A. Cuando el ujo sale del reactor, contiene los productos A y B. Este ujo es la alimentaci on al reactor. 6) T : temperatura del liquido que sale del reactor. 7) Cb : Concentraci on del producto B a la salida del reactor y en el interior. 8) Ca : Concentraci on del producto A. Siempre debe de cumplirse la desigualdad: Ca < Ca0 . En el estado estacionario se tiene: Ca + Cb = Ca0 . 9) Tc0 : temperatura del agua de refrigeraci on que ingresa a la chaqueta. 10) Tc : temperatura del agua de refrigeraci on en el interior y en la salida de la la chaqueta. 11) Fc : ujo del agua de refrigeraci on. Las concentraciones se dan en kmol/m3 , los ujos en m3 /h y las temperaturas en o C (grados Celcius). A continuaci on se muestran las ecuaciones diferenciales que describen la din amica del sistema. Para ello se aplican las leyes de conservaci on de la masa y de la energ a. Para hacer esto, se supone que no existe liquido acumulado en el reactor, que las concentraciones y temperaturas son homog eneas y que las p erdidas de energ a hacia el exterior son despreciables. Las ecuaciones de balance de masa son: d(V Ca ) dt d(V Cb ) dt = F Ca0 V kCa F Ca = V kCa F Cb (2.124) (2.125)
2.3 Problemas
39
donde: F Ca0 es el ujo del componente A en kmol/h que ingresa al sistema, F Ca es el ujo de A que sale del sistema, V es el volumen del liquido en el sistema, V kCa es la velocidad de formaci on de A (el signo negativo indica que el componente A d(V Ca ) se est a consumiendo), es el ujo de A (en kmol/h) en transici on, F Cb es el dt ujo de B que sale del sistema, +V kCa es la velocidad de formaci on de B a partir de A (por esta raz on posee signo positivo) y d(VdtCb ) es el ujo de B (en kmol/h) en transici on. Las ecuaciones de balance de energ a se formulan como: d(V Cp T ) dt d(Vc c Cp c Tc ) dt = F Cp T 0 F Cp T Q + V kCa H = Fc c Cp c (Tc0 Tc ) + Q (2.126) (2.127)
donde: F Cp T 0 es el ujo calor co entregado al sistema, F Cp T es el ujo calor co que sale del sistema, Q es el ujo calor co absorbido por el agua de refrigeraci on, V kCa H es ujo calor co producido en la reacci on debido a la entalp a H de la reacci on, d(V Cp T )/dt es el ujo calor co en transici on (acumulado) en el interior del tanque, Fc c Cp c (Tc0 Tc ) es el ujo calor co absorbido en el sistema (refrigeraci on) y d(Vc c Cp c Tc )/dt es el ujo calor co en transici on (acumulado) en la chaqueta del tanque. Todos los ujos calor cos est an en kJ/h, mientras que la entalp a H posee unidades de kJ/kmol. El balance de energ a en el sistema asume que la temperatura Tc es uniforme en toda la chaqueta. La transferencia de calor entre el sistema de reacci on (que se realiza a la temperatura T ) y el agua de refrigeraci on (que se realiza a la temperatura Tc ), se describe mediante la relaci on: Q = U S ( T Tc ) (2.128)
donde U es el coeciente global de transmisi on de calor en kJ/(h m2 K), S es la supercie efectiva de transferencia de calor en m2 . Tener en cuenta que en general la supercie S puede variar debido a los ujos que ingresan al reactor y cuando algunas supercies dentro del tanque no est an completamente cubiertas todo el tiempo con la masa liquida de la reacci on. La velocidad de reacci on k en h1 tiene la forma: k = eEa /R(272+T
)
(2.129)
donde Ea es la energ a de activaci on en kJ/kmol y R es la constante universal de los gases. La tabla 2.5 muestra los valores nominales de los par ametros del sistema. El objetivo de control es estabilizar la temperatura T , as como tambi en la concentraci on Cb a la salida del reactor, cumpliendo determinadas especicaciones de dise no, tales como tiempo de estabilizaci on, m aximo sobrepico de las respuestas controladas y error en estado estable de las respuestas con respecto a las se nales de referencia o set points. Las fuerzas de control para lograr este objetivo son el ujo F del liquido y el ujo de refrigeraci on Fc . Para este sistema: (a) Determine su modelo en el espacio de estado. (b) Determine su modelo de Lagrange. (c) Para un cambio escal on de 25 a 26 m3 /h en el ujo de alimentaci on F , gracar la respuesta no lineal a lazo abierto correspondiente a Cb , T , Ca y Tc .
40
Tabla 2.5: Par ametros nominales del reactor qu mico con chaqueta de enfriamiento. S mbolo R Ea H U c Cp Cp c S V Vc Tl0 Tc0 Ca0 : Descripci on Coeciente de la velocidad de reacci on Constante de los gases ideales Energ a de activaci on Entalp a de reacci on Coeciente global de transmisi on de calor Densidad del liquido Densidad del refrigerante Calor espec co del l quido Calor espec co del refrigerante Supercie efectiva de intercambio de calor Volumen del tanque Volumen de la chaqueta Temperatura del liquido entrante Temperatura del refrigerante entrante Concentraci on del liquido de entrada Valor 29.063 8.314 2100 2100 4300 800 1000 3 4.1868 24 24 8 34 20 8 Unidades h1 kJ/K kmol kJ/kmol kJ/kmol kJ/(h m2 K) kg/m3 kg/m3 kJ/(kg K) kJ/(kg K) m2 m3 m3
oC oC
kmol/m3
(d) Para un cambio de 1 m3 /h en el ujo de enfriamiento Fc , gracar la respuesta a lazo abierto no lineal del sistema correspondiente a Cb , T , Ca y Tc . Problema 2.7 : Motor DC No Lineal La gura 2.14 muestra un motor DC en el cual el voltaje de armadura se mantiene constante mientras que el voltaje de campo es variable. El modelo de este motor ha sido tomado de [14]. El balance el ectrico en el devanado del estator se describe como:
+ Vr -
Rr
Lr
Ls
Rs
- Vs +
Fig. 2.14: Nonlinear DC motor.
Ls
dIs + Rs If = Vs dt
2.3 Problemas
41
donde Is es la corriente del estator, Vs es el voltaje del estator, Rs y Ls son la resistencia e inductancia del devanado del estator respectivamente. El balance el ectrico en el devanado del rotor resulta: Lr dIr + Rr Ir = Vr E dt
donde Ir es la corriente del rotor, Vr es el voltaje del rotor, Rr y Lr son la resistencia e inductancia del devanado del rotor respectivamente, y E es el voltaje de fuerza contra electromotriz. Considerando s olo fricci on viscosa, el balance mec anico en la carga est a dado por: d J + F = T dt donde representsa la velocidad angular del eje del motor, J denota la inercia de la carga, F es la constante de fricci on viscosa, y T es el torque de carga. Si denota el ujo asociado con el devanado del estator, entonces: E = Ke T = Km Ir = Ls Is
donde Ke y Km son constantes. Asumiendo 100 % de eciencia en la conversi on de energ a, entonces Ke = Km = K . Para el sistema descrito considere que el voltaje u = Vs es la entrada del sistema y seleccione como variables de estado: x1 = Is , x2 = Ir , x3 = . Luego: (a) Determine el modelo de Lagrange del motor DC. (b) Determine el modelo en el espacio de estado. Problema 2.8 : Manipulador Polar Vertical La gura 2.15 muestra un manipulador rob otico polar vertical de 2GDL extra do de [25]. a) Determinar SU modelo de Lagrange. b) Determinar SUS ecuaciones de estado y de salida. Problema 2.9 : Manipulador Polar Horizontal La gura 2.16 muestra un manipulador rob otico polar horizontal de 2GDL extra do de [25]. a) Determinar SU modelo de Lagrange. b) Determinar SUS ecuaciones de estado y de salida. Problema 2.10 : Manipulador Rob otico TraslacionalEsf erico (MRTE) La Fig. 2.17 muestra el Manipulador Rob otico TraslacionalEsf erico (MRTE). Este manipulador es una combinaci on del manipuladores MRT (Fig. 2.5) descrito en la subsecci on 2.2.1 y el manipulador MRE (Fig. 2.8) descrito en la subsecci on 2.2.2. Determinar su modelo de Lagrange y su modelo en el espacio de estado empleando las ecuaciones de Lagrange.
42
L1 m1
11 00 00 11
d1
m2
1 0
m1
00 L 11 1
d1
00 11
m2
1 0
Problema 2.11 : Manipulador Rob otico Esf erico de 3GDL (MRE3) La Fig. 2.18 muestra el Manipulador Rob otico Esf erico de 3 GDL (MRE3). Este maon nipulador es una extensi on del manipulador MRE (Fig. 2.18) descrito en la subsecci 2.2.2. Determinar su modelo de Lagrange y su modelo en el espacio de estado empleando las ecuaciones de Lagrange. Considerar longitudes L1 = L2 y masas m1 = m2 de los brazos. Problema 2.12 : Motor S ncrono de Im an Permanente El modelo matem atico de un motor s crono de im an permanente (MSIP) en un sistema de referencias s crono, o el denominado sistema dq, se formula como: vd = R id + vq d dd q dt dq = R iq + + d dt = Ld id + m
q = Lq iq
2.3 Problemas
43
mh Lh
y
Efector Final
Lb
mb
Brazo
Motor 1
11 00 00 11 00 11
00 11 00 11 111 000 00 11 000 111 000 111 1111 0000 F 1111111111111111111111111111 0000000000000000000000000000
Motor 3 b Base Disco d a Motor 2 Carro
Polea
11 00 00 11 00 11
mp rp
M3 SERVOMOTOR q 2 M2 a BASE b
DISCO
q3 m2 L2
L1 Lh
m1 mh mb EFECTOR FINAL
rd M1
a y md
q1
Fig. 2.18: Manipulador Rob otico Esf erico de 3GDL (MRE3). Te = 3 p[m iq (Lq Ld ) id iq ] 2 dr Te = TL + B r + J dt = p r
44 donde: vd , vq id , i q d , q m R Ld , Lq Te , TL J B p r
Voltajes en los ejes d y q del estator. Corrientes en los ejes d y q del estator. Flujos magn eticos en los ejes d y q del estator. Flujo creado por los magnetos del rotor. Resistencia del estator. Inductancias en los ejes d y q del estator. Torques electromagn etico y de carga. Momento de inercia. Coeciente de fricci on viscosa. N umero de pares de polos. Velocidad del rotor en frecuencia angular. Frecuencia del inversor.
Determinar el modelo de Lagrange y la ecuaci on de estado del MSIP. Los estados del sistema son id , iq y wr . Las entradas son vd y vq y la salida es el toque Te .
Cap tulo 3
Control Optimo
El procedimiento de dise no del sistema de control optimo presentado en este cap tulo se puede aplicar a una gran clase de procesos no lineales, algunos de los cuales ya fueron propuestos en el cap tulo 2. Este cap tulo trata el problema del control optimo cuadr atico gaussiano, denominado as porque el ndice de rendimiento o funci on de costo que emplea es una funci on cuadr atica de los estados y de las se nales de control. La soluci on del problema de control planteado consiste en determinar un extremo de la funci on de costo mediante minimizaci on con el prop osito de generar la ley de control optima. La conguraci on del sistema de control optimo no lineal desarrollado en este cap tulo comprende el modelo no lineal multivariable del sistema a controlar, un observador no lineal para estimar los estados del sistema y un controlador de realimentaci on de estados del tipo proporcionalintegral. El dise no del sistema de control optimo (Fig. 3.1) consiste en producir una fuerza de control U que sea capaz de hacer que el vector de salida Y del sistema (la salida controlada) siga al vector de referencias deseadas Rd cumpliendo ciertas especicaciones de dise no, no obstante la presencia de disturbios estoc asticos gaussianos actuando sobre el sistema en operaci on. Con el prop osito de validar el procedimiento de dise no propuesto en la secci on 3.5, sistemas de control optimo no lineal han sido dise nados e implementados en tiempo real para los sistemas: (1) Manipulador rob otico de 1GDL. (2) Manipulador rob otico esf erico. (3) Manipulador rob otico traslacional. (4) Tanque de agua
3.1.
La conguraci on del sistema de control optimo no lineal empleada en este cap tulo se ilustra en la Fig. 3.1. Tal conguraci on combina en su dise no la representaci on de un sistema no lineal, un observador no lineal para estimar los estados del sistema y una ley de control de realimentaci on de estados del tipo proporcional integral. El objetivo del sistema de control optimo consiste en seleccionar una fuerza de control U capaz de minimizar la diferencia entre el vector de salida Y del sistema y el vector de trayectorias de referencia deseadas R, a pesar de la presencia de incertidumbres en los par ametros y de disturbios estoc asticos gaussianos actuando sobre
46 el sistema controlado.
R
z z
Control Optimo
SISTEMA
OBSERVADOR K X
La implementaci on en tiempo real del sistema mostrado en la gura 3.1 opera como sigue: despu es de cada tiempo de discretizaci on, el observador no lineal estima los estados X del sistema empleando los datos proporcionados por el vector de entrada U y el vector de salida Y. Invocando el bien conocido teorema de la separaci on [15], tales estados estimados y la integral del error z, se usan para computar la ley de control U = K X + KI z. La se nal U, que es del tipo proporcionalintegral, act ua sobre el sistema para hacer que el error entre Rd y la salida Y tienda a cero cumpliendo ciertas especicaciones de dise no.
3.2.
El sistema din amico no lineal multivariable (de m ultiples entradas U y m ultiples salidas Y) se describe como: = f (X, U) + v X X1 . X= . . Xn Y = U1 . U= . . f = Um h(X) + w v1 . v= . . vn X(0 ) = 0 Y1 . Y= . . Yp h1 (X) . . h= . hp (X) (3.1) w1 . w= . . wp
f1 (X, U) . . . fn (X, U)
donde X es el vector de estado, U es el vector de control (la entrada al sistema) e Y es el vector de salida. Asumiremos que las funciones vectoriales de variable vectorial f (X, U) y h(X) son operadores no lineales diferenciables que representan la din amica del sistema y la din amica de la salida respectivamente. Los vectores v de orden n 1 y w de orden p 1 son los disturbios en los estados del sistema (ruidos en los estados) y en sus salidas (ruidos de medici on) respectivamente.
47
Sean X0 , U0 e Y0 los vectores de referencia (o nominales) de X, U e Y respectivamente. Si la entrada del sistema se selecciona exactamente igual a U0 , su respuesta ser a X0 . Entonces X0 satisface: 0 = f (X0 , U0 ) + v X Y0 = h(X0 ) + w X0 (0 ) = 0 (3.2)
Si la entrada del sistema U no es exactamente, pero s muy cercana a U0 , el vector de estado X resultante diere muy poco de X0 . Para tal situaci on, las trayectorias actuales pueden formularse como: X = X0 + x U = U0 + u Y = Y0 + y (3.3)
donde los vectores residuales y, u y x representan desviaciones con respecto a los correspondientes vectores de estado, de control y de salida respectivamente. Reemplazando (3.3) en (3.1) produce: 0+x X = f (X0 + x, U0 + u) + v Y0 + y = h(X0 + x) + w (3.4)
Como hemos asumido que las desviaciones actuales son peque nas, entonces el sistema (3.4) admite ser linealizado alrededor de un vector de trayectorias nominales o de referencia X0 . La linealizaci on de (3.4) empleando operadores jacobianos alrededor de X0 y U0 resulta: x Ax + Bu + v y Cx + w donde: A = C =
f1 X1
x(0 ) = 0 (3.5)
. . .
fn X1 h1 X1
.. . .. .
f1 Xn
(X0 ) (X0 ,U0 )
B=
. . .
f1 U1
. . .
fn Xn h1 Xn
fn U1
.. .
f1 Um
(X0 ,U0 )
. . .
fn Um
. . .
. . .
(3.6)
hp X1
hp Xn
Observar que las matrices jacobianas Ann , Bnm , Cpn y Dpm necesitan ser evaluadas alrededor de los vectores de referencia X0 y U0 .
3.3.
El Controlador PI Optimo
La Fig. 3.2 muestra el sistema de control optimo proporcional integral a emplear para la deducci on de la correspondiente ley de control. Notar que en dicha gura no aparece el observador de estados. Adem as, el sistema a controlar emplea la descripci on
48
z
Control Optimo
z KI
u B
A K
Fig. 3.2: Sistema de control optimo linealizado con controlador PI (Proporcional Integral) de realimentaci on de estados.
lineal dada en (3.5). Sin considerar los vectores gaussianos v y w (estos vectores se incluyen al nal), de la gura 3.2 se obtiene: x = Ax + Bu y = Cx u = Kx + KI z z = R y = R Cx (3.7)
donde x es el vector de estado de orden n, u es el vector de control de orden m, y es el vector de salida de orden p, z es el vector de salida del integrador de orden p, R es el vector de referencias deseadas de orden p, A es la matriz de estado de dimensi on n n, B es la matriz de control de dimensi on n m y C es la matriz de salida de dimensi on p n. De (3.7) se puede formular: x (t) z (t) = A 0 C 0 x(t) z(t) + B 0 u(t) + 0 I R(t) (3.8)
donde I es la matriz identidad de orden p y las matrices y vectores 0 poseen dimensiones apropiadas. Dado que (3.8) es cierto para cualquier t, entonces para un tiempo nal tf se tiene: x (tf ) z (tf ) = A 0 C 0 x(tf ) z(tf ) + B 0 u(tf ) + 0 I R(tf ) (3.9)
3.3 El Controlador PI Optimo donde: xe = x(t) x(tf ) ze = z(t) z(tf ) ue = u(t) u(tf ) Re = R(t) R(tf )
49
(3.11)
son los errores del sistema. Dado que se desea un comportamiento asint oticamente estable del sistema controlado, entonces los errores xe , ze y ue deben de tender a cero, mientras que el error Re debe de ser nulo cuando se alcance el estado estacionario. Por consiguiente, la ecuaci on de estado del error (incluyendo los vectores de ruido gaussiano) toma la forma: e = Aa e + Ba ue + v e = xe ze Aa = e(0 ) = 0 A 0 C 0 Ba = B 0 (3.12)
donde el vector de error e es de orden n + p, el vector de ruido gaussiano v es ahora de orden n + p y las matrices Aa y Ba son de orden (n + p) (n + p) y (n + p) m respectivamente. De la misma manera, la ley de control u = Kx + KI z dada en (3.7) toma la forma: ue = Kxe + KI ze = Ka e Ka = [K KI ] (3.13)
donde la matriz de ganancia Ka es de orden m (n + p). Observar que la ecuaci on de estado del error (3.12) y la ley de control residual (3.13) poseen la misma estructura que las ecuaciones de estado y de control del sistema dado en (3.7). Esta similitud nos permite ahora determinar la matriz de ganancia optima Ka como sigue [15]. Siempre que el sistema descrito por (3.12) cumpla la siguiente condici on de controlabilidad: rango Ma = rango Ba Aa Ba (Aa )n1 Ba = n + p (3.14)
donde Pa = (Pa )T de orden (n + p) (n + p) es la u nica matriz soluci on denida positiva de la siguiente ecuaci on asociada de Riccati: Pa (Aa + I) + (Aa + I)T Pa Pa Ba R1 (Ba )T Pa + Qa = 0 (3.16)
Por lo tanto, la ley de control de realimentaci on de estados (el controlador PI de realimentaci on de estados): u = Ka xa = K KI x z (3.17)
Control Optimo
(3.18)
En (3.18), Qa = (Qa )T de orden (n + p) (n + p) es una matriz semi-denida positiva, R = RT de orden m m es una matriz denida positiva y 0 es una constante. Observar que R y Qa son matrices de sintonizaci on que sirven para ponderar el rendimiento del sistema. Agregando los valores estacionarios U y X a ambos miembros de (3.17), se obtiene la ley de control actual U: u + U = U = Ka Xa = K KI x+X z = K KI X z (3.20)
De acuerdo al teorema de la separaci on [15], los controladores de realimentaci on de estado se pueden implementar empleando los estimados de los estados en lugar de los estados actuales del sistema. Por consiguiente, la ley de control (3.20) se puede implementar tambi en como: U = Ka Xa = K KI X z (3.21)
Para obtener el vector de estado estimado X emplearemos un observador no lineal (section 3.4). El vector estimado z no necesita estimarse ya que se obtiene directamente integrando la salida actual Y.
3.4.
Consideremos la estructura de la gura 3.3 para la estimaci on de estados y control del sistema descrito en (3.1). El observador no lineal ilustrado se puede describir por: X = f (X, U) + H(Y Y) Y = h(X) X(0 ) = 0 (3.22)
donde Y y X son los vectores estimados de Y y X respectivamente, y H es una matriz residual de ganancia de orden n p a ser determinada. Por otra parte, asumamos que los disturbios v y w en (3.1) sean ruido blanco gaussiano con media (o esperanza) nula. El ruido blanco gaussiano posee la propiedad de ser no correlacionado en cada instante de tiempo. En otras palabras, no existe una interrelaci on (correlaci on) entre v y w. La propiedad de la media nula implica que toda la informaci on estad stica del ruido se acumula en la covarianza de los disturbios. En t erminos matem aticos: E [v(t)vT ( )] = V (t ) E [w(t)w ( )] = W (t )
T
51
+ +
U U a
x
f(X, U)
h( )
+
h(X)
f( ) ^ X
z
^a X
^ X
z
^ X
^ X
+ +
^ U) f(X, f( )
U
^ Y
H
Fig. 3.3: Estructura del sistema de control optimo para estimaci on de estados y control.
donde E [.] es la operaci on matem atica esperanza, (t ) es la funci on delta de Kronecker denida como: (t ) = 1 para t = y nula en otro caso. Tambi en, V de orden n n y W de orden p p son matrices de covarianza denidas positivas. Es un hecho conocido que un sistema lineal de la forma dada en (3.7) pero con v = w = 0, es observable siempre que su correspondiente matriz de observabilidad N posea rango completo: C CA rango N = rango (3.24) =n . . . CAn1 Cuando el modelo linealizado dado en (3.7) es completamente observable, la matriz residual de ganancia H del observador no lineal descrito en (3.22), se calcula de: H = SCT W1 (3.25)
donde S = ST de orden n n es la u nica matriz denida positiva soluci on de la siguiente ecuaci on asociada de Riccati: 0 = S(A + I)T + (A + I)S SCT W1 CS + V (3.26)
El estimador de estados resultante mostrado en la gura 3.3 es conocido tambi en como el ltro extendido de Kalman de ganancia constante H [15].
52
Control Optimo
3.5.
Procedimiento de Dise no
El procedimiento de dise no del sistema de control optimo desarrollado sigue los pasos siguientes: (1) Formular el problema: describir el sistema a controlar, denir las especicaciones de dise no y determinar el modelo no lineal del sistema en la forma dada en (3.1). (2) Determinar el modelo linealizado del sistema (ecuaci on (3.5)). (3) Determinar la controlabilidad y observabilidad del sistema linealizado (ecuaciones (3.14) y (3.24) respectivamente). (4) Computar la matriz de ganancia Ka de la ley de control PI del sistema (ecuaciones (3.15) y (3.16)). (5) Computar la matriz de ganancia H del observador no lineal del sistema (ecuaciones (3.25) y (3.26)). (6) Simular el sistema de control optimo empleando las ecuaciones din amicas no lineales (3.1) y (3.22). (7) Implementar el sistema de control optimo (hardware). (8) Desarrollar el software de control en tiempo real del sistema. (9) Ejecutar pruebas de funcionamiento en tiempo real. Ejemplo 3.1 Dise nar un sistema de control optimo para el manipulador rob otico con articulaci on on 2.1.2. el astica (MRAE) mostrado en la Fig. 2.3 y descrito en la subsecci Soluci on: La ecuaci on de estado no lineal del MRAE, despreciando la inductancia de armadura La se muestra en la ecuaci on (2.39). Haciendo sin x1 = x1 en (2.39), la ecuaci on de estado lineal toma la forma: x = Ax + Bu 0 0 B = x4 a44 mb + mh 2 y = Cx 0 0 0
nKm Kb Jeq Ra
0 x2 BL a 21 JL A= 0 0 K 0 Jeq a21 =
0
K JL
C=
(3.27)
1 0 0 0
m K Jeq
Lg K JL JL
a44 =
Dado que el sistema es completamente controlable y completamente observable, la ganancia Ka del controlador y la ganancia H del observador se determinaron usando los comandos lqr y lqe de Mathscript respectivamente. Las matrices requeridas por estos comandos se jaron como sigue: R = 30I, Qa = 50I, V = 0.01I, W = 0.01 I y G = I, donde I es la matriz identidad. El par ametro de la funci on de costo se j o en 3.5. La simulaci on se llev o a cabo ejecutando el archivo ocmraer.m (que se encuentra t en el CD adjunto) para se nales de referencia R tipo escal on. La relaci on z = 0 Yd
53
se aproxim o en el dominio discreto como z(k +1) = z(k )+ T x(k ), donde T=0.001 s es el tiempo de muestreo y k = t/T es el tiempo discreto. El resultado de la simulaci on se muestra en la Fig. 3.4. Notar que las especicaciones de dise no: porcentaje de sobreimpulso nulo, error en estado estacionario nulo y tiempo de estabilizaci on menor de 1.5 s se cumplen satisfactoriamente.
1 0.8 Posicin x1 [rad] 0.6 0.4 0.2 0
8 TIEMPO
10 [s]
12
14
16
Fig. 3.4: Posici on angular controlada del brazo del manipulador MRAE.
Ejemplo 3.2 Dise nar un sistema de control optimo para el proceso tanque de agua mostrado en la Fig. 2.4 y descrito en la subsecci on 2.1.3. Soluci on: La ecuaci on de estado del sistema tanque de agua se muestra en (2.51). Como el sistema es completamente controlable y completamente observable, la ganancia Ka del controlador y la ganancia H del observador se determinaron usando los comandos lqr y lqe de MathScript respectivamente. Las matrices de sintonizaci on a requeridas por tales comandos se jaron como sigue: R = 4000I, Q = 50 I, donde I es la matriz identidad. Cabe anotar que no se requiere observador dado que las variables de estado son las variables de salida medibles. El par ametro de la funci on de costo se j o en 0.008. La simulaci on se ejecut o empleando el archivo octanque.m (que se encuentra t en el CD adjunto) para se nales de referencia R tipo escal on. La relaci on z = 0 Yd se aproxim o en el dominio discreto como z(k + 1) = z(k ) + T x(k ), donde T = 1 s es el tiempo de muestreo y k = t/T es el tiempo discreto. El resultado de la simulaci on
54
Control Optimo
se muestra en la Fig. 3.5. Notar que las especicaciones de dise no: porcentaje de sobreimpulso nulo, error en estado estacionario nulo y tiempo de estabilizaci on menor de 1.5 s se cumplen satisfactoriamente.
0.4 NIVEL [m] 0.2 0
500
1000
1500
2000
2500
3000
3500
4000
500
1000
1500
2000 TIEMPO
2500 [s]
3000
3500
4000
500
500
1000
1500
2000
2500
3000
3500
4000
CALOR [V]
100 0 100
500
1000
1500
2000 TIEMPO
2500 [s]
3000
3500
4000
3.6.
3.6.1.
Aplicaciones
Control Optimo del Manipulador Rob otico de 1GDL (MR1)
La ecuaci on de estado del MRE1 se muestra en la ecuaci on (2.20). Este sistema se puede linealizar haciendo sin x1 no. Entonces: = x1 , asumiendo que x1 es peque x = Ax + Bu Q A = Jeq 0 C= Por lo tanto: Aa = A 0 C 0 Ba = B 0 Ca = C 0 0 1
eq Jeq b nK La
y = Cx D= 0 B= 0
Ka La
0
nKm Jeq a R La
1 0 0
Es f acil comprobar que el sistema es completamente controlable y completamente observable. Por ello, la ganancia Ka del controlador y la ganancia H del
3.6 Aplicaciones
55
observador fueron determinadas usando los comandos lqr y lqe de Mathscript, respectivamente. Las matrices requeridas por estos comandos se jaron en: R = 1I, Qa = 0.5I, V = 0.1I, W = 0.1I, G = I, Re = 0.1I, Qe = 0.3I, donde I es la matriz identidad. El par ametro de la funci on de costo se j o en 10. La simulaci on se lleva a cabo ejecutando el archivo ocmr1r.m para el caso de regulaci on. Tal archivo se lista en el CD adjunto para las se nales de referencia tipo t escal on. La relaci on z = 0 Yd se aproxim o en el dominio discreto como z(k + 1) = z(k ) + T x(k ), donde T=0.001 s es el tiempo de muestreo y k = t/T es el tiempo discreto. La simulaci on se muestra en la Fig. 3.6. Notar que las especicaciones de dise no porcentaje de sobreimpulso nulo, error en estado estacionario nulo y tiempo de estabilizaci on menor de 1 s se cumplen satisfactoriamente.
1 0.8 Angulo [rad] 0.6 0.4 0.2 0
4 5 6 TIEMPO EN SEGUNDOS
10
Fig. 3.6: Posiciones angulares de la base y del del brazo MR1 controladas.
3.6.2.
.
La ecuaci on de estado del MRE se muestra en la ecuaci on (2.122). Este sistema se puede linealizar usando las matrices jacobianas dadas en (3.6). Sin embargo, aplicaremos el m etodo de linealizaci on aproximada que consiste en asumir que, cuando x es sucientemente peque no, se cumple: sin(x) = x, cos(x) = 1, x2 = 0, etc. Aplicando esta aproximaci on en (2.122) se obtiene (el sobrerayado indica un valor estacionario): M 11 = Ra (J1 + Jeq ) nKm KA
Control Optimo
0 0 0 0 1 M 11 0 1 0 M 22
D=
0 0 0 0
Ca =
C 0
Usando el hecho de que el sistema es completamente controlable y completamente observable, la ganancia Ka del controlador y la ganancia H del observador fueron determinadas usando los comandos lqr y lqe de Mathscript, respectivamente. Las matrices requeridas por estos comandos se jaron como sigue: R = 0,1I, Qa = 2I, V = 0,1I, W = 0,1I y G = I, donde I es la matriz identidad. El par ametro de la funci on de costo se j o en 5.5. La simulaci on se llev o a cabo ejecutando el archivo ocmrer.m (que se encuentra en el CD adjunto), para las se nales de referencia R1 = 1 rad y r2 = 1 rad. La relaci on t z = 0 Yd se aproxim o en el dominio discreto como z(k + 1) = z(k ) + T x(k ), donde T=0.001 s es el tiempo de muestreo y k = t/T es el tiempo discreto. El resultado de la simulaci on se muestran en la Fig. 3.7. Notar que las especicaciones de dise no porcentaje de sobreimpulso nulo, error en estado estacionario nulo y tiempo de estabilizaci on menor de 1 s se cumplen satisfactoriamente.
3.6.3.
.
La ecuaci on de estado lineal del sistema MRT se muedtra en (2.92). Por consiguiente: A 0 B Aa = Ba = Ca = C 0 C 0 0 Como el sistema es completamente controlable y completamente observable, la ganancia Ka del controlador y la ganancia H del observador fueron determinadas usando los comandos lqr y lqe de Mathscript, respectivamente. Las matrices de ponderaci on pedidas por estos comandos se jaron en: R = 0.01I, Qa = 40I, V = 0,1I, W = 0,1I y G = I, donde I es la matriz identidad. El par ametro de la funci on de costo se j o en 6.
3.7 Problemas
Posicin X1 [rad] 1 0.5 0 10 0 10 1 0.5 0 10 0 10
57
Control U1 [V]
Posicin X2 [rad]
Control U2 [V]
4 Tiempo [segundos]
Fig. 3.7: Posiciones angulares de la base y del del brazo MRE controladas.
La simulaci on se llev o a cabo ejecutando el archivo ocmrts.m (que se encuentra en el CD adjunto), para las se nales de referencia R1 y R2 sinusoidales. La relaci on t z = 0 Yd se aproxim o en el dominio discreto como z(k + 1) = z(k ) + T x(k ), donde T=0.001 s es el tiempo de muestreo y k = t/T es el tiempo discreto. El resultado de la simulaci on se muestra en la Fig. 3.8. Notar que las especicaciones de dise no porcentaje de sobreimpulso nulo, error en estado estacionario nulo y tiempo de estabilizaci on menor de 1 s se cumplen satisfactoriamente.
3.7.
Problemas
Problema 3.1 : Sistema de Plataformas Dise nar un sistema de control de posici on optimo para el sistema de plataformas mostrado en la Fig. 2.11 y descrito en el problema 2.4. Problema 3.2 : Columna de Destilaci on En el problema 2.5 se describe la columna de destilaci on para fraccionar petr oleo pesado, mostrado en La Fig. 2.12. Dise nar un sistema de control optimo para este sistema. Problema 3.3 : Reactor Qu mico
58
Posicin X1 [metros]
Control Optimo
20 10 0 10 100 50 0 50 2 0 2 5 0 5 0 2 4 6 8 10 12 14 16 0 2 4 6 8 10 12 14 16
Posicin X2 [rad]
Control U1 [V]
10
12
14
16
Control U2 (voltios)
8 10 Tiempo [segundos]
12
14
16
Fig. 3.8: Posiciones angulares controladas de la base y del del brazo del MRT.
Dise nar un sistema de control optimo para el reactor qu mico con chaqueta de enfriamiento mostrado en la Fig. 2.13 y descrito en el problema 2.6. Problema 3.4 : Motor DC No Lineal En el problema 2.7 se describe un motor DC en el cual el voltaje de armadura se mantiene constante mientras que el voltaje de campo es variable (ver Fig. 2.14. Dise nar un sistema de control optimo para este motor. Problema 3.5 : Manipulador Polar Vertical La Fig. 2.15 (problema ) muestra un manipulador polar vertical. Dise nar un sistema de control optimo para este manipulador. Problema 3.6 : Manipulador Polar Horizontal La Fig. 2.16 (problema ) muestra un manipulador polar horizontal. Dise nar un sistema de control optimo para este manipulador. Problema 3.7 : Manipulador Rob otico TraslacionalEsf erico (MRTE) Dise nar un sistema de control optimo para el manipulador rob otico traslacional esf erico mostrado en la Fig. 2.17 y descrito en el problema 2.10.
3.7 Problemas Problema 3.8 : Manipulador Rob otico Esf erico (MRE3)
59
Dise nar un sistema de control optimo para el manipulador rob otico esf erico mostrado en la Fig. 2.17 y descrito en el problema 2.11. Problema 3.9 : Motor S ncrono de Im an Permanente La din amica del motor s ncrono de im an permanente se describe en el problema 2.12. Dise nar un sistema de control optimo del torque para este motor.
Cap tulo 4
4.1.
Conguraci on de un SCAMR
La gura 4.1 ilustra la conguraci on de un Sistema de Control Adaptativo con Modelo Referencial (SCAMR) que puede ser empleado en una gran variedad de aplicaciones. El SCAMR se compone b asicamente de un modelo de referencia, un controlador adaptativo, el sistema a controlar y un mecanismo de adaptaci on . El esquema en consideraci on se denomina un SCAMR paralelo debido a la ubicaci on relativa del modelo referencial con respecto al sistema. El modelo de referencia, el cual est a excitado por una entrada externa r, es un sistema din amico auxiliar usado para especicar la respuesta deseada del sistema. Tal respuesta debe de ser lograda por el SCAMR a pesar de las restricciones generadas por inexactitudes en el modelado de la estructura del modelo de referencia y el
62
MODELO REFERENCIAL
r
CONTROLADOR ADAPTATIVO
yd
u
SISTEMA NO LINEAL
+
y
MECANISMO DE ADAPTACIN
~ y
Fig. 4.1: Conguraci on de un Sistema de Control Adaptativo con Modelo Referencial (SCAMR).
modelo del sistema. En este cap tulo se emplea un modelo de referencia con matriz de transferencia unitaria lo cual implica que r = qd . El mecanismo de adaptaci on es un conjunto de bloques interconectados usados para implementar la ley de adaptaci on. De hecho, la ley de adaptaci on es el algoritmo de control empleado para modicar los par ametros del controlador adaptativo, de modo tal que el SCAMR permanezca estable y que el error de seguimiento q q = q qd converja a cero a pesar de la presencia de par ametros del sistema variantes con el tiempo y disturbios externos. El m etodo directo de Lyapunov es empleado para determinar que el SCAMR dise nado garantice convergencia global de las se nales controladas con respecto a sus trayectorias deseadas. Se asume que el sistema es no lineal. Por consiguiente, su descripci on puede ser imprecisa; esto es, el modelo din amico del sistema puede presentar incertidumbres en su estructura o din amica no modelada en su representaci on. Ya que la descripci on del sistema permite incertidumbres, el control adaptativo (en general) se puede considerar una aproximaci on particular de control robusto.
4.2.
4.2.1.
Una gran clase de sistemas no lineales se pueden describir mediante su modelo din amico de Lagrange: q1 u1 . . M(q)q + P(q, q )q + d(q) = u q= . u= . (4.1) . . qm um donde las matrices M, P y d representan la inercia del sistema a controlar, los torques centr petos y de Coriolis, y los torques gravitacionales respectivamente. Tambi en, q es el vector de coordenadas generalizadas y u es el vector de control. El objetivo de control del SCAMR es dise nar una ley de control u capaz de hacer que la salida del sistema q(t) siga a la trayectoria deseada qd (t) con velocidad
63
suciente a pesar de la presencia de incertidumbres en los par ametros. Asumamos que todos los t erminos en (4.1) dependen linealmente de un vector de par ametros a con elementos conocidos, a saber: Ya = u (4.2) donde Y es una matriz conocida. Considere la siguiente ley de control: u = Ya KD s (4.3)
donde KD s es el t ermino derivativo e Ya es el t ermino anticipativo. En los t erminos descritos, a es el vector estimado de par ametros, KD (la ganancia derivativa) es una matriz sim etrica constante denida positiva y s es un vector de supercies deslizantes cuyos elementos si , i = 1, . . . , m se denen mediante la ecuaci on escalar si (q, t) = 0, de modo tal que: si = ( d + i )n1 qi = (p + i )n1 qi dt (4.4)
donde i > 0 es una constante (el ancho de banda), p es el operador de Laplace y: qi = qi qdi es el error de seguimiento. Por ejemplo, para n = 2, (4.4) se convierte en un error de seguimiento compuesto de velocidad y posici on: + q = q q r s=q donde: s1 . s= . . sm q = q qd q r = q d q q r1 . = q . r . q
rm
(4.5)
q 1 . = q . . q
m
1 0 0 2 . . . . . . 0 0
... ...
... . . . m
0 0 . . .
(4.6)
donde q T Mq es la energ a cin etica del sistema y q T (u d) es la potencia de entrada generada por el actuador. Diferenciando el miembro izquierdo de (4.7): 1 T q T M q+ q Mq =q T (u d) 2 De (4.1) obtenemos: M q = u d Pq . Sustituyendo este t ermino en (4.8): 2P)q q T (M =0 (4.9) (4.8)
64
2P) = J es antisim Ha sido establecido en [27], [3] que (M etrica. Por consiguiente: = 2P + J M Considere la siguiente candidata para funci on de Lyapunov: V (t) = 1 T s Ms + aT 1 a 2 (4.11) (4.10)
donde es una matriz sim etrica denida positiva y a = a a es el error de estimaci on de par ametros. Diferenciando (4.11) se obtiene: 1 T 1 a (t) = sT M +a V s + sT M 2 y empleando la relaci on s = q q r (ecuaci on (4.5)) en la expresi on anterior se obtiene: 1 T 1 a (t) = sT (M +a V q + M qr ) + sT Ms 2 produce: Sustituyendo (4.10), (4.3) y M q de (4.1) en V T 1 a (t) = sT (Ya KD s M V qr Pq r d) + a (4.12)
en donde hemos usado el hecho de que sT Js = 0, dado que J es antisim etrica1 . La actualizaci on de los par ametros estimados a se puede formular como: = YT s a mientras que la propiedad de parametrizaci on lineal en (4.12) establece que: Y(q, q ,q r, q r )a = M(q)q r + P(q, q )q r + d(q) Reemplazando (4.14)y (4.13) en (4.12) produce: (t) = sT KD s 0 V (4.15) (4.14) (4.13)
+ q (ver (4.5)), entonces (4.15) garantiza que los errores de Dado que s = q tiendan a 0 conforme t . En otras seguimiento de posici on q y de velocidad q palabras, los errores de seguimiento convergen en la supercie s = 0.
4.2.2.
El Observador de Velocidad
Es conveniente estimar la velocidad angular q del sistema, dado que solo se cuenta con la medici on del vector de posici on q. El estimado de la velocidad angular, , toma la forma: denotada como q =q q d + Ld (q q) (4.16)
donde la matriz de ganancia Ld = d I del observador es diagonal y denida positiva, donde d es una constante positiva.
1 Suponga que sT Js = c = 0, donde c es una constante. Como J es antisim etrica: J = JT ; luego sT Js = c. Entonces, la u nica soluci on posible para la constante es: c = 0
65
4.2.3.
El problema del corrimiento de par ametros hacia valores peligrosos est a asociado con las incertidumbres no param etricas tales como fricciones est atica y de Coulomb, ruidos de medici on, tiempos muertos, entre otros. Tal problema se origina principalmente cuando el SCAMR no est a excitado permanentemente o debido a la presencia del ruido de medici on o de disturbios. El corrimiento de los valores de los par ametros puede causar que el SCAMR se torne inestable si se permite que los par ametros estimados desplacen sus valores hacia valores que puedan provocar que los polos del SCAMR se vuelvan inestables. La experiencia dicta que la presencia de peque nos errores de seguimiento pueden originar el corrimiento de los par ametros a valores peligrosos, debido a que dichas se nales b asicamente contienen ruido y disturbios. La t ecnica m as simple de modicaci on de la ley de control para evitar este problema es detener el mecanismo de adaptaci on en presencia de peque no errores de seguimiento. Esta t ecnica conocida como zonamuertasustituye (4.13) por: = a YT s 0 |s| > |s| < (4.17) donde representa el tama no de la zonamuerta. Ecuaci on (4.17) nos indica que T cuando |s| < , entonces h debe tomar el valor Y s computado en el tiempo de muestreo anterior.
4.2.4.
El procedimiento de dise no del sistema de control adaptativo con modelo referencial desarrollado sigue los pasos siguientes: (1) Formular el problema: describir el sistema a controlar, denir las especicaciones de dise no y determinar el modelo din amico de Lagrange (ecuaci on (4.1)). (2) Construir la ecuaci on de parametrizaci on lineal dada en (4.14) como sigue. Primero estimar el vector q usando el observador de velocidad dado en (4.16): =q q d + Ld (q q) Luego, formular los errores de posici on y velocidad: q = q qd y la funci on de deslizamiento: s = q + q La velocidad y aceleraci on de referencias se formulan como: q r = q d q q r = q d q =q q q d
66
Control Adaptativo con Modelo Referencial Finalmente, formular la matriz de parametrizaci on: Y(q, q ,q r, q r )a = M(q)q r + P(q, q )q r + d(q)
(3) Determinar el vector de par ametros estimados a integrando la ley de adaptaci on T a = Y s (ecuaci on (4.13)). (4) Calcular la ley de control u = Ya KD s (ecuaci on (4.3)). (5) Si fuera necesario, con el n de evitar el corrimiento de los par ametros, emplear la siguiente ecuaci on de la zonamuerta: i = Y T s 0 |s| > |s| < (4.18)
donde representa el tama no de la zonamuerta. (6) Simular el sistema de control adaptativo empleando los resultados de los pasos anteriores. (7) Implementar el sistema de control adaptativo (hardware). (8) Desarrollar el software de control en tiempo real del sistema. (9) Ejecutar pruebas de funcionamiento. Ejemplo 4.1 Dise nar simular un sistema de control adaptativo con modelo referencial para el manipulador rob otico MR1. Soluci on: El modelo din amico de Lagrange del MR1 se muestra en la ecuaci on (2.23). + P + d = u, Para nes de parametrizaci on lineal, tal modelo se formula como: M donde: M= Deniendo: Jeq Ra nKb + nKm KA KA a1 = M P = Beq Ra nKm KA a3 = d= Ra Q sin nKm KA
Ra Q nKm KA Se obtiene la siguiente matriz de parametrizaci on lineal: a1 r q r q r2 sin q a2 Y(q, q ,q r, q r )a = q a3 a2 = P donde el vector de par ametros estimados a se calcula integrando la ley de adaptaci on: a = Y T s. Luego es posible calcular la ley de control u = Ya Kd s. Las Figs. 4.2 y 4.3 muestran los resultados de la simulaci on del sistema de control adaptativo dise nado para controlar las posici on angular del brazo del MR1 para los casos de seguimiento y regulaci on respectivamente. Para obtener tales resultados, ejecutar los programas acmr1s.m y acmr1r.m (ver listados en el CD adjunto). Notar que las especicaciones de dise no porcentaje de sobreimpulso nulo, error en estado estacionario nulo y tiempo de estabilizaci on menor de 1 s se cumplen satisfactoriamente para ambos casos. Los par ametros de sintonizaci on en los dos casos se seleccionaron: = 10, = 0.01, Ld = 30 y Kd = 8.
67
POSICIN q [rad]
5 4
CONTROL u
3 2 1 0 1 0 1 2 3 4 TIEMPO 5 [S] 6 7 8
Fig. 4.2: Posici on angular controlada del brazo del MR1. Caso: seguimiento.
0.4
POSICIN q [rad]
0.3
0.2
0.1
30 20
CONTROL u
10 0 10 20
4 TIEMPO
5 [S]
Fig. 4.3: Posici on angular controlada del brazo del MR1. Caso: regulaci ono.
4.3.
Hemos visto que el procedimiento de dise no descrito en la subsecci on 4.2.4 tambi en se aplica a sistemas que poseen una entrada. Sin embargo, en esta secci on se dise na un SCAMR para sistemas no lineales de una entrada y una salida que poseen una descripci on din amica asociada [3].
4.3.1.
En lo que sigue, la notaci on f (q) denota la q- esima derivada total de f con respecto al tiempo. Es decir: dq f f (q) dtq
68
(n)
+
i=1
i fi (x, t) = bu
(4.19)
y b son constantes donde x = [y y . . . y (n) ]T es el vector de estado de orden n, i desconocidas, y fi son funciones no lineales conocidas. Dividiendo ambos miembros de (4.19) por b, se obtiene: m
h y (n) +
i=1
i fi (x, t) = u
h=
1 b
i =
i b
(4.20)
Denamos el error de seguimiento a la salida: e = y yd donde yd es la trayectoria deseada, de modo tal que el error combinado s se pueda expresar como:
(n1) s = e(n1) + n2 e(n2) + + 0 e = (p)e = y (n1) yr
(4.21)
n2 e(n2) 0 e
en donde los i , i = 0 . . . (n 2), son constantes enteras, p es el operador de Laplace y (p) es un polinomio estable Hurwitz, lo cual signica que todas las ra ces complejas pi = i + ji , i = 1, . . . , n de (p) = 0 verican la condici on i < 0. Asumamos la siguiente ley de control:
m
u=
(n) h yr
ks+
i=1
i fi (x, t)
(n)
(4.22)
donde las constantes k y h poseen el mismo signo. La variable yr , denotada como la variable de referencia de y (n) , se determina de:
(n) yr = yd n2 e(n1) (n)
0 e
Sustituyendo (4.22) en (4.20) nos conduce al error de seguimiento din amico: hs +ks = 0
k
s = e h t
(4.23)
on de la ecuaci on diferencial (4.23), es exponencialNotar que s = e h t , la soluci mente convergente en s. Este hecho garantiza la convergencia del error de seguimiento din amico dado en (4.23).
69
4.3.2.
La Ley de Adaptaci on
Reemplazando los par ametros h y i de (4.22) por sus valores estimados h y i respectivamente, entonces la ley de control del SCAMR toma la forma:
m (n) u = h yr ks+ i=1
i fi (x, t)
(4.24)
hs +ks =
(n) h yr
+
i=1
i fi (x, t)
(4.26)
(4.27)
donde es la ganancia de adaptaci on. Para determinar si el SCAMR garantiza convergencia de seguimiento global, consideremos la siguiente funci on de Lyapunov (ver subsecci on A.1.2):
m
V = |h|s2 + 1 h2 +
i=1
2 i
(4.28)
Usando el hecho de que h sign(h) = |h| y k sign(k ) = |k | y dado que k y h poseen el mismo signo, se puede demostrar f acilmente que: = 2|k |s2 < 0 V (4.29)
lo cual garantiza convergencia de seguimiento global del SCAMR en el sentido del m etodo directo de Liapunov (subsecci on A.1.3). Ahora, considere la ley de adaptaci on: n h = h sgn(h)s yr i = sgn(h)s fi
(4.30)
donde las ganancias de adaptaci on h y k son diferentes para cada par ametro desconocido. Seleccionando la siguiente candidata para funci on de Lyapunov:
m 1 2 1 V = |h|s2 + h h + k i=1 2 i
(4.31)
nos conduce a (4.29), lo cual garantiza converse puede demostrar f acilmente que V gencia de seguimiento global del SCAMR.
70
4.3.3.
Procedimiento de Dise no
El procedimiento de dise no del SCAMR para sistemas de una entrada con forma asiciada es el siguientes: (1) Formular el problema: describir el sistema a controlar, denir las especicaciones de dise no y determinar el modelo no lineal del sistema en su forma asociada dada en (4.19). (3) Dise nar la ley de adaptaci on dada en (4.27). (2) Dise nar la ley de control dada en (4.22). (4) Si fuera necesario, formular las ecuaciones de la zonamuerta dada en (4.17) para evitar el corrimiento de los par ametros. (5) Simular el sistema de control adaptativo empleando los resultados de los pasos anteriores. (6) Implementar el hardware del sistema de control adaptativo. (7) Elaborar el software de control en tiempo real del sistema. (8) Ejecutar pruebas de funcionamiento en tiempo real.
4.4.
4.4.1.
Aplicaciones
Control Adaptativo del Manipulador Rob otico Esf erico
El modelo din amico de Lagrange del MRE se muestra en la ecuaci on (2.121). Para nes de parametrizaci on lineal, tal modelo din amico toma la forma dad en (4.14) M11 0 0 M22 q r + P11 P12 P21 P22 q r + 0 d21 = u1 u2 Ra m2 L2 2 2nKm KA
Este sistema puede ser parametrizado deniendo: M11 = a1 + M22 = a2 P11 = P12 = P21 = P22 = d21 = a4 sin2 q2 2 a2 = a1 = Ra (J1 + Jeq nKm KA 1 J2 + Jeq + m2 L2 2 4 n2 Km Kb Beq + Ra a4 =
Por consiguiente, la propiedad de parametrizaci on lineal dada en (4.14) queda como: a1 a2 1 q r1 0 q r1 sin2 q2 + q r1 0 2 a3 Y(q, q ,q r, q r )a = 1 2 0 q r2 q r2 2 q r1 sin q2 cos q2 sin q2 a4 a5
4.4 Aplicaciones
71
donde el vector de par ametros estimados a se calcula integrando la ley de adaptaci on: T a = Y s. Para determinar el vector de deslizamiento s dada en (4.5), se requiere emplear el observador de velocidad descrito en (4.16). Finalmente, la ley de control se determina de: u = Ya Kd s. Las Figs. 4.4 y 4.5 muestran los resultados de la simulaci on del sistema de control adaptativo dise nado para controlar las posiciones angulares de los brazos del MRE para los casos de seguimiento y regulaci on respectivamente. Para obtener tales resultados, ejecutar los programas scmres.m y scmrer.m (ver listados en el CD adjunto). Notar que las especicaciones de dise no porcentaje de sobreimpulso nulo, error en estado estacionario nulo y tiempo de estabilizaci on menor de 1 s se cumplen satisfactoriamente para ambos casos. Los par ametros de sintonizaci on en los dos casos se seleccionaron: = 4, = 0.1, Ld = 80 y Kd = 20.
POSICIN q1 [rad] 10 5 0
10
12
14
16
CONTROL u1 [V]
1 0 1
POSICIN q2 [rad]
8 TIEMPO
10 [s]
12
14
16
10 5 0
10
12
14
16
CONTROL u2 [V]
1 0 1
8 TIEMPO
10 [s]
12
14
16
Fig. 4.4: Posiciones angulares controladas de los brazos del MRE. Caso: seguimiento.
4.4.2.
El modelo de Lagrange del MRT se muestra en (2.90). Para prop osito de parametrizaci on lineal, tal modelo se formula como: M11 M12 M21 M22 q r + P11 P12 0 P22 q r + 0 d21
72
POSICIN q1 [rad]
1 0.5 0 50 0 50 1 0.5 0 50 0 50
CONTROL u1 [V]
POSICIN q2 [rad]
CONTROL u2 [V]
3 TIEMPO
4 [segundos]
Fig. 4.5: Posiciones angulares controladas de los brazos del MRE. Caso: regulaci on.
a4 = M22
a5 = P11
a6 = P22
Este sistema puede ser parametrizado deniendo: Y(q, q ,q r, q r )a toma la forma: q r1 cos q2 q r2 sin q2 q 2 q r2 0 0 q r1 0 0 0 cos q2 q r1 g sin q2 q r2 0 q r2 a1 a2 a3 a4 a5 a6
donde el vector de par ametros estimados a se calcula integrando la ley de adaptaci on: T a = Y s. Luego se calcula la ley de control u = Ya Kd s. Las Figs. 4.6 y 4.6 muestran los resultados de la simulaci on del sistema de control adaptativo dise nado para controlar las posiciones angulares de los brazos del MRE para los casos de seguimiento y regulaci on respectivamente. Para obtener tales resultados, ejecutar los programas acmrts.m y acmrtr.m (ver listados en el CD adjunto). Notar que las especicaciones de dise no porcentaje de sobreimpulso nulo, error en estado estacionario nulo y tiempo de estabilizaci on menor de 1 s se cumplen satisfactoriamente para ambos casos. Los par ametros de sintonizaci on en los dos casos se seleccionaron: = 10, = 0.01, Ld = 40 y Kd = 17. El modelo din amico del MRE para prop ositos de simulaci on se da en la ecuaci on (??).
4.4 Aplicaciones
POSICIN q1 [rad]
73
5 0 5
CONTROL u1 [V]
20 0 20 POSICIN q2 [rad]
4 TIEMPO
5 [s]
4 2 0
CONTROL u1 [V]
100 0 100
4 TIEMPO
5 [s]
Fig. 4.6: Posiciones angulares de la base y del brazo del MRE controladas. Caso: seguimiento.
4.4.3.
El manipulador rob otico MR1 mostrado en la gura 2.1 se describe en la subsecci on 2.1.1. La forma asociada del sistema MR1 se determin o en (2.27). Para prop ositos de simulaci on en el caso de seguimiento, la trayectoria deseada y sus derivadas toman la forma: yd (t) = sin W t y d = W cos W t y d = W 2 sin W t
3 dyd = W 3 cos W t dt3
Para el caso de regulaci on, ya que la trayectoria deseada es constante, las derivadas de orden superior son nulas. Volviendo al primer caso, el error de seguimiento y sus derivadas se formulan como: e = y yd e = f2 y d e = f1 y d
2 = sign(h) s f2
74
POSICIN q1 [rad]
0.5
10
12
14
16
CONTROL u1 [V]
100 0 100
POSICIN q2 [rad]
8 TIEMPO
10 [s]
12
14
16
0.5 0 0.5
10
12
14
16
CONTROL u1 [V]
100 0 100
8 TIEMPO
10 [s]
12
14
16
Fig. 4.7: Posiciones angulares de la base y del brazo del MRE controladas. Caso: regulaci ono.
3 = sign(h) s f3 4 = sign(h) s f4 Finalmente, la ley de control se formula: u(t) = h Dado que: y = y (k ) y (k 1) T y = y (k ) y (k 1) T2 dy 3 y (k ) y (k 1) = dt3 T3
3 dyr k s + 1 f1 + 2 f2 + 3 f3 + 4 f4 dt3
donde k = t/T , siendo T el tiempo de muestreo, entonces se puede demostrar que el modelo discretizado del sistema resulta: y (k +1) = 3y (k ) 3y (k 1)+ y (k 2)+ T3 (1 f1 (k ) 2 f2 (k ) 3 f3 (k ) 4 f4 (k )+ u) h
Las Figs. 4.8 y 4.9 muestran el brazo del MR1 controlado para los casos de seguimiento y regulaci on. Para obtener tales resultados ejecutar los programas acmr1asociadas.m (para el caso de seguimiento) y acmr1asociadar.m (para el caso de regulaci on), cuyos listados se encuentra en el CD adjunto. Para regulaci on, los par ametros de sintonizaci on para las ra ces deseadas r1 = 3 y r2 = 2 fueron: 0 = r1 r2 , 1 = (r1 + r2 ), k = 5, = 10, con un tiempo de muestreo T = 0.005 s. Para seguimiento, s olo el par ametro k cambi o al valor 10.
4.5 Problemas
1
75
Posicin y [rad]
0.5
0.5
10
15
20
25
Control u [V]
10 15 Tiempo en segundos
20
25
Fig. 4.8: Posici on angular controlada del brazo del manipulador MR1. Caso: seguimiento.
4.5.
Problemas
Problema 4.1 : Sistema de Plataformas Dise nar un sistema de control de posici on adaptativo para el sistema de plataformas mostrado en la Fig. 2.11 y descrito en el problema 2.4. Problema 4.2 : Columna de Destilaci on En el problema 2.5 se describe la columna de destilaci on para fraccionar petr oleo pesado, mostrado en La Fig. 2.12. Dise nar un sistema de control adaptativo para este sistema. Problema 4.3 : Reactor Qu mico Dise nar un sistema de control adaptativo para el reactor qu mico con chaqueta de enfriamiento mostrado en la Fig. 2.13 y descrito en el problema 2.6. Problema 4.4 : Motor DC No Lineal En el problema 2.7 se describe un motor DC en el cual el voltaje de armadura se mantiene constante mientras que el voltaje de campo es variable (ver Fig. 2.14. Dise nar un sistema de control adaptativo para este motor. Problema 4.5 : Manipulador Polar Vertical
76
1 0.8 Posicin y [rad] 0.6 0.4 0.2 0
10
30 20 Control u [V] 10 0 10 20
4 5 6 Tiempo en segundos
10
Fig. 4.9: Posici on angular controlada del brazo del manipulador MR1. Caso: regulaci on.
La Fig. 2.15 (problema ) muestra un manipulador polar vertical. Dise nar un sistema de control adaptativo para este manipulador. Problema 4.6 : Manipulador Polar Horizontal La Fig. 2.16 (problema ) muestra un manipulador polar horizontal. Dise nar un sistema de control adaptativo para este manipulador. Problema 4.7 : Manipulador Rob otico TraslacionalEsf erico (MRTE) Dise nar un sistema de control adaptativo para el manipulador rob otico traslacional esf erico mostrado en la Fig. 2.17 y descrito en el problema 2.10. Problema 4.8 : Manipulador Rob otico Esf erico (MRE3) Dise nar un sistema de control adaptativo con modelo referencial para el manipulador rob otico esf erico mostrado en la Fig. 2.17 y descrito en el problema 2.11. Problema 4.9 : Motor S ncrono de Im an Permanente La din amica del motor s ncrono de im an permanente se describe en el problema 2.12. Dise nar un sistema de control adaptativo del torque para este motor.
Cap tulo 5
5.1.
Conceptos B asicos
Para explicar la notaci on empleada y los conceptos b asicos del control con modos deslizantes, emplearemos un sistema din amico de una entrada y lineal en u.
x x x(2) . . . x(n1)
(5.1)
donde el estado escalar x es la salida de inter es del sistema, el escalar u es la entrada de control, x es el vector de estado y las funciones f (x) y g (x) no son exactamente conocidas pero son acotadas por funciones conocidas dependientes de x. En adici on, b(x) es de signo conocido. Notar que la notaci on para expresar derivadas totales de orden superior es: dxn x(n) dtn Dada una trayectoria de estado deseada y variante con el tiempo: xd x d (2) xd xd = (5.2) xd (0) = x(0) . . . (n1) xd El problema de control a resolver consiste en dise nar un control nito u que fuerce al estado x seguir a la trayectoria deseada xd a pesar de la presencia de incertidumbres en los par ametros y din amica no modelada. Denamos el error de seguimiento x y el vector de error de seguimiento x como: x = x xd (2) x = x xd = x . . . ( n x 1) x x (5.3)
Adem as, consideremos la supercie S (t) variante con el tiempo en el espacio de estado n R denido mediante la ecuaci on escalar s(x, t) = 0, tal que: s(x, t) = ( d n1) + )n1 x = (p + )n1 x = x(n1) x( r dt (5.4)
donde es una constante positiva cuya selecci on se discutir a luego, p es el operador (n1) de Laplace y xr es una funci on que puede ser computada de x y xd . Por ejemplo, para un sistema de orden n = 3, s toma la forma: + 2x + 2 x s = (p + )2 x = (p2 + 2p + 2 )x = x = x x r 2 x x r = x d 2x (5.5)
79
, del error de velociNotar que s resulta la suma ponderada del error de aceleraci on x y el error de posici dad x on x. La relaci on (5.4) establece que un problema de control de trayectoria de orden n se puede reemplazar por un problema de estabilizaci on de primer orden, es decir, por el problema de mantener el escalar s en cero. Tal problema de estabilizaci on se puede resolver seleccionando la ley de control u de (5.1) de forma tal que fuera de la supercie S (t): 1 d 2 s =s s |s| (5.6) 2 dt donde es una constante positiva. Como se ilustra en la gura 5.1(a) para el caso n = 2, todas las trayectorias de estado que satisfacen la condici on (5.6), la condici on de deslizamiento, hacen de la supercie S (t) un conjunto invariante en el sentido de Lyapunov (ver Ap endice A), implicando que las trayectorias del sistema fuera de S (t) apuntar an a tal supercie, y las trayectorias del sistema en S (t) permanecer an en ella. Tambi en se puede establecer que din amica no modelada, incertidumbre param etrica o ciertos disturbios, ser an tolerados por un sistema que satisfaga la condici on dada en (5.6). S (t) es conocida como la supercie de deslizamiento porque satisface la condici on de deslizamiento. El comportamiento del sistema sobre una supercie de deslizamiento se denomina modo de deslizamiento.
S(t)
(a) dx dt s=0
.
0 (b) dx dt s=0
xd x
.
0 (c)
xd x
Fig. 5.1: (a) La supercie de deslizamiento S (t). (b) Convergencia exponencial. (c) Fen omeno del chattering.
Consideremos el caso de aquellos sistemas que satisfacen la condici on (5.6), pero no la condici on dada en (5.2), esto es, xd (0) = x(0). Para tales sistemas, la supercie de deslizamiento s(t) = 0 ser a golpeada por alguna trayectoria del sistema
80
en un tiempo thit , el cual se puede computar como sigue. Asumiendo que s(t = 0) > 0 e integrando (5.6) entre t = 0 y t = thit :
thit 0
s dt =
s(t=thit ) s(t=0)
ds
0
thit
dt
(5.7)
nos conduce a thit s(t = 0)/ . Se puede obtener el mismo resultado si se arranca con s(t = 0) < 0. Por consiguiente: thit |s(t = 0)|/ (5.8)
La gure 5.1(b) ilustra el caso de una trayectoria de estado que evoluciona con una condici on inicial arbitraria, y luego golpea a la supercie s(t) = 0 en un tiempo nito thit |s(t = 0)|/ . En el modo de deslizamiento, tal trayectoria se desliza a lo largo de S (t) con el objeto de alcanzar exponencialmente a xd con una constante de tiempo igual a 1/. Por cierto, la expresi on de (5.4) para n = 2: s = (p + ) x x = 1/ s (1/)p + 1
posee una constante de tiempo igual a 1/. La implementaci on de sistemas de control deslizantes requiere de una ley de control realimentada, la cual se puede obtener de (5.4) y (5.1) de modo tal que s2 en la ecuaci on (5.6) se comporte muy parecido a una funci on de Lyapunov (Ap endice A) con el n de garantizar estabilidad asint otica del sistema a lazo cerrado. En modo deslizante para el caso ideal, por ejemplo, cuando el modelo del sistema (5.1) representa exactamente al sistema actual, la ley de control dise nada forzar a a todas las trayectorias de estado a deslizarse a lo largo de s = 0, tal como se observa en la gura 5.1(b). Sin embargo, debido a la presencia de imprecisiones en el modelado (incertidumbres en los par ametros y din amica no modelada) y de disturbios, la ley de control forzar a a todas las trayectorias de estado a deslizarse discontinuamente a lo largo de s = 0 tal como se muestra en la gura 5.1(c); es decir, la ley de control en modo deslizante necesita ser discontinua a trav es de S (t), produciendo as el fen omeno conocido como chattering. Desde que el chattering implica una muy elevada actividad de control, entonces, por consideraciones pr acticas, la fuerza de control u necesita ser suavizada adecuadamente (por ejemplo, mediante una acci on de saturaci on) a pesar de la p erdida de precisi on en el seguimiento y en el ancho de banda. Ejemplo 5.1 Para el sistema x = u denamos la supercie s(t) = x(t). Consideremos una ley de control de la forma: u=x = sgn(x) = u+ = 1 if s(t) > 0 u = +1 if s(t) < 0
81
La gura 5.2 muestra las trayectorias del sistema x(t) = t y x(t) = t originadas por la ley de control u+ y u respectivamente. La supercie s(t) = x(t) = 0 es una supercie de deslizamiento porque satisface la condici on (5.6) para 1.
x
s=0
5.2.
5.2.1.
Esta secci on sigue el procedimiento desarrollado en [28]. La representaci on din amica del sistema no lineal multivariable, el modelo de Lagrange, est a dado por: M(q)q + P(q, q )q + d(q) = u (5.9)
donde q es un m 1 vector de coordenadas generalizadas, M(q) es una matriz de inercia denida positiva de orden m m, P(q, q ) es una matriz de orden m m que representa las fuerzas de Coriolis y centr peta, d(q) es un vector de orden m 1 que representa las fuerzas gravitacionales y u es un vector de orden m 1 de fuerzas ]T . generalizadas. El vector de estado correspondiente a (5.9) posee la forma x = [q q Sean qdi (t) y q di (t) para i = 1, . . . , m las trayectorias deseadas, las cuales se suponen ser funciones del tiempo continuamente diferenciables. Los vectores de error se denen como: (t) = q q q d q(t) = q qd o lo que es lo mismo empleando sus componentes: qi (t) = qi (t) qdi (t) (t) = q q i (t) q di (t) i
5.2.2.
La Supercie de Conmutaci on
(t) +q i
i = 1, . . . , m
(5.10) (5.11)
. . . 0
q1 . . . + qm
q 1 . . . q
m
donde las constantes positivas ii son los elementos de una matriz diagonal L de orden m m. Asumiendo que una fuerza de control dise nada es capaz de connar todas las trayectorias que se originan en la intersecci on de tales supercies y hacerlas permanecer all , entonces en tal situaci on se cumple, de acuerdo a (5.10), que: si (q, q , t) = 0 =
ii qi (t)
(t) +q i
i = 1, . . . , m
i (t) deben converger exponencialmente a Esta u ltima relaci on nos indica que q i (t) y q cero, esto es: q i (t) = qi (t) qdi (t) = 0 i (t) = q q i (t) q di (t) = 0
Por consiguiente: qi (t) = qdi (t) y q i (t) = q di (t), con lo cual se logra el objetivo de control.
5.2.3.
El dise no de la fuerza o ley de control requerida para connar las trayectorias del sistema que se originan en la intersecci on de las supercies de deslizamiento y hacerlas permanecer all emplea el m etodo directo de Lyapunov. Omitiendo por simplicidad la dependencia de los argumentos, consideremos la siguiente candidata para funci on de Lyapunov: 1 V = sT Ms 2 Denamos ahora la siguiente ley de control: u = u0 Usgn(s) (5.12) + u1 + u 0 sign(s1 ) 1 1 . . . .. . . . . . . . 2 0 u+ u sign ( s ) m m m 1 + u u j 2 j
+ u1 u1 u1 1 . . . . . = 2 . + um um um
La derivada de s (ecuaci on (5.11)) produce: +q = Lq + (q s = Lq q d ) Despejando q de (5.9) y reemplazando la expresi on resultante en la ecuaci on anterior se obtiene: s = M1 (u0 U sgn(s) ueq ) donde: + Pq ueq = MLq + d + M qd
5.2 Control Deslizante para Sistemas Multivariables Por consiguiente: 1 = sT M = sT [u0 Usgn(s) ueq ] + 1 sT Ms V s + sT Ms 2 2 En la referencia [27] se establece que: P= 1 MJ 2
83
(5.13)
(5.14)
donde J es una matriz antisim etrica, es decir: J = JT . Empleando (5.14) en (5.13) nos conduce a: = sT [u0 Usgn(s) + Ps ueq ] + 1 sT Js V 2 Dado que sT Js = 0 debido a que J es antisim etrica, entonces:
m m
sj [u0 + Ps ueq ]j Ui
j =1
|sj | (5.15)
j =1
Uj |sj |
>0
(5.16)
|sj |
>0
lo que signica que se ha cumplido la condici on de deslizamiento y a la vez se garantiza que q (t) y q (t) convergen exponencialmente a cero. los estimados de u y P respectivamente. Los controles u y u+ se Sean u eq y P j j pueden seleccionar para satisfacer: u+ + j = [ueq Ps]j + u j u = [ u Ps ] + u eq j j j Si seleccionamos: u j = Kj i = 1, . . . , m (5.17)
u + j = Kj
(5.18)
entonces de (5.17) obtenemos: 1 u0j = (u+ + u j ) = [ueq Ps]j 2 j o lo que es lo mismo, en forma matricial: + u1 + u 1 1 . . u0 = = ueq Ps . 2 + um + um + u1 u 0 1 1 . . .. . . U = = . . . 2 0 u+ m um Uj = Kj
K1 0 . . .. . . . . . 0 Km
(5.19)
84
Asumiendo que el t ermino gravitacional se puede expresar como: d = ueq Ps entonces la ley de control dada por (5.12) toma la forma: K1 0 . .. . . u = u0 Usign(s) = d . . . . sgn(s) 0 Km y la relaci on (5.16) con Uj = Kj se expresa como: Kj |[ueq Ps d]i | + + Pq Ahora, dado que ueq = MLq + d + Mq d , entonces las ganancias Kj se pueden seleccionar siempre que: Kj |(M Pq + Pq + Mq d P s)j | + en donde M and P son las cotas superiores de M y P respectivamente. (5.22) (5.20)
(5.21)
5.3.
Procedimiento de Dise no
El procedimiento de dise no de un sistema de control con modos deslizante, como el desarrollado en la secci on 5.2, comprende los pasos siguientes. (1) Formular el problema: describir el sistema a controlar, denir las especicaciones de dise no y determinar el modelo no lineal del sistema en la forma dada en (5.9). (2) Determinar la ley de control con modos deslizantes dada en (5.21). Para ello se requiere primero determinar las cotas superiores de M y P. Luego, formular el : observador para determinar el vector q =q q d Ld (q q) donde Ld = I es una matriz diagonal siendo una constante positiva. El vector , mientras que q se determina del modelo estimado q se calcula integrando q din amico de Lagrange: = M1 (q )[u P(q, q ) d(q)] q El vector de deslizamiento s se calcula como sigue: q = q qd q =q d q s = q + q siendo = I una matriz diagonal, donde es una constante positiva. Las constantes Kj (j = 1, . . . , m) se calculan de (5.22): Kj |(M Pq + Pq + Mq d P s)j | + (5.23) q d q=q
5.4 Aplicaciones
85
donde M and P son las cotas superiores de M y P respectivamente y una constante positiva. Para suavizar la acci on de control introducimos las funci on de saturaci on satj , j = 1, . . . , m:
u u
if (sj / > 1) satj = 1 elseif (sj / < 1) satj = 1 else satj = sj / end
(5.24)
(3) Simular el sistema de control con modos deslizantes empleando los par ametros de sintonizaci on: , , Ld y . (4) Implementar el sistema de control optimo (hardware). (5) Desarrollar el software de control en tiempo real del sistema. (6) Ejecutar pruebas de funcionamiento en tiempo real.
5.4.
5.4.1.
Aplicaciones
Control Deslizante del Manipulador Esf erico
El modelo din amico de Lagrange del MRE se describe en la subsecci on 2.2.2, on de la ley de control requiere la formulaci on de las ecuaci on (2.121). La determinaci cotas superiores de M, P: M 11 = Ra nKm KA 1 J1 + Jeq + m2 L2 2 4
2 2 J1 + Jeq + 1 4 m2 L2 sin q2 0
0 M 22
P(q, q ) =
sin q2
Las se nales de referencia deseada qd para prop ositos de simulaci on se formulan para el caso de seguimiento como: qd1 = A sin W k + Bk qd2 = A cos W k + Bk (5.25)
donde A y B son constantes, k = t/T es el tiempo discreto y T es el tiempo de muestreo. Para el caso de regulaci on, qd es del tipo escal on. Los par ametros de sintonizaci on K1 y K2 se determinan de (5.23) con: M= M 11 0 0 M 22 P= P 11 P 12 P 21 P 22
Luego, la ley de control se calcula de (5.24). Las Figs. 5.3 y 5.4 muestran el resultado de la simulaci on del sistema de control deslizante dise nado para controlar las posiciones angulares de la base y del brazo del MRE para los casos de seguimiento y regulaci on respectivamente. Para obtener tales resultados, ejecutar los programas mres.m y mrer.m, cuyos listados se encuentran en el CD adjunto. Notar que las especicaciones de dise no porcentaje de sobreimpulso nulo, error en estado estacionario nulo y tiempo de estabilizaci on menor de 1 s se cumplen satisfactoriamente para ambos casos. Los par ametros de sintonizaci on para los dos casos se jaron en: = 7, = 2, d = 30 y = 0,4.
5.4.2.
El modelo de Lagrange del MRT se describe en la subsecci on 2.2.1, ecuaci on (2.90). Las cotas superiores de M, P y d, necesarias para determinar la ley de control, se denen como: M 11 = M 12 = M 21 = M 22 = Ra rp Jeq mc + mb + 2 nKm KA rp Ra rp mb Lb ; 2nKm KA Ra mb Lb ; 2nKm KA Ra 1 mb L2 b + Jb + Jeq nKm KA 4
5.4 Aplicaciones
POSICIN q1 [rad]
87
4 2 0
CONTROL u1 [V]
1 0.5 0
POSICIN q2 [rad]
4 TIEMPO
5 [s]
CONTROL u1 [V]
10 0 10
4 TIEMPO
5 [s]
Fig. 5.3: Posiciones angulares controladas de los brazos del MRE. Caso: seguimiento.
POSICIN q1 [rad]
0.4 0.2 0
CONTROL u1 [V]
5 0 5
POSICIN q2 [rad]
4 TIEMPO
5 [s]
0.4 0.2 0
CONTROL u1 [V]
10 0 10
4 TIEMPO
5 [s]
Fig. 5.4: Posiciones angulares controladas de los brazos del MRE. Caso: regulaci on.
P 11 =
Ra rp nKm KA
Ff +
Beq n2 Km Kb + 2 2 rp Ra rp
88 Ra rp mb Lb 2nKm KA Beq +
P 12 = P 21 = 0 P 22 = Por consiguiente:
Ra nKm KA
n2 Km Kb Ra
M(q) = P(q, q ) =
P 11 P 12 q 2 sin q2 0 P 22
sin q2
Las se nales deseadas para prop ositos de simulaci on son las mismas que las dadas en 5.25. Los par ametros de sintonizaci on K1 y K2 se determinan de (5.23) con: M= M 11 M 12 M 21 M 22 P= P 11 P 12 0 P 22
Finalmente, la ley de control se calcula de (5.24). Las Figs. 5.5 y 5.6 muestran los resultados de las simulaciones del sistema de control deslizante dise nados para controlar las posiciones angulares de los brazos del MRT para los casos de seguimiento y regulaci on respectivamente. Para obtener tales resultados, ejecutar los programas scmrts.m y scmrtr.m respectivamente (ver sus listados en el CD adjunto). Notar que las especicaciones de dise no porcentaje de sobreimpulso nulo, error en estado estacionario nulo y tiempo de estabilizaci on menor de 1 s se cumplen satisfactoriamente en ambos casos. Los par ametros de sintonizaci on para los dos csos se jaron en: = 5, = 8, Ld = 50 y = 0.1.
5.4.3.
El modelo de Lagrange del MRE se describe en la subsecci on 2.1.3, ecuaci on (2.61). Las cotas superiores de P se denen como: P 11 = A) P 12 = 0 P 21 = Cp i A; P 22 = ACp P 11 0 P 11 P 22 q1 a q1 a aCp q2 q1 + q2R i Cp a q1 t
P(q, q ) = d(q) =
Las se nales deseadas para prop ositos de simulaci on son del tipo escal on. Las funciones de deslizamiento se calcularon separadamente para mejorar el rendimiento del sistema controlado: s1 = 1 q1 + q s2 = 2 q2 + q 1 2
5.4 Aplicaciones
POSICIN q1 [rad]
89
10 0 10
10
12
14
16
CONTROL u1 [V]
20 10 0
POSICIN q2 [rad]
8 TIEMPO
10 [s]
12
14
16
10 5 0
10
12
14
16
CONTROL u1 [V]
20 0 20
8 TIEMPO
10 [s]
12
14
16
Fig. 5.5: Posiciones angulares controladas de los brazos del MRT. Caso: seguimiento.
POSICIN q1 [rad]
0.4 0.2 0
10
12
14
16
CONTROL u1 [V]
20 0 20
POSICIN q2 [rad]
8 TIEMPO
10 [s]
12
14
16
0.5 0 0.5
10
12
14
16
CONTROL u1 [V]
10 0 10
8 TIEMPO
10 [s]
12
14
16
Fig. 5.6: Posiciones angulares controladas de los brazos del MRT. Caso: regulaci on.
90
Luego, la ley de control se calcula de (5.24) sin considerar M. La Fig. 5.7 muestra el resultado de la simulaci on del sistema de control deslizante para el caso regulaci on: se nales deseadas constantes. Para obtener tal resultado, ejecutar el programa sctanquer.m (ver su listado completo en el CD adjunto). Observar que las especicaciones de dise no porcentaje de sobreimpulso nulo, error en estado estacionario nulo y tiempo de estabilizaci on menor de 1 s tambi en se cumplen satisfactoriamente. Los par ametros de sintonizaci on son: 1 = 0.08, 2 = 0.014, = 0.1, Ld = 0.1 y = 0.8.
NIVEL h [m] 0.15
0.1
1000
2000
3000
4000
5000
6000
7000
8000
FLUJO u1 [V]
15 10 5
1000
2000
3000
4000 TIEMPO
5000 [s]
6000
7000
8000
TEMP q2 [K]
50
1000
2000
3000
4000
5000
6000
7000
8000
CALOR u2 [V]
50 0 50
1000
2000
3000
4000 TIEMPO
5000 [s]
6000
7000
8000
Fig. 5.7: Nivel y temperatura controladas del sistema tanque con agua.
5.4.4.
El modelo de Lagrange del MR1 se describe en la subsecci on 2.1.1, ecuaci on (2.23). Las cotas superiores de M y P se denen como: M P = = Jeq Ra nKb + nKm KA KA Beq Ra nKm KA
Por consiguiente: M =M P =P Las se nales deseadas para prop ositos de simulaci on son las mismas que las dadas en 5.25, pero para el caso escalar. El par ametro de sintonizaci on en linea K se determina
5.5 Problemas
91
de (5.23) para j = 1, con M y P denidos anteriormente. Luego, la ley de control se calcula de (5.24): u = d Ksat
a Q sin q donde d = R nKm KA . Las Figs. 5.8 y 5.9 muestran el resultado de la simulaci on del sistema de control deslizante dise nado para controlar la posici on angular del brazo del MR1 para los casos de seguimiento y regulaci on respectivamente. Para obtener tales resultados, ejecutar los programas scmr1s.m y scmr1r.m (ver su listado en el CD adjunto). Notar que las especicaciones de dise no porcentaje de sobreimpulso nulo, error en estado estacionario nulo y tiempo de estabilizaci on menor de 1 s se cumplen satisfactoriamente. Los par ametros de sintonizaci on para ambos casos se seleccionaron: = 9, eta = 10, Ld = 50 y P hi = 0.6. El modelo din amico del MRT para prop ositos de simulaci on se da en la ecuaci on (??).
10 8 6 4 2 0
POSICIN q [rad]
10
12
14
16
4 3
CONTROL u
2 1 0 1
8 TIEMPO
10 [S]
12
14
16
Fig. 5.8: Posici on angular controlada del brazo del MR1. Caso: seguimiento.
5.5.
Problemas
Problema 5.1 : Sistema de Plataformas Dise nar un sistema de control de posici on por modos deslizantes para el sistema de plataformas mostrado en la Fig. 2.11 y descrito en el problema 2.4. Problema 5.2 : Columna de Destilaci on En el problema 2.5 se describe la columna de destilaci on para fraccionar petr oleo pesado, mostrado en La Fig. 2.12. Dise nar un sistema de control por modos deslizantes para este sistema. Problema 5.3 : Reactor Qu mico
92
0.4
POSICIN q [rad]
0.3
0.2
0.1
15 10
CONTROL u
5 0 5 10 15 20 0 1 2 3 4 TIEMPO 5 [S] 6 7 8
Fig. 5.9: Posici on angular controlada del brazo del MR1. Caso: regulaci on.
Dise nar un sistema de control por modos deslizantes para el reactor qu mico con chaqueta de enfriamiento mostrado en la Fig. 2.13 y descrito en el problema 2.6. Problema 5.4 : Motor DC No Lineal En el problema 2.7 se describe un motor DC en el cual el voltaje de armadura se mantiene constante mientras que el voltaje de campo es variable (ver Fig. 2.14. Dise nar un sistema de control por modos deslizantes para este motor. Problema 5.5 : Manipulador Polar Vertical La Fig. 2.15 (problema ) muestra un manipulador polar vertical. Dise nar un sistema de control por modos deslizantes para este manipulador. Problema 5.6 : Manipulador Polar Horizontal La Fig. 2.16 (problema ) muestra un manipulador polar horizontal. Dise nar un sistema de control por modos deslizantes para este manipulador. Problema 5.7 : Manipulador Rob otico TraslacionalEsf erico (MRTE) Dise nar un sistema de control por modos deslizantes para el manipulador rob otico traslacionalesf erico mostrado en la Fig. 2.17 y descrito en el problema 2.10. Problema 5.8 : Manipulador Rob otico Esf erico (MRE3) Dise nar un sistema de control por modos deslizantes para el manipulador rob otico esf erico mostrado en la Fig. 2.17 y descrito en el problema 2.11. Problema 5.9 : Motor S ncrono de Im an Permanente La din amica del motor s ncrono de im an permanente se describe en el problema 2.12. Dise nar un sistema de control por modos deslizantes del torque para este motor.
Cap tulo 6
Control Backstepping
Este cap tulo describe la la metodolog a para dise nar sistemas de control backstepping para una cierta clase de sistemas multivariables no lineales. Tal metodolog a, basada en el m etodo directo de Lyapunov, comprende varios pasos en concordancia con el orden del sistema. En cada paso es necesario introducir un estado virtual y una fuerza de control virtual que permitan reescribir la ecuaci on de estado actual del sistema a controlar en t erminos de estos. La selecci on adecuada de una funci on de Lyapunov, va a permitir determinar un control virtual, que aplicado al sistema a controlar, permita la estabilizaci on del mismo. Con el prop osito de validar el procedimiento de dise no propuesto, se presentan varios sistemas de control backstepping operando en tiempo real para los procesos: (1) Manipulador rob otico de 1GDL. (2) Manipulador rob otico esf erico. (3) Manipulador esf erico traslacional. (4) Sistema Tanque con Agua.
6.1.
Introducci on
El m etodo directo de Lyapunov se emplea extensivamente para el an alisis y s ntesis de sistemas. Los sistemas de control adaptativo con modelo referencial y con modos deslizantes descritos en los cap tulos 4 y 5 respectivamente, fueron sintetizados empleando dicho m etodo. El m etodo directo de Lyapunov, descrito en el Ap endice A, emplea una funci on de Lyapunov (FL) que contiene cierta informaci on de la din amica del sistema. Si la derivada en el tiempo de la FL seleccionada es negativa, entonces se dice en el sentido de Lyapunov que el sistema en estudio es estable, tal como se puede ver en el siguiente ejemplo. Ejemplo 6.1 Determinar una FL para el sistema escalar: x = cos x x3 + u donde x es la variable de estado y u es la se nal de control.
94
Control Backstepping
Soluci on.- Es claro que una fuerza de control de la forma u = cos x + x3 kx, donde k es una constante, convierte tal sistema a su forma lineal x = kx, y por lo tanto, lo puede estabilizar. Si tomamos V (x) = x2 /2 como una FL para el sistema, vemos que: 1. V (x) es denida positiva. 2.
dV dt 2 = x dx dt = kx es denida negativa.
Por consiguiente, el sistema es globalmente asint oticamente estable en el sentido de 3 Lyapunov. Observar que el t ermino x en la ley de control u = cos x + x3 kx, puede hacerla crecer signicativamente. Si seleccionamos en cambio como ley de control u = (x) = cos x kx y = xx la misma FL V = x2 /2, obtenemos V = x4 kx2 x4 . Este resultado es ventajoso porque demuestra que la magnitud de la fuerza de control u se incrementa linealmente con x en lugar de hacerlo con x3 y que la FL V decrece m as r apido cuanto m as grande sea x. La F ormula de Sontag La f ormula de Sontag [13] nos permite determinar una adecuada ley de control u = s (x) para sistemas din amicos descritos como: x = f (x) + g(x)s Tal f ormula supone que existe una FL V (x) para dicho sistema. Entonces, una ley de control s (x) capaz de estabilizar tal sistema se formula como: 2 4 V f + ( V f +( V g x x ) x ) V , x g = 0; s (x) = (6.1) g ( V x ) V 0, g = 0. x La ley de control de Sontag permite generar una ley de control de magnitud apropiada (no grandes magnitudes) y r apida convergencia al estado estacionario a pesar de la presencia de grandes valores iniciales de x, tal como se demuestra en el siguiente ejemplo. Ejemplo 6.2 Determinar una FL para el sistema escalar: x = cos x x3 + u Soluci on.- Asumamos la ley de control u = cos x s (x), donde s (x) se determina usando la f ormula de Sontag con f (x) = x3 , g (x) = 1 y V (x) = x2 /2. Luego: V g = x x V f = x4 x s (x) = x3 x x4 + 1 u(x) = cos x x3 x x4 + 1
Podemos observar que para grandes valores de x, s (x) tiende a cero, mientras que para peque nos valores de x, s (x) tiende a x. Por consiguiente, la magnitud de u usando la f ormula de Sontag resulta menor que en los casos anteriores.
95
La t ecnica de control backstepping comprende varios pasos, de acuerdo al orden del sistema. Cada paso se puede descomponer en las partes siguientes: (1) Introducir un estado virtual y una fuerza de control virtual, y reescribir la ecuaci on de estado actual en t erminos de estos. (2) Seleccionar una FL para el sistema. (3) Buscar una ecuaci on para el control virtual que haga que la FL sea una del tipo estabilizable, es decir, que su aplicaci on en el sistema permita determinar las condiciones para estabilizar al sistema, sujeto a las restricciones del caso. En los pasos subsiguientes, se aumenta la FL para reejar la presencia de nuevos estados virtuales. En el ejemplo siguiente se aplica el m etodo descrito. Ejemplo 6.3 Dise nar un controlador backstepping para el sistema: x 1 = x3 1 + x2 x 2 = x2 2 +u Soluci on.- Apliquemos los pasos descritos anteriormente. (1) Para la ecuaci on (6.2) denamos una fuerza de control virtual , y una estado virtual z = x2 . Por consiguiente: x 1 = x3 1+z+ Denamos ahora una FL candidata: V = x2 1 /2. Entonces:
3 = x1 x V 1 = x1 (x3 1 + z + ) = x1 (x1 + ) + zx1
(6.2) (6.3)
En este punto se puede usar la f ormula de Sontag para calcular con el n de estabilizar al sistema propuesto. Por simplicidad usaremos: = k1 x1 para k1 0. Por lo tanto: = k1 x 1 = k1 (x3 1 + x2 ) z =x 2 = x2 + u + k1 (x3 1 + x2 ) (2) Seleccionemos ahora una FL para el sistema. En este caso, una apropiada selecci on resulta la siguiente FL aumentada: Va = V + z 2 /2. Por consiguiente:
2 2 3 a = V + zz V = x4 1 kx1 + z (u + x1 + x2 + k1 (x1 ) + x2 )
(3) Seleccionemos una apropiada ley de control u que pueda estabilizar al sistema de segundo orden. Una posible selecci on, de las muchas que pueden existir, puede ser:
3 2 3 u = k2 z (x1 + x2 2 + k1 (x1 + x2 )) = k2 (x2 + k1 x1 ) (x1 + x2 + k1 (x1 + x2 ))
La Fig. 6.1, obtenida ejecutando el programa bscej33.m, muestra las respuestas x1 y x2 del sistema estabilizado para x1 (0) = 1.5, x2 (0) = 0.8, k1 = 1.5 y k2 = 2.
96
Control Backstepping
En la siguiente secci on se desarrolla un sistema de control backstepping apropiado para controla una gran clase de sistemas representados mediante un modelo din amico de lagrange.
1.5 x1 SALIDA 1 0.5 0 0.5 0 1 2 3 4 5 6
6.2.
El modelo din amico de una gran clase sistemas no lineales multivariables se puede representar mediante la siguiente ecuaci on matricial [25], [3]: M(q)q + P(q, q )q + d(q) = u (6.4)
donde el vector q de orden n es el vector de estado, M de dimensi on n n es una matriz denida positiva que por construcci on depende de q, P de dimensi on n n es otra matriz que depende de los vectores q y q , d de orden n es un vector que depende de q por construcci on, y u de orden n es el vector de entrada de control. Para el caso de los manipuladores rob oticos, q es el vector posici on, M es la matriz de inercia, P es la matriz de Corioliscentripetal y d es el vector de gravedad. De (6.4), la ecuaci on para q resulta: q = M1 (q)[u P(q, q )q d(q)] Asumiremos que s olo se dispone de la medici on del vector q. (6.5)
97
6.3.
El dise no backstepping descrito a continuaci on ha sido desarrollado [37]. Denamos el error de seguimiento e de la posici on angular de un brazo rob otico como: e = q qd (6.6)
donde qd es la trayectoria deseada de la posici on angular. El objetivo de control consiste en resolver el problema de seguimiento de la trayectoria usando s olo mediciones de la posici on. Denamos z1 = e como la variable regulada dentro del procedimiento de dise no backstepping. Computando la derivada de z1 se obtiene: z 1 = e =q q d = e (6.7)
Usemos ahora e como la variable virtual de control. Seleccionemos la siguiente funci on de estabilizaci on: 1 = K z1 (6.8) donde K es una matriz diagonal de la forma K = k I, donde k es una constante positiva e I es la matriz identidad. El correspondiente error de la variable de estado se dene como: z2 = e 1 = q q d + K z1 = q q r (6.9) donde q r se dene como: q r = q d K z1 Entonces, ecuaci on (6.7) se puede reescribir como: z 1 = z2 + 1 = K z1 + z2 Tambi en, la derivada de la variable de error z2 toma la forma: z 2 = q q d + K z 1 (6.12) (6.11) (6.10)
Empleando las ecuaciones (6.5) y (6.11), la ecuaci on (6.12) se puede formular como: z 2 = M1 (q)[u P(q, q )q d(q)] q d + K z2 K2 z1 (6.13)
Empleando el an alisis de estabilidad de Lyapunov descrito en el Ap endice A, en la referencia [37] se demuestra que la siguiente entrada de control es capaz de estabilizar al sistema: )q q u = M(q)q + P(q, q r + d(q) Kd (q r ) K1 z1 toma la forma: donde el estimado de la velocidad angular q =q q d + Ld (q q) (6.15) (6.14)
Las ganancias de control Kd , K1 y Ld son matrices diagonales denidas positivas con Kd = kd I, K1 = k1 I y Ld = d I, donde kd , k1 y d son constantes positivas.
98
Control Backstepping
6.4.
El procedimiento de dise no de un sistema de control backstepping, como el desarrollado en la secci on 6.3, comprende los pasos siguientes: (1) Formular el problema: describir el sistema a controlar, denir las especicaciones de dise no determinar el modelo no lineal del sistema en la forma dada en (6.4). (2) Determinar la ley de control backstepping dada en (6.14). Para ello se requiere denir el vector de referencias deseadas qd . Luego, formular el vector de error e y el vector q r: e = z1 = q qd q r = q d Kz1
En la u ltima relaci on, K = k I es una matriz diagonal donde k es una constante positiva e I es la matriz identidad. El observador se expresa como: =q q d Ld (q q) En esta expresi on, Ld = I es una matriz diagonal donde es una constante . Con los datos anteriores positiva. El vector q se puede calcular integrando q se puede formular la ley de control backstepping: q )q r ) K1 z1 r + d(q) Kd (q u = M(q)q + P(q, q En dicha ley de control, Kd = kd I y K1 = k1 I son matrices diagonales donde kd y k1 son constantes positivas. Simular el sistema de control con modos deslizantes empleando los par ametros de sintonizaci on kd , k1 y d . Implementar el sistema de control optimo (hardware). Desarrollar el software de control en tiempo real del sistema. Ejecutar pruebas de funcionamiento en tiempo real.
6.5.
6.5.1.
Aplicaciones
Control Backstepping del Manipulador Esf erico
El modelo din amico de Lagrange del MRE se describe en la subsecci on 2.2.2, ecuaci on (2.121). Las se nales de referencias deseadas qd para prop ositos de simulaci on se formulan para el caso de seguimiento como: qd1 = A sin W k + Bk qd2 = A cos W k + Bk donde A, W y B son constantes, k = t/T es el tiempo discreto y T es el tiempo de muestreo. Para el caso de regulaci on, qd es del tipo escal on. La ley de control dada en (6.14) toma la forma: )q q u = M(q)q + P(q, q r + d(q) Kd (q r ) K1 z1
99
0 2 J2 + Jeq + 1 4 m2 L2 )
) = P(q, q
Beq +
n2 Km Kb Ra
d(q) =
0
Ra m2 L2 g sin q2 2nKm KA
Las Figs. 6.2 y 6.3 muestran los resultados de las simulaciones del sistema de control backstepping dise nado para controlar la posici on angular de los dos brazos del MRE para los casos de seguimiento y regulaci on respectivamente. Tales Figs. se obtiene ejecutando los programa bscmres.m (caso seguimiento) y bscmrer.m (caso seguimiento). Sus listados se encuentran en el CD adjunto. Notar que en ambos casos las especicaciones de dise no: porcentaje de sobreimpulso nulo, error en estado estacionario nulo y tiempo de estabilizaci on menor de 1 s se cumplen satisfactoriamente. Los par ametros de sintonizaci on se seleccionaron: k = 10, k1 = 20, ld = 20 y kd = 5 para regulaci on, y k = 8; k1 = 8, ld = 30 y kd = 10 para seguimiento. El modelo din amico del MRE para prop ositos de simulaci on toma la forma: q = M1 [u Pq d]
6.5.2.
El modelo de Lagrange del MRT se describe en la subsecci on 2.2.1, ecuaci on (2.90). Las se nales de referencias deseadas contenidas en qd para prop ositos de simulaci on son las mismas que para el caso del sistema MRE: qd1 = A sin W k + Bk qd2 = A cos W k + Bk donde A, W y B son constantes, k = t/T es el tiempo discreto y T es el tiempo de muestreo. Para el caso de regulaci on, qd es del tipo escal on. La ley de control dada en (6.14) toma la forma: )q q u = M(q)q + P(q, q r + d(q) Kd (q r ) K1 z1 donde Kd = kd I y K1 = k1 I son matrices diagonales y: Ra rp Jeq Ra rp mb Lb 2 nKm KA mc + mb + rp 2nKA Km cos q2 M(q) = mb L2 Ra mb Lb Ra b + Jb + Jeq 2nKm KA cos q2 nKA Km 4 ) = P(q, q
Ra rp Beq n2 Km Kb 2 + 2 nKm KA Fc + rp Ra rp 2 n Km Kb Ra nKA Km Beq + Ra
a p b b 2nK q 2 sin q2 A Km
R r m L
Ra mb Lb g 2 nKA Km sin q2
100
POSICIN q1 [rad]
Control Backstepping
4 2 0
CONTROL u1 [v]
2 0 2
POSICIN q2 [rad]
4 TIEMPO
5 [S]
CONTROL u2 [v]
50 0 50
4 TIEMPO
5 [S]
Fig. 6.2: Control backstepping de la posici on angular de los brazos del MRE. Caso seguimiento.
d(q) =
0
Ra mb Lb g 2 nKA Km
sin q2
Las Figs. 6.4 y 6.5 muestran los resultados de las simulaciones del sistema de control backstepping dise nado para controlar la posici on angular de los dos brazos del MRT para los casos de seguimiento y regulaci on respectivamente. Tales Figs. se obtiene ejecutando los programa bscmrts.m (caso seguimiento) y bscmrtr.m (caso seguimiento). Sus listados se encuentran en el CD adjunto. En ambos casos las especicaciones de dise no: porcentaje de sobreimpulso nulo, error en estado estacionario nulo y tiempo de estabilizaci on menor de 1 s se cumplen satisfactoriamente. Los par ametros de sintonizaci on se seleccionaron: k = 4, k1 = 5, ld = 10 y kd = 8 para regulaci on, y k = 4; k1 = 5, ld = 15 y kd = 20 para seguimiento. El modelo din amico del MRE para prop ositos de simulaci on toma la forma: q = M1 [u Pq d] (6.16)
6.5.3.
El modelo de Lagrange del MRE se describe en la subsecci on 2.1.3, ecuaci on (2.61). Las se nales deseadas qd para prop ositos de simulaci on son del tipo escal on. La ley de control dada en (6.14) toma la forma: )q q u = M(q)q + P(q, q r + d(q) Kd (q r ) K1 z1
6.5 Aplicaciones
POSICIN q1 [rad]
101
1 0.5 0
CONTROL u1 [v]
50 0 50
POSICIN q2 [rad]
4 TIEMPO
5 [S]
1 0.5 0
CONTROL u2 [v]
50 0 50
4 TIEMPO
5 [S]
Fig. 6.3: Control backstepping de la posici on angular de los brazos del MRE. Caso regulaci on.
donde Kd = kd I y K1 = k1 I son matrices diagonales y: ) = P(q, q d(q) = A 0 ACp i ACp q1 a q1 a Cp aq2 q1 Cp a q1 i + q2R t
La Fig. 6.6 muestra el resultado de la simulaci on del sistema de control backstepping dise nado para controlar el nivel y la temperatura en el tanque con agua. Para obtener dicho resultado, ejecutar el programa bsctanquer.m (ver su listado completo en el CD adjunto). Notar que las especicaciones de dise no porcentaje de sobreimpulso nulo, error en estado estacionario nulo y tiempo de estabilizaci on menor de 300 s se cumplen satisfactoriamente. Los par ametros de sintonizaci on se seleccionaron: k = 0.1, k1 = 0.1, ld = 0.02 y kd = 0.002. El modelo din amico del sistema tanque con agua para simulaci on toma la forma: q = P1 [u d]
6.5.4.
El modelo de Lagrange del MR1 se describe en la subsecci on 2.1.1, ecuaci on (2.23). Para prop ositos de simulaci on, la se nal de referencia deseada qd para el caso
102
POSICIN q1 [rad]
Control Backstepping
10 5 0
10
12
14
16
CONTROL u1 [v]
5 0 5
POSICIN q2 [rad]
8 TIEMPO
10 [S]
12
14
16
10 5 0
10
12
14
16
CONTROL u2 [v]
20 0 20
8 TIEMPO
10 [S]
12
14
16
Fig. 6.4: Control backstepping de la posici on angular de la base y del brazo del MRT. Caso seguimiento.
de seguimiento se formula como: qd = A sin W k + Bk donde A y B son constantes, k = t/T es el tiempo discreto y T es el tiempo de muestreo. Para el caso de regulaci on, qd es del tipo escal on. El error de seguimiento e = z1 y la variable q r se denen como: e = q qd = z1 qr = q d Kz1
donde q = es las posici on angular medida y K es una constante positiva. El observador se expresa como: =q q d Ld (q q ) (6.17) . La ley de donde Ld es una constante positiva. y q se puede calcular integrando q control dada en (6.14) toma la forma: )q q u = M (q )q 1 + P (q, q r + d(q ) Kd (q r ) K1 z1 donde Kd y K1 son constantes positivas y: M (q ) = Jeq Ra nKb + nKm KA KA ) = Beq Ra P (q, q nKm KA d(q ) = Ra Q sin q nKm KA
Las Figs. 6.8 y 6.7 muestran los resultados de las simulaciones del sistema de control backstepping dise nado para controlar la posici on angular del brazo del MRE
6.6 Problemas
POSICIN q1 [rad]
103
0.4 0.2 0
10
12
14
16
CONTROL u1 [v]
50 0 50
POSICIN q2 [rad]
8 TIEMPO
10 [S]
12
14
16
0.5 0 0.5
10
12
14
16
CONTROL u2 [v]
50 0 50
8 TIEMPO
10 [S]
12
14
16
para los casos de seguimiento y regulaci on respectivamente. Tales Figs. se obtiene ejecutando los programa bscmr1s.m (caso seguimiento) y bscmr1r.m (caso seguimiento). Sus listados se encuentran en el CD adjunto. Notar que en ambos casos las especicaciones de dise no: porcentaje de sobreimpulso nulo, error en estado estacionario nulo y tiempo de estabilizaci on menor de 1 s se cumplen satisfactoriamente. Los par ametros de sintonizaci on se seleccionaron: k = 8, k1 = 8, ld = 30 y kd = 10 para regulaci on y seguimiento. El modelo din amico del MR1 para prop ositos de simulaci on toma la forma: q = M1 [u P q d]
6.6.
Problemas
Problema 6.1 : Sistema de Plataformas Dise nar un sistema de control backstepping por modos deslizantes para el sistema de plataformas mostrado en la Fig. 2.11 y descrito en el problema 2.4. Problema 6.2 : Columna de Destilaci on En el problema 2.5 se describe la columna de destilaci on para fraccionar petr oleo pesado, mostrado en La Fig. 2.12. Dise nar un sistema de control backstepping para este sistema.
104
0.12
Control Backstepping
NIVEL h [m]
0.1199
100
200
300
400
500
600
700
800
900
1000
FLUJO uh [V]
9 8.5 8
100
200
300
600 [s]
700
800
900
1000
100
200
300
400
500
600
700
800
900
1000
100
200
300
600 [s]
700
800
900
1000
0.4
POSICIN q [rad]
0.3
0.2
0.1
30 20
CONTROL u
10 0 10 20 30 0 1 2 3 4 TIEMPO 5 [S] 6 7 8
Problema 6.3 : Reactor Qu mico Dise nar un sistema de control backstepping para el reactor qu mico con chaqueta de enfriamiento mostrado en la Fig. 2.13 y descrito en el problema 2.6. Problema 6.4 : Motor DC No Lineal
6.6 Problemas
10
105
POSICIN q [rad]
8 6 4 2 0
10
12
14
16
4 3
CONTROL u
2 1 0 1
8 TIEMPO
10 [S]
12
14
16
En el problema 2.7 se describe un motor DC en el cual el voltaje de armadura se mantiene constante mientras que el voltaje de campo es variable (ver Fig. 2.14. Dise nar un sistema de control backstepping para este motor. Problema 6.5 : Manipulador Polar Vertical La Fig. 2.15 (problema ) muestra un manipulador polar vertical. Dise nar un sistema de control backstepping para este manipulador. Problema 6.6 : Manipulador Polar Horizontal La Fig. 2.16 (problema ) muestra un manipulador polar horizontal. Dise nar un sistema de control backstepping para este manipulador. Problema 6.7 : Manipulador Rob otico TraslacionalEsf erico (MRTE) Dise nar un sistema de control backstepping para el manipulador rob otico traslacional esf erico mostrado en la Fig. 2.17 y descrito en el problema 2.10. Problema 6.8 : Manipulador Rob otico Esf erico (MRE3) Dise nar un sistema de control backstepping para el manipulador rob otico esf erico mostrado en la Fig. 2.17 y descrito en el problema 2.11. Problema 6.9 : Motor S ncrono de Im an Permanente La din amica del motor s ncrono de im an permanente se describe en el problema 2.12. Dise nar un sistema de control backstepping del torque para este motor.
Cap tulo 7
7.1.
Los m etodos de la geometr a diferencial se pueden aplicar a sistemas no lineales para determinar si tales sistemas son linealizables mediante realimentaci on de estados; esto es, si la descripci on din amica de un sistema en particular se puede hacer que parezca lineal, luego de efectuar una apropiada transformaci on de coordenadas y aplicar la correspondiente linealizaci on de estados no lineal. En concordancia con la terminolog a empleada en geometr a diferencial [11], [3], [14], la siguiente funci on vectorial n-dimensional: f1 (x) f1 (x1 , . . . , xn ) . . . . f (x) = (7.1) = . . fn (x) fn (x1 , . . . , xn )
108
se denomina un campo vectorial, si a cada funci on vectorial f le corresponde un campo de vectores en un espacio n-dimensional Rn . En lo que sigue, nosotros nos ocuparemos s olo de campos vectoriales suaves de la forma f (x), signicando que tales funciones vectoriales poseen derivadas parciales continuas de cualquier orden. El concepto de suavidad se aplica tambi en a funciones escalares. El gradiente de una funci on escalar suave h(x) se dene como: h(x) = h = x f (x) = f (x) = x
h x1
h xn
(7.2)
De la misma manera, el jacobiano de una funci on vectorial suave f (x) se dene como:
f1 x1
. . .
fn x1
.. .
f1 xn
(7.3)
. . .
fn xn
7.1.1.
Derivadas de Lie La derivada de Lie de una funci on escalar h(x) con respecto al campo vectorial f (x) es una nueva funci on escalar Lf h denida como: Lf h = h f = h h f1 + + fn x1 xn (7.4)
Observar que la derivada de Lie es el producto interno entre h(x) y f (x). Derivadas de Lie repetidas se pueden formular en forma recursiva como: L0 fh = h
i1 i1 Li f h = Lf (Lf h) = (Lf h) f
for i = 1, 2, . . .
(7.5)
Si f y g son campos vectoriales, entonces: Lg Lf = (Lf ) g Corchetes de Lie El corchete de Lie de dos campos vectoriales f y g es otro campo vectorial [f , g] denido como: [f , g] = g f f g (7.7) La notaci on adf g (donde ad signica adjunta) se emplea frecuentemente en lugar de [f , g]. Corchetes de Lie repetidos se pueden formular en forma recursiva: adf0 g = g adfi g = [f , adfi1 g] para i = 1, 2, . . . (7.8) Siempre que f , f1 , f2 , g, g1 y g2 sean campos vectoriales suaves, 1 and 2 sean constantes escalares y h(x) sea una funci on escalar suave de x, entonces se pueden formular las siguientes propiedades del corchete de Lie: (7.6)
7.1 Herramientas de la Geometr a Diferencial 1) Bilinealidad: [1 f1 + 2 f2 , g] = 1 [f1 , g] + 2 [f2 , g] [f , 1 g1 + 2 g2 ] = 1 [f , g1 ] + 2 [f , g2 ] 2) Anti-conmutatividad: [f , g] = [g, f ] 3) Identidad de Jacoby: Ladf g h = Lf Lg h Lg Lf h
109
(7.9)
(7.10)
(7.11)
7.1.2.
Una funci on denida en una regi on se conoce como un difeomorsmo si ambos, y su inversa 1 son funciones suaves. Si la regi on es Rn (el espacio total), entonces, (x) se denomina un difeomorsmo global. Por otra parte, un difeomorsmo local se dened s olo en una vecindad nita de un punto dado x0 . Una funci on suave (x) denida en una regi on en Rn es un difeomorsmo local, siempre que la matriz jacobiana x sea no singular en un punto x = x0 de la regi on . Empleando difeomorsmo, nosotros podemos transformar los estados de un sistema no lineal en un nuevo conjunto de estados correspondiente al sistema no lineal transformado. La metodolog a es bien conocida. Consideremos un sistema SISO (de una entrada y una salida) no lineal descrito por: x = f (x) + g(x)u y = h(x) (7.12)
donde u es la u nica entrada e y es la u nica salida. Denamos un nuevo conjunto de estados z = (x). Efectuando diferenciaci on en z: z = donde f = f x g = g x x = 1 (z) h = h x = (f (x) + g(x)u) = f (z) + g (z)u x x y = h (z) (7.13)
7.1.3.
El Teorema de Frobenius
Suponiendo que f1 , f2 , . . ., fm forman un conjunto de campos vectoriales linealmente independientes en Rn , el teorema de Frobenius establece que tal conjunto es completamente integrable s y s olo si dicho conjunto es involutivo. Se dice que el conjunto de campos vectoriales arriba denido es completamente integrable s y s olo si existen n m funciones escalares h1 (x), h2 (x), . . ., hnm (x) que satisfacen el siguiente sistema de ecuaciones diferenciales parciales. hi fj = 0 1inm 1jm (7.14)
110
El conjunto de campos vectoriales en consideraci on se dice que es involutivo, s y s olo si existen funciones escalares ijk en R (el espacio unidimensional) que satisfacen:
m
[fi , fj ](x) =
k=1
i, j
(7.15)
La u ltima ecuaci on indica que el campo vectorial resultante [fi , fj ](x) es una combinaci on lineal del conjunto original de campos vectoriales f1 , f2 , . . ., fm . De (7.15), podemos postular: 1) El conjunto de campos vectoriales constantes f1 , f2 , . . ., fm es siempre involutivo porque el corchete de Lie de cualquier par de tales campos siempre es nulo; esto es: [fi , gj ] = 0 lo cual signica que estos campos se pueden representar como una combinaci on lineal. 2) Un conjunto que contiene un u nico campo vectorial f es involutivo porque: [f , f ] = 0. 3) El conjunto de campos vectoriales f1 , f2 , . . ., fm es involutivo si x y i, j rank f1 (x) . . . fm (x) = rank f1 (x) . . . fm (x) [fi (x), fj ](x)
donde la notaci on rank . representa el rango de una matriz de campos vectoriales columna.
7.2.
Esta secci on presenta la metodolog a para generar una relaci on entradasalida para procesos SISO no lineales con el prop osito de dise nar controladores estables. El sistema no lineal en consideraci on se describe como: x = f (x) + g(x)u x1 . x= . . xn f1 (x) . . f = . fn (x) y = h(x) g1 . g= . . gn (7.16)
donde x es el vector de estado de orden n 1, u es la entrada de control, y es la salida del sistema, f y g son campos vectoriales suaves de orden n 1, y h es una funci on suave.
7.2.1.
El sistema no lineal x = f (x) + g(x)u es linearizable por realimentaci on de estados, s y s olo si las siguientes condiciones son verdaderas para una regi on :
111
1 1) Los campos vectoriales g, adf g, . . ., adn g son linealmente independientes en f la regi on . 2 2) El conjunto {g, adf g, . . ., adn g } es involutivo en . f
Para sistemas SISO lineales se sabe que f (x) = Ax y g(x) = B, donde A de orden n n y B de orden n 1 son las matrices de estado y de control (o de distribuci on) respectivamente. Por consiguiente, la primera condici on se convierte en la bien conocida condici on de estabilidad completa [15], [16], a saber, un sistema lineal de la forma: x = Ax + Bu y = Cx (7.17)
es controlable en sus estados si su matriz de controlabilidad C posee rango completo: rank C = rank [B AB An1 B] = n (7.18)
La primera condici on descrita arriba puede ser interpretada como la Condici on de Controlabilidad Generalizada. Ejemplo 7.1 La descripci on en el espacio de estado del manipulador MR1 con inductancia de armadura despreciable se muestra en la ecuaci on (2.22), de la cual se formula (prescindiendo de los argumentos para mayor claridad): x = f (x) + g(x)u x1 x2 f1 f2 y = h(x) = x1 g= g1 g2 = 0 b
x=
f=
x2 a1 sin x1 a2 x2
Determinar si el sistema MR1 es exactamente linearizable. Soluci on.- La primera condici on establecida en la subsecci on 7.2.1 requiere formar la matriz [g adf g], donde adf g = [f , g] = g f f g se calcula como sigue: g f f g = Luego: det[g adf g] = det 0 b b a2 b =0
g1 x1 g2 x1 g1 x2 g2 x2
f1 f2
f1 x1 f2 x1
f1 x2 f2 x2
g1 g2
b a2 b
Como el determinante de [g adf g] es diferente de cero, entonces g y adf g forman un conjunto de campos vectoriales linealmente independientes. Adem as, el conjunto [g adf g] es involutivo porque es constante.
112
7.2.2.
Diferenciemos la salida y de (7.16): y = h(x)(f + gu) = Lf h(x) + Lg h(x)u Si Lg h(x) = 0 para alg un x = x0 , entonces la siguiente transformaci on en la entrada: u= 1 (Lf h(x) + v ) Lg h(x)
genera una relaci on diferencial lineal entre la salida y y la nueva entrada v , de la forma: y = v . Por el contrario, si Lg h(x) = 0 para todo x, la diferenciaci on de y produce: y = L2 f h(x) + Lg Lf h(x)u Si ahora Lg Lf h(x) = 0 para todo x, necesitamos diferenciar y para obtener: y (3) = y as sucesivamente: y (i) = d iy i1 = Li f h(x) + Lg Lf h(x)u dt i d 3y 2 = L3 f h(x) + Lg Lf h(x)u dt 3
+ v)
(7.19)
(7.20)
genera una relaci on diferencial lineal entre la salida y y la nueva entrada v de la forma: d ry y (r ) = r = v dt Por consiguiente, un sistema SISO posee un grado relativo r en el punto x0 en una regi on si, para todo x : Lg Li f h(x) = 0
1 Lg Lr h(x) f
0i<r1
(7.21) (7.22)
= 0
Observar que r es el n umero de diferenciaciones ejecutadas en la salida y requeridas para que la entrada u aparezca. En general: r n (recordar que n es el orden del sistema). Si r = n, entonces la linealizaci on entradasalida se denomina exacta y en esta situaci on todos los estados se realimentan. Ejemplo 7.2
7.2 Linealizaci on por Realimentaci on. Caso: SISO Determinar el grado relativo del sistema MR1.
113
Soluci on.- Usemos el modelo del sistema MR1 descrito en el ejemplo ??. Calculemos (7.21) y (7.22): Lf h(x) = h(x)f = x2 Lg Lf h(x) = Lg x2 = x2 g = b = 0
7.2.3.
El sistema no lineal (7.16) se puede transformar a su forma normal usando los resultados establecidos en la subsecci on 7.1.2. Sabemos que linealizaci on exacta de un sistema no lineal descrito por (7.16) ocurre cuando el grado relativo r es igual al orden del sistema n. Para linealizaci on exacta, la transformaci on de estados: z= z1 z2 . . . zn = (x) = 1 (x) 2 (x) . . . n (x) = h(x) Lf h(x) . . .
1 Ln h(x) f
y y . . . yn
(7.23)
z 1 z 2 . . .
z2 z3 . . . zn b(z) + a(z)u
y = z1 (7.24)
(7.25)
Ejemplo 7.3 Determinar la forma normal del sistema MR1. Soluci on.- El modelo del sistema MR1 descrito en el ejemplo ?? ya est a en su forma normal debido a que su transformaci on lineal resulta en el mismo sistema: z= z1 z2 = h(x) Lf h(x) = x1 x2
114
7.2.4.
donde v es una nueva entrada a ser determinada, a(z) y b(z) est an dadas en (7.25), y z es el nuevo estado para linealizaci on. Substituyendo (7.26) en (7.24) produce la siguiente representaci on can onica invariante con el tiempo: z = Mz + Nv donde: M= 0 1 0 0 0 1 . . . . . . . . . . . . 0 0 0 0 0 0 0 0 0 0 . . . 1 0 N= 0 1 0 0 . . . C= 1 0 0 0 y = Cz (7.27)
La funci on de transferencia del sistema es: y (s) 1 = H (s) = C(sI M)1 N = n v (s) s (7.28)
donde s es el operador de Laplace. La entrada v se dise na para ubicar los polos del sistema lineal equivalente. Entonces, la entrada u se computa usando (7.26). Empleando (7.28), el sistema lineal equivalente se puede seleccionar de: v= d ny + Kn y = y (n) = (n) + K1 y (n1) + + Kn1 y dt n (7.29)
donde (t) es la trayectoria deseada e y (t) = (t) y (t) es la se nal de error de seguimiento. La ecuaci on caracter stica del sistema lineal equivalente es: + Kn y y (n) + K1 y (n1) + + Kn1 y =0 En el dominio de Laplace, la ecuaci on (7.30) toma la forma: (sn + K1 sn1 + + Kn1 s + Kn ) y = (s 1 )(s 2 ) (s n1 )(s n ) y (7.31) Observar en (7.30) que para comportamiento asint otico estable se requiere que y = ( y ) 0 con t . Con este prop osito, ninguna de las ra ces 1 , 2 , , n1 , n de (7.31) se deben de localizar en el semiplano derecho del plano s, incluyendo el eje imaginario. Cumpliendo este requerimiento, es f acil de determinar los par ametros de control Ki , i = 1, . . . , n. Ejemplo 7.4 (7.30)
7.3 Linealizaci on por Realimentaci on: Caso MIMO Determinar la ley de control para el sistema MR1.
115
Soluci on.- Las ecuaciones en (7.25) para el sistema MR1 con n = 2 toman la forma: a(z) = Lg Lf h(1 (z)) = b b(z) = Lf h(1 (z)) = x2
Por consiguiente, la ley de control (ecuaci on (7.26)) produce: u= donde: v= 1 [b(z) + v ] a(z)
d 2y + K2 y =y = + K1 y dt 2
+ K2 y y + K1 y =0
donde los par ametros K1 y K2 se calculan (jando las ra ces deseadas 1 y 2 en el semiplano derecho del plano s) de: (s2 + K1 s + K2 ) = (s 1 )(s 2 )
7.3.
7.3.1.
Un sistema MIMO no lineal se denomina cuadrado cuando el n umero de sus entradas iguala al n umero de sus salidas. El sistema cuadrado por considerar, en la vecindad del punto x0 , se describe por:
m
gj (x)uj (x)
y = h(x)
(7.32)
u1 . u= . . um h1 (x) y1 . . . h(x) = y= . . . ym hm (x) G11 (x) . . . G1m (x) . . G(x) = = g1 (x) gm (x) . ... Gm1 (x) . . . Gmm (x) donde x es el vector de estado de orden n 1, u es el vector de control (la entrada) de orden m 1, y es el vector de salida de orden m 1, f es un campo vectorial suave de orden n 1, h es un campo vectorial suave de orden m 1, y G es una matriz de dimensi on n m cuyas columnas son campos vectoriales gj de orden n 1. Los elementos de gj y h son funciones suaves.
x1 . x= . . xn
116
7.3.2.
En la referencia [14], se establece que el sistema cuadrado descrito por (7.32) posee un grado relativo total r = r1 + . . . + rm si: 1) Para todo x en una vecindad de x0 Lgj Lk f hi (x) = 0 j, i = 1, . . . , m k < ri 1 (7.33)
2) La siguiente matriz de orden m m es no singular en x = x0 : r1 1 1 1 Lg1 Lr h1 (x) Lgm Lf h1 (x) f Lg Lr2 1 h2 (x) Lg Lr2 1 h2 (x) m f 1 f A(x) = . . .. . . . . . rm 1 rm 1 Lg1 Lf hm (x) Lgm Lf hm (x)
Observando las las de A, podemos postular que cada entero ri est a relacionado con la i- esima salida del sistema. Tambi en, notar que ri es el n umero de diferenciaciones ejecutadas en la salida yi requeridas para que aparezca al menos uno de los componentes del vector de entrada u. La no singularidad de A(x) en x = x0 es la versi on multivariable de la condici on impuesta por la ecuaci on (7.22). Un sistema MIMO de orden n que posee m entradas y m salidas es completamente linearizable y desacoplable si su grado relativo total r = r1 + + rm es igual al orden n del sistema. Ejemplo 7.5 La descripci on en el espacio de estado del sistema MRE de dos entradas y dos salidas se muestra en la ecuaci on (2.122). Conforme a (7.32), la ecuaci on (2.122) se transforma en:
2
x = f (x)+G(x)u = f (x)+
j =1
gj (x)uj (x)
y=
y1 y2
= h(x) =
h1 h2
x1 x2
x3 0 0 f1 f2 x 0 0 4 ; G(x) = [g1 g2 ] = f = 1 1 f3 = M11 (P11 x3 P12 x4 ) M11 0 1 1 f4 M22 (P21 x3 P22 x4 d21 ) 0 M22 Determinar el grado relativo total del MRE. Soluci on. Para la salida y1 tenemos: Lf h1 = f1 = x3 Lf h2 = f2 = x4
1 Lg1 Lf h1 = M11 =0
Por lo tanto, r2 1 = 1 y r2 = 2. La matriz A dada en (7.33) toma la forma: A(x) = Lg1 Lf h1 Lg2 Lf h1 Lg2 Lf h2 Lg2 Lf h2 =
1 M11 0 1 0 M22
Claramente, la matriz A es no singular. Por consiguiente, el grado relativo total del sistema MRE es: r = r1 + r2 = 4 = n.
117
7.3.3.
Si el grado relativo total del sistema cuadrado descrito en (7.32) es r, entonces: r = r1 + r2 + + rm n Un sistema MIMO descrito por (7.32) posee linealizaci on exacta, si su grado relativo total r = r1 + . . . + rm es igual al orden n del sistema, es decir, la dimensi on n del vector de estados. Para linealizaci on exacta, la transformaci on de estados: 1 (x) z1 . . . . . . r1 (x) z r 1 1 (x) zr1 +1 . . . . . . z = (x) = (7.34) r (x) = zr1 +r2 2 . . . . . . 1 (x) zr +r ++1 1 2 . . . . . . rm (x) zr1 +r2 ++rm donde: 1 (x) = h1 (x) = y1 (x); 1 (x) = h2 (x) = y2 (x); . . . 1 (x) = hm (x) = ym (x); 2 (x) = Lf h1 (x); 2 (x) = Lf h2 (x); 2 (x) = Lf hm (x); . . .
r1 1 ; r1 (x) = Lf h1 (x) r2 1 ; r2 (x) = Lf h2 (x) . . .
rm 1 ; rm (x) = Lf hm (x)
r 1 (x) = r (x) = 1 1
m r1 1 Lgj Lf h1 (1 (z))uj = v1 j =1
1 (x) = 2 (x) y 2 = . . . y2 2
(r ) y2 2 (r 1)
r 1 (x) = r (x) = 2 2
m r2 1 Lgj Lf h2 (1 (z))uj = v2 j =1
118
m rm 1 Lgj Lf hm (1 (z))uj = vm j =1
(7.35)
Ejemplo 7.6 Determinar la forma normal MIMO del proceso MRE. Soluci on: Del ejemplo 7.5, la condici on para linealizaci on exacta se cumple para el sistema MRE porque r = r1 + r2 = 4 = n (orden del sistema). Aplicaci on de las relaciones (7.34) y (7.35) en el sistema MRE nos conduce a: z1 z2 z= z3 = (x) = z4 z1 z3 x = 1 (z) = z2 z4 donde: y1 y2 z1 z3 v1 v2 0 0 M= 0 0 1 0 0 0 0 0 0 0 0 0 1 0 1 (x) h1 Lf h1 (x) 2 (x) = 1 (x) h2 (x) 2 (x) Lf h2 (x) z 1 z2 z 2 v1 = z = z 3 z4 z 4 v2 = Mz + Nv y = Cz x1 y1 x3 y = 1 x2 = y2 x4 y 2
y=
v=
0 1 N= 0 0
0 0 0 1
C=
1 0 0 0 0 0 1 0
7.3.4.
Es importante anotar que el grado relativo ri , i = 1, . . . , m, es el entero m as peque no requerido para que al menos una de las entradas aparezca en (ver (7.35)):
m ri yi
1 i Lr f hi ( (z))
+
j =1
i 1 Lgj Lr hi (1 (z))uj f
119
i 1 Por consiguiente, Lr hi (1 (z))uj = 0 para al menos un j en la vecindad de x0 . f Ahora consideremos la siguiente ley de control desacoplada: u1 . 1 u= . (7.36) . = A (z)[B (z) + v] um
donde v = [v1 . . . vm ]T es una nueva entrada por determinar, y A(z) (ver (7.33)) y B(z) son matrices con elementos: aij = Lgi Lf j
r 1
hj (1 (z))
i, j = 1, . . . , m i = 1, . . . , m
1 i bi = Lr f hi ( (z))
respectivamente. Sustituci on de los elementos ui , i = 1, . . . , m (ecuaci on (7.36)) en (7.35) conduce a la siguiente representaci on invariante con el tiempo: yi
(ri )
= d ri yi /dt ri = vi
i = 1, . . . , m
Por extensi on podemos formular entonces: y(s) = H(s)v(s) donde la matriz de transferencia H(s) del sistema MIMO 1/sr1 0 0 r 0 2 1/s 0 H(s) = . . . . . .. . . . . . 0 0 linealizado posee la forma: (7.37)
1/srm
Cada entrada vi produce un sistema lineal equivalente, similar al descrito en (7.29), (7.30) y (7.31) para el caso SISO. Por consiguiente, para el caso MIMO: vi = d ri yi (r ) (r ) (r 1) i +Ki,ri y = yi i = i i +Ki,1 y i i + +Ki,ri 1 y i dt ri i = 1, . . . , m (7.38)
donde i (t) es la i- esima trayectoria deseada y, y i (t) = i (t) yi (t) es la i- esima se nal de error de seguimiento. La i- esima ecuaci on caracter stica resulta: y i
(ri )
+ Ki, 1 y i
(ri 1)
i + Ki, ri y + + Ki, ri 1 y i = 0
i = 1, . . . , m
(7.39)
En el dominio de Laplace, la ecuaci on (7.39) toma la forma: (sri + Ki, 1 sri 1 + + Ki, ri 1 s + Ki, ri ) y= (s i, 1 )(s i, 2 ) (s i, ri1 )(s i, ri ) y (7.40)
Para comportamiento asint otico estable, es decir, para que y i 0, o lo que es lo mismo: yi i para t , ninguna de las ra ces de (7.39) debe de estar localizada en el semiplano derecho del plano-s, incluyendo el eje imaginario.
Determinar la ley de control MIMO desacoplada para el proceso MRE. Soluci on. Usando (7.38), las entradas v1 y v2 toman la forma: 1 + K1,2 y v1 = y 1 = 1 + K1,1 y 1 v2 = y 1 = 2 + K2,1 y 2 + K2,2 y 2 donde i (t) y y i (t) = i (t) yi (t) son la i- esima trayectoria deseada y el i- esimo error de seguimiento respectivamente, para i = 1, 2. Los par ametros Ki,j , para i, j = 1, 2, se determinan de las siguientes ecuaciones caracter sticas: s2 + K1,1 s + K1,2 = (s 1,1 )(s 1,2 ) s2 + K2,1 s + K2,2 = (s 2,1 )(s 2,2 ) donde i,j , para i, j = 1, 2, son las ra ces deseadas y deben de estar ubicadas en el semiplano derecho del planos, sin incluir el eje imaginario. La ley de control se determina de (7.36): u1 u= = A1 (z)[B (z) + v] u2 donde A(z) (ver ejemplo 7.5) y B toman la forma: A(x) =
1 M11 0 1 0 M22
B=
L2 f h1 L2 f h2
f3 f4
7.4.
El dise no de controladores por ubicaci on de polos para sistemas lineales [16], [17] asume que todos los estados del sistema est an disponibles en la realimentaci on. En esta situaci on es posible forzar al sistema de modo tal que posea polos predeterminados a lazo cerrado; es decir, hacer que el sistema posea polos prescritos (o eigenvalores) en localizaciones deseadas. En la pr actica, s olo parte de los estados son disponibles para procesamiento, y adem as, debemos siempre evitar la diferenciaci on de variables de estado con el n de generar nuevas. Es bien conocido que la simple diferenciaci on de una se nal puede hacer decrecer en varias veces la relaci on se nal a ruido. Los observadores de estados para sistemas lineales son capaces de estimar los estados no medibles. El dise no de un observador lineal de estados es similar al dise no de un controlador lineal por ubicaci on de polos. En otras palabras, la expresi on de la matriz de ganancia de un observador de estados es la expresi on dual de la matriz de ganancia de un controlador de estados. Vimos que la linealizaci on exacta (subsecci on 7.3.3) nos permite dise nar una ley de control desacoplada (subsecci on 7.3.4) usando eigenvalores prescritos para asegurar la estabilizaci on del sistema descrito por (7.32). Apelando al concepto de dualidad como en el caso lineal discutido l neas arriba, nosotros enfrentaremos el problema de s ntesis de observadores no lineales con eigenvalores prescritos para la estimaci on de estados.
121
7.4.1.
Sistemas lineales SISO de la forma dada en (7.27) son observables si su matriz de observabilidad O posee rango completo (ver (3.24) por ejemplo); es decir: rango O = rango C CM . . . CMn1 Se puede demostrar f acilmente que la matriz de observabilidad del sistema (7.27) posee rango completo. Para sistemas no lineales con entrada y salida escalares descritos por: x = f (x) + g(x)u y = h(x) (7.42) la matriz de observabilidad generalizada se puede denir como; h(x) h(x) L h ( x ) L f f h(x) O(x) z = ( x ) = . . . . x . . n1 n1 Lf h(x) Lf h(x) (7.43) =n (7.41)
donde O es de orden nn y z = (x) es la transformaci on de estados descrita en (7.23). Es f acil de vericar que la ecuaci on (7.43) se convierte en (7.41) cuando f (x) = Ax y h(x) = Cx. La descripci on en el espacio de estado del sistema en el dominio de z est a dado on (7.27) describe su correspondiente por la ecuaci on (7.24), mientras que la ecuaci representaci on can onica invariante en el tiempo. Empleando (7.24) y la transformaci on z = (x), podemos formular: x = O(x)(f (x) + g(x)u) = Mz + Nv x n1 1 v = Ln h(1 (z))u f h( (z)) + Lg Lf z = y = Cz (7.44)
El observador no lineal para el sistema descrito por las ecuaciones (7.24) y (7.27) posee la forma: = M z z + Nv + P(y C z) y = C z (7.45)
donde zey son los estimados de z e y , respectivamente, y P de orden n 1 es la matriz de ganancia del observador. Notar que (7.45) se convierte en un observador lineal cuando v es una entrada lineal. Asumamos la existencia de O1 (x). Para z = zyx=x , y usando el hecho de que y = C z = h(x ), entonces la ecuaci on (7.44) toma la forma: O (x )(f (x ) + g (x )u) = M z + Nv C z = h(x ) (7.46)
122
Substituyendo (7.46) en (7.45) nos conduce al siguiente observador no lineal en el dominio de x : = f (x x ) + g (x )u + O1 (x )H(y h(x )) (7.47) Sea e = z z el error de estimaci on. Substrayendo (7.27) de (7.46) y usando el hecho de que y = Cz, es f acil vericar que: e = (M HC)e (7.48)
La matriz de ganancia H del observador requiere ser seleccionada de modo tal que los eigenvalores de la ecuaci on caracter stica del observador no lineal: det [sI M + HC] = 0 hagan que el error de estimaci on e tienda a 0 con suciente rapidez. Tal matriz de ganancia H se puede computar usando los comandos place o acker de Mathscript. Tales comandos se pueden tambi en emplear para calcular la ganancia K del controlador del sistema z = Mz + Nv y = C z como sigue: H = place(M,N,[mu1 ... mun]) H = acker(M,N,[mu1 ... mu2]) donde 1 , . . . n (mu1, ..., mun) son las ra ces (o polos) deseadas del sistema controlado. Debido a la dualidad que existe entre controlabilidad y observabilidad, la matriz la matriz de ganancia H del observador se puede calcular de: H = place(M,C,[nu1 ... nun]) H = acker(M,C,[nu1 ... nun]) donde 1 , . . . n (nu1, ... nun) son las ra ces (o polos) deseadas del observador y el ap ostrofe indica la operaci on matricial transpuesta. Con el comando place los polos del observador deben de estar en diferentes posiciones. Esto no es necesario si se usa el comando acker. Es conveniente que la din amica del observador sea mucho m as r apida que la del mismo sistema, por ello se recomienda ubicar los polos del observador al menos 5 veces m as alejados hacia la izquierda de los polos dominantes del sistema realimentado. Ejemplo 7.8 Determinar el observador SISO con polos prescritos para el sistema MR1. Soluci on. La ecuaci on (7.47) es el observador SISO pedido: = f (x x ) + g (x ) u + O 1 (x )P(y h(x )) donde: y = x1 y h(x ) = x 1 . Adem as: f= f1 (x ) f2 (x ) O(x) = = x x 2 a1 sin x 1 a2 x 2 h(x) Lf h(x) = x x1 x2 = g= 1 0 0 1 0 b
7.4 Observadores No Lineales con Polos Prescritos H = place(M,C,[nu1, nu2]) H = acker(M,C,[nu1, nu2])
123
donde 1 y 2 (nu1 y nu2) son las ra ces (o polos) deseadas del observador y el ap ostrofe indica la operaci on matricial transpuesta. Recordar que con el comando place los polos del observador deben de estar en diferentes posiciones.
7.4.2.
El observador MIMO no lineal es una extensi on del observador SISO descrito en la subsecci on 7.4.1. Considere que el sistema MIMO no lineal cuadrado descrito por (7.32) posee un grado relativo total r = r1 + + rm . Para linealizaci on exacta, la transformaci on de estados dada en (7.34) nos conduce a la descripci on en el espacio de estado dada por (7.35). Por consiguiente, la correspondiente matriz de observabilidad generalizada se puede formular como: O(x) (x) x z = (x) (7.49)
por lo tanto (ver ecuaci on (7.44)): x = O(x)(f (x) + g(x)u) = Mz + Nv x n 1 1 v = Ln h(1 (z))u v = [v1 . . . vm ]T f h( (z)) + Lg Lf z = y = Cz El observador MIMO toma la forma: = M z z + Nv + H(y C z) y = C z (7.53) (7.54) (7.50) (7.51) (7.52)
donde zey son los estimados de z e y, respectivamente, y H de orden n m es la matriz de ganancia del observador. La ecuaci on no lineal del observador en el dominio de x est a dada por: = f (x x ) + G(x )u + O1 (x )H(y h(x )) Sea e = z z el error de estimaci on. Sustraendo (7.53) de (7.50) se obtiene: e = (M HC)e (7.56) (7.55)
Como en el caso SISO, la matriz la matriz de ganancia H del observador se puede calcular de: H = place(M,C,[nu1 ... nun]) H = acker(M,C,[nu1 ... nun]) donde 1 , . . . n (nu1, ... nun) son las ra ces (o polos) deseados del observador y el ap ostrofe indica la operaci on matricial transpuesta. Con el comando place los polos del observador deben de estar en diferentes posiciones. Esto no es necesario si se usa el comando acker. Cabe anotar tambi en la recomendaci on, como en el caso SISO, de ubicar los polos del observador al menos 5 veces m as alejados hacia la izquierda de los polos dominantes del sistema realimentado.
Determinar el observador MIMO no lineal para el proceso MRE. Soluci on. La ecuaci on (7.55) es el observador MIMO requerido: = f (x x ) + G(x )u + O1 (x )H(y h(x )) donde (ver ejemplo 7.5): y1 x1 h1 (x ) x 1 = h(x ) = = y2 x2 h2 (x ) x 2 x 3 f1 (x ) f2 (x x 4 ) = f (x ) = 1 f3 (x M11 (P11 x 3 P12 x 4 ) ) 1 21 ) f4 (x ) M22 (P21 x 3 P22 x 4 d 0 0 0 0 G(x ) = [g1 (x ) g2 (x )] = 1 M 0 11 1 0 M22 h1 x1 1 0 0 x3 0 0 1 h(x) L h 1 f = = = O(x) = x Lf h(x) x h2 x x2 0 1 0 Lf h2 x4 0 0 0 y=
0 0 = O1 0 1
La matriz de ganancia H del observador se determina usando cualesquiera de las relaciones: H = place(M,C,[nu1 nu2 nu3 nu4]) H = acker(M,C,[nu1 nu2 nu3 nu4]) donde 1 , 2 , 3 y 4 son las ra ces (o polos) deseadas del observador y el ap ostrofe indica la operaci on matricial transpuesta. Tener en cuenta que con el comando place los polos del observador deben de estar en diferentes posiciones.
7.5.
Procedimiento de Dise no
El procedimiento de dise no de un sistema de control empleando el m etodo de la linealizaci on por realimentaci on de estados comprende los pasos siguientes: (1) Determinar el modelo din amico del sistema a controlar en forma de su ecuaci on de estado, tal como se muestra en (7.16) para el caso SISO y en (7.32) para el caso MIMO. (2) Determinar si se cumplen las condiciones de linealizaci on exacta descritas en la subsecci on 7.2.1 para el caso SISO. Si este es el caso, calcular su grado relativo r de acuerdo a la subsecci on 7.2.2. Para el caso MIMO calcular el grado relativo total de acuerdo con la subsecci on 7.3.2 con el n de determinar si el sistema es exactamente linealizable.
7.6 Aplicaciones
125
(3) Determinar la forma normal del sistema (subsecciones 7.2.3 y 7.3.3 para los casos SISO y MIMO respectivamente) para linealizaci on exacta. (4) Formular el observador de estados completo del sistema descrito en la subsecci on 7.4.1 para el caso SISO y 7.4.2 para el caso MIMO. (5) Determinar la ley de control desacoplada descrita en las subsecciones 7.2.4 y 7.3.4 para los casos SISO y MIMO respectivamente. (6) Simular el sistema para las especicaciones de dise no preestablecidas. (7) Determinar el hardware y programar el software de control para implementar el sistema de control dise nado. Realizar las pruebas experimentales del caso para validar el dise no.
7.6.
7.6.1.
Aplicaciones
Control por Linealizaci on del Manipulador MR1
La descripci on en el espacio de estado del manipulador MR1 con inductancia de armadura despreciable y la aplicaci on de las condiciones para linealizaci on exacta o que el en tal sistema ha sido materia del ejemplo 7.1. En el ejemplo 7.2 se determin grado relativo r = 2 del sistema MR1 coincide con el orden n =2 de dicho sistema. La forma normal del manipulador fue determinada en el ejemplo 7.3, mientras que en los ejemplos 7.4 y 7.8 se dedujeron la ley de control y el observador no lineal del sistema, respectivamente. Las Figs. 7.1 y 7.2 muestran el resultado de la simulaci on del sistema de control de la posici on angular del brazo del MR1 para los casos de seguimiento y regulaci on respectivamente. Para obtener dichas Figs. ejecutar los programas mr1s.m y mr1r.m, cuyos listados se encuentran en el CD adjunto. La se nal de referencia deseada para el caso de seguimiento se formul o como: qd = A sin W k + A3 W k donde A y W son constantes, k = t/T es el tiempo discreto y T es el tiempo de muestreo. Para el caso de regulaci on,la se nal de referencia es del tipo escal on. Notar en tales Figs. que las especicaciones de dise no porcentaje de sobreimpulso nulo, error en estado estacionario nulo y tiempo de estabilizaci on menor de 1 s se cumplen satisfactoriamente. Para el caso de seguimiento las ra ces deseadas del controlador se jaron en -30, mientras que las del observador se jaron en -150 y -151. Para el caso de regulaci on las ra ces deseadas del controlador se jaron en -10, mientras que las del observador se jaron en -50 y -51.
7.6.2.
La descripci on en el espacio de estado y la determinaci on del grado relativo total del manipulador MRE con inductancias de armadura de sus servomotores despreciables es materia del ejemplo 7.5. Dao que el grado relativo total r = 4 coincide con el orden n = 4 del sistema MRE, entonce dicho sistema es exactamente linearizable. La forma normal del manipulador MRE fue hallada en el ejemplo ??, mientras
126
1.5
POSICIN x1 [rad]
0.5
4 3
CONTROL u
2 1 0 1
4 TIEMPO
5 [S]
Fig. 7.1: Posici on angular controlada del brazo del MRE. Caso: seguimiento.
0.5 0.4 0.3 0.2 0.1 0
POSICIN x1 [rad]
15 10
CONTROL u
5 0 5 10
4 TIEMPO
5 [S]
Fig. 7.2: Posici on angular controlada del brazo del MRE. Caso: regulaci on.
que en los ejemplos 7.4.1 y 7.9 se dedujeron la ley de control y el observador no lineal del sistema, respectivamente. Las Figs. 7.3 y 7.4 muestran el resultado de la simulaci on del sistema de control de la posici on angular del brazo del MRE para los casos de seguimiento y regulaci on respectivamente. Para obtener dichas Figs. ejecutar los programas mres.m y mrer.m, cuyos listados se encuentran en el CD adjunto. La se nal de referencia deseada para el caso de seguimiento se formul o como: qd = A sin W k + Bk donde A y W son constantes, k = t/T es el tiempo discreto y T es el tiempo de muestreo. Para el caso de regulaci on,la se nal de referencia es del tipo escal on. Notar en tales Figs. que las especicaciones de dise no porcentaje de sobreimpulso nulo,
7.7 Problemas
127
error en estado estacionario nulo y tiempo de estabilizaci on menor de 2 s se cumplen satisfactoriamente. Tanto para los casos de seguimiento y de regulaci on las ra ces deseadas del controlador se jaron en -2, mientras que las del observador se jaron en -100, -101, -102 y -103.
POSICIN q1 [rad] 10 5 0
10
12
14
16
18
20
CONTROL u1 [V]
0.2 0.1 0
POSICIN q2 [rad]
10 TIEMPO
12 [s]
14
16
18
20
20 10 0
10
12
14
16
18
20
CONTROL u1 [V]
2 0 2
10 TIEMPO
12 [s]
14
16
18
20
Fig. 7.3: Posiciones angulares controladas de los brazos del MRE. Caso: seguimiento.
7.7.
Problemas
Problema 7.1 : Sistema de Plataformas Dise nar un sistema de control por linealizaci on de la realimentaci on de estados para el sistema de plataformas mostrado en la Fig. 2.11 y descrito en el problema 2.4. Problema 7.2 : Columna de Destilaci on En el problema 2.5 se describe la columna de destilaci on para fraccionar petr oleo pesado, mostrado en La Fig. 2.12. Dise nar un sistema de control por linealizaci on de la realimentaci on de estados para este sistema. Problema 7.3 : Reactor Qu mico Dise nar un sistema de control por linealizaci on de la realimentaci on de estados para el reactor qu mico con chaqueta de enfriamiento mostrado en la Fig. 2.13 y descrito en el problema 2.6. Problema 7.4 : Motor DC No Lineal
128
POSICIN q1 [rad]
2 1 0
10
12
14
16
18
20
CONTROL u1 [V]
1 0 1
POSICIN q2 [rad]
10 TIEMPO
12 [s]
14
16
18
20
2 1 0
10
12
14
16
18
20
CONTROL u1 [V]
5 0 5
10 TIEMPO
12 [s]
14
16
18
20
Fig. 7.4: Posiciones angulares controladas de los brazos del MRE. Caso: regulaci on.
En el problema 2.7 se describe un motor DC en el cual el voltaje de armadura se mantiene constante mientras que el voltaje de campo es variable (ver Fig. 2.14. Dise nar un sistema de control por linealizaci on de la realimentaci on de estados para este motor. Problema 7.5 : Manipulador Polar Vertical La Fig. 2.15 (problema ) muestra un manipulador polar vertical. Dise nar un sistema de control por linealizaci on de la realimentaci on de estados para este manipulador. Problema 7.6 : Manipulador Polar Horizontal La Fig. 2.16 (problema ) muestra un manipulador polar horizontal. Dise nar un sistema de control por linealizaci on de la realimentaci on de estados para este manipulador. Problema 7.7 : Manipulador Rob otico TraslacionalEsf erico (MRTE) Dise nar un sistema de control por linealizaci on de la realimentaci on de estados para el manipulador rob otico traslacionalesf erico mostrado en la Fig. 2.17 y descrito en el problema 2.10. Problema 7.8 : Manipulador Rob otico Esf erico (MRE3) Dise nar un sistema de control por linealizaci on de la realimentaci on de estados para el manipulador rob otico esf erico mostrado en la Fig. 2.17 y descrito en el problema 2.11.
129
La din amica del motor s ncrono de im an permanente se describe en el problema 2.12. Dise nar un sistema de control por linealizaci on de la realimentaci on de estados del torque para este motor.
Ap endice A
A. M. Lyapunov trata el problema de la estabilidad de sistemas descritos mediante ecuaciones diferenciales empleando dos m etodos. El denominado primer m etodo analiza el comportamiento de la estabilidad de una soluci on expl cita del modelo no lineal del sistema y se aplica solamente a ciertos casos. El segundo m etodo, o m etodo directo de Lyapunov, es de gran generalidad y potencia porque no requiere de la soluci on de la descripci on del sistema, como s lo requiere el primer m etodo.
A.1.1.
Conceptos de Estabilidad
se dice que es no aut onomo si f depende del tiempo, por ejemplo, si f posee par ametros variantes con el tiempo. Por consiguiente, un sistema aut onomo puede ser descrito por: x = f (x). Las trayectorias de estado para procesos aut onomos son independientes del tiempo inicial, mientras que para los no aut onomos generalmente no lo son. Un estado o punto de equilibrio xe (realmente un vector constante) de un sistema aut onomo se puede determinar de: 0 = f (xe ) (A.2)
Ya que nosotros debemos de tratar la estabilidad en el origen del sistema aut onomo b asico: x = f (x) x(0) = 0 (A.3) Entonces debemos de hacer ciertas suposiciones con relaci on a la gura A.1. Denotaremos como B (R) a la regi on esf erica (bal on) ||x|| < R y como S (R) a la esfera ||x|| = R en s . La regi on esf erica anular cerrada r ||x|| R ser a denotada coR . Asumiremos que en una cierta regi on esf erica : ||x|| < B (R), todas las mo Br derivadas parciales xi /xj existen y son continuas en . Entonces diremos que el origen es: estable si alguna trayectoria que empieza en B (r) en un punto arbitrario xo nunca logra alcanzar la esfera frontera S (R) de B (R);
132
El M etodo Directo de Lyapunov asint oticamente estable cuando es estable y en adici on cada trayectoria de estado que empieza en B (R) en un punto arbitrario xo , tiende hacia el origen conforme el tiempo se incremente indenidamente; inestable cuando para alg un R y r, ya sea grande o peque no, alguna trayectoria de estado que empieza en B (R) en un punto arbitrario x0 logra alcanzar la esfera frontera S (R). Observar en la gura A.1 que para la trayectoria T el origen es inestable en el sentido de Lyapunov, a pesar de que tal trayectoria de estado muestre convergencia.
Unstable
0 r x0
S(R)
A.1.2.
Funciones de Lyapunov
Un tipo especial de funci on escalar V (x), la denominada funci on de Lyapunov juega un importante rol en el an alisis de la estabilidad y el dise no de sistemas de control. Una funci on de Lyapunov V (x) verica las siguientes propiedades: (a) V (x) y sus primeras derivadas parciales V (x) = V (x) x son continuas en una cierta regi on abierta alrededor del origen. (b) V (0) = 0 (c) Fuera del origen, pero siempre en , V (x) es positiva. Por consiguiente, el origen es un m nimo aislado de V (x). (x) = V (x) x = V (x) f (x) 0 en . (d) V
133
V (x) es una funci on denida positiva si satisface las propiedades (a)(c). La gura A.2 ilustra una funci on de Lyapunov para un sistema de segundo orden. Notar que V (x1 , x2 ) tiene el aspecto general de un espejo parab olico apuntando hacia arriba. Si V fuera denida negativa, el espejo parab olico deber a de apuntar hacia abajo. Por consiguiente, V (x) es denida negativa si V (x) es denida positiva. Tambi en, V (x) es semidenida positiva si V (0) = 0 y V (x) 0 para x = 0; V (x) es semidenida negativa si V (x) es semidenida positiva. Para una matriz cuadrada V de orden n n, las expresiones V > 0, V 0, V < 0 y V 0 denotan que V es denida positiva, semidenida positiva, denida negativa y semidenida negativa respectivamente, siempre y cuando V est e asociada a su forma cuadr atica. V es denida positiva (V > 0), es decir, xT Vx > 0, si la funci on cuadr atica T x Vx es denida positiva para x = 0. Tambi en, V es denida positiva si todos sus eigenvalores o sus menores principales son mayores que cero. En general, los menores principales mi de V = [vij ] (de orden n n) son: v11 v12 v13 v11 v12 m0 = 1; m1 = v11 ; m2 = det ; m3 = det v21 v22 v23 ; v21 v22 v31 v32 v33 y as sucesivamente hasta llegar a mn = det(V). V es semidenida positiva (V 0), es decir, xT Vx 0, si la funci on cuadr atica T x Vx es semidenida positiva para x = 0. Tambi en, V 0 si V es singular de rango r < n, y r eigenvalores o r menores principales de V son positivos y el resto (n r) son nulos. V denida negativa (V < 0), es decir, xT Vx < 0, si la funci on cuadr atica T x Vx es denida negativa para x = 0. Tambi en, V < 0 si V es no singular y todos los eigenvalores o los menores principales de V son negativos. V semidenida negativa (V 0), es decir, xT Vx 0, si la funci on cuadr atica T x Vx 0 a para x = 0. V 0 si V es singular de rango r < n, y r eigenvalores o r menores principales de V son negativos y el resto (n r) son nulos. Si la matriz cuadrada V de orden n n posee eigenvalores positivos y negativos, entonces V es indenida.
V(x1 , x 2)
x2
V(x1 , x 2) x2 x1
Fig. A.2: Representaci on gr aca de una funci on de Lyapunov.
x1
Ejemplo A.1
134
La funci on V (x) = (x1 + x2 )2 con x = [x1 x2 ]T es semidenida positiva desde que V (0) = 0 y V (x) 0 para x = 0 (por ejemplo, para x1 = x2 , V (x) = 0), 2 mientras que la funci on V (x) = x2 1 + x2 no es denida positiva ni negativa porque V (x) > 0 para x1 = 0 y V (x) < 0 para x2 = 0. Es f acil de demostrar que la funci on 2 2 V (x) = x1 + x2 es denida positiva. Ejemplo A.2 El circuito mostrado en la gura A.3 contiene un resistor no lineal RN que obedece la ley i = N e3 , N > 0. Determine si la energ a almacenada en el capacitor C es una funci on de Lyapunov.
R
+
i
+
u
-
e -
RN
Fig. A.3: Circuito no lineal. Soluci on: Sumando las corrientes que salen del nodo superior derecho (ver la gura A.3) produce: eu Ce + + N e3 = 0 R 2 La energ a almacenada en el capacitor est a dada por V (e) = 1 2 Ce . Para el sistema no actuado (u = 0) tenemos: (e) = Cee V = e2 1 + N e2 R 0
Por consiguiente, la funci on V (e) es una funci on de Lyapunov. Ejemplo A.3 La gura A.4 muestra un sistema masaamortiguadorresorte no lineal cuyo modelo din amico es: Mx + Bo x + B1 x |x | + K0 x + K1 x3 = 0 donde (B0 x + B1 x |x |) caracteriza un amortiguador no lineal con coecientes de amortiguaci on B0 , B1 > 0 constantes, y donde (K0 x + K1 x3 ) representa un resorte no lineal con coecientes de resorte K0 , K1 > 0 constantes. Demostrar que la energ a total almacenada en el sistema es una funci on de Lyapunov. Soluci on: La energ a del sistema es: 1 V (x) = M x 2 + 2
x 0
1 1 1 (K0 x + K1 x3 )dx = M x 2 + K0 x2 + K1 x4 2 2 4
Se puede demostrar f acilmente que: (x) = M x V x + (K0 x + K1 x3 )x = [B0 x B1 x |x |]x = B0 x 2 B1 |x |3 0 Por consiguiente, V (x) es una funci on de Lyapunov.
135
M K0 K B b(t)
Funciones de Lyapunov para Sistemas No Aut onomos El sistema no aut onomo en consideraci on se describe en la regi on : ||x|| < A mediante: x = f (x, t) f (0, t) = 0 t0 (A.4) Siempre que W (x) es una funci on de Lyapunov en , entonces V (x, t) es una funci on de Lyapunov si: (a) V (x, t) est a denida en para alg un t 0; (b) V (0, t) = 0 para alg un t 0; (c) V (x, t) W (x) para alg un t t0 ; (x, t) 0 para alg (d) V un t 0, donde: V V = dV = V + V x = V + f (x, t) dt t x t x Se dice que una funci on V (x, t) es denida positiva si satisface las condiciones (a)(c). Tambi en se dice que V (x, t) es una funci on denida positiva si esta funci on domina a otra funci on denida positiva W (x), por ejemplo, cuando V (x, t) W (x). Tambi en, V (x, t) es denida negativa si V (x, t) es denida positiva; V (x, t) es semidenida positiva si esta funci on domina a otra funci on semidenida positiva W (x); V (x, t) es semidenida negativa si V (x, t) es semidenida positiva. Ejemplo A.4 Desprecie el t ermino no lineal x |x | del amortiguador descrito en el ejemplo A.3 y considere un coeciente de amortiguaci on b(t) variante con el tiempo en lugar de B0 , de modo tal que el sistema se convierta en uno no aut onomo. Demostrar que la siguiente funci on V (x, t) es una funci on de Lyapunov. V (x, t) = M 1 (x + x)2 + 2 2 1 2 K0 + K1 M 2 + b(t) x2 2
(x, t) produce: Soluci on: El c omputo de V 1 (x, t) = (M b(t))x V 2 + (b (t) 2k0 ) K1 x4 < 0 2
136
(t) < 2K0 . De acuerdo al ejemplo A.3, la energ siempre que > 0, b(t) > M y b a del sistema es una funci on de Lyapunov, a saber: 1 1 1 W (x) = M x 2 + K0 x2 + K1 x4 2 2 4 Podemos observar que V (x, t) > W (x). Por consiguiente, V (x, t) es una funci on de Lyapunov.
A.1.3.
Los teoremas de estabilidad de Lyapunov generalizan la idea de que cerca al estado de equilibrio de un sistema f1sico, la energ a del sistema es siempre decreciente. Teoremas de Estabilidad para Sistemas Aut onomos I. Teorema de Estabilidad. El equilibrio en el origen es estable si all existe en alguna vecindad del origen, una funci on de Lyapunov V (x). II. Teorema de Estabilidad Asint otica. El equilibrio en el origen es asint otica es denida positiva (esto es: V > 0) en . mente estable si V III. Teorema de Estabilidad Completa (Global). Considere una funci on escalar V (x) con primeras derivadas parciales continuas para todo x = 0 tal que (x) < 0, y V (x) cuando ||x|| . entonces el sistema aut V (x) > 0, V onomo oticamente estable. (A.4) es completamente (globalmente) asint IV. teorema de Inestabilidad of Ce teav. Sea una vecindad en el origen. Sea una regi on en . Dada una funci on V (x) en , entonces el equilibrio en el origen es inestable si: (a) V (x) posee derivadas parciales continuas en . (x) son denidas positivas en . (b) V (x) y V (c) V (x) = 0 en los puntos de frontera de dentro de . (d) El origen es un punto de frontera de . La gura A.5 ilustra el teorema de inestabilidad de C eteav. El teorema de inestabilidad de C eteav se convierte en el denominado primer teorema de inestabilidad si = 1 , cuando es una cierta vecindad del origen. Si, en adici on > 0 es reemplazada por: a la condici on = , la condici on V (x) V (x) 0 V t0 x
donde es una constante positiva, de este modo el teorema de inestabilidad de C eteav se convierta en el denominado segundo teorema de inestabilidad. Las demostraciones de los teoremas descritos anteriormente se realizan b asicamente en forma geom etrica en [19], [3].
137
V=0
.
1
x0
V = constant
Teoremas de Estabilidad de Lyapunov para Sistemas no Aut onomos V. teorema de Estabilidad. El equilibrio en el origen es estable, si all existe en alguna vecindad del origen, una funci on de Lyapunov V (x, t). VI. Teorema de Estabilidad Asint otica Uniforme. El equilibrio en el origen es uniformemente asint oticamente estable si la funci on denida positiva V (x, t) ies decreciente (lo que signica que V est a dominado por una funci on denida positiva (x, t) es denida positiva(es decir, V > 0) en . W (x) para alg un t 0) y V VII. Teorema de Inestabilidad. Sea una vecindad del origen. Sea una regi on en . Dada una funci2n V (x, t) en , entonces el equilibrio del origen en el tiempo t0 es inestable si: (a) V (x, t) posee derivadas parciales continuas en . (x, t) son denidas positivas en 1 . (b) V (x, t) y V (c) V (x, t) = 0 para alg un t t0 en los puntos de frontera de dentro de . (d) El origen es un punto de frontera de dentro de . En forma similar, el teorema de inestabilidad anterior se convierte en el denominado primer teorema de inestabilidad si = , donde es una cierta vecindad > 0 es reemplazada del origen. Si en adici on a la condici on = , la condici on V por (x, t) V (x, t) 0 V t t0 x donde es una constante positiva, entonces el teorema de inestabilidad se convierte en el denominado segundo teorema de inestabilidad. Las demostraciones de estos teoremas se pueden encontrar en [3]. Ejemplo A.5 Determine la estabilidad del sistema aut onomo descrito en los ejemplos A.2 y A.3 aplicando el m etodo directo de Lyapunov.
138
Soluci on: Del ejemplo A.2 podemos establecer que la funci on de Lyapunov V (e) = 1 2 onomo no lineal 2 Ce cuando ||e|| . Por consiguiente, el sistema aut descrito en dicho ejemplo es completamente (globalmente) asint oticamente estable. Del ejemplo A.3 podemos establecer que la funci on de Lyapunov: 1 1 1 V (x) = M x 2 + K0 x2 + K1 x4 2 2 4 cuando ||x|| . Por consiguiente, el sistema aut onomo no lineal descrito en dicho ejemplo es completamente (globalmente) asint oticamente estable. Ejemplo A.6 Determine la estabilidad el sistema no aut onomo descrito en el ejemplo A.4 aplicando el m etodo directo de Lyapunov. Soluci on: Del ejemplo A.4 se puede establecer que la funci on de Lyapunov: V (x, t) = M 1 (x + x)2 + 2 2 1 2 K0 + K1 M 2 + b(t) x2 2
(t) < 2K0 . Por consiguconforme ||x|| , siempre que > 0, b(t) > M , y b iente, el sistema no aut onomo descrito en tal ejemplo es completamente (globalmente) asint oticamente estable.
A.1.4.
En aplicaciones relacionadas con sistemas de control, estabilidad asint otica es m as importante que estabilidad. Claramente, peque nas desviaciones de las salidas controladas con respecto a se nales de referencia deseadas se pueden cancelar como resultado de la operaci on de un sistema asint oticamente estable. Sin embargo, la aplicaci on del 0 en lugar segundo teorema de estabilidad nos conduce a menudo a la relaci on V > 0 para estabilidad asint de la requerida condici on V otica. Para tales casos, puede ser de gran utilidad emplear el denominado teorema del conjunto invariante atribuido as conclusiones acerca de la estabilidad a La Salle [19] con la nalidad de obtener m asint otica. Conjunto Invariante. Se dice que un conjunto G es el conjunto invariante de un = f (x) si cada trayectoria de estado x(t) que comienza desde un sistema din amico x punto x0 en G permanece en G para todo tiempo. por consiguiente, una trayectoria de estado cerrada en G es un conjunto invariante. De acuerdo a tal denici on, alg un punto de equilibrio es un conjunto invariante. El dominio de atracci on del punto de equilibrio es tambi en un conjunto invariante. VIII. Teorema del Conjunto Invariante Local. Considere el sistema dado en (A.3). Sea V (x) una funci on escalar con primeras derivadas parciales continuas. Sea una regi on acotada denida por V (x) < , con > 0. Asumamos que: (x) 0 V (A.5)
139
(x) = 0, para todo x en . Sea R el conjunto de todos los puntos dentro de donde V y sea M el m as grande conjunto invariante en R. Entonces, cada soluci on x(t) en tiende a M conforme t . Que M sea el conjunto invariante m as grande en R signica que M es la uni on de todos conjuntos invariantes dentro de R. La interpretaci on geom etrica de este teorema se ilustra en la gura A.6.
V V=l
l R
M x2 x0 x1
Fig. A.6: Interpretaci on geom etrica del teorema del conjunto invariante.
y el origen est a en , entonces tal origen es asint oticamente estable, y cada soluci on en tiende hacia el origen conforme t . IX. Teorema del Conjunto Invariante Global. Considere el sistema dado en (A.3) Sea V (x) una funci on escalar con primeras derivadas parciales continuas. (x) 0. Sea R el conjunto de todos Suponga que V (x) > 0 para todo x = 0 y V los puntos donde V (x) = 0, y M el conjunto invariante m as grande en R. Entonces todas las soluciones convergen completamente (globalmente) asint oticamente en M conforme t . En vista de los teoremas del conjunto invariante, una funci on de Lyapunov V tiene que desaparecer gradualmente. Esto es, V tiene que converger a cero debido a que V es acotado inferiormente. Demostraci on de los teoremas del conjunto invariante se pueden encontrar en [19], [3]. Ejemplo A.7
es: A lo largo de una trayectoria de estado, su derivada V (x) = 2(x2 + x2 )(x2 + x2 4) V 1 2 1 2 (x) < 0 dentro de un c Observe que V rculo de radio 2. Por consiguiente, usando el teorema de estabilidad II de Lyapunov, podemos inferir que el origen es asint otica2 < 4 es acotada y el mente estable. Para = 4, la regi on denida por V (x) = x2 + x 1 2 conjunto R es el origen, el cual es un conjunto invariante. Por consiguiente, cualquier trayectoria que se inicia dentro del c rculo de radio 2 converge hacia el origen y esta regi on constituye el dominio de atracci on.
Bibliograf a
[1] H. Goldstain, Mec anica Cl asica, segunda edici on. Editorial Revert e, S.A., 1996, ISBN: 84-291-4306-8 [2] , Din amica de Lagrange. McGraw-Hill de M exico, S.A., 1972 [3] Jean-Jacques E. Slotine and Weiping Li, Applied Nonlinear Control, Prentice Hall, Englewood Clis, New Jersey 07632, 1991. [4] K. S. Fu, R. C. Gonz ales, and C. S. G. Lee, Din amica del Brazo del Robot, Rob otica, Control,Detecci on, Visi on e Inteligencia, McGrawHill/Interamericana, Madrid, 1988. [5] R. P. Paul, Dynamics, Robot Manipulators, Mathematics, Programming and Control, The MIT Press, Massachussets, 1982. [6] J. J. Craig, Manipulator Dynamics, Introduction to Robotics, Addisson Wesley, 2nd edition, 1989. [7] Mohsen Shahinpoor, A Robot Engineering Textbook, Harper & Row, Publishers, New York, Cambridge, Philadelphia, and others, 1987. [8] Murray R. Spiegel, Mathematical handbook, Shaums Outline Series, McGrawHill, Inc., New York et. al. 1991. [9] V. I. Utkin, Variable structure systems with sliding modes, IEEE Trans. Automat. Contr., vol. 22, pp. 2-22, Feb. 1993. [10] J. Y. Hung, W. Gao, and A. Homaifa, Variable structure control: a survey, IEEE Trans. Ind. Electron., vol. 42, pp. 212-222, Feb. 1986. [11] M. Vidyasagar, Nonlinear Systems Analysis (Second Edition), Prentice Hall, Englewood Clis, New Jersey 07632, 1993. [12] W. F. Hughes and J. A. Brighton, Theory and Problems of Fluid Dynamics, Shaums outline series, McGraw-Hill, 2nd edition, Inc., 1991. [13] Lin, Y. and E.D. Sontag, Lin, Y. and E.D. Sontag, A universal formula for stabilization with bounded controls Report 90-10, SYCON-Rutgers Center for Systems and Control, July 1990. [14] Alberto Isidori, Nonlinear Control Systems (Second Edition), Springer-Verlag Berlin Heidelberg New York London Paris Tokyo Hong Kong, 1989.
142
BIBLIOGRAF IA
[15] M. G. Sofonov, Stability and Robustness of Multivariable Feedback Systems, The MIT Press Cambridge, MA, and London, England, 1980. [16] Katsuhiko Ogata, Designing Linear Control Systems with MATLAB, Prentice Hall, Englewood Clis, New Jersey 07632, 1944. [17] Bernard Friedland, Control System Design. An Introduction to State-Space Methods, McGraw-Hill, Inc., New York St. Louis y otras, 1986. [18] A. M. Lyapunov, Probl eme g eneral de la stabilit e du mouvement. Reprinted in Annals of Mathematics Study No. 17 (Princeton Univ. Press, Princeton, New Jersey) of the 1907 French translation of the fundamental Russian paper by Lyapunov, published in 1892. 1980. [19] Joseph La Salle and Solomon Lefschetz, Stability by Liapunovs Direct Method With Applications, Academic Press new York, London, 1961. [20] I. Gustavsson, Comparison of dierent methods for identication of linear models for industrial processes, in Preprints IFAC Symp. on Identif., 1970, paper 11.4. [21] G. N. Saridis, Comparison of ve popular identication algorithms, Automatica, vol. 10, no. 1, pp. 6979, Jan. 1974. [22] B. D. O. Anderson, Exponential stability of linear systems arising from adaptive identication, IEEE Trans. on Auto. Contr., 22-2 (1977). [23] A. P. Morgan and K. S. Narendra, On the uniform asymptotic stability of certain linear nonautonomous dierential equations, S.I.A.M. of Control and Optimization, 15 (1977). [24] Olle I. Elgerd, Control Systems Theory, McGraw-Hill Kogakusha, Ltd., Tokyo, Auckland, Dusseldorf, and others, 1967. [25] A. Barrientos, L. F. Pe nin, C. Balaguer, and R. Aracil, Fundamentos de Rob otica, McGraw-Hill/Interamericana de Espa na, S. A., Madrid, Buenos aires, Caracas, and others, 1997. [26] A. F. Filippov, Dierential Eequations with discontinuous right-hand sides, Mathematicheskii Sbornik, 51.1 (1960), in Russian. Trnaslated in English, Aw. Math. Soc. Trans., 62, 199 (1964). Addisson Wesley, 2nd edition, 1989. [27] D. E. Koditschek, Natural Motion for Robot ArmsProc. 23rd I.E.E.E. Conf. on Decision and Control, Las Vegas, p. 733, 1984. [28] E. Bailey and A. Arapostathis, Simple sliding mode control scheme applied to robot manipulators, Int. J. Control, 1987, vol. 45, No. 4, p. 11971209. [29] Lab-PC+ User Manual, National Instruments Corporation, Part Number 320502B-01, August 1994. [30] Eduardo F. Camacho y Carlos Bordons, Model Predictive Control, SpringerVerlag London Limited 1999.
BIBLIOGRAF IA
143
[31] D.M. Prett and M. Morari, Shell Process Control Workshop,Butterworths, 1987. [32] T. Alvarez, M. Sanzo, and C. Prada, Identication and Constrained Multivariable Predictive Control of Chemical Reactors,4th IEEE Conference on Control Applications, Albany, pages 21:577-582, 1977. [33] Manfred Morari y Evanghelos Zariou, Robust Process Control. PTR Prentice Hall, Englewood Clis, New Jersey 07632, 1989. [34] William H. Press, Brian P. Flannery y Saul A. Teukolosky, Numerical Recipes in C, Cambridge University Press, Cambridge, 1988. [35] MathWorks, Inc., MATLAB Reference Guide, Prentice Hall, Englewood Clis, New Jersey, primera edici on, 1998. [36] MathWorks, Inc., SIMULINK Users Guide, Prentice Hall, Englewood Clis, New Jersey, primera edici on, 1996. [37] Fang-Shiung Chen and Jung-Shan Lin, Nonlinear backstepping design of robot manipulators with velocity estimation feedback,5th Asian Control Conference, July 2004, vol. 1, no. 6, pp 351356. New Jersey 07632, 1989. [38] R. De Keyser, A Gentle Introduction to Model Based Predictive Control. In PADI2 International Conference on Control Engineering and Signal Processing, Piura, Per u, 1998. [39] A. Rojas-Moreno, Design of Self-tuning Controllers for Processes Having Multiple Unknown Time-varying Delays, Ph.D. Thesis, Utah State University, Logan, UT, 1995.