Control
Control
IO
C
C
RU
ST
N
O
C
Control y Guiado
EN
C
C
1. Introducción 1
1.1. Sistemas Realimentados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
RU
1.2. Sistemas de Control Automático . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2.1. Control a Lazo Abierto y Lazo Cerrado . . . . . . . . . . . . . . . . . . . . . . . 5
1.2.2. Entradas y Salidas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.3. Estrategias Comunes de Control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.3.1. Control ON/OFF . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.3.2. Control Proporcional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
ST
1.6. Cómputos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
N
3. Análisis Clásico de Sistemas SISO 45
3.1. Lugar de Raı́ces . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.1.1. Análisis de la Ecuación Caracterı́stica de Lazo Cerrado . . . . . . . . . . . . . 48
IO
3.1.2. Interpretación de las Condiciones de Módulo y Ángulo . . . . . . . . . . . . . . 49
3.1.3. Reglas para el Trazado del Diagrama . . . . . . . . . . . . . . . . . . . . . . . 51
3.1.4. Análisis de Estabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
3.1.5. Lugar de Raı́ces Complementario . . . . . . . . . . . . . . . . . . . . . . . . . 54
3.1.6. Lectura Adicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
C
3.2. Criterio de Nyquist . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
3.2.1. Teorema del Encierro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
3.2.2. Estabilidad del Lazo Cerrado . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
C
3.2.3. Funciones de Lazo Abierto con Polos en el Eje Imaginario . . . . . . . . . . . . 60
3.2.4. Márgenes de Estabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
3.2.5. Lectura Adicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
RU
3.3. Respuesta en Frecuencia de Lazo Cerrado . . . . . . . . . . . . . . . . . . . . . . . . 63
3.3.1. Realimentación Unitaria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
3.3.2. Ganancia de Lazo Cerrado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
3.3.3. Lectura Adicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
3.3.4. Revisita de la Función de Sensibilidad . . . . . . . . . . . . . . . . . . . . . . . 68
3.4. Compensación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
ST
4.3. Robustez . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
4.3.1. Incertidumbre en el Modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
4.3.2. Modelos de Incertidumbre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
4.3.3. Estabilidad Robusta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
4.3.4. Desempeño Robusto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
EN
N
4.7.1. Control en Tiempo Discreto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
4.7.2. Diseño en Tiempo Discreto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
4.7.3. Aproximación de Tiempo Discreto para un Compensador Continuo . . . . . . . 125
IO
4.7.4. Elección del Tiempo de Muestreo . . . . . . . . . . . . . . . . . . . . . . . . . 127
4.7.5. Implementación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
4.7.6. Efecto de la “Cuantización” . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
C
5.1. Realimentación de Estado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
5.1.1. Ubicación de Polos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140
5.1.2. Control Optimo Cuadrático . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
C
5.2. Observador de Estados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147
5.2.1. Observador de Luenberger . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147
5.2.2. Realimentación de Estados Observados . . . . . . . . . . . . . . . . . . . . . . 151
RU
5.2.3. Filtro de Kalman . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153
5.2.4. Control Optimo Gausiano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156
5.2.5. Análisis del Lazo MIMO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
A. Apéndices 163
A.1. Modelos Dinámicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163
ST
N
IO
C
C
RU
ST
N
O
C
EN
1
ST
RU
C
C
IO
N
N
1
IO
C
Introducción
C
RU
ST
N
O
C
EN
C
Sistemas Realimentados
Los seres vivos interactúan permanentemente sobre su entorno, perturbando procesos
C
dinámicos de forma apropiada para llevarlos a condiciones de equilibrio deseables.
Esto es particularmente frecuente y deliberado en el caso de los humanos; en
situaciones que van desde la manipulación de objetos hasta la conducción de sistemas
RU
complejos, ya sean estos de carácter tecnológico, social, económico, biológico, etc.
palma de la mano.
La intervención se produce por medio del ajuste de ciertas perturbaciones que pueden
C
ser manipuladas de forma directa cuando sea necesario. Denominamos a estas acciones
de control, para diferenciarlas respecto de aquellas perturbaciones que están fuera de
nuestro alcance.
EN
Para desarrollar estas actividades es necesario poder observar la evolución del proceso,
N
y para ello se requiere de ciertas capacidades sensoriales.
El ente que intenta controlar el proceso (el controlador ) lo observa permanentemente y
reacciona ajustando las acciones de control en función de los apartamientos observados
IO
respecto de la condición buscada.
C
esquematizado en la figura 1.2, al que identificamos como sistema a lazo cerrado.
C
RU
ST
En tareas que implican interactuar con el medio fı́sico los humanos aprendemos formas
adecuadas de reacción mediante el entrenamiento.
Conducir un vehı́culo, por ejemplo, es una tarea resuelta por el sistema lı́mbico de
nuestro cerebro, en contraste con los procesos de carácter intelectual que resolvemos en
EN
N
matemático para reaccionar adecuadamente al interactuar con un determinado proceso
dinámico, lo cual sustituye el entrenamiento; aunque existen algoritmos para “aprender”
las reacciones correctas de forma experimental (controles adaptables).
IO
C
C
RU
Figura 1.3: Lazo de control a lazo cerrado
ST
N
En control automático llamamos entradas a las acciones de control y perturbaciones que
actúan sobre la planta (el proceso dinámico a controlar), y salidas a las observaciones.
IO
Cuando nos referimos a un control SISO, el acrónimo SI (Single Input) hace referencia
al caso en el cual hay una única entrada que podemos manipular (acción de control).
Serı́a el caso si por ejemplo en un control térmico solo podemos actuar sobre una único
calefactor.
C
De forma análoga, el acrónimo SO (Single Output) se refriere a disponer datos de una
única variable escalar para monitorear el proceso. En el ejemplo del control térmico este
serı́a el caso si contamos con capacidad para medir temperatura en un único punto.
C
Naturalmente MI y MO hace referencia a los casos en los cuales se cuenta con entradas
y salidas múltiples. Un ejemplo claro de sistema MIMO es el del control de vuelo de un
RU
helicóptero, en donde las acciones de control son el paso cı́clico, colectivo y rotor de
cola; mientras que las entradas serán diferentes ángulos y velocidades.
constituye un control ON/OFF; o con un calefón, el cual funciona como control a lazo
abierto (no cuenta con sensor de temperatura).
C
El control ON/OFF no permite en general ajustar la condición de equilibrio con alta
C
precisión, excepto que la conmutación pueda realizarse a alta frecuencia, como es el
caso de las fuentes eléctricas de tipo switching.
Cuando esto no es posible resulta necesario establecer una banda de tolerancia
RU
alrededor del valor nominal deseado dentro de la cual no se realiza ninguna acción.
La conmutación ocurre unicamente al traspasar los lı́mites de esta banda.
forma continua. Las representamos matemáticamente con números reales, más allá de
cual sea su naturaleza fı́sica (la temperatura, la concentración de glucosa en sangre, la
cotización de una divisa extranjera, etc.).
una presión constante a la salida aunque la presión de entrada fluctúe (siempre que se
mantenga por encima del valor deseado para la salida).
En la figura 1.4b se muestra un esquema del dispositivo. Un diafragma actúa como
O
sensor. Una aguja obtura proporcionalmente el paso de gas, operando como actuador.
El controlador serı́an los resortes, que establecen una apertura proporcional del paso de
gas en función de la presión diferencia entre la presión a la salida y el valor deseado
establecido por la compresión del resorte superior.
C
C
se acerca al valor deseado, incluyendo una acción proporcional a ese cambio. Esto se
denomina control derivativo, y tiene la propiedad de anticiparse a los cambios.
Por otra, en muchos casos un sistema de control logra equilibrar la planta pero con un
C
cierto error en relación al valor deseado. Esto se compensa automáticamente con una
acción integral.
RU
La combinación de las tres acciones: proporcional + integral + derivativa se conoce como
control PID, y es la estrategia más común en los sistemas de control a lazo cerrado.
La intensidad de estas acciones se puede ajustar de forma empı́rica o semi-empı́rica.
Existe en general una confusión entre lo que entendemos aquı́ como control automático
y los automatismos.
Es muy común utilizar enclavamientos lógicos para coordinar acciones de todo tipo.
O
En muchos casos de observan zonas grises para realizar esta discriminación. Por
ejemplo, un control ON/OFF podrı́a interpretarse como un enclavamiento lógico.
Al mismo tiempo en común que los sistemas de control automático incluyan enclava-
mientos lógicos para dar señales de alarma en situaciones anormales, e incluso llevar el
proceso controlado a una condición segura cuando las condiciones se tornan peligrosas.
EN
N
Actualmente la industria manufacturera hace un uso extensivo tanto de la automatización
(omnipresente) y el control automático, esto último en los procesos de producción
IO
continua como la petroquı́mica y la metal-mecánica.
C
Se trata de computadoras sin interfaz humana diseñados para digitalizar datos de
sensores discretos (ON/OFF con contactos secos, sensores inductivos y capacitivos,
etc.) y analógicos (normalmente señales de 0-10V o 4-20mA generadas por diversos
tipos de sensores); y generar señales de salida de ambos tipos; aunque también
C
pueden utilizarse redes de datos informáticas estándar (RS232, Ethernet, WiFi) o de
tipo industrial (FieldBus, Profibus, etc.).
RU
La programación de estos dispositivos se realiza con interfaces gráficas desde una
computadora conectada en red con el PLC, y para su uso pueden conectarse interfaces
de operador en el piso de planta o con computadoras en una sala de control (sistemas
SCADA: Supervisory Control and Data Aquisition) para visualización, registro de datos,
realizar ajustes y enviar comandos al equipo (figura 1.7).
En control industrial la estrategia habitual es la PID, y existen dispositivos de hardware
ST
especı́ficos para ello; aunque también pueden programarse estas funciones en un PLC o
en computadoras conectadas en red con estos dispositivos (para procesos de alto nivel).
Solo en casos muy especı́ficos o para el control de procesos multi-variable se utilizan
otras estrategias.
Los sistemas de control realimentados son imprescindibles para la operación de
N
ves y vehı́culos espaciales. Sus funciones van desde controlar una única variable (por
ejemplo la velocidad en el control de crucero de un automóvil) hasta la de realizar una
misión completa de forma autónoma para descender en otro planeta.
Un piloto automático es un sistema de control diseñado para realizar tareas que realiza
un piloto humano de forma desatendida.
EN
C
interfaz de operador (a la derecha) y varios modelos de PLCs al centro y debajo
C
RU
ST
Figura 1.8: Primer autopiloto Sperry (derecha) y su demostración en Francia (izquierda), en el año 1914
N
abandonó su puesto y caminó por una de las alas
mientras Sperry nuevamente mantenı́a los brazos en
alto.
IO
Durante la tercer pasada ambos abandonaron el cockpit mientras el avión mantenı́a su
vuelo en lı́nea recta.
Naturalmente, ganaron la competencia.
C
En 1945, motivados por los riesgos que se experimentaban
en época invernal debido a las condiciones climáticas
desfavorables de las islas británicas combinadas con los
C
altos niveles de contaminación con carbón existentes en
aquellos años, se creó la unidad de desarrollo BLEU (Blind
Landing Experimental Unit) para trabajar sobre soluciones
RU
para el aterrizaje con baja visibilidad. Esto condujo en poco
tiempo al desarrollo de un sistema de aterrizaje automático,
precursor de lo que hoy conocemos como autoland.
Estos desarrollos evolucionaron aplicándose en aeronaves
militares como el English Electric Canberra y el Avro Vulcan;
ST
Estos van desde casos simples como el amortiguador de guiñada presentes en los
reactores multimotor, hasta sistemas de control de vuelo completo para aeronaves
intrı́nsecamente inestables. En particular, los aviones de combate de 4ta generación
y posteriores dependen fuertemente del SAS para poder volar.
EN
También se utilizan sistemas de control auxiliares, por ejemplo para regular la presión de
cabina. Los motores a reacción modernos cuentan con el FADEC (Full Authority Digital
Engine Controller ), que monitorea y regula completamente la operación del motor.
Los motores alternativos por su parte incluyen una unidad electrónica denominada
ECU (Engine Control Unit), que incluye lazos de control para optimizar la combustión
ajustando la inyección de combustible y la entrada de gases al turbocompresor.
C
C
RU
(b) Interfaz de comando para las funciones de un piloto automático
aterrizaje.
El primer sistema reutilizable con esta capacidad fue el transbordador soviético Buran
(figura 1.10b), que hizo su primer y único vuelo el 15 de noviembre de 1988, antes del
EN
colapso de la URSS.
C
C
RU
(c) Actitud de un satélite en órbita terrestre (d) Satélites de la CONAE
orientación de los instrumentos en el “modo ciencia” (estado del satélite cuando opera
ST
C
C
RU
ST
(a) Vehı́culo submarino autónomo (b) Mars Exploration Rovers (MER), que operaron en
Marte entre 2004 y 2019
especı́fico; ya sea que se trate de terrenos abiertos, zonas rocosas, conductos, etc.
Puede tratarse de vehı́culos comunes, articulados, caminadores, etc.
N
En esta lı́nea mencionemos que en el campo automotriz los pilotos automáticos para
automóviles tienden hacia la robotización, permitiendo en la actualidad la conducción
completamente autónoma bajo ciertas condiciones (BWM, Tesla, etc.).
EN
C
Honda
En estos casos control automático cubre la mismas funciones que las del auto-piloto
C
en las aeronaves tripuladas; aunque se trabaja activamente en paralelo al desarrollo de
nuevas configuraciones y mecánicas de vuelo.
En cuanto a vehı́culos submarinos, en la actualidad existen muchos modelos comercia-
RU
les operados de forma remota para realizar operaciones submarinas y modelos autóno-
mos de investigación.
ción tecnológica. Aunque se han sumado otras empresas, por el momento solo se co-
mercializan robots humanoides con fines lúdicos y publicitarios; pero lamentablemente
también hay desarrollos militares en este sector.
Control PID
N
En la sección 1.3.3 hemos realizado una introducción para esta estrategia, que es la más
extendida. Su masiva utilización es especialmente destacable en el campo del control
C
industrial. Allı́ se identifica la referencia como “set point” (SP) y la salida como “point
value” (PV). La diferencia entre referencia y salida es el error (de seguimiento):
N
Z t
de
u(t) = kp e(t) + kd (t) + ki e(t)dt (1.1)
dt 0
IO
Que también puede expresarse como
1 t
Z
de
u(t) = kc e(t) + Td (t) + e(t)dt (1.2)
dt Ti 0
C
donde Td y Ti tienen unidades de tiempo.
C
Para intentar comprender el efecto de cada uno de estos términos vamos a considerar
como ejemplo el caso de un actuador lineal.
Este puede consistir en motor eléctrico y una transmisión (tornillo y corona) o un pistón
RU
hidráulico accionado mediante una servo-válvula.
En ambos casos el servomotor permite aplicar una fuerza o torque para posicionar
(lineal o angularmente) una carga inercial, y en general para neutralizar perturbaciones
constituidas por otras fuerzas o momentos aplicados independientemente.
ST
Entre los muchos ejemplos de esta clase de sistemas tenemos el utilizado en los
lanzadores satelitales para orientar el vector de empuje de un motor cohete (ver figura
1.14a), subsistema conocido como TVC (Thrust Vector Control).
J δ̈ = Ma (t) + P (δ, t)
O
donde δ es el ángulo de desvı́o del eje de la tobera (y por lo tanto del empuje) respecto
del eje del fuselaje y Ma es el momento aplicado por el actuador. Dado que el punto de
giro (gimbal del motor) en realidad está acelerado por ser solidario al cohete, incluimos
C
una perturbación P (t) que dependerı́a de la aceleración y velocidad angular del cohete.
Mas adelante veremos un modelo más completo incluyendo la dinámica del actuador.
Por el momento el modelo conceptual equivale al siguiente esquema:
EN
C
motor cohete. El motor se encuentra montado en una unión cardánica
(a) Actuador lineal (color azul) para el control del vector de empuje de un (gimbal) y el actuador permite desviar el eje de la tobera en relación al
motor cohete. El actuador puede ser hidráulico o electro-mecánico. eje del fuselaje.
C
donde u se corresponde con Ma (la acción de control), x serı́a el desvı́o δ (variable de
RU
salida) y F se corresponde a P (la perturbación).
Acción Proporcional
La acción proporcional tiene un efecto equivalente al resorte de un sistema masa-
ST
resorte-amortiguador:
N
Si se sustituye el resorte por un actuador capaz de aplicar una fuerza u(t) sobre la masa,
y se instala un sensor capaz de medir el desplazamiento x(t); mediante algún dispositivo
C
Una ventaja respecto del resorte es la posibilidad de ajustar la “rigidez” variando kp , pero
además con el control proporcional serı́a posible hacer:
N
Esto permite ajustar la posición de reposo (equilibrio) a cualquier valor x deseado; lo cual
serı́a equivalente a mover el anclaje del resorte en el caso del modelo masa-resorte.
Pero sabemos que sin amortiguador la dinámica de lazo cerrado serı́a oscilatoria
IO
no amortiguada, y por lo tanto no serı́a posible alcanzar el equilibrio luego de una
perturbación. Veamos como resolver este problema.
Acción Derivativa
C
La acción derivativa corresponde a:
C
El segundo término del lado derecho, −kd · ẋ, es equivalente al efecto que produce el
amortiguador. El primer término, kd · ṙ, implica una anticipación a los cambios o valores
futuros de la referencia (ṙ define la “tendencia” de la referencia).
RU
Para el caso de la masa libre, con el actuador podrı́amos combinar la acción proporcional
con la derivativa para sustituir el conjunto resorte-amortiguador, agregando la capacidad
de variar la respuesta del sistema tanto en velocidad (frecuencia natural) como en
relación a su factor de amortiguamiento. El control proporcional-derivativo (PD) serı́a:
ST
1
N
ess = F
kp
ė = 0.
Podemos achicar ese error en estado estacionario ess aumentando la constante
proporcional kp , pero nunca será posible anularlo totalmente, dado que sin error no hay
C
Pero serı́a necesario ajustar este valor de forma manual (ū = F ), y deberı́a ser
reajustado cada vez que cambie la perturbación.
Esta acción solo alcanza el equilibrio cuando e(t) = 0. Por lo tanto, si ajustando
N
adecuadamente los parámetros de la ley de control logramos que el sistema a lazo
cerrado resulte estable, aun bajo la acción de una perturbación constante el sistema
a lazo cerrado siempre convergerá a la condición de equilibrio con error nulo.
IO
El término integral es el único que permite aplicar una acción de control no-nula aunque
el error sea nulo, y por lo tanto permitirı́a neutralizar perturbaciones sin error de estado
estacionario. Pero debe advertirse que es perjudicial para la respuesta transitoria,
C
ya que tiende a desestabilizar el sistema y por lo tanto en muchos casos debe ser
compensada mediante las acciones PD. De todas formas, en procesos con dinámicas
sobre-amortiguadas (como lo es el caso de los procesos térmicos) muchas veces es
C
suficiente con una combinación proporcional-integral (PI).
entre los objetivos antes planteados y las limitaciones que impone el proceso a controlar.
La acción de control u(t) siempre tiene lı́mites para sus valores máximos y mı́nimos,
y frecuentemente también hay lı́mites para su velocidad de cambio (rate limit o slew
rate en inglés). En general lo razonable es que estos lı́mites se alcancen solo de forma
excepcional, dado que en esta condición (saturación) el control deja de ser efectivo
EN
y el sistema a lazo cerrado se comporta como si estuviese a lazo abierto con una
perturbación constante u(t) = umax o u(t) = umin .
ẽ(t) = r − ỹ(t)
donde ỹ(t) es la señal entregada por el sensor, que se supone se corresponde con un
valor real y . En general podemos descomponer la medición en:
ỹ = y + η
N
donde η es lo que denominamos ruido de medición, que en general es una señal
aleatoria mediante aunque en casos puntuales puede ser determinı́stica, pero siempre
IO
con valor medio nulo.
Considerando por ejemplo una ley PD, para la acción de control real se tendrı́a:
˙ = [kp e(t) + kd ė(t)] + kp η(t) + kd η̇(t)
u(t) = kp ẽ(t) + kd ẽ(t)
C
Vemos entonces que el ruido de medición se propaga a la acción de control de forma
directa con ganancia kp , y por medio de su derivada a través de kd .
Si el ruido de medición es periódico, para cualquiera de sus componentes armónicas
C
η(t) = A sin ωη t la derivada serı́a η̇(t) = ωη A sin ωη t. Resulta evidente que la acción
derivativa realzará la propagación del ruido de medición con un factor kd ωη , lo cual será
más intenso cuando mayor sea la frecuencia de la señal de ruido (más allá de que esta
RU
sea periódica o aleatoria).
Sintonización
Banda Proporcional En general existe cierta tolerancia ±etol para el error. Por otra
N
parte, como dijimos la acción de control u(t) tiene lı́mites máximos umax y mı́nimos
umin .
Un ajuste razonable para la ganancia proporcional es el de aplicar la máxima acción de
O
control cuando se alcanza el lı́mite del error. Si la tolerancia para el error es razonable
para la capacidad de actuación disponible, un ajuste lógico para la ganancia proporcional
serı́a:
1 umax − umin
C
kp =
2 etol
Esto define una “banda proporcional” para el uso del rango de control.
La respuesta será más rápida y los errores serán menores si aumentamos kp , pero esto
EN
implicará que los ruidos de medición se propaguen a la acción de control (verı́amos una
acción de control “ruidosa” aun en ausencia de perturbaciones), lo cual en algún punto
podrı́a resultar indeseable.
A su vez la respuesta en situaciones normales podrı́a resultar demasiado “intensa”,
exigiendo en exceso al actuador, y finalmente podrı́amos observar problemas de
estabilidad que con ganancias más bajas no se producen.
N
Tiempo Integral La acción integral se puede escribir como:
IO
Z t
ui (t) = ki e(t)dt
0
C
Z t
1
ui (t) = kc e(t)dt
Ti 0
C
donde llamamos tiempo integral al parámetro Ti . Si el error se mantuviese constante, Ti
serı́a el tiempo que tardarı́a la integral en alcanzar el valor del error.
En un control proporcional-integral (PI):
RU
1 t
Z
upi (t) = up (t) + ui (t) = kp e(t) + e(t)dt
Ti 0
upi (0) = kp ē
1
upi (Ti ) = kp ē + ē Ti = 2kp ē
Ti
N
Si el error crece linealmente e(t) = d · t, la presencia de una acción derivativa con tiempo
derivativo Td = 1/d duplicará la acción de control del término proporcional cuando
t = Td :
IO
upd (Td ) = kp (d Td + Td d) = 2kp e(Td )
Por lo tanto el tiempo derivativo deberı́a estar en el orden del tiempo de respuesta. Un
valor mayor implicará un efecto amortiguante mayor y viceversa.
C
La desventaja es que este término amplificará los errores de medición de alta frecuencia.
Esto puede mitigarse introduciendo un “filtro pasa-bajos” en la derivada.
C
Consideremos el caso del TVC. El rango de desplazamiento es de ±60 . Supongamos
que se requiere una precisión de 0,020 en el alineamiento del eje de empuje, y que la
señal de control se encuentra normalizada de forma tal que los lı́mites se correspondan
RU
con ±1. La ganancia para esta banda proporcional en este caso serı́a:
1
kp = = 50
0,02
Pero si el actuador está sobredimensionado, usar este valor de banda proporcional para
ST
Por ser este un sistema mecánico en principio con fenómenos disipativos de baja
intensidad (habrı́a que ver en detalle el actuador para afirmarlo), el lógico asumir que
será necesario incluir acción derivativa para amortiguar la respuesta.
Si el vehı́culo realiza una trayectoria curva (diferente a la de un “giro gravitatorio”), el
N
En el control PID tenemos por un lado un ajuste de la ganancia del lazo abierto dada por
la acción proporcional. Podrı́amos utilizar valores elevados de kp para aproximarnos al
control perfecto, pero sabemos que un valor excesivo puede acarrear problemas.
Los términos integral y derivativo tienen ganancias diferentes según se trate de
EN
Respecto del término integral podemos notar que si por ejemplo tenemos una
señal de error senoidal e(t) = A sin ωt, el integrador genera como salida ui (t) =
ki ω −1 A cos ω (t − π). La ganancia serı́a ki ω −1 .
Para la acción derivativa ud (t) = kd ωA cos ωt, y por lo tanto podemos realizar el
razonamiento inverso.. Pero lograr el control perfecto para señales rápidas también
N
genera problemas y en general no es necesario.
IO
La realización fı́sica de un controlador depende de la naturaleza de la aplicación.
En la actualidad predominan las implementaciones digitales, utilizando algún tipo de
microcontrolador (microprocesador diseñado para su uso en sistemas embebidos). Sin
embargo el controlador PID nació a principios del siglo XX, mucho antes del desarrollo
C
de la electrónica analógica y más aún de la era digital.
C
RU
ST
Analógica
Podemos reconocer el uso de la acción proporcional ya en el regulador de Watt para
O
sus máquinas a vapor. Hacia 1907 apareció el primer controlador neumático. Empresas
muy conocidas en la actualidad como Sperry, Taylor o Foxboro tuvieron sus orı́genes en
aquellas épocas.
C
C
Realización Digital
Un controlador digital es una implementación de la ley de control utilizando un micro-
RU
procesador con la electrónica necesaria (conversores A/D) para convertir las señales de
los sensores en números digitales y a partir de las acciones de control calculadas desde
su representación digital generar las señales analógicas correspondientes (conversores
D/A).
En muchos casos los sensores dan información digital de forma directa, y los actuadores
ST
pueden ser comandados mediante señales digitales sin requerir el uso de conversores
D/A, aunque en última instancia en problemas de ingenierı́a casi siempre habrá una
conversión D/A para que las acciones de control incidan en el mundo fı́sico.
n
e(k) − e(k − 1) X
u(k) = kp e(k) + kd + ki e(h) (1.3)
ts
h=0
C
Mediante un reloj interno el procesador computa la (1.3) una vez cada ts segundos
para actualizar el valor de la acción de control (salida) con la última medición disponible
(entrada) y su correspondiente referencia. En general la acción de control se mantiene
constante hasta el próximo instante de muestreo mediante un dispositivo de retención
de orden cero.
N
durante el tiempo de crecimiento en la respuesta transitoria, que por ahora definiremos
como aquel necesario para pasar del 10 % al 90 % del valor final de equilibrio al aplicar
una perturbación constante o un cambio de referencia de forma abrupta.
IO
Cómputos
C
Los cómputos asociados a los ejemplos que se presentarán pueden realizarse mediante
Matlab™ o GNU Octave. En ambos casos se requiere tener instalado el paquete con
funciones especı́ficas para control.
C
En el caso de Matlab™nos referimos al paquete denominado control toolbox.
En el caso de GNU Octave 2 es necesario descargar el paquete control y luego instalarlo
RU
desde la ventana de comando con la sentencia pkg, aunque la opción -forge permite
descargar e instalar un paquete con un solo comando:
pkg install -forge control
El paquete control debe ser cargado en cada sesión en la cual sea requerido:
ST
Es posible realizar ajustes para que esto ocurra de forma automática al inicio.
IO
C
Objetivos del Control
C
RU
ST
N
O
C
EN
Requerimientos
No es posible hacer un desarrollo de ingenierı́a sin contar previamente con una
especificación de requerimientos que permita orientar dicho desarrollo.
En esta sección daremos un panorama introductorio en relación a los requerimientos
27
para un sistema de control automático.
N
controlador.
IO
En general el objetivo básico de un sistema de control es el de lograr que ciertas variables
de un determinado proceso se ajusten a valores deseados.
C
Por ejemplo, en una máquina de CNC la posición y la velocidad de la herramienta de
corte tienen que seguir una evolución predeterminada para mecanizar la pieza requerida.
En el caso de un manipulador para operación remota, el “efector” del brazo robótico tiene
C
que “copiar” los movimientos de la mano del operador.
RU
En todos los casos existirán tolerancias en cuanto a la diferencia entre los valores
deseados o referencias y los valores realmente alcanzados (que consideramos salidas),
a lo que llamamos errores de seguimiento.
Por ejemplo, en el aterrizaje de una aeronave por instrumentos el objetivo del piloto
(automático o humano) es el de mantener los indicadores de error de trayectoria en cero,
N
es decir, centrar las barras de senda de planeo (glide slope) y eje de pista (localizer ) en
el indicador del ILS (ver figura 2.1) .
En condiciones climáticas adversas el seguimiento exacto será imposible, pero se espera
O
que el piloto logre mantener acotado los errores a la mitad del intervalo de la escala del
indicador.
C
Por otra parte existen sistemas diseñados especı́ficamente para lograr ciertas mejoras
en la dinámica del proceso controlado respecto de la del proceso sin controlar. Es el
caso de los sistemas de estabilidad artificial: amortiguadores de guiñada en aeronaves
O
En sı́ntesis podemos decir que para cualquier aplicación en el diseño de las estrategias
C
2.1.4. Robustez
Los procesos dinámicos reales en general varı́an con el transcurso del tiempo
(envejecimiento, desgaste, etc.), o bien cambian al operar en diferentes condiciones.
C
Figura 2.2: Variaciones en la dinámica longitudinal de una avión bireactor de 8 plazas durante la aproximación final
RU
Por ejemplo, la dinámica de una aeronave depende fuertemente de la presión dinámica
y el número de Mach; por lo cual su comportamiento es diferente en una condición de
aproximación final respecto del vuelo en crucero.
En la figura 2.2 vemos los cambios en la dinámica de una aeronave para diferentes
ST
Un sistema de control automático debe ser capaz de cumplir con los requerimientos del
N
diseño aun bajo cambios (acotados) en la dinámica del proceso sobre el cual opera.
Llamamos a esto desempeño robusto.
O
En la figura 2.3 se muestra una estrategia que en teorı́a podrı́a alcanzar este objetivo. El
bloque f [·] es un operador matemático que representa la respuesta dinámica de la salida
y(t) ante una acción de control u(t), mientras que h[·] corresponde a la ley de control
IO
que regula u(t) en función de r(t) − d(t). Implı́citamente estamos asumiendo que esta
última se mide de alguna manera, aunque en general eso no es posible.
C
control perfecto si hacemos que la ley de control sea la inversa de la dinámica de la
planta: h[·] = f −1 [·].
Veremos más adelante que esto tampoco es posible por diversas razones, y por lo tanto
C
el control perfecto es “irrealizable”. Sin embargo se puede lograr una aproximación a este
ideal dentro de ciertos lı́mites.
RU
El primer obstáculo para realizar un control por inversión es que toda dinámica implica
una relación integral.
Por ejemplo, desde el punto fı́sico la posición de un rı́gido es la integral de la velocidad
(matemáticamente se puede establecer también la relación inversa), y esta a su vez es
la integral de la aceleración producida por los actuadores y las perturbaciones.
La inversa de la integral es la derivada, y para señales que varı́an rápidamente su
ST
derivada al menos para señales que no cambien demasiado rápido, y por lo tanto lo
mismo puede decirse de la inversa de una dinámica genérica f [·].
fˆ[·] ≈ f [·] en un lazo de realimentación con un término de alta ganancia h[·], según el
esquema mostrado en la figura 2.4. En ese diagrama se observa que:
C
u = h[(r − d) − z]
y como z = fˆ[u]:
u = h[(r − d) − fˆ[u]]
EN
C
Si |h[·]| ≫ 1 para su inversa se tiene |h[·]−1 | ≈ 0 y podemos decir que con esto:
u ≈ f −1 [r − d]
C
De esta forma vemos que u responde en base a una inversa aproximada de la dinámica
de la planta sin tener que invertir el modelo de forma explı́cita.
Pero se debe destacar que aun quedan otros problemas por resolver:
RU
nunca es posible modelar la dinámica de la planta de forma exacta (fˆ[·] ̸= f [·]) y
además |h[·]| < ∞.
normalmente no es posible medir las perturbaciones para incluirlas en la acción
de control.
aunque lo anterior fuera posible, habrı́a que conocer además la condición inicial
ST
De esta forma se logra una inversión “implı́cita” sin necesidad de conocer la dinámica del
proceso ni tener que medir la perturbación; con la sola condición de que |h[·]| ≫ 1, sin
Pero debemos advertir que utilizar alta ganancia para la realimentación acarrea una serie
de problemas asociados a la estabilidad del sistema a lazo cerrado, y otros relacionados
con la instrumentación (sensores y actuadores).
Veremos en los próximos capı́tulos que en el diseño de un sistema de control es
N
necesario alcanzar una relación de compromiso entre la búsqueda del control perfecto
y los problemas que implica el uso de alta ganancia por las limitaciones que impone el
proceso a controlar y la instrumentación requerida.
IO
2.2.3. Realimentación y Dinámica de Lazo Cerrado
Podrı́a decirse que la temática central del control automático es en definitiva el diseño
de realimentaciones artificiales sobre algún proceso dinámico (planta) para generar uno
C
con caracterı́sticas dinámicas deseables. Es a este nuevo sistema, que antes llamamos
“proceso controlado”, al cual nos referimos al hablar de sistema a lazo cerrado.
C
Es importante comprender que el sistema de control no cambia la dinámica de la planta.
Es la interacción entre la dinámica del controlador y la de la planta lo que resulta en una
cierta dinámica de lazo cerrado, diferente tanto de la planta como del controlador.
RU
Tomemos el modelo de estados (A.4) (ver apéndice A.1) para la dinámica de la planta
junto con sus salidas (variables medidas):
Z t
x(t) = [f (x, t) + g u (x, t)u(t) + g d (x, t)d(t)] dt (2.2)
0
O
y = h(x)
El “efecto” es la evolución del estado (lado izquierdo) mientras que las “causas” de esta
C
evolución son todos los términos que definen ẋ, es decir, el corchete dentro de la integral.
Este modelo se puede graficar como:
EN
N
Normalmente el término f (x) es no nulo, con lo cual podrı́amos decir que casi todos
los procesos dinámicos son realimentados. Si embargo, en control automático hablamos
IO
de sistemas realimentados cuando alguna componente de u es forzada a depender del
estado. Esto constituye una realimentación artificial, pero en última instancia que sistema
es realimentado y cual no es solo una cuestión de perspectiva (excepto que f (x) = 0).
C
El esquema de realimentación artificial (en el caso invariante en el tiempo) serı́a:
C
RU
ST
Los sensores y actuadores también son sistemas dinámicos, con propiedades que
pueden ser descriptas con modelos matemáticos. En el diagrama precedente esa
N
dinámica quedarı́a absorbida dentro del modelo de estados, es decir, los estados
internos de estos subsistemas serı́an parte del vector x.
O
N
IO
2.3.2. Sensibilidades del Lazo SISO
Podrı́amos sustituir las perturbaciones por señales equivalentes que actúe directamente
sobre la salida:
C
Y (s) = G(s)U (s) + Do (s) , Do (s) = F (s)D(s)
C
o bien una que se apliquen a la entrada junto con u:
F (s)
Y (s) = G(s) [U (s) + Di (s)] , Di (s) = D(s)
RU G(s)
Para construir una estructura genérica para el lazo de control se agrega en el lazo de
realimentación el ruido de medición N (s) y se identifican las tres variables de salida
ST
C
También el rotor principal y el rotor de cola afectan el régimen de giro cuando cambia
el paso colectivo de cualquiera de ellos, especialmente el primero. Identifiquemos estas
perturbaciones como dp y dc respectivamente.
C
Dado que el paso colectivo del rotor principal es proporcional al movimiento del comando
de paso colectivo (figura 2.8a), la posición de este mando da información directa de la
RU
perturbación.
Sin embargo, esta no se suma directamente a la entrada o a la salida, como se muestra
en la figura 2.6. Para calcular una perturbación de salida do “equivalente” habrı́a que
considerar la transformación dinámica f1 [·] que hay sobre el paso colectivo antes de
producir un efecto en la salida y (el régimen de giro del motor). Lo mismo puede
decirse para el rotor de cola, con lo cual la perturbación equivalente serı́a de la forma
ST
do = f1 [dp ] + f2 [dc ].
Dado que la dinámica f1 [·] es similar a la que relaciona la apertura de la mariposa u con
la salida f [·], es decir f1 [·] ≈ f [·], es lógico pensar en estos efectos como perturbaciones
de entrada. Más aun, una estrategia común para compensarla al menos parcialmente
N
Y (s) K(s)G(s)
T (s) = = (2.3)
R(s) 1 + K(s)G(s)
De la misma forma podemos evaluar la transferencia entre la referencia y el error:
E(s) 1
S(s) = = (2.4)
R(s) 1 + K(s)G(s)
IO
Esta misma relación coincide con la sensibilidad de la salida Y (s) a la perturbación de
salida Do (s).
Entre estas dos funciones de sensibilidad existe una restricción fundamental indepen-
C
diente del caso analizado:
C
Llamamos a S(s) función de sensibilidad y a T (s) sensibilidad complementaria.
RU
Podemos determinar otras funciones de interés identificando las trayectorias directas, ya
que el lazo de realimentación es el mismo en todos los casos:
Y (s) G(s)
Si (s) = = = S(s)G(s) (2.6)
Di (s) 1 + K(s)G(s)
ST
Y (s)
So (s) = ≡ S(s) (2.7)
Do (s)
U (s) K(s)
Su (s) = = = S(s)K(s) (2.8)
N (s) 1 + K(s)G(s)
N
( ) (
Y (s) 1 K(s)G(s) G(s) 1 1 D (s)
i
= (2.9)
U (s) 1 + K(s)G(s) K(s) K(s)G(s) K(s) K(s)
Do (s)
N (s)
C
Puede observarse que todas las sensibilidades quedan definidas por cuatro funciones
fundamentales: T (s), S(s), Si (s) y Su (s), que comparten como denominador la
expresión 1 + K(s)G(s).
EN
1 + G(s)H(s) = 0 (2.10)
Es obvio que las raı́ces quedan definidas por el producto L(s) = G(s)H(s), a lo cual
denominaremos dinámica de lazo abierto; pero normalmente los polos de lazo abierto y
N
los de lazo cerrado son diferentes.
Como L(s) es una función racional (cociente de polinomios), puede representarse como:
IO
B(s)
L(s) =
A(s)
donde A(s) es un polinomio de orden n y B(s) uno de orden ≤ n. Con esto la ecuación
C
caracterı́stica se puede escribir como:
B(s)
1+ =0
C
A(s)
Dado que entre las diferentes sensibilidades puede haber cancelaciones entre polos y
ceros, la estabilidad no puede evaluarse a partir de una sola de ellas; pero sı́ podemos
N
afirmar que el lazo es internamente estable si las cuatro sensibilidades mencionadas son
estables.
O
Ambas cosas compatibles y de hecho podemos decir “caras de una misma moneda”,
si consideramos la restricción fundamental dada por la ecuación (2.5) que podemos
reescribir como:
S(s) = 1 − T (s) (2.13)
N
Restricciones por Actuación Máxima Ganancias elevadas implican acciones más
intensas de control ante una cierta magnitud de error. Esto podrı́a llevar a alcanzar
los valores máximos admisibles de la acción de control (saturación) aun ante errores
IO
pequeños, lo cual suele resultar inaceptable desde el punto de vista práctico.
C
En casos extremos la acción de control podrı́a terminar dominada por los ruidos de me-
dición.
C
Restricciones por Incertidumbre Dinámica Las leyes de control se diseñan en base
a un modelo dinámico del proceso a controlar, que por definición no es exacto. En general
este modelo representa correctamente la dinámica del sistema para movimientos lentos,
RU
compatibles con el comportamiento esperado del sistema a lazo cerrado.
Si se pretende de este último una respuesta más rápida será necesario refinar el modelo
para incluir efectos originalmente despreciados. Estos suelen ser difı́ciles de modelar, y
muchas veces implica lidiar con parámetros variables según la condición de operación.
De hecho, este cambio en las entradas podrı́a tener alguna ley de evolución temporal
que no necesariamente implique establecerse en algún valor constante, y aún ası́
C
Los errores en el régimen transitorio son inevitables, pero se puede trabajar sobre
la dinámica de lazo cerrado para ajustar algunos aspectos de este transitorio,
especialmente su duración (tiempo de establecimiento) y amortiguamiento (es decir,
evitar oscilaciones excesivas).
N
“filtro”.
IO
Para determinar el error de estado estacionario a partir de las funciones de transferencia
del lazo podemos recurrir al Teorema del Valor Final, que aplicado al error resulta:
ess = lı́m e(t) = lı́m sE(s) (2.14)
t→∞ s→0
C
Si evaluamos lo que ocurre con este error ante un cambio en la referencia tendremos:
1
ess = lı́m sS(s)R(s) = lı́m s R(s) (2.15)
s→0 s→0 1 + L(s)
C
En el análisis que podemos encontrar en los libros clásicos como [Oga98] o [Kuo96]
se considera habitualmente el error de respuesta a una referencia escalón, rampa o
parábola:
RU
1 1 1
R(s) = k
ess = lı́m s (2.16)
s s→0 1 + L(s) sk
donde k = 1, 2, 3, · · · se corresponde a escalón, rampa, parábola, etc. Si descompone-
mos la transferencia de lazo abierto en el producto de una función L̄(s) sin polos en el
ST
origen y normalizada con ganancia 1 a frecuencia cero (L̄(0) = 1) y otro término L0 /st
con el resto de la dinámica de lazo abierto (L0 = L(0)):
s 1 st−k+1
ess = lı́m = lı́m t
s→0 L0 sk s→0 s + L0
1 + t L̄(s)
s
N
st
eescalon = lı́m t = 1 + L0 (2.17)
s→0 s + L0
0 si t > 0
A la cantidad t de polos en el origen del lazo abierto se la designa como tipo de sistema.
C
Vemos que un sistema de tipo 0 tendrá un error constante al escalón, tanto más chico
cuanto mayor sea su ganancia a frecuencia cero. Un sistema con tipo mayor a 0 tendrá
error nulo al escalón.
EN
Veamos el caso de la respuesta de lazo cerrado para un sistema térmico simple con
control proporcional:
C kp C
N
G(s) = , K(s) = kp , L(s) = K(s)G(s) =
Ts + 1 Ts + 1
El lazo es de tipo 0 (ni G(s) ni K(s) tienen polos en el origen), y la ganancia a frecuencia
IO
cero es L(0) = kp C . La transferencia a lazo cerrado es:
kp C
T (s) =
T s + kp + 1
C
En la siguiente figura se muestra la respuesta a un cambio abrupto (escalón) en la
referencia y a un cambio lineal (rampa):
C
RU
ST
N
Vemos que hay un error en estado estacionario constante, mientras que para la rampa el
error crece sin lı́mite ya que la pendiente de la respuesta tiene una diferencia constante
respecto de la pendiente de la referencia.
O
Para el escalón (en este caso de amplitud el escalón 550 − 100 = 450 y kp C = 10) el
error de estado estacionario es:
1 1
C
Podemos ver que los polos y ceros de lazo abierto no tienen ninguna influencia sobre el
EN
estado estacionario, a excepción de aquellos en el origen. En los casos con error no nulo,
este será tanto menor cuando mayor sea la ganancia. Estos resultados se sintetizan en
la tabla 2.1.
Debe destacarse que la acción integral en el control PID incrementa el tipo de sistema
en 1, y por lo tanto garantiza error nulo en estado estacionario a referencias constantes.
N
Cuadro 2.1: Errores de estado estacionario para modelos de perturbación 1/sk
IO
Los mismos resultados se obtiene si consideramos el error de estado estacionario
ante una perturbación equivalente a la salida. Desde la perspectiva del error,
tanto la referencia R(s) como la perturbación de salida Do (s) pueden considerarse
genéricamente como una misma perturbación.
C
Pero en el caso de una perturbación de entrada hay una diferencia:
G(s)
ess = lı́m sSi (s)Di (s) = lı́m s Di (s)
C
s→0 s→0 1 + K(s)G(s)
1
= lı́m s Di (s)
s→0 G−1 (s) + K(s)
RU
Si G(s) no tiene ceros en el origen, lı́m G−1 (s) = cte, con lo cual:
s→0
1
ess = lı́m s Di (s)
s→0 c + K(s)
ST
En este caso los polos y ceros de la planta no tienen incidencia sobre el error en estado
estacionario. Solo interesa la ganancia y los polos del controlador K(s).
A partir del diagrama 2.6 para un lazo de control podemos diagramar las sensibilidades
del error a las referencias o perturbaciones de salida por un lado (función S(s)) y a
N
Figura 2.9: Replanteo de la figura 2.6 para poner en evidencia las sensibilidades del error a las distintas entradas del lazo SISO
N
N (s)
P (s) =
D(s)
IO
De forma genérica podemos esquematizar la relación entre perturbación y error de la
siguiente forma:
C
C
El error en estado estacionario serı́a:
RU
Ld (s) N (s)
ess = lı́m s ·
s→0 1 + Ld (s)Gr (s) D(s)
Expresando ambas transferencias como funciones racionales Ld (s) = Bd (s)/Ad (s) y
Lr (s) = Br (s)/Ar (s) :
ST
Bd (s)
Ad (s) N (s) Bd (s)Ar (s) N (s)
ess = lı́m s = lı́m s ·
s→0 Bd (s) Br (s) D(s) s→0 Ad (s)Ar (s) + Bd (s)Br (s) D(s)
1+
Ad (s) Ar (s)
El denominador de la primer fracción es el polinomio caracecterı́stico de lazo cerrado
N
N (s)Bd (s)Ā(s)
ess = lı́m s
s→0 Alc (s)
EN
En palabras esto significa que el error de estado estacionario será nulo si el denominador
del lazo de realimentación incluye un “modelo” de la perturbación, es decir, D(s) es un
factor de A(s).
Esta es una generalización de lo visto para perturbaciones c/sk (escalón, rampa, parábo-
la, etc.) en donde necesitamos un factor sk en el denominador de la realimentación.
N
IO
C
C
RU
ST
N
O
C
EN
IO
C
Análisis Clásico de Sistemas SISO
C
RU
ST
N
O
C
En el este capı́tulo veremos los métodos clásicos para evaluar el impacto en la dinámica
EN
45
Lugar de Raı́ces
La ecuación caracterı́stica de lazo cerrado (2.10) puede escribirse también como:
Desde el punto de vista de los modos de respuesta de lazo cerrado, que la dinámica esté
distribuida entre G(s) y H(s) es irrelevante.
N
Dado que L(s) es una función compleja, hay que ver a la constante −1 en la ecuación
(3.1) como un número complejo con parte imaginaria nula. Este tiene una magnitud 1
y un argumento ± (2n + 1) π, n ∈ N. Por lo tanto, la ecuación caracterı́stica de lazo
IO
cerrado se puede expresar en término de dos relaciones ecuaciones reales:
|L(s)| = 1 (3.2)
∠L(s) = ± (2n + 1) π n = 0, ±1, ±2, · · · (3.3)
C
donde n ∈ R. Llamamos condición de módulo a la restricción dada por la ecuación (3.2),
y condición de ángulo a la establecida por la ecuación (3.3).
C
Si la ganancia de lazo abierto varı́a en un factor λ ∈ R habrá una afectación sobre la
condición de módulo pero no en la de ángulo.
Para una determinada dinámica de lazo abierto λL(s), cualquier punto del plano s
RU
cumplirá la condición de módulo para algún valor de λ, pero solo un subconjunto de
ellos cumple las condición de ángulo.
Por lo tanto, si cambia el valor de λ los polos de lazo cerrado (raı́ces de la ecuación
caracterı́stica (2.10)) se desplazarán en el plano s sobre un conjunto de curvas que
agrupan aquellos puntos del plano complejo que cumplen la condición de ángulo.
A este subespacio del plano complejo se lo denomina lugar geométrico de las raı́ces
ST
Podemos decir que el lugar geométrico de las raı́ces para un sistema realimentado es el
subespacio del plano complejo en donde:
se ubicarı́an los polos de lazo cerrado al modificar la ganancia de lazo abierto con
N
un factor λ : [0 : ∞)
se cumple con la condición de ángulo (3.3)
O
N
IO
C
C
RU
ST
num = [b k];
den = [1 0 0];
O
rlocus(num, den)
Hemos remarcado con flechas la dirección de desplazamiento de las raı́ces de la
ecuación caracterı́stica (que son los polos de lazo cerrado) cuando se aumenta λ (que
C
en el eje real negativo) y a partir de ahı́ se tendrá una respuesta sobre amortiguada. AL
N
ms2 ms ms2
IO
−1
k b k
1+ 1 + =1+ =0
ms2 ms s (ms + b)
C
Podemos tomar ahora:
1
L(s) = k
s (ms + b)
C
para analizar el efecto de la rigidez en la dinámica del sistema masa-resorte-
amortiguador.
RU
3.1.1. Análisis de la Ecuación Caracterı́stica de Lazo Cerrado
Como L(s) es una función racional (cociente de polinomios), puede representarse como:
ST
B(s)
L(s) =
A(s)
b0 sn + b1 sn−1 + · · · + bn−1 s + bn
= n
s + a1 sn−1 + · · · + an−1 s + an
(s + z1 )(s + z2 ) · · · (s + zn ) B̄(s)
=k =k (3.4)
N
(s + p1 )(s + p2 ) · · · (s + pn ) A(s)
donde −z1 , −z2 · · · − zn son las raı́ces del numerador o ceros del lazo abierto L(s),
O
mientras que −p1 , −p2 · · ·−pn son las raı́ces de su denominador o polos de lazo abierto.
La constante real k se suele llamar ganancia, aunque también llamamos ganancia al
cociente bn /an , que es la “ganancia a frecuencia cero”.
C
Las raı́ces de (2.11) o (2.10) son equivalentes y cumplen tanto la condición de módulo
como la de ángulo. Con el modelo propuesto para L(s) podemos ver que:
B̄(s)
EN
Queda claro que las raı́ces del polinomio de lazo cerrado Alc (s) cambiarán si cambia k .
Puede notarse que si k → 0, Alc (s) → A(s), con lo cual podemos decir que los polos
de lazo cerrado tienden hacia los polos de lazo abierto para valores pequeños del factor
k . El caso lı́mite es k = 0, que equivale a eliminar la realimentación.
Sintetizamos esto diciendo que las ramas del lugar de raı́ces arrancan en los polos de
lazo abierto y terminan en sus ceros. Como en general el la función L(s) es estrictamente
propia (el orden del polinomio numerador es menor que el del denominador), se tienen
mas polos que ceros a lazo abierto. En ese caso hay ramas que terminan en ceros
N
infinitos z = ∞ejθ .
IO
Para evaluar las condiciones (3.2) y (3.3) tenemos que determinar el módulo y argumento
de las expresión (3.4). Para ello es conveniente expresar los números complejos en
forma polar:
C
p b
s = a + j b = |s|ej∠s , |s| = x2 + y 2 , ∠s = tan−1
a
La suma de complejos se puede interpretar como suma vectorial en R2 . En la siguiente
C
figura se muestra una interpretación gráfica de un término s+p (tener presente que tanto
s como p son números complejos y pueden ser representados con vectores en el plano
C):
RU
ST
N
A · B = |A||B| ej∠A+∠B
C
Para el cociente:
A |A| j∠A−∠B
= e
B |B|
Entonces podemos reescribir el lazo abierto como:
EN
|B(s)| |s + z1 ||s + z2 | · · · |s + zm |
|L(s)| = =k
|A(s)| |s + p1 ||s + p2 | · · · |s + pn |
B1 B2 · · · Bm
=k
A1 A2 · · · An
C
donde Bk = |s + zk | y Ak = |s + pk |; y
RU
∠L(s) = ∠B(s) − ∠A(s)
= ∠(s + z1 ) + ∠(s + z2 ) + · · · ∠(s + zn )
− ∠(s + p1 ) − ∠(s + p2 ) · · · − ∠(s + pn )
Xm Xn
= ϕk − θk
ST
k=1 k=1
En base al razonamiento gráfico propuesto podemos ver que para un lazo abierto:
1
L(s) =
O
s (s + 2)
Para este caso podemos notar que cualquier punto de la recta vertical Re {s} = −1
cumple con la condición de ángulo, ya que −θ1 − θ2 = −1800 . Por lo tanto esa recta es
parte del lugar de raı́ces de este ejemplo.
EN
C
El lugar de raı́ces puede aproximarse mediante reglas relativamente sencillas a partir de
la ubicación de polos y ceros de lazo abierto en el plano complejo.
Una de ellas ya ha sido mencionada, y establece que hay una rama de esta gráfica por
C
cada polo de lazo abierto, que parte desde este y converge hacia algún cero de lazo
abierto cuando la ganancia tiende a infinito.
Hemos dicho también que como las funciones de transferencia para sistemas reales
RU
tienen más polos que ceros (son funciones estrictamente propias), algunas de las ramas
convergen a ceros en el infinito siguiendo la dirección de ciertas “ası́ntotas”. La cantidad
de ası́ntotas será igual al grado relativo del lazo abierto, definido como la diferencia entre
cantidad de polos np y cantidad de ceros nz .
P P
pj − zj
σa = (3.6)
np − nz
y forma ángulos
N
± (2n + 1) π
θa = , n = 0, 1, · · · (3.7)
np − nz
O
Esto significa que cuanto mayor sea el grado relativo, mayor será la cantidad de ası́ntotas
y menor será el intervalo angular entre ellas. A su vez, la intersección entre ellas estará
tanto más a la izquierda cuando más a la izquierda estén los polos y más a la derecha
estén los ceros.
C
N
Si solo interesa evaluar la estabilidad del lazo cerrado, es posible construir el polinomio
Alc (s) y determinar si este tiene raı́ces en el semiplano derecho del espacio complejo
(C+ ).
IO
Para un polinomio concreto esto se puede resolver con el comando roots().
C
% representamos un polinomio colocando sus coeficientes en un vector
% comenzando con el que corresponde a la mayor potencia de s
C
A = [1 3 3 10];
roots(A)
RU
ans =
-3.0801 + 0.0000i
0.0400 + 1.8014i
0.0400 - 1.8014i
Vemos que hay un par de raı́ces complejas conjugadas en C+ (parte real positiva).
ST
Pero esta forma directa no es útil cuando existen parámetros variables en el polinomio.
Para esos casos existen algunas alternativas.
El Criterio de Estabilidad de Routh puede utilizarse para determinar los rangos de valores
de algún parámetro variable en el lazo abierto para los cuales el lazo cerrado será
O
Una consideración importante que se plantea en este criterio es que cualquier polinomio
en donde haya un cambio de signo en sus coeficientes tendrá raı́ces con parte real
C
B(s) s−1
L(s) =
A(s) s (s + 1) (s + 2)
N
Criterio de Estabilidad de Hurwitz
IO
La inexistencia de cambios de signo es una condición necesaria para que todas
las raı́ces del polinomio estén en C− , pero no es suficiente. El criterio de Routh
complementa esta condición con la construcción de una tabla de evaluación para
determinar la existencia de raı́ces positivas.
C
En contraste, el criterio de estabilidad de Hurtwitz da condiciones suficientes para
cualquier polinomio.
C
Este se basa en evaluar los menores principales de una matriz construida con los
coeficientes del polinomio. Este se presenta en [Oga10, A-5-18, p. 252] y en ediciones
anteriores.
RU
Mencionamos este criterio puntualmente porque es común en la bibliografı́a decir que
un polinomio es “Hurwitz” para indicar que no tiene raı́ces en C+ .
1 − L(s) = 0 (3.8)
N
6(s − 2)
L(s) =
4 (s + 0,5) (s + 3)
N
Sin embargo, dado que el signo de la mayor potencia de s tanto en el numerador como
en el denominador son positivos, con un factor de ganancia kc positivo se tendrá el Lugar
de Raı́ces convencional.
IO
Esto queda más claro si expresamos la transferencia de lazo abierto con polinomios
desarrollados:
1,5s − 3
L(s) =
s2 + 3,5s + 1,5
C
C
3.1.6. Lectura Adicional
El tema del lugar geométrico de las raı́ces está desarrollado en detalle en [Oga10] y
RU
en todas sus ediciones anteriores, ası́ como en la mayorı́a de los libros clásicos para la
enseñanza de grado en control automático.
Allı́ se detallan reglas para estimar la forma del lugar de raı́ces a partir de los polos
y ceros en base a diferentes reglas. Estas son de interés no para realizar la gráfica
(el comando rlocus() resuelve rápidamente esta cuestión) sino para poder imaginar
como cambia el diagrama al agregar polos o ceros en el lazo abierto.
ST
6.1 - Introducción
6.2 - Gráficas del lugar geométrico de las raı́ces
Conceptos Principales
N
reglas básicas: lugar de raı́ces en el eje real, ángulo e intersección con el eje real
de las ası́ntotas
Conceptos Interesantes
C
N
Estabilidad del lazo cerrado implica que todas las raı́ces de su ecuación caracterı́stica
(2.10) estén en el semiplano izquierdo del espacio complejo C− . Ya hemos mencionado
IO
los criterios de Routh y Hurwitz como formas de indagar esto, y también hemos dicho
que en la actualidad es muy fácil computar la dinámica de lazo cerrado y evaluar de
forma directa la ubicación de sus polos cuando todos los parámetros están definidos.
Lo que buscamos aquı́ es poner en evidencia el impacto que tendrı́a un cambio en la
C
dinámica de lazo abierto sobre la estabilidad del lazo cerrado.
Veremos que esto se puede determinar de forma gráfica.
Posteriormente partiremos de este criterio para realizar el análisis de robustez de un
C
sistema de control.
cantidad de zeros Z y polos P que tiene F (s) en la región del plano s original encerrada
por la curva C .
s+1
F (s) =
O
s−1
Esta función tiene un cero en s = −1 y un polo en s = 1.
En las gráficas del lado izquierdo de la figura puede notarse que para trayectos que
C
encierran solo al polo (a) o al cero (b), el mapeo del trayecto encierra al origen en sentido
negativo y positivo respectivamente; mientras que en los otros casos Z − P = 0 y el
mapeo no encierra al origen (N = 0).
EN
Figura 3.4: Algunos ejemplos del “teorema del encierro” (tomado de [Oga10]). En los casos (a) y (b) hay encierro al origen de la
curva transformada, mientras que en los (c) y (d) no. Observar a la izquierda la cantidad de polos y ceros en la región acotada
por la curva original.
C
de raı́ces de F (s) en C+ y P la cantidad de polos en dicho espacio.
Como polos F (s) = 1 + L(s) son los polos de L(s), y los ceros o raı́ces de F (s) =
C
1 + L(s) son los polos de lazo cerrado, vemos que:
Conociendo P (se asume que sabemos cuantos polos inestables tiene el lazo abierto) y
determinado N podemos ver “cuantos polos inestables tiene el lazo cerrado”:
Z =N +P (3.10)
ST
Por simplicidad podemos hacer una traslación del espacio transformado llevando el
origen al punto −1 y usando como transformación F (s) = L(s).
El resultado es el mismo, pero ahora debemos evaluar los encierros al −1.
El trayecto de Nyquist C+ está compuesto por dos partes: el eje imaginario Cj y un semi-
N
de lazo abierto.
Al evaluar el tramo C∞ se tiene s = ∞ ejθ . El módulo de la transformación serı́a:
|∞ ejθ + z1 | · · · |∞ ejθ + zm |
C
Para aplicar el teorema del encierro la función de transformación debe ser conforme (no
singular) sobre la trayectoria a transformar.
Este no es el caso al aplicar el criterio de Nyquist a un lazo abierto que tengan polos
sobre el eje imaginario.
EN
(b) Aspecto general de la traza de Nyquist para funciones de transferencia con diferente
cantidad polos en el origen (o tipo de sistema)
N
lado derecho del plano de Nyquist. Algo similar se debe hacer con polos complejos
conjugados de lazo abierto en cualquier otra ubicación sobre el eje imaginario.
En la figura 3.6b se muestra el aspecto de las trazas de Nyquist para funciones de
IO
transferencia con diferente cantidad polos en el origen.
C
C
RU
ST
N
Si el lazo abierto tuviese un atraso de fase adicional dado por el arco identificado como
M F , el lazo cerrado quedarı́a en el lı́mite de la inestabilidad (de hecho ya no tendrı́a
estabilidad asintótica). A este arco se lo denomina margen de fase.
N
7.3 - Diagramas polares
7.5 - Criterio de estabilidad de Nyquist
7.6 - Análisis de estabilidad
IO
7.7 - Análisis de estabilidad relativa
Conceptos Principales
formas de las gráficas polares para la respuesta en frecuencia
C
gráfica polar para funciones de transferencia con polos en el eje imaginario
teorema del encierro
planteo de Nyquist para evaluar estabilidad de lazo cerrado
C
resultado de transformar la ”trayectoria de Nyquistçon la función de transferencia
de lazo abierto
criterio de estabilidad de Nyquist
RU
márgenes de estabilidad, y relación entre estos y la respuesta de lazo cerrado
L(s)
T (s) = H −1 (s) (3.13)
1 + L(s)
O
Esto se muestra en la figura 3.8. Los polos de lazo cerrado quedan definidos por el
término de la izquierda. El término H −1 (s) afecta puntualmente a la variable Y (s), y sus
C
|L(jω)|
|T (jω)| = (3.14)
|1 + L(jω)|
N
En la siguiente figura 3.9 podemos identificar numerador de la expresión precedente
(longitud del vector azul) y el denominador (longitud del vector verde, que surge de sumar
IO
el rojo con el azul)
Es evidente que en aquellos valores de ω para los cuales Re {L(jω)} = 0,5 la ganancia
del lazo cerrado definida por la ecuación 3.12 será M = |T (jω)| = 1.
C
Podrı́amos decir que independientemente de la dinámica de lazo abierto considerada, la
recta Re {L(jω)} = 0,5 es una curva de ganancia de lazo cerrado M = 1.
C
Podemos computar como son las curvas para otros valores de M , y con eso hacer una
grilla de ganancias constantes de lazo cerrado. Separando parte real e imaginaria:
RU
L(jω) = X(ω) + j(Y ω)
Entonces
|X + jY | X2 + Y 2
M= → M2 =
|1 + X + jY | (1 + X)2 + Y 2
ST
Por lo tanto:
M 2 (1 + 2X + X 2 ) + M 2 Y 2 = X 2 + Y 2
X2 1 − M 2 − 2M 2 X − M 2 + 1 − M 2 Y 2 = 0
M2 M2
N
X2 + 2 2
X+ 2 +Y2 =0
M −1 M −1
O
C
EN
Figura 3.10: Grillas para la determinación de la respuesta en frecuencia de lazo cerrado a partir de la traza de nyquist del lazo
C
abierto (tomado de [Oga98])
Finalmente: 2
RU
M2 M2
X+ +Y2 = 2
M2 − 1 (M 2 − 1)
Esta es la ecuación de una circunferencia con centro en {C, 0} siendo C = M 2 /(1−M 2 )
y de radio R = |C|/M . El resultado se muestra en la figura 3.10a para diferentes valores
de M .
ST
De forma análoga se puede evaluar el lugar geométrico para el atraso de fase del
lazo cerrado (ver figura 3.10b). El desarrollo detallado puede verse en [Oga98, sec.7-
8, p. 477].
N
Pico resonante de lazo cerrado En la figura 3.10a se puede ver que todas las curvas
M a la izquierda de M = 1 (parte real < −0,5) corresponden a ganancias de lazo
cerrado mayores a 1 (0db).
O
Si el lazo abierto se aproxima al punto −1, el lazo cerrado tendrá picos resonantes de
alta ganancia.
Dado que un lazo abierto con buenos márgenes de fase y ganancia implica un buen
alejamiento de dicho punto, márgenes de fase y ganancia de al menos 600 y 6db
C
Esto se puede explicar de otra forma. Viendo la ecuación (3.14) podemos notar que:
EN
|L(jω)|
|T (jω)| = = |L(jω)||S(jω)|
|1 + L(jω)|
Por lo tanto se tendrán ganancias |T (jω)| > 1 en aquellas frecuencias para las cuales
|L(jω)| > |S(jω)|−1 . Notando que:
|S(jω)|−1 = |1 + L(jω)|
N
Y (s) km
G(s) = = 2
U (s) s (s + q)
IO
donde y representa la posición de la superficie, u es el voltaje de alimentación del motor,
km es una constante que depende de parámetros eléctricos y mecánicos y q el ”polo
eléctrico”.
C
Con un control PD el lazo abierto resulta:
kc (s + z) km
L(s) =
(s + p) s2 (s + q)
C
En la siguiente figura mostramos las funciones de sensibilidad del lazo cerrado a la
izquierda (en escala semi-logarı́tmica, con ganancias en valor absoluto) y el diagrama
RU
de Nyquist de lazo abierto a la derecha para dos ajustes del control PD (lineas gruesa y
finas).
Se observa en el diagrama de Nyquist que con el segundo ajuste (trazo fino) el lazo
abierto se aproxima más al −1, disminuyendo el margen de fase. En consecuencia se
observa en la respuesta en frecuencia de lazo cerrado mayores picos de sensibilidad y
sensibilidad complementaria.
ST
N
O
C
EN
En la siguiente figura se puede observar la relación entre un mayor pico en las funciones
de sensibilidad con el amortiguamiento de las respuestas transitorias.
C
La función T (jω) se corresponde con un filtro pasa bajos, y como |T (0)| ≈ 0db,
√ se corresponde con la frecuencia ωbw para la cual
por definición el ancho de banda
|T (jωbw )| − |T (0)| = −3db (1/ 2 en valor absoluto).
RU
De forma complementaria, la función S(jω) se corresponde con un filtro pasa altos, y
como |S(j∞)| ≈ 0db, por definición la frecuencia de paso se corresponde con el valor
ωps para la cual |S(jωps )| − |S(j∞)| = −3db.
Dado que esto es fácil de ajustar con un ajuste en la ganancia de lazo abierto, alterando
la frecuencia de cruce podemos ajustar (al menos en orden de magnitud) el ancho de
banda de T (jω) y la frecuencia de paso de S(jω).
EN
Conceptos Principales
ST
( )
1 L(s)
S(s) = − [1 + L(s)]
1 + L(s) [1 + L(s)]2
1 + L(s) − L(s)
= 2 [1 + L(s)]
[1 + L(s)]
N
Si consideramos s = jω , la expresión anterior indica que la dinámica de lazo cerrado
será poco sensible a los cambios en el lazo abierto en el rango frecuencias en donde
IO
T (jω) ≈ 1. Dado que hablamos de una cantidad compleja, esto implica |T (jω)| ≈ 1 y
∠T (jω) ≈ 0.
Esto es ası́ en general hasta una frecuencia una década por debajo del ancho de banda
de lazo cerrado. Para frecuencias en el orden del ancho de banda la sensibilidad crece,
y para altas frecuencias |T (jω)| → 0 y por lo tanto |S(jω)| → 1.
C
Sin embargo, como un cambio porcentual de un valor pequeño es igualmente pequeño
(aunque sea de un 100 %), los cambios que tenga la planta respecto del modelo para
altas frecuencias no es relevante.
C
Concluimos preliminarmente que el lazo cerrado será sensible a cambios en la dinámica
L(s) si estás se manifiestan en frecuencias próximas al ancho de banda de lazo cerrado,
RU
mientras que lo que ocurra una década por encima o por debajo no será muy relevante.
To do (??)
Simplificación de Modelos
Una dinámica G1 (s) de primer orden con un polo p tiene para una frecuencia ω = p una
ST
ganancia de −3db (para este caso p coincide con su ancho de banda) y un atraso de
fase −450 .
Para una frecuencia una octava menor (ω = p/2) la ganancia se aproxima a 1 (0,9) y
el atraso de fase es significativo (≈ −260 ). Pero para una frecuencia una década menor
(ω = p/10) la ganancia es prácticamente 1 y el atraso de fase menor a −60 .
Por lo tanto podemos decir que G1 (jω) ≈ 1 si ω < p/10.
N
Para una dinámica de segundo orden se observa algo similar. En la figura 3.11 se
muestra la respuesta en frecuencia de un modelo de segundo orden prototipo con
O
amortiguamiento 0,7 y ancho de banda ωbw = 1s−1 (con este factor de amortiguamiento
el ancho de banda coincide con ωn ).
Para una frecuencia ωbw /2 (una octava menor al ancho de banda) la ganancia es casi 1
C
En sı́ntesis podemos decir que en general G(jω) ≈ 1 si ω < ωbw /10. Por lo tanto para
el diseño es posible eliminar la dinámica de alta frecuencia del modelo; entendiendo
esto como aquellos polos y ceros cuyas frecuencias sean una década mayor al rango de
frecuencias de interés. En el caso del diseño de un sistema de control, este rango es el
ancho de banda de lazo cerrado pretendido.
Figura 3.11: Validez de la hipótesis de control perfecto para una dinámica dominante de segundo orden
C
EN
N
polos y ceros de baja frecuencia de forma aislada, pero si lo podemos hacer en pares;
dado que los atrasos de fase se compensan.
IO
En sı́ntesis, un conjunto de igual cantidad de polos y ceros con frecuencias una década
por debajo de la frecuencia de cruce ωc tendrá un impacto poco significativo en la
dinámica de lazo cerrado, y por lo tanto podrı́an ser eliminados del modelo para el diseño.
C
Pico de Sensibilidad
En la figura 3.9 se puede notar que la distancia entre un punto de la traza de Nyquist
de lazo abierto y el punto −1 es la inversa de la función de sensibilidad S −1 (jω) (vector
C
verde).
Por lo tanto, la menor distancia entre estos elementos se dará en donde la función de
sensibilidad tenga un máximo, es decir, un pico de sensibilidad.
RU
EL pico de sensibilidad es una medida de robustez mucho más efectiva que los
márgenes de ganancia y fase, ya que estos garantizan estabilidad de lazo cerrado
siempre y cuando variaciones de fase y ganancia de lazo abierto no se produzcan de
forma simultánea.
ST
Compensación
3.4.1. Compensación en el “Plano s”
Una vez resuelto el requerimiento de error en estado estacionario es necesario
N
garantizar no solo la estabilidad del lazo cerrado sino también aquellos asociados a su
dinámica.
O
s + p1 s + p2 s + pn s
C
En el caso de polos complejos conjugados agruparemos los términos de segundo cuyas
respuestas al escalón son de la forma:
h i
RU
yj (t) = rj 1 − cj e−Re{pj }t · sin (Im {pj } t + ϕj )
s2
+ 2s + 2
1,8(s + 0,1)
T2 (s) =
(s + 0,09)(s2 + 2s + 2)
0,18
T2 (s) =
EN
(s + 0,09)(s2 + 2s + 2)
Se observa que T2 equivale a T1 con un polo lento adicional cancelado parcialmente con
un cero, mientras que en T3 no hay tal cancelación.
En la siguiente figura vemos la ubicación de polos y ceros a la izquierda junto con la
respuesta al escalón a la derecha:
exclusión sobre el espacio complejo (región verde en la figura 3.13) para la ubicación de
polos de lazo cerrado.
dominantes de lazo cerrado se tendrı́a una respuesta transitoria aceptable. Los polos
dominantes son lo más cercanos al origen.
En el caso de cancelaciones sobre polos lentos debe tenerse presente que estas podrı́an
estar presentes en algunas sensibilidades pero no en todas; pero no necesariamente se
deben imponer los mismos requerimientos para todas ellas.
C
Compensación
Hemos dicho que en primer término es necesario decidir que se debe agregar en el
compensador K(s) para satisfacer los requerimientos de error en estado estacionario.
C
Luego, una vez definida la región admisible en el plano s para los polos de lazo cerrado
se deberán elegir “puntos de prueba” donde se pretende ubicar los polos dominantes de
lazo cerrado.
RU
Si estos puntos de prueba resultan ser finalmente polos de lazo cerrado, allı́ se deberán
cumplir las condiciones de módulo (3.2) y ángulo (3.3).
La primera se logra con un ajuste de ganancia, pero para lograr la segunda en general es
necesario “compensar” la dinámica de lazo abierto existente hasta este punto agregando
polos y ceros en lugares adecuados del plano s.
Esto hará que los puntos de prueba pasen a formar parte del lugar de raı́ces, y por lo
ST
tanto podrán ser polos de lazo cerrado con un simple ajuste de ganancia.
s+z
Kpi (s) = kc (3.17)
s+p
O
En general se busca una respuesta de lazo cerrado un poco más rápida que la de lazo
abierto, dado que mientras la diferencia no sea excesiva este es un objetivo alcanzable
y a mayor velocidad de respuesta mejor capacidad de seguimiento de referencias y
rechazo de perturbaciones.
EN
una gran sensibilidad a ruidos de medición de alta frecuencia. Por lo tanto lo habitual es
también agregar un polo, pero más alejado del origen que el cero para que la contribución
C
neta sea positiva a la condición de ángulo sea positiva.
C
ganancia:
K(s) = kp + Kd s = kc (s + z)
RU
Dado que la derivada pura no es fı́sicamente realizable, la implementación real es de la
forma:
s s+z
K(s) = kp + Kd = kc
Ts + 1 s+p
Llamamos a esto compensación en adelanto, por razones que expondremos al analizar
este compensador en el dominio de la frecuencia.
ST
mismo aporte a la condición de ángulo, en tanto el ángulo entre ambos segmentos sea
el mismo.
O
Una forma sistemática de ajustar la ubicación del polo y el cero para obtener un cierto
aporte ϕ es el llamado método de la bisectriz. El método se presenta de forma detallada
en [Oga10, p. 315] y ediciones precedentes.
A partir del punto de prueba P se traza la bisectriz P B del ángulo determinado entre OP
C
y P A. Luego a cada lazo de esta se proyectan dos rectas desde el punto P , obtenidas
agregando y sustrayendo a la bisectriz la mitad del ángulo ϕ (el déficit obtenido en
la condición de ángulo con el lazo abierto sin compensar). La intersección de estos
segmentos con el eje real define la ubicación del polo y el cero del compensador.
EN
Compensación en Atraso
N
SI colocamos un polo p y un cero z cercanos al origen en relación a los polos dominantes
de lazo cerrado, su contribución a la condición de angulo será nula. Sin embargo, si
z < p, la ganancia para cumplir con la condición de módulo se incrementará en un factor
IO
aproximado z/p.
El caso lı́mite del compensador en atraso es el controlador PI.
Ajuste de un Lazo PI
C
Hemos dicho que la acción integral se introduce en el lazo para neutralizar perturbacio-
nes constantes. Combinada con una acción proporcional el compensador es:
1 s+z ki
Kpi (s) = kp + ki = kp , z= (3.18)
C
s s kp
En este caso la compensación es en atraso, dado que el polo (en el origen) siempre
está a la derecha del cero (efecto desestabilizante). Sin embargo, en casos en donde la
RU
condición de ángulo en el punto de prueba es mayor de −π esto serı́a suficiente.
En este caso solo es necesario ajustar z para cumplir con la condición de ángulo en
la ubicación deseada para los polos dominantes, y luego ajustar kp para verificar la
condición de módulo, con lo cual definimos los parámetros del controlador PI.
Si ajustando z no se logra cumplir la condición de ángulo, serı́a necesario agregar un
compensador en adelanto pasando a un control PID (o revisar los requerimientos).
ST
y ceros de lazo abierto entre aquellos próximos y los que se encuentran más lejos (a
distancias en el orden de 10 veces la de referencia.)
O
Podemos notar que los polos y ceros reales de lazo abierto que se encuentran lejos del
origen realizan un aporte pequeño a la condición de ángulo.
En el caso de polos y ceros complejos el aporte puede ser grande, pero si se encuentran
C
lejos del punto de prueba el aporte del par complejo conjugado se aproxima a 3600 , con
lo cual su efecto es nulo.
Y para aquellos polos que se encuentren próximos pero cancelados por ceros, el aporte
EN
neto es nulo.
6.5 - Diseño de sistemas de control mediante el método del lugar de las raı́ces
6.6 - Compensación de adelanto
6.7 - Compensación de retardo
N
En muchos problemas de control la respuesta transitoria al escalón no resulta apropiada
como forma de definir requerimientos.
IO
Esto es generalmente ası́ en el caso de sistemas de control de vuelo, que son diseñados
para seguir referencias continuamente variables (por ejemplo, los sistemas para control
de actitud) o para rechazar perturbaciones (sistemas de control de trayectoria).
Para esta clase de problemas es más significativo pensar en los anchos de banda de las
C
funciones de sensibilidad para definir velocidad de respuesta, imponiendo cotas para los
picos resonantes, asociados al amortiguamiento de los modos oscilatorios.
Esto no es contradictorio con la especificación de parámetros de respuesta transitoria,
C
ya que es posible establecer relaciones entre está y la respuesta en frecuencia.
Podemos plantear los requerimientos para la dinámica de lazo cerrado en términos del
RU
ancho de banda (en realidad frecuencia de corte) de la sensibilidad complementaria
T (s), y márgenes de fase y ganancia para lograr picos resonantes de lazo cerrado lo
suficientemente acotados.
Si la dinámica dominante de lazo cerrado puede caracterizarse por un par de polos
complejos conjugados; el ancho de banda de la sensibilidad complementaria se
relaciona directamente con la distancia al origen de los polos dominantes en el plano
ST
s, mientras que su pico resonante (y por lo tanto los márgenes de estabilidad relativa) se
conectan directamente con el factor de amortiguamiento de estos polos.
Si la dinámica dominante es sobre-amortiguada, el polo real que la caracteriza define el
ancho de banda y el margen de fase es del orden de los 900 .
En la sección 3.3.2 hemos visto que esta frecuencia se encuentra levemente por encima
C
del cruce ωc del lazo abierto (en el orden de una octava). Por lo tanto, ajustando la
frecuencia de cruce de lazo abierto podemos establecer el ancho de banda de T (jω).
Para cumplir las especificaciones de diseño restarı́a agregar un compensador para
cumplir con los márgenes de fase y ganancia.
EN
Podemos decir que en general lograr el margen de fase requerido implica también
cumplir con el de ganancia, excepto que la dinámica de lazo abierto en el entorno de
la frecuencia de cruce sea muy compleja. En tal caso deberı́a revisarse el requerimiento
de ancho de banda, y de ser posible, disminuirlo.
N
Por conveniencia re-escribimos esta expresión de la siguiente forma:
Ts + 1
IO
K(s) = kc (3.19)
αT s + 1
donde 0 < α < 1, resultando que z = 1/T , p = 1/αT y kc = k · z/p. La respuesta
en frecuencia del compensador tiene la siguiente forma (ejemplo tomado de [Oga10] en
donde α = 0,1):
C
C
RU
ST
Podemos ver que este compensador introduce un “adelanto de fase” cuyo valor máximo
resulta:
N
1−α
ϕm = sin−1 (3.20)
1+α
Claramente se observa que cuanto menor sea α, mayor será ϕm ; siendo el valor máximo
O
posible de 900 con α → 0. Este máximo adelanto de fase se produce a una frecuencia
√
ωm = 1/ αT , que es el punto medio entre el polo y el cero del compensador en la
escala logarı́tmica de frecuencias.
C
N
Compensación en Atraso
Si colocamos un polo p y un cero z en baja frecuencia respecto del cruce de ganancia del
IO
lazo abierto, si p < z podemos aumentar la ganancia de lazo abierto a baja frecuencia
sin impactar significativamente en el margen de fase.
Como hemos mencionado para la compensación en el plano s, el caso lı́mite del
compensador en atraso es el controlador PI.
C
Lectura Adicional
De [Oga10]:
C
7.10 - Diseño de sistemas de control por el método de la respuesta en frecuencia
7.11 - Compensación de adelanto
RU
7.12 - Compensación de retardo
los ceros de la transferencia entre entrada y salida son los ceros de G(s) y los polos de
H(s):
NG (s) NH (s)
O
G(s) = , H(s) = →
DG (s) DH (s)
NG (s)
C
Los ceros cercanos al origen tienden a aumentar el ancho de banda. También provocan
un aumento del sobrepaso en la respuesta al escalón, como se observa en la siguiente
figura. En esta se muestra la respuesta al escalón de una dinámica de segundo con un
cero a diferentes distancias del origen:
C
RU
ST
Es evidente que:
Y (s) Y (s)
N
Podemos incluir polos en el filtro para cancelar los ceros de T (s) cercanos al origen y
O
efecto sobre las sensibilidades para las otras entradas del sistema.
EN
IO
C
Control Moderno de Sistemas SISO
C
RU
ST
N
O
C
EN
81
Especificaciones de Diseño
4.1.1. Respuesta Transitoria
En la subsección 2.3.5 hemos visto que el desempeño en estado estacionario depende
solo de algunos aspectos de la dinámica de lazo abierto, sintetizado en el principio del
modelo interno.
Respecto de la respuesta de lazo cerrado, en la subsección 3.4.1 hemos planteado los
N
objetivos de la compensación en el plano s a partir de especificaciones de respuesta
transitoria al escalón; lo que se traduce en la ubicación deseada para los polos
dominantes de lazo cerrado. Esta es una aproximación razonable para aquellos casos
IO
en los cuales las referencias y perturbaciones cambian solo ocasionalmente.
Tiempos de Respuesta
Hemos considerado en la sección 3.4.1 tres parámetros temporales para la respuesta
C
transitoria:
tiempo de establecimiento
C
tiempo de crecimiento
tiempo de retardo
Oscilación
ST
C
X
TV = vk (4.1)
k=0
C
RU
ST
tener una forma de cuantificar la “eficiencia” del diseño en relación al esfuerzo de control.
Indices de Desempeño
O
En relación al IAE, el ISE penaliza más aquellas soluciones con excursiones mayores
del error (por ejemplo, los sobrepasos).
Dado que el error inicial al escalón es 1 para t = 0 cualquiera sea la respuesta, serı́a
N
lógico darle más peso en el ı́ndice al error tardı́o (cuando el tiempo crece). Con esta
consideración se define el ı́ndice ITAE: integral del tiempo por el valor absoluto del error :
Z T
IO
IT AE = t|e(t)|dt (4.4)
0
Respuestas Optimas
Al momento de decidir especificaciones de diseño se combinan distintos requerimientos
C
de acuerdo al problema particular abordado, pero en muchas ocasiones quedan
aspectos sin definir de forma explı́cita.
Puede plantearse como objetivo la idea de buscar el mejor “resultado posible”, que
C
identificamos como “solución óptima”.
El adjetivo “óptimo” implica algo ası́ como “insuperable”, lo que es muy difı́cil de plantear
RU
en cualquier caso real.
El concepto de “solución óptima” solo tiene sentido en planteos matemáticos muy
concretos, y solo en relación a un ı́ndice de desempeño en particular.
Para afirmar que una solución es óptima debemos demostrar de forma rigurosa que con
esta se obtiene el mı́nimo posible para el ı́ndice de desempeño elegido. Y debe notarse
que si se cambia el ı́ndice de desempeño, la solución óptima podrı́a dejar de serlo para
ST
el nuevo ı́ndice.
Pero en ambos casos hay una restricción, en el primero la obligatoriedad de pasar por
dos puntos determinados y en la segunda la de contener un determinado volumen.
Para una dinámica de segundo orden con tiempo normalizado t̂ = ωn t (lo cual define de
EN
forma implı́cita una restricción), el óptimo ITAE es el caso con factor de amortiguamiento
0,7.
Diferentes trabajos han computado funciones de lazo cerrado sin ceros de diferente
orden que serı́an óptimas para el ı́ndice ITAE (aunque hay cierta controversia sobre
esos resultados). Los polinomios denominadores para las respuestas óptimas ITAE son
los siguientes:
N
s6 + 3,25ωn s5 + 6,60ωn2 s4 + 8,60ωn3 s3 + 7,45ωn4 s2 + 3,95ωn5 s + ωn6
IO
desempeño puede ser algo relevante o no en un determinado caso concreto. En el caso
ITAE, las respuestas de orden elevado resultan bastante oscilatorias.
C
Para la compensación en frecuencia planteada en la subsección 3.4.2 los objetivos se
establecieron en términos de ancho de banda y pico resonante de lazo cerrado, lo cual
C
nos conduce a la elección de una frecuencia de cruce de ganancia para el lazo abierto y
cotas inferiores para margenes de estabilidad relativa, especialmente el de fase.
RU
El análisis en frecuencia es más razonable para referencias o perturbaciones inciertas,
y permite considerar de forma más directa los compromisos en el diseño. Podemos
plantear los requerimientos estableciendo una cota inferior para el “nivel de rechazo”
(del error a las referencias y las perturbaciones).
matemático, exige elegir una cierta norma para definir a que nos referimos al hablar
de magnitud.
Por ejemplo, para un número complejo podemos usar el módulo como medida de
magnitud. Habitualmente extendemos esto a cualquier vector de dimensión finita n, que
calculamos tomando la raı́z cuadrada del producto escalar de este por si mismo.
N
Normas Vectoriales
Cualquier operador || · || que arroje como resultado una cantidad escalar puede ser
C
el resultado es no negativo: || · || ≥ 0
es un operador positivo: ||x|| = 0 ⇐⇒ x = 0
es homogéneo: ||αx|| = α||x||
EN
en donde x es un elemento del espacio vectorial sobre el que opera (ver [SP01, apéndice
A.5, p. 526]).
n
!1/p
X
∥x∥p ≜ |xk |p (4.5)
k=1
La norma 2 se corresponde con la norma euclı́dea (módulo del vector), mientras que la
norma ∞ se corresponde con la componente de mayor valor absoluto (valor máximo).
N
Para funciones continuas la sumatoria se convierte en integral:
Z ∞ 1/p
IO
p
∥x(t)∥p ≜ |x(τ )| dτ (4.6)
−∞
La norma 2 para este caso es la raı́z cuadrada de la energı́a, mientras que la norma ∞
es el pico de su valor absoluto.
C
Para señales con energı́a no acotada no es posible calcular la norma 2, pero podemos
considerar su potencia:
s
C
Z T
1
∥x(t)∥pwr ≜ lı́m |x(τ )|2 dτ (4.7)
T →∞ 2T −T
RU
Estrictamente hablando esta es una semi-norma, por no cumplir todas las propiedades
para de las normas (ver [SP01, apéndice A.5.6, p. 536]).
Z ∞ Z ∞ Z ∞
2 1 2
y 2 (t)dt = |Y (f )| df = |Y (ω)| dω (4.8)
−∞ −∞ 2π −∞
0 0
s
∞
r
1 −2at 1
= e =
2a 0 2a
N
2πa a −∞ 2a
IO
Escalado y Normalización
Vamos a considerar en lo sucesivo que en el modelo G(s) tanto la entrada como la salida
han sido normalizadas de la forma:
C
G(s) = e−1
tol Ḡ(s)umax
C
donde etol es la tolerancia para el error de seguimiento, umax es el valor máximo de la
acción de control y Ḡ(s) la transferencia considerando unidades de ingenierı́a.
De esta forma los rangos para la acción de control y la salida estarı́an normalizados al
RU
rango operativo. En otras palabras, con la función de transferencia normalizada G(s) en
condiciones normales |y| y |u| estarán en el rango (−1 : 1), y deben ser interpretados
como valores normalizados.
Para el análisis es recomendable realizar esto con todas las entradas y salidas de interés
en el lazo. El concepto de escalado aquı́ planteado puede profundizarse en [SP01,
sec.1.4, p. 5].
ST
Control Perfecto
En la subsección 2.2.1 se introdujo el concepto de control perfecto, que podrı́amos
sintentizar como “rechazo exacto de perturbaciones”: S(s) = 0 (T (s) = 1), lo cual hemos
dicho no es fı́sicamente realizable.
N
Siendo T (s) un filtro pasa-bajos, podemos caracterizarlo con su frecuencia de corte ωbw
C
(que coincide con su ancho de banda), y como S(s) + T (s) = 1, la sensibilidad S(s) es
pasa-altos caracterizada por una cierta frecuencia de paso ωps .
En el apartado 3.3.2 se mostró que ωps < ωc < ωbw , donde ωc es la frecuencia de cruce
de ganancia del lazo abierto: |K(jωc )G(jωc )| = 1.
EN
N
El filtro de Butterworth se caracteriza por tener para un determinado orden la respuesta
en frecuencia más plana posible en la banda de paso y la mayor pendiente en la banda
de corte, como se observa a la izquierda en la figura 4.1. Se podrı́a decir que como filtro,
IO
a los efectos de absorber la energı́a de la señal de entrada en la banda de corte es ideal;
e introduce la mı́nima distorsión posible en la distribución espectral de energı́a dentro de
la banda de paso.
C
El filtro de Bessel en cambio se caracteriza por tener un atraso de fase lineal en la banda
de paso. Esto significa que el atraso traducido a tiempo de retardo es el mismo para
todas las armónicas en la banda de paso, y con ello la distorsión en la forma temporal
C
de la señal es mı́nima.
En el lado derecho de la figura 4.1 se observa que la respuesta transitoria del filtro
de butterworth es algo oscilatoria, mientras que la del filtro de Bessel es mucho más
RU
parecida a la forma de la entrada (un escalón).
Puede observarse que en el caso de Butterworth los polos tienen una distribución circular
(la distancia al origen para todos los polos es la misma), mientras que en el caso de
Bessel la distribución es elı́ptica.
ST
Como las entradas tienen una cierta distribución espectral W̄ (jω), lo razonable serı́a
EN
figura 4.2.
Lectura Adicional
De [SP01]:
Restricciones en el Diseño
C
En el capı́tulo precedente hemos visto las formas clásicas para la sı́ntesis de un
compensador SISO. En este capı́tulo veremos algunas alternativas, pero en todos los
RU
casos el proceso de sı́ntesis requiere de la definición de especificaciones de diseño, las
cuales de una u otra manera imponen una cierta velocidad de respuesta o ancho de
banda para el lazo cerrado.
Al momento de determinar esta caracterı́stica es necesario analizar las limitaciones en
el diseño que impone la dinámica del proceso a controlar; algunas de las cuales tienen
que ver con la instrumentación (sensores y actuadores) pero otras son estructurales.
ST
ganancia: |K(jω)| ≫ 1.
Esto significa que las acciones de control serán grandes ante perturbaciones equiva-
lentes de salida o cambios en la referencia con frecuencias mayores a la frecuencia de
C
corte. Si estas fueran significativas, las acciones de control alcanzarı́an rápidamente sus
valores máximos (saturación).
Por lo tanto el nivel de actuación máximo impone un lı́mite superior para el ancho de
banda alcanzable, aunque debemos aclarar que no se trata de un lı́mite exacto sino más
EN
Ruidos de Medición
La sensibilidad del control al ruido de medición es:
U (s) K(s)
Su (s) = = = K(s)S(s)
N (s) 1 + K(s)G(s)
IO
Lograr una ganancia elevada en el control para frecuencias altas implicarı́a una
amplificación del ruido de medición en ese rango de frecuencia, lo cual normalmente
se traduce en un alto nivel de ruido en la acción de control; llegando en ocasiones a
C
responder al ruido de medición con buena parte del rango de actuación.
Por lo tanto el ruido de medición en alta frecuencia impone también un lı́mite superior
para el ancho de banda alcanzable.
C
4.2.2. Restricciones Estructurales
RU
Estabilidad Interna
Cuando hablamos del lazo cerrado solemos pensar en la función de transferencia entre
referencia y salida T (s). Pero debe tenerse en cuenta que en el lazo cerrado hay varias
entradas, siendo la referencia solo una de ellas.
Debemos considerar perturbaciones y ruido de medición, y analizar también las
ST
exigencias del diseño sobre las acciones de control (pensando también a u(t) como
una salida de interés).
En la subsección 2.3.2 se han definido las sensibilidades del lazo SISO estándar, cuya
estructura repetimos en la figura 4.3.
En particular debe tenerse en cuenta que la estabilidad de lazo cerrado no implica solo
N
def.5.1, p. 125]).
Diremos que el lazo SISO es internamente estable si las sensibilidades básicas S(s),
C
Sistemas de Fase No Mı́nima Los sistemas de fase no-mı́nima son aquellos que
tienen polos y/o ceros en el semiplano-derecho.
La designación surge por el hecho de que en su respuesta en frecuencia la gráfica de
ganancia coincide con la del sistema equivalente con todos sus polos y ceros en el
semiplano izquierdo, pero el atraso de fase es mucho mayor al de este último. En la
figura 4.4 se ilustra esto con un ejemplo.
N
manteniendo el compensador bipropio.
Lo que estamos planteando al hacer esto es que parte del control “invierta” una parte de
la dinámica de la planta.
IO
Si bien este es un recurso viable, debe usarse con precaución al trabajar con plantas de
fase no mı́nima.
Supongamos que p sea un polo de la planta y un cero del control; es decir G(p) = ∞
C
y K(p) = 0. Entonces podemos escribir las funciones de transferencia de la planta y el
compensador de la siguiente forma:
1 B(s) P̄ (s)
C
G(p) = , K(p) = (s − p)
s − p Ā(s) L(s)
s + 0,8 −s + 0,8
Figura 4.4: Polos-ceros y respuesta en frecuencia para G1 (s) = 7,5 (azul) y G2 (s) = 7,5 (rojo)
(s + 2)(s + 3) (s + 2)(s + 3)
P̄ (s) 1 B(s)
(s − p)
L(s) (s − p) Ā(s) P (s)B(s)
T (s) = =
P̄ (s) 1 B(s) L(s)Ā + P̄ (s)B(s)
1 + (s − p)
L(s) (s − p) Ā(s)
N
Pero el polinomio de lazo cerrado resulta:
IO
o bien:
(s − p) P̄ (s)B(s) + L(s)Ā(s) = 0
Aunque en las funciones de sensibilidad S(s) y T (s) este polo no sea visible, el lazo
C
cerrado tendrá un polo en p.
Por lo tanto la estrategia de control con cancelación es válida en tanto p sea un polo
estable para eliminarlo de S(s) y T (s), pero no desaparece del lazo cerrado. Por ejemplo:
C
Y (s) B(s)
Si (s) = = G(s)S(s) =
Di (s) (s − p) L(s)Ā + P̄ (s)B(s)
RU
Si p es un polo inestable (p > 0), la cancelación no es válida porque el lazo cerrado
no serı́a internamente estable. Por lo tanto podemos afirmar que si el lazo cerrado es
estable, no puede haber cancelaciones entre polos y ceros en el semiplano derecho.
1
S(s) =
1 + K(s)G(s)
Y (s) K(s)G(s)
T (s) = =
R(s) 1 + K(s)G(s)
O
S(s) + T (s) = 1
1 1
S(p) = = =0 , T (p) = 1 − S(p) = 1
1 + K(p)G(p) 1 + K(p) ∞ ejθ
N
z > 0 , G(z) = 0 → T (z) = 0 , S(z) = 1 (4.13)
Estas son restricciones de interpolación impuestas para la dinámica de lazo cerrado con
IO
dinámicas de fase no mı́nima en el lazo abierto.
C
E(s) = L {e(t)} =
0
Supongamos que el lazo abierto tenga un polo inestable p (p > 0), con lo cual S(p) = 0.
C
Entonces, independientemente del control se verifica que:
Z ∞
E(p) = S(p)R(p) = 0 → e(t)e−pt dt = 0
0
RU
Como e−pt > 0 ∀t > 0, para que la integral sea nula el error e(t) necesariamente tiene
cambiar de signo. Si consideramos una referencia escalón, la respuesta necesariamente
tendrá sobrepaso.
Supongamos que:
1
C
G(s) =
(s − 1)(s + 2)
Analicemos dos casos, el segundo con ancho de banda igual al doble del primero:
K1 (s) = → T1 (s) =
s(s + 4,4) (s + 2)(s2 + 1,4s + 1)
23(s + 1)(s + 0,6957) 23(s + 0,6957)
K2 (s) = → T2 (s) =
s(s + 7,8) (s + 4)(s2 + 2,8s + 4)
En la siguientes figuras se ven las respuestas al escalón.
Z ∞
Y (s) = L {y(t)} = y(t)e−st dt = T (s)R(s)
0
Supongamos que el lazo abierto tenga un cero de fase no mı́nima z (z > 0), con lo cual
T (z) = 0. Entonces:
N
Z ∞
Y (z) = T (z)R(z) = 0 → y(t)e−zt dt = 0
O
Como e−zt > 0 ∀t > 0, para que la integral sea nula la salida y(t) necesariamente tiene
cambiar de signo, independientemente de lo que sea el control. Si consideramos una
C
dominante de lazo cerrado debe ser más lenta que los ceros de fase no mı́nima del lazo
abierto para evitar subvalores exagerados.
N
0,3125(s + 3)(s + 2) −0,3125(s − 0,8)
K2 (s) = → T2 (s) =
s(s + 1,312) (s + 0,5)2
IO
En la siguientes figuras se ven las respuestas al escalón.
C
C
RU
ST
N
Si la planta tuviera ceros de fase no mı́nima lentos y polos inestables rápidos, el control
se torna inviable. En esos casos es necesario recurrir a estructuras de control con más
C
de un grado de libertad.
Integrales de la Sensibilidad
Además de la restricción estructural entre S y T de la ecuación (2.5) existen otras
EN
donde pk son los polos inestables de lazo abierto. El lı́mite en el lado derecho se anula
si el lazo abierto es de grado relativo 2 o superior .
Evidentemente en el caso de plantas estables de grado relativo mayor a 1:
N
Z ∞
ln |S(jω)|dω = 0 (4.15)
0
IO
De esto surge que todo intento de disminuir la sensibilidad en una cierta banda de
frecuencia tendrá siempre su correlato como incremento en otra. Esto se conoce como
“efecto de la cama de agua” (waterbed effect).
C
Como la función de sensibilidad se corresponde con un filtro pasa-altos, en baja
frecuencia el logaritmo natural de su magnitud es negativo. Por lo tanto en alguna región
de la banda de paso su ganancia deberá ser mayor de 1 (amplificación), y esto será más
C
severo si el lazo abierto tiene polos inestables.
Naturalmente el balance de la integral ante una disminución de la sensibilidad en alguna
banda se podrı́a lograr con un incremento pequeño pero sostenido de la sensibilidad en
RU
alta frecuencia, ya que la parte positiva de la integral se extiende hasta el infinito.
dos alternativas para la elección del lazo cerrado T (s): Un filtro de Butterworth y uno de
Bessel, ambos de orden 3 y con el mismo ancho de banda. Por ejemplo, para un ancho
de banda de 2s−1 :
8 21,95
Fbutt (s) = , Fbess (s) =
(s + 2)(s2 + 2s + 4) (s + 2,64)(s2 + 4,18s + 8,33)
N
Podemos fácilmente evaluar como quedarı́a la función de sensibilidad para cada caso
con el siguiente código:
O
clear; clc
[B,A] = butter(3, 2, 's'); F1 = tf(B,A); S1 = 1 - F1;
[B,A] = besself(3, 2.8) ; F2 = tf(B,A); S2 = 1 - F2;
C
Segunda Integral de Bode Para lazos abiertos con un cero de fase no-mı́nima z se
verifica que:
Z ∞ np
Y pk + z
O
x x
w(z, ω) = 2 + 2 (4.18)
x2 + (y − ω) x2 + (y + ω)
La función w(z, ω) decae rápidamente para ω > z , lo cual evidencia la dificultad de llevar
la frecuencia de paso a valores superiores al cero de fase no mı́nima.
El tema puede profundizarse en [SP01, sec.5.3.2,p. 164]
Robustez
N
En el diseño de sistemas de control automático trabajamos con modelos de la dinámica
de la planta para realizar la sı́ntesis de los parámetros del controlador.
IO
Estos modelos excluyen deliberadamente las caracterı́sticas dinámicas que asumimos
irrelevantes para el diseño. Pero en muchas ocasiones se presentan otros aspecto de la
dinámica real que no podemos modelar, o que solo puede hacerse de forma aproximada.
Debemos asumir que siempre existirá un cierto nivel de incertidumbre en el modelo.
C
Aun ası́ pretendemos que el sistema de control sea capaz de garantizar mı́nimamente
estabilidad de lazo cerrado, y de ser posible también un desempeño mı́nimo para cumplir
los requerimientos del diseño.
C
La Teorı́a de Control Robusto aborda esta problemática de forma explı́cita, estableciendo
pruebas para garantizar la estabilidad robusta y el desempeño robusto; y métodos de
sı́ntesis para intentar alcanzar estos objetivos.
RU
4.3.1. Incertidumbre en el Modelo
En [SP01] se listan algunos orı́genes de esta incertidumbre:
parámetros en el modelo que solo se conocen de forma aproximada
parámetros en los modelos lineales que cambian para diferentes condiciones de
ST
equilibrio
en modelos temporalmente invariantes para dinámicas que no lo son habrá
parámetros que cambian con el tiempo
distorsiones relacionadas con sensores y actuadores
dinámica de alta frecuencia desconocida o difı́cil de modelar
N
Cuando la incertidumbre está asociada a los polos de un proceso SISO puede resultar
conveniente usar un modelo multiplicativo inverso:
O
1
G(s) = G0 (s) , |δ| < 1 (4.20)
1 + δW∆ (s)
C
N
|L0 (s)|
1> |W∆ (s)|
|1 + L0 (s)|
IO
Por lo tanto podemos decir que la condición de estabilidad robusta para un modelo con
incertidumbre multiplicativa global es:
C
Podemos replantear esto como:
C
|W∆ (s)| < |T0 (jω)|−1 (4.22)
−1
|1 + L0 (s) [1 + δWI (s)] | > 0 ∀|δ| < 1
de lo cual:
|S0−1 (s)WI (s)| < 1 (4.24)
EN
N
La inversa de la función de peso WS jω) impone una cota superior para la función de
sensibilidad, y sabemos que la inversa de la sensibilidad es la distancia entre la traza de
Nyquist de lazo abierto y el punto −1.
IO
Por lo tanto para lograr desempeño robusto es necesario que para una dada frecuencia
ω toda la famila de modelos se encuentre a una distancia mayor a WS (jω) respecto del
−1. Podemos pensar la función de peso como un radio de exclusión centrado en el −1
para la traza de lazo abierto, como se muestra en la figura 4.7.
C
Para evaluar desempeño robusto podemos modificar la condición de estabilidad robusta
exigiendo no una distancia mayor a 0 respecto del −1 en la gráfico de Nyquist, sino
mayor a |WS (jω)|:
C
|T0 (jω)W∆ (s)| < 1 − |WS−1 (jω)S0 (jω)|
RU
lo cual equivale a:
Lectura Adicional
En [SP01]:
Sı́ntesis de Compensadores
O
P (s) B(s)
K(s) = , G(s) =
L(s) A(s)
N
El polinomio de lazo cerrado será:
IO
Igualando coeficientes obtenemos un conjunto de 2(n − 1) ecuaciones lineales para
definir los coeficientes del compensador.
C
Veamos el ejemplo 7.1 de [GGS01]:
1
G(s) =
C
s2 + 3s + 2
El compensador será de orden 1. Entonces:
RU
Alc = s2 + 3s + 2 (l1 s + l0 ) + (p1 s + p0 )
Igualando coeficientes:
l1 = 1
3l1 + l0 = 3
N
2l1 + 3l0 + p1 = 3
2l0 + p0 = 1
O
3 1 0 0 l0 3
2
=
3 1 0p1 3
0 2 0 1
p0 1
EN
De esto obtenemos l1 = 1, l0 = 0, p1 = 1, p0 = 1:
s+1
K(s) =
s
que equivale a un controlador PI.
l
n−1
...
c2n−1
l0
..
M̄e (A, B) = . (4.28)
pn−1
N
c0
..
.
p0
IO
en donde M̄e es una matriz que obtenemos eliminando la fila 1 y las columnas 1 y n + 1
de la matriz eliminante de Silvester Me para los poliniomios A(s) y B(s):
an 0 ··· 0 bn 0 ··· 0
C
a
n−1 an ··· 0 bn−1 bn ··· 0
.. .. .. .. .. .. .. ..
. . . . . . . .
C
Me (A, B) = a0 a1 ··· an b0 b1 ··· bn (4.29)
0
a0 ··· an−1 0 b0 ··· bn−1
.
RU
. .. .. .. .. .. .. ..
. . . . . . . .
0 0 ··· a0 0 0 ··· b0
function M = sylm(A, B)
n = length(A);
m = 2*n;
Me = zeros(m-1, m);
for k=1:n
Me(k:n+k-1, k) = A';
N
N = length(A);
Me = sylm(A, B);
% eliminamos la fila 1
Me(1,:) = [];
EN
N
compensador para ese modelo aumentado.
El compensador resultante será estrictamente propio, ya que al denominador del
compensador bipropio computado con este enfoque deberá ser convolucionado con el
IO
término adicional.
Sin embargo, es posible reducir el orden del lazo cerrado en una cantidad igual al orden
m del termino que hemos forzado en L, y obtener un control bipropio. Hacemos esto
reduciendo en m el orden del denominador en el compensador asumiendo P de orden
m veces mayor a L, eligiendo un lazo cerrado de orden 2n + m − 1.
C
En el ejemplo 7.3 de [GGS01] se tiene una planta inestable dada por:
C
1
G(s) =
s−1
RU
pero se desea seguir una referencia senoidal de frecuencia 2rad/s sin error en estado
estacionario. De acuerdo al principio del modelo interno, para el control debe incluir un
modelo de la perturbación, que en este caso serı́a:
k
R(s) =
s2 + 4
ST
ajustables, que permiten obtener cualquier polinomio mónico de orden 3 que se desee.
Para ello el orden de L̄(s) serı́a 0, y por lo tanto podemos adoptar L̄(s) = 1.
Con esto:
p2 s2 + p1 s + p0
C
K(s) =
s2 + 4
Eligiendo para el lazo cerrado:
Alc = s2 + 4s + 9 (s + 10)
EN
15s2 + 45s + 94
K(s) =
s2 + 4
K(s)G(s)
T (s) = = Fq (s)
N
1 + K(s)G(s)
Despejando:
IO
K(s)G(s) = Fq (s) [1 + K(s)G(s)]
= Fq (s) + Fq (s)K(s)G(s) → K(s) [G(s) − Fq (s)G(s)] = Fq (s)
Finalmente:
C
Fq (s) 1
K(s) = (4.30)
1 − Fq (s) G(s)
C
Si:
B(s) N (s) N (s)/D(s) A(s)
G(s) = , Fq (s) = → K(s) =
A(s) D(s) 1 − N (s)/D(s) B(s)
RU
y por lo tanto:
N (s) A(s)
K(s) = (4.31)
D(s) − N (s) B(s)
Para que el compensador sea bipropio, el grado relativo de Fq (s) debe ser igual al de la
ST
De la ecuación (4.31) puede notarse que con este enfoque el compensador tendrá como
ceros los polos de G(s) y los ceros de Fq (s), mientras que sus polos serán los ceros
de G(s) y las raı́ces de D(s) − N (s). Vemos que de forma indirecta esto nos lleva
O
K(s)G(s)
T (s) = = Q(s)G(s)
1 + K(s)G(s)
Por lo tanto, el control para obtener una dinámica inversa Q(s) es:
K(s) = Q(s) [1 + K(s)G(s)] = Q(s) + K(s)G(s)Q(s)
N
de lo cual:
Q(s)
K(s) =
1 − Q(s)G(s)
IO
Podrı́a usarse Q(s) como un control con modelo predictivo, en el cual solo realimentamos
el error de predicción:
C
C
RU
Si queremos que T (s) se ajuste a un modelo de lazo cerrado Fq (s) se tendrı́a:
Q(s)G(s) = Fq (s) → Q(s) = Fq (s)G−1 (s)
ST
Entonces a partir de elegir Fq (s) determinamos la dinámica inversa Q(s), y con esta el
control K(s) para implementar una realimentación de la salida.
Q(s)
Su (s) = K(s)S(s) = [1 − Q(s)G(s)] = Q(s) = Fq (s)G−1 (s)
1 − Q(s)G(s)
C
Claramente resulta necesario elegir Fq (s) estable, con lo cual T (s) y S(s) resultan
estables.
Pero en la tercer ecuación se observa que si la planta tiene un polo inestable p, es
necesario elegir Fq (s) tal que S(p) = 0, o bien Fq (p) = 1.
Y de la cuarta ecuación se observa que para lograr estabilidad interna Su (s) = Q(s)
EN
debe ser estable. Por lo tanto, todo cero de fase no mı́nima de G(s) deberá ser cero de
Fq (s) para que no aparezca como polo de Q(s).
En sı́ntesis, para polos p y ceros z de fase no mı́nima de la planta se debe cumplir que:
Fq (p) = 1 , Fq (z) = 0
que es lo mencionado previamente.
N
Para que el control no tenga ceros en el origen es necesario que el polinomio D(s)−N (s)
tenga k raı́ces en el origen, lo cual implica que los últimos k coeficientes deben ser nulos.
Esto implica que Fq (s) se debe elegir de forma tal que el numerador coincida con los
IO
últimos k términos del denominador.
C
G(s) =
s2
y elegimos:
C
a0
Fq (s) =
s2 + a1 s + a0
en donde el numerador es igual al último término del denominador, de forma tal que
RU
Fq (0) = 1. El control resulta:
a0 a0
K(s) = s2 = s
s2 + a1 s + a0 − a0 s + a1
Con este la función de sensibilidad de entrada resulta:
ST
1 s (s + a1 ) s + a1 1
S(s) = = 2 → Si (s) = G(s)S(s) =
a0 s 1 s + a1 s + a0 s2 + a1 s + a0 s
1+
s + a1 s2
Vemos que este lazo es incapaz de rechazar perturbaciones de entrada, y que no es
internamente estable. Resulta claro que el compensador no puede tener un cero en el
N
Para evitar esto elegimos para el numerador los últimos dos términos del denominador,
O
s3 + a2 s2 + a1 s + a0
con lo cual
a1 s + a0 a1 s + a0
K(s) = s2 =
s3 + a2 s2 + a1 s + a0 − a1 s − a0 s + a2
EN
Con esto:
1 s2 (s + a2 )
S(s) = = 3
a1 s + a0 1 s + a2 s2 + a1 s + a0
1+
s + a2 s2
s2 (s + a2 ) 1 s + a2
Si (s) = = 3
s3 + a2 s2 + a1 s + a0 s2 s + a2 s2 + a1 s + a0
Si queremos forzar acción integral para rechazar perturbaciones constantes de entrada
serı́a necesario agregar un término adicional en el numerador y expandir en un orden
más el denominador.
N
Polos Indeseables Se puede notar que lo dicho anteriormente es equivalente a
IO
considerar los polos en el origen de la planta como dinámica de fase no mı́nima, aunque
no lo sea.
Podemos aplicar el mismo tratamiento para los polos inestables a la dinámica lenta de la
planta o cualquier polo que por alguna razón sea indeseable para el lazo cerrado.
C
Esto implica que si p es un polo indeseable (inestable o no), para que no aparezca en el
lazo cerrado será necesario elegir Fq tal que Fq (p) = 1.
Y si p tiene multiplicidad k , entonces será necesario elegir Fq tal que Sq (s) = 1 − Fq (s)
C
tenga un cero en p con la misma multiplicidad k .
4.4.3. Loop-Shaping
ST
los efectos del ruido de medición (de alta frecuencia). Esto implica además mayor
robustez en relación a la incertidumbre dinámica de alta frecuencia.
Podemos observar que la compensación se traduce en una técnica de “conformado
C
del lazo abierto” (loop shaping) para lograr alta ganancia en baja frecuencia, un atraso
moderado en la frecuencia de cruce, y baja ganancia en frecuencias superiores.
e=0·r+0·d+0·n
lo que implica |L| ≫ 1 para los primeros dos términos y |L| = 0 para el tercero.
Evidentemente esto genera un conflicto, pero lo salvamos tratando de lograr lo primero
en baja frecuencia y lo segundo en alta.
N
Además de los requerimientos por desempeño debemos cumplir con los de estabilidad
relativa.
El atraso de fase para una determinada frecuencia ω se encuentra estrechamente
IO
relacionada con la pendiente de la curva de ganancia a esa frecuencia. Podemos
decir que si para una frecuencia ω la pendiente de |L(jω)| es n, el atraso de fase es
aproximadamente −n · 900 [SP01, p. 20].
C
En la siguiente gráfica se muestran los valores asintóticos de pendiente y atraso de fase
para la función de transferencia, donde se comprueba la afirmación anterior:
30(s + 1)
C
G(s) =
(s + 10)(s + 0,01)2
RU
ST
N
O
C
EN
Una pendiente −1 (−20 db/dec) implica un atraso de fase de 900 , mientras que una
pendiente −2 se corresponde con un atraso de 1800 .
En la frecuencia de cruce el atraso deberı́a ser del orden de los 1200 o menor, lo cual
implica una pendiente mayor que −1,5; pero no nula porque no habrı́a cruce. Para lograr
alta ganancia en baja frecuencia, la pendiente para frecuencias menores a la de cruce
deberı́a ser más negativa; pero obviamente no podrá ser mas negativa de −2. Para alta
N
Un método de este tipo es el propuesto por McFarlane y Glover en 1990; en el cual se
busca ajustar un compensador para aproximar la forma deseada para el lazo abierto
maximizando la robustez de la solución. Esta estrategia se conoce como loop shaping
IO
H∞ y se encuentra desarrollado en [SP01, sec.9.4, p. 382] para el caso multivariable.
C
Sistemas con Retardo
C
4.5.1. Dinámicas con Retardo
RU
El retardo está presente en la mayorı́a de los sistemas reales. Este puede ser causado
por:
Un retardo importante implica una dificultad para el sistema de control. Las dificultades
son provocadas principalmente porque el efecto de las perturbaciones demora para ser
sentido, la acción de control demora para causar efecto en la variable controlada y porque
la acción de control se calcula con base en un error pasado.
N
O
C
EN
(a) Se calienta agua usando quemador de gas natural y se (b) Se usa vapor para calentar y evaporar el agua del jugo de caña Se controlan los
mide la temperatura del agua a la salida niveles en cada evaporador
4.5.2. Modelado
ST
Y (s)
P (s) = = G(s)e−sL (4.32)
U (s)
C
lineales su transformada de Laplace no es una función racional:
C
Es obvio que la ganancia de este operador es 1 para todo valor de frecuencia ω , pero a
diferencia de los otros modelos el atraso de fase no está acotado:
RU
|D(jω)| = 1 , ∠D(jω) = −Lω (4.34)
Puede notarse que el atraso es de 1800 para una frecuencia ω = π/L, duplicándose
con cada octava. El retardo de transporte es una dinámica de fase no-mı́nima
correspondiente al caso de fase mı́nima G(s) = 1.
ST
Una aproximación simple para la transformada de Laplace del retardo es utilizar un polo
o un cero:
1
e−sL ≈ Dp (s) = , e−sL ≈ Dz (s) = 1 − L s (4.35)
Ls + 1
N
Sin embargo, esto sirve para ω ≪ L. Es posible lograr una aproximación exacta para la
ganancia y más ajustada para la fase recurriendo a una expansión de Padè. La expresión
genérica para expandir una función f (x) es:
O
a0 + b1 x + b2 x2 + · · · + pm xm
f (x) ≈ R(x) = (4.36)
1 + a1 x + a2 x2 + · · · + an xn
C
R(0) = f (0)
R′ (0) = f ′ (0)
EN
C
Esta aproximación se puede computar con el comando pade( ).
(4.38)
2 + sL
Al igual que el retardo, esta función racional tiene ganancia unitaria en todo el espectro
de frecuencias, y da una aproximación razonable para el atraso de fase mientras la
frecuencia no sea demasiado grande, como se puede observar en la figura 4.10.
En la figura 4.11 se comparan las respuestas al escalón de estas aproximaciones. Puede
N
e−(L0 +∆L) s
WL (s) = −1
e−L0 s
= e−∆L s − 1 (4.40)
C
4.5.3. Predictor de Smith
Para una planta descripta por el modelo (4.32) proponemos como esquema de control
RU
“ideal” el mostrado en la siguiente figura:
ST
C
retardo y la respuesta será la que se planteó en la ecuación (4.41).
C
RU
ST
Para analizar lo que ocurre en el caso real vamos a computar el control equivalente
Ceq (s), que surge del control nominal C(s) combinado con el predictor:
N
O
C
Para llegar a esto reestructuremos el diagrama del control con predictor de la siguiente
EN
forma:
IO
C(s)
C ′ (s) =
1 + C(s)Gn (s)
Entonces:
C
C(s)
C ′ (s) 1 + C(s)Gn (s)
Ceq (s) = =
C
1 − C ′ (s)Pn (s) C(s)
1− Pn (s)
1 + C(s)Gn (s)
C(s)
=
RU
1 + C(s)Gn (s) − C(s)Pn (s)
lo que arroja finalmente:
C(s)
Ceq (s) = (4.42)
1 + C(s) [Gn (s) − Pn (s)]
ST
C(s)
Ceq (s) = (4.43)
1 + C(s)Gn (s) [1 − e−sLn (s)]
N
un retardo (que de ser pequeño eventualmente podrı́a sustituirse por una aproximación
racional).
C
Y (s) C(s)G(s)
= e−sL (4.44)
R(s) 1 + C(s)Gn (s) + C(s) [P (s) − Pn (s)]
N
= P (s) (4.46)
Q(s) 1 + C(s)Gn (s) + C(s) [P (s) − Pn (s)]
Puede notarse que los polos lentos de P (s) también lo serán para la respuesta a la
IO
perturbación.
C
C
RU
ST
= (4.48)
Q(s) 1 + C(s)Gn (s) + C(s)Fr (s) [P (s) − Pn (s)]
La ecuación caracterı́stica de lazo cerrado es:
O
El filtro agrega el grado de libertad necesario para lograr mayor robustez y estabilidad
C
interna. El control C(s) se diseña igual que antes para la planta sin retardo, mientras que
el filtro Fr (s) se diseña para la respuesta ante una perturbación (ver [JENR09]).
Estructuras Especiales
EN
4.6.1. Anti-Windup
Al implementar un sistema de control que incluya acción integral es necesario considerar
el efecto denominado “wind-up del integrador”, e incluir formas de mitigarlo en caso que
esto pudiera ser un inconveniente. Veamos primero cual es el problema.
N
un escenario no habitual pero posible.
IO
Consideremos el caso de una planta G(s) a lazo cerrado con un compensador K(s):
C
C
2 4,5 s2 + s + 1
G(s) = 2 , K(s) = (4.50)
s +s+1 s (s + 5,196)
RU
En la siguiente figura vemos la respuesta al escalón sin saturación (azul) y con saturación
(rojo).
ST
N
O
C
EN
N
IO
donde:
k∞ = lı́m K(s) , H(s) = K(s)−1 − k∞
−1
(4.51)
s→∞
Si calculamos el bloque equivalente de la parte recuadrada en celeste tenemos que:
C
k∞ k∞ k∞
K̄(s) = = = ≡ K(s)
1
1 + k∞ H(s) 1 1
C
1 + k∞ − 1 + k∞ −1
K(s) k∞ K(s)
N
Debe notarse que para una implementación digital no es necesario plantear este
esquema, dado que el windup se puede evitar en la programación del compensador.
IO
4.6.2. Control con Dos Grados de Libertad
Filtro de Referencia
C
Ya hemos mencionado en la subsección 3.4.3 que la sensibilidad complementaria T (s)
se puede ajustar mediante un filtro de referencia Fr (s) como se muestra en la siguiente
figura:
C
RU
ST
Es evidente que:
Y (s) Y (s)
N
Podemos incluir polos en el filtro para cancelar los ceros de T (s) cercanos al origen y
O
efecto sobre las sensibilidades para las otras entradas del sistema.
C
Si los polos de Fr (s) se eligen más rápidos que el ancho de banda de la referencia, su
presencia no impactará en el efecto buscado, que es eliminar el error de seguimiento.
C
Para perturbaciones medibles podemos incluir la “pre-alimentación” Gdf (s), que
permitirı́a cancelar la perturbación eligiendo Gdf (s) = G1 (s)−1 .
RU
Naturalmente en este caso se aplica la misma observación respecto del grado relativo
de esta función de transferencia:
Control en Cascada
ST
En muchos casos la tarea del control implica lidiar simultáneamente con modos lentos
y rápidos de la dinámica de la planta. En ese caso es conveniente recurrir al control en
cascada:
N
O
C
EN
El lazo interno (enmarcado en lı́nea azul discontinua) pasa a formar parte del modelo de
planta para el lazo externo:
IO
alta frecuencia, es decir, para el lazo externo Ti (s) ≈ 1. Ası́, el diseño del lazo externo
Te (s) se puede realizar asumiendo Ti (s)Ge (s) ≈ Ge (s). Esto implica diseñar Ke (s) con
un modelo más sencillo, resultando en un compensador más simple.
C
Además puede notarse que las perturbaciones en el lazo interno se propagarán al
externo como señales equivalentes a la entrada de la forma Di (s) = Si (s)D1 (s), donde
Si = 1 − Ti . Al ser Ti (s) mucho más rápido que Te (s), en el ancho de banda de este
C
último |Si (jω)| ≈ 0, con lo cual esas perturbaciones no afectarán significativamente la
salida del lazo externo.
RU
Si tal separación en escala de tiempos (o frecuencias) no es tan significativa, el modelo
de planta para el lazo externo será Ti (s)Ge (s). De todas formas, en este caso el control
en cascada podrı́a usarse igualmente para permitir por ejemplo limitar variables internas
del proceso, en este caso, Yi ; introduciendo saturaciones u otros acondicionamientos en
la referencia interna Ri . Esto equivale a saturar estados internos del proceso a controlar.
ST
Controladores Digitales
4.7.1. Control en Tiempo Discreto
Un sistema de control digital opera en tiempo discreto. Esto significa que las acciones de
N
utilizar una aproximación lineal, o retención de primer orden (FOH por first order hold);
pero como se muestra en la figura 4.12b esta no es equivalente a una interpolación lineal
entre los valores en los extremos del intervalo, ya que el extremo futuro en tiempo real
no se conoce.
EN
La acción de control también podrı́a ser de tipo impulsiva (sin retención), es decir, tomar
valores en los instantes de muestreo durante tiempos breves y permanecer nula en el
resto del intervalo de muestreo.
N
tiempo real
IO
(a) Muestreo y retención de orden cero
C
LEO o GEO luego de la inyección orbital, en la cual se realiza el encendido del motor
en el apogeo de cada órbita durante un breve intervalo de tiempo (en relación al perı́odo
orbital, que serı́a el tiempo de muestreo).
C
4.7.2. Diseño en Tiempo Discreto
RU
Es posible plantear lo visto para el caso continuo a tiempo discreto utilizando modelos
de tiempo discreto (ver apéndice A.1.4) con la retención correspondiente a la entrada
de los modelos de planta; y mapear el análisis de polos y ceros del plano s al plano z
mediante ecuación (A.19).
Para la discretización hay que considerar la dinámica de la planta y la retención.
ST
Y (s)
G(z) = Z {RET (s) · G(s)} , G(s) =
U (s)
En el caso de retención de orden cero:
1 − e−ts s
ZOH(s) = (4.52)
N
s
En ese caso la salida del control el modelo de tiempo discreto para el diseño puede
obtenerse como:
O
−1
G(s)
G(z) = Z {ZOH(s) · G(s)} = 1 − z Z (4.53)
s
C
N
Distribuyendo
IO
bn sn E(s) + bn−1 sn−1 E(s) + · · · + b1 sE(s) + b0 E(s)
Teniendo en cuenta que la variable s se corresponde al operador derivada en el dominio
del tiempo podemos decir que:
C
u(n) + an−1 u(n−1) Y (s) + · · · + a1 u̇ + a0 y =
bn e(n) + bn−1 e(n−1) + · · · + b1 ė + b0 e
C
Para la aproximación numérica existen diferentes metodologı́as (figura 4.13).
Una forma bastante obvia de discretizar un control continuo es reemplazar las derivadas
RU
en el compensador por diferencias finitas. Podemos plantear diferencias “hacia atrás”
(backward difference)
yk − yk−1
ẏ(t) ≈
ts
o hacia adelante (método de Euler)
yk+1 − yk
ST
ẏ(t) ≈
ts
U (s) s+b
K(s) = = kc
N
E(s) s+a
de lo cual
O
Llevando esta ecuación al dominio del tiempo (reemplazando s por el operador derivada):
C
yk − yk−1
ẏ(t) ≈
ts
y multiplicando ambos miembros por ts :
uk − uk−1 + ts a uk = kc ek − kc ek−1 + b ek
1
uk = [uk−1 + (kc + b) ek − kc ek−1 ]
1 + ts a
N
Podemos obtener el modelo de transferencia discreta correspondiente a la aproximación
por diferencias finitas hacia atrás sustituyendo la variable s en la función de transferencia
IO
continua con la siguiente relación [ÄW04, sec.8.3, p. 294]:
z−1
z = 1 + ts s → s= (4.54)
ts
C
Otra aproximación posible es la “transformada Bilineal” o de “Tustin”, que se corresponde
con el método de integración numérica trapezoidal:
2 z−1
C
2 + ts s
z= → s= (4.55)
2 − ts s ts z + 1
Esta última transformada da un sistema discreto con una respuesta en frecuencia muy
RU
similar al de tiempo continuo. Más aun, es posible introducir una corrección (“prewarp”)
para que a una determinada frecuencia ω1 las respuestas en frecuencia del modelo
discreto y el continuo correspondiente coincidan Kc (ω1 ) = Kd (ω1 ). La transformada de
Tustin con prewarp resulta [ÄW04, sec.8.3, p. 296]::
z−1 ω1
ST
que tenga la misma ganancia y fase que el continuo en el cruce de ganancia del lazo
abierto, preservando de esta forma los márgenes de fase y ganancia del diseño original
(ver [ÄW04, sec.8.2, p. 295]).
C
Figura 4.13: Respuesta al escalón y en frecuencia de modelos con diferente método de discretización para una dinámica de
EN
segundo orden.
N
En [ÄW04, sec.2.9, p. 66] se propone como criterio práctico elegir un tiempo de muestreo
del orden de 1/4 a 1/8 del de crecimiento. Puede notarse que esto conduce a valores
similares a lo establecido en función del ancho de banda.
IO
Para mantener una consistencia matemática en el proceso es necesario además
asegurar que todos los polos y ceros del modelo de lazo abierto y de de lazo cerrado
queden contenidos en la banda primaria en el plano s.
C
4.7.5. Implementación
Un control digital se implementa utilizando microcontroladores o microprocesadores de
C
uso general.
El control propiamente dicho no es más que una pequeña función dentro del código para
el procesador, que en general incluye muchas otras funciones tales como gestión del
RU
hardware, control de alarmas, configuración y comunicaciones, etc.
Independientemente del método utilizado para obtener el compensador discreto se tiene
que:
de lo cual
n
X n
X
uk = bj ek−j − aj uk−j (4.57)
j=0 j=1
N
Es posible utilizar simulink para verificar la implementación digital del compensador. Esto
se puede realizar con un bloque “MATLAB Function” introduciendo código para computar
IO
la ecuación (4.57). Por ejemplo, para un compensador de segundo orden:
% entradas:
% r: referencia
% y: salida de la planta
C
% salida:
% u: acción de control
% parámetros
C
% num : coeficientes del numerador
% den : coeficientes del denominador
% u max: lı́mite de actuación máxima
RU
% u min: lı́mite de actuación mı́nima
function u = fcn(r, y, num, den, u max, u min)
persistent e1 e2 u1 u2
e = r - y;
if isempty(e1)
ST
end
% cómputo con la programación directa
u = num(1)*e + num(2)*e1 + num(3)*e2 - (den(2)*u1 + den(3)*e3)/den(1);
O
e2 = e1;
e1 = e;
end
Se puede observar que, aunque el compensador se haya diseñado con acción integral,
no hay en el código una integración explı́cita del error. Esta integral existe de forma
N
implı́cita en los valores guardados de las acciones de control pasadas.
El mecanismo anti-windup surge simplemente de almacenar la acción de control actual
luego de saturarla.
IO
4.7.6. Efecto de la “Cuantización”
La “cuatización” inevitable en una implementación digital, ya sea originado en las
C
conversiones analógico-digitales o por errores de redondeo en los cómputos; y no puede
modelarse en un modelo lineal. Por lo tanto no está contemplada en los modelos de
tiempo discreto.
C
Esto en ciertas condiciones puede introducir oscilaciones de ciclo lı́mite, en general
de pequeña amplitud (ver [ÄW04, sec.9.6, p. 340]). Estos empeoran al degradar la
resolución de la conversión D/A a la salida del compensador.
RU
Es posible evaluar de forma aproximada sus efectos incluyendo un ruido blanco gausiano
a la salida del control con varianza δ 2 /12, siendo δ el intervalo de cuantización (ver
[ÄW04, sec.9.6, p. 344]).
ST
N
O
C
EN
IO
C
Control de Sistemas MIMO
C
RU
ST
N
O
C
EN
133
Figura 5.1: regulador por realimentación de estados
N
Realimentación de Estado
Supongamos que contamos con un modelo de estados para describir la dinámica del
IO
proceso a controlar:
ẋ = Ax + Bu + Bv v (5.1)
donde x ∈ Rn , u ∈ Rm es la acción de control y v ∈ Rp es el vector de perturbación.
Un control por realimentación de estados es aquel en el cual el vector de control u surge
C
de un mapeo estático del vector de estados x. En el caso lineal:
u = −Kx (5.2)
C
donde K ∈ Rm×n es la denominada matriz de realimentación de estados.
Obtenemos la dinámica de lazo cerrado reemplazando (5.2) en (5.1):
RU
ẋ = [A − BK] x + Bv v (5.3)
Ā = [A − BK] (5.4)
ST
Esto puede plantearse también para sistemas que varı́an en el tiempo (caso en el cual
las matrices en (5.1) dependen explı́citamente de t).
Controlabilidad
Formalmente se dice que “un sistema es completamente controlable en tiempo t0 si
C
Para entender que significa esto vamos a considerar un ejemplo de sistema que no
resulta completamente controlable.
N
θ̇ = ω
l
ω̇ = T sin δ
IO
J
Por otra parte, para la posición respecto de una terna geográfica:
ẋ = u
C
ż = w
T
u̇ = fx , fx = sin (θ + δ)
m
C
T
ẇ = fz − g , fz = cos (θ + δ)
m
RU
Linealizando para θ ≈ 0:
ẋ
0 0 0 1 0 x 0
0 0
ż 0
0 0 0 1 0 z 0
0
θ̇
0 0 0
0 0 1 θ
0
0
= + δ +
ST
0
u̇ 0 f 0 0 0 u f 0
− g
ẇ
0
0 0 0 0 0 w
0
f
ω̇ 0 0 0 0 0 0 ω τ 0
( ) " #( ) " #
ẋc Ac Acu xc Bc
= + u
ẋu 0 Au xu 0
C
El bloque nulo en la matriz de entrada indica que no hay efecto directo del control u
sobre ẋu , mientras que el bloque nulo en la matriz dinámica de debe al desacoplamiento
RU
dinámico de xu respecto de xc (que sı́ es afectado por el control), por lo cual tampoco
hay efecto indirecto.
El sistema serı́a completamente controlable si podemos manipular el empuje del motor
T , con lo cual la parte inferior de la matriz de entrada no serı́a nula.
Matriz de Controlabilidad
ST
k=0
Si elegimos como estado final el origen (el objetivo de nuestro regulador) x(tf ) = 0, con
lo cual:
C
Z tf
x(0) = − eA(t−τ ) Bu(t)dτ
0
n−1 Z tf
EN
X
k
=− A B αk (τ )u(τ )dτ
k=0 0
n−1
X
=− A k B βk
k=0
N
De lo cual se deduce que el sistema es completamente controlable si y solo si la matriz:
B | AB | A2 B | · · · | An−1 B
IO
(5.8)
C
f = 15;
r = 100; % valor arbitrario
C
A = [zeros(3) eye(3) ; zeros(3,6)] ; A(4,3) = f;
B = [0 0 0 f 0 r]';
rank(ctrb(A,B))
RU
lo cual arroja como resultado un valor 4, lo cual se corresponde a los cuatro estados
controlables antes mencionados.
Para el problema del regulador, a partir del lazo abierto (5.1) el modelo de lazo cerrado
serı́a:
ẋ = [A − BK] x + Bv v (5.9)
En este las entradas son las perturbaciones.
Si queremos que nuestro regulador además siga referencias (convertirlo en un
N
u = −K [x − xr ]
xr = Br r
EN
donde Br será una matriz con valores nulos para los estados no relevantes. Podrı́a
inclusive plantearse una ecuación de salida para definir las variables de interés y a partir
de esto definir Br :
y r = Cr x , Br = C+
r
donde C+ 1
r es la “pseudo-inversa” de Cr .
N
Con un vector de referencias la realimentación de estados tomará la forma:
u = −K [x − Br r]
IO
Sustituyendo en el modelo de lazo abierto obtenemos para el lazo cerrado:
C
Supongamos que planteamos el control de actitud θ en un plano para el ejemplo
precedente usando el modelo:
C
θ̇ = ω
l
ω̇ = T sin δ
J
RU
Tomando u = sin δ :
( ) " #( ) " #
θ̇ 0 1 θ 0
= + u
ω̇ 0 0 ω T l/J
ST
Acción Integral
O
er = r − y r = r − Cr x
Z t
ζ= er dτ
0
−1
1 Una pseudo-inversa posible es la de Moore-Penrose: H+ = HT H HT
IO
El estado expandido resulta:
( ) " #( ) " #( )
ẋ A 0 x B 0 u
= + (5.11)
ζ̇ −Cr 0 ζ 0 I r
C
En equilibrio ζ̇ = er = 0, por lo cual cualquier realimentación que estabilice el modelo
aumentado garantiza error nulo en estado estacionario.
C
La acción de control puede escribirse como:
( )
x
RU
u = − Kp Ki
ζ
Con esto último nos referimos a un modelo dinámico cuya salida ante una condición
de desequilibrio (o perturbación impulsiva) tenga la misma evolución temporal que la
perturbación.
O
ζ̇ = r
C
e = r − yr
EN
obteniendo la salida yr que debe seguir la referencia mediante una ecuación de salida
auxiliar de la forma:
y r = Cr x
Podemos plantear esto para referencias escalares o para un vector de referencias de la
misma forma.
ζ̈ = −ωr ζ + ωr e
N
ζ̈ −ωr 0 ζ̇ ωr
En el caso general:
IO
ζ̇ = Ar ζ + Br r
Lo que hacemos para incluir esto en la realimentación de estados es plantear una
realimentación de estados sobre un modelo aumentado combinando la dinámica de la
planta con el exo-sistema definido en la ecuación anterior, asociado a la perturbación o
C
referencia a rechazar:
( ) " #( ) " #( )
ẋ A 0 x B 0 u
= + (5.12)
C
ζ̇ −Cr Ar ζ 0 Br r
posible elegir K tal que la matriz dinámica de lazo cerrado (5.3) tenga cualquier conjunto
de autovalores que se desee.
Esto es muy simple para una planta de segundo orden con una acción de control escalar:
( ) " #( ) " #
ẋ1 a11 a12 x1 b1
= + u
ẋ2 a21 a22 x2 b2
N
( )
x1
u = − k1 k2
x2
C
N
Si elegimos n = 2 polos de lazo cerrado p1 y p2 , la ecuaciób caracterı́stica de lazo
cerrado deberı́a ser:
IO
(s − p1 ) (s − p2 ) = s2 − (p1 + p2 ) s + p1 p2
Igualando obtenemos un sistema de dos ecuaciones para ajustar las dos ganancias de
la matriz de realimentación de estados:
C
b1 k1 + b2 k2 = a11 + a22 − (p1 + p2 )
(b1 k2 − a12 ) (b2 k1 − a21 ) = p1 p2
C
Control Escalar - Forma Canónica Controlable
El cómputo de las ganancias de realimentación para el caso de una acción de control
escalar es simple si el modelo de estados se expresa en la forma canónica controlable.
RU
Por ejemplo, para el caso de segundo orden la forma canónica controlable serı́a:
( ) " #( ) " #
ż1 0 1 z1 0
= + u
ż2 a1 a2 z2 b
A(s) = s2 + a1 s + a2
Para esta forma, el polinomio de lazo cerrado con realimentación de estados [k1 k2 ]
resulta:
Alc (s) = s2 + (a1 + k2 ) s + (a1 + k2 )
N
Ar (s) = s2 + α1 s + α2
O
k2 = α1 − a1
C
k1 = α2 − a2
Esto se puede extender a cualquier caso de orden n.
kn = α1 − a1
EN
kn−1 = α2 − a2
..
.
k2 = αn−1 − an−1
k1 = αn − an
M = B | AB | A2 B | · · · | An−1 B
(5.14)
N
donde B es una matriz columna (en este caso arbitraria pero no nula); y la matriz T se
construye de la forma:
IO
an−1 an−2 ··· a1 1
a
n−2 an−3 ··· 1 0
. .. .. .. ..
W = .. . . . . (5.15)
C
a
1 1 ··· 0 0
1 0 ··· 0 0
C
siendo ak los coeficientes del polinomio caracterı́stico de la matriz A:
Para el caso de acción de control escalar existe una forma alternativa para este cómputo
denominada formula de Ackermann [Oga10, p. 730].
Control Multivariable
Para el caso de múltiples entradas u ∈ Rm no existe solución única para la ubicación
N
de polos. Por lo tanto en necesario introducir otros elementos para obtener una solución
cerrada.
O
casos mediante un cambio de coordenadas que permita obtener una forma canónica
controlable en bloques.
Una propuesta interesante es la de [JND85], en la cual se plantea un método de
ubicación de polos que minimiza la sensibilidad de los polos asignados a variaciones
EN
N
Antes de avanzar en el tema se debe advertir que la palabra ”óptimo” deberı́a
descartarse del vocabulario del ingeniero, dado que tal concepto indefectiblemente se
torna abstracto en cualquier aplicación práctica, y en general solo es aplicable en el
IO
campo de las matemáticas.
C
cuantificar. Lo que ofrece es una herramienta que se usa de forma iterativa para obtener
soluciones con un balance adecuado entre ”velocidad de respuesta” y ”esfuerzo de
control”, lo cual resulta generalmente en soluciones ”robustas”.
C
Índice de Desempeño Cuadrático
Como en todo problema de optimización, la cuestión central es la de definir un ı́ndice
RU
de desempeño adecuado. Este debe ser una cantidad definida positiva que resulte
fı́sicamente significativa y matemáticamente tratable.
En control automático el objetivo general es el de llevar la planta a una determinada
condición estacionaria con el menor esfuerzo posible. Esto puede cuantificarse mediante
un ı́ndice de desempeño cuadrático de la forma:
Z t
ST
xT Qx + uT Ru dt
J(t) = (5.18)
0
ẋ = Ax + Bu (5.19)
O
u = −Kx
C
siendo:
K = R−1 BT P (5.20)
donde la matriz P es solución de la siguiente ecuación algebraica de Ricatti:
EN
h i
AT P + PA − P BR−1 BT P + Q = 0 (5.21)
para la cual se cuenta con algoritmos de cómputo bien establecidos (ver comando are).
2 Una matriz H es positiva definida si la forma cuadrática V (x) = xT Hx > 0 ∀x ̸= 0. Esto se cumple si es real simétrica
con todos sus menores principales son positivos (y en consecuencia todos sus autovalores son positivos)
N
El término entre paréntesis es una forma cuadrática que podemos reescribir de la
siguiente forma:
IO
d
xT Q + KT RK x = − xT Px (5.22)
dt
Con lo cual:
J(t) = −xT Px (5.23)
C
Desarrollando el lado derecho de la ecuación (5.22), y teniendo en cuenta que a lazo
cerrado ẋ = (A − BK) x:
C
d T
− x Px = −ẋT Px − xT Pẋ
dt
T
= −xT (A − BK) Px − xT P (A − BK) x
RU
h i
T
= −xT (A − BK) P + P (A − BK) x
Como el lado derecho es una matriz negativa definida (el término dentro del paréntesis
es, por definición, positivo definido) y el lazo cerrado es estable, esta ecuación de
Liapunov tiene una solución P positiva definida.
Por otra parte, como R es una matriz real simétrica, se puede escribir como R = TT T,
y con esto:
N
T
(A − BK) P + P (A − BK) + Q + KT TT TK = 0
O
desarrollando y reagrupando:
h i
AT P + PA + Q + KT TT TK − KT BT P − PBK = 0
C
N
En la práctica los coeficientes en las matrices del ı́ndice de desempeño suelen ser un
IO
tanto arbitrarios, dado que en general no hay razones sólidas para establecerlos. Pero si
hay criterios para ajustarlos de forma iterativa hasta alcanzar una solución satisfactoria;
entendiendo esto último como lazos cerrados robustos que muestren respuestas rápidas
a los desequilibrios, con acciones de control dentro del rango admisible.
C
Selección de las Matrices para el Índice de Desempeño
Si Q y R son matrices diagonales con coeficientes qj , j = 1 : n y rj , j = 1 : m
respectivamente, el ı́ndice será de la forma:
C
Z t
q1 x21 + q2 x22 + · · · + qn x2n + r1 u21 + r2 u22 + · · · + rn u2n dt
J(t) =
0
RU
= q1 I12 + q2 I22 + · · · + qn In2 + r1 J12 + · · · + r1 Jm
2
(5.25)
0 0
El mı́nimo se alcanza cuando todos los sumandos qk Ik2 y rk Jk2 en (5.25) son iguales, lo
que pone en evidencia el balance entre desequilibrio (x ̸= 0) y acción de control (u ̸= 0)
que se alcanza minimizando este ı́ndice.
función de los valores máximos que se espera tomen las variables de estado y las
acciones de control en situaciones normales (amplitudes máximas esperables en los
estados y lı́mites por actuación máxima para las acciones de control):
O
1 1
qj = , rj = (5.26)
|xj |2max |uj |2max
C
regla de Bryson, calcular una primer matriz de realimentación óptima con (5.21) y (5.20),
y luego evaluar la respuesta de lazo cerrado resultante. En función de este resultado se
reajustan los coeficientes, y se repite el procedimiento de forma iterativa hasta lograr una
respuesta adecuada.
En cada iteración deberı́amos verificar si la respuesta de lazo cerrado cumple con las
expectativas.
N
M = ss(A, B, C, D);
IO
R = diag([ ... ]);
K = lqr(M, Q, R);
% Lazo cerrado
C
% Deberı́amos contar con una matriz Br para mapear las referencias
% a los estados, aunque para el comando 'initial' la matriz B
% es irrelevante
C
Ac = A - B*K;
Bc = B*K*Br;
RU
% Ecuación de salida, que muestre los estados relevantes para
% el problema y las acciones de control.
% aunque para el comando 'initial' la matriz B
Cc = [Br' ; -K];
% para 'initial' también la matriz D es irrelevante, pero la completamos por prolijidad
Dc = [zeros(size(Br,2), size(Br,2)) ; K*Br ];
ST
initial(LC, xo);
El comando lqr combina la solución dada por el comando are (care en Octave)
N
h i−1
P = AT PA − AT PB R + BT PB BT PA + Q (5.27)
Para este caso se cuenta con el comando dare, aunque el comando lqr también
permite manejar el caso discreto.
N
ẋ = Ax + Bu + Bv v (5.28)
y = Cx + Du (5.29)
IO
Si y ̸= x, podemos obtener una estimación del estado x̂ construyendo un sistema
paralelo que responda con la misma dinámica del modelo anterior, en el cual todas las
variables de estado estén accesibles; al cual llamaremos estimador:
C
x̂˙ = Ax̂ + Bu
Este podrı́a ser por ejemplo un circuito analógico que responda con la misma esta
C
dinámica de la planta, y por lo tanto podrı́amos suponer que su estado interno x̂(t)
evolucionará de la misma forma que el estado de la planta x(t).
Si embargo solo podremos decir que x̂ ≈ x si se cumplen las siguientes condiciones:
RU
En el instante inicial x̂(0) = x(0)
Las perturbaciones no medibles son nulas (v = 0)
El modelo utilizado para la estimación es exacto
En algunos casos lo primero puede realizarse (un ejemplo son los navegadores
ST
ŷ = Cx̂ + Du
N
ȳ = y + η
proporcional a la diferencia ȳ − ŷ :
Esta es la estructura del observador de estado completo propuesto por David Luenberger
en 1966. Veamos si con esto es posible lograr que la estimación converja al estado real.
e = x − x̂
C
La dinámica de este error será:
RU
ė = ẋ − x̂˙
Sustituyendo:
ė = Ax + Bu + Bv v − [Ax̂ + Bu + L (y + η − ŷ)]
= A (x − x̂) − LC (x − x̂) + Bv v + Lη
ST
ė = [A − LC] e + Bv v + Lη (5.32)
Se puede elegir la ganancia del observador L para ajustar la matriz dinámica del error
N
de estimación A − LC, y con ello asegurar que este error converja a su condición de
equilibrio lo suficientemente rápido.
Si el error de medición η tiene media nula, la condición de equilibrio será el origen
O
ż = AT z + CT v (5.33)
T
v = −L z
EN
En este caso la acción de control no es real, y por lo tanto no estarı́a limitada. Sin
embargo, si se ajusta la ganancia para lograr una dinámica muy rápida, el modelo usado
para la predicción deberá ser válido en un rango de frecuencia muy amplio. Por lo tanto
la velocidad del error de estimación estará limitada por la incertidumbre dinámica del
modelo utilizado.
Observabilidad
Se dice que “un sistema es completamente observable si cualquier estado x(t0 ) puede
ser determinado a partir de la observación de la salida y(t) durante un intervalo de
N
tiempo finito t0 ≤ t ≤ t1 ”.
Si el sistema es invariante en el tiempo, el instante t0 para el cual se plantea el análisis
es irrelevante.
IO
En [Zum20, sec.2.2.4, p. 60] se realiza un análisis de los ceros de la matriz de
transferencia. Entre los conceptos mencionados se destaca que en algunos casos
existen modos naturales del proceso que no son visibles a través de las salidas
disponibles. En estos casos decimos que el sistema no es completamente observable,
C
porque al menos una parte del estado no afecta las salidas y por lo tanto no puede
reconstruirse.
Esto tiene que ver con la dinámica de la planta (a través de la matriz A) y de la relación
C
entre los estados y las variables medidas (a través de la matriz C).
Al igual que con la controlabilidad, en el caso de observabilidad de orden reducido es
posible separa el estado en una parte observable y otra que no lo es.
RU
Matriz de Observabilidad
Se puede demostrar que un sistema es completamente observable si y solo si la matriz:
C
CA
ST
CA2
(5.34)
..
.
n−1
CA
N
es de rango n, siendo esta la dimensión del vector de estados. Se puede verificar que
la matriz de observabilidad es equivalente a la controlabilidad del sistema dual dado por
(5.33).
O
( ) " #( ) " #
ṗ 0 I p 0
EN
= + u
v̇ 0 0 v I
( )
p
y= 0 0 +u
v
rank(obsv(A,C))
lo cual arroja como resultado un valor 0, lo cual indica que ninguno de los estados
es observable. Es cierto que la velocidad puede obtenerse integrando la aceleración,
y mediante una nueva integración obtener la posición; pero en este proceso nunca se
N
puede reconstruir la posición y velocidad inicial a partir de las mediciones.
IO
Observador de Orden Reducido
Cuando algunas de las variables de estado son accesibles, es posible diseñar un
observador para estimar solo aquellos estados no medibles.
Para ello se puede realizar una transformación T para separar los estados medibles de
C
aquellos que no lo son:
" #( )
F y
x̂ =
T z
C
ż = Fz + TBu + Ly
La matriz F ∈ R(n−q)×(n−q) se elige de forma arbitraria pero con autovalores en el
RU
semiplano izquierdo, siendo q la dimensión del vector de salidas. Con esta se elige una
matriz L ∈ R(n−q)×q tal que el par {F, F} sea controlable. Con estas dos matrices se
determina la matriz de transformación T como solución de la ecuación LA − FL = LC.
Si la matriz {C T}T resulta singular hay que realizar una nueva elección de L, dado que
para la estimación necesitamos contar con su inversa.
ST
Esto ofrece un fuerte argumento para utilizar un observador, aun en aquellos casos en
O
xk = Fxk−1 + Guk−1
El observador serı́a:
x̂k = Fx̂k−1 + Guk−1 + L (y h − ŷ)
Si queremos usar y h = y k necesitamos computar ŷ k , pero para eso necesitamos x̂k .
Esto hace el cómputo engorroso. Veremos dos opciones:
N
La dinámica del error estará dada por:
IO
− L (Cxk−1 + Duk−2 − Cx̂k−1 − Duk−2 )
= F (xk−1 − x̂k−1 ) − LC (xk−1 − Cx̂k−1 )
Resultando que:
C
ek = (F − LC) ek−1
C
ese caso puede resolverse como realimentación de estados de un sistema dual.
Observador Actual Para usar la medición actual k podemos usar una estimación “a
RU
priori” del estado actual sin usar el término de corrección para computar la medición
esperada:
x̂−
k = Fx̂k−1 + Guk−1
ŷ − −
k = Cx̂k + Duk−1
ST
−
x̂k = x−
k − L y k − ŷ k
= (F − LCF) ek−1
Por lo tanto:
C
ek = (F − LCF) ek−1
Este caso también puede resolverse como realimentación de estados de un sistema
dual, pero en este caso con B = FT CT .
EN
u = −Kx̂ (5.35)
ẋ = Ax + Bu + Bv v
˙ = Ax̂ + Bu + L (y − ŷ)
x̂
u = −K [x − Br r]
y = Cx + Du + η
N
ŷ = Cx̂ + Du
Los términos coloreados corresponden a las entradas del lazo cerrado, que no son
IO
necesarios para analizar la dinámica del lazo cerrado. Sustituyendo sin estos términos
se tiene que:
ẋ = Ax − BKx̂
˙ = [A − BK] x̂ + LC (x − x̂)
x̂
C
o bien: ( ) " #( )
ẋ A −BK x
C
=
˙x̂ LC A − BK − LC x̂
Para tener una visión más clara de este resultado realizamos un cambio de coordenadas,
RU
teniendo en cuenta que por la definición del error de estimación:
e = x − x̂ → x̂ = x − e
=
ė 0 A − LC e
Vemos entonces que los autovalores o polos de lazo cerrado son los de la realimentación
de estados reales combinados con los de la dinámica del error de estimación. Por lo tanto
O
más rápido.
N
El término entre corchetes representa la matriz de transferencia del controlador.
IO
5.2.3. Filtro de Kalman
Estimación Óptima
Sean dos estimaciones x1 y x2 de una variable real x con error n1 y n2 de media nula y
C
varianza v1 y v2 respectivamente:
E n21 = v1
x1 = x + n1 , E {n1 } = 0 ,
C
E n22 = v2
x2 = x + n2 , E {n2 } = 0 , (5.37)
= αE {x1 } + βE {x2 } − x
= [α + β − 1] x + αE {n1 } + βE {n2 }
=0
O
n o
2
E e2 = E (x̂ − x) = E x̂2 + E x2 − 2E {x̂x} = E x̂2 + x2 − 2xE {x̂}
2
= (α + β) x2 + α2 n21 + β 2 n22 + 2α (α + β) xn1 + 2β (α + β) xn2 + 2αβn1 n2
= x2 + α2 n21 + β 2 n22 + 2 (αn1 + βn2 ) x + 2αβn1 n2
= x2 + α2 E n21 + β 2 E n22
N
∂E e2 v2
= 2α (v1 + v2 ) − 2v2 = 0 → α=
∂α v1 + v2
IO
con lo cual:
v1 v2
E e2 = v̂ =
v1 + v2
que es la media geométrica de las varianzas originales.
C
Puede notarse que:
v̂ v̂
α= , β=
v1 v2
C
Esto se puede aplicar de forma recursiva para incluir mediciones adicionales. Con tres
muestras:
v 1 v2 v 3 v̂ v̂ v̂
E e2 =
, α= , β= , γ=
RU
v1 v2 + v2 v3 + v1 v3 v1 v2 v3
N
observador es el filtro de Kalman.
IO
ẋ = Ax + Bu + Bw w (5.43)
y = Cx + Du + v (5.44)
C
en donde x ∈ Rn , u ∈ Rm y y ∈ Rl . Los vectores w ∈ Rw y v ∈ Rl son ruidos
blancos gausianos con media nula; denominados ruido de proceso y ruido de medición
respectivamente:
C
w = N (0, W) , v = N (0, R)
e = x − x̂ = N (0, P)
x̂−
k = Fx̂k−1 + Guk−1
P− T
k = FPk−1 F + Q (5.45)
N
ŷ k = Cx̂−
k + Duk
x̂k = x̂−
k + Kk (y k − ŷ k )
IO
Para esta fase de corrección primero se debe calcular la matriz de ganancias de Kalman,
que minimiza la covarianza de la estimación ası́ obtenida:
−1
Kk = P− C T
C P − T
C + R (5.46)
C
k k
C
Pk = (I − Kk C) P−
k (5.47)
Estado estacionario
En el caso de sistemas observables la ganancia de Kalman converge a un valor de
estado estacionario.
ST
En tiempo continuo esta ganancia se puede obtener por optimización cuadrática del
sistema “dual”, tomando para el ı́ndice de desempeño cuadrático las matrices Q y R de
covarianza para el ruido de proceso y medición respectivamente.
En otras palabras, el filtro de Kalman invariante en el tiempo es el dual del regulador
LQR ([Tew11, pág. 81]).
N
ż = AT z + CT y
con un ı́ndice de desempeño definido con la convarianza del ruido de proceso Q y la del
C
ruido de medición R.
Control LQG/LTR
El control LQG (Linear Quadratic Gaussian) consiste en obtener el controlador que
minimice del ı́ndice de desempeño cuadrático para el problema:
ẋ = Ax + Bu + ν (5.48)
y = Cx + Du + η
IO
bajo la acción de ruidos de proceso ν y medición η blancos gausianos de media nula.
El problema se resuelve combinando el regulador LQR con un filtro de Kalman.
C
Se ha demostrado [SP01, sec.9.2.2, p. 364] que el regulador LQR para un problema
con estados accesibles que se obtiene con una matriz R diagonal tiene un margen de
ganancia infinito y un margen de fase superior a los 600 en cada acción de control;
C
asociado a un alto nivel de robustez. Por su parte el filtro de Kalman comparte estas
propiedades como sistema dual.
Y si bien es cierto que el diseño del regulador y el del observador son problemas
RU
independientes (“teorema de separación”), se ha demostrado [Doy78] que esta
combinación no resulta necesariamente robusta.
Para resolver este aspecto se han desarrollado una técnica denominada loop transfer
recovery (LTR), que consiste en ajustar la ganancia del observador una vez calculada la
del regulador o viceversa a fin de recuperar las propiedades de robustez al plantear un
ST
Los conceptos utilizados para analizar el lazo SISO se pueden expandir para el caso
MIMO, pero ello requiere introducir nuevos conceptos.
O
Podemos decir para el caso general que a la hora de obtener la transferencia de bloques
en serie debemos comenzar por la salida e ir escribiendo las matrices de transferencia
en el orden que van apareciendo hasta llega a la entrada. De esta forma se puede
determinar la matriz de transferencia de lazo abierto L(s).
−1
N
El lazo de realimentación agregar un término pre-multiplicando [I + L(s)] .
Ganancia
IO
Un punto particularmente relevante es plantear una forma de extrapolar el concepto de
“ganancia” del caso SISO al MIMO.
C
señal. Las señales en el caso MIMO son vectores, y en general la variación de magnitud
entre el vector de entrada y el de salida depende de la dirección del primero.
Por lo tanto podrı́amos asumir que por ejemplo para una determinada frecuencia puede
C
haber infinitas ganancias.
Sin embargo estas surgen como combinación lineal de las ganancia en ciertas
direcciones principales. El concepto es claro para matrices simétricas, en donde las
RU
direcciones principales son los autovectores y las ganancias correspondientes son los
autovalores. Podemos tomar el vector de entrada, proyectarlo en cada dirección principal,
escalar cada componente con el autovalor correspondiente y finalmente volver a la
proyección original.
Para el caso de una matriz M arbitraria se puede realizar el mismo análisis computando
autovalores y autovectores de la matriz MT M, tomando la raı́z cuadrada de los
ST
Sea la matriz:
1 0 0
M = 0 2 0
C
0 0 3
Podemos computar sus valores singulares con svd(M) y sus autovalores con eig(M).
En este caso ambos comandos arrojan el mismo resultado {1, 2, 3}.
EN
0 100 3
0 100 3
los autovalores son {1, 2, 3}, mientras que los valores singulares resultan
N
{100,065, 1, 0,060}.
Se observa que para matrices no-simétricas los autovalores no son representativos de
sus ganancias.
IO
Para la matriz de transferencia esto se puede plantear para cada valor de frecuencia ω .
Los valores singulares máximo σ̄ y mı́nimo σ definen el rango de amplificación que puede
experimentar cualquier vector de entrada, y en general varı́an en función de la frecuencia
C
ω.
Un aspecto relevante para el caso MIMO es el cociente entre estos valores extremos,
C
que denominamos número de condición:
γ = σ̄/σ (5.52)
RU
Un valor alto implica ganancias muy diferentes en función del vector de entrada.
Debe tenerse presente que para analizar el número de condición debe considerarse
el escalado de las variables de entrada y salida. Si estas están normalizadas, el valor
deseable serı́a 1. Valores mucho mayores implican un sistema mal condicionado.
ST
frecuencia (en Matlab utilizando el comando sigma del robust control system toolbox).
C
RU
ST
N
(b) Valores singulares máximo y mı́nimo para un modelo de la dinámica latero-direccional de una aeronave de transporte.
O
0,15 0,51
en donde se observa que el ángulo de rolido es más sensible al alerón mientras que el
deslizamiento lo es al timón de dirección, pero con ganancias similares. A esta frecuencia
N
el número de condición es mucho más próximo a 1.
IO
Desacoplamiento
En control multivariable aparece una caracterı́stica nueva en el análisis de un lazo de
control: el “desacoplamiento de canales”.
Esto se refiere a que modificaciones en la referencia para una de las variables de salida
C
no impacte en las demás, lo cual equivale a que la matriz de sensibilidad complementaria
sea lo más diagonal posible.
C
Criterio de Nyquist
Para el caso MIMO el criterio de Nyquist se aplica al determinante:
RU
|I + L(jω)|
IO
C
Apéndices
C
RU
Modelos Dinámicos
ST
ẋ = f (x, u, t) (A.1)
donde x ∈ Rn es el vector de estado, u ∈ Rm es un vector de acciones exógenas
independientes del estado y t ∈ R es el tiempo. Este es un modelo general no-lineal y
O
variante en el tiempo.
Sin embargo, en la mayor parte de los problemas en ingenierı́a se puede plantear algo
un poco más restrictivo sin perder demasiada generalidad:
C
163
El modelo completo resulta:
N
serie de Taylor alrededor de una condición de equilibrio: f (x0 , u0 ) = 0.
El modelo lineal resulta:
IO
y = C∆x + D∆u
donde:
∂f
C
A= , ∆x = x − x0
∂x x0 ,u0
∂f
B= , ∆u = u − u0
C
∂u x0 ,u0
∂h
C=
∂x
RU
x0 ,u0
∂h
D=
∂u x0 ,u0
ẋ = Ax + Bu (A.6)
y = Cx + Du (A.7)
Podemos aplicar la transformada e Laplace para obtener una solución del modelo lineal:
N
ϕ (s)
21 ϕ22 (s) ··· ϕ2n (s)
−1
Φ(s) = [sI − A] =
.. .. .. ..
(A.9)
. . . .
ϕn1 (s) ϕn2 (s) · · · ϕnn (s)
EN
N
Modelos de Procesos con Dinámica de Sensores y Actuadores
Frecuentemente en control automático se plantean modelos para la dinámica de los
procesos a controlar, identificando las acciones de control u y las variables medidas
IO
y , asumiendo que estas tienen una relación estática (instantánea) con las salidas y
entradas del sistema de control. Sin embargo en general esta interacción entre el
proceso y el controlador se da por medio de sensores y actuadores cuyas dinámicas
no aparecen inicialmente en el modelo del proceso.
C
Esto se da por ejemplo al analizar la dinámica del avión, al asumir que la deflexión de
las susperficies de control aerodinámico o el empuje son acciones de control (pueden
C
ser manipuladas directamente), cuando el realidad las acciones de control son señales
enviadas a un actuador (servomecanismos en el caso de las superficies aerodinámicas)
que se encarga de ejecutar este movimiento.
RU
En tanto la dinámica de estos actuadores resulta rápida respecto de la dinámica de lazo
cerrado que se pretende lograr, no incluirlos en el modelo es admisible. Algo similar
puede decirse de los sensores.
Cuando esto no es ası́ se requiere contar al menos con un modelo de la dinámica
dominante de los actuadores y de los sensores, para fusionarlo con el modelo del
ST
proceso principal.
ẋa = Aa xa + Ba v
y a = Ca xa + Da v ≡ u
O
( ) " #( ) " #
ẋ A BCa x BDa
= + v (A.13)
ẋa 0 Aa xa Ba
( )
x
EN
y= C DCa + DDa v
xa
ẋs = As xs + Bs y
y s = Cs xs + Ds y
N
xs
IO
A partir de la solución en Laplace (A.8) podemos despejar una relación entre entradas y
salidas:
−1 −1
Y (s) = {C [sI − A] B + D}U (s) + C [sI − A] x(0) (A.15)
C
El término entre llaves es lo que se denomina matriz de transferencia, que relaciona
el efecto de las entradas sobre las salidas partiendo de condiciones iniciales nulas
(equilibrio):
C
−1
G(s) = C [sI − A] B+D (A.16)
En sı́ntesis podemos decir que:
RU
Y (s) = [CΦ(s)] x(0) + G(s)U (s)
De forma expandida:
U1 (s)
Y1 (s)
G11 (s) G12 (s) · · · G1m (s)
U (s)
2
.. . .. .. ..
ST
. = .. . . . ..
.
Yl (s) Gl1(s) Gl2(s) · · · Gln (s)
Um (s)
Función de Transferencia
N
Cada elemento Gij (s) es una función racional cuyo denominador es el polinomio
caracterı́stico de la matriz A, de orden n, y el numerador es un polinomio como máximo
de orden n, si D ̸= 0, o a lo sumo n − 1 si D = 0.
O
Respuesta en Frecuencia
EN
N
Modelo de Estados
Podemos evaluar la solución de la ecuación de estados (A.10) entre dos instantes de
IO
muestreo consecutivos ta = kts y tb = (k + 1)ts :
Z tb
x(tb ) = Φ(tb − ta )x(ta ) + Φ(t − τ )Bu(τ )dτ
ta
C
Como el sistema es invariante en el tiempo podemos decir que:
Z ts
x(tb ) = Φ(ts )x(ta ) + Φ(t − τ )Bu(τ )dτ
C
0
donde Z ts
F = Φ(ts ) , H= Φ(t − τ )B
C
Transformada Z
De la misma forma que ocurre con el modelo de tiempo continuo (A.6), la solución para
una ecuación en diferencias como lo és el modelo de tiempo discreto (A.18) no puede
obtenerse de forma algebraica. Pero al igual que en el caso continuo es posible convertir
el modelo discreto en una expresión algebraica aplicando la transformada Z.
N
∞
X ∞
X
y ∗ (t) = y(t)δ(t − nts ) = y(nts)δ(t − nts)
n=0 n=0
IO
Aplicando Laplace:
∞
" #
Z ∞ X
L {y ∗ (t)} = y(nts )δ(t − ns ) e−st dt
0
C
n=0
∞ Z
X ∞
y(nts)δ(t − nts ) e−nts s dt
=
n=0 0
C
Como s(t) = 0∀t ̸= nts , podemos sustituir st por nts s en el exponente y reemplazar la
integral por la sucesión y(n · ts):
RU
∞
X
L {y ∗ (t)} = y(nts ) e−nts s
n=0
z = e−ts s (A.19)
n=0
∞
X
Z {x(t) + y(t)} = [x(nts ) + y(nts )] z −n = Z {x(t)} + Z {y(t)}
n=0
X∞
Z {αy(t)} = αy(nts ) z −n = αZ {y(t)}
n=0
N
k=1 k=1
Por lo tanto:
Z {y(t + ts )} = z Z {y(t)} − y(0)z (A.21)
IO
Usando un razonamiento similar se demuestra que:
Z {y(t − ts )} = z −1 Z {y(t)} (A.22)
Podemos notar en esto un paralelismo con la transformada de Laplace. Para esta la
variable compleja s representa al operador derivada en el tiempo, y s−1 la integral.
C
Para la transformada Z la variable compleja z representa un operador de desplazamiento
hacia adelante en el tiempo de magnitud ts , y su inversa z −1 un atraso temporal de igual
C
amplitud.
Esto es matemáticamente igual a la solución de tiempo continuo A.8. Dado que se trata
de un operador lineal, la transformada Z inversa se puede calcular de forma directa a
O
Matriz de Transferencia
Aplicando también la transformada Z a la ecuación de salida y despejando para
condiciones iniciales nulas encontramos la matriz de transferencia discreta; que tiene
EN
C
Estabilidad del Modelo Discreto y Mapeo s-z
La ecuación (A.19) define un “mapeo” entre el pano s y el plano z:
RU
z = e−ts s = e−ts Re{s}−ts jIm{s} = e−ts Re{s} e−jts Im{s} (A.24)
Es evidente que:
|z| = e−ts Re{s} , ∠z = e−jts Im{s} (A.25)
ST
Por lo tanto una recta Re {s} = cte (vertical) en el plano s es una circunsferencia de
radio e−ts Re{s} en el plano z , mientras que una recta Im {s} = cte (horizontal) en el
plano s es una radial con ángulo e−ts Im{s} en el plano z . Debe tenerse presente que la
parte real en s define el tiempo de establecimiento en el caso estable, o el tiempo para
duplicar la amplitud en el inestable. Esto en el plano z queda entonces asociado a la
distancia al origen.
N
C
ẋ = −a x + b u
y = cx
C
La matriz de transición de estados para este caso es escalar:
1
RU
ϕ(s) = → ϕ(t) = e−at
s+a
Si a > 0 es una dinámica estable sobre-amortiguada.
La matriz de transferencia también es escalar:
Y (s) b
=
ST
U (s) s+a
El modelo en tiempo discreto será:
xk+1 = ā xk + b̄ uk
yk = c xk
N
donde
b
ā = e−ats 1 − e−ats
→ b̄ =
a
O
z − ā
y la función de transferencia discreta resulta:
Y (z) b̄
=
EN
U (z) z − ā
El polo en el modelo continuo está en s = −a (semiplano izquierdo) mientras que para
el modelo discreto es z = e−ats (interior del circulo unitario).
En la figura A.2 se ve la respuesta al escalón calculada con el modelo continuo y con el
discreto.
Estado Estacionario
Los valores de una señal en estado estacionario para el modelo de tiempo contı́nuo se
pueden determinar a partir del teorema del valor final. Para modelos de tiempo continuo
se tiene:
yss = lı́m y(t) = lı́m s Y (s)
N
t→∞ s→0
En tiempo discreto este teorema toma la siguiente forma [Oga96, p.6]:
IO
k→∞ z→1
lo cual es consistente con el hecho de que el modelo discreto del escalón unitario es
−1
1 − z −1 .
Esto implica que para determinar la ganancia a frecuencia cero a partir de una función
C
de transferencia discreta G(z) debemos computar G(1).
Respuesta en Frecuencia
C
La respuesta en frecuencia del proceso operando en tiempo discreto puede obtenerse
reemplazando z = ejωt en la función discreta, en concordancia con el mapeo en el plano
s y el plano z .
RU
Debe observarse que para un determinado modelo continuo, la respuesta en frecuencia
discreta no coincide con la continua; dado que para el modelo discreto hay un dispositivo
de retención a la entrada. Podrı́amos decir que la respuesta en frecuencia discreta se
corresponde con la respuesta en régimen estacionario del proceso continuo con una
entrada senoidal procesada por una retención de orden cero.
Con la retención, a la frecuencia de Nyquist la senoidal se convierte en una onda
ST
cuadrada.
en frecuencia.
Para lidiar con este inconveniente se puede aplicar una segunda transformación al
O
modelo continuo, esto es, mapear el plano z a otro plano que denominaremos w
mediante la transformada bilineal, también conocida como método de Tustin; definida
como [Oga96, p.228]:
C
ts
1+ w 2 z−1
z= 2 → w= (A.27)
ts ts z + 1
1− w
2
EN
Esta transformada mapea el interior del cı́rculo unitario del plano z en el semiplano
izquierdo del plano w, llevando el cı́rculo unitario en z al eje imaginario en w.
En el plano w la respuesta en frecuencia vuelve a ser una función racional, pero en
términos de una frecuencia ficticia ν relacionada no-linealmente con la frecuencia real ω :
2 ts
Im {w} = ν = tan ω (A.28)
ts 2
N
IO
C
C
RU
ST
N
O
C
EN
N
Las señales representan variables escalares o vectoriales que evolucionan en el tiempo.
Los bloques son transformaciones aplicadas sobre las señales, y los puntos de suma
son bloques especiales que representan adición sustracción de señales.
IO
Un ejemplo muy simple es el de un modelo masa-resorte-amortiguador:
C
C
mv̇ = f − fr − fb ṗ = v fr = k · p fb = b · v (A.29)
donde f es una fuerza externa, mientras que las expresiones para fr y fb son modelos
RU
para los fenómenos elásticos y disipativos respectivamente.
La ecuación diferencial puede escribirse de forma más significativa dejando en claro las
relaciones causa-efecto de la siguiente forma:
Z t Z t
1
v= (fr + fb + fp ) dt p= vdt (A.30)
m 0 0
ST
Como en este caso el modelo es lineal, podemos aplicar la transformada de Laplace para
C
obtener expresiones algebraicas. De esta forma es posible operar para encontrar alguna
relación entre una variable de entrada y cualquiera de las señales. Con la transformada
de Laplace convertimos el operador derivada en un producto por la variable s:
EN
N
IO
El bloque del recuadro verde incluye dos términos que toman una misma señal de
C
entrada (P (s)) y la suman (o restan) a una misma señal resultante. Estos bloques en
paralelo pueden ser sustituidos por uno que equivalga a la suma de ambos:
C
RU
El resultado tiene una estructura genérica de la forma:
ST
tenemos que:
Z(s) = X(s) − H(s)Y (s)
y además:
O
Y (s) = G(s)Z(s)
Despejando Z(s) y sustituyendo en lo anterior:
C
X(s) 1 + G(s)H(s)
Para nuestro ejemplo:
1
P (s) ms2 1
= =
F (s) bs + k ms2 + bs + k
1+
ms2
Figura A.3: Reducción del diagrama en bloques para el modelo de 1/4 de auto con 2 grados de libertad
Por ejemplo, para un modelo de 1/4 de auto para la suspensión con dos grados de
libertad:
N
IO
C
C
Con modelos lineales de elasticidad y amortiguamiento:
M ẇ = f1 f1 = kϵ + bϵ̇
RU
mẇr = f2 − f1 f2 = kr δ + br δ̇
ż = w , żr = wr , ϵ = z − zr , δ = zr − h
1
M s2 Z(s) = F1 (s) → Z(s) = F1 (s)
M s2
1
ms2 Zr (s) = F2 (s) − F1 (s) → Zr (s) = [F2 (s) − F1 (s)]
ms2
N
Con esto planteamos el diagrama superior de la figura A.3. Luego reducimos el diagrama
hasta obtener un solo bloque que transforme la señal de entrda (en este caso la altura
del terreno) con la de salida (la altura de la carrocerı́a).
C
Hacemos una simplificación del último bloque para obtener una función racional:
Conceptos Principales
Representación gráfica de ecuaciones algebraicas
N
Reducción de diagramas en bloques
IO
C
C
RU
ST
N
O
C
EN
αx = y , Ax = y
N
El producto por un escalar puede interpretarse como un operador matemático que al
vector le aplica un cambio de magnitud dado por el valor absoluto de este escalar, y una
posible inversión de su dirección si el signo del escalar es negativo.
IO
El producto de una matriz por un vector implica igualmente operar sobre la magnitud del
vector, pero también un cambio de dirección no se acota a un signo.
En el caso del escalar la magnificación o atenuación solo depende del valor absoluto
C
del escalar. Al considerar el producto por una matriz esto no es tan evidente, y existen
diferentes ”normas” matriciales que se pueden considerar; porque el cambio de magnitud
depende de la “dirección” del vector de entrada.
C
En particular, las normas “inducidas” cuantifican el ”escalado” que sufre un vector al
aplicarle un operador matricial en función de la norma usada para computar el tamaño
de dicho vector. Pero una norma no da información asociada al cambio de dirección
RU
implı́cito en un operador matricial.
M = UΣVT (A.32)
ST
Figura A.4
C
A diferencia de los operadores escalares, una matriz en general tiene diferentes
C
”ganancias” según la dirección del vector sobre el que opera, y estará acotada entre
los valores singulares máximo σ̄ y y mı́nimo σ . El cociente σ̄/σ entre ambos define su
número de condición, que cuantifica la disparidad en el escalado para las diferentes
RU
direcciones.
En el caso de matrices simétricas los valores singulares coinciden con los autovalores y
las matrices de entrada y salida resultan idénticas y equivalen a la matriz modal.
A.3.2. Pseudo-Inversa
ST
x0 = A+ b (A.33)
donde −1
A+ = AT A AT (A.34)
N
Para poder usar esta expresión es necesario que la matriz A sea de rango completo. Si
esto no se cumple, se puede utilizar una descomposición en valores singulares de A.
C
constituyen las columnas de U. Los valores singulares son las raı́ces cuadradas de los
autovalores de cualquiera de ellas.
Esto implicarı́a un cierto costo computacional que podemos evitar recurriendo directa-
mente a una regresión lineal.
ST = −S
S + ST = 0
N
Se puede comprobar que |S| = 0.
IO
En R3×3 la matriz anti-simétrica tiene la siguiente estructura:
0 −z y
S(v) = z 0 −x
C
−y x 0
Dado que los tres parámetros que la definen pueden agruparse en un vector, se suele
utilizar la notación S(v) donde v = x y z .
C
Se comprueba que:
RU
0 −z y 0 −z y
S2 (v) = z 0 −x z 0 −x
−y x 0 −y x 0
2 2
−y − z xy xz
= yx −z 2 − x2 yz (A.36)
ST
2 2
zx zy −x − y
h i1/2
2
∥a × b∥2 = ∥a∥2 ∥b∥2 − (a · b) (A.37)
a × b = S(a)b (A.38)
Relaciones útiles
EN
a × (b × c) = aT c b − aT b c
(A.39)
(a × b) · c = a · (b × c) (A.40)
N
" #−1 " −1 −1 #
A B A − BD−1 C − A − BD−1 C BD−1
= −1 −1 (A.42)
C D −D−1 C A − BD−1 C D−1 + D−1 C A − BD−1 C BD−1
IO
A.3.6. Covarianza
La covarianza de un vector aleatorio x ∈ Rn es el valor esperado de xxT , una matriz
V ∈ R×n a la que denominamos matriz de covarianza:
C
V = E xxT
C
Es bastante obvio que los elementos de la diagonal son las varianzas de cada
componente, mientras que los términos fuera de la diagonal vij son las esperanzas para
los productos xi xj . También puede afirmarse que se trata de una matriz real simétrica y
RU
positiva definida.
E yy T = A E xxT AT
(A.43)
N
O
C
EN
N
el LEM al módulo de comando y efectuar el retorno a la tierra en este último.
El LEM fue construido por la Grumman, por un contrato de u$s 350 M. Estaba compuesto
de dos etapas, una de descenso y otra de ascenso.
IO
Los módulos de descenso contenı́an el tren de aterrizaje, la antena del radio-altı́metro,
el motor de descenso y el combustible para el alunizaje. También tenı́a varios
compartimientos de carga usados para llevar entre otras cosas, los paquetes de los
experimentos de la misión, un carro móvil para el equipo (un carro tirado a mano para
C
los equipo llevado en la misión Apolo 14), el Lunar Rover (un vehı́culo lunar eléctrico
llevado en las misiones Apolo 15, 16 y 17), una cámara de televisión, herramientas y
cajas para la recolección de muestras de la superficie lunar.
C
El módulo de ascenso contenı́a la cabina para la tripulación, los tableros de instrumentos,
el puerto y escotilla de acople (al CSM), la escotilla delantera, el sistema de control
RU
de reacción, las antenas del radar y de comunicaciones, el motor de ascenso y el
combustible para volver a la órbita lunar y encontrarse con el CSM.
ST
N
O
C
(a) Imagen del Lunar Excursion Module (LEM) (b) Infografı́a de los subsistemas del LEM
EN
C
Dimensiones
Altura 6,37m
RU
Diámetro 4,27m
Envergadura en el tren de aterrizaje 9,07m
Volumen 6,65m3
Masas
Módulo de Ascenso (con combustible) 4670kg
ST
Propulsión
RCS: Reaction Control System (N2O4/UDMH) 16x441N
N
1. Una fase de frenado (Programa 63, o P63) iniciada mediante un teclado unos 10
minutos antes del momento nominal de ignición. P63 primero computa el momento
preciso y la actitud para la ignición. Luego, tı́picamente a 492-km del sitio de alunizaje,
C
P63 enciende el DPS (Descent Propulsion System). Finalmente, P63 transfiere el
C
LM al estado terminal requerido como condición inicial para la fase de aproximación
subsiguiente. La transferencia toma tı́picamente 514 segundos y es casi óptima.
RU
2. La fase de aproximación (P64) el guiado comienza con condiciones iniciales
consistentes tı́picamente en, a) 2.2km de altitud y 7.5 km de rango en superficie y b) 44
m/s de velocidad vertical y 129 m/s de velocidad hacia adelante. En unos146 segundos,
P64 transfiere el LM a un punto prácticamente arriba del sitio de aterrizaje. P64 provee
visibilidad continua de la superficie lunar, y especı́ficamente, del sitio de alunizaje hasta
unos cinco segundos antes de la finalización. Durante P64 el comandante puede indicar
ST
altitud y 11m de distancia al sitio de aterrizaje, o puede ser iniciado por el comandante
en cualquier momento durante P64. El algoritmo de guiado de P66 controla solo
la velocidad; no hay control de posición. P66 anula las componentes de velocidad
O
o decrementado en pasos de 0.3 m/s cada vez que el comandante sube o baja un switch
de control (ROD: rate-of-descent) control ubicado cerca de su mano izquierda.
EN
N
control de actitud mantiene el motor de descenso (DPS) correctamente alineado con
la trayectoria; podemos concebir un sistema independiente que controle el descenso
regulando el empuje de este motor. Dicho motor fue diseñado para permitir un cierto
IO
nivel de control de empuje, lo cual no es sencillo debido a las inestabilidades que pueden
experimentarse en la cámara de combustión de un motor cohete por cuestiones termo-
fluidodinámicas.
C
rango admisible para nuestra acción de control.
C
perfil de altura vs tiempo pre-programado
B - Ajustar la velocidad de descenso en función de la altura, en base a una curva o
RU
mapeo altura ¿ velocidad predefinido
d dh
{m × w} = ṁw + mẇ = F − mg , =w
dt dt
ST
τdps Ḟ + F = u;
EN
1 g
s W (s) = ∆F (s) − , sH(s) = W (s)
m s
N
IO
Análisis en Régimen Estacionario
C
El problema de esta perspectiva es que para encontrar una relación entre acción
de control y salida debemos eliminar la perturbación gravitatoria, pero esta puede
conservarse como una perturbación equivalente a la entrada Di o a la salida Do .
C
Perturbación Equivalente a la Entrada
RU
1/m Tdps s + 1
H(s) = 2 U (s) − mg
s (Tdps s + 1) s
ST
N
1/m 1
O
H(s) = U (s) − 3 g
s2 (Tdps s + 1) s
C
EN
N
IO
C
Si lo analizamos como perturbación de salida, el lazo de realimentación en este caso
incluye a la planta, que ya tiene dos polos en el origen; pero la perturbación de salida en
estado estacionario serı́a de tipo parabólica, por lo cual nuevamente vemos la necesidad
C
de incluir acción integral en el controlador:
RU
Entonces el problema de control pasarı́a a ser:
ST
N
m = 15000;
g = 1.62;
Tdps = 1;
den = [Tdps 1 0 0];
G = tf(1/m, den);
zpk(G)
N
IO
C
C
RU
Es claro que se requiere de un compensador, dado que con un control integral puro que
ST
Debe tenerse en cuenta que si la respuesta oscila, también lo hace la acción de control.
En este caso acciones de control de carácter oscilatorio no parecen recomendables ya
O
que el actuador es un motor cohete. Sin embargo no es mandatorio una respuesta sobre-
amortiguada; con un “buen amortiguamiento” serı́a suficiente.
C
C
convergencia más rápida que para el caso de amortiguamiento crı́tico o una respuesta
sobre-amortiguada, y podrı́amos adoptarlo.
C
El otro punto a definir es: ¿cuan rápida queremos que sea la respuesta?
La maniobra de descenso final tendrı́a una duración del orden de los 30s. Está claro que
la respuesta transitoria deberı́a extinguirse en un tiempo mucho menor.
RU
Por otra parte tenemos un actuador con una constante de tiempo de un segundo, y
no podemos pretender una respuesta de lazo más rápida que la del actuador. En caso
contrario durante cualquier transitorio habrá frecuentemente saturación de la acción de
control (motor al máximo o a cero empuje) y la respuesta no se corresponderá con lo
que podrı́a suponerse a partir del modelo lineal.
ST
Sin más argumentos podrı́amos pensar en un cero doble (dos ceros en el mismo lugar),
ST
en donde cada uno aporte la mitad del ángulo requerido (+124°). Hasta este punto el
controlador serı́a:
2
(s + z)
K(s) = kc
s
N
con z = 1,19. Restarı́a calcular kc para cumplir con la condición de módulo, lo cual da
un valor aproximado de 5,6.
O
2
(s + 1,19)
K(s) = 5,6
s
C
% objetivo
plot(real(p ), imag(p ), 's');
hold on;
N
axis([-3.5 0.5 -2 2]);
legend( 'polos deseados a lazo cerrado' ...
, 'polos con el modelo simplificado' ...
IO
, 'polos con el modelo completo');
sgrid;
C
C
RU
ST
N
Un aspecto adicional que deberı́amos verificar es que pasa al variar la masa entre el
valor al inicio del descenso y el caso lı́mite de consumir la totalidad del combustible.
O
En necesario entonces agregar un polo adicional, ajustando los ceros para mantener la
dinámica dominantes de lazo cerrado elegida.
Enfoque Moderno
EN
To do (??)
Modelo Matemático
N
En primer término proponemos un modelo de dos grados de libertad, considerando el
rotor del generador y la turbina como dos cuerpos rı́gidos vinculados mediante un eje
flexible. Planteando conservación de momento cinético en ambos rı́gidos:
IO
Jt ω̇t = Tt − Te , Jg ω̇g = Te − bωg + Tc
C
te, ωt y ωg sus velocidades de giro, Tf el torque generado por la turbina, Te el torque
elástico del eje, Tc el torque de carga en el generador y b un coeficiente de disipación
viscosa.
C
Para el torque de la turbina y el elástico proponemos lo siguiente:
Tt = cα [β − cω ωt ] , Te = ke ϕ , ϕ̇ = ωt − ωg
RU
donde β es el ángulo de paso de las palas, cα y cω son coeficientes hidrodinámicos y ke
es la rigidez a torsión del eje. Por simplicidad consideramos que el torque de carga Tc
está desacoplado de la velocidad de giro del generador.
El rotor del generador tiene 40 pares de polos magnéticos, 650 toneladas de peso y
13,50 metros de diámetro. El eje de la turbina tiene 11,00 metros de largo, 95 toneladas
ST
N
ω(s) 631,8
G(s) = = (A.44)
β(s) (s + 0,376)(s2 + 12,07s + 216,8)
IO
Sı́ntesis del Compensador
Proponemos un enfoque polinomial para la sı́ntesis del compensador. Con el modelo
(A.44) de tercer orden deberı́amos elegir para el lazo cerrado un polinomio de orden 5.
C
Pero si requerimos error nulo en estado estacionario ante referencias o perturbaciones
constantes debemos elevar el polinomio denominador de lazo abierto a 4 para incluir el
integrador del control, lo cual impone la elección de un polinomio de orden 7 para el lazo
C
cerrado.
que tiene la misma ganancia a frecuencia cero que (A.44) pero solo conserva el polo real.
Graficando las respuestas en frecuencia es fácil notar que el modelo simplificado da una
buena aproximación para frecuencias una década por encima del ancho de banda de
lazo abierto.
N
control es de orden 3.
De acuerdo al ancho de banda de lazo abierto partimos de un ancho de banda de lazo
cerrado del orden de 1 rad/s.
Consideramos tres casos: polinomio de Butterworth Ab (s), polinomio de Bessel As (s) y
EN
Ab (s) = s3 + 2s2 + 2s + 1
As (s) = s3 + 2,4329s2 + 2,4662s + 1
Ad (s) = s2 + 1,12s + 0,64 (s + 2,4)
N
IO
C
Calculamos los controles con el enfoque polinomial (ver sección 4.4.1) considerando
como polinomio de lazo abierto:
C
A0 = s (2,659s + 1)
Las dinámicas de lazo cerrado para cada caso se muestran en la figura siguiente,
considerando tanto el modelo nominal (gráficos superiores) y como el modelo completo
(gráficas inferiores). Puede notarse que no se manifiestan diferencias significativas.
N
O
C
EN
N
IO
C
Si estresamos el diseño aumentando el ancho de banda, las respuestas de lazo cerrado
C
deberı́an tener la misma forma pero con una escala de tiempo proporcionalmente
menores; más allá de los problemas que pudieran surgir por limitaciones de actuación
máxima.
RU
Esto es ası́ para el modelo nominal, pero a modo de ejemplo con un factor 7 sobre el
ancho de banda los resultados con el modelo nominal (arriba) y el completo (abajo) son
muy diferentes a los esperados:
ST
N
O
C
EN
Aunque la situación empeoró en todos los casos, el menor impacto se obtuvo para el
polinomio con polos dominantes de segundo orden.
Todo esto era previsible evaluando el margen de robustez resultante con este ancho de
banda:
N
que pueden estar disponibles o no en diferentes momentos.
IO
la aeronave (strapdown). Estos miden “fuerza especı́fica” 1 y velocidad angular hasta
frecuencias del orden del kHz.
Como sensores exoceptivos asociados a la posición podemos considerar receptores
GNSS, telémetros (RADAR, LIDAR, ultrasónicos, etc.) y barómetros.
Para el sensado de la actitud pueden utilizarse magnetómetros triaxiales, y tanto para
C
la actitud como para posición y/o velocidad pueden utilizarse sensores ópticos (basados
en el procesamiento de imágenes).
C
A.5.2. Aspectos Terrestres Relevantes para la Navegación
Rotación Sideral
RU
Es una magnitud bastante importante en algunas transformaciones o en el cálculo del
error de algunos sistemas. El tiempo que la Tierra tarda en completar una vuelta (dı́a
sideral) es de 23h, 56 min, 4,09s. Por lo tanto:
3600
Ω= = 15,04107 0 /h (A.47)
ST
56 4,09
23 + +
60 3600
Mientras que una vuelta por dı́a podrı́a parecer algo despreciable, incluso en vuelos
cortos (en el orden de los 20 minutos) la rotación terrestre añade 5° a la actitud; por
lo cual se concluye que es lo suficientemente significativo para cualquier problema de
N
Campo Gravitatorio
O
su superficie. Los efectos centrı́fugos por la rotación terrestre tienen incidencia en este
punto.
Las variaciones van desde 9,7639m/s2 en el macizo Huascarán en Perú a 9,8337m/s2
en la superficie del Océano Ártico.
En Buenos Aires la aceleración gravitatoria es de 9,797m/s2 .
EN
1 aceleración en una terna inercial sin la componente gravitatoria, proyectada en el eje del sensor
C
A.5.3. Sistemas de Referencia
C
En lo sucesivo será necesario definir actitud y posición, por lo cual se requiere establecer
sistemas de coordenadas adecuados.
Habitualmente se consideran cuatro sistemas de referencia según las escalas de tiempo
RU
involucradas. Adoptamos la nomenclatura definida en [Esp16].
Una terna cuyo origen se ubica en el centro de la tierra, con un eje alineado con los polos
geográficos (eje de rotación terrestre, que normalmente se designa como z), un segundo
eje fijo en relación con el Sol (eje x) y un tercer eje para constituir una terna derecha
es una terna aproximadamente inercial para vuelos terrestres, e incluso orbitales; en
ST
general identificada como ECI (Earth Centered Inertial) y referenciada como terna-i.
Esta terna sirve como referencia para las mediciones de los sensores inerciales.
ve = vi − ωie × r
N
mediciones de altura, que está definido por una superficie equipotencial del campo
gravitatorio constituido por la combinación del campo gravitacional terrestre y el efecto
centrı́fugo debido a su rotación. Esta superficie es invariante en el tiempo pero no es
IO
completamente regular.
Para establecer un sistema de coordenadas de navegación terrestre se aproxima su
forma por un elipsoide de revolución (figura A.12). Sobre este elipsoide se determinan los
ángulos de latitud y longitud, mientras que la separación normal al elipsoide determina
C
la altura.
C
coincide con la vertical astronómica, que es definida por la dirección local de la gravedad.
En la definición de una vertical pueden plantearse tres alternativas.
Figura A.12
N
Finalmente necesitamos definir una terna solidaria al vehı́culo (terna-b), a partir de
la cual se definen los ejes de rolido, cabeceo y guiñada para la descripción de las
IO
maniobras de cambio de actitud.
La actitud del vehı́culo queda definida por la rotación que se requiere para llevar la terna
geográfica a lo orientación de la terna-b.
C
Sistema de referencia WGS El sistema WGS (World Geodetic System) definió en el
año 1984 una actualización del estándar de referencia geodésico (WGS84) adoptando
C
para el elipsoide normal un semieje mayor de a = 6,378,137, 0m y uno menor de
b = 6,356,752, 3m.
Con esto la inversa del aplanamiento del elipsoide es: f −1 = a−b
a
= 294,978698214. La
√
RU
excentricidad es ϵ = a2 − b2 /a.
ENU Terna geográfica local, con ejes x,y ,z apuntados hacia el Este, Norte y Arriba
respectivamente, tomando como vertical la normal al elipsoide WGS-84
O
ṗi = v i (A.48)
i
q ib f b q̄ ib i i
v̇ = +γ p (A.49)
( )
1 i ω bib
q̇ ib = q (A.50)
2 b 0
N
En terna ECEF agregamos los efectos de la rotación terrestre:
ṗe = v e (A.51)
IO
e
v̇ = Ceb f b
+ γ (p ) − e
×v e
2Ωeie e
(A.52)
( ) ( )
b e
1 ω eb 1 Ωie
q̇ eb = q eb − q eb (A.53)
2 0 2 0
C
A.5.5. Navegación Inercial
La navegación inercial se logra integrando de forma numérica y en tiempo real el conjunto
C
de ecuaciones elegido, normalmente ECEF; tomando como entrada las mediciones de
fuerza especı́fica f b y velocidad angular ω b .
Esta integración puede realizarse mediante un esquema de Euler o Runge-Kutta, aunque
RU
existen algoritmos optimizados que permiten alcanzar buena precisión con menor carga
computacional como el algorı́tmo adaptado de Savage [Sav98a, Sav98b] (ver [Esp16,
cap.7]).
( ) " #( ) " #
ṗ 0 I p 0
= + f
v̇ 0 0 v I
N
donde p, v, f ∈ R3 .
En este caso el modelo es lineal, por lo cual podemos realizar la integración exacta con el
O
modelo de tiempo discreto tomando como f las mediciones de los acelerómetros, lo cual
constituirı́a la única fuente de error debido a los ruidos de medición de estos sensores.
Si en cambio contáramos solo con sensores alineados con la terna móvil deberı́amos
C
" #
cos ψ − sin ψ
Crb (ψ) =
N
sin ψ cos ψ
donde Crb (ψ) es la matriz de rotación que proyecta los vectores definidos en terna móvil
IO
a la terna de referencia, pr = {x, y} y v r = {u, v} son los vectores de posición y
velocidad en la terna de referencia, ω es la velocidad angular de la terna móvil respecto
de la terna de referencia, y f b = {fx , fy } la fuerza especı́fica proyectada en la terna
móvil.
En este caso el modelo es no lineal debido al término Crb (ψ). Habrá errores no solo por
C
los ruidos de medición sino también de origen numérico.
El modelo compacto ẋ = f (x, u) para realizar la integración numérica es:
C
ẋ
u
ẏ
v
u̇ = fx cos ψ − fy sin ψ
RU
v̇
fx sin ψ + fy cos ψ
ψ̇ ω
% x = { x, y, u, v, q }
% u = { hx, hy, hq }
function f = x dot(x, u)
s = sin(x(5));
c = cos(x(5));
Crb = [c -s ; s c];
N
I3 = x dot(xo+0.5*h*I2, u1);
I4 = x dot(xo+h*I3, uf);
xf = xo + h/6*(I1+2*(I2+I3)+I4);
end
N
considera el movimiento de un punto cuyos desplazamientos sucesivos son aleatorios e
independientes, pero con propiedades estadı́sticas estacionarias. Los ejemplos clásicos
son el movimiento Browniano y el proceso de Poisson, o en tiempo discreto la caminata
IO
aleatoria (random walk).
Einstein analizó el movimiento colectivo de partı́culas brownianas, demostrando que si
ρ(x, t) es la densidad de partı́culas en un punto x en el tiempo t, entonces ρ satisface la
ecuación de difusión:
∂ρ ∂2ρ
C
=D 2
∂t ∂x
donde D es la difusividad de masa. Asumiendo que todas las partı́culas se encuentran
C
en el origen en el instante inicial t = 0, la ecuación de difusión arroja la solución:
ρ0 x2
ρ(x, t) = √ e− 4D t
4πD t
RU
Esta expresión le permitió a Einstein calcular de forma directa los momentos estadı́sticos.
El primero (valor medio) tiende a cero, indicando que las partı́culas brownianas tienen
igual probabilidad de moverse hacia la izquierda o hacia la derecha. El segundo
momento (varianza) queda determinado por:
ST
x¯2 (t) = 2D t
Figura A.13: Errores en la estimación de posición y velocidad mediante la integral de un acelerómetro con ruido blanco de
O
Cada uno de estos sistemas se compone de una constelación de satélites que orbitan
ST
Un receptor GNSS captura las señales transmitidas por algunos de los satélites “visibles”
N
desde su ubicación (en todo momento hay satélites que se encuentran al otro lado
del globo, y por lo tanto sus señales no llegan al receptor por lo que se los considera
“invisibles” desde ese lugar en ese momento).
O
En primer término el receptor se sincroniza con los satélites que va a utilizar, y luego
para todos satélites “capturados” calcula el tiempo que tardó la señal emitida por cada
satélite visible en llegar hasta el receptor.
Conociendo la velocidad a la que viaja la señal (que es la velocidad de la luz) se obtiene
C
una estimación de la distancia entre el receptor y cada uno de los satélites recibidos. A
estas estimaciones de distancia se las denomina “pseudo-rango”.
Dado que la señal de cada satélite transporta información que permite determinar su
posición en el momento de la transmisión, capturando las emisiones de al menos cuatro
EN
satélites es posible calcular la posición del receptor GNSS respecto del sistema de
referencia ECEF y ajustar su reloj interno en relación al del sistema GNSS, que es muy
preciso (variaciones menores a la millonésima parte de un segundo).
Como toda medición, la estimación de posición realizada por el receptor GNSS no estará
exenta de errores.
IO
Exactitud del GPS
El sistema GPS brinda dos servicios, uno de alta precisión denominado PPS (Precise
Positioning Service) para uso militar y otro estándar o SPS (Standard Positioning
Service) para uso civil.
C
Al inicio de su operación en 1993 con 24 satélites el GPS-SPS tenı́a una exactitud del
orden de los 100m, pero esto ha ido mejorando con su evolución.
Una de las fuentes primarias de error son las distorsiones en la velocidad de propagación
C
de las señales por variaciones en la ionósfera, lo cual era mitigado en el servicio PPS
utilizando dos señales con bandas de frecuencia diferentes.
Para lograr mayor precisión se recurre a un sistema diferencia, en donde una estación
RU
fija en una posición conocida computa los errores ionosféricos y los transmite a los
receptores móviles mediante algún enlace de datos. Esta técnica dio origen al DGPS
(Differential GPS), y al RTK (Real Time Kinematic), en la cual se utilizan todas las
constelaciones disponibles.
Para 2007 los buenos receptores GPS eran capaces de alcanzar una exactitud de 3m el
ST
95 % del tiempo, aunque solo se garantizaba una exactitud de 7,8m con esa probabilidad.
Al hablar del 95 % del tiempo nos referimos a que es posible ocasionalmente obtener
muestras con un error mayor.
Estadı́sticamente habrá un 4,7 % del tiempo restante en el cual el error serı́a mayor pero
acotado a una banda 1,5 más amplia. Esta banda se incrementa a 2,5 veces si incluimos
N
Debe notarse en este punto que los receptores en el arranque trabajan con pocos
satélites y por lo tanto no alcanzan a precisión nominal. Esta situación mejora a medida
C
Hay errores adicionales por rebote de las señales en el entorno. En la figura A.15 se
EN
observa que la distancia recorrida por la señal que rebota es mayor que la distancia de
separación entre el receptor y el satélite, por lo cual la determinación de distancia entre
ambos tendrá un error mayor al normal.
Por último tengamos en cuenta que el receptor GPS da la posición de su antena, con lo
cual en el análisis debe considerarse donde se ubica la misma en el móvil bajo estudio.
Existen dos estrategias para mitigar este problema: utilizar sensores de muy alta calidad
N
(bajo ruido) para acotar la divergencia a valores aceptables en el perı́odo de operación;
o integrar otros sensores para mejorar la observabilidad del algoritmo, utilizando un
filtro de Kalman (u otros esquemas alternativos) para fusionar esta estimación con las
mediciones.
IO
La ecuación de salida para el filtro dependerá de los sensores a fusionar.
Fusión
C
Para la fusión de datos se puede usar un filtro de Kalman Extendido (EKF) para un
modelo de la forma:
C
ẋ = f (x, u, t) (A.56)
y = h (x, u, t) (A.57)
RU
Computamos una aproximación lineal en cada instante de cómputo y aplicamos el
algoritmo de Kalman para el caso lineal (5.45) (5.46) (5.47):
∂f ∂f ∂h
Ak = , Bk = , Hk = (A.58)
N
t=ts 0
Qk = Gk WGTk
P− T
k = Fk Pk−1 F + Qk (A.60)
La ecuación de salida (A.57) queda definida por los sensores a fusionar, y puede
cambiar de un instante de cómputo al siguiente en función de la disponibilidad de estos
sensores. Por lo tanto será necesario computar la ganancia de Kalman en cada instante
de muestreo con la ecuación (5.46):
N
−1
Kk = P− T − T
k Hk Hk Pk Hk + Rk (A.61)
IO
salida el modelo no-lineal (A.57)):
ŷ k = h x̂−
k , uk−1 , tk (A.62)
x̂k = x̂−
k + Kk (y k − ŷ k ) (A.63)
C
Finalmente actualizamos la covarianza de la estimación para el próximo instante de
muestreo con la ecuación (5.47):
C
Pk = (I − Kk Hk ) P−
k (A.64)
Heh = c31
c32 c33 (A.66)
O
P
Para la tropopausa se puede utilizar la expresión:
" −γ #
T p
EN
h= 1− (A.68)
L p0
Para esto es necesario definir una presión de referencia para obtener una indicación de
altura.
Adoptando el valor QFE tendremos una medición de altura sobre el terreno.
Con QNH se obtiene la altitud respecto del nivel del mar (geoide terrestre).
C
correlacionar de forma directa la altura barométrica con la altura respecto del elipsoide
normal.
En el caso de navegaciones prolongadas, ante el pasaje de fenómenos meteorológicos
C
intensos; o al volar en terrenos accidentados en condiciones de viento fuerte deberán
compensarse las variaciones de la presión de referencia aumentando el modelo de
estados.
RU
La varianza para este desvı́o deberı́a ajustarse a la condición climática.
v̇ 0 0 v 1
( ) " #( ) " #
hk 1 ts hk−1 t2s /2
f¯ + g
= + (A.70)
vk 0 1 vk−1 ts
C
Dado que para la fuerza especı́fica no se puede decir que haya una retención de orden
cero, podrı́amos aproximar por trapecios: f¯ = (fk−1 + fk )/2.
La estimación {ĥk , v̂k } tendrá una incertidumbre cuantificada por una matriz de
EN
N
Linealizando para una altura h0 (presión p0 ):
γ−1
dy L L
IO
y ≈ y0 + ∆h = y0 − γ pr 1− h ∆h (A.73)
dh T T
C
h
L L
yk = c 0 , c = −γ pr 1 − hk (A.74)
v T T
C
Con esto calculamos la ganancia de Kalman usando la expresión (A.61), y estimando la
salida (ecuación (A.62)) como:
γ
L
RU
ŷk = pr 1 − hk (A.75)
T
Fusión de un Lidar El Lidar (Laser Imaging Detection and Ranging) indica distancia a
un objeto reflectante. La apretura del haz es pequeña, por lo cual es necesario conocer
la posición del obstáculo y la actitud del sensor para correlacionar esta medición con el
estado de la posición y actitud de la aeronave.
Por lo tanto el uso de un sensor de este tipo requiere integrar técnicas de tipo
SLAM (Simultaneous Localization And Mapping), excepto que se opere en un ambiente
N
conocido.
To do (??)
O
y = Cbe me
donde me el el vector de campo magnético local proyectado en la terna ECEF y Cbe es
la matriz de rotación entre el sensor y dicha terna. lamentablemente el vector de campo
EN
magnético varı́a tanto en intensidad como en dirección sobre la superficie terrestre, por
lo cual serı́a necesario determinarlo mediante un proceso de inicialización.
N
Hg = 03×4 I3×3 03×3
Si incluimos velocidad:
IO
Hg = 06×4 I6×6
Pero debe tenerse en cuenta que el receptor GNSS establece la posición de su antena,
y esta no coincide con la ubicación del arreglo de sensores inerciales (ISA), que es en
C
principio el punto de referencia para la navegación integrada. Por lo tanto la ecuación de
salida deberı́a ser:
C
,
I3×3 03×3
Hg = Ha
donde
∂Ceb b
Ha = r
∂q ant
ST
N
O
C
EN
C
C
1.1. superficies de control aerodinámico en un avión . . . . . . . . . . . . . . . . . . . . . 3
1.2. Sistema realimentado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
RU
1.3. Lazo de control a lazo cerrado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.5. Diagrama en bloques de un sistema realimentado con un compensador PID . . . . . . 8
1.6. En esta imágen vemos arriba inverters de diferente potencia (a la izquierda) para control
de motores eléctricos, un interfaz de operador (a la derecha) y varios modelos de PLCs
al centro y debajo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.7. Sistema SCADA en una sala de control . . . . . . . . . . . . . . . . . . . . . . . . . . 10
ST
combustión interna . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
2.9. Replanteo de la figura 2.6 para poner en evidencia las sensibilidades del error a las
distintas entradas del lazo SISO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
EN
213
3.4. Algunos ejemplos del “teorema del encierro” (tomado de [Oga10]). En los casos (a) y
(b) hay encierro al origen de la curva transformada, mientras que en los (c) y (d) no.
Observar a la izquierda la cantidad de polos y ceros en la región acotada por la curva
original. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
3.7. Margenes de estabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
3.8. Replanteo del lazo estándar a uno con realimentación unitaria . . . . . . . . . . . . . . 64
3.9. Interpretación gráfica de los términos de la ecuación (??) . . . . . . . . . . . . . . . . 64
[Link] para la determinación de la respuesta en frecuencia de lazo cerrado a partir de
N
la traza de nyquist del lazo abierto (tomado de [Oga98]) . . . . . . . . . . . . . . . . . 65
[Link] de la hipótesis de control perfecto para una dinámica dominante de segundo
orden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
IO
[Link]́n de la respuesta transitoria . . . . . . . . . . . . . . . . . . . . . . . . 72
[Link] de las especificaciones de respuesta transitoria a regiones admisibles para los
polos de lazo cerrado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
[Link] de un compensador en adelanto mediante el método de la bisectriz (ver [Oga10,
C
p. 315]) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
C
4.2. Análisis de desempeño en relación a la sensibilidad . . . . . . . . . . . . . . . . . . . 90
4.3. Lazo de control general . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
s + 0,8
RU
4.4. Polos-ceros y respuesta en frecuencia para G1 (s) = 7,5 (azul) y G2 (s) =
(s + 2)(s + 3)
−s + 0,8
7,5 (rojo) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
(s + 2)(s + 3)
4.5. Análisis de estabilidad robusta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
4.6. Análisis de estabilidad robusta con el ı́ndice de robustez . . . . . . . . . . . . . . . . . 102
4.7. Análisis de desempeño robusto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
ST
A.3. Reducción del diagrama en bloques para el modelo de 1/4 de auto con 2 grados de
libertad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176
A.4. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179
A.5. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180
A.7. Fases de la maniobra de alunizaje de ?as misiones Apollo de la NASA . . . . . . . . . 184
A.8. Esquema del ajuste del vector de empuje para control de trayectoria . . . . . . . . . . 185
N
IO
C
C
RU
ST
N
O
C
EN
C
C
[A.81] Varga A. A schur method for pole assignment. IEEE Transactions in Automatic Control,
AC-26(2):517–519, 1981.
RU
[Doy78] John C. Doyle. Guaranteed margins for lqg regulators. IEEE Transactions on Automatic
Control, 23(4):756–757, 1978.
[Esp16] Martı́n España. Sistemas de Navegación Integrada con Aplicaciones. CONAE, 2 edition,
2016.
[GGS01] Graham C. Goodwin, Stefan F. Graebe, and Mario E. Salgado. Control System Design.
Prentice Hall, 2001.
[JENR09] Eduardo F. Camacho Julio E. Normey-Rico. Unified approach for robust dead-time
N
[JND85] [Link], N.K. Nichols, and P. Vann Dooren. Robust pole assignment in linear state
O
[Kuo96] Benjamin C. Kuo. Sistemas de Control Automático. Prentice Hall, 7 edition, 1996.
C
[Oga93] Katsuhiko Ogata. Ingenierı́a de Control Moderna. Prentice Hall, 2 edition, 1993.
[Oga96] Katsuhiko Ogata. Sistemas de Control en Tiempo Discreto. Prentice Hall, 2 edition, 1996.
[Oga98] Katsuhiko Ogata. Ingenierı́a de Control Moderna. Prentice Hall, 3 edition, 1998.
EN
[Oga10] Katsuhiko Ogata. Ingenierı́a de Control Moderna. Prentice Hall, 5 edition, 2010.
[Peñ92] Ricardo S. Sánchez Peña. Introducción a los Teorı́a de Control Robusto. AADECA, 1992.
[Sav98a] Paul G. Savage. Strapdown inertial navigation integration algorithm design part 1: Attitude
algorithms. Journal of Guidance, Control, and Dynamics, 21(1):19–28, jan, feb 1998.
217
[Sav98b] Paul G. Savage. Strapdown inertial navigation integration algorithm design part 2: Velocity
and position algorithms. Journal of Guidance, Control, and Dynamics, 21(2):208–221, mar
1998.
[SP01] Sigurd Skogestad and Ian Postlethwaite. Multivariable Feedback Control - Analysis and
Design. John Wiley & Sons, 2 edition, 2001.
[Tew11] Ashish Tewari. Advanced Control of Aircraft, Spacecraft and Rockets. John Wiley and Sons,
2011.
N
[ZN42] J.G. Ziegler and N.B. Nichols. Optimum settings for automatic controllers. 1942.
IO
[Zum20] Augusto J. Zumarraga. Sistemas Dinámicos. 0.28 edition, 2020.
[ÄW04] Karl J. Äström and Björn Wittenmark. Computer Controlled Systems - Theory and Design.
Prentice Hall, 3 edition, 2004.
C
C
RU
ST
N
O
C
EN