0% encontró este documento útil (0 votos)
126 vistas60 páginas

Control PID en Tolvas Industriales

Este documento presenta un modelo matemático de una tolva y cinta transportadora para controlar la cantidad de arena al final de la cinta. Describe el modelo dinámico del sistema, incluyendo variables como la tensión de control de la válvula, la cantidad de arena medida, y una perturbación. También describe un control proporcional básico en lazo cerrado para mejorar la precisión del sistema frente a perturbaciones.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
126 vistas60 páginas

Control PID en Tolvas Industriales

Este documento presenta un modelo matemático de una tolva y cinta transportadora para controlar la cantidad de arena al final de la cinta. Describe el modelo dinámico del sistema, incluyendo variables como la tensión de control de la válvula, la cantidad de arena medida, y una perturbación. También describe un control proporcional básico en lazo cerrado para mejorar la precisión del sistema frente a perturbaciones.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

CONCEPTOS BÁSICOS Y

ACCIONES DE CONTROL PID


Prof. Juan Luis Zamora Macho
Prof. F. Luis Pagola y de las Heras
Prof. Aurelio García Cerrada
Prof. Ramón Rodríguez Pecharromán

ESCUELA TÉCNICA SUPERIOR DE INGENIERÍA


DEPARTAMENTO DE ELECTRÓNICA, AUTOMÁTICA
Y COMUNICACIONES
Tolva
1. Descripción del problema
Supóngase una tolva provista de una electroválvula en su base (véase la figura 1.1) que puede
verter la arena que contiene sobre una cinta transportadora. Se pretende controlar de forma
precisa la cantidad de arena al final de la cinta transportadora para su utilización en un
proceso industrial. La apertura de la electroválvula depende de la tensión aplicada en sus
terminales de entrada (variable de control o mando), mientras que la cantidad de arena al final
de la cinta transportadora (variable a controlar o salida) se mide mediante un sensor
piezoeléctrico que suministra una tensión proporcional a la presión a la que se ve sometido.

Figura 1.1: Tolva y cinta transportadora

Una primera estrategia consiste en realizar una calibración entre la tensión aplicada a la
electroválvula y la cantidad de arena al final de la cinta transportadora. A esta estrategia de
control se la denomina control en lazo abierto. Utilizando esta calibración, es posible calcular
la tensión de mando que hay que aplicar a la electroválvula para conseguir en régimen
permanente la cantidad de arena deseada. La tensión de mando puede aplicarse manualmente
mediante un potenciómetro o transmitir su valor digital desde el ordenador del centro de
control de la fábrica y convertirlo en un valor analógico mediante un convertidor D/A.

Sin embargo esta estrategia tiene un problema de precisión, ya que la calibración, al realizarse
para unas condiciones nominales de la arena, deja de ser válida cuando se utiliza arena más
húmeda o de grano más grueso. La consecuencia de utilizar arena en distintas condiciones que
las nominales es una variación en la cantidad de arena al final de la cinta transportadora para
una cierta apertura de la electroválvula (perturbación). Es decir, el control en lazo abierto,
basado en una calibración de la relación variable de mando – salida en régimen permanente,
no es capaz de corregir el error introducido en la salida por la presencia de una perturbación
en el sistema.

1
Otra estrategia más eficaz para resolver este problema de precisión consiste en aplicar un
control en lazo cerrado, tal como se muestra en la figura 1.1. Esta estrategia se basa en
comparar la medida de la salida del sistema con su valor deseado o valor de referencia y
procesar el error correspondiente mediante un regulador o controlador para generar la
variable de control o mando con la que actuar de forma automática sobre el sistema a
controlar. El regulador o controlador consiste frecuentemente en un circuito electrónico
basado en amplificadores operacionales (control analógico) o en un programa ejecutado en un
microprocesador o cualquier otro dispositivo de procesamiento (control digital). En ambos
casos, la variable de referencia o valor deseado de la salida puede generarse analógicamente
mediante un potenciómetro o introducirse digitalmente mediante un teclado, igual que
ocurría con la variable de mando en el control en lazo abierto.

2. Modelo de la planta

El primer requisito para el diseño del regulador es disponer de un modelo matemático de


carácter dinámico que represente la relación entre la variable de mando (entrada) y la variable
de salida del sistema a controlar. Es conveniente que este modelo también incluya la influencia
de la perturbación sobre la salida con el fin de analizar su efecto con y sin regulador.

En primer lugar se definen las variables involucradas en este modelo, su margen nominal de
variación y unidades físicas:

 u(t) es la tensión de control de la electroválvula o variable de mando del sistema de


control. Se supondrá que su margen está definido entre 0 y 10 V.
 y(t) es la cantidad de arena al final de la cinta transportadora, que en este caso es la
variable a controlar o variable de salida del sistema. Se define su margen entre 0 y 50
kg/m2.
 x(t) es la cantidad de arena al comienzo de la cinta transportadora, justo en la base de
la tolva. Su margen es el mismo que el de la variable de salida y(t).
 z(t) es la apertura real de la válvula entre 0 y 100%. Nominalmente, se corresponde
con el margen de la salida.
 ym(t) es la medida de la variable de salida mediante un sensor piezoeléctrico que
suministra una tensión proporcional a la presión a la que se ve sometido. Se supone
que el sensor es lineal y que la tensión suministrada, una vez amplificada, está en el
margen de 0 a 10 V. La tensión máxima de 10 V se corresponde con un valor de
igual a 50 kg/m2.
 d(t) es una perturbación, variable que se utiliza para representar matemáticamente el
efecto de una variación de las condiciones de la arena (humedad, grosor del grano)
con respecto a las condiciones nominales. Puede incluir también otras causas que
produzcan variaciones en la cantidad de arena correspondiente a una apertura de
válvula determinada: la carga en la tolva, la temperatura, la falta de linealidad de la
válvula, etc. La cantidad de arena x(t) es la correspondiente a la apertura z(t) menos la
perturbación d(t). El signo menos aquí no es realmente necesario; se ha usado por
analogía con otras perturbaciones de otros procesos, en los que aparece así

2
frecuentemente. Se ha medido que, en el peor de los casos, la cantidad de arena se
desvía un 10% de la correspondiente a la apertura.

Con el fin de simplificar el modelo y poder generalizar fácilmente los resultados aunque
cambie el margen de las variables involucradas, se manejarán magnitudes por unidad (pu) en
el margen entre 0 y 1. Los valores en (pu) se obtienen dividiendo los valores reales de cada
variable por su magnitud base, que coincide con el valor máximo de su margen. Sin embargo,
la perturbación d(t) utiliza la misma magnitud base que la apertura de la electroválvula, por lo
que su margen varía entre 0,1 y -0,1 (pu)

A continuación se definen los parámetros que se requieren en el modelo dinámico de la


planta:

  es el retardo de transporte en la cinta transportadora. Si su velocidad es constante e


igual a v y su longitud es L, el retardo resulta  = L/v
  es la constante de tiempo de actuación de la electroválvula. Ésta se modela como un
sistema de primer orden. La ganancia estática igual a 1 en (pu).

En el presente análisis se tomará el retardo  = 1s y la constante de tiempo  = 0,2s

Las ecuaciones que modelan el comportamiento dinámico de la planta expresando las


variables en (pu) son las siguientes:

La transformada de Laplace Y(s) de la respuesta forzada de la salida y(t) puede obtenerse


como superposición de los efectos del mando U(s) y de la perturbación D(s):

A partir de las ganancias estáticas de las funciones de transferencia P(s) y Pd(s) es posible
analizar la precisión en régimen permanente del sistema de control en lazo abierto, tanto en el
seguimiento del valor deseado como en el rechazo de la perturbación. Las ganancia estáticas
de P(s) y Pd(s) son respectivamente 1 y -1. El valor de 1 en la ganancia estática de P(s) indica
que si la calibración del sistema es correcta y la arena es de calidad nominal (d(t) = 0) la salida
tendrá el mismo valor en (pu) que el mando en régimen permanente, el cual coincide en lazo
abierto con el valor deseado. Sin embargo, la ganancia estática igual a -1 en Pd(s) indica que si
la arena no es de calidad nominal se producirá una desviación en la salida con respecto a su
valor deseado (mando) que coincidirá en (pu) con el valor de la perturbación d(t) en régimen
permanente. Este último hecho puede ser inaceptable si la calidad del proceso de fabricación
depende críticamente del valor de la salida en régimen permanente.

3
Las funciones de transferencia P(s) y Pd(s) permitirán también diseñar y analizar el efecto de
aplicar diferentes estrategias de control en lazo cerrado. En la figura 2.1 se representa el
diagrama de bloques de la planta en Simulink. Se incluye una saturación en la tensión de la
electroválvula o mando entre 0 y 1 para que la respuesta del sistema en simulación tenga en
cuenta la limitación que existe en el sistema real. La limitación física en la apertura ya está
incluida en la limitación de la tensión de mando de la electroválvula.

Figura 2.1: Diagrama de bloques de la planta en Simulink

3. Control proporcional

En la figura 3.1 se muestra el diagrama de bloques de un control P (proporcional) en lazo


cerrado (o por realimentación). La tensión de la electroválvula u(t) es el resultado de
multiplicar por la ganancia K el error de control o diferencia entre el valor deseado o referencia
r(t) y la medida ym(t) de la salida. La medida ym(t) coincide en este caso con la salida y(t) en
(pu).

Figura 3.1: Diagrama de bloques del control P

Aplicar un control proporcional es una estrategia de control muy simple. Resulta bastante
intuitivo abrir más la electroválvula si la salida es muy inferior al valor deseado y reducir esa
apertura cuando la salida se acerca al valor deseado.

A continuación se analizará matemáticamente qué efecto tiene el valor de la ganancia K del


control sobre la precisión en régimen permanente del sistema de control, tanto en el
seguimiento del valor de referencia r(t) como en el rechazo de la perturbación d(t). Ambas
entradas se supondrán constantes.

Para ello, se calculan en función de K las ganancias estáticas de las funciones de transferencia
de lazo cerrado entre referencia y salida (precisión en el seguimiento de la referencia) y entre

4
perturbación y salida (precisión en el rechazo de la perturbación). Estas funciones de
transferencia y sus correspondientes ganancias estáticas son las siguientes:

Nota: no es estrictamente necesario obtener primero las funciones de transferencia; puede


hacerse s=0 en el diagrama de bloques para obtener un modelo estático.

El objetivo final es que F(0) = 1 y Fd(0) = 0, o que se aproximen lo más posible a estos valores
deseables con el fin de poder seguir en régimen permanente al valor de referencia de la salida
y rechazar el efecto de la perturbación. En el caso del control en lazo abierto, se cumplía
plenamente el primer objetivo pero no así el segundo, ya que se obtenía una ganancia igual a -
1 en la función de transferencia entre perturbación y salida. En este caso, los valores de ambas
ganancias estáticas dependen de K, y resulta fácil deducir que los valores deseables se
obtienen cuando K tiende a infinito.

Por lo tanto, la primera conclusión que se obtiene es que es recomendable incrementar la


ganancia K del control P todo lo que sea posible para mejorar la precisión del sistema. Sin
embargo, el valor de K afectará también a la estabilidad y a la respuesta transitoria del
sistema. El sistema debe ser estable, y sin excesivas oscilaciones que le acerquen
peligrosamente a un comportamiento inestable.

En este caso, no es sencillo realizar un análisis teórico de cómo será la respuesta transitoria del
sistema al modificar el valor de K, ya que, debido al retardo, las funciones de transferencia no
son racionales sino trascendentes y tienen infinitos polos. Recuérdese que los polos de la
función de transferencia determinan la estabilidad del sistema y los modos de respuesta
presentes (exponenciales o sinusoides amortiguadas) en la respuesta transitoria del sistema.
Por esta razón, resulta más práctico en este caso recurrir a la simulación de la respuesta del
sistema con la ayuda de una herramienta como Simulink con el fin de evaluar la influencia de
K.

En la figura 3.2 se representa el diagrama de Simulink que se ha empleado para simular la


respuesta del sistema ante escalones aplicados tanto en la referencia r(t) como en la
perturbación d(t).

5
Figura 3.2: Diagrama de bloques del control P para simulación

En el diagrama de bloques de la figura 3.2 se ha añadido una saturación de la medida de la


salida con límites en 0 y 1 en (pu), sendos escalones en la referencia y la perturbación y varios
osciloscopios y displays de Simulink para visualizar las señales más relevantes y sus valores en
régimen permanente. El tiempo final de simulación se ha fijado en 30 segundos. La simulación
consta de los siguientes transitorios:

 Arranque t = 0 del sistema hasta un valor inicial r(t) = 0,5 con d(t) = 0
 En t = 10 se cambia instantáneamente la referencia a un valor r(t) = 0,7
 En t = 20 se introduce un escalón en la perturbación hasta su valor máximo d(t) = 0,1

El cálculo de errores en régimen permanente en un sistema de control ante entradas


constantes, tanto en el seguimiento de la referencia como en el rechazo de la perturbación,
puede realizarse teóricamente, por simulación o experimentalmente a partir de un ensayo. En
cualquier caso los errores se definen de la siguiente forma:

 Error de seguimiento a la referencia: , para .


 Error de rechazo de la perturbación: , para .

Las anteriores definiciones significan que los errores:

 Se miden de forma separada para referencia y perturbación.


 Se definen como la diferencia entre el valor deseado y el valor real.
 Se calculan de forma incremental, no con valores absolutos.
 Se normalizan dividiendo por el incremento de la entrada.

Posteriormente, en el transcurso de la asignatura, se estudiará de forma sistemática el cálculo


de errores en régimen permanente. No obstante, en este capítulo de introducción se adelanta
la forma teórica de calcular estos errores para entradas constantes. Estos errores pueden
calcularse a partir de las funciones de transferencia F(s) y Fd(s) del siguiente modo:

 Error de seguimiento a la referencia: es = 1  F(0)


 Error de rechazo de la perturbación: ed = 0  Fd(0)

6
La justificación teórica de estas expresiones es sencilla a partir de las definiciones anteriores.

Utilizando el modelo de Simulink representado en la figura 3.2, se selecciona un valor de K que


genere una respuesta transitoria aceptable, sin excesivas oscilaciones. Se ha buscado que el
sobrepaso en la respuesta al escalón en la referencia sea aproximadamente un 20%, valor que
está en el límite de lo aceptable en el control de procesos industriales. Mediante sucesivos
ensayos se encuentra K = 0,2

En la figura 3.3 se muestra el transitorio completo de la salida del sistema y de la variable de


mando, según la secuencia de variaciones en referencia y perturbación descrita previamente.

Figura 3.3: Respuesta de la salida y el mando para K = 0,2

El mando es proporcional al error, por lo que es mayor al principio de aplicar los escalones de
referencia. También crece cuando disminuye la salida por efecto de la perturbación,
compensando (en este ejemplo sólo parcialmente) el efecto de la misma.

Si se deducen experimentalmente los errores de seguimiento de referencia y rechazo de


perturbación, resultan:

Si se calculan los errores teóricamente para el mismo valor de K se obtienen los mismos
resultados:

7
Nótese que el error de seguimiento de referencia es adimensional al ser un cociente de
variables que deben estar expresadas en las mismas unidades. Por esta razón, a veces se
expresa en %, en este caso el 83.3%. Sin embargo, el error de rechazo de la perturbación tiene
habitualmente unidades, ya que se calcula mediante un cociente de variables que pueden
expresarse en unidades diferentes. En este caso no ocurre así porque se está trabajando con
variables en (pu).

Para este valor de K los errores obtenidos en régimen permanente no son aceptables. La
solución sería aumentar el valor de la ganancia K. Sin embargo esta solución conlleva un
aumento inaceptable del sobrepaso y una respuesta cada vez más oscilante. En las figuras 3.4
y 3.5 se representan las simulaciones obtenidas para K = 0,5 y K = 1. Aumentando más el valor
de K se llegaría a oscilaciones crecientes, es decir un sistema inestable.

Figura 3.4: Respuesta de la salida y el mando para K = 0,5

8
Figura 3.5: Respuesta de la salida y el mando para K = 1

La conclusión del análisis realizado es que elevar la ganancia del control proporcional mejora la
precisión del sistema de control, tanto en el seguimiento de la referencia como en el rechazo
de la perturbación. Sin embargo, ese mismo incremento de la ganancia compromete el
amortiguamiento del sistema y en última instancia incluso la estabilidad. Por lo tanto, debido
al compromiso existente entre precisión y amortiguamiento, el único grado de libertad del
control P debe emplearse para limitar el amortiguamiento que es la especificación más crítica
por suponer un margen de seguridad frente al comportamiento inestable del sistema. Si para
un valor de K que da un amortiguamiento aceptable la precisión resultante no es satisfactoria,
como ocurre en este ejemplo, se hace imprescindible utilizar una estrategia de control más
sofisticada para mejorar la precisión sin comprometer el amortiguamiento.

Figura 3.6: Circuito electrónico para implantar un control P

En la figura 3.6 se muestra cómo implantar el control P mediante un amplificador diferencial


basado en un único amplificador operacional. La tensión de referencia r(t) se introduce

9
mediante un potenciómetro que debe generar una tensión en el mismo margen que la tensión
de medida ym(t) procedente del sensor. La tensión de mando u(t) es proporcional a la
diferencia (error) e(t) = r(t)  ym(t) con ganancia K = R2/R1

A continuación se esboza un programa para implantar un control P en un controlador digital.


Se adquieren las medidas (muestras) de referencia y de salida cada Ts segundos, y se
ejecuta el programa con la misma periodicidad.

Repetir:
1 Esperar la interrupción del reloj (cada Ts segundos)
2 Leer la medida del convertidor A/D y el valor de referencia de memoria: y, r
3 Calcular el error y el mando:

4 Poner el mando en el convertidor D/A : u


Fin del repetir
Se aplica a la electroválvula una tensión constante correspondiente a u durante Ts
segundos hasta el siguiente refresco.

4. Control proporcional integral

El objetivo fundamental de un control proporcional integral (control PI) es anular los errores
de seguimiento a la referencia y de rechazo de la perturbación siempre que se alcance un
punto de operación o punto de equilibrio (situación donde todas las variables del sistema son
constantes). Esto ocurrirá si además el sistema en lazo cerrado es estable. Por lo tanto, el
diseño del sistema de control PI se basa en obtener una respuesta transitoria con
amortiguamiento aceptable. Si esto se consigue, la presencia de la acción integral garantiza
que la referencia (constante) y la medida de la salida coinciden en régimen permanente,
incluso en presencia de perturbaciones (constantes) en el sistema.

Figura 4.1: Diagrama de bloques del control PI

10
La figura 4.1 muestra el diagrama de bloques de un control PI. La variable de mando u(t) se
genera mediante la suma de dos acciones, una proporcional al error e(t) = r(t)  ym(t) y otra
proporcional a la integral de este error.

La anulación del error de control en régimen permanente se puede justificar de diferentes


formas, si el sistema en lazo cerrado es estable. En este último supuesto, para que el sistema
permanezca en un punto de trabajo o equilibrio, donde todas las variables son constantes, es
condición necesaria que la salida del integrador 1/s permanezca también en un valor
constante. Esta condición sólo es posible si la entrada del integrador, proporcional a e(t), vale
0, lo cual implica que r(t)  ym(t) en régimen permanente. Esto es cierto aunque la
perturbación d(t) no sea 0.

Otra forma de justificar la anulación de los errores de seguimiento de la referencia y de


rechazo de la perturbación en régimen permanente es mediante el cálculo de las ganancias
estáticas de las funciones de transferencia de lazo cerrado entre referencia y salida y entre
perturbación y salida.

( )
( ) ( )

Mediante esta estrategia de control PI en lazo cerrado se consiguen ganancias estáticas que
anulan el error de seguimiento y rechazan por completo la perturbación.

El diseño del control PI puede acometerse de forma sencilla a partir del control P que garantiza
un amortiguamiento aceptable. Se obtuvo en la sección anterior un valor de K que producía un
sobrepaso razonable, del 20%. El procedimiento que se va a aplicar consiste en mantener
constante la ganancia proporcional K = 0,2 y variar la constante de tiempo integral Ti hasta
conseguir una respuesta similar a la del control proporcional (sobrepaso del 20%
aproximadamente) pero con error 0 en régimen permanente. Puede comenzarse probando
con un valor alto (Ti = 5) que anula el error muy lentamente y da una respuesta similar a la del
control P para tiempos cortos.

En la figura 4.2 se representa la respuesta de la salida y(t) del sistema con control PI y para la
secuencia de cambios en referencia y perturbación descrita en la sección 3 para K = 0,2 y
diferentes valores del parámetro Ti. Se encuentra que un valor adecuado es Ti = 0,3. Un valor
del doble da una respuesta demasiado amortiguada, que tarda en alcanzar el régimen
permanente. Un valor de la mitad da una respuesta oscilante con demasiado sobrepaso.

En general, el precio que se paga con respecto al control P, por mejorar cualitativamente la
precisión puede ser un cierto deterioro de la rapidez o el amortiguamiento de la respuesta
transitoria. En muchas aplicaciones, como por ejemplo la que nos ocupa, este precio está
sobradamente justificado porque la precisión es prioritaria frente a la rapidez de respuesta si
el sistema opera la mayor parte del tiempo en régimen permanente.

11
El procedimiento que se ha empleado se basa en simulaciones a partir de un modelo. Durante
el transcurso de la asignatura se estudiarán otros procedimientos de carácter más analítico
para el diseño del control PI. Por otra parte, si es viable realizar pruebas sobre el sistema real,
el procedimiento descrito aquí es de gran utilidad práctica: la ventaja es que no se requiere un
modelo de la planta para realizar el ajuste del control.

Figura 4.2: Respuesta de la salida con control PI para diferentes valores de Ti

En la figura 4.3 se muestra cómo implantar el control PI mediante el mismo amplificador


diferencial empleado para implantar un control P seguido de un integrador en configuración
no inversora. Es sencillo comprobar que la función de transferencia del circuito con entrada
y salida viene dada por ⁄ ⁄ , por lo que ⁄ y
.

Figura 4.3: Circuito electrónico para implantar un control PI

12
A continuación se esboza un programa para implantar un control PI en un controlador digital.

Se adquieren las medidas (muestras) de referencia y de salida cada Ts segundos, y se


ejecuta el programa con la misma periodicidad.

Inicializar: i = 0
Repetir:
1 Esperar la interrupción del reloj (cada Ts segundos)
2 Leer la medida del convertidor A/D y el valor de referencia de memoria: y, r
3 Calcular el error, la integral (aproximada) del error, y el mando:

4 Poner el mando en el convertidor D/A : u


Fin del repetir
Se aplica a la electroválvula una tensión constante correspondiente a u durante Ts
segundos hasta el siguiente refresco.

5. Conclusiones

A partir del análisis realizado del problema de control propuesto, se pueden obtener las
siguientes conclusiones que son de aplicación bastante general:

 Un control en lazo abierto no puede compensar el efecto en régimen permanente de


perturbaciones no medidas sobre la salida del sistema. La única estrategia eficaz en
estos casos es aplicar un control en lazo cerrado.
 Se ha presentado un procedimiento de cálculo de errores en régimen permanente
(para entradas constantes), tanto analíticamente como experimentalmente, que es de
aplicación general a cualquier sistema de control.
 El control P presenta como ventaja su sencillez, pero puede implicar un compromiso
entre precisión y amortiguamiento que lo convierta en ineficaz. Si se aumenta la
ganancia del control, mejora la precisión pero empeora el amortiguamiento. Cuando
se fija el amortiguamiento a un valor aceptable con el único grado de libertad del
control, la precisión queda definida y podría no ser satisfactoria.
 El control PI permite superar el compromiso anterior ya que garantiza, si el sistema es
estable, precisión absoluta en régimen permanente para entradas constantes: error
nulo en el seguimiento de la referencia y en el rechazo de la perturbación. El precio
que frecuentemente se paga es un cierto deterioro de la respuesta transitoria con

13
respecto al control P. En este ejemplo la respuesta permanente del control P es tan
mala que es difícil apreciar este deterioro.
 Se ha descrito un método para diseñar de forma sencilla un control PI satisfactorio,
partiendo del control P, que se puede aplicar tanto en simulación como directamente
sobre el sistema real, si es viable realizar pruebas sobre dicho sistema modificando los
parámetros del control. En este último caso, no se requiere un modelo del sistema.

6. Algunos criterios para valorar controles


Se resumen aquí algunas ideas para guiar el diseño de sistemas de control y valorar los
resultados.

 ESTABILIDAD. El sistema completo debe ser estable. Además, el modelo de diseño


debe estar “suficientemente lejos” de ser inestable, ya que el sistema real puede ser
diferente. Ver ROBUSTEZ.
 La salida (y) debe SEGUIR la referencia (r) y RECHAZAR (no seguir) las perturbaciones
(d) y también (n) = ruido de medida, no estudiado en este documento.
 Lo anterior se estudia en RÉGIMEN PERMANENTE: PRECISIÓN.
 Y también en transitorios: AMORTIGUAMIENTO, RAPIDEZ.
 El mando (u) también tiene importancia. De especial interés son su valor máximo, que
puede conducir a SATURACIÓN, y el efecto del RUIDO (n).
 SISTEMA y MODELO: el diseño se lleva a cabo mediante modelos que nunca describen
exactamente el sistema real.
 ROBUSTEZ: un control robusto produce un comportamiento del sistema completo que
no depende demasiado de variaciones en la Planta. En otras palabras, el
comportamiento del sistema en lazo cerrado debe ser adecuado aunque el modelo
usado en el diseño no sea muy bueno.

14
PROBLEMAS

Se resolverán usando los programas de Simulink suministrados, u otros similares. Algunos


están marcados ***, indicando ideas más avanzadas; no deben acometerse antes de resolver
los otros.

P T.1 Tolva, control P. Se compararán y valorarán dos ajustes distintos.

a) Para K=0,2: A partir de la respuesta a escalón en referencia obtener el error de


seguimiento, el sobrepaso, el tiempo de alcance y el tiempo de pico. A partir de la
respuesta a escalón en perturbación obtener el error en régimen permanente y el
máximo error (relacionado también con d).
b) Para K=0,5: Obtener las mismas especificaciones.
c) Representar en un mismo gráfico la referencia r(t) y las respuestas y1(t), y2(t) para
K=0,2 y K=0,5, para los ensayos descritos en el texto.
d) A partir de los resultados anteriores, comparar los dos ajustes y valorar sus fortalezas y
debilidades.

P T.2 *** Tolva, control P. Se introduce una de las medidas de distancia a la inestabilidad: el
margen de ganancia Am.

a) Variando K en distintas simulaciones, determinar (tres cifras significativas) el menor


valor para el que las oscilaciones se mantienen sin amortiguarse: la ganancia última Ku
b) Determinar (dos cifras significativas) la pulsación de las oscilaciones: la pulsación de
oscilación u

El margen de ganancia Am es una especie de coeficiente de seguridad de la estabilidad. Es


el factor por el que puede multiplicarse K manteniendo la estabilidad. Normalmente se
considera suficiente, si otras medidas son adecuadas, un margen de ganancia Am = 2

En la práctica lo que suele variar no es K sino otras ganancias peor conocidas del modelo,
pero este estudio es equivalente y más cómodo.

c) Deducir los márgenes de ganancia correspondientes a los dos ajustes K=0,2 y K=0,5.
d) Revisar a la luz de estos nuevos datos las valoraciones de P1.1 d)

P T.3 Tolva, control PI. Se compararán y valorarán distintos ajustes.

Para K=0,2, Ti=0,3 y 0,6:

a) A partir de la respuesta a escalón en referencia obtener el error de seguimiento, el


sobrepaso, el tiempo de alcance y el tiempo de establecimiento al 5%.
b) A partir de la respuesta a escalón en perturbación obtener el error en régimen
permanente y el máximo error (relacionado también con d). ¿Tiene sentido el

15
sobrepaso? ¿Puede definirse el tiempo de establecimiento? Determinar el tiempo de
respuesta para la precisión del medidor, que es del 2% de la plena escala.
c) A partir de los resultados anteriores, comparar y valorar los dos ajustes.

Para Ti=0, 6:

d) Ajustar el valor de K (dos cifras significativas) para obtener un sobrepaso del 10%
aproximado.
e) Obtener para este nuevo ajuste las características de a) y b)

Se compararán ahora los ajustes (K=0,2, Ti=0,3) y (K=obtenida en d), Ti=0,6)

f) Representar en un mismo gráfico las salidas y1(t), y2(t) para ambos ajustes y los
ensayos descritos en el texto.
g) Representar en un mismo gráfico los mandos u1(t), u2(t) para ambos ajustes y los
ensayos descritos en el texto.
h) Determinar el mando máximo y compararlo con el que se requiere en régimen
permanente.
i) *** Comprobar en ambos ajustes si el margen de ganancia es al menos =2
j) A partir de los resultados anteriores, comparar y valorar los dos ajustes.

P T.4 *** Tolva, control P. Se estudia el regulador de dos grados de libertad indicado en la
figura, que pretende mejorar el comportamiento frente a referencia.

u(t)
K1 K

y(t)

a) Este apartado puede hacerse sin simulación, a partir de los resultados de P1.1. Ajustar
K y K1 para obtener en la respuesta a un escalón un sobrepaso aproximado del 20 % y
un error de seguimiento nulo. Usar una cifra significativa en ambas ganancias.
b) Comprobar lo anterior por simulación. Obtener las propiedades definidas en P1.1 a)
c) Comparar con el ajuste de P1.1 a): ¿se mejora la precisión de seguimiento? ¿y la de
perturbación?
d) Analizar qué sucede con el error de seguimiento si el modelo no refleja exactamente la
ganancia de la electroválvula, y ésta resulta ser 0,8 en lugar de 1. Téngase presente
que el regulador, diseñado a partir del modelo anterior, no cambia.
e) Para un control PI, determinar qué sucede con los errores de seguimiento y de
perturbación si el modelo no refleja exactamente la ganancia de la electroválvula.
f) Conclusiones de estos estudios.

16
Servomecanismo de posición
1. Descripción del problema
En este documento se aborda una de las aplicaciones más comunes en la ingeniería de control:
posicionar automáticamente un elemento mecánico accionado mediante un motor eléctrico o
un actuador hidráulico. Este sistema de control se denomina servomecanismo de posición y es
fundamental, entre otros muchos ejemplos, en cualquier herramienta robotizada para soldar,
atornillar o pintar en una cadena de montaje, en el posicionamiento de elementos de control
en barcos y aviones o en el lector de un disco de almacenamiento.

Como ejemplo de aplicación, se supondrá que se desea controlar la posición angular de una
carga mecánica accionada por un motor DC (motor de corriente continua) de imanes
permanentes, siendo la variable de mando la tensión de alimentación del mismo. Se supondrá
además que existe un par externo aplicado sobre la carga que dificulta el posicionamiento del
rotor y que se considerará como una perturbación para este sistema de control. Este par
externo o par de carga puede oponerse al movimiento o favorecerlo. El par por rozamiento
interno en el motor de magnitud constante y signo opuesto a la velocidad contribuye también
a este efecto. Además, existe otra perturbación relacionada con la alimentación del motor que
se describirá más adelante.

Al alimentar el motor con una tensión constante puede controlarse la velocidad, pero la
posición crece indefinidamente: la realimentación es casi imprescindible para alcanzar la
posición deseada. Objetivos de este sistema de control son la precisión (en régimen
permanente) en el seguimiento de la referencia y en el rechazo de las perturbaciones, así
como la calidad (amortiguamiento y rapidez) de las respuestas.

2. Modelo de la planta
Este ejemplo se basa en el mismo motor DC que se emplea en las clases prácticas. La
estructura de un motor DC consta de dos partes:

 Estator: es la parte externa y fija del motor y contiene imanes permanentes que crean
un campo magnético en el interior del motor.
 Rotor: es la parte interna y giratoria del motor y contiene el circuito eléctrico de
alimentación.

En la figura 2.1 se muestran el estator y el rotor de un motor DC.

17
Figura 2.1: Estator de imanes permanente y circuito eléctrico del rotor

El esquema electromecánico de un motor DC puede observarse en la figura 2.2.

L i
R

Tm R Jm
+
+ u
- e TR
-

Dm

Figura 2.2: Esquema electromecánico de un motor DC

El circuito eléctrico del rotor gira en el interior de un campo magnético constante creado por
los imanes permanentes del estator. Al circular una corriente i por el circuito del rotor se
ejerce sobre él un par motor TM que es directamente proporcional a la corriente i:

La constante Kt o constante de par incluye el valor del campo magnético del estator que se
supone constante.

Por otra parte, el giro del circuito del rotor en el interior del campo magnético creado por el
estator produce un flujo magnético oscilante en dicho circuito que induce una fuerza
contraelectromotriz e proporcional a la velocidad de giro del rotor R:

La constante de fuerza contraelectromotriz Ke y la constante de par Kt tienen el mismo valor


numérico. Esto se debe a que si se iguala la potencia eléctrica interna del motor a la potencia
mecánica en el rotor, despreciando las pérdidas, resulta:

18
Si se tienen en cuenta las pérdidas en el hierro y mecánicas, Kt < Ke.
La ecuación eléctrica del motor, teniendo en cuenta su resistencia R e inductancia L, resulta:

Siendo u la tensión de alimentación, e la fuerza contraelectromotriz inducida en el circuito del


rotor e i la corriente que circula por el mismo.

Por último, aplicando la segunda ley de Newton a la rotación del eje del motor se obtiene:

Siendo TM el par motor, TR el par aplicado a la carga (se considera positivo si es resistente), Dm
el coeficiente de fricción viscosa, Jm la inercia y R la velocidad angular del rotor.

En la figura 2.3 se representa un diagrama de bloques del motor DC utilizando exclusivamente


integradores, ganancias y puntos de suma con el fin de tener acceso a todas la variables
relevantes del motor. La posición angular  en grados se obtiene integrando la velocidad
angular R y transformando las unidades mediante un factor 180/.

Figura 2.3: Diagrama de bloques del modelo del motor DC

A partir del diagrama de bloques de la figura 2.3, la función de transferencia P(s) entre la
tensión de alimentación u (V) y la posición angular del rotor  (º) se puede calcular aplicando el
álgebra de diagrama de bloques, obteniéndose el siguiente resultado:

( )

Los valores que se usarán en este ejemplo para los parámetros son los siguientes: R = 5 , L =
5 mH, Ke = 0.5 V.s, Kt = 0.5 N.m/A, Jm = 0.002 Kg.m2 y Dm = 0.001 N.m.s. Resulta:

19
También es útil, para el análisis y diseño posterior del sistema de control, obtener la función de
transferencia entre el par externo aplicado a la carga (perturbación) TR (N.m) y la posición del
rotor  (º). La función de transferencia correspondiente es:

En las funciones de transferencia puede comprobarse que una constante de tiempo es mucho
menor que la otra, y puede estar justificada la simplificación del modelo. En ocasiones es
necesario emplear el modelo anterior, pero en este capítulo puede despreciarse la
autoinducción; cuando se considera L = 0, resulta:

( ) ( )

Nótese que la constante de tiempo Tm es ligeramente diferente a la que se obtiene en el


modelo completo debido a la realimentación interna en el modelo del motor (véase la figura
2.3), que produce un acoplamiento entre ambas constantes de tiempo.

Alimentación electrónica del motor

El motor se alimenta mediante una batería de 9 V a través de un puente en H y modulación


PWM (Pulse Width Modulation, modulación de ancho de pulso) para obtener el valor medio de
tensión deseado. En la figura 2.4 se puede ver el esquema del circuito de alimentación. En
dicha figura, los transistores funcionan como interruptores controlables bidireccionales (puede
circular la corriente en los dos sentidos) por la presencia de diodos de libre circulación. Estos
diodos no se muestran en la figura 2.4 por simplicidad.

Figura 2.4: Circuito de alimentación y sentido de la corriente para tensión media positiva

20
Para aplicar tensión media positiva al motor, el transistor Q2 se mantiene siempre encendido y
los transistores Q3 y Q4 conmutan de manera alternada en un período de 125 s (frecuencia
de 8 kHz). Esto produce una tensión que oscila entre 9 V y 0 V. El factor de servicio, que se
calcula como el tiempo que está ON el transistor Q3 dividido por el período de 125 s,
determina el valor medio de tensión en el motor. Para aplicar tensión media negativa al motor,
se apaga Q2 y se mantiene encendido continuamente Q1, repitiendo la conmutación alternada
de Q3 y Q4. Esto hace que la tensión del motor oscile entre 0 V y -9 V. Este modo de
funcionamiento evita que la corriente del motor, cuando este frene, circule hacia la batería.

Asociada a la alimentación PWM, existe otra perturbación en el sistema, ya que la tensión de


alimentación que se desea aplicar se reduce por la pequeña caída de tensión en los
transistores y diodos del puente en H. Esta perturbación se puede modelar como otra entrada
de tensión que se resta a la tensión de mando para generar la tensión realmente aplicada al
motor. Además, su signo cambia con el signo de la tensión de mando. Esta perturbación no se
ha incluido en el modelo de la figura 2.3, porque su efecto, una vez simplificado el modelo, es
similar al del par de carga.

Medida de la posición angular

El motor lleva incorporado un encoder incremental que está acoplado al rotor. El encoder está
compuesto de un emisor LED y dos fotorreceptores. Uno de los fotorreceptores genera una
onda cuadrada para llevar la cuenta del ángulo girado por el motor. El otro fotorreceptor,
desplazado ligeramente respecto de la posición del primero, genera otra onda cuadrada,
desfasada respecto a la primera, para determinar el sentido de giro. En la figura 2.5 se puede
ver un esquema simplificado de su funcionamiento para uno de los dos fotorreceptores y las
dos ondas cuadradas que genera el encoder.

Figura 2.5: Señales de salida del encoder

21
Para medir en cada instante la posición angular del motor, se cuentan los flancos de subida y
bajada y se transforma esa cuenta a grados en función del número de ranuras del encoder. Se
supondrá que la resolución final de la medida del encoder es de 1 grado en la posición angular.

Sistema de control en lazo cerrado

En la figura 2.6 se representa un diagrama de bloques simplificado del sistema de control en


lazo cerrado despreciando la autoinducción y usando la notación habitual para las variables
más relevantes.

Figura 2.6: Diagrama de bloques del sistema de control.

A partir de ahora se usarán denominaciones comunes a los sistemas de control de este curso:
la salida y(t) es la posición angular del rotor, la variable de control o mando u(t) es la tensión
de alimentación del motor y la perturbación d(t) es el par externo aplicado a la carga
mecánica. El valor deseado o referencia de posición angular es r(t) la medida de posición
angular es ym(t) y la diferencia entra ambas variables o error de control es e(t). Finalmente, C(s)
es la función de transferencia del control, que se detallará más adelante.

3. Control proporcional (P)


En el control proporcional, control P, la función de transferencia del control en la figura 2.6 es
C(s) = K. La variable de mando u(t) es el resultado de multiplicar por la ganancia K el error de
control o diferencia entre el valor deseado o referencia r(t) y la medida ym(t) de la salida. De
momento se considerará que la medida ym(t) coincide con la salida y(t).

A continuación se analiza matemáticamente qué efecto tiene el valor de la ganancia K del


control sobre la precisión en régimen permanente y el amortiguamiento y la rapidez de
respuesta del sistema de control, tanto en el seguimiento del valor de referencia r(t)
(transformada de Laplace igual a R(s)) como en el rechazo de la perturbación d(t)
(transformada de Laplace igual a D(s)). Para ello, se calculan las funciones de transferencia de
lazo cerrado entre referencia y salida y entre perturbación y salida en función de K:

22

√ √

Nótese que ambas funciones de transferencia tienen el mismo polinomio denominador y por
lo tanto los mismos polos. Los situación de los polos en el plano complejo determinará el tipo
de respuesta transitoria en lazo cerrado, tanto para un variación en la referencia como en la
perturbación. Como se trata de un sistema estándar de segundo orden, se pueden aplicar
todas las fórmulas y las tablas correspondientes. Expresando el polinomio denominador en
función de la pulsación natural n y del amortiguamiento :

La ganancia estática de la función de transferencia entre referencia y salida vale 1, por lo que
no existe error en el seguimiento de una referencia constante si el sistema es estable. Esto se
debe a la presencia de una integración en la planta que, en ausencia de perturbación, anula en
régimen permanente el mando y el error de control. En otras palabras, para mantener una
posición constante la velocidad y el mando deben ser nulos.

Sin embargo, cuando la perturbación (par resistente) no es nula, el mando debe compensarla
(con un par motor igual) para que la entrada del integrador en la planta sea 0 en régimen
permanente. Como el error de control es proporcional al mando, este tampoco será 0 y
existirá un error en el rechazo de la perturbación. Este último efecto se puede comprobar
analíticamente mediante la ganancia estática entre perturbación y salida, que no es 0 en este
caso. Además, resulta fácil deducir que el error de perturbación disminuye cuando K aumenta.

Por lo tanto, la primera conclusión que se obtiene es que es recomendable incrementar la


ganancia K del control P todo lo que sea posible para mejorar la precisión del sistema. Sin
embargo, el valor de K afectará también a la respuesta transitoria del sistema en lazo cerrado.
Es necesario también garantizar que el sistema responda en régimen transitorio de forma
rápida y suficientemente amortiguada (margen de seguridad frente a inestabilidad).

La influencia de K sobre la rapidez y amortiguamiento del sistema se deduce a partir de las


relaciones con n y . Se puede concluir que al aumentar el valor de se incrementa también
el valor de n, pero se reduce el valor de . Recuérdese que la pulsación natural n es un índice
que mide directamente la rapidez de la respuesta transitoria para sistemas con igual
amortiguamiento . Cuando aumenta n se reducen los tiempos de respuesta: tiempo de
alcance y tiempo de pico (sólo en sistemas subamortiguados con  < 1), y tiempo de
establecimiento. Por lo tanto, es conveniente incrementar la pulsación natural, y como

23
consecuencia K, para conseguir una respuesta más rápida. Por otra parte, al aumentar K se
reduce el amortiguamiento y aumenta el sobrepaso y las oscilaciones en la respuesta.

Como conclusión final, se puede afirmar que en este sistema de control existe un compromiso
entre la precisión y la rapidez por una parte (mejoran al aumentar K) y el amortiguamiento por
otra parte (empeora al aumentar K). El único grado de libertad en el diseño del control P debe
utilizarse para garantizar una respuesta suficientemente amortiguada, ya que el
amortiguamiento supone un margen de seguridad frente al comportamiento inestable.
Típicamente, se busca una respuesta en lazo cerrado subamortiguada con  entre 0.5 y 0.7,
que se corresponden con sobrepasos del 16% y el 5% aproximadamente para sistemas de
segundo orden sin ceros. Hay que aclarar que la presencia de un sobrepaso en la respuesta no
es un objetivo de control en sí mismo, sino que es el precio que se suele pagar por obtener una
respuesta más rápida y precisa: a mayor K, menor  y mayor n. Téngase en cuenta que
existen aplicaciones de control donde el sobrepaso no es admisible por restricciones físicas, y
que en esos casos será necesario renunciar a algo de rapidez en la respuesta final.

12

10

8
salida y, º

0
0 0.2 0.4 0.6 0.8 1 1.2
tiempo, s

Figura 3.1: Control P: Respuesta de la salida para escalones en referencia y perturbación

Escogiendo  = 0,5 resulta:

24
√ √

La figura 3.1 recoge la salida y(t) (en º) con el control proporcional diseñado. Se considera un
escalón en referencia de 10º, seguido a los 0,6 s (se supone que la primera respuesta ha
llegado a régimen permanente) de un escalón en perturbación de 0,1 N.m.

Ejercicio 3.1

Teniendo en cuenta que las funciones de transferencia F(s) y Fd(s) son sistemas estándar de
segundo orden, calcular los valores finales de las respuestas de la figura 3.1, los valores de pico
y los tiempos de pico. Comprobar en la figura.

F(0) = 1 y1() = 10º x 1 = 10º error de seguimiento: Es = 0

Fd(0) = -44,1 º/N.m y2() = 10º + 0,1 N.m x -44,1 = 5,59º

error de perturbación: Ed = 44,1 º/N.m

 = 0,5 Mp = 16,3% y1p = 10º x 1,163 = 11,63º

y2p = 10º + 0,1 N.m x -44,1 x 1,163 = 4,87º

ntp = 3,63 t1p = 3,63/25,5 = 0,142 s

t2p = 0,6 + 0,142 = 0,742 s

&&&

Conclusiones para control P

 La presencia de una integración en la planta garantiza error nulo en régimen


permanente en el seguimiento de una referencia constante, si el sistema es estable.
Sin embargo, esta integración en la planta no garantiza en todos los casos, y el caso
analizado es un ejemplo, error nulo en régimen permanente en el rechazo a una
perturbación constante.
 Elevar la ganancia del control proporcional no sólo mejora la precisión del sistema de
control, tanto en el seguimiento de la referencia (en este caso ya es 0) como en el
rechazo de la perturbación, sino también la rapidez en tiempo de alcance y tiempo de
pico del sistema.

25
 Sin embargo, ese mismo incremento de la ganancia compromete el amortiguamiento
del sistema y en última instancia incluso la estabilidad. Además, la rapidez medida
como tiempo de establecimiento puede empeorar.
 Por lo tanto, debido al compromiso existente entre precisión y amortiguamiento, el
único grado de libertad del control P debe emplearse para fijar el amortiguamiento
que es la especificación más crítica por suponer un margen de seguridad frente a la
inestabilidad del sistema.
 Si seleccionado el valor de K que garantiza un amortiguamiento aceptable, la precisión
o la rapidez resultante no es satisfactoria, se hace imprescindible utilizar una
estrategia de control más sofisticada para mejorar la precisión y/o la rapidez sin
comprometer el amortiguamiento.

4. Control proporcional diferencial (PD)

El control proporcional diferencial (control PD) puede emplearse para mejorar la rapidez, la
precisión o el amortiguamiento del control P. En el caso de que el control P no garantice un
amortiguamiento aceptable, puede emplearse el control PD para mejorarlo. Si, como en el
presente ejemplo, el control P permite conseguir un amortiguamiento satisfactorio, el control
PD se diseña para incrementar la rapidez de la respuesta con igual amortiguamiento, y
frecuentemente se consigue también mejorar la precisión.

La figura 4.1 muestra el diagrama de bloques de un control PD. La variable de mando u(t) se
genera mediante la suma de dos acciones de control, proporcionales al error de control e(t) =
r(t) – ym(t) y a su derivada (en Laplace, producto por “s”). Más adelante se considerará una
variante de este esquema. Se ha añadido un ruido de medida al modelo para posterior
discusión. La función de transferencia del control resulta:

Figura 4.1: Diagrama de bloques del servo con control PD con acción diferencial sobre el error

26
A continuación se analiza matemáticamente qué efecto tiene el control PD sobre la precisión
en régimen permanente, la rapidez y el amortiguamiento del sistema en lazo cerrado. Para
ello, se calculan en función de los parámetros K y Td del control, que son ajustables, las
funciones de transferencia de lazo cerrado entre referencia y salida y entre perturbación y
salida. Estas funciones de transferencia, las ganancias estáticas, la pulsación natural y el
amortiguamiento resultan:


( ) ( )

√ √

Nótese que la relación entre la pulsación natural y la ganancia K es la misma que en el control
P. Por lo tanto, para obtener una determinada pulsación natural (rapidez) habría que utilizar el
mismo valor de K en ambos controles. Sin embargo, mientras que en el control P un valor alto
de K puede producir un amortiguamiento demasiado bajo, en el caso del control PD es posible
incrementar el amortiguamiento aumentando el valor de Td. Es decir, el término dependiente
de Td añadido en el numerador de la expresión correspondiente al amortiguamiento permite
diseñar de forma independiente la pulsación natural y el amortiguamiento con este control.
Puede observarse que no existe ningún límite teórico a la hora de incrementar la pulsación
natural, porque basta con aumentar Td todo lo que se requiera para fijar el amortiguamiento al
valor que se desee. En la práctica aparecen distintos límites; uno de ellos es la constante de
tiempo eléctrica del motor, despreciada en nuestro modelo.

Supóngase que se desea doblar la pulsación natural del control P para obtener n = 50 rad/s.
Se pretende además que el sobrepaso a un escalón en referencia no supere el 20%, por lo que
se fija el amortiguamiento a un valor de  = 0,5 (como en el control P). Con estos datos se
diseña el control PD:

√ √

Obsérvese que para doblar la pulsación natural se necesita K 4 veces mayor, y el error de
perturbación disminuirá 4 veces. En la figura 4.2 se muestra la respuesta de la salida del

27
sistema para escalón en referencia de 10º, seguido a los 0,3 s de un escalón en perturbación de
0,1 N.m.

Efecto de un cero adicional

El sobrepaso observado en la figura 4.2 es cercano al 20%, cuando para  = 0,5 cabe esperar un
sobrepaso del 16,3%. Este incremento del sobrepaso se debe a la presencia de un cero en el
polinomio numerador de lazo cerrado introducido por la acción diferencial. Concretamente, la
constante de tiempo correspondiente al cero coincide con Td.

12

10

8
salida y, º

0
0 0.1 0.2 0.3 0.4 0.5 0.6
tiempo, s

Figura 4.2: Control PD (acción diferencial sobre el error): Respuesta de la salida para escalones
en referencia y perturbación

Para justificar el aumento del sobrepaso en un sistema de segundo orden cuando se añade un
cero de constante de tiempo T, se puede considerar que la función de transferencia con cero
adicional es la suma de dos funciones de transferencia, la de un sistema de 2º orden sin ceros y
la derivada de la anterior multiplicada por :

28
Teniendo en cuenta esta descomposición de la función de transferencia, la respuesta a un
escalón se puede obtener sumando la respuesta estándar del sistema de 2º orden sin ceros y
su derivada temporal multiplicada por T. En la figura 4.3 se muestra la respuesta a un escalón
unitario de un sistema de segundo orden subamortiguado (n = 1 y  = 0,5) cuando se añade
un cero en -1 (T = 1). Como conclusiones fundamentales cabe citar las siguientes:

 El cero incrementa el sobrepaso de la respuesta, tanto más cuanto menor es el valor


absoluto del cero o mayor la constante de tiempo T asociada al mismo, en relación con
n.
 El tiempo de alcance y el tiempo de pico se reducen.

1.4

1.2

0.8
respuestas

0.6

segundo orden estándar


0.4
derivada

0.2 segundo orden con cero

-0.2
0 1 2 3 4 5 6 7 8 9 10
tiempo, s

Figura 4.3: Respuesta de un sistema de 2º orden subamortiguado con cero adicional.

El apartado 4.4.1 de Regulación Automática da más detalles.

Ejercicio 4.1

En la figura 4.2, y usando el texto de Regulación Automática, calcular los valores finales de
ambas respuestas, y estimar los valores y los tiempos de pico. Comprobar aproximadamente
en la figura.

F(0) = 1 y1() = 10º x 1 = 10º error de seguimiento: Es = 0

Fd(0) = -11,5 º/N.m y2() = 10º + 0,1 N.m x -11,5 = 8,85º

error de perturbación: Ed = 11,5 º/N.m

 = 0,5

29
Pero F(s) no es un sistema estándar de segundo orden, porque tiene un cero adicional:

( )

z = -1/Td = -102 La relación con n = 50 es muy cercana a 2, y en la Tabla 4.1 de RA resulta un


sobrepaso Mp = 19,1% y ntp = 3,02

En cambio Fd(s) sí es un sistema estándar de segundo orden: Mp = 16,3% y ntp = 3,63

y1p = 10º x 1,191 = 11,91º

y2p = 10º + 0,1 N.m x -11,5 x 1,163 = 8,66º

 t1p = 3,02/50 = 0,0604 s

t2p = 0,3 + 3,63/50 = 0,373 s

&&&

Nótese que el error de perturbación es inferior al obtenido con el control P. Aunque el objetivo
del control PD ha sido mejorar la rapidez de la respuesta, suele conseguirse como beneficio
adicional mejorar la precisión.

Acción diferencial sobre la salida

El incremento del sobrepaso se podría compensar, si fuese necesario, aumentando el


amortiguamiento. Sin embargo, puede eliminarse en el control PD aplicando la derivada sobre
la salida (ojo, cambiando el signo), y no sobre el error, como se indica en la figura 4.4.

Figura 4.4: Diagrama de bloques del servo con control PD con acción diferencial sobre la salida

30
Puede comprobarse que F(s) ya no presenta un cero, y es un sistema estándar. Este tipo de
esquemas en los que el mando depende de manera distinta de la referencia y de la salida se
denominan modernamente “regulador de dos grados de libertad”. El esquema tradicional de la
figura 2.6 es un “regulador de un grado de libertad”. Como solamente se modifica la influencia
de la referencia, ambos reguladores tienen la misma respuesta a una perturbación.

Los efectos beneficiosos de la acción diferencial se ven limitados en la práctica por dos
factores: la saturación del mando y el ruido de medida. Sin ninguna pretensión de decirlo todo
aquí, se darán a continuación algunas indicaciones.

Saturación del mando y patada derivativa

El control PD consigue aumentar la rapidez con la misma planta aplicando valores mayores de
mando. Pero el valor de mando siempre tiene un límite, llamado saturación. En este
servomecanismo es el valor máximo de la alimentación del motor, 9 V. Ello quiere decir que si
el control “pide” valores muy altos de mando, la alimentación no podrá seguirlos, y no se
elevará la rapidez tanto como se deduciría de un modelo lineal (sin saturación).

12

10

6 salida y(t), º

mando u(t), V

-2
0 0.1 0.2 0.3 0.4 0.5 0.6
tiempo, s

Figura 4.5: Control PD (acción diferencial sobre la salida): Respuestas de la salida y el mando
para escalones en referencia y perturbación

Estudiando el esquema de control PD de la figura 4.1 puede deducirse que un escalón en la


referencia (supóngase la salida en 0 inicialmente) produce en el mando la derivada del escalón,
es decir, un impulso. La alimentación del motor nunca será capaz de darlo, y dará su valor de

31
saturación (9 V) para cualquier magnitud del escalón en referencia. Este efecto de saturación
del mando para cualquier valor del escalón en la referencia, que produce la derivada del error,
se conoce como patada derivativa, derivative kick. El esquema con acción diferencial sobre la
salida de la figura 4.4, además de evitar el cero y el consiguiente aumento del sobrepaso,
también evita la patada derivativa.

La figura 4.5 recoge la salida y el mando para el regulador de la figura 4.4 con acción
diferencial sobre la salida. Se aplica un escalón en referencia de 10º, seguido a los 0,3 s de un
escalón en perturbación de 0,1 N.m.

Al desaparecer el cero el sobrepaso de la salida vuelve a ser el 16,3%. El efecto de la


perturbación debe ser idéntico al de la figura 4.2. Los valores iniciales y finales del mando dan
buenas estimaciones de la posibilidad de saturación. Pueden obtenerse mediante las funciones
de transferencia y aplicando los teoremas correspondientes; pero es más rápido analizar el
diagrama de bloques.

Ejercicio 4.2

En la figura 4.5, calcular los valores iniciales y finales del mando de ambas respuestas. Se usa el
esquema de la figura 4.4. Escalón en referencia de 10º, seguido de un escalón en perturbación
de 0,1 N.m. Comprobar aproximadamente en la figura.

u1(0) = K (r(0) - y(0)) = 0,873 (10 – 0) = 8,73 V

Para escalón de 10º el mando está próximo a la saturación de 9 V.

u1() = d() x Kd/Km = 0 V porque la planta tiene una integración.

u2(0) = 0 V porque la salida no reacciona inmediatamente a la perturbación.

u2() = d() x Kd/Km = 0,1 x 10 = 1 V

Esta perturbación requiere un mando bastante por debajo de la saturación de 9 V.

&&&

Ruido de medida

El ruido de medida (ver las figuras 4.1 y 4.4) aparece directamente en la señal de error del
sistema de control y suele contener componentes de alta frecuencia. Siempre está presente,
aunque en unos sistemas más que en otros. El control PD amplifica las altas frecuencias más
que las bajas, y el ruido amplificado de alta frecuencia aparece directamente en la variable de
control o mando y puede provocar que el actuador funcione mal, reduzca su vida útil u
ocasione vibraciones en la planta, especialmente si es de naturaleza mecánica. En muchos
casos el ruido es poco perceptible en la salida, porque la planta tiene menor ganancia a alta
frecuencia.

32
Es fácil deducir la ganancia del diagrama de Bode del control (| | √ ), que
crece sin límite a medida que aumenta la frecuencia (véase la figura 4.6). En cambio, el control
P amplifica por igual todas las frecuencias.

La forma más frecuente de atenuar el contenido de ruido en el mando hasta un nivel aceptable
consiste en filtrar la acción diferencial mediante un filtro de primer orden. La ganancia a
frecuencia infinita ya no es infinita, sino que depende de N. Valores típicos de N van de 1 a 10.

( )

Bode Diagram
50

45

40

35 K (1 + Td s)

30 con filtro N=3


Magnitude (dB)

25

20

15

10

5 0 1 2 3 4
10 10 10 10 10
Frequency (rad/s)

Figura 4.6: Diagrama de Bode de ganancia del control PD.

Ejercicio 4.3

Deducir aproximadamente K y Td de la figura 4.6. Añadiendo un filtro con N = 3, obtener la


ganancia a alta frecuencia del control PD.

K = 9 dB = 2,8 Td = 1/50 = 0,02 s C() = K(1+N) = 11,2 = 21,0 dB

&&&

33
Conclusiones para control PD

 El control PD tiene como principal objetivo mejorar la respuesta transitoria del


sistema. Cuando el control P permite limitar el amortiguamiento, el objetivo del
control PD es incrementar la rapidez de respuesta, como ocurre en el ejemplo
analizado. En aquellos casos en los que el control P no consigue un amortiguamiento
aceptable o incluso el sistema es inestable, la solución pasa también por aplicar acción
diferencial.
 En algunas situaciones (pero no en general) el diseño analítico no impone limitación
alguna a la hora de incrementar la rapidez del sistema. En estos casos, la rapidez de
respuesta del sistema real puede estar limitada por la saturación del mando, las
simplificaciones aplicadas en el modelo o la amplificación del ruido de medida.
 La mejora de la precisión en muchos casos acompaña al incremento de rapidez en la
respuesta, debido al incremento de K.
 A la hora de implantar el control PD es posible optar por aplicar la acción diferencial al
error o a la salida. En este ejemplo se ha optado por aplicar la acción diferencial a la
salida para evitar el efecto de la patada derivativa en el mando y el aumento del
sobrepaso en la salida como consecuencia del cero añadido por el control. La opción
anterior no es de aplicación general, y en otros casos podría ser ventajoso aplicar la
acción diferencial al error.
 La gran desventaja del control PD, y el motivo de que en muchas aplicaciones se
prescinda de la acción diferencial, es la amplificación en el mando del ruido de medida.
No obstante, es posible atenuar este efecto si se aplica un filtrado adecuado a la
acción diferencial.

5. Control proporcional integral

El objetivo fundamental del control proporcional integral (control PI) es anular el error de
rechazo de una perturbación constante. También anularía el error de seguimiento al escalón,
pero en este ejemplo ya es nulo con el control P.

Figura 5.1: Diagrama de bloques del servo con control PI

34
La figura 5.1 muestra el diagrama de bloques de un control PI. La variable de mando u(t) se
genera mediante la suma de dos acciones de control, proporcionales al error de control e(t) =
r(t) – ym(t) y a su integral. Existen variantes de este esquema básico; más adelante se explorará
una de ellas.

A partir del diagrama de bloques pueden obtenerse las funciones de transferencia en lazo
cerrado que definen la influencia sobre la salida y(t) de la referencia r(t) y de la perturbación
d(t):

Un rápido análisis muestra la ganancia estática de la primera: F(0) = 1 indica que para
referencia constante la salida es igual a ella en régimen permanente, siempre que el sistema
sea estable. La ganancia estática de la segunda: Fd(0) = 0 indica que para perturbación
constante la salida es igual a 0. Por tanto, en estas condiciones se cumplen perfectamente los
objetivos del sistema de control de seguir a la referencia y rechazar la perturbación.

Ambas funciones de transferencia tienen el mismo denominador, que es de tercer orden. Sin
embargo, se aplicará la teoría de los sistemas de segundo orden para situar dos polos
complejos, y posteriormente se analizarán los efectos del tercer polo y del cero. Se eligen dos
polos con amortiguamiento  = 0,5 (igual al usado para el control P) y rapidez n = 20 rad/s,
aproximadamente un 80% de la obtenida con el control P. Como solo se pueden ajustar dos
constantes, el tercer polo p no se puede fijar. Se igualarán los denominadores, normalizados
de la misma manera:

Conocidos Km = 112,4 y Tm = 0,0392 pueden despejarse las incógnitas una a una:

p = 5,510 s-1 K = 0,1779 V/º Ti = 0,2315 s

Es característico que resulta un valor de K del mismo orden que el del control P, y algo inferior.
El tercer polo es muy significativo, ya que su módulo es aproximadamente la cuarta parte de
n. Sin embargo, en F(s) aparece también un cero próximo, z = 1/Ti = 4,320 s-1, por lo que los
efectos de ambos se compensarán en parte. Más adelante se volverá a esta discusión.

35
0

-10

-20
P

PI wn=20
salida y, º

-30

-40

-50

-60
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
tiempo, s

Figura 5.2: Controles P y PI: respuestas de la salida para escalón unitario en perturbación

La figura 5.2 describe la mejora obtenida sobre el control P. Se pasa de un error en régimen
permanente igual a 10/K a un error 0 con control PI. El error de pico es del mismo orden, pero
algo más elevado. El análisis a partir de la función de transferencia Fd(s) es poco estándar, ya
que habría que tener en cuenta, además del sistema de segundo orden, un polo muy
significativo y un cero en el origen, todavía más significativo, que es equivalente a derivar la
respuesta dada por el denominador.

Elección de n

Se explorará ahora la elección de n, dejando el mismo amortiguamiento  = 0,5. Se repiten los
cálculos anteriores para una pulsación cercana a la obtenida con el control P y otra bastante
inferior. La tabla 5.1 recoge los resultados, y la figura 5.3 las respuestas.

n rad/s Ti s K V/º KI = K/Ti


24 0,7038 0,2135 0,3034
20 0,2315 0,1779 0,7687
10 0,1645 0,0890 0,5409
Tabla 5.1: Tres diseños de controles PI

36
20

-20
salida y,º

-40

PI wn=24
PI wn=20
-60
PI wn=10

-80

-100
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
tiempo, s

Figura 5.3: Controles PI: respuestas de la salida para escalón unitario en perturbación

Al aproximarse a la n del control P el valor de Ti crece, resultando un transitorio más lento en


la figura 5.3. Puede comprobarse que si se toma igual n que el control P resulta Ti infinita, que
es lo mismo que desconectar la acción integral y volver al control P, sin anular nunca el error.
Si se toma una n superior a la del control P resulta un sistema inestable.

Al tomar n pequeña resulta Ti pequeña (esto es poco intuitivo) y un transitorio con mucho
pico y demasiado oscilante.

El caso intermedio adoptado parece un compromiso aceptable. Puede mejorarse tomando n


= 17 rad/s, que resulta en KI = 0,86; más adelante en el curso se discutirá el valor de KI = K/Ti
como índice a maximizar.

Respuesta para escalón en referencia

Se da a continuación F(s) en formato ceros-polos (zpk):

La ganancia estática debería ser exactamente 1, pero este formato no la da directamente, y


con las cifras indicadas hay una pequeña diferencia. El polo adicional se ha obtenido al diseñar;
el cero corresponde exactamente a la constante de tiempo integral: z = 1/Ti

37
El cero y el polo son individualmente muy significativos, ya que son del orden de la cuarta
parte de n = 20 rad/s. Pero sus efectos se cancelan en parte, dominando los del cero (que
tiene menor módulo) sobre los del polo. Así, cabe esperar una respuesta no demasiado
distinta de la del sistema estándar de segundo orden, pero con más pico y menor tiempo de
alcance.

La figura 5.4 indica la respuesta del sistema con control P (azul) y con control PI (verde). En
rojo está indicada la respuesta con el cero igual al polo, que es como la del control P porque
también es un sistema estándar con el mismo amortiguamiento  = 0,5, pero menor rapidez n
= 20 rad/s.

Puede concluirse que esta respuesta con control PI es peor que la del control P: tiene un
sobrepaso algo elevado, tiempo de alcance parecido, tiempo de establecimiento mayor. En
este ejemplo se justifica el uso de control PI porque mejora la respuesta a perturbación, pero
no así la respuesta a escalón en referencia.

1.4

1.2

0.8
P wn=25,5
salida y, º

PI wn=20 b=1
0.6
PI wn=20 b=0,7840

0.4

0.2

0
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8
tiempo, s

Figura 5.4: Controles P y PI: respuestas de la salida para escalón unitario en referencia

Ponderación de la referencia

La respuesta a escalón en referencia puede refinarse algo si se mueve el cero para cancelar el
polo, obteniendo la respuesta en rojo, con el mismo sobrepaso que el control P, y una rapidez
del orden del 80%. Para ello se usará un regulador de dos grados de libertad, ponderando la

38
referencia, como se muestra en la figura 5.5. Puede verse que para b = 1 se reduce al caso
anterior (b = 1 es “no hay ponderación”). Para b>1 se aplica más referencia, y la respuesta a un
escalón debería tener más pico; lo contrario para b<1.

Figura 5.5: Diagrama de bloques del servo con control PI con ponderación de la referencia

Obteniendo la nueva función de transferencia en lazo cerrado:

La ponderación solamente cambia el cero de sitio: z = 1/(bTi). A mayor b, menor módulo del
cero negativo, y por tanto más significativo y más pico. Puede ajustarse en cierta medida la
respuesta cambiando la ponderación y por tanto el cero. En este ejemplo se cancelará el polo;
pero debe avisarse que no siempre es lo mejor:

z = 1/(bTi) s-1 = p: b = 1/(pTi) = 1/(5,510.0,2315) = 0,7840

Con este valor de b en el regulador se obtiene la respuesta en rojo de la figura 5.4, y la


respuesta en verde de las figuras 5.2 y 5.3.

La ponderación no tiene efecto sobre la función de transferencia de la perturbación, Fd(s); las


respuestas de la figura 5.3 serán idénticas. Tampoco tiene efecto sobre el denominador de
F(s) ni, salvo cancelaciones, sobre los polos ni sobre la estabilidad del sistema.

Saturación del mando: saturación integral (windup)

La saturación del mando cuando hay acción integral puede producir efectos mucho más graves
que con la acción proporcional o diferencial. Básicamente, cuando el mando satura el
regulador sigue integrando el error sin poder hacer nada por corregirlo, y le cuesta volver
después a la situación normal, deshaciendo la integración. Se debe usar un esquema
antiwindup para evitar esto. Como entender tanto el windup como el esquema antiwindup
requieren analizar un sistema fuertemente no lineal, la discusión queda aquí algo fuera de
lugar, y se dejará para el laboratorio.

39
Conclusiones para control PI

 El control PI tiene como principal objetivo mejorar la precisión del sistema,


disminuyendo los errores (en régimen permanente) de seguimiento y de perturbación.
Cuando el control P ya da error de seguimiento nulo al escalón, la mejoría se percibe
en el error a perturbación.
 A cambio, es frecuente tener que tolerar un empeoramiento de la respuesta
transitoria a referencia; si se ajusta el amortiguamiento, ello quiere decir menor
rapidez.
 La acción integral acaba resultando en un polo lento, más lento que los polos de
segundo orden. La constante de tiempo correspondiente es cercana a Ti. No deben
tomarse valores demasiado grandes de Ti, que dan una cancelación muy lenta del error
de perturbación, ni demasiado pequeños, que dan oscilaciones.
 En la respuesta a referencia aparece un cero de constante de tiempo estrictamente
igual a Ti, y por tanto próximo al polo. Sus efectos se compensan en parte, pero con
frecuencia dan lugar a un transitorio que tarda en desaparecer.
 La ponderación de la referencia permite mover el cero, quizá para cancelar el polo, y
en general para modificar de manera limitada la respuesta, aumentando o
disminuyendo el sobrepaso según lo que se desee.
 La saturación del mando, junto con la acción integral, puede producir un mal
comportamiento del sistema de control. Puede corregirse mediante un esquema
antiwindup

6. Control proporcional integral diferencial

El objetivo del control proporcional integral diferencial (control PID) es combinar las mejoras
de los controles PD y PI, elevando la rapidez con el primero y anulando con el segundo el error
para una perturbación constante.

Figura 6.1: Diagrama de bloques del servo con control PID

40
La figura 6.1 muestra el diagrama de bloques de un control PID. La variable de mando u(t) se
genera mediante la suma de tres acciones de control, proporcionales al error de control e(t) =
r(t) – ym(t), a su integral y a su derivada (en Laplace, producto por “s”). Existen variantes de
este esquema (26, según O’Dwyer); aquí se considera la acción diferencial sobre la salida y no
sobre el error, y se añade la ponderación de la referencia. Se ha añadido un ruido de medida al
modelo para posterior discusión.

A partir del diagrama de bloques pueden obtenerse las funciones de transferencia en lazo
cerrado que definen la influencia sobre la salida y(t) de la referencia r(t) y de la perturbación
d(t):

Como en el control PI, F(0) = 1 y Fd(0) = 0. Esto indica que, para entradas constantes, se
cumplen, en régimen permanente, los objetivos del sistema de control de seguir a la referencia
y rechazar la perturbación.

Ambas funciones de transferencia tienen el mismo denominador, que es de tercer orden. Se


aplicará la teoría de los sistemas de segundo orden para situar dos polos complejos, y
posteriormente se analizarán los efectos del tercer polo y del cero. Se eligen dos polos con
amortiguamiento  = 0,5 (igual al usado para el control P) y rapidez n = 40 rad/s, algo menos
del doble de la obtenida con el control P, y exactamente el doble de la del control PI adoptado.

Se pueden ajustar tres constantes, y con ellas se podría fijar el tercer polo p. Pero se optará
por una especificación más parecida a las que se usan en la práctica: la constante de tiempo de
la acción integral se relacionará con la rapidez del lazo cerrado:

nTi = 

Se igualarán los denominadores, normalizados de la misma manera:

nTi =  Ti s Td s K V/º KI = K/Ti b


1,25 0,0313 0,0218 2,7900 89,2811 0,2000
2,5 0,0625 0,0154 0,9300 14,8802 0,6000
5 0,1250 0,0122 0,6975 5,5801 0,8000
Tabla 6.1: Tres diseños de controles PID

Conocidos Km = 112,4 y Tm = 0,0392 y para distintos valores de  se obtienen los resultados de


la tabla 6.1. La solución de las ecuaciones es un poco más difícil que en el caso anterior: puede

41
empezarse por obtener p en función de  a partir de los dos términos de menor orden. Por
último, se ajusta la ponderación de la referencia para cancelar el polo con el cero.

10

-10

PI
-20
PID wnTi=5
PID wnTi=2,5
salida y, º

PID wnTi=1,25

-30

-40

-50

-60
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
tiempo, s

Figura 6.2: Respuestas de la salida para escalón unitario en perturbación; controles PI y PID

La figura 6.2 compara las respuestas a escalón en perturbación para el control PI y estos tres
controles PID. Los valores de  = 5 y 2,5 son más típicos, pero el valor  = 1,25 da mejor
respuesta. Por otra parte, al aumentar mucho el valor de K.Td aumentará mucho el efecto del
ruido de medida de alta frecuencia, como se ve más adelante.

Con la ponderación se consigue una respuesta a escalón en referencia estándar de segundo


orden, con  = 0,5 y n = 40 rad/s, idéntica en los tres casos. También en los tres casos el
mando para escalón en referencia será idéntico, al ser iguales el lazo cerrado y la planta:

Para estudiar el efecto del ruido de medida sobre el mando se ha obtenido la función de
transferencia correspondiente:

42
La figura 6.3 indica que el ruido de medida se atenúa con el control PI, y aumenta con los tres
PID, tanto más cuanto menor es .

Bode Diagram
60

40

20
Magnitude (dB)

-20

PI
PID delta=5
PID delta=2,5
-40
PID delta=1,25

-60
0 1 2 3 4
10 10 10 10 10
Frequency (rad/s)

Figura 6.3: Respuesta en frecuencia del mando para ruido de medida; controles PI y PID

Conclusiones para control PID

 El control PID mejora la precisión del sistema, de manera importante mediante la


acción integral, y todavía algo más mediante la acción diferencial.
 La acción diferencial disminuye el pico de error a perturbación, y la acción integral lo
elimina en régimen permanente.
 Las ventajas de la acción diferencial pueden ser limitadas por el ruido de medida.
 La acción diferencial puede compensar, en la respuesta a referencia, la disminución de
rapidez producida por la acción integral.
 La acción integral acaba resultando típicamente en un polo lento.
 En la respuesta a referencia aparece un cero de constante de tiempo igual a bTi; la
ponderación de la referencia permite mover este cero para modificar la respuesta.
 Al ser un regulador con muchos parámetros, permite teóricamente mucha libertad de
ajuste, pero también es más difícil establecer reglas generales para ello.

7. Visión general de los cuatro controles


En este apartado se comparan diseños típicos de cada control P, PD, PI, PID. Se estudiarán las
respuestas de la salida y del mando para escalones en referencia y en perturbación. En estos

43
ejemplos no se ha considerado el efecto del ruido de medida, y ello ha permitido usar acción
diferencial ideal; en la práctica se usa siempre un filtro, que aquí no se ha estudiado.

Se han ajustado sistemas estándar de segundo orden para la función de transferencia en lazo
cerrado F(s), todos con el mismo amortiguamiento y distinta rapidez. La acción diferencial
sobre la salida suprime el cero de la acción diferencial, y la ponderación de la referencia
compensa el tercer polo. La tabla 7.1 resume los ajustes.

= 0,5 n rad/s K V/º Ti s Td s b


P 25,51 0,2270
PD 50 0,8719 0,0098
PI 20 0,1779 0,2315 0,7840
PID 40 0,9300 0,0625 0,0154 0,6000
Tabla 7.1: Cuatro controles

Se considera un escalón en referencia de 10º, seguido a los 0,6 s (cuando la primera respuesta
ha llegado a régimen permanente) de un escalón en perturbación de 0,1 N.m. La figura 7.1
recoge las salidas (en º) para los distintos controles.

12

10

8
salida, º

PI
4
PD

PID

0
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6
tiempo, s

Figura 7.1: Respuestas de la salida para escalones en referencia y perturbación

Respuesta a referencia:

 Los cuatro controles dan error de seguimiento nulo (la salida es igual a la referencia en
régimen permanente), debido a la integración de la planta.
 Los cuatro controles dan sistemas estándar de segundo orden, con el mismo
amortiguamiento (= 0,5) y por tanto el mismo sobrepaso (Mp = 16,3%).

44
 Las cuatro respuestas solo se diferencian en n, que indica la rapidez.
 Comparando con el P, el PI disminuye la rapidez, y el PD y el PID la aumentan.

Respuesta a perturbación:

 Los controles con acción integral anulan el error de perturbación (la salida es igual a la
referencia en régimen permanente).
 Los controles P y PD dan error. Es inversamente proporcional a K, por lo que el PD da
menos error. Pueden calcularse los valores obteniendo las ganancias estáticas.
 La acción integral se justifica en este ejemplo por mejorar la respuesta a perturbación,
no la respuesta a referencia.
 La acción diferencial da lugar a menos pico en la respuesta. Esto es porque su mayor
rapidez le hace compensar antes la perturbación.

La figura 7.2 recoge los mandos (en V) para los distintos controles. Se consideran los mismos
escalones, de 10º en referencia y de 0,1 N.m en perturbación.

10

PI
6
PD

PID
mando, V

-2
0 0.2 0.4 0.6 0.8 1 1.2
tiempo, s

Figura 7.2: Respuestas del mando para escalones en referencia y perturbación

Respuesta a referencia:

 Los cuatro controles dan un valor final del mando nulo, debido a la integración de la
planta.

45
 Los controles con acción diferencial necesitan mandos más elevados para aumentar la
rapidez; ello aumenta la posibilidad de saturación del mando. En el ejemplo, el valor
de saturación del mando es 9 V, y el control PD llega cerca con el escalón de 10º.
 Los valores inicial y final del mando pueden calcularse obteniendo funciones de
transferencia, o más rápidamente analizando el diagrama de bloques.

Respuesta a perturbación:

 Los cuatro controles dan un valor final del mando igual, que debe compensar la
perturbación: 1V de mando da 0,1 N.m de par motor.
 La acción diferencial adelanta el mando para compensar antes la perturbación.
 Puede observarse que este PD es más rápido que el PID para referencia, y satura más
el mando. Pero este PID es más rápido que el PD para perturbación, y la compensa
antes, además de más completamente por la parte integral.

8. Regulador digital

Véase en el recuadro el boceto de un programa para un regulador digital PID. La integral y la


derivada son aproximadas, naturalmente. Incorpora un mecanismo anti-windup que detiene la
integración cuando el mando está saturado, evitando la acumulación de integral de error
cuando el regulador no puede hacer más.

Se adquieren las medidas (muestras) de referencia y de salida cada Ts segundos, y se


ejecuta el programa con la misma periodicidad.

Inicializar: i = 0 yant = 0 sat = 1


Repetir:
1 Esperar la interrupción del reloj (cada Ts segundos)
2 Leer la medida del convertidor A/D y el valor de referencia de memoria: y, r
3 Calcular el error, la integral del error, la derivada de la salida y el mando:

4 Poner el mando en el convertidor D/A : u


5 Actualizar:

Fin del repetir


Se aplica al amplificador que alimenta el motor una tensión constante
correspondiente a u durante Ts segundos hasta el siguiente refresco.
46
PROBLEMAS

Se resolverán con técnicas analíticas, usando los conceptos, fórmulas y tablas de Sistemas
Dinámicos, y del texto de Regulación Automática (capítulos 2 y 4, apéndice D).

Se recomienda comprobar algunos resultados con MatLab. Obtener las funciones de


transferencia necesarias y usar las instrucciones step y ltiview.

P S.1 El diagrama de bloques de la figura modela un sistema con control proporcional. Las
variables están en magnitudes unitarias, de manera que el valor 1 corresponde aproximada-
mente a su máximo.

Se desea un sobrepaso de aproximadamente el 5% en la respuesta a escalón en referencia.

a) Ajustar el valor de K. Dar la pulsación propia no amortiguada, o pulsación natural.


b) Respuesta a escalón en referencia: valor final, tiempo de alcance, tiempo de
establecimiento. Comentar qué tiempo es mayor y por qué.
c) Obtener la función de transferencia entre salida y perturbación. Dar el valor final de la
respuesta a escalón en perturbación. ¿Qué otras informaciones se pueden dar?

Se aplica un escalón en referencia de valor r=0,6, y al cabo de 1 s un escalón en perturba-


ción de valor d=0,8:

d) Valores de la salida al final de cada respuesta. Hacer un boceto.


e) Valores del mando al principio y al final de cada respuesta. Hacer un boceto.

47
P S.2 El diagrama de bloques de la figura modela un servomecanismo de posición con control
proporcional y realimentación de la velocidad. Las variables están en magnitudes unitarias, de
manera que el valor 1 corresponde aproximadamente a su máximo.

Se desea un sobrepaso de aproximadamente el 10% en la respuesta a escalón en referencia.

a) Para K2 = 0, ajustar el valor de K1. Dar la pulsación natural. Dar el tiempo de alcance.
b) Ajustar K1 y K2 para obtener un tiempo de alcance de 65 ms.
c) Respuesta a escalón en referencia: valor inicial del mando en los dos ajustes a) y b).
Comentar.
d) Respuesta a escalón en perturbación: valor final de la salida y valor final del mando en
los dos ajustes a) y b). Comentar.

P S.3 El diagrama de bloques de la figura modela un sistema de control de velocidad con


control PI con ponderación de la referencia. Obsérvese que la planta no tiene integración.

Se desea un sobrepaso de aproximadamente el 12,5% en la respuesta a escalón en referencia.

a) Para control P se desconecta la acción integral (1/Ti = 0, b=1). Ajustar el valor de K. Dar
la pulsación natural. Dar el error de seguimiento y el de perturbación en régimen
permanente.
b) Control PI: Tomar b= 1,  = 0,55 y n = 15. Ajustar K y Ti. Dar el tercer polo. Dar el error
de seguimiento y el de perturbación en régimen permanente.
c) Control PI: Respuesta a escalón en referencia. Dar los polos y los ceros para b=1.
Indicar si el sobrepaso será mayor o menor del 12,6%. Ajustar el valor de b para tener
un sobrepaso del 12,6%.

48
d) Control PI con el valor anterior de b: Valor inicial y valor final del mando en la
respuesta a un escalón en referencia. Valor inicial y valor final del mando en la
respuesta a un escalón en perturbación.

P S.4 El diagrama de bloques de la figura es un modelo genérico de un sistema de control.

Para se desea un sobrepaso del 16,3% en la respuesta a escalón en referencia.

Control proporcional, C(s) = K:

a) Ajustar el valor de K. Dar la pulsación propia no amortiguada. En la respuesta a escalón


en referencia: valor final, valor de pico, tiempo de pico, tiempo de establecimiento.

Control PI:

b) Para  = 0,5 y n = 1,5 ajustar los parámetros del control. Valor del tercer polo.
c) Respuesta a escalón en referencia. Dar los polos y los ceros. Indicar si el sobrepaso
será mayor o menor del 16,3%.
d) ¿Cómo puede obtenerse un sobrepaso del 16,3%? Concretar.

El siguiente apartado solo tiene gracia si se usa Matlab; pero se recomienda mucho
hacerlo.

e) Repetir el diseño b) para  = 0,5 y n = 1,9. Simular con Matlab las tres respuestas a
escalón en referencia de los diseños: a), b), e). Sacar conclusiones.

P S.5 Servomecanismo de posición, control PID.

Usando el álgebra de diagramas de bloques se obtendrán distintas funciones de transferencia


interesantes que se estudiarán posteriormente. Es preferible hacerlo en función de los
parámetros, pero se dan valores por si se desea comprobar con Matlab.

Planta: Km=100 º/V.s, Kd=1000 º/N.m.s, Tm=40 ms

Control: K=0,9 V/º, Ti =200 ms, Td =9 ms, N=3

49
a) Obtener la función de transferencia C(s) del control como cociente de polinomios,
pero sin multiplicar.
b) Obtener las 6 FdeT para dos salidas (y, u) y las tres entradas (r, d, n): F(s), Fd(s), Fn(s),
Fur(s), Fud(s), Fun(s). Los polinomios numerador y denominador se dejarán sin multipli-
car. Téngase en cuenta que están relacionadas, por lo que no es lo más hábil empezar
con cada FdeT independientemente.
c) Indicar qué FdeT son idénticas (o simplemente proporcionales) y sacar consecuencias.
¿Es posible seguir una referencia y rechazar un ruido a la vez?
d) Estudiar las ganancias estáticas y sacar consecuencias. Comprobar con el diagrama de
bloques.
e) Estudiar los valores iniciales en las respuestas a un escalón. Comprobar con el
diagrama de bloques.

Se aplica la acción diferencial solo a la salida, y se añade ponderación de la referencia:

f) Obtener la FdeT F(s)


g) Calcular el valor inicial del mando para escalón en referencia.

50
Soluciones

P S.1

a)  = 0,7 K = 2,551 n = 14,29


b) y() = 1 ta = 0,230 ts = 0,203 ts < ta porque Mp < 5%
c) y() = -0,196. Cero bastante significativo (-z/n = 20/14,29); Mp > 4,6%

d) y1() = 0,6 y2() = 0,4432


e) u1(0) = 1,53 u1() = 0 u2(0) = 0 u2() = 0,4

P S.2

a) K1 = 3,472 n = 16,67 ta = 0,166


b)  = 0,6 y n = 42,62 K1 = 22,70 K2 = 0,3892
c) u1(0) = K1 Bastante mayor en b). Si el mando máximo es 1, ambos saturan para
escalón unitario; a) satura con un escalón de 0,29 y b) con un escalón de 0,044.
d) ya() = -0,072 yb() = -0,011 ua() = ub() = 0,25 Aunque ambos requieren el
mismo mando, b) tiene menor error de perturbación.

P S.3

a)  = 0,55 K = 0,900 n = 20,00 Es = 0,1 Ed = 0,05


b) K = 0,6894 Ti = 0,2228 p = -5,5 Es = 0 Ed = 0
c) Polos -8,250 ± 12,53j y -5,5 cero -4,488 Mayor b = 0,8161
d) ur(0) = 0,5626 ur() = 0,1 ud(0) = 0 ud() = 0,05

P S.4

a)  = 0,5 K = 3 n = 2 y() = 0,75 yp = 0,8723 tp = 1,82 ts = 2,65


b) K=2 Ti = 1,778 p = -0,5
c) Polos -0,75 ± 1,299j y -0,5 cero -0,5624 Menor sobrepaso
d) Usando ponderación de la referencia. Para elevar el sobrepaso, b>1: b = 1,125
e) K = 2,8 Ti = 7,756 p = -0,1 z = -0,1289
Ti grande, que da una respuesta muy descolgada, aunque parecería que la rapidez (n)
es mayor. El problema es que está demasiado cerca de la del control P.

51
P S.5

a)
[ ( )]

( )

b)
[ ( )]

( ) [ ( )]

( )

( ) [ ( )]

[ ( )]

( ) [ ( )]

c) La influencia de la referencia y del ruido son iguales, salvo el cambio de signo, que es
una cuestión de definición. Muchas veces se mueven en frecuencias distintas (el ruido
es pequeño para las frecuencias comunes), y gracias a ello se puede funcionar. La
influencia de la referencia sobre la salida y la de la perturbación sobre el mando son
proporcionales; esto se debe a que la perturbación está aplicada en el mismo punto
que el mando.
d) F(0)=1, error de seguimiento nulo. Fd(0) = 0, error de perturbación nulo. Fur(0) = 0,
mando final nulo (por la integración de la planta). Fud(0) = Kd/Km, el mando compensa la
perturbación. La influencia de un ruido constante (error de medida) es igual que la de
la referencia.
e) Valores iniciales para escalones: F() = 0, y todos son cero salvo el mando para escalón
en referencia o en ruido: u(0) = Fur()= K(N+1) = -Fun()
f) Solo cambia la influencia de la referencia (F(s) y Fur(s)), y solo el numerador.
( )

( ) [ ( )]
g) u(0) = bK

52
Influencia de ceros y polos adicionales en la
respuesta a un escalón de un sistema de 2º
orden
Para sistemas de segundo orden con ceros o de orden superior, la respuesta temporal forzada
puede calcularse mediante la expresión general . El estudio de los polos
y ceros del sistema puede dar una idea de la forma de la respuesta.
En este documento se analizan dos casos particulares por su interés: el sistema de segundo
orden con un cero y el sistema de tercer orden sin ceros. Estos dos casos surgen de añadir un
cero o un polo al sistema de 2º y aporta ideas útiles para analizar cualitativamente sistemas de
orden superior.

Efecto de un cero adicional

Cuando se añade un cero a un sistema de 2º orden ideal, resulta la siguiente función de


transferencia:

Se ha supuesto que el cero añadido, con constante de tiempo T, puede ser tanto negativo
(signo + en el numerador) o positivo (signo – en el numerador). Para dibujar de forma sencilla
un boceto de la respuesta y poder así analizar cualitativamente el efecto del cero adicional, se
considera que el sistema es la suma o resta (en función del signo del cero adicional) de dos
funciones de transferencia, la de un sistema de 2º orden sin ceros y la derivada del anterior
multiplicada por T:

Teniendo en cuenta esta descomposición de la función de transferencia, la respuesta a un


escalón se puede obtener sumando la respuesta del sistema de 2º orden sin ceros y su
derivada temporal multiplicada por T. En la figura 1 se muestra la respuesta a un escalón
unitario de un sistema de segundo orden subamortiguado ( y ) cuando se añade
un cero negativo (signo +) o positivo (signo -). Como conclusiones fundamentales cabe citar las
siguientes:

 Tanto el cero positivo como el negativo incrementan el sobrepaso de la respuesta,


tanto más cuanto menor es el valor absoluto del cero o mayor la constante de tiempo
asociada al mismo.

53
 Un cero negativo reduce el tiempo de alcance y el tiempo de pico, mientras que un
cero positivo los incrementa.
 Un cero positivo produce siempre una respuesta inicial en sentido inverso a la
tendencia posterior de la respuesta.

Figura 1: Respuesta a un escalón unitario de un sistema de segundo orden subamortiguado con cero adicional negativo y
positivo (T = 1).

En la figura 2 se muestra la respuesta a un escalón unitario de un sistema de segundo orden


sobreamortiguado ( y ) cuando se añade un cero negativo o positivo con T = 1.
Finalmente, en la figura 3 se muestra la respuesta la respuesta a un escalón unitario de un
sistema sobreamortiguado ( y ) cuando se reduce el módulo del cero negativo
tomando T = 4. Como conclusiones fundamentales cabe citar las siguientes:

 El cero negativo puede llegar a generar un sobrepaso en la respuesta de un sistema


sobreamortiguado, mientras que un cero positivo no lo producirá en ningún caso.
 Un cero negativo reduce el tiempo de establecimiento, mientras que un cero positivo
lo incrementa.
 Un cero positivo produce siempre una respuesta inicial en sentido inverso a la
tendencia posterior de la respuesta.

En todos los casos, si el módulo del cero es grande su efecto comienza a ser despreciable. Una
regla muy utilizada es despreciar el efecto del cero si su módulo es mayor que 5 veces el de los
polos de segundo orden.

54
Figura 2: Respuesta a un escalón unitario de un sistema de segundo orden sobreamortiguado con cero adicional negativo y
positivo (T = 1).

Figura 3: Respuesta a un escalón unitario de un sistema de segundo orden sobreamortiguado con cero adicional negativo y
positivo más sognificativo que el anterior (T = 4).

Efecto de un polo adicional

Supóngase un sistema de segundo orden al que se añade un polo adicional (negativo) de


constante de tiempo :

( )

55
El efecto del polo adicional sobre la respuesta a un escalón unitario de un sistema de 2º orden
sin ceros es equivalente al de un filtro paso bajo aplicado a la salida del sistema de 2º orden. Es
decir, la respuesta se suaviza reduciéndose, o incluso desapareciendo, el sobrepaso y
aumentado los tiempos de alcance y de pico.
La figura 4 compara la respuesta de un sistema de segundo orden subamortiguado ( y
), y la de otro con un polo adicional para varios valores de éste. Si el módulo del polo es
grande su efecto comienza a ser despreciable. Una regla muy utilizada es despreciar el efecto
del polo si su módulo es mayor que 5 veces el de los polos de segundo orden.

Step Response
1.4

1.2

0.8
Amplitude

Segundo orden sin polo adicional


polo adicional -5wn
0.6
polo adicional -2wn
polo adicional -wn
polo adicional -0,5wn
0.4

0.2

0
0 2 4 6 8 10 12 14
Time (seconds)

Figura 4: Efecto de un polo adicional, para distintos valores del módulo del polo 1/  .

Estos estudios complementan el apartado 4.4.1 del texto de Regulación Automática, Luis
Pagola. A continuación se presentan versiones ampliadas de la Figura 4.7 y la Tabla 4.1

56
2

1.5

0.5
ref
2º + z = -0,5
2º + z = -1
2º + z = -2
0
2º orden
2º + p = -2
2º + p = -1
2º + p = -0,5
-0.5 2º + z = +0,5
2º + z = +1
2º + z = +2

-1
0 1 2 3 4 5 6 7 8

Figura 4.7(ampl) Respuestas a un escalón con cero o polo adicional

Sistema de segundo orden:  = 0,5 n = 1

57
Tabla 4.1(ampl) Sistema de segundo orden ( = 0,5) con cero o polo
adicional
z/n Mp % Rp % * ntp nts

Cero (negativo) z 0,5 69,9 16,3 1,81 6,85

1 29,8 16,3 2,42 4,38

2 19,1 16,3 3,02 4,78

5 16,7 16,3 3,41 5,08

10 16,4 16,3 3,51 5,19


Segundo orden  16,3 16,3 3,63 5,29
= 0,5

10 16,2 16,3 3,73 5,39

5 15,9 16,3 3,85 5,49

2 13,9 16,3 4,23 5,79

1 8,1 18,1 4,92 5,97

Polo (negativo) p 0,5 - - - 5,44


p/n

z/n Mp % mp % ** ntp nts


Cero (positivo) z 0,5 28,6 -75,2 4,45 6,39
1 20,9 -28,0 4,23 6,03
2 17,8 -9,1 4,02 5,73
5 16,6 -1,8 3,81 5,48
10 16,4 -0,5 3,73 5,39
Segundo orden  16,3 0 3,63 5,29
= 0,5

* Rp % es la razón entre el segundo pico y el primero.

** mp % es el pico negativo inicial.

58

También podría gustarte