Journal Information
Title: Enfoque UTE
Abbreviated Title: Enfoque UTE
ISSN (print): 1390-9363
ISSN (electronic): 1390-6542
Publisher: Universidad UTE (Quito, Ecuador)
Las aplicaciones industriales generalmente requieren interacciones entre reactivos, donde un nivel de líquido debe ser constante para alcanzar una reacción química con éxito. Estos procesos industriales se desarrollan en sistemas que involucran tanques acoplados entre sí. Los sistemas de dos tanques son ampliamente utilizados en procesos de purificación de agua, procesamiento de alimentos, tratamientos de desechos nucleares, entre otros. Estos ejemplos incluyen requisitos de rendimiento agresivos que pueden no ser alcanzables con métodos de control en lazo abierto (Vikram, et al., 2005). Los sistemas acoplados con 3 o 4 tanques se han convertido en una herramienta útil en el tratamiento de bio-contaminantes (Guillod, et al., 2003) o aguas residuales con alto contenido orgánico (Mavrias, et al., 2003). Es por eso que, desarrollar estrategias de control para superar las irregularidades o limitaciones en los procesos industriales son casos de estudio llamativos dentro de la ingeniería de control.
En el campo de control, se ha prestado especial atención a los sistemas de cuatro tanques introducidos por (Johansson, 2000). Debido a su versatilidad para aplicaciones educativas e industriales. El sistema ofrece una dinámica no lineal y variables físicas acopladas que hacen atractivo llevar a cabo varias estrategias de control como se muestra en (Cheng, et al., 2016); (Askari, et al., 2016). Dentro de esta variedad, dos técnicas de control han sido ampliamente utilizadas por su robustez: control predictivo basado en el modelo (Model Predictive Control) y regulador cuadrático lineal (Linear Quadratic Regulator) conocidos como MPC y LQR por sus siglas en inglés, respectivamente. Existen técnicas de optimización basadas en algoritmos genéticos como en el trabajo realizado en (Najarro, et al., 2017), que pueden ser tratados a futuro.
MPC es una estrategia de control utilizada en varios campos industriales debido a su adaptabilidad. El controlador MPC puede considerar retardos en las entradas y salidas, no linealidades, incertidumbres, naturaleza estocástica, por nombrar algunos (Grosso, et al., 2016); (Camacho & Bordons, 2004); (Velarde, et al., 2017). La idea detrás de este esquema de control es minimizar una función objetivo mediante el cálculo de una secuencia de acciones de control a lo largo de un horizonte de predicción; solo el primer componente de esta secuencia de control se implementa en el paso de tiempo actual; las acciones de control restantes se descartan. El problema de optimización se repite a cada instante del tiempo. Este esquema permite obtener una señal de control basada en estados pasados así como en estados futuros fundamentado en un modelo del sistema dinámico.
LQR es un método sustentado en la ponderación de las variables de estado y las entradas de control. Además, esta técnica ofrece un menor consumo de recursos computacionales en su implementación. Las respuestas producidas son más rápidas con una acción de control óptima, especialmente en los sistemas de tanques acoplados (Engules, et al., 2015). En este sentido, la carga computacional es reducida notablemente en su implementación.
El presente artículo propone una comparación adecuada entre estas dos estrategias de control ampliamente implementadas. La comparación busca mostrar sus ventajas y desventajas, así como presentar sus diseños e implementación en un caso de estudio real. Con este fin, el sistema de cuatro tanques acoplados se modela al tener en cuenta sus no linealidades. Sin embargo, para probar los controladores diseñados es necesario considerar un modelo lineal alrededor de un punto de operación adecuado, que se detalla en este trabajo. El sistema de cuatro tanques acoplados puede ser muy vulnerable al presentar un error de posición en estado estacionario; este inconveniente se puede superar mediante la introducción de restricciones suaves (soft-constraints) y una acción integral en la formulación tradicional para los controladores MPC y LQR, respectivamente; dando como resultado un MPC con restricciones suaves (SC-MPC) y la acción integral en el LQR (PI-LQR). Estas dos formulaciones y el proceso de linealización, son descritas en detalle y generalizadas para cualquier sistema.
El resto de este documento está organizado de la siguiente manera. La Sección 2 presenta la descripción no lineal del sistema de cuatro tanques, el modelo matemático, los parámetros de trabajo y su linealización referida a un punto de trabajo obtenido a partir de una curva de reacción. En la Sección 3, las dos técnicas de control PI-LQR y SC-MPC son formuladas bajo una manera general y ser aplicadas en el sistema descrito. Los resultados de la comparación que señalan ventajas y desventajas entre estas dos técnicas, se proporcionan en la Sección 4. Finalmente, las conclusiones son especificadas en la sección 5. El presente trabajo es una versión extendida y en español del artículo (Chamorro, et al., 2017).
La planta de cuatro tanques es un sistema educativo diseñado para probar técnicas de control mediante instrumentación de tipo industrial (Alvarado, et al., 2011). El sistema consiste en una modificación de los cuatro tanques de agua interconectados presentados por (Johansson, 2000) para realizar el seguimiento de referencias mediante SC-MPC y PI-LQR. La Figura 1 muestra el diagrama de la planta, que se compone de cuatro tanques: dos tanques superiores (3 y 4), que se descargan en dos inferiores (1 y 2). Cada tanque se llena con el flujo de un tanque de almacenamiento situado en la parte inferior de la planta mediante dos bombas (y). Los flujos de entrada están regulados por válvulas de tres vías. El sistema se modela como se muestra a continuación:
Donde es el nivel de flujo de cada uno, S es la sección transversal, es la constante de descarga y es la relación de la válvula de tres caminos.
La Tabla 1 muestra los parámetros empleados en el proceso de simulación
Parámetro | Valor | Parámetro | Valor |
---|---|---|---|
0.65 m | 1.31 x 10-4 m2 | ||
0.65 m | 1.507 x 10-4 m2 | ||
0.65 m | 9.627 x 10-4 m2 | ||
0.65 m | 8.31 x 10-4 m2 | ||
1.63 m3/h | 0.30 | ||
2m3/h | 0.40 | ||
0.06 m2 |
Para asegurar el correcto funcionamiento de la planta y su equipo, el sistema está sujeto a restricciones en cada instante de tiempo , es decir:
Estas restricciones se pueden expresar como restricciones en los estados, en las entradas o como restricciones politópicas.
La función de coste para este sistema está dado por:
Donde, es el nivel de referencia dado para los estados, y son los pesos para los estados y las entradas de control, respectivamente.
El nivel en cada uno de los cuatro tanques se estabiliza en un valor de altura que depende de los dos flujos en las entradas del sistema. La Figura 2 representa la curva de reacción; esta curva se obtiene al proporcionar varias entradas que van desde 0 hasta los valores de flujos máximos dados por las restricciones propias del sistema. Además, permite identificar el punto de trabajo, denominado también punto de operación, alrededor del cual el sistema será linealizado y hasta qué punto puede extenderse la linealización para seguir con un modelo lineal válido.
Como se puede observar en la Figura 2, el punto de operación m; ubicado en la mitad de la curva, permite; desplazamientos lineales a lo largo de una sección recta.
Un método para la identificación de sistemas no lineales se muestra en (Sugeno & Takagi, 1985), mediante la optimización un índice de rendimiento. Esta técnica consiste en generar un conjunto compuesto por muestras aleatorias alrededor del punto de operación como datos de entrada y salidas correspondientes a la respuesta a las entradas dadas. Ambos datos de entrada y salida se calculan mediante el modelo no lineal. Estos valores son la base para el algoritmo de linealización. Por lo tanto, cada muestra puede ser expresada según las ecuaciones 8 a la 15.
Donde, son las constantes de linealización, obtenidas al alcanzar el menor error en la estimación de salida. Este error está dado por:
Al reducir un índice de rendimiento, el error cuadrado de la matriz de parámetros también es minimizada (Jimenez, et al., 2013). Este índice es:
Se logra una mayor precisión con un mayor número de muestras durante el proceso de estimación, además, es una matriz de rango completo por lo tanto la ecuación (12) está expresada de la siguiente manera:
Las matrices y están contenidas dentro de El modelo lineal en tiempo discreto del sistema de cuatro tanques alrededor de los puntos de trabajo , y descritos en la Tabla 2, se expresa como:
Donde , para y y corresponde a Además, A y B son matrices invariantes en el tiempo, que pueden obtenerse de la solución (13) de la siguiente manera:
En particular, para este modelo lineal, y . En este punto las matrices A y B para un tiempo de muestreo de T = 5s, son definidas como:
El sistema de cuatro tanques consta de múltiples entradas y múltiples salidas (MIMO) con error en estado estable diferente de cero, la comparación del rendimiento se lleva a cabo entre los dos controladores propuestos que buscan reducir este error. En esta sección se formula el problema de control para el sistema mencionado anteriormente basado en un PI-LQR y SC-MPC.
El sistema lineal, definido por (14) puede ser llevado desde un estado inicial a otro por medio de una acción de control bajo una formulación en lazo cerrado dada por:
Donde es una matriz de ganancias. Para determinar, el siguiente criterio (función objetivo) debe ser minimizado (Herrera, et al., 2015),
La solución a este problema es encontrar la matriz P, definido-positivo que resuelve la ecuación de Ricatti:
La ganancia de la matriz es calculada de la siguiente manera:
Para garantizar un error de posición en estado estable igual a cero, se debe agregar una acción integral al controlador LQR. Aquí, las referencias dadas al sistema se denotan como . Se propone agregar nuevos estados para lograr una acción integral asociada con el error entre cada instante de tiempo y el consecutivo , para más detalle véase (Jimenez, et al., 2013).
La ecuación (21) representa un sistema extendido cuya formulación se puede escribir como:
El sistema dado por (22) es reescrito como:
Donde, , , , y , y . El índice de rendimiento que considera el sistema extendido se convierte
Al priorizar el valor de los estados frente a las acciones de control, los valores y seleccionados para el algoritmo del controlador LQR discreto son:
MPC es una estrategia de control basada en el uso del modelo lineal dinámico del sistema para calcular la evolución de los estados a lo largo de un horizonte de predicción. La secuencia de acciones de control futuras se calcula minimizando la función de coste dada por (5) a lo largo de . Solo el primer elemento de la secuencia () se aplica al proceso en el instante de tiempo actual ; los elementos restantes son descartados. El problema de optimización se repite en el siguiente instante de tiempo para calcular las acciones correspondientes con la información más reciente.
El problema de optimización resuelto en cada instante se formula de la siguiente manera:
Sujeto a:
Donde es el conjunto de números enteros de 0 a .
Una alternativa para conseguir el seguimiento de la referencia es incorporar restricciones suaves en el problema de optimización. La idea principal detrás de la introducción de restricciones suaves es considerar un sistema extendido que replica los estados y las entradas de control del sistema físico y adicionar acciones de control "virtuales" en las entradas del sistema , una por cada estado, que actúan libremente cuando los estados replicados ; altamente penalizados cuando los estados se encuentran lejos de las referencias. En este sentido, la función objetivo se puede escribir como:
Donde y representan los estados extendidos y la entrada de control, respectivamente. Por lo tanto, el sistema aumentado se define como:
Además, los pesos de la función de coste y se definen como:
Donde, estos valores de y son los pesos en la función de coste para los estados adicionales y la entrada de control respectivamente. Además, debe ser un valor alto para penalizar la desviación de los estados de las referencias y debe ser un valor pequeño para dar libertad a la entrada de control en el momento de dirigir el sistema hacia sus referencias. El problema de optimización que incorpora restricciones suaves se establece de la siguiente manera
Sujeto a (30):
Nótese que las entradas de control no están sujetas a restricciones debido a estas acciones de control que pueden tomar valores en un amplio rango.
En esta sección, los dos controladores son implementados mediante simulación para comparar su rendimiento y destacar sus ventajas y desventajas.
La acción integral en el LQR es proporcionada por constantes óptimas multiplicadas por el error. En este punto, la matriz de ganancia para el sistema de cuatro tanques está dada por:
Las acciones de control se calculan según los pesos y para dar más prioridad a los estados que a las entradas del sistema.
En este marco de simulación, la condición inicial es m para cada tanque que corresponde al punto de operación. Las referencias para cada estado se establecen en 0.5 m y tienen las mismas matrices y cuyos valores se especifican de acuerdo con (26).
La Figura 3 muestra que el LQR ayuda a alcanzar la referencia en cada tanque, la respuesta contiene un error de estado estable que es mínimo.
Para producir estos resultados, los flujos de entrada requeridos y se muestran en la Figura 4. Como puede verse, la entrada B () comienza antes de la entrada A () en t = 0 que proporcionan un flujo máximo de y , respectivamente. Es importante notar que ambas señales de control no alcanzan el flujo de saturación de y , dado por (5).
El error en estado estacionario con el SC-MPC se reduce por la acción de las restricciones suaves que producen un alcance rápido de las referencias con grandes sobre-impulsos, además, se tiene un error mínimo de estado estacionario. La Figura 5 muestra las respuestas de la planta obtenidas al aplicar un controlador MPC en las mismas condiciones establecidas con el controlador LQR y con un horizonte de predicción .
Debido a las restricciones suaves, ambas entradas de control comienzan después de t = 0 con un retardo. Luego de eso, estas señales de control empiezan a aumentar rápidamente hasta alcanzar flujos constantes de y respectivamente, como se muestra en la Figura 6.
El objetivo en la comparación entre los controladores SC-MPC y PI-LQR es determinar cuál produce la mejor respuesta mediante el análisis de los parámetros que muestren un índice de rendimiento como: el error de estado estable, el tiempo de ajuste y el tiempo de cálculo computacional. Ambos controladores funcionan en las mismas condiciones y tratan de reducir el error de estado estable a cero.
La capacidad del proceso para llegar a las referencias con entradas que hacen el menor esfuerzo para producir estas respuestas se denomina índice de rendimiento, este índice de rendimiento se calcula mediante la función de coste acumulada, dada por:
Donde es el número de muestras tomadas durante el tiempo de simulación. Si se tiene en cuenta que el tiempo de muestreo seleccionado para el sistema de cuatro tanques es T= 5s, esto resulta en:
Con un tiempo de simulación de 500 s. El índice de rendimiento para los controladores son unidades de coste y unidades de coste.
El rendimiento de salida de ambos controladores se puede comparar estableciendo un punto de referencia y midiendo los niveles de agua para cada uno de los tanques en estado estacionario y los tiempos de caída que se obtienen a partir de la Figura 3 y la Figura 5, estos resultados se resumen en la Tabla 2.
Los resultados indican que un controlador SC-MPC proporciona la respuesta más rápida con el menor error de seguimiento de referencia en estado estacionario y el coste acumulado final. Sin embargo, el tiempo de cálculo promedio requerido por el controlador SC-MPC es 6.04 × 10-2 s, este valor es considerablemente más grande que el PI-LQR que es en el orden de los microsegundos. Este parámetro, en ambos casos, no afecta el rendimiento del controlador debido a que el muestreo se realiza cada 5s y es mucho mayor que el tiempo de cálculo para ambos controladores. El controlador SC-MPC agrega un retraso en la señal de control; debido al tiempo empleado en su cálculo; Por otro lado, la salida de control en el PI-LQR responde instantáneamente, sin embargo, el establecimiento es aproximadamente un 49% más rápido con el MPC. Como se indicó anteriormente, el LQR tiene un pequeño error de posición el cual se mejoró alrededor del 2.24% con el controlador SC-MPC como se indica en la Tabla 2.
Las respuestas de los controladores LQR y MPC en su forma común poseen un error de posición considerable. Una acción integral agregada al LQR y restricciones suaves al MPC permiten reducir este error considerablemente y mejorar los tiempos de respuesta. El sistema de cuatro tanques, que se modeló y linealizó en un espacio discreto, tiene un tiempo de muestreo relativamente grande de 5 s. El cálculo de las acciones de control de ambos controladores toma menos que este tiempo de muestreo, sin embargo, la salida de control empleando SC-MPC requiere un esfuerzo computacional mayor que el PI-LQR lo que hace que el tiempo de cálculo con el LQR sea casi tres veces más rápido que con el SC-MPC.
Implementar un controlador LQR se vuelve más fácil porque solo requiere de una constante óptima calculada en forma off-line, mientras que un MPC requiere un cálculo en línea para estimar la salida de control en cada tiempo de muestreo, creciendo a medida que aumenta el horizonte de predicción.
El tiempo de ajuste se mejora con la implementación de restricciones suaves en el MPC lo cual significa que el sobreimpulso en cada estado también aumenta. Sin embargo, esta característica no afecta al rendimiento general del sistema