Journal Information

Article Information


Rendimiento de Enfoques de Control Auto-Disparado

 

Resumen:

El control auto-disparado produce secuencias de muestreo no periódico que varían según varios de factores de diseño relacionados con la estabilidad y el rendimiento del sistema a ser controlado. Dentro de este marco, recientemente han sido desarrollados dos enfoques dirigidos a minimizar un costo cuadrático, considerando un rendimiento óptimo y persiguiendo el mismo objetivo de control; cada una de ellos sigue una regla de muestreo diferente. Un enfoque se basa en mantener el valor de control actual tanto tiempo como sea posible, mientras que un umbral de rendimiento óptimo no se traspase. El otro enfoque se basa en la generación de una señal de control a trozos que se aproxima a una señal de control óptima continua, sujeta a determinadas limitaciones. Este artículo presenta un estudio comparativo entre los dos enfoques, proporcionando una percepción útil para la realización de futuras investigaciones. Como métricas de interés, el rendimiento de control y la utilización de recursos fueron considerados, y para evaluarlos, se hizo uso del intervalo de muestreo promedio y del costo normalizado. Se demostró que el diferente espacio de búsqueda de cada enfoque plantea un desafío para diseñar un marco de comparación equitativo, y que ambos enfoques superan al muestreo periódico.

Abstract:

The self-triggered control produces non-periodic sampling sequences that vary depending on design factors related to stability and performance of the controlled system. Within this framework, two approaches aimed at minimizing a quadratic cost have been developed recently, considering an optimal performance and pursuing the same control objective; each approach follows a different sampling rule. One approach is based on maintaining the current control value as long as possible, while an optimal performance threshold is not passed. The other approach is based on the generation of a piecewise control signal, which approximates a continuous optimal control signal subject to certain constraints. This article presents a comparative study between the two approaches, providing a useful insight for conducting future research. Control performance and resource utilization were considered as metrics of interest and to evaluate them, the average sampling interval and the standardized cost were taken into account. It was shown that the different search space of each approach poses a challenge to design an equitable framework of comparison, and that both approaches exceed the periodic sampling.


1. Introducción

En la actualidad, los controladores son implementados usando sistemas computacionales en los cuales la tarea de control comparte recursos de procesamiento y red con otras tareas. El muestreo periódico establece que la tarea de control se debe ejecutar (disparar) en función del tiempo, es decir, cada vez que el período de muestreo se cumple, incurriendo a menudo en la sobreutilización de recursos (Astrom, 1999). Sin embargo, los esquemas no periódicos de muestreo pueden ser más efectivos que los periódicos, al balancear el rendimiento de control en lazo cerrado (calidad de control) en función de la utilización de recursos (Gommans, 2015).

Dos tipos de aproximaciones que abandonan el paradigma de control periódico son el control disparado por eventos (ETC, Event-Triggered Control) y el control auto-disparado (STC, Self-Triggered Control), (Heemels, 2012). El primero es reactivo y requiere de la ejecución de la tarea de control cuando algún estado de la planta sobrepasa cierto valor de umbral (Arzén, 1999). El segundo calcula previamente cuándo será la próxima vez que la tarea de control se debe ejecutar (Velasco, 2003). Tanto ETC como STC se componen de dos elementos: un controlador con realimentación que calcula la entrada de control, y un mecanismo de disparo que determina cuándo debe actualizarse de nuevo esta entrada de control.

El presente artículo se centra en analizar reglas para muestreo aplicadas en STC, direccionadas a producir secuencias de entradas de control con costo menor o igual que el costo óptimo, el cual corresponde al mínimo dado por el regulador cuadrático lineal (LQR, Linear Quadratic Regulator) de tiempo discreto (Astrom, 1997). El problema de la regla para muestreo óptimo ha sido recientemente abordado en (Rabi, 2008), (Velasco, 2011), (Meng, 2012), (Molin, 2013), (Bini, 2014), (Gommans, 2014) y (Velasco, 2015), cuya contribución ofrece formulaciones factibles en diferentes entornos, a la vez que identifica posibles limitaciones en términos de optimalidad, tratabilidad computacional y/o aplicación práctica. Sin embargo, dentro de la literatura existente, no se encuentra un marco comparativo o una metodología para evaluar sus propiedades.

Para superar esta limitación el presente trabajo considera dos enfoques de STC, (Gommans, 2014) y (Velasco, 2015), con el objetivo de identificar los aspectos claves que una metodología de comparación debe tener en cuenta para la evaluación del rendimiento. La contribución de este trabajo consiste en presentar un análisis comparativo de las dos aproximaciones, donde el rendimiento de control y la utilización de recursos son las principales métricas de interés. Además, el equilibrio inherente entre rendimiento y utilización es la base para establecer la metodología utilizada en el análisis comparativo de desempeño. Los resultados obtenidos a través de simulaciones revelan sus posibles beneficios y limitaciones, a la vez que permiten extraer lineamientos para el diseño futuro de nuevas reglas de muestreo óptimo.

El resto del documento está estructurado de la siguiente manera. La Sección 2 presenta la base teórica necesaria para comprender los dos enfoques de control; muestra las pautas a seguir para desarrollar el análisis comparativo. La Sección 3 ilustra numéricamente la evaluación de rendimiento y muestra la discusión de los resultados. Finalmente, la Sección 4 concluye el manuscrito.

2. Metodología

En adelante, la aproximación en Gommans (2014) llamada control cuadrático lineal auto-disparado (Self-Triggered Linear Quadratic Control) se citará como STLQ. La aproximación en Velasco (2015), llamada control auto-disparado inspirado en muestreo óptimo (Optimal-Sampling-Inspired Self-Triggered Control), se mencionará como OSIST.

Ambos enfoques de STC consideran un sistema lineal continuo invariante en el tiempo (LTI, Linear Time-Invariant), regido por

(1)
1390-6542-enfoqueute-8-02-00107-e1.png

donde 1390-6542-enfoqueute-8-02-00107-i002.png es el vector de estados y 1390-6542-enfoqueute-8-02-00107-i003.png es el vector de señales de entrada, 1390-6542-enfoqueute-8-02-00107-i004.png y 1390-6542-enfoqueute-8-02-00107-i005.png son matrices que describen la dinámica del sistema, y 1390-6542-enfoqueute-8-02-00107-i006.png es el vector de estados iniciales.

Una diferencia fundamental entre STLQ y OSIST, consiste en que el primero contempla el trabajo bajo condiciones de ruido. Sin embargo, el estudio desarrollado a través de este artículo no lo considera, ya que ambos enfoques presentan contribuciones comparables para el caso de condiciones ideales.

La señal de entrada de control continua 1390-6542-enfoqueute-8-02-00107-i007.png en (1) está limitada a ser constante a trozos,

(2)
1390-6542-enfoqueute-8-02-00107-e2.png,

donde 1390-6542-enfoqueute-8-02-00107-i009.png es la entrada de control en tiempos discretos1390-6542-enfoqueute-8-02-00107-i010.png, y 1390-6542-enfoqueute-8-02-00107-i011.png simboliza los instantes de muestreo. El patrón de muestreo está representado por los valores que separan dos instantes consecutivos llamados intervalos de muestreo1390-6542-enfoqueute-8-02-00107-i012.png. Los instantes de muestreo y los intervalos de muestreo están relacionados entre sí a través de

(3)
1390-6542-enfoqueute-8-02-00107-e3.png

El problema óptimo LQR de horizonte infinito en tiempo continuo contempla la búsqueda de una señal de entrada que minimiza la función de costo

(4)
1390-6542-enfoqueute-8-02-00107-e4.png

considerando las matrices 1390-6542-enfoqueute-8-02-00107-i015.png positiva semidefinida, y 1390-6542-enfoqueute-8-02-00107-i016.png positiva definida. Para el control LQR de horizonte infinito en tiempo discreto, se pueden usar formas discretas conocidas (Astrom, 1997).

En el muestreo periódico se tiene 1390-6542-enfoqueute-8-02-00107-i017.png para todos los 1390-6542-enfoqueute-8-02-00107-i018.png, donde 1390-6542-enfoqueute-8-02-00107-i019.png es el período de muestreo. A través de técnicas de discretización usuales (Astrom, 1997), y considerando

(5)
1390-6542-enfoqueute-8-02-00107-e5.png

(6)
1390-6542-enfoqueute-8-02-00107-e6.png

la dinámica (1) puede ser descrita por el sistema LTI en tiempo discreto

(7)
1390-6542-enfoqueute-8-02-00107-e7.png

donde 1390-6542-enfoqueute-8-02-00107-i023.png es el estado muestreado en 1390-6542-enfoqueute-8-02-00107-i024.png. La ecuación (4) puede describirse como un problema óptimo LQR de horizonte infinito en tiempo discreto,

(8)
1390-6542-enfoqueute-8-02-00107-e8.png

con las matrices 1390-6542-enfoqueute-8-02-00107-i026.png positiva semidefinida, 1390-6542-enfoqueute-8-02-00107-i027.png positiva definida y 1390-6542-enfoqueute-8-02-00107-i028.png, todas obtenidas a través de discretizaciones conocidas (Astrom, 1997).

2.1. Enfoques de control auto-disparado

En STLQ y OSIST, tanto la regla de muestreo como la entrada de control a trozos se resuelven minimizando el costo LQR. La regla de muestreo genera intervalos de muestreo 1390-6542-enfoqueute-8-02-00107-i012.png según el estado muestreado 1390-6542-enfoqueute-8-02-00107-i029.png y un conjunto de parámetros. La entrada de control consiste en una ganancia calculada para trabajar durante el intervalo 1390-6542-enfoqueute-8-02-00107-i012.png y depende además del estado muestreado 1390-6542-enfoqueute-8-02-00107-i029.png.

2.1.1. Control Cuadrático Lineal Auto-Disparado (STLQ)

Esta aproximación presenta una regla de muestreo inspirada en el problema clásico LQR de tiempo discreto que busca mantener constante cada entrada de control durante el mayor número de pasos posible, ampliando así cada intervalo de muestreo, y garantizando un rendimiento de control (Gommans, 2014). Esta garantía de rendimiento se da en términos de una función de costo LQR de tiempo discreto; las muestras se activan de acuerdo con una degradación permisible, especificada en el costo LQR y limitada por un intervalo de muestreo mínimo dado.

La regla de muestreo puede ser descrita a través de una notación diferente a la original, así

(9)
1390-6542-enfoqueute-8-02-00107-e9.png,

considera una función de costo

(10)
1390-6542-enfoqueute-8-02-00107-e10.png

El cálculo de 1390-6542-enfoqueute-8-02-00107-i012.png en (9) busca maximizar el intervalo de muestreo actual 1390-6542-enfoqueute-8-02-00107-i032.png (múltiplo del intervalo de muestreo mínimo1390-6542-enfoqueute-8-02-00107-i033.png dado) durante el cual se aplica una señal de control constante 1390-6542-enfoqueute-8-02-00107-i007.png. El valor específico de 1390-6542-enfoqueute-8-02-00107-i007.png debería incurrir en un costo (10) menor que 1390-6542-enfoqueute-8-02-00107-i034.png veces el costo mínimo que obtendría un controlador periódico LQR de tiempo discreto, con intervalo de muestreo 1390-6542-enfoqueute-8-02-00107-i033.png, donde 1390-6542-enfoqueute-8-02-00107-i035.png. En (9), 1390-6542-enfoqueute-8-02-00107-i036.png es la única solución semidefinida positiva a la ecuación algebraica discreta de Riccati (DARE, Discrete Algebraic Ricatti Equation) del costo cuadrático discreto (8) para 1390-6542-enfoqueute-8-02-00107-i033.png periódico. El primer sumando en (10), el término integral, es el costo cuadrático en tiempo continuo (4) sobre el intervalo de muestreo actual. El segundo sumando en (10), es el costo al suponer que las muestras restantes, después del intervalo de muestreo actual, se realizan periódicamente con 1390-6542-enfoqueute-8-02-00107-i033.png.

Además, esta aproximación sugiere que la señal de control, para un intervalo de muestreo dado 1390-6542-enfoqueute-8-02-00107-i012.png, es descrita por

(11)
1390-6542-enfoqueute-8-02-00107-e11.png

En el documento original (Gommans, 2014) se proporciona una expresión alternativa para (11) que tiene una forma estándar de retroalimentación lineal de estados 1390-6542-enfoqueute-8-02-00107-i038.png donde la ganancia 1390-6542-enfoqueute-8-02-00107-i039.png cambia en cada ejecución del controlador. Sin embargo, por propósitos de comparación, la expresión dada en (11) ha sido considerada la más adecuada.

2.1.2. Control Auto-Disparado Inspirado en Muestreo Óptimo (OSIST)

Establece una regla de muestreo que genera entradas de control de tal manera que la señal de control a trozos resultante, se aproxima a la entrada de control LQR de tiempo continuo, proporcionando un muestreo más denso cuando la señal de control exhibe más variación. La garantía de rendimiento se da en términos de densidad de muestreo, definida como el número de muestras a lo largo de un intervalo de tiempo (véase (Bini, 2014)). Las muestras se disparan de acuerdo con la derivativa de la entrada de control LQR de tiempo continuo y tienen como límite superior un valor máximo dado.

La regla de muestreo se sintetiza como

(12)
1390-6542-enfoqueute-8-02-00107-e12.png

donde 1390-6542-enfoqueute-8-02-00107-i041.png es el límite superior para los intervalos de muestreo, 1390-6542-enfoqueute-8-02-00107-i042.png determina la densidad de la secuencia de muestreo (pequeños valores de 1390-6542-enfoqueute-8-02-00107-i042.png producirán instantes de muestreo más densos, es decir muestras más frecuentes, y viceversa). El término 1390-6542-enfoqueute-8-02-00107-i043.png es la ganancia óptima de retroalimentación en tiempo continuo, obtenida al minimizar el costo cuadrático continuo (4). El parámetro 1390-6542-enfoqueute-8-02-00107-i044.png determina la distribución del conjunto de muestras, permitiendo la aparición de más muestras cuando la derivativa de la entrada de control LQR en tiempo continuo es mayor. Véase (Bini, 2014) para una discusión sobre los ajustes del parámetro 1390-6542-enfoqueute-8-02-00107-i045.png.

Además, este enfoque sugiere que la señal de control a trozos a ser aplicada en (2) para un intervalo de muestreo dado 1390-6542-enfoqueute-8-02-00107-i012.png, es descrita por

(13)
1390-6542-enfoqueute-8-02-00107-e13.png

que es la señal de control óptima a trozos que se aplicaría al suponer un muestreo periódico con1390-6542-enfoqueute-8-02-00107-i047.png. La señal de control en (13) también puede expresarse usando una forma estándar de retroalimentación lineal 1390-6542-enfoqueute-8-02-00107-i048.png donde la ganancia 1390-6542-enfoqueute-8-02-00107-i039.png cambia en cada ejecución del controlador y corresponde a la ganancia de retroalimentación óptima en tiempo discreto, encontrada al minimizar el costo (8) para un período de muestreo 1390-6542-enfoqueute-8-02-00107-i012.png.

2.2. Análisis de rendimiento

STLQ se centra en ampliar los intervalos de muestreo, acepta cierta degradación en los costos y enfatiza la utilización de recursos. Además, OSIST se enfoca en producir una señal de control a trozos para imitar la entrada de control óptima continua y da importancia al rendimiento de control.

En la Tabla 1 se agrupan las ecuaciones (14) y (15) tomadas desde (Gommans, 2014), y las ecuaciones (16) y (17), desde (Velasco, 2015). Se usan para resumir las directrices de diseño, tanto para las reglas de muestreo 1390-6542-enfoqueute-8-02-00107-i012.png, como para la entrada de control a trozos 1390-6542-enfoqueute-8-02-00107-i049.png. A través de estas se pueden identificar los parámetros que afectan el funcionamiento en términos de utilización de recursos y rendimiento de control.

Tabla 1

Reglas de muestreo y entradas de control por trozos

1390-6542-enfoqueute-8-02-00107-gt1.jpg

(14)
1390-6542-enfoqueute-8-02-00107-e14.png

(15)
1390-6542-enfoqueute-8-02-00107-e15.png

(16)
1390-6542-enfoqueute-8-02-00107-e16.png

(17)
1390-6542-enfoqueute-8-02-00107-e17.png

2.2.1. Condición inicial e intervalo de muestreo promedio

En STLQ se señala que en ausencia de ruido (caso bajo análisis), cualquier condición inicial a lo largo de un segmento 1390-6542-enfoqueute-8-02-00107-i055.png, conducirá a una misma secuencia de intervalos de muestreo. Dado que la ganancia del controlador es óptima, la dinámica dominante oscilará, lo que significa que los estados saltarán a través de diferentes rayos. Esto producirá un patrón de muestreo oscilatorio que para una ejecución suficientemente larga tendrá el mismo período promedio, independientemente de la condición inicial. Para una caracterización extendida de las secuencias de muestreo véase (Velasco, 2009).

En la regla de muestreo de OSIST en (12), en estado de equilibrio (1390-6542-enfoqueute-8-02-00107-i056.png), los intervalos de muestreo son lo más largos posible (1390-6542-enfoqueute-8-02-00107-i057.png). La tendencia consiste en obtener intervalos largos a medida que la dinámica de lazo cerrado se aproxima al equilibrio, así, si el estado inicial ya proporciona un intervalo largo, existe una alta probabilidad que la secuencia trabaje en el tope superior de valores. Por lo tanto, pueden alcanzarse intervalos de muestreo promedio más grandes.

El estado inicial más adecuado será el que para OSIST proporcione el período promedio más corto; el tiempo de ejecución deberá ser lo suficientemente largo como para permitir que ambos enfoques pongan al sistema de lazo cerrado en equilibrio.

2.2.2. Parámetros de muestreo

Con el fin de asegurar una comparación equitativa, es necesario que STLQ y OSIST generen intervalos de muestreo con límites inferior y superior. En la regla de muestreo (14), STLQ tiene un límite inferior 1390-6542-enfoqueute-8-02-00107-i033.png, mientras que en (16), OSIST un límite superior 1390-6542-enfoqueute-8-02-00107-i041.png. Por lo tanto, los intervalos de muestreo generados por STLQ deberían ser limitados en valor máximo, y los generados por OSIST, en valor mínimo.

En (14), 1390-6542-enfoqueute-8-02-00107-i033.png también especifica la granularidad temporal del espacio de búsqueda para 1390-6542-enfoqueute-8-02-00107-i032.png (véase (9)), limitando el conjunto de valores posibles que 1390-6542-enfoqueute-8-02-00107-i012.png puede tomar. Sin embargo, esta limitación no se cumple para (16) donde 1390-6542-enfoqueute-8-02-00107-i012.png puede tomar cualquier valor menor que 1390-6542-enfoqueute-8-02-00107-i041.png. Así, se debe ajustar un valor pequeño para 1390-6542-enfoqueute-8-02-00107-i033.png en la configuración del experimento.

Es necesario considerar que un intervalo de muestreo corto proporciona mejor rendimiento de control (menor costo), mientras que un intervalo de muestreo largo permite menor demanda de recursos (menor utilización). Alternativamente se puede usar el intervalo de muestreo promedio1390-6542-enfoqueute-8-02-00107-i058.png como una métrica de utilización de recursos, considerando

(18)
1390-6542-enfoqueute-8-02-00107-e18.png

donde 1390-6542-enfoqueute-8-02-00107-i060.png es el número de intervalos de muestreo en un período de tiempo determinado. Mediante la aplicación de restricciones en este valor, se evita distorsionar la operación original de cada regla de muestreo, con el fin de obtener resultados aptos para la comparación.

En (14), considerando que cuando se tiene un muestreo periódico cada 1390-6542-enfoqueute-8-02-00107-i033.png existe un costo óptimo discreto, el factor de escalamiento1390-6542-enfoqueute-8-02-00107-i034.png especifica una degradación permitida con respecto a este costo. Se ajusta así un grado de suboptimalidad en términos de rendimiento de control, pero intrínsecamente, también se configura la demanda de recursos del controlador auto-disparado. Por lo tanto, al permitir una mayor degradación (1390-6542-enfoqueute-8-02-00107-i061.pngmás grande) se obtiene un espacio de búsqueda más amplio para 1390-6542-enfoqueute-8-02-00107-i032.png, el cual termina con intervalos de muestreo más largos.

El factor de densidad1390-6542-enfoqueute-8-02-00107-i042.png en (16), regula la frecuencia de muestreo y consecuentemente afecta la utilización de recursos. Considerando que un muestreo más denso (1390-6542-enfoqueute-8-02-00107-i042.png más pequeño) implica la producción de una señal de control a trozos más cercana a la óptima continua, 1390-6542-enfoqueute-8-02-00107-i042.png especifica un grado de suboptimalidad en términos de rendimiento de control.

El parámetro de diseño 1390-6542-enfoqueute-8-02-00107-i045.png en (16), permite realizar un ajuste extra en el rendimiento de control. Esta variable ajusta el muestreo de tal manera que se pueden producir más muestras ante una mayor variación de la derivada de la entrada de control óptimo continuo (Bini, 2014); para 1390-6542-enfoqueute-8-02-00107-i062.png se obtiene un muestreo periódico.

2.2.3. Señales de Control

Una vez calculado el intervalo de muestreo actual 1390-6542-enfoqueute-8-02-00107-i012.png, la entrada de control a trozos 1390-6542-enfoqueute-8-02-00107-i063.pnggenerada por (15) o (17), difiere solamente en la ganancia 1390-6542-enfoqueute-8-02-00107-i064.png que se aplica. En la expresión de control para STLQ (11), la ganancia se calcula suponiendo que el resto de muestras después de la muestra actual, será igual a 1390-6542-enfoqueute-8-02-00107-i033.png. En el control de OSIST (13), se supone que el resto de muestras será igual a la muestra actual 1390-6542-enfoqueute-8-02-00107-i012.png.

3. Resultados y Discusión

Esta sección ilustra numéricamente varias cuestiones discutidas en la Sección 2. Sobre una planta conocida, se aplican los criterios enunciados para evaluar el rendimiento de los dos enfoques de control auto-disparado. Además se presentan los resultados de este análisis comparativo.

3.1. Planta

La planta considerada es un sistema LTI que tiene la forma de (1) y consiste en un circuito electrónico doble integrador, tal como se describe en Astrom (1997). Su dinámica se representa a través de

(19)
1390-6542-enfoqueute-8-02-00107-e19.png

1390-6542-enfoqueute-8-02-00107-g066.png

El costo (4) se caracteriza por las matrices de ponderación

(20)
1390-6542-enfoqueute-8-02-00107-e20.png

1390-6542-enfoqueute-8-02-00107-g068.png

cuyos valores han sido elegidos para obtener gráficas lisas. En una función de costo LQR, la matriz Q define los pesos en los estados mientras que la matriz R especifica los pesos en la entrada de control. Se puede consultar Murray (2006) para mayor información sobre el ajuste de estas matrices.

A continuación, en las Figuras 1 y 2 se observa el rendimiento de STLQ y OSIST respectivamente. Las gráficas de tallo en azul (Stems) representan las secuencias de muestreo. En el eje-x se encuentran representados los instantes en que cada muestreo se realiza durante el experimento, mientras que en el eje-y, la longitud de los tallos ilustra la magnitud de cada instante de muestreo 1390-6542-enfoqueute-8-02-00107-i012.png. Además, las gráficas en rojo exhiben la evolución de los estados 1390-6542-enfoqueute-8-02-00107-i069.png y 1390-6542-enfoqueute-8-02-00107-i070.png del sistema en (19). Estas representaciones en particular, son curvas paramétricas (con 1390-6542-enfoqueute-8-02-00107-i024.png como parámetro) que trazan la trayectoria de cada particular solución 1390-6542-enfoqueute-8-02-00107-i071.png, cuando el tiempo del experimento 1390-6542-enfoqueute-8-02-00107-i072.png se encuentra dentro del rango 1390-6542-enfoqueute-8-02-00107-i073.png.

3.2. Evaluación de rendimiento

En la Figura 1 se ilustra la secuencia oscilante de muestreo de la respuesta natural obtenida con STLQ dada una condición inicial arbitraria 1390-6542-enfoqueute-8-02-00107-i074.png, un intervalo de muestreo mínimo 1390-6542-enfoqueute-8-02-00107-i033.png, y un conjunto de parámetros de diseño 1390-6542-enfoqueute-8-02-00107-i034.png. Se observa el alcance que tiene 1390-6542-enfoqueute-8-02-00107-i034.png sobre la utilización de recursos: valores más pequeños de 1390-6542-enfoqueute-8-02-00107-i034.png producen patrones de muestreo más densos (mayor utilización), y viceversa, como se enunció en la Sección 2.2.2. Este mismo efecto de utilización se puede advertir a través de la métrica de intervalo de muestreo promedio 1390-6542-enfoqueute-8-02-00107-i075.png en (18). Además, los retratos de fase ilustran la convergencia de los estados de la planta hacia el punto de equilibrio 1390-6542-enfoqueute-8-02-00107-i076.png, indicando estabilidad del sistema a pesar de las diferentes densidades del muestreo.

La Figura 2 muestra el patrón de muestreo (que primero oscila y luego se estabiliza) de la respuesta natural obtenida a través de la estrategia OSIST, considerando la misma condición inicial que la usada para evaluar STLQ (Figura 1), un intervalo de muestreo máximo 1390-6542-enfoqueute-8-02-00107-i041.png, un parámetro de distribución de muestras 1390-6542-enfoqueute-8-02-00107-i045.png, y un conjunto de valores de densidad de la secuencia de muestreo 1390-6542-enfoqueute-8-02-00107-i042.png. Es evidente que el valor del parámetro 1390-6542-enfoqueute-8-02-00107-i077.png influye en la utilización de recursos, produciendo muestreos más densos cuando su valor es menor, como se mencionó en la Sección 2.2.2. Además, el muestreo promedio 1390-6542-enfoqueute-8-02-00107-i075.png es más pequeño para muestreos más densos, corroborando un mayor uso de recursos. En cuanto a los retratos de fase, se puede observar que los estados convergen al punto de equilibrio indistintamente de las secuencias de muestreo, confirmando la estabilidad del sistema. Es importante distinguir que conforme los estados tienden al equilibrio, el muestreo tiende a 1390-6542-enfoqueute-8-02-00107-i041.png.

Fig. 1:

Intervalos de muestreo en STLQ para 1390-6542-enfoqueute-8-02-00107-i079.png y 1390-6542-enfoqueute-8-02-00107-i080.png

1390-6542-enfoqueute-8-02-00107-gf1.jpg

Fig. 2:

Intervalos de muestreo en OSIST para 1390-6542-enfoqueute-8-02-00107-i082.png, 1390-6542-enfoqueute-8-02-00107-i083.png y 1390-6542-enfoqueute-8-02-00107-i084.png

1390-6542-enfoqueute-8-02-00107-gf2.jpg

En la Figura 3 se analiza el impacto del estado inicial sobre el desempeño de cada enfoque, considerando al intervalo de muestreo promedio como función de la orientación inicial de los estados (véase la Sección 2.2.1). Cada aproximación estabiliza la planta ante diferentes condiciones iniciales expresadas en términos de magnitud constante y orientación variable (se muestran solo ángulos dentro del intervalo 1390-6542-enfoqueute-8-02-00107-i085.png ya que la segunda mitad del círculo es simétrica con respecto a la primera mitad). Si se observa la Figura 3, se obtiene menor utilización (mayor muestreo promedio) para el intervalo de orientaciones 1390-6542-enfoqueute-8-02-00107-i086.png, en las dos reglas de muestreo. Finalmente, tanto en STLQ como en OSIST el intervalo de muestreo promedio depende de la condición inicial.

Fig. 3:

Efecto de la orientación de estado, en STLQ (azul), con 1390-6542-enfoqueute-8-02-00107-i088.png, 1390-6542-enfoqueute-8-02-00107-i089.png, y en OSIST (rojo), con 1390-6542-enfoqueute-8-02-00107-i090.png, 1390-6542-enfoqueute-8-02-00107-i091.png y 1390-6542-enfoqueute-8-02-00107-i083.png para OSIST

1390-6542-enfoqueute-8-02-00107-gf3.jpg

La Figura 4 muestra el impacto que tienen 1390-6542-enfoqueute-8-02-00107-i034.png y 1390-6542-enfoqueute-8-02-00107-i042.png en el rendimiento de control. Para ello se utiliza como métrica el costo normalizado, definido en la (21) como

(21)
1390-6542-enfoqueute-8-02-00107-e21.png,

donde 1390-6542-enfoqueute-8-02-00107-i093.png es el costo LQR mínimo del sistema en tiempo continuo (4), y 1390-6542-enfoqueute-8-02-00107-i094.png es el costo discreto en (8) pero con intervalos de muestreo variables. En la misma Figura 4, la línea negra corresponde al costo obtenido a través del control LQR periódico en tiempo discreto, para diferentes períodos de muestreo. Como puede observarse, el desempeño del controlador periódico disminuye a medida que el período de muestreo aumenta. La curva en azul corresponde a STLQ y la curva en rojo a OSIST, para diferentes parámetros 1390-6542-enfoqueute-8-02-00107-i034.png y 1390-6542-enfoqueute-8-02-00107-i042.png respectivamente, con configuraciones y estados iniciales arbitrarios. Si se tiene en cuenta que 1390-6542-enfoqueute-8-02-00107-i034.png y 1390-6542-enfoqueute-8-02-00107-i042.png indican la densidad de la discretización, se evidencia que para valores pequeños, ambos enfoques proporcionan tanto intervalos de muestreo promedio cortos (mayor utilización), como menores costos. Las dos aproximaciones superan al caso periódico.

Un posible espacio para investigar dentro del enfoque STLQ (Gommans, 2014) consistiría en, cumpliendo la misma restricción en el costo, no solo considerar el intervalo de muestreo actual, sino más de un intervalo de muestreo. Además, una nueva alternativa podría explorar si la ocurrencia de intervalos cortos de muestreo adicionales, mejoraría el costo sin poner en riesgo la utilización. Lo anterior se enuncia considerando que ampliar los intervalos de muestreo tanto como sea posible, no es una garantía para lograr un costo mínimo.

Fig. 4:

Efecto del factor de escala 1390-6542-enfoqueute-8-02-00107-i096.png en STLQ (azul) para 1390-6542-enfoqueute-8-02-00107-i097.png y 1390-6542-enfoqueute-8-02-00107-i098.png, y efecto del factor de densidad 1390-6542-enfoqueute-8-02-00107-i099.png en OSIST (rojo) para 1390-6542-enfoqueute-8-02-00107-i100.png, 1390-6542-enfoqueute-8-02-00107-i083.png y 1390-6542-enfoqueute-8-02-00107-i101.png

1390-6542-enfoqueute-8-02-00107-gf4.jpg

En OSIST (Velasco, 2015), dado que el costo normalizado bordea cero (Figura 4), y que el algoritmo para ajustar los parámetros de diseño todavía está incompleto, investigaciones futuras podrían explorar el efecto que estos parámetros ejercen sobre el costo. La sencillez de la regla de muestreo (12) facilita su implementación, pero introduce un grado de suboptimalidad cuando se utiliza la aproximación de primer orden de la dinámica de lazo cerrado. Por lo tanto, en estudios posteriores, podría considerarse el uso de aproximaciones de orden superior.

Como trabajo futuro sería factible la formulación de una búsqueda de los ajustes de control que minimicen el costo sujeto a una restricción en demanda de recursos (común para los dos enfoques). Se puede considerar al intervalo promedio de muestreo como una restricción adecuada, utilizando condiciones iniciales que proporcionen al menos un intervalo promedio similar entre las dos aproximaciones.

4. Conclusiones y Recomendaciones

Se ha presentado un análisis comparativo de dos enfoques de control auto-disparado que siguen principios de diseño distintos. Este estudio ha demostrado que: ambos tienen un desempeño que supera al del muestreo periódico y queda campo por explorar en la formulación de métricas y condiciones de trabajo aplicables en su evaluación conjunta.

Bibliografía

1 

Arzén, K., 1999, A Simple Event-Based PID Controller, IFAC World Conference, 18, 423, 428, http://portal.research.lu.se/portal/files/6083100/8521976.pdf.

2 

Astrom, K., Bernhardsson, B., 1999, Comparison of periodic and event based sampling for first-order stochastic systems, 14th IFAC World Congress, https://lup.lub.lu.se/search/ws/files/6208782/8520116.pdf.

3 

Astrom, K., & Wittenmark, B. (1997). Theory and Design. Prentice Hall. Computer-Controlled System.

4 

Bini, E., & Buttazzo, G. (2014). The optimal sampling pattern for linear control systems. IEEE Transactions on Automatic Control, 59(1), 78-90, https://doi.org/10.1109/TAC.2013.2279913.

5 

Gommans, T. (2015). Resource-aware control and estimation: an optimization-based approach. Eindhoven University of Technology Library. https://pure.tue.nl/ws/files/12652231/20160118_Gommans.pdf.

6 

Gommans, T., Antunes, D., Donkers, T., Tabuada, P., & Heemels, M. (2014). Self-triggered linear quadratic control. Automatica, 50(4), 1279-1287, http://dx.doi.org/10.1016/j.automatica.2014.02.030.

7 

Heemels, W., Johansson, K., Tabuada, P., 2012, An introduction to event-triggered and self-triggered control, IEEE 51st Annual Conference on Decision and Control (CDC), 3270, 3285, https://doi.org/10.1109/CDC.2012.6425820.

8 

Meng, X., & Chen, T. (2012). Optimal sampling and performance comparison of periodic and event based impulse control. IEEE Transactions on Automatic Control, 57(12), 3252-3259, https://doi.org/10.1109/TAC.2012.2200381.

9 

Molin, A., & Hirche, S. (2013). On the optimality of certainty equivalence for event-triggered control systems. IEEE Transactions on Automatic Control, 58(2), 470-474, https://doi.org/10.1109/TAC.2012.2206719.

10 

Murray, R.M. (2006). Control and Dynamical Systems: LQR Control. California Institute of Technology. http://www.cds.caltech.edu/~murray/courses/cds110/wi06/lqr.pdf.

11 

Rabi, M., Johansson, K., Johansson, M., 2008, Optimal stopping for event-triggered sensing and actuation, 47th IEEE Conference on Decision and Control, 3607, 3612, https://doi.org/10.1109/CDC.2008.4739489.

12 

Velasco, M., Fuertes, J., Martí, P., 2003, The self triggered task model for real-time control systems, IEEE 24th Real-Time Systems Symposium, 67, 70, http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.164.3868&rep=rep1&type=pdf.

13 

Velasco, M., Martí, P., Bini, E., 2009, Equilibrium sampling interval sequences for event-driven controllers, 2009 European Control Conference, 3773, 3778, http://ieeexplore.ieee.org/document/7074987/.

14 

Velasco, M., Martí, P., Bini, E., 2015, Optimal-sampling-inspired self triggered control, 1st IEEE International Conference on Event-based Control, Communication, and Signal Processing, 1, 8, https://doi.org/10.1109/EBCCSP.2015.7300648.

15 

Velasco, M., Martí, P., Yépez, J., Ruiz, F., Fuertes, J., Bini, E., 2011, Qualitative analysis of a one-step finite-horizon boundary for event-driven controllers, 50th IEEE Conference on Decision and Control and European Control Conference, 1662, 1667, https://doi.org/10.1109/CDC.2011.6161106.