SciELO - Scientific Electronic Library Online

 
vol.55 issue1Preparation and Characterization of Biocomposites Based on Corn Wastes and Vinyl Acrylic CopolymerCharacterization of Straw Panels and their Structural Evaluation in a Three-Story Building author indexsubject indexarticles search
Home Pagealphabetic serial listing  

Services on Demand

Journal

Article

Indicators

Related links

  • Have no similar articlesSimilars in SciELO

Share


Revista Politécnica

On-line version ISSN 2477-8990Print version ISSN 1390-0129

Rev Politéc. (Quito) vol.55 n.1 Quito Feb./Apr. 2025

https://doi.org/10.33333/rp.vol55n1.02 

Articles

Estimación del Tamaño de la Perturbación en una Microrred durante Eventos de Frecuencia usando Analítica de Datos Multivariantes

Estimating the Size of the Disturbance in Frequency Events using Multivariate Data Analytics

1Escuela Politécnica Nacional, Facultad de Ingeniería Eléctrica y Electrónica, Quito, Ecuador

2Operador Nacional de Electricidad CENACE, Gerencia Nacional de Desarrollo Técnico, Quito, Ecuador


Resumen:

Las microrredes, definidas como conjuntos de cargas interconectadas y recursos energéticos distribuidos, operan dentro de límites eléctricos claramente definidos y pueden funcionar de manera conectada o aislada respecto a la red principal. Estos sistemas enfrentan desafíos críticos de estabilidad de frecuencia, especialmente tras perturbaciones significativas como la pérdida de generación eléctrica, lo que es particularmente problemático en microrredes aisladas o sin un Esquema de Alivio de Carga (EAC) eficaz. Este trabajo presenta una novedosa metodología para estimar el tamaño de las perturbaciones durante eventos de frecuencia, la cual se integra en un EAC adaptativo. La metodología se aplica en la microrred de Galápagos Santa Cruz - Baltra, utilizando modelos de regresión lineal múltiple. Además, se complementa con un análisis de contingencias basado en simulaciones de Monte Carlo, obteniendo datos críticos como la frecuencia mínima (Nadir), la tasa de cambio de frecuencia (RoCoF), el voltaje de establecimiento (Vend) y la frecuencia de establecimiento (fend). La evaluación realizada en siete escenarios diferentes demuestra la alta efectividad de la regresión lineal múltiple para predecir el tamaño de las perturbaciones, lo que subraya su potencial para mejorar la estabilidad y confiabilidad de microrredes.

Palabras clave: Monte Carlo; regresión lineal múltiple; microrred; estabilidad

Abstract:

Microgrids, defined as interconnected loads and distributed energy resources operating within clearly defined electrical boundaries, can function either connected to or isolated from the main grid. These systems face critical challenges related to frequency stability, especially following significant disturbances such as the loss of electrical generation, which is particularly problematic in isolated microgrids or those lacking an effective Load Shedding Scheme (LSS). This work presents an innovative methodology for estimating the size of disturbances during frequency events, which is integrated into an adaptive LSS. The methodology is applied to the Galápagos Santa Cruz - Baltra microgrid, using multiple linear regression models. Additionally, it is complemented by a contingency analysis based on Monte Carlo simulations, obtaining critical data such as minimum frequency (Nadir), rate of change of frequency (RoCoF), settling voltage (Vend), and settling frequency (fend). The evaluation conducted across seven different scenarios demonstrates the high effectiveness of multiple linear regression in predicting the size of disturbances, that highlights its potential to enhance the stability and reliability of microgrids.

Keywords: Monte Carlo; multiple linear regression; microgrid; stability

1. INTRODUCCIÓN

Las microrredes, según la definición del IEEE Std. 2030-7 (2018), son sistemas compuestos por cargas interconectadas y recursos energéticos distribuidos que operan dentro de límites eléctricos definidos. Estas pueden funcionar como entidades controlables, ya sea conectadas o desconectadas de la red principal. Esta flexibilidad operativa permite a las microrredes enfrentar desafíos significativos de estabilidad, especialmente en términos de frecuencia, un aspecto crítico en la gestión de perturbaciones en un Sistema Eléctrico de Potencia (SEP).

La estabilidad de frecuencia es la capacidad de un SEP para mantener un equilibrio tras una perturbación significativa, como la pérdida de generación. Dicho evento puede provocar un desbalance entre la generación y la carga, lo que lleva a una disminución de la frecuencia y, eventualmente, al colapso del sistema. Durante los primeros 30 segundos posteriores a la perturbación, se activa la Regulación Primaria de Frecuencia (RPF), que incluye respuestas electromagnéticas, inerciales y del regulador de velocidad (Sun et al., 2010). Si la RPF resulta insuficiente, es necesario implementar un Esquema de Alivio de Carga (EAC) para salvaguardar la estabilidad del sistema (Wiest et al., 2018).

Los EAC pueden clasificarse en tres tipos principales: tradicional, semi-adaptativo, y adaptativo. Los enfoques tradicionales, como el propuesto por Mohd Zin et al. (2004) para el sistema Tenaga Nasional Berhad (TNC), utilizan pasos de frecuencia predefinidos para desconectar cargas. Sin embargo, este enfoque fijo resulta ineficaz en escenarios con alta variabilidad de condiciones operativas. Los EAC semi-adaptativos, como el de Jiang et al. (2010), ajustan la cantidad de carga a desconectar en función de la tasa de cambio de frecuencia (RoCoF), lo que mejora la respuesta del sistema.

Por otro lado, los EAC adaptativos, como el propuesto por Mohamad et al. (2017) el cual usa la técnica de Optimización por Enjambre de Partículas (PSO), calculan la potencia óptima a desconectar, aunque no siempre consideran la dependencia de 𝐷𝑃 con otras variables. En esta línea, Pérez et al. (2016) diseñaron un EAC adaptativo para evitar colapsos de voltaje, utilizando PSO combinado con un índice de estabilidad de voltaje (SVSI). A pesar de estos avances, aún son necesarias técnicas más sofisticadas para garantizar la estabilidad integral del sistema.

Escobar (2021) diseñó un EAC adaptativo basado en voltaje y frecuencia, implementado en una plataforma de simulación digital en tiempo real. Este esquema utiliza un regresor para determinar la carga a desconectar en caso de contingencia, considerando voltaje, frecuencia y 𝑅𝑜𝐶𝑜𝐹. Como mejora, se propone la incorporación de la variable 𝑁𝑎𝑑𝑖𝑟, debido a su alta correlación con el tamaño de la perturbación (𝐷𝑃), lo que podría aumentar la precisión del modelo. Asimismo, se recomienda la aplicación de técnicas de despacho económico para optimizar la operación de generación térmica, lo que garantiza una distribución eficiente de la carga en el sistema.

En este trabajo, se propone una metodología para estimar los valores del tamaño de la perturbación (𝐷𝑃) generados por múltiples eventos de frecuencia, utilizando modelos regresores basados en la evolución dinámica del sistema. El documento está estructurado en tres secciones principales: en la Sección 2, se describe la metodología empleada, abarcando la modelación dinámica del sistema, la generación de datos mediante simulaciones Monte Carlo y el análisis post-contingencia. En la Sección 3, se presentan los resultados, que incluyen el análisis descriptivo de los datos, la estimación de los regresores y la evaluación de la capacidad predictiva de los modelos para determinar DP.

2. METODOLOGÍA

En la Figura 1, se presenta un esquema con la metodología propuesta para estimar el tamaño de la perturbación, estructurada en tres fases: a) modelación del sistema eléctrico de prueba, b) preparación y estructura de datos de Monte Carlo, y c) análisis post contingencia. A continuación, se detallará el estado del arte en cada una de las fases de la metodología propuesta.

2.1 Sistema eléctrico de prueba

El sistema de prueba consiste en la microrred del sistema eléctrico aislado Santa Cruz - Baltra. La modelación dinámica se realiza en el programa computacional PowerFactory. La microrred se encuentra compuesta por unidades de generación convencional (unidades térmicas) y fuentes de energía renovable no convencional (parque eólico y plantas fotovoltaicas). Desde el sistema de distribución compuesto por varios alimentadores se provee de energía a centros educativos, hospitales, sector doméstico, comercial, industrial y otros.

Figura 1 Esquema de la metodología 

Se considera como generación convencional a la central ubicada en Santa Cruz que está formada por diez unidades de generación a diésel. Los generadores se encuentran subdivididos en tres grupos conectados a barras independientes. El grupo Hyundai 1 se encuentra integrado por dos generadores a diésel G08-HYU y G09-HYU de 1,702 MW a 4,16 kV. El grupo Hyundai 2 se encuentra integrado por cuatro generadores a diésel G10-HYU, G11-HYU, G12-HYU, G13-HYU de 1,702 MW a 4,16 kV.

Finalmente, el grupo Caterpillar se encuentra formado por cuatro generadores a diésel G1-3512, G3-3512, G4-3512 y G6-3512 de 650 kW a 480 V. En la actualidad, los generadores Caterpillar no son usados como parte del despacho de generación.

Los controles de los generadores Hyundai se representaron mediante modelos y parámetros típicos. Los modelos de los reguladores consisten en: a) regulador de voltaje (modelo IEEE ESAC8B); y b) control de velocidad (modelo IEEE DEGOV1).

Las fuentes de energía renovable no convencional instaladas en el sistema eléctrico Santa Cruz - Baltra están formadas por: un parque eólico en la isla Baltra con tres aerogeneradores de 750 kW cada uno y una planta fotovoltaica de 200 kW, un banco de baterías para regulación de fluctuaciones viento/irradiación (baterías Ion-Litio) con capacidad de 500 kW y 400 kWh, un banco de baterías para almacenamiento de energía no usada (baterías de plomo ácido) con capacidad de 600 kW y 4 000 kWh; y finalmente, en la isla Santa Cruz se tiene una planta fotovoltaica de 1,5 MW.

Para la modelación de los generadores eólicos, se utiliza el modelo estándar de un aerogenerador tipo FRCWTG (en inglés Fully Rated Converter Wind Turbine Generator). La descripción detallada del modelo se encuentra en DIgSILENT GmbH (2022). El modelo se redimensiona para representar un aerogenerador de 750 kW con frecuencia nominal 60 Hz.

La modelación de la planta fotovoltaica de Santa Cruz de capacidad 1,5 MW utiliza el modelo estándar ElmPvsys, este modelo se encuentra disponible en PowerFactory. El modelo está basado en un generador estático. En general, el sistema fotovoltaico modela un conjunto de paneles fotovoltaicos conectados a la red a través de un único inversor. El detalle del modelo ElmPvsys se encuentra en la referencia DIgSILENT GmbH (2022).

2.2 Preparación y estructura de datos de Monte Carlo

Una vez completada la modelación dinámica del sistema de prueba, se implementó un algoritmo en Python para la generación de datos. Este algoritmo emplea el método de Monte Carlo para realizar análisis de contingencias N-1 mediante simulaciones de probabilidad múltiple.

Los pasos ejecutados por el algoritmo son los siguientes: i) cálculo de la demanda del sistema mediante distribución normal; ii) asignación de niveles de potencia en generadores convencionales (Hyundai) mediante despacho económico; iii) asignación de niveles de potencia en generadores convencionales (aerogeneradores y planta fotovoltaica) mediante distribución Weibull; iv) contingencia N-1 mediante la desconexión aleatoria de generación; y, v) simulación dinámica en el dominio del tiempo en PowerFactory.

2.2.1 Demanda del sistema

La demanda de potencia activa del sistema se determina mediante funciones de distribución normal o gaussiana, caracterizada por la Ecuación (1). La demanda de potencia reactiva se estimará basándose en el supuesto de que el factor de potencia mantiene un comportamiento cuasi invariable (Cepeda, 2013).

donde 𝑥 es la variable, u es la media de la distribución, 𝜎 es la desviación estándar, y el cuadrado de la desviación estándar, , se denomina la varianza.

Con la Ecuación (1), se obtiene la matriz de la demanda aleatoria D2 000x1 formada por 2 000 observaciones. Para el cálculo de la demanda del sistema se utiliza una media una desviación estándar

Asignación de potencia en unidades no convencionales

La función de distribución Weibull caracterizada por la Ecuación (2), ha sido adoptada para determinar la potencia de generación Peol de los generadores eólicos (Mejía et al., 2024).

Donde k y c constituyen los parámetros forma y escala, respectivamente, y, la variable vprom representa la velocidad media o promedio del viento. El parámetro de forma k no tiene unidades y se puede obtener mediante la Ecuación (3).

Donde 𝜎 es la desviación estándar obtenida a partir de la velocidad del viento. El factor de escala 𝑐 tiene las mismas unidades de la velocidad del viento (m/s) y está dada por la Ecuación (4).

Para la planta fotovoltaica de 1,5 MW de Santa Cruz, se asume que, durante las horas de actividad de la planta, la producción se comporta como un proceso estocástico de acuerdo con una función de distribución Normal.

2.2.3 Asignación de potencia en unidades convencionales

El despacho económico es utilizado para determinar la potencia activa en los generadores convencionales (Hyundai). Debido a la existencia de generadores eólicos y fotovoltaicos, la potencia para el despacho económico en las unidades convencionales PUC, se actualiza en cada paso de la simulación de Monte Carlo. La potencia PUC se calcula mediante la diferencia entre la demanda total del sistema Pd con la potencia de la central eólica Peol y de la planta fotovoltaica Pphv, tal como se detalla en la Ecuación (5).

Según Chowdhury y Rahman (1990), el despacho económico se define como el proceso de asignar niveles de potencia activa en las unidades de generación, de esta manera, la carga del sistema puede ser cubierta en su totalidad y de la forma más económica. El objetivo básico de la función de despacho económico es programar las salidas de las unidades de generación de combustible fósil en línea para satisfacer la carga del sistema al menor costo (Bakirtzis, 1994).

En un sistema de N generadores, el costo de combustible de cada unidad se representa como Fi y la potencia de salida como Pi. El costo total de combustible del sistema se representa como FT que corresponde a la suma del costo de cada unidad individual.

Por tanto, la función objetivo a minimizar se muestra en la Ecuación (7), donde F es la tasa de costo de cada generador que entrega una potencia Pi.

La Ecuación (7) se puede expresar de la siguiente manera:

donde 𝑎, 𝑏, 𝑐, son los coeficientes de costo de combustible de cada generador. La restricción que se debe cumplir es que la suma de la potencia que entrega cada unidad de generación 𝑃 𝑖 debe ser igual a la potencia de demanda 𝑃 𝑑 que se está abasteciendo (Guo-Li Zhang et al., 2005). Para propósitos de este trabajo, no se considera las pérdidas del sistema, por tanto, el balance de potencia estará dado por la Ecuación (9) donde es el error.

Los límites de generación se encuentran dados en la Ecuación (10), donde P i min y P i max representan las potencias de salida mínimos y máximos de cada unidad de generación.

Según Guo-Li Zhang et al. (2005), para resolver el problema de despacho económico de un sistema totalmente térmico y sin tener en cuenta las pérdidas, se recomienda utilizar el método de iteración Lambda. En este método, se asumen una tasa del costo incremental y se encuentra la potencia P i . Con los dos primeros resultados, se extrapola o interpola hasta disminuir el ancho del intervalo donde se encuentra la solución (Muñoz & Quezada, 2015).

El costo incremental se caracteriza de acuerdo con la Ecuación (11) y corresponde a la derivada de la función de costo respecto a la potencia de salida de cada unidad de generación P i como se muestra en la Ecuación (12).

De la Ecuación (12), se obtiene la potencia de generación P i mostrado en la Ecuación (13) y se calcula la variación de la potencia de cada unidad, como se expresa en la Ecuación (14).

El costo incremental promedio se define en la Ecuación (15), donde 𝜆 ℎ es el costo incremental superior y el costo inferior.

Con las expresiones anteriores, la potencia de generación Pi considerando el nuevo valor de se expresa como se muestra en la Ecuación (16).

A continuación, en la Ecuación (17) se muestra un arreglo para que la variación de potencia , cumpla con una tolerancia, por ejemplo 1,0 x 10 -4.

Con base en la teoría del despacho económico y al método de iteración Lambda, se desarrolla en Python un algoritmo para asignar niveles de generación en las unidades convencionales Hyundai.

2.2.4 Contingencia N-1

Una vez definido el valor de la demanda del sistema y asignado los valores de potencia en los generadores convencionales y no convencionales, se procede a realizar la contingencia N-1. La contingencia que permite producir un desbalance entre la generación y carga es la salida aleatoria de generación, misma que está basada en una función de distribución normal.

2.2.5 Simulación dinámica

En cada simulación de Monte Carlo se ejecuta una simulación dinámica en el programa PowerFactory durante un tiempo de 20 segundos. Para cada simulación, se obtienen los datos de 𝑁𝑎𝑑𝑖𝑟 (Hz), 𝑅𝑜𝐶𝑜𝐹 (Hz/s), voltaje de establecimiento 𝑉𝑒𝑛𝑑 (kV) y frecuencia de establecimiento 𝑓𝑒𝑛𝑑 (Hz). Este proceso se repite para un número 𝑛 de simulaciones que varía dependiendo del número de iteraciones que se requiera, para este caso se consideraron 2 000 simulaciones. Los datos son almacenados en la matriz 𝑋 2 000 𝑥 4 que servirán para la estimación del regresor.

2.3 Análisis Post-Contingencia

Una vez obtenida la matriz de datos, se procede a su descripción mediante dos enfoques: a) análisis univariante y b) análisis multivariante. El análisis univariante se centra en la operación de cada vector de datos de manera individual, mientras que el análisis multivariante considera las relaciones geométricas dentro de la matriz de datos (Peña, 2002).

Para facilitar la comprensión, se presenta el esquema del dataset final, el cual distingue entre las variables características (features) y la variable objetivo (target). Las variables features incluyen 𝑁𝑎𝑑𝑖𝑟, 𝑅𝑜𝐶𝑜𝐹, 𝑉𝑒𝑛𝑑 y 𝑓𝑒𝑛𝑑, todas de tipo numérico y continuo. Estas variables se emplean para predecir el tamaño de la perturbación (𝐷𝑃), la variable objetivo. Su naturaleza numérica y continua, tanto desde una perspectiva computacional como matemática, permite aplicar de manera efectiva técnicas de regresión lineal múltiple.

La descripción detallada del esquema del dataset empleado se encuentra en la Tabla 1, donde se destaca cómo este enfoque estructurado mejora la capacidad predictiva y la robustez del análisis.

Tabla 1 Descripción del esquema del dataset 

2.3.1 Análisis univariante

El análisis univariante permite comprender el comportamiento individual de cada variable, examinándola de manera aislada y explorando posibles relaciones entre ellas (Peña, 2002). Este análisis utiliza como principales estadísticos: a) media; b) mediana; c) desviación estándar; d) varianza; e) coeficiente de asimetría; f) coeficiente de curtosis; y g) coeficiente de variación.

2.4 Análisis multivariante

El análisis multivariante tiene como objetivo principal analizar la estructura de dependencias entre las variables. Estas dependencias se analizan de diferentes maneras: a) entre pares de variables; b) entre una variable y el conjunto de las demás; c) entre pares de variables controlando el efecto de otras; y d) considerando todas las variables en conjunto (Peña, 2002). Este enfoque permite identificar patrones complejos y relaciones estructurales en los datos.

2.5 Regresión lineal

La implementación de un modelo supervisado de regresión lineal múltiple exige una división estructurada del conjunto de datos en dos subconjuntos: i) un conjunto de entrenamiento, que representa el 80 % de los datos disponibles (1 600 observaciones), y ii) un conjunto de prueba, que constituye el 20 % restante (400 observaciones).

El modelo de regresión lineal múltiple se centra en establecer una relación cuantitativa entre la variable dependiente, el tamaño de la perturbación (DP), y las variables independientes NADIR, RoCoF, Vend y fend. Estas variables, al ser numéricas y continuas, favorecen la aplicación eficiente del modelo, cuyo objetivo principal es minimizar los errores al cuadrado mediante un ajuste óptimo de los coeficientes de regresión.

La evaluación del modelo se realiza utilizando el coeficiente de determinación ajustado (R 2 ), que mide la proporción de la variabilidad explicada por el modelo, y considera el número de variables independientes. Un R 2 ajustado más alto indica un ajuste más sólido y efectivo.

En este trabajo, el análisis de las dependencias en los casos a y b se basa en este modelo, que proporciona una herramienta robusta para explorar las interacciones entre las variables. Adicionalmente, las simulaciones dinámicas se llevaron a cabo utilizando el software PowerFactory de DIgSILENT, versión 2023, lo que permitió evaluar el comportamiento del sistema en el dominio del tiempo.

3. RESULTADOS

3.1 Análisis de datos

Esta sección se enfoca exclusivamente en el análisis y exploración preliminar de los datos, previo a la implementación de los modelos de regresión.

3.1.1 Análisis descriptivo univariante

El análisis descriptivo de datos tiene la finalidad de examinar los datos previo a la aplicación de cualquier técnica estadística. A partir de los principales estadísticos que se presentan en la Tabla 2, es posible realizar un análisis general de los datos, el cual se resume a continuación:

  1. Tamaño de muestra: Cada variable cuenta con 2 000 observaciones. Las medias y medianas de las variables están cercanas entre sí, lo que sugiere la ausencia de valores extremos significativos.

  2. En relación con el coeficiente de Kurtosis, generalmente se observa Coeficiente de Kurtosis; los valores de Kurtosis para todas las variables son menores a 3, lo que indica que las distribuciones tienden a ser más compactas alrededor de su centro. Esto implica una menor probabilidad de valores extremos en comparación con una distribución normal. Sin embargo, es importante considerar que podrían existir anomalías o atípicos debido a características específicas de los datos o factores externos que afecten la variabilidad.

  3. Coeficiente de variación: Las variables 𝐷𝑃 y 𝑅𝑜𝐶𝑜𝐹 presentan valores similares, lo que indica que ambas distribuciones de datos tienen una estabilidad relativa parecida en términos de su dispersión. Aunque estas variables tienen diferentes medias y desviaciones estándar, el coeficiente de variación (CV) sugiere que la variabilidad relativa en relación con sus medias es comparable.

Tabla 2.  Estadísticos del análisis univariante 

Para profundizar el entendimiento de los principales estadísticos, resulta interesante observar el comportamiento de las variables mediante histogramas y diagramas de cajas que se muestran en la Figura 2. Los datos con mayor frecuencia corresponden a las observaciones que se sitúan entre los valores mínimos y máximos de la caja.

Como se puede observar en la Figura 2, no se identifican datos atípicos significativos en las distribuciones de las variables DP, NADIR, RoCoF, Vend, y fend Los diagramas de cajas confirman que la mayoría de los datos se encuentran dentro del rango intercuartil, con pocas observaciones fuera de este rango, lo que sugiere que la presencia de outliers es mínima.

Las variables DP, NADIR y RoCoF presentan distribuciones bimodales evidentes en sus histogramas. Esto podría indicar la existencia de dos subgrupos bien definidos dentro de los datos, posiblemente asociados a diferentes fuentes de generación de energía, como plantas térmicas y fuentes renovables no convencionales, cada una con características operativas distintas. En las variables Vend y fend, la mayoría de los datos están concentrados alrededor de los valores centrales, con distribuciones más compactas y un comportamiento menos disperso en comparación con las variables anteriores.

3.1.2 Análisis descriptivo bivariante

El análisis descriptivo bivariante se enfoca en explorar las relaciones entre pares de variables mediante herramientas gráficas y estadísticas. En la Figura 3 (a), se puede observar el diagrama de dispersión de las cinco variables en análisis, donde se puede resaltar que la potencia de salida 𝐷𝑃 tiene un comportamiento lineal con las variables 𝑁𝑎𝑑𝑖𝑟 y 𝑅𝑜𝐶𝑜𝐹.

La Figura 3 (b) presenta la matriz de correlación, que permite identificar la dirección y la magnitud de las relaciones lineales. En este análisis, se observa una alta correlación negativa entre 𝐷𝑃 y las variables independientes 𝑁𝑎𝑑𝑖𝑟, 𝑅𝑜𝐶𝑜𝐹, 𝑉𝑒𝑛𝑑 y 𝑓𝑒𝑛𝑑, lo que refuerza la idoneidad de un modelo de regresión lineal múltiple. Adicionalmente, la fuerte dependencia de 𝐷𝑃 con las variables predictoras sugiere que ninguna puede ser eliminada sin afectar significativamente el modelo.

Por último, la Figura 3 (c) muestra la matriz de varianzas y covarianzas, que complementa la matriz de correlación al destacar la variabilidad conjunta entre las variables. Este análisis confirma que las dependencias identificadas son consistentes en magnitud y dirección, reforzando la solidez del modelo propuesto.

Figura 2.  Diagrama de cajas e histogramas de las variables DP, NADIR, RoCoF, Vend, y fend  

3.1.3 Regresión lineal múltiple

A continuación, se presenta la evaluación de los modelos predictivos, fundamentada en el análisis de los datos previamente descritos.

Figura 3 Diagramas de análisis bivariantes 

3.1.4 Regresión lineal multivariante

El análisis de regresión lineal múltiple, destinado a determinar el tamaño de la perturbación (DP), se llevó a cabo utilizando tres modelos distintos. Cada modelo consideró un conjunto diferente de variables independientes (features), según lo especificado en la Tabla 3.

  • Modelo 1 (caso a): Incluye las variables NADIR, RoCoF, Vend, y fend. Este modelo mostró un R2 de 0,99226, e indica un alto grado de ajuste.

  • Modelo 2 (caso b): Excluye la variable 𝑁𝑎𝑑𝑖𝑟, utilizando solo RoCoF, Vend, y fend . Aunque R2 disminuye ligeramente a 0,99217, el modelo sigue siendo robusto.

  • Modelo 3 (caso c): Considera solo las variables NADI y, RoCoF. El R2 es de 0,98596, lo que indica un menor ajuste en comparación con los modelos anteriores, aunque aún es considerable.

La comparación entre estos modelos muestra que el caso a, que incluye las cuatro variables, ofrece el mejor ajuste. Sin embargo, los modelos simplificados (caso b y c) también proporcionan resultados satisfactorios, aunque con una ligera disminución en la precisión.

Tabla 3. Resultados del entrenamiento de la regresión lineal múltiple - (a) caso a: dependencia de 4 variables, (b) caso b: 3 variables, (c) caso c: 2 variables 

Además, en la Tabla 3 se comparan los resultados de ambos modelos en términos de la significancia de los coeficientes, la precisión de la predicción (medida por R2), y la importancia relativa de las variables independientes en cada caso.

Como complemento, se desarrollaron dos modelos de regresión lineal simple para evaluar la relación individual de las variables NADIR y RoCoF, con la potencia de salida DP. El primer modelo, denominado caso d, estima DP en función de Nadir, como se muestra en la Figura 4(a). En este caso, R2 es 0,840, lo que indica que 𝑁𝑎𝑑𝑖𝑟 por sí sola no es un predictor fuerte de DP.

El segundo modelo, denominado caso e, estima DP en función de RoCoF, como se observa en la Figura 4(b). Aquí, R2 es significativamente mayor, alcanzando 0,985, lo que demuestra que el RoCoF es un predictor mucho más robusto para DP Aunque los modelos univariantes no alcanzan el nivel de precisión de los modelos multivariantes, el caso e destaca el papel clave de RoCoF como variable determinante en la predicción de perturbaciones, lo que supera notablemente a Nadir en términos de desempeño.

Figura 4 Resultados de regresión lineal simple 

Con base en los resultados obtenidos en los diferentes casos analizados hasta aquí, se concluye que el modelo que presenta el mejor desempeño es el correspondiente al caso a (regresión lineal múltiple con cuatro variables independientes: NADIR, RoCoF, Vend, y fend). El modelo del caso a permitirá estimar el tamaño de la perturbación de forma más exacta. Los resultados de los casos d y e, hasta aquí analizados, se incluyen en la Tabla 4.

3.2 Capacidad de predicción del modelo

Luego de identificar que el modelo de regresión múltiple del caso a (considerando las cuatro variables independientes: NADIR, RoCoF, Vend, y fend) presentó los resultados más prometedores durante la fase de entrenamiento, se procedió a evaluar su capacidad predictiva en datos nuevos. Esto busca validar su generalización y evitar el sobreajuste. Para este fin, se realizaron pruebas con un conjunto independiente de 400 eventos, calculando el coeficiente de determinación R 2 y las funciones de costo, donde n es el número de eventos de cada subconjunto: n1= 1 600 para entrenamiento, n2= 400 para prueba.

Es importante destacar que un alto valor de R 2 en el entrenamiento no garantiza un buen desempeño en datos nuevos. Esto ocurre porque los modelos pueden ajustarse a patrones específicos de los datos de entrenamiento que no se replican en el conjunto de prueba. Por ello, la evaluación debe enfocarse en el rendimiento en datos de prueba para asegurar su capacidad de generalización y aplicabilidad en escenarios reales.

Mediante las ecuaciones de función de coste, los resultados obtenidos para el entrenamiento son: R 2 = 992,2 x 10-3, J = 1,706 y Jmed = 1,0 x 10-3; mientras que los resultados para los datos de prueba son: R 2 = 991,2 x 10-3, J = 0,462 y Jmed= 1,1 x 10-3. A partir de estos resultados, se aprecia que el coeficiente de determinación de la prueba mantiene un valor mayor a 0,99; esto refleja un buen modelo. El coeficiente de determinación de prueba disminuye en un 0,1 % respecto del entrenamiento. Esta leve disminución en la capacidad predictiva también se aprecia en un ligero incremento de la función de coste promedio.

En la Figura 5, se presenta la dispersión del conjunto de prueba, junto con las estimaciones logradas mediante el modelo de regresión lineal múltiple del caso a, que incluye las 4 variables independientes. El modelo alcanzó un R 2= 991,294 x 10-3. En la Figura 5(a), se observa la dispersión de DP respecto a las 4 variables, graficando la frecuencia en el eje x, mientras que en la Figura 5(b), se muestra la dispersión de DP en función del RoCoF

Figura 5 Resultados de estimación - casos de regresión lineal múltiple 

Sobre la base de los resultados obtenidos con el modelo de regresión múltiple, se plantea evaluar un modelo adicional de regresión no lineal univariante (caso f), ilustrado en la Figura 6. Considerando que la variable independiente 𝑅𝑜𝐶𝑜𝐹 presenta el mejor desempeño predictivo, se proponen dos modelos de 𝐷𝑃 = 𝑓(𝑅𝑜𝐶𝑜𝐹): a) caso f1, que utiliza un modelo de regresión cuadrática representado en la Figura 6(a); y (b) el caso f2, basado en un modelo de regresión cúbica mostrado en la Figura 6(b).

El modelo cuadrático tiene la forma: 𝑦= −49,97 × 10 −3 𝑥 1 2 −1,729 𝑥 1 −83,47× 10 −3 con un coeficiente de determinación 𝑅 2 = 985,352 × 10-3. Como se observa en la Figura 6 (b), el modelo de regresión cúbica tiene un coeficiente 𝑅 2 = 987,792 × 10-3 y se expresa mediante la ecuación: 𝑦= 2,415 𝑥 1 3 −3,216 𝑥 1 2 −0,431 𝑥 1 −58,34× 10 −3 Como se puede revisar, el modelo cúbico presenta un coeficiente de determinación ligeramente mayor al modelo cuadrático, sin embargo, los dos modelos presentan menor desempeño al modelo de regresión lineal del caso a.

Figura 6 Resultados para regresiones no lineales 

3.3 Discusión de resultados

Los modelos de análisis de datos multivariantes y las técnicas de aprendizaje automático han tenido relativamente poco desarrollo en el diseño de un esquema de alivio de carga (EAC) aplicado a microrredes. En este contexto, se ha desarrollado una metodología para estimar el tamaño de las perturbaciones (𝐷𝑃), el cual sirve como un parámetro crucial en el diseño de un EAC.

En la Tabla 4, se presenta un resumen de los casos de regresión que han sido objeto de estudio en esta investigación. Es evidente que el rendimiento más destacado se observa en el modelo de regresión lineal múltiple que emplea las cuatro variables independientes: 𝑁𝑎𝑑𝑖𝑟, 𝑅𝑜𝐶𝑜𝐹, 𝑉𝑒𝑛𝑑 y 𝑓𝑒𝑛𝑑. Por consiguiente, este modelo se utilizaría para la estimación de 𝐷𝑃, lo que, a su vez, facilitará la implementación de un EAC adaptativo.

Es relevante señalar que entre las cuatro variables que se han analizado, el 𝑅𝑜𝐶𝑜𝐹 presenta la correlación más alta en relación con la magnitud de la perturbación (𝐷𝑃). En consecuencia, es posible diseñar un EAC adaptativo exclusivamente basado en la variable 𝑅??𝐶𝑜𝐹, utilizando un modelo de regresión lineal cúbica.

Tabla 4. Resumen de casos de regresión analizados 

4. CONCLUSIONES

Las microrredes, especialmente las aisladas, enfrentan desafíos críticos en la estabilidad de la frecuencia debido a perturbaciones significativas, como la pérdida de generación eléctrica. Este problema es especialmente grave en microrredes que carecen de un Esquema de Alivio de Carga (EAC) efectivo. En este estudio, se ha estimado el tamaño de la perturbación (𝐷𝑃) en la microrred de Galápagos Santa Cruz - Baltra mediante el uso de análisis multivariante de datos, modelos de regresión, y técnicas de inteligencia computacional.

El análisis reveló que el modelo de regresión lineal múltiple, que incorpora cuatro variables independientes (𝑁𝑎𝑑𝑖𝑟, 𝑅𝑜𝐶𝑜𝐹, 𝑉𝑒𝑛?? y 𝑓𝑒𝑛𝑑), es el más robusto para predecir la magnitud de 𝐷𝑃. Este modelo no solo proporcionó una estimación precisa de 𝐷𝑃, sino que también facilitó la implementación de un EAC adaptativo, crítico para mantener la estabilidad en la microrred. Entre las variables analizadas, el 𝑅𝑜𝐶𝑜𝐹 demostró tener la correlación más fuerte con 𝐷𝑃, destacando su importancia en la predicción de perturbaciones.

Por otro lado, los modelos de regresión polinómica, tanto cuadráticos como cúbicos, centrados en 𝑅𝑜𝐶𝑜𝐹 como variable independiente, no mostraron mejoras en la fiabilidad predictiva en comparación con los modelos lineales. Esto sugiere que la complejidad adicional de los modelos polinómicos no necesariamente se traduce en un mejor desempeño para este tipo de problemas.

Para asegurar la transparencia y reproducibilidad de los resultados, el código y los modelos desarrollados en este estudio se han publicado en un repositorio público en GitHub. facilitando el acceso a cualquier persona interesada en verificar los resultados. Los scripts creados documentan detalladamente todo el proceso de desarrollo y validación de los modelos, promoviendo su uso y análisis dentro de la comunidad científica.

Como recomendación para futuros estudios, se sugiere explorar la aplicación de redes neuronales para comparar los resultados obtenidos con los métodos de regresión tradicionales. Este enfoque podría aportar una perspectiva adicional y posiblemente revelar patrones o tendencias no detectadas por las técnicas convencionales. La implementación de redes neuronales podría ofrecer mejoras significativas en la capacidad predictiva y en la comprensión de las dinámicas complejas dentro de las microrredes.

REFERENCIAS

Bakirtzis, A. (1994). Genetic algorithm solution to the economic dispatch problem. IEE Proceedings - Generation, Transmission and Distribution, 141(4), 377. 10.1049/ip-gtd:19941211 [ Links ]

Cepeda, J. (2013). Evaluación de la vulnerabilidad del sistema eléctrico de potencia en tiempo real usando tecnología de medición sincrofasorial [Tesis doctoral]. Universidad Nacional de San Juan. [ Links ]

Chowdhury, B. H., & Rahman, S. (1990). A review of recent advances in economic dispatch. IEEE Transactions on Power Systems, 5(4), 1248-1259. 10.1109/59.99376 [ Links ]

DIgSILENT GmbH. (2022a, enero 10). Technical Reference Fully Rated Converter Wind Turbine Templates. Power System Solutions. [ Links ]

DIgSILENT GmbH. (2022b, enero 10). Technical Reference PV System ElmPvsys, TypPvpanel. Power System Solutions. [ Links ]

Escobar, B. (2021). Esquema adaptativo de seccionamiento de carga en función del voltaje y la frecuencia usando simulación digital en tiempo real [Tesis de maestría]. Escuela Politécnica Nacional. [ Links ]

Guo-Li Zhang, Hai-Yan Lu, Geng-Yin Li, & Guang-Quan Zhang. (2005). Dynamic economic load dispatch using hybrid genetic algorithm and the method of fuzzy number ranking. 2005 International Conference on Machine Learning and Cybernetics, 2472-2477 Vol. 4. 10.1109/ICMLC.2005.1527359 [ Links ]

IEEE Std. 2030-7. (2018). IEEE Standard for the specification of microgrid controllers. IEEE Std. 2030-7-2018, 1-43. 10.1109/IEEESTD.2018.8340204 [ Links ]

Jiang, H., Yan, G., Ji, H., Liu, L., & Shan, D. (2010). An Improved Under Frequency Load Shedding Scheme Based on Rate of Change of Frequency. 2010 International Conference on Electrical and Control Engineering, 3292-3295. 10.1109/iCECE.2010.803 [ Links ]

Mejía, C. A., Gallardo, C., & Pesantez, P. (2024). Proposal of a Load Shedding Scheme for Microgrids Using IEC 61850 Standard and the Rate of Change of Frequency. 2024 IEEE Eighth Ecuador Technical Chapters Meeting (ETCM), 1-7. 10.1109/ETCM63562.2024.10746010 [ Links ]

Mohamad, H., Isa, A. I. M., Yasin, Z. M., Salim, N. A., & Mohd Rahim, N. N. A. (2017). Optimal load shedding technique for an islanding distribution system by using Particle Swarm Optimization. 2017 3rd International Conference on Power Generation Systems and Renewable Energy Technologies (PGSRET), 154-158. 10.1109/PGSRET.2017.8251819 [ Links ]

Mohd Zin, A. A., Mohd Hafiz, H., & Aziz, M. S. (2004). A review of under-frequency load shedding scheme on TNB system. PECon 2004. Proceedings. National Power and Energy Conference, 2004., 170-174..1109/PECON.2004.1461637 [ Links ]

Muñoz, L., & Quezada, P. (2015). Flujo óptimo de potencia DC considerando restricciones por congestión y pérdidas en las líneas para resolución de problemas de despacho económico [Universidad Politécnica Salesiana Sede Quito]. https://dspace.ups.edu.ec/bitstream/123456789/11286/3/UPS-KT01199.pdfLinks ]

Peña, D. (2002). Análisis de datos multivariantes (McGrawHill). McGrawHill. https://b-ok.lat/book/1185829/d0e57eLinks ]

Pérez, S., López, K., & Rodríguez, L. (2016). Optimal under voltage load shedding based on voltage stability index. Ingeniería e Investigación, 36(2), 43. 10.15446/ing.investig.v36n2.53773 [ Links ]

Sun, Y., Zhang, Z., Li, G., & Lin, J. (2010). Review on frequency control of power systems with wind power penetration. 2010 International Conference on Power System Technology, 1-8. 10.1109/POWERCON.2010.5666151 [ Links ]

Wiest, P., Rudion, K., & Probst, A. (2018). Efficient integration of (n−1)-security into probabilistic network expansion planning. International Journal of Electrical Power & Energy Systems, 94, 151-159. 10.1016/j.ijepes.2017.07002 [ Links ]

1BIOGRAFÍAS César Andrés, Mejía, Ingeniero en Electrónica y Control (2010) e Ingeniero Eléctrico (2013) por la Escuela Politécnica Nacional, Quito, Ecuador. Posee una Maestría en Electricidad con mención en Redes Eléctricas Inteligentes (2024) por la misma institución y un MBA (2022) de la Universidad Andina Simón Bolívar. Su experiencia incluye estudios eléctricos para sistemas de potencia y microrredes, enfocados en estabilidad, confiabilidad y eficiencia energética. Es especialista en automatización de subestaciones eléctricas e integración de sistemas SCADA mediante DNP3 e IEC 61850, contribuyendo al diseño de soluciones innovadoras para redes eléctricas inteligentes y sostenibles.

Alex Ricardo, Rocha, Ingeniero en Electrónica y Control por la Escuela Politécnica Nacional, Quito, Ecuador (2019), y Magíster en Electricidad con mención en Redes Eléctricas Inteligentes de la misma institución. Actualmente, se desempeña como especialista en estudios de automatización y en la gestión de sistemas en laboratorios de metrología y calibración en magnitudes de potencia y energía. Sus áreas de investigación incluyen la automatización de procesos eléctricos, eficiencia energética, calidad de energía, transformación digital y minería de datos, enfocándose en el desarrollo de soluciones innovadoras para sistemas eléctricos y tecnologías avanzadas.

Jaime Cristóbal, Cepeda, Recibió el título de Ingeniero Eléctrico en la Escuela Politécnica Nacional (2005), Doctor en Ingeniería Eléctrica en la Universidad Nacional de San Juan, Argentina (2013), y Máster en Big Data en la Universidad Miguel de Cervantes, España (2021). Fue investigador en el Instituto de Energía Eléctrica, Argentina, y en el Instituto de Sistemas Eléctricos de Potencia, Alemania (2009-2013). Lideró áreas técnicas en CENACE (2014-2021) y fue Director Ejecutivo de la Agencia de Regulación y Control de Energía (2021-2022). Actualmente, es Profesor en la Escuela Politécnica Nacional. Ha publicado más de 120 artículos en temas como estabilidad de sistemas eléctricos y microrredes

Recibido: 19 de Septiembre de 2023; Aprobado: 21 de Enero de 2024

Creative Commons License Este es un artículo publicado en acceso abierto bajo una licencia Creative Commons