1. INTRODUCCIÓN
Las microrredes, según la definición del IEEE Std. 2030-7 (2018), son sistemas compuestos por cargas interconectadas y recursos energéticos distribuidos que operan dentro de límites eléctricos definidos. Estas pueden funcionar como entidades controlables, ya sea conectadas o desconectadas de la red principal. Esta flexibilidad operativa permite a las microrredes enfrentar desafíos significativos de estabilidad, especialmente en términos de frecuencia, un aspecto crítico en la gestión de perturbaciones en un Sistema Eléctrico de Potencia (SEP).
La estabilidad de frecuencia es la capacidad de un SEP para mantener un equilibrio tras una perturbación significativa, como la pérdida de generación. Dicho evento puede provocar un desbalance entre la generación y la carga, lo que lleva a una disminución de la frecuencia y, eventualmente, al colapso del sistema. Durante los primeros 30 segundos posteriores a la perturbación, se activa la Regulación Primaria de Frecuencia (RPF), que incluye respuestas electromagnéticas, inerciales y del regulador de velocidad (Sun et al., 2010). Si la RPF resulta insuficiente, es necesario implementar un Esquema de Alivio de Carga (EAC) para salvaguardar la estabilidad del sistema (Wiest et al., 2018).
Los EAC pueden clasificarse en tres tipos principales: tradicional, semi-adaptativo, y adaptativo. Los enfoques tradicionales, como el propuesto por Mohd Zin et al. (2004) para el sistema Tenaga Nasional Berhad (TNC), utilizan pasos de frecuencia predefinidos para desconectar cargas. Sin embargo, este enfoque fijo resulta ineficaz en escenarios con alta variabilidad de condiciones operativas. Los EAC semi-adaptativos, como el de Jiang et al. (2010), ajustan la cantidad de carga a desconectar en función de la tasa de cambio de frecuencia (RoCoF), lo que mejora la respuesta del sistema.
Por otro lado, los EAC adaptativos, como el propuesto por Mohamad et al. (2017) el cual usa la técnica de Optimización por Enjambre de Partículas (PSO), calculan la potencia óptima a desconectar, aunque no siempre consideran la dependencia de 𝐷𝑃 con otras variables. En esta línea, Pérez et al. (2016) diseñaron un EAC adaptativo para evitar colapsos de voltaje, utilizando PSO combinado con un índice de estabilidad de voltaje (SVSI). A pesar de estos avances, aún son necesarias técnicas más sofisticadas para garantizar la estabilidad integral del sistema.
Escobar (2021) diseñó un EAC adaptativo basado en voltaje y frecuencia, implementado en una plataforma de simulación digital en tiempo real. Este esquema utiliza un regresor para determinar la carga a desconectar en caso de contingencia, considerando voltaje, frecuencia y 𝑅𝑜𝐶𝑜𝐹. Como mejora, se propone la incorporación de la variable 𝑁𝑎𝑑𝑖𝑟, debido a su alta correlación con el tamaño de la perturbación (𝐷𝑃), lo que podría aumentar la precisión del modelo. Asimismo, se recomienda la aplicación de técnicas de despacho económico para optimizar la operación de generación térmica, lo que garantiza una distribución eficiente de la carga en el sistema.
En este trabajo, se propone una metodología para estimar los valores del tamaño de la perturbación (𝐷𝑃) generados por múltiples eventos de frecuencia, utilizando modelos regresores basados en la evolución dinámica del sistema. El documento está estructurado en tres secciones principales: en la Sección 2, se describe la metodología empleada, abarcando la modelación dinámica del sistema, la generación de datos mediante simulaciones Monte Carlo y el análisis post-contingencia. En la Sección 3, se presentan los resultados, que incluyen el análisis descriptivo de los datos, la estimación de los regresores y la evaluación de la capacidad predictiva de los modelos para determinar DP.
2. METODOLOGÍA
En la Figura 1, se presenta un esquema con la metodología propuesta para estimar el tamaño de la perturbación, estructurada en tres fases: a) modelación del sistema eléctrico de prueba, b) preparación y estructura de datos de Monte Carlo, y c) análisis post contingencia. A continuación, se detallará el estado del arte en cada una de las fases de la metodología propuesta.
2.1 Sistema eléctrico de prueba
El sistema de prueba consiste en la microrred del sistema eléctrico aislado Santa Cruz - Baltra. La modelación dinámica se realiza en el programa computacional PowerFactory. La microrred se encuentra compuesta por unidades de generación convencional (unidades térmicas) y fuentes de energía renovable no convencional (parque eólico y plantas fotovoltaicas). Desde el sistema de distribución compuesto por varios alimentadores se provee de energía a centros educativos, hospitales, sector doméstico, comercial, industrial y otros.
Se considera como generación convencional a la central ubicada en Santa Cruz que está formada por diez unidades de generación a diésel. Los generadores se encuentran subdivididos en tres grupos conectados a barras independientes. El grupo Hyundai 1 se encuentra integrado por dos generadores a diésel G08-HYU y G09-HYU de 1,702 MW a 4,16 kV. El grupo Hyundai 2 se encuentra integrado por cuatro generadores a diésel G10-HYU, G11-HYU, G12-HYU, G13-HYU de 1,702 MW a 4,16 kV.
Finalmente, el grupo Caterpillar se encuentra formado por cuatro generadores a diésel G1-3512, G3-3512, G4-3512 y G6-3512 de 650 kW a 480 V. En la actualidad, los generadores Caterpillar no son usados como parte del despacho de generación.
Los controles de los generadores Hyundai se representaron mediante modelos y parámetros típicos. Los modelos de los reguladores consisten en: a) regulador de voltaje (modelo IEEE ESAC8B); y b) control de velocidad (modelo IEEE DEGOV1).
Las fuentes de energía renovable no convencional instaladas en el sistema eléctrico Santa Cruz - Baltra están formadas por: un parque eólico en la isla Baltra con tres aerogeneradores de 750 kW cada uno y una planta fotovoltaica de 200 kW, un banco de baterías para regulación de fluctuaciones viento/irradiación (baterías Ion-Litio) con capacidad de 500 kW y 400 kWh, un banco de baterías para almacenamiento de energía no usada (baterías de plomo ácido) con capacidad de 600 kW y 4 000 kWh; y finalmente, en la isla Santa Cruz se tiene una planta fotovoltaica de 1,5 MW.
Para la modelación de los generadores eólicos, se utiliza el modelo estándar de un aerogenerador tipo FRCWTG (en inglés Fully Rated Converter Wind Turbine Generator). La descripción detallada del modelo se encuentra en DIgSILENT GmbH (2022). El modelo se redimensiona para representar un aerogenerador de 750 kW con frecuencia nominal 60 Hz.
La modelación de la planta fotovoltaica de Santa Cruz de capacidad 1,5 MW utiliza el modelo estándar ElmPvsys, este modelo se encuentra disponible en PowerFactory. El modelo está basado en un generador estático. En general, el sistema fotovoltaico modela un conjunto de paneles fotovoltaicos conectados a la red a través de un único inversor. El detalle del modelo ElmPvsys se encuentra en la referencia DIgSILENT GmbH (2022).
2.2 Preparación y estructura de datos de Monte Carlo
Una vez completada la modelación dinámica del sistema de prueba, se implementó un algoritmo en Python para la generación de datos. Este algoritmo emplea el método de Monte Carlo para realizar análisis de contingencias N-1 mediante simulaciones de probabilidad múltiple.
Los pasos ejecutados por el algoritmo son los siguientes: i) cálculo de la demanda del sistema mediante distribución normal; ii) asignación de niveles de potencia en generadores convencionales (Hyundai) mediante despacho económico; iii) asignación de niveles de potencia en generadores convencionales (aerogeneradores y planta fotovoltaica) mediante distribución Weibull; iv) contingencia N-1 mediante la desconexión aleatoria de generación; y, v) simulación dinámica en el dominio del tiempo en PowerFactory.
2.2.1 Demanda del sistema
La demanda de potencia activa del sistema se determina mediante funciones de distribución normal o gaussiana, caracterizada por la Ecuación (1). La demanda de potencia reactiva se estimará basándose en el supuesto de que el factor de potencia mantiene un comportamiento cuasi invariable (Cepeda, 2013).

donde 𝑥 es la variable, u es la media de la distribución, 𝜎 es la desviación estándar, y el cuadrado de la desviación estándar,
, se denomina la varianza.
Con la Ecuación (1), se obtiene la matriz de la demanda aleatoria D2 000x1 formada por 2 000 observaciones. Para el cálculo de la demanda del sistema se utiliza una media
una desviación estándar
Asignación de potencia en unidades no convencionales
La función de distribución Weibull caracterizada por la Ecuación (2), ha sido adoptada para determinar la potencia de generación Peol de los generadores eólicos (Mejía et al., 2024).

Donde k y c constituyen los parámetros forma y escala, respectivamente, y, la variable vprom representa la velocidad media o promedio del viento. El parámetro de forma k no tiene unidades y se puede obtener mediante la Ecuación (3).

Donde 𝜎 es la desviación estándar obtenida a partir de la velocidad del viento. El factor de escala 𝑐 tiene las mismas unidades de la velocidad del viento (m/s) y está dada por la Ecuación (4).

Para la planta fotovoltaica de 1,5 MW de Santa Cruz, se asume que, durante las horas de actividad de la planta, la producción se comporta como un proceso estocástico de acuerdo con una función de distribución Normal.
2.2.3 Asignación de potencia en unidades convencionales
El despacho económico es utilizado para determinar la potencia activa en los generadores convencionales (Hyundai). Debido a la existencia de generadores eólicos y fotovoltaicos, la potencia para el despacho económico en las unidades convencionales PUC, se actualiza en cada paso de la simulación de Monte Carlo. La potencia PUC se calcula mediante la diferencia entre la demanda total del sistema Pd con la potencia de la central eólica Peol y de la planta fotovoltaica Pphv, tal como se detalla en la Ecuación (5).

Según Chowdhury y Rahman (1990), el despacho económico se define como el proceso de asignar niveles de potencia activa en las unidades de generación, de esta manera, la carga del sistema puede ser cubierta en su totalidad y de la forma más económica. El objetivo básico de la función de despacho económico es programar las salidas de las unidades de generación de combustible fósil en línea para satisfacer la carga del sistema al menor costo (Bakirtzis, 1994).
En un sistema de N generadores, el costo de combustible de cada unidad se representa como Fi y la potencia de salida como Pi. El costo total de combustible del sistema se representa como FT que corresponde a la suma del costo de cada unidad individual.

Por tanto, la función objetivo a minimizar se muestra en la Ecuación (7), donde F es la tasa de costo de cada generador que entrega una potencia Pi.

La Ecuación (7) se puede expresar de la siguiente manera:

donde 𝑎, 𝑏, 𝑐, son los coeficientes de costo de combustible de cada generador. La restricción que se debe cumplir es que la suma de la potencia que entrega cada unidad de generación 𝑃 𝑖 debe ser igual a la potencia de demanda 𝑃 𝑑 que se está abasteciendo (Guo-Li Zhang et al., 2005). Para propósitos de este trabajo, no se considera las pérdidas del sistema, por tanto, el balance de potencia estará dado por la Ecuación (9) donde
es el error.

Los límites de generación se encuentran dados en la Ecuación (10), donde P i min y P i max representan las potencias de salida mínimos y máximos de cada unidad de generación.

Según Guo-Li Zhang et al. (2005), para resolver el problema de despacho económico de un sistema totalmente térmico y sin tener en cuenta las pérdidas, se recomienda utilizar el método de iteración Lambda. En este método, se asumen una tasa del costo incremental
y se encuentra la potencia P
i
. Con los dos primeros resultados, se extrapola o interpola hasta disminuir el ancho del intervalo donde se encuentra la solución (Muñoz & Quezada, 2015).
El costo incremental
se caracteriza de acuerdo con la Ecuación (11) y corresponde a la derivada de la función de costo respecto a la potencia de salida de cada unidad de generación P
i
como se muestra en la Ecuación (12).

De la Ecuación (12), se obtiene la potencia de generación P i mostrado en la Ecuación (13) y se calcula la variación de la potencia de cada unidad, como se expresa en la Ecuación (14).

El costo incremental promedio
se define en la Ecuación (15), donde 𝜆 ℎ es el costo incremental superior y
el costo inferior.

Con las expresiones anteriores, la potencia de generación Pi considerando el nuevo valor de
se expresa como se muestra en la Ecuación (16).

A continuación, en la Ecuación (17) se muestra un arreglo para que la variación de potencia
, cumpla con una tolerancia, por ejemplo 1,0 x 10 -4.

Con base en la teoría del despacho económico y al método de iteración Lambda, se desarrolla en Python un algoritmo para asignar niveles de generación en las unidades convencionales Hyundai.
2.2.4 Contingencia N-1
Una vez definido el valor de la demanda del sistema y asignado los valores de potencia en los generadores convencionales y no convencionales, se procede a realizar la contingencia N-1. La contingencia que permite producir un desbalance entre la generación y carga es la salida aleatoria de generación, misma que está basada en una función de distribución normal.
2.2.5 Simulación dinámica
En cada simulación de Monte Carlo se ejecuta una simulación dinámica en el programa PowerFactory durante un tiempo de 20 segundos. Para cada simulación, se obtienen los datos de 𝑁𝑎𝑑𝑖𝑟 (Hz), 𝑅𝑜𝐶𝑜𝐹 (Hz/s), voltaje de establecimiento 𝑉𝑒𝑛𝑑 (kV) y frecuencia de establecimiento 𝑓𝑒𝑛𝑑 (Hz). Este proceso se repite para un número 𝑛 de simulaciones que varía dependiendo del número de iteraciones que se requiera, para este caso se consideraron 2 000 simulaciones. Los datos son almacenados en la matriz 𝑋 2 000 𝑥 4 que servirán para la estimación del regresor.
2.3 Análisis Post-Contingencia
Una vez obtenida la matriz de datos, se procede a su descripción mediante dos enfoques: a) análisis univariante y b) análisis multivariante. El análisis univariante se centra en la operación de cada vector de datos de manera individual, mientras que el análisis multivariante considera las relaciones geométricas dentro de la matriz de datos (Peña, 2002).
Para facilitar la comprensión, se presenta el esquema del dataset final, el cual distingue entre las variables características (features) y la variable objetivo (target). Las variables features incluyen 𝑁𝑎𝑑𝑖𝑟, 𝑅𝑜𝐶𝑜𝐹, 𝑉𝑒𝑛𝑑 y 𝑓𝑒𝑛𝑑, todas de tipo numérico y continuo. Estas variables se emplean para predecir el tamaño de la perturbación (𝐷𝑃), la variable objetivo. Su naturaleza numérica y continua, tanto desde una perspectiva computacional como matemática, permite aplicar de manera efectiva técnicas de regresión lineal múltiple.
La descripción detallada del esquema del dataset empleado se encuentra en la Tabla 1, donde se destaca cómo este enfoque estructurado mejora la capacidad predictiva y la robustez del análisis.
2.3.1 Análisis univariante
El análisis univariante permite comprender el comportamiento individual de cada variable, examinándola de manera aislada y explorando posibles relaciones entre ellas (Peña, 2002). Este análisis utiliza como principales estadísticos: a) media; b) mediana; c) desviación estándar; d) varianza; e) coeficiente de asimetría; f) coeficiente de curtosis; y g) coeficiente de variación.
2.4 Análisis multivariante
El análisis multivariante tiene como objetivo principal analizar la estructura de dependencias entre las variables. Estas dependencias se analizan de diferentes maneras: a) entre pares de variables; b) entre una variable y el conjunto de las demás; c) entre pares de variables controlando el efecto de otras; y d) considerando todas las variables en conjunto (Peña, 2002). Este enfoque permite identificar patrones complejos y relaciones estructurales en los datos.
2.5 Regresión lineal
La implementación de un modelo supervisado de regresión lineal múltiple exige una división estructurada del conjunto de datos en dos subconjuntos: i) un conjunto de entrenamiento, que representa el 80 % de los datos disponibles (1 600 observaciones), y ii) un conjunto de prueba, que constituye el 20 % restante (400 observaciones).
El modelo de regresión lineal múltiple se centra en establecer una relación cuantitativa entre la variable dependiente, el tamaño de la perturbación (DP), y las variables independientes NADIR, RoCoF, Vend y fend. Estas variables, al ser numéricas y continuas, favorecen la aplicación eficiente del modelo, cuyo objetivo principal es minimizar los errores al cuadrado mediante un ajuste óptimo de los coeficientes de regresión.
La evaluación del modelo se realiza utilizando el coeficiente de determinación ajustado (R 2 ), que mide la proporción de la variabilidad explicada por el modelo, y considera el número de variables independientes. Un R 2 ajustado más alto indica un ajuste más sólido y efectivo.
En este trabajo, el análisis de las dependencias en los casos a y b se basa en este modelo, que proporciona una herramienta robusta para explorar las interacciones entre las variables. Adicionalmente, las simulaciones dinámicas se llevaron a cabo utilizando el software PowerFactory de DIgSILENT, versión 2023, lo que permitió evaluar el comportamiento del sistema en el dominio del tiempo.
3. RESULTADOS
3.1 Análisis de datos
Esta sección se enfoca exclusivamente en el análisis y exploración preliminar de los datos, previo a la implementación de los modelos de regresión.
3.1.1 Análisis descriptivo univariante
El análisis descriptivo de datos tiene la finalidad de examinar los datos previo a la aplicación de cualquier técnica estadística. A partir de los principales estadísticos que se presentan en la Tabla 2, es posible realizar un análisis general de los datos, el cual se resume a continuación:
Tamaño de muestra: Cada variable cuenta con 2 000 observaciones. Las medias y medianas de las variables están cercanas entre sí, lo que sugiere la ausencia de valores extremos significativos.
En relación con el coeficiente de Kurtosis, generalmente se observa Coeficiente de Kurtosis; los valores de Kurtosis para todas las variables son menores a 3, lo que indica que las distribuciones tienden a ser más compactas alrededor de su centro. Esto implica una menor probabilidad de valores extremos en comparación con una distribución normal. Sin embargo, es importante considerar que podrían existir anomalías o atípicos debido a características específicas de los datos o factores externos que afecten la variabilidad.
Coeficiente de variación: Las variables 𝐷𝑃 y 𝑅𝑜𝐶𝑜𝐹 presentan valores similares, lo que indica que ambas distribuciones de datos tienen una estabilidad relativa parecida en términos de su dispersión. Aunque estas variables tienen diferentes medias y desviaciones estándar, el coeficiente de variación (CV) sugiere que la variabilidad relativa en relación con sus medias es comparable.
Para profundizar el entendimiento de los principales estadísticos, resulta interesante observar el comportamiento de las variables mediante histogramas y diagramas de cajas que se muestran en la Figura 2. Los datos con mayor frecuencia corresponden a las observaciones que se sitúan entre los valores mínimos y máximos de la caja.
Como se puede observar en la Figura 2, no se identifican datos atípicos significativos en las distribuciones de las variables DP, NADIR, RoCoF, Vend, y fend Los diagramas de cajas confirman que la mayoría de los datos se encuentran dentro del rango intercuartil, con pocas observaciones fuera de este rango, lo que sugiere que la presencia de outliers es mínima.
Las variables DP, NADIR y RoCoF presentan distribuciones bimodales evidentes en sus histogramas. Esto podría indicar la existencia de dos subgrupos bien definidos dentro de los datos, posiblemente asociados a diferentes fuentes de generación de energía, como plantas térmicas y fuentes renovables no convencionales, cada una con características operativas distintas. En las variables Vend y fend, la mayoría de los datos están concentrados alrededor de los valores centrales, con distribuciones más compactas y un comportamiento menos disperso en comparación con las variables anteriores.
3.1.2 Análisis descriptivo bivariante
El análisis descriptivo bivariante se enfoca en explorar las relaciones entre pares de variables mediante herramientas gráficas y estadísticas. En la Figura 3 (a), se puede observar el diagrama de dispersión de las cinco variables en análisis, donde se puede resaltar que la potencia de salida 𝐷𝑃 tiene un comportamiento lineal con las variables 𝑁𝑎𝑑𝑖𝑟 y 𝑅𝑜𝐶𝑜𝐹.
La Figura 3 (b) presenta la matriz de correlación, que permite identificar la dirección y la magnitud de las relaciones lineales. En este análisis, se observa una alta correlación negativa entre 𝐷𝑃 y las variables independientes 𝑁𝑎𝑑𝑖𝑟, 𝑅𝑜𝐶𝑜𝐹, 𝑉𝑒𝑛𝑑 y 𝑓𝑒𝑛𝑑, lo que refuerza la idoneidad de un modelo de regresión lineal múltiple. Adicionalmente, la fuerte dependencia de 𝐷𝑃 con las variables predictoras sugiere que ninguna puede ser eliminada sin afectar significativamente el modelo.
Por último, la Figura 3 (c) muestra la matriz de varianzas y covarianzas, que complementa la matriz de correlación al destacar la variabilidad conjunta entre las variables. Este análisis confirma que las dependencias identificadas son consistentes en magnitud y dirección, reforzando la solidez del modelo propuesto.
3.1.3 Regresión lineal múltiple
A continuación, se presenta la evaluación de los modelos predictivos, fundamentada en el análisis de los datos previamente descritos.
3.1.4 Regresión lineal multivariante
El análisis de regresión lineal múltiple, destinado a determinar el tamaño de la perturbación (DP), se llevó a cabo utilizando tres modelos distintos. Cada modelo consideró un conjunto diferente de variables independientes (features), según lo especificado en la Tabla 3.
Modelo 1 (caso a): Incluye las variables NADIR, RoCoF, Vend, y fend. Este modelo mostró un R2 de 0,99226, e indica un alto grado de ajuste.
Modelo 2 (caso b): Excluye la variable 𝑁𝑎𝑑𝑖𝑟, utilizando solo RoCoF, Vend, y fend . Aunque R2 disminuye ligeramente a 0,99217, el modelo sigue siendo robusto.
Modelo 3 (caso c): Considera solo las variables NADI y, RoCoF. El R2 es de 0,98596, lo que indica un menor ajuste en comparación con los modelos anteriores, aunque aún es considerable.
La comparación entre estos modelos muestra que el caso a, que incluye las cuatro variables, ofrece el mejor ajuste. Sin embargo, los modelos simplificados (caso b y c) también proporcionan resultados satisfactorios, aunque con una ligera disminución en la precisión.
Tabla 3. Resultados del entrenamiento de la regresión lineal múltiple - (a) caso a: dependencia de 4 variables, (b) caso b: 3 variables, (c) caso c: 2 variables
Además, en la Tabla 3 se comparan los resultados de ambos modelos en términos de la significancia de los coeficientes, la precisión de la predicción (medida por R2), y la importancia relativa de las variables independientes en cada caso.
Como complemento, se desarrollaron dos modelos de regresión lineal simple para evaluar la relación individual de las variables NADIR y RoCoF, con la potencia de salida DP. El primer modelo, denominado caso d, estima DP en función de Nadir, como se muestra en la Figura 4(a). En este caso, R2 es 0,840, lo que indica que 𝑁𝑎𝑑𝑖𝑟 por sí sola no es un predictor fuerte de DP.
El segundo modelo, denominado caso e, estima DP en función de RoCoF, como se observa en la Figura 4(b). Aquí, R2 es significativamente mayor, alcanzando 0,985, lo que demuestra que el RoCoF es un predictor mucho más robusto para DP Aunque los modelos univariantes no alcanzan el nivel de precisión de los modelos multivariantes, el caso e destaca el papel clave de RoCoF como variable determinante en la predicción de perturbaciones, lo que supera notablemente a Nadir en términos de desempeño.
Con base en los resultados obtenidos en los diferentes casos analizados hasta aquí, se concluye que el modelo que presenta el mejor desempeño es el correspondiente al caso a (regresión lineal múltiple con cuatro variables independientes: NADIR, RoCoF, Vend, y fend). El modelo del caso a permitirá estimar el tamaño de la perturbación de forma más exacta. Los resultados de los casos d y e, hasta aquí analizados, se incluyen en la Tabla 4.
3.2 Capacidad de predicción del modelo
Luego de identificar que el modelo de regresión múltiple del caso a (considerando las cuatro variables independientes: NADIR, RoCoF, Vend, y fend) presentó los resultados más prometedores durante la fase de entrenamiento, se procedió a evaluar su capacidad predictiva en datos nuevos. Esto busca validar su generalización y evitar el sobreajuste. Para este fin, se realizaron pruebas con un conjunto independiente de 400 eventos, calculando el coeficiente de determinación R
2
y las funciones de costo
, donde n es el número de eventos de cada subconjunto: n1= 1 600 para entrenamiento, n2= 400 para prueba.
Es importante destacar que un alto valor de R 2 en el entrenamiento no garantiza un buen desempeño en datos nuevos. Esto ocurre porque los modelos pueden ajustarse a patrones específicos de los datos de entrenamiento que no se replican en el conjunto de prueba. Por ello, la evaluación debe enfocarse en el rendimiento en datos de prueba para asegurar su capacidad de generalización y aplicabilidad en escenarios reales.
Mediante las ecuaciones de función de coste, los resultados obtenidos para el entrenamiento son: R 2 = 992,2 x 10-3, J = 1,706 y Jmed = 1,0 x 10-3; mientras que los resultados para los datos de prueba son: R 2 = 991,2 x 10-3, J = 0,462 y Jmed= 1,1 x 10-3. A partir de estos resultados, se aprecia que el coeficiente de determinación de la prueba mantiene un valor mayor a 0,99; esto refleja un buen modelo. El coeficiente de determinación de prueba disminuye en un 0,1 % respecto del entrenamiento. Esta leve disminución en la capacidad predictiva también se aprecia en un ligero incremento de la función de coste promedio.
En la Figura 5, se presenta la dispersión del conjunto de prueba, junto con las estimaciones logradas mediante el modelo de regresión lineal múltiple del caso a, que incluye las 4 variables independientes. El modelo alcanzó un R 2= 991,294 x 10-3. En la Figura 5(a), se observa la dispersión de DP respecto a las 4 variables, graficando la frecuencia en el eje x, mientras que en la Figura 5(b), se muestra la dispersión de DP en función del RoCoF
Sobre la base de los resultados obtenidos con el modelo de regresión múltiple, se plantea evaluar un modelo adicional de regresión no lineal univariante (caso f), ilustrado en la Figura 6. Considerando que la variable independiente 𝑅𝑜𝐶𝑜𝐹 presenta el mejor desempeño predictivo, se proponen dos modelos de 𝐷𝑃 = 𝑓(𝑅𝑜𝐶𝑜𝐹): a) caso f1, que utiliza un modelo de regresión cuadrática representado en la Figura 6(a); y (b) el caso f2, basado en un modelo de regresión cúbica mostrado en la Figura 6(b).
El modelo cuadrático tiene la forma: 𝑦= −49,97 × 10 −3 𝑥 1 2 −1,729 𝑥 1 −83,47× 10 −3 con un coeficiente de determinación 𝑅 2 = 985,352 × 10-3. Como se observa en la Figura 6 (b), el modelo de regresión cúbica tiene un coeficiente 𝑅 2 = 987,792 × 10-3 y se expresa mediante la ecuación: 𝑦= 2,415 𝑥 1 3 −3,216 𝑥 1 2 −0,431 𝑥 1 −58,34× 10 −3 Como se puede revisar, el modelo cúbico presenta un coeficiente de determinación ligeramente mayor al modelo cuadrático, sin embargo, los dos modelos presentan menor desempeño al modelo de regresión lineal del caso a.
3.3 Discusión de resultados
Los modelos de análisis de datos multivariantes y las técnicas de aprendizaje automático han tenido relativamente poco desarrollo en el diseño de un esquema de alivio de carga (EAC) aplicado a microrredes. En este contexto, se ha desarrollado una metodología para estimar el tamaño de las perturbaciones (𝐷𝑃), el cual sirve como un parámetro crucial en el diseño de un EAC.
En la Tabla 4, se presenta un resumen de los casos de regresión que han sido objeto de estudio en esta investigación. Es evidente que el rendimiento más destacado se observa en el modelo de regresión lineal múltiple que emplea las cuatro variables independientes: 𝑁𝑎𝑑𝑖𝑟, 𝑅𝑜𝐶𝑜𝐹, 𝑉𝑒𝑛𝑑 y 𝑓𝑒𝑛𝑑. Por consiguiente, este modelo se utilizaría para la estimación de 𝐷𝑃, lo que, a su vez, facilitará la implementación de un EAC adaptativo.
Es relevante señalar que entre las cuatro variables que se han analizado, el 𝑅𝑜𝐶𝑜𝐹 presenta la correlación más alta en relación con la magnitud de la perturbación (𝐷𝑃). En consecuencia, es posible diseñar un EAC adaptativo exclusivamente basado en la variable 𝑅??𝐶𝑜𝐹, utilizando un modelo de regresión lineal cúbica.
4. CONCLUSIONES
Las microrredes, especialmente las aisladas, enfrentan desafíos críticos en la estabilidad de la frecuencia debido a perturbaciones significativas, como la pérdida de generación eléctrica. Este problema es especialmente grave en microrredes que carecen de un Esquema de Alivio de Carga (EAC) efectivo. En este estudio, se ha estimado el tamaño de la perturbación (𝐷𝑃) en la microrred de Galápagos Santa Cruz - Baltra mediante el uso de análisis multivariante de datos, modelos de regresión, y técnicas de inteligencia computacional.
El análisis reveló que el modelo de regresión lineal múltiple, que incorpora cuatro variables independientes (𝑁𝑎𝑑𝑖𝑟, 𝑅𝑜𝐶𝑜𝐹, 𝑉𝑒𝑛?? y 𝑓𝑒𝑛𝑑), es el más robusto para predecir la magnitud de 𝐷𝑃. Este modelo no solo proporcionó una estimación precisa de 𝐷𝑃, sino que también facilitó la implementación de un EAC adaptativo, crítico para mantener la estabilidad en la microrred. Entre las variables analizadas, el 𝑅𝑜𝐶𝑜𝐹 demostró tener la correlación más fuerte con 𝐷𝑃, destacando su importancia en la predicción de perturbaciones.
Por otro lado, los modelos de regresión polinómica, tanto cuadráticos como cúbicos, centrados en 𝑅𝑜𝐶𝑜𝐹 como variable independiente, no mostraron mejoras en la fiabilidad predictiva en comparación con los modelos lineales. Esto sugiere que la complejidad adicional de los modelos polinómicos no necesariamente se traduce en un mejor desempeño para este tipo de problemas.
Para asegurar la transparencia y reproducibilidad de los resultados, el código y los modelos desarrollados en este estudio se han publicado en un repositorio público en GitHub. facilitando el acceso a cualquier persona interesada en verificar los resultados. Los scripts creados documentan detalladamente todo el proceso de desarrollo y validación de los modelos, promoviendo su uso y análisis dentro de la comunidad científica.
Como recomendación para futuros estudios, se sugiere explorar la aplicación de redes neuronales para comparar los resultados obtenidos con los métodos de regresión tradicionales. Este enfoque podría aportar una perspectiva adicional y posiblemente revelar patrones o tendencias no detectadas por las técnicas convencionales. La implementación de redes neuronales podría ofrecer mejoras significativas en la capacidad predictiva y en la comprensión de las dinámicas complejas dentro de las microrredes.
























