SciELO - Scientific Electronic Library Online

 
vol.1 número28MODELOS DE REGRESIÓN PARAMÉTRICOS POLINOMIALES Y NO PARAMÉTRICOS B-SPLINES. UNA APLICACIÓN EN INGENIERÍA.ANÁLISIS DEL ESPESOR ÓPTICO DE AEROSOL DEBIDO A INCENDIOS FORESTALES EN LA AMAZONIA DE PERÚ, ECUADOR, COLOMBIA, BRASIL Y BOLIVIA índice de autoresíndice de materiabúsqueda de artículos
Home Pagelista alfabética de revistas  

Servicios Personalizados

Revista

Articulo

Indicadores

Links relacionados

  • No hay articulos similaresSimilares en SciELO

Compartir


Perfiles

versión On-line ISSN 2477-9105

Perfiles vol.1 no.28 Riobamba jul./dic. 2022

https://doi.org/10.47187/perf.v1i28.186 

Articles

MODELO NO PARAMÉTRICO FUNCIONAL PREDICTIVO EN SERIES DE TIEMPO FUNCIONALES. APLICACIÓN EN VARIABLES METEOROLÓGICAS

Non parametric functional predictive model in functional time series. Application in meteorological variables

Antonio Meneses Freire1 
http://orcid.org/0000-0001-8182-3153

Lourdes Zúñiga Lema2 
http://orcid.org/0000-0001-9060-6273

José Muñoz Cargua2 
http://orcid.org/0000-0003-2356-9542

Jorge Lara Sinaluisa2 
http://orcid.org/0000-0002-3116-5161

Washington Acurio Martínez3 
http://orcid.org/0000-0002-7453-2734

¹ Universidad Nacional de Chimborazo, Facultad de Ingeniería, Carrera de Ingeniería en Telecomunicaciones, Riobamba, Ecuador.

²Escuela Superior Politécnica de Chimborazo, Facultad de Informática y Electrónica/ Facultad de Administración de Empresas, Carrera Ingeniería en Telecomunicaciones/ Carrera Gestión del Transporte, Riobamba, Ecuador.

³Autor Independiente, Ecuador.


RESUMEN

La investigación parte del estudio del modelo funcional no paramétrico para series de tiempo funcionales. El objetivo es establecer predicciones de series de tiempo funcionales que se forman con la muestra de las velocidades promedio del viento en cada hora de los meses de enero a diciembre del año 2019. La muestra fue tomada de la estación meteorológica de la Escuela Superior Politécnica de Chimborazo ubicada en la Parroquia San Juan a una altura de 4350 msnm en el kilómetro 30 de la vía Calpi - Guaranda en la provincia de Chimborazo - Ecuador. Se utilizó el package fda,usc del software R para la aplicación de las series de tiempo funcionales en el modelo antes mencionado, luego con este modelo se obtuvieron los ajustes, el ancho de ventana óptimo propio de un modelo no paramétrico, las predicciones de la serie temporal de 24 valores correspondientes a cada hora del intervalo de 0:00 a 23:00 horas, muy próxima a la serie de velocidades del viento del mes de diciembre tomado como mes testigo. Esto da la pauta para testificar que el modelo ajustado en esta investigación es significativamente confiable, y abre el camino para realizar futuras aplicaciones en otras variables meteorológicas

Palabras claves: Modelo no paramétrico funcional; series de tiempo funcionales; variables meteorológicas; velocidad del viento

ABSTRACT

The research starts from the study of the non-parametric functional model for functional time series. The objective is to establish predictions of functional time series that are formed with the sample of the average wind speeds in each hour of the months of January to December of the year 2019. The sample was taken from the meteorological station of the Escuela Superior Politécnica de Chimborazo located in the San Juan Parish at 4350 meters above sea level at the 30th kilometer of the Calpi - Guaranda road in the province of Chimborazo- Ecuador. The fda,usc package of the R software was used for the application of the functional time series in the aforementioned model, then with this model the adjustments were obtained, the optimal window width typical of a non-parametric model, the predictions of the Time series of 24 values corresponding to each hour in the interval from 0:00 to 23:00, very close to the series of wind speeds for the month of December taken as the control month. This sets the standard to testify that the adjusted model in this research is significantly reliable, and opens the way for future applications in other meteorological variables

Keywords: Functional nonparametric model; functional time series; meteorological variables; wind speed

INTRODUCCIÓN

El estudio del comportamiento de las variables meteorológicas ha sido un tema de significativa importancia a lo largo de la historia debido a que son netamente aleatorias por muchos factores. Desde hace mucho tiempo se han ajustado modelos de regresión de series de tiempo con buenos resultados, sobre todo para predecir valores a mediano plazo, y cuando se trata de ampliar este tiempo las predicciones se alejan de la realidad 21,22,23. En esta investigación se desarrolló una aplicación de un modelo no paramétrico funcional de series de tiempo funcionales que tiene un buen ajuste de la variable meteorológica de velocidad del viento y propone predicciones no a corto tiempo, debido a que predice uno o más datos funcionales (curvas) correspondientes a series de tiempo de velocidades del viento. El modelo antes mencionado tiene una forma no paramétrica adaptada a datos funcionales, como se detallará más adelante 5,24,25.

Modelo no paramétrico de series de tiempo funcionales.

Uno de los métodos más utilizados en las series de tiempo es el modelo de regresión no paramétrico. El modelo no paramétrico puede extenderse a las series de tiempo funcionales de la siguiente manera 14), (15), (16), (17), (18), (20.

()1

donde:

Xi(t) es el i-ésimo dato funcional en el instante t, con t que varía en un intervalo de tiempo. La Ecuación (1), representa una serie de tiempo para cada instante t que se ajusta con un modelo no paramétrico, más un término de error, .

El presente trabajo de investigación utilizó el estimador de Nadaraya-Watson de m(X), basado en las ideas de Aneiros-Perez et al. (2011), presentes en la Ecuación (2),

()2

donde el parámetro h es la ventana de suavizado, N es el tamaño de la muestra, y,

()3

En la Ecuación (3), K es una función tipo núcleo y d es una distancia que puede ser una métrica o la semimétric.pca 9,26.

En este estudio, K es el núcleo Gaussiano, la distancia d es la semimetrica que calcula la distancia entre curvas según el método de análisis de componentes principales funcionales, además el presente trabajo se consideró en el espacio L2 de funciones módulo al cuadrado integrables (1), (4), (5), (6).

Para el ajuste del modelo se minimizó el error cuadrático medio de la Ecuación (4), usando una ventana estimada ĥ de suavizado obtenida mediante validación cruzada (CV) en la ecuación (5).

()4

()5

donde,

()6

siendo: (7) el estimador de Nadaraya- Watson estimado con todos los datos salvo la observación i-ésima.

MATERIALES Y MÉTODOS

Materiales.

En esta la investigación se utilizaron los siguientes materiales:

  • Software estadístico R.

  • Computador y equipos de oficina

Metodología.

La investigación se centró en la aplicación del modelo no paramétrico de series de tiempo funcionales de la ecuación (1), a la variable meteorológica velocidad del viento, que contiene velocidades en cada hora de los días del año 2019. Una vez ajustado el modelo con las velocidades en los meses desde enero a noviembre, y a la vez se consideró a diciembre como mes testigo, posteriormente se establecieron las 24 predicciones y luego se compararon con las velocidades reales del mes de diciembre, obteniendo un error cuadrático medio menor al 3%.

Muestra

La muestra de tamaño 8760 corresponde a las velocidades del viento en metro por segundo de cada hora en los meses del año 2019, descargadas de la estación meteorológica de la Escuela Superior Politécnica de Chimborazo, ubicada en la Parroquia San Juan a una altitud de 4350 msnm en el kilómetro 30 vía Calpi - Guaranda en la provincia de Chimborazo - Ecuador.

Procesamiento de la información

Los datos de la variable de las velocidades del viento se procesaron mediante la utilización del software estadístico R 9,10,11,12,13, los cálculos de las medias de las velocidades por cada hora del día y en cada mes del año 2019 se convirtieron en una variable funcional con valores que determinaron 12 curvas con 24 datos cada una, (correspondientes a las horas), para los meses de enero a diciembre.

Preparación del código

Se realizó la programación de un script con una codificación destinada a establecer el modelo no paramétrico de series de tiempo funcionales, tomando en cuenta el lenguaje de código correspondiente y la teoría estadística inherente a este tipo de modelo 2), (3), (7), (8.

Ajuste del modelo

El modelo no paramétrico, se ajustó a los datos funcionales de medias de velocidades del viento por cada hora de los meses de enero a noviembre. Con este modelo ajustado se realizaron las predicciones de 24 valores, mismos que se compararon con los valores reales de las medias de las velocidades del viento del mes de diciembre.

Con los datos procesados se obtuvieron 2 gráficas: Gráfica de la serie de tiempo de las medias de las velocidades del viento de los meses, de enero a diciembre, junto con las 24 predicciones del modelo no paramétrico funcional.

Gráfica de la serie de tiempo de las medias de las velocidades del viento del mes de diciembre, junto con las 24 predicciones del modelo no paramétrico funcional.

Adicionalmente, se procedió al calculó el error cuadrático medio, MSE, para medir el porcentaje de error entre las predicciones del modelo con los valores correspondientes al mes testigo (diciembre), lo que permitió obtener una nueva gráfica de las medias de las velocidades del viento de diciembre con intervalos de confianza wild bootstrap al 95%, junto a las predicciones del modelo no paramétrico.

RESULTADOS

Los resultados se presentan en tablas y gráficas, que detallan la información de la variable funcional con valores de medias de las velocidades del viento de cada mes, y además, contienen las predicciones del modelo junto con los valores del mes testigo y el valor calculado del error cuadrático medio en porcentaje.

En la Tabla 1 se observan los valores de las medias de las velocidades del viento por cada hora en cada mes del año 2019, calculados con el software R.

Tabla 1 Medias de las velocidades del viento de enero a diciembre de 2019 

Figura 1 Serie de tiempo funcional de medias de las velocidades del viento de los meses de enero a noviembre de 2019. 

La serie de tiempo funcional de la Figura 1, de 11 curvas de medias de velocidades de viento pertenecen al espacio L² de funciones módulo al cuadrado integrables sobre el intervalo de tiempo de 0 a 24 horas, condición necesaria y suficiente para realizar el ajuste del modelo no paramétrico funcional.

En la Figura 2, se presentan las medias de las velocidades del viento versus las 288 horas correspondientes a los meses de enero a diciembre del año 2019, donde a cada mes corresponde 24 horas (ver Tabla 1). Además, se muestran las predicciones del modelo no paramétrico funcional (curva de color rojo), junto a la curva correspondiente al mes de diciembre (curva de color negro).

Figura 2 Medias de las velocidades del viento de los meses de enero a diciembre de 2019 y predicciones del modelo no paramétrico funcional 

DISCUSIÓN

Los 24 pares ordenados con las horas desde 0:00 a 23:00, y los valores de las medias de las velocidades del viento que corresponden a cada mes, constituyen un dato de la serie de tiempo funcional de la velocidad del viento. En total se tienen 12 datos funcionales correspondientes a los meses del año 2019.

Por consiguiente, al unir estos 12 datos funcionales (curvas) uno a continuación de otro se obtiene una serie de tiempo que contiene 288 pares ordenados, como se observa la curva en la Figura 2.

Figura 3 Medias de las velocidades del viento de diciembre junto a las predicciones del modelo no paramétrico. 

Tabla 2 Medias de las velocidades del viento de diciembre de 2019 y predicciones del modelo 

Figura 4 Medias de las velocidades del viento de diciembre con intervalos de confianza wild bootstrap al 95%, junto a las predicciones del modelo no paramétrico (19). 

Los intervalos de confianza wild boostrap son generados mediante las b réplicas:

()8

Donde,

()9

Yi en cada hora i del día, es un vector de valores de las velocidades del viento de los días de diciembre.

en cada hora i del día, es la media de las velocidades del viento.

CONCLUSIONES

Los modelos estadísticos de regresión no paramétricos funcionales de series de tiempo funcionales tienen amplia aplicación en la actualidad. La predicción de la serie de tiempo de las medias de velocidades del viento correspondientes a un mes, y a cada hora de las 24 del día, hace notar la gran potencia de ajuste y predicción de este tipo de modelo en esta variable climática a diferencia de los comúnmente utilizados.

En esta investigación, tras el estudio realizado de modelos no paramétricos funcionales de series de tiempo funcionales, se evidenció que los datos funcionales correspondientes a las medias de las velocidades del viento en cada hora del año 2019 cumplen las condiciones necesarias para la correcta aplicación de este tipo de modelos.

El buen ajuste del modelo antes mencionado, de las medias de velocidades del viento en cada hora de los meses de enero a noviembre de 2019, evidenció que, con su predicción correspondiente a un mes, y la serie de velocidades del viento del mes testigo, diciembre, permitió obtener un excelente acercamiento al observar que cada una de dichas predicciones se encontraban dentro de los intervalos puntuales de confianza wild bootstrap al 95% de dicha serie del mes testigo, y además de muy buena precisión con el error cuadrático medio menor al 3%.

Además, con esta investigación se abre la posibilidad de realizar predicciones de series de tiempo utilizando datos funcionales (curvas), de otras variables meteorológicas en la zona centro de Ecuador.

AGRADECIMIENTOS

Los autores desean agradecer al personal de la Facultad de Informática y Electrónica de la ESPOCH, Grupo de Energías Alternativas y Ambiente, al proyecto de investigación Caracterización de datos meteorológicos en la provincia de Chimborazo usando la Teoría del Caos, por las facilidades brindadas en la recopilación de la información de las bases de datos.

REFERENCIAS

Aneiros-Pérez G, Cao R, Vilar-Fernández JM. Functional methods for time series prediction: a nonparametric approach. J Forecast Internet. 2011;30(4):377-392. Available from: https:// www.eco.uc3m.es/temp/Cao%202.pdfLinks ]

Aneiros G, Vilar JM, Cao R, Munoz San Roque A. Functional prediction for the residual demand in electricity spot markets. IEEE Trans Power Syst Internet. 2013 cited 2022 Dec 12;28(4):4201-4208. Available from: Available from: https://www.iit.comillas.edu/docs/IIT-13-164A-Preview.pdfLinks ]

Aneiros-Pérez G, Cardot H, Estévez-Pérez G, Vieu P. Maximum ozone concentration forecasting by functional non-parametric approaches: MAXIMUM OZONE CONCENTRATION FORECASTING. Environmetrics Internet. 2004;15(7):675-685. Available from: http://dx.doi.org/10.1002/env.659 [ Links ]

Berlinet A., Levallois S. Higher order analysis at Lebesgue points. In: Puri, M. (Ed.), Asymptotics in Statistics and Probability, 2001. VSP [ Links ]

Beyaztas U, Shang HL. On function-on-function regression: Partial least squares approach Internet. arXiv stat.ME. 2019 cited 2022 Dec 12. Available from: Available from: https://pubag.nal.usda.gov/catalog/6848647Links ]

De Boor C. A practical guide to splines. 1st ed. New York, NY: Springer; 2001. [ Links ]

Bosq D. Nonparametric statistics for stochastic processes: Estimation and prediction Internet. 2nd ed. New York, NY: Springer ; 1998. Available from: https://books.google.at/ books?id=tZDqBwAAQBAJLinks ]

Bosq D. Linear processes in function spaces: Theory and applications. New York, NY: Springer ; 2000. [ Links ]

Cuevas A, Febrero M, Fraiman R. Linear functional regression: The case of fixed design and functional response. Can J Stat Internet. 2002;30(2):285-300. Available from: http://dx.doi.org/10.2307/3315952 [ Links ]

Damon J, Guillas S. Estimation and simulation of autoregressive hilbertian processes with exogenous variables. Stat Inference Stoch Process Internet. 2005;8(2):185-204. Available from: http://dx.doi.org/10.1007/s11203-004-1031-6 [ Links ]

Damon J, Guillas S. The inclusion of exogenous variables in functional autoregressive ozone forecasting. Environmetrics Internet. 2002;13(7):759-774. Available from: http://dx.doi.org/10.1002/env.527 [ Links ]

Febrero-Bande M, de la Fuente MO. Statistical Computing in Functional Data Analysis: The R Package fda.Usc. J Stat Softw Internet. 2012 cited 2022 Dec 12;51(4). Available from: Available from: https:// www.academia.edu/22388623/Statistical_Computing_in_Functional_Data_Analysis_The_R_ Package_fda_uscLinks ]

Febrero-Bande M, Galeano P, González-Manteiga W. Functional principal component regression and functional partial least-squares regression: An overview and a comparative study. Int Stat Rev Internet. 2017;85(1):61-83. Available from: http://dx.doi.org/10.1111/insr.12116 [ Links ]

Ferraty, F. Estimation non-paramétrique et discrimination de courbes. Proceedings of SFC 2001 Conference, Guadeloupe, 2001;17-21. [ Links ]

Ferraty F, Goia A, Vieu P. Functional nonparametric model for time series: a fractal approach for dimension reduction. Test (Madr) Internet. 2002;11(2):317-344. Available from: http://dx.doi. org/10.1007/bf02595710 [ Links ]

Ferraty F, Vieu P. The functional nonparametric model and application to spectrometric data. Comput Stat Internet. 2002;17(4):545-564. Available from: http://dx.doi.org/10.1007/s001800200126 [ Links ]

Ferraty F, Vieu P. Curves discrimination: a nonparametric functional approach. Comput Stat Data Anal Internet. 2003;44(1-2):161-173. Available from: https://www.sciencedirect.com/science/ article/pii/S016794730300032XLinks ]

Ferraty F, Mas A, Vieu P. Nonparametric regression on functional data: inference and practical aspects. Aust. N.Z.J. Stat. 2007; 49:267-286. Available from: https://onlinelibrary.wiley.com/doi/ abs/10.1111/j.1467-842X.2007.00480.x [ Links ]

Ferraty F, Van Keilegom I, Vieu P. On the Validity of the Bootstrap in Non-Parametric Functional Regression: Bootstrap in functional regression. Scand Stat Theory Appl Internet. 2009;37(2):286-306. Available from: http://dx.doi.org/10.1111/j.1467-9469.2009.00662.x [ Links ]

Ferraty F, Vieu P. Nonparametric Functional Data Analysis. (2006). Springer. [ Links ]

Horváth L, Kokoszka P. Inference for functional data with applications Internet. 2012th ed. New York, NY: Springer ; 2012. Available from: https://books.google.at/books?id=OVezLB_ZpYCLinks ]

Peña D. Análisis de series temporales Internet. Alianzaeditorial.es. cited 2022 Dec 12. Available from: Available from: https://www.alianzaeditorial.es/libro/manuales/analisis-de-series-temporales- daniel-pena-9788420669458/Links ]

Portela González J. Functional time series forecasting in electricity markets : a novel parametric approach. 2017. [ Links ]

Silverman BW, Ramsay JO. Applied functional data analysis: Methods and case studies. 2002 cited 2022 Dec 12; Available from: Available from: https://research-information.bris.ac.uk/en/publications/ applied-functional-data-analysis-methods-and-case-studiesLinks ]

Ramsay J.O, Silverman B.W. (2005) Functional Data Analysis. Springer, New York. - references - scientific research publishing Scirp.org Internet. cited 2022 Dec 12. Available from: Available from: https://www.scirp.org/(S(lz5mqp453edsnp55rrgjct55))/reference/referencespapers. aspx?referenceid=2016706Links ]

M. G. schimek, “Smoothing and Regression Approaches, Computation, and Application Wiley Series in Probability and Statistics Applied Probability and Statistics Section” Wiley, New York, 2000. - references - scientific research publishing Scirp.org Internet. cited 2022 Dec 12. Available from: Available from: https://www.scirp.org/(S(czeh2tfqw2orz553k1w0r45))/reference/ referencespapers.aspx?referenceid=1047228Links ]

Recibido: 09 de Agosto de 2022; Aprobado: 21 de Septiembre de 2022

Creative Commons License Este es un artículo publicado en acceso abierto bajo una licencia Creative Commons