Modelo autorregresivo de media móvil
En estadística, los modelos autorregresivos de media móvil (en inglés AutoRegressive Moving Average models, abreviados ARMA), también llamados Modelos Box-Jenkins, se aplican a series temporales de datos.
Dada una serie temporal de datos Xt, el modelo ARMA es una herramienta para entender y, aún más, para predecir futuros valores de la serie. El modelo está formado por dos partes, una parte autorregresiva (AR) y otra de media móvil (MA). El modelo se conoce con el nombre de modelo ARMA (p,q), donde p es el orden de la parte autorregresiva y q es el orden de la parte de media móvil.
Modelo autorregresivo
La notación AR(p) se refiere a un modelo autorregresivo de orden p. Un modelo AR(p) puede escribirse como:
donde son los parámetros del modelo, es una constante y es un término de error. Muchos autores omiten el término constante, para fines de simplificación.
Un modelo autorregresivo es esencialmente un filtro de respuesta infinita al impulso IIR, con determinada interpretación adicional.
Se debe tener en cuenta que es necesario imponer ciertas restricciones a los valores de los parámetros de este modelo para que funcione correctamente (proceso estacionario). Por ejemplo, en un modelo AR(1), si |φ1| > 1 el modelo no tendrá un buen comportamiento.
Ejemplo: Un proceso AR(1)
Un proceso AR(1) está dado por:
donde es un proceso de ruido blanco con media cero y varianza . (Nota: El subíndice en se omitió.) El proceso es de covarianza estacionaria si . Si , entonces tiene una raíz unitaria. El cálculo de la esperanza de es directo. Asumiendo la covarianza estacionaria, tenemos:
- .
entonces:
donde es la media. La varianza es:
La función de autocorrelación viene dada por:
Se puede ver que la función de autocorrelación decrece con un intervalo de decrecimiento de .
La función de densidad espectral es la transformada de Fourier de la función de autocorrelación. En términos discretos, ésta sería la transformada de Fourier de tiempo discreto:
Esta expresión contiene aliasing debido a la naturaleza discreta de . Si asumimos que el intervalo de la muestra es mucho menor que el intervalo de decrecimiento (), entonces podemos utilizar una aproximación continua a :
que da un perfil Lorentzian para la densidad espectral:
donde es la frecuencia angular asociada con el intervalo de decrecimiento .
Una expresión alternativa para se puede obtener substituyendo primero por en la ecuación de definición.
Continuando este proceso N veces, obtenemos:
Cuando N tiende a infinito, tiende a cero y:
Véase que es ruido blanco convolucionado con más la constante de la media. Por el teorema del límite central, será distribuido normalmente como cualquier muestra de , que es más grande que el intervalo de decrecimiento de la función de autocorrelación.
Modelo de medias móviles
La notación MA(q) se refiere a un modelo de media móvil de orden q.
donde θ1, ..., θq son los parámetros del modelo y εt, εt-1,... son, de nuevo, los términos de error.
Un modelo de medias móviles es esencialmente un filtro de respuesta finita al impulso FIR, con cierta interpretación adicional.
Modelo autorregresivo de media móvil
La notación ARMA(p, q) se refiere a un modelo con p términos autorregresivos y q términos de media móvil. Este modelo combina los modelos AR y MA:
Nota sobre los términos de error
Habitualmente se asume que los términos de error εt son variables aleatorias independientes idénticamente distribuidas, tomadas de una muestra con distribución normal de media cero: εt ~ N(0,σ2), donde σ2 es la varianza. Estas suposiciones pueden ser frágiles y, si no se cumplen, pueden cambiar las propiedades del modelo. De hecho, un cambio en la suposición de independencia y distribución idéntica podría dar lugar a una diferencia considerable.
Especificación en términos del operador retardo (lag operator)
En algunos textos los modelos se especifican en términos del operador retardo L. En estos términos, el modelo AR(p) viene dado por:
donde representa el polinomio
Un modelo MA(q) viene dado por:
donde θ representa el polinomio
Por último, el modelo combinatorio ARMA viene dado por
o, de forma más concisa,
Modelos de ajuste (fitting models)
En general, tras seleccionar p y q, los modelos ARMA pueden ajustarse mediante regresión de mínimos cuadrados para encontrar los valores de los parámetros que minimizan el término de error. Se considera generalmente una buena práctica encontrar los valores menores de p y q que proporcionan un ajuste aceptable a los datos. Para un modelo puro AR, deben utilizarse las ecuaciones Yule-Walker para proporcionar un ajuste.
Generalizaciones
La dependencia de Xt de valores pasados y en los términos de error εt se asume que es lineal, salvo que se especifique lo contrario. Si la dependencia no es lineal, entonces el modelo se llama específicamente modelo de media móvil no lineal (NMA), modelo autorregresivo no lineal (NAR) o modelo autorregresivo de media móvil no lineal (NARMA).
Los modelos autorregresivos de media móvil pueden generalizarse con otros métodos. Véanse también los modelos ARCH (modelos de heterocedasticidad condicional autorregresivos) y los modelos autorregresivos integrados de medias móviles ARIMA (modelos autorregresivos integrados de medias móviles). Si tenemos que ajustar múltiples series temporales, entonces se puede ajustar un modelo vectorial ARIMA (VARIMA). Si las series temporales en cuestión muestran una memoria lejana, entonces es apropiado un modelo ARIMA fraccional (FARIMA, a veces denominado ARFIMA). De pensar que los datos presentan estacionalidad, entonces debe usarse un modelo SARIMA.
Referencias
- Box, George E.P. 1976: and F.M. Jenkins. Time Series Analysis: Forecasting and Control, 2nd. ed. Oakland, CA: Holden-Day.