Análisis de series de tiempo Segunda clase
Procesos estócasticos Las series de tiempo (discretas) representan una realización (observación) una colección de variables aleatorias indexadas en un conjunto discreto (y finito) de tiempos La descripción completa de la serie viene dada por la distribución conjunta de las variables aleatorias Estacionaridad Función de media Función de autocovariancia
Modelos Ruido blanco Paseo al azar Promedio móvil Paseo al azar con tendencia (deriva)
Estimación de autocovariancia y covariancia cruzada Autocorrelación Autocorrelación
Métodos de descomposición de series de tiempo
Métodos de suavizamiento – pronóstico Promedios Simples Simple Móvil Doble Móvil Suavizamiento exponencial Simple Doble (Holt, Brown) Triple (Winters, Brown)
Análisis de tendencia: Modelos de regresión lineal
Ajuste de una línea a los datos: residuo2 residuo7 5 10 15 X Y Valor observado de la respuesta (Y real) Valor ajustado ( Y = Y estimado ) ^ Un Valor Residual o error Es la distancia vertical desde cada punto de datos hasta la línea de regresión Equivale a (Y observada – Y prevista) Ejemplos: Valor Residual 2 = 3 – 5 = -2 Valor Residual 7 = 9 – 7,5 = 1,5 Es la variación restante en Y después de usar X para predecir Y Representa una variación de causa común (= aleatoria = sin explicación)
Escogencia del modelos Se busca minimizar una función de balance entre la verosimilitud y el número de parámetros del modelo En el caso del modelo normal la log verosimilitud es equivalente a la variancia Criterio de información de Akaike AIC Definición de R: 2*log-likelihood + c*k c = 2 usualmente Definición en el libro: 2 log (sk2 )+ (n+2k)/n Criterio de información de Akaike, corregido por sesgo AICc Criterio de información de Schwarz, SIC o BIC
Modelos con variables exógenas Ver ejemplo de contaminación, temperatura y mortalidad. Gráficos por pares...
Análisis de tendencia – Series derivadas
Opciones: Una tendencia determinística Una tendencia aleatoria En la primera hay que ajustar un modelo En la segunda para eliminarla hay que trabajar con la primera diferencia (hablar de las segundas ...) NOTACIÓN: Ir a R
Periodicidad Ver datos simulados
Suavizamiento - Revisitado Tendencias de largo plazo pueden ser examinadas con la serie ‘suavizada’ por ejemplo
Suavizamiento - Revisitado Nucleo
Splines Se divide el soporte de los datos en k intervalos y en cada intervalo se ajusta una regresion polinomica de manera que sea diferenciable en todas partes