Análisis Estadístico de Datos Climáticos Facultad de Ciencias – Facultad de Ingeniería 2009 M. Barreiro – M. Bidegain – A. Díaz Análisis de espectro singular.

Slides:



Advertisements
Presentaciones similares
Tema 5: Asociación. 1. Introducción. 2. Tablas y gráficas bivariadas.
Advertisements

REGRESION LINEAL SIMPLE
Modelos de Variable Dependiente Binaria -Logit y Probit-
Capitulo 9: Modelos unívariados de series temporales
ESTUDIO DE MERCADO. MÉTODOS DE PROYECCIÓN
Procesamiento Digital de Señales (DSP)
ANÁLISIS EXPLORATORIO DE DATOS
Curso SimSEE 2011 Análisis a largo plazo del valor de incorporar la dinámica del Niño 3.4 en el sistema eléctrico uruguayo Federico Purtscher Fernanda.
Unidad académica: Ingenierías
Centro de Investigación Estadística
GEOESTADISTICA MULTIVARIADA
La transformada de Fourier.
Espacios de dimensión infinita
Modelado y simulación en Ingeniería Química. Manuel Rodríguez
MODELO DE REGRESIÓN MÚLTIPLE
ANALISIS DE COMPONENTES PRINCIPALES.
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN
MANUAL DE LABORATORIO DE CÓMPUTO ECONOMETRÍA I MULTICOLINEALIDAD
Capítulo I. Introducción
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
Mario Bidegain (FC) – Alvaro Diaz (FI) – Marcelo Barreiro (FC)
Mario Bidegain (FC) – Alvaro Diaz (FI) – Marcelo Barreiro (FC)
Capitulo 10: La metodología Box-Jenkins
ECONOMÍA DE LA INFORMACIÓN
Pág 1 Servicio de Estudios Económicos, México 25 Agosto 2006 PIB Estatal: Aproximación de tendencias a través de componentes principales.
Análisis Estadístico de Datos Climáticos Facultad de Ciencias – Facultad de Ingeniería 2009 M. Barreiro – M. Bidegain – A. Díaz Análisis de correlación.
Maracaibo, 5 de Noviembre de 2007 Universidad del Zulia Facultad de Ingeniería Instituto de Cálculo Aplicado Universidad del Zulia Facultad de Ingeniería.
FUNCIONES DE DENSIDAD DE PROBABILIDAD
Módulo Instruccional para el curso de Biología 3101
Estadística 2010 Maestría en Finanzas Universidad del CEMA Profesor: Alberto Landro Asistente: Julián R. Siri.
Cuantificación de la capacidad predictiva de la SST del Atlántico en las temperaturas de Europa S.R. Gámiz-Fortis, M.J. Esteban-Parra, D. Argüeso, J.M.
Qué es el Sonido? Señales Simples Parametros fundamentales Señales complejas (Fourier) Señal y Sonido Propagación del Sonido Suma de señales Senoidales.
TIPOS DE MODELOS DE REGRESIÓN Y SUPUESTOS PARA EL MODELO A
Seminario sobre evaluación económica de proyectos de transporte Madrid, 15 y 16 de noviembre LA PREDICCIÓN DE LA DEMANDA EN EVALUACIÓN DE PROYECTOS.
Señales Limitadas por Banda y Teorema de Muestreo
Principios del diseño experimental Maestría Ingeniería Industrial
Análisis de series de tiempo Cuarta semana Abril Julio 2009.
GRUPO DE INVESTIGACION EN CONTROL INDUSTRIAL
SERIES DE TIEMPO INTEGRANTES :.
ESTADÍSTICA BÁSICA EN ECOLOGÍA EVOLUTIVA Juan J. Soler Cruz Estación Experimental de Zonas Áridas Almería.
José Ángel González Fraga, Erika. M. Ramos Michel, Facultad de Telemática, Universidad de Colima V TALLER DE PROCESAMIENTO.
Datos: Estadística.
Universidad de La Laguna, 14/11/2013 Mareas y Corrientes IV: Análisis de datos de corrientes.
Previsión de Ventas. Métodos no paramétricos Previsión de Ventas. Tema 2. 1 Antonio Montañés Bernal Curso
Incorporación de pronósticos climáticos en la gestión del sistema eléctrico - Algunos problemas estadísticos - Rafael Terra A. Díaz y R. Chaer.
PROCESOS COSTEROS. MAREAS OLAS TSUNAMIS Generalidades. Ondas en el mar
Análisis de series de tiempo
EL EXPERIMENTO CIENTÍFICO
Índice: Introducción Conceptos básicos Procesos elementales
TEMA 2 CARACTERIZACIÓN FRECUENCIAL DE SEÑALES Y SISTEMAS
Pronósticos por ensambles
UNIDAD 1.- EVALUACIÓN DE DATOS ANALITICOS
Gabriela Messineo Sistemas Dinámicos
José Oliver Alberto Bonastre José Luis Poza
Modelos matemáticos del proceso de muestreo y retención
SERIES CRONOLOGICAS O DE TIEMPO
El procesamiento óptico y las computadoras ópticas. J. Zacarías Malacara H. Taller de Ciencia para Jóvenes.
Regresión Lineal Simple
NORA ALCANTARA  ¿Por que existen mercados estacionales?  ¿Es importante conocer la estacionalidad del mercado?  ¿La estacionalidad es una característica.
Análisis de Fourier.
Control Estadístico de Procesos
Diseño de Caso Único Profesora: Carolina Mora UCV- Caracas.
OPTIMIZACION DEL DESEMPEÑO DE ERROR
Técnicas numéricas para el procesamiento de datos reales Antonio Turiel Instituto de Ciencias del Mar de Barcelona.
Financiera III Lica. Mónica Casia
REGRESIÓN LINEAL SIMPLE
ESTADISTICA DESCRIPTIVA BIVARIADA MEDIDAS DE RELACIÓN ENTRE VARIABLES CUANTITATIVAS.
Licenciatura en Psicopedagogía: Métodos, Diseños y Técnicas de Investigación Psicológica Tema 9 Fiabilidad de las puntuaciones.
TEMA 7 ANÁLISIS DE LOS RESULTADOS TEMA 7 ANÁLISIS DE LOS RESULTADOS.
Transcripción de la presentación:

Análisis Estadístico de Datos Climáticos Facultad de Ciencias – Facultad de Ingeniería 2009 M. Barreiro – M. Bidegain – A. Díaz Análisis de espectro singular

Análisis de Espectro Singular El análisis de espectro singular (SSA en inglés) está diseñado para extraer información de series temporales cortas y “ruidosas”. Se destaca de métodos espectrales clásicos en que construye auto-elementos “adaptados a los datos”. Motivación

Anomalías Salto Grande OND Indice de Oscilación Sur (mensual)

Dominio temporal vs. Dominio espectral La función de autocorrelación (que se calcula en el dominio temporal) y el espectro de potencia (o densidad espectral) están vinculados a través de la transformada de Fourier. El dominio espectral está motivado por el hecho de que el comportamiento más regular (y por tanto más predecible) de una serie temporal, es periódico. En el dominio espectral, se destacan las contribuciones de frecuencias predominantes y de sus períodos asociados. T período (se mide en segundos, meses, años, etc) f frecuencia (ciclos por segundo, o por mes, etc.)

Dominio temporal Dominio espectral

La variabilidad del sistema climático está caracterizada por un espectro de potencia que presenta: 1) una componente de banda ancha de “color cálido”, con potencias creciendo de las altas a las bajas frecuencias. 2) una componente de línea asociada con forzantes puramente periódicos, (anual y diario). 3) varios picos anchos que podrían surgir de forzantes menos periódicos (ej., variabilidad solar), oscilaciones internas, o una combinación de ambas.

Series de tiempo y dinámica no lineal Aun cuando una serie provenga de un sistema determinístico caótico, su comportamiento, para escalas de tiempo relativamente grandes, no es completamente irregular. Algunas regularidades, p. ej. cuasi- periodicidades, pueden contribuir a una parte importante de su variabilidad. El sistema climático tiene un límite de predictibilidad de un par de semanas para el tiempo meteorológico, debido a sus inestabilidades y no linealidades.

Series de tiempo y dinámica no lineal Al mismo tiempo, el sistema climático presenta algunas cuasi-periodicidades, como: El Niño -Oscilación Sur (en océano- atmósfera) (~ 2 a 5 años). Las oscilaciones de 40 a 50 días en la atmósfera tropical. Estas cuasi-periodicidades pueden, en principio, facilitar la predicción basada en el análisis de series temporales.

Aumento de la relación señal-ruido El SSA permite extraer información de la serie dada, descomponiéndola en patrones elementales aditivos, usando filtros adaptados a los datos. Esos patrones pueden ser: tendencias, patrones oscilatorios, y ruido. Algunas cuasi-periodicidades pueden contribuir a una parte importante de su variabilidad. Las tendencias no tienen por qué ser lineales, y los patrones oscilatorios (no necesariamente armónicos) pueden estar modulados en amplitud y fase.

Anomalías Salto Grande OND ( )

Para los cálculos, utilizamos el SSA- toolkit de la Universidad de California Los Angeles disponible en:

Etapas del SSA Se construye la secuencia de vectores desfasados: (t = 1,...,N´=N - M + 1) Dada una serie de tiempo X(t): Tiene bastante en común con el ACP, pero tiene diferencias importantes.

¿Cómo se elige M (longitud de “ventana”)? No hay una respuesta única. Surge de un compromiso: cantidad de información a extraer (mayor M) vs. grado de confianza estadística en esa información (N/M mayor ==> M menor). Aquí elegimos M = 20 porque los seudo-períodos que aparecen son bastante menores, como veremos. Es recomendable experimentar con más de un valor de M.

Matriz de covarianza Una estimación de la matriz de covarianza C MxM es: (Hay otras estimaciones posibles) Los autovalores y autovectores (matriz de Toeplitz) son la solución de:

Se construye la matriz de covarianza y se hace un análisis de componentes principales, obteniendo valores propios y funciones empíricas ortogonales (EOFs). Valores propios

Ejemplo de EOFs (M=60)

Funciones empíricas ortogonales Este método construye funciones empíricas ortogonales (EOFs, de longitud M) que son la contraparte de los senos y cosenos del análisis espectral clásico de Fourier. La ventaja sobre senos y cosenos es que los EOFs no son necesariamente funciones armónicas y, al ser adaptados a los datos, pueden capturar formas de oscilación altamente anarmónicas. Estas EOFs suelen presentarse en pares, con frecuencias y valores propios muy similares.

Los componentes principales se calculan proyectando adecuadamente la serie temporal sobre los EOFs: Los PCs tienen longitud N-M+1

Método de Monte Carlo para SSA En las señales climáticas, típicamente el ruido de fondo no es “blanco”, sino más bien “rojo”, es decir que presenta potencias mayores en frecuencias más bajas. Utilizamos aquí el término “ruido rojo” en el sentido restrictivo de un proceso autoregresivo de orden 1, AR(1). La idea es evaluar si, con algún nivel de significancia estadística, la serie original se distingue de un AR(1). Para ello, se puede hacer una simulación por el método de Monte Carlo.

Método de Monte Carlo para SSA Se ajusta un proceso AR(1) (“ruido rojo”) a la serie X(t) : donde a 1,  y X 0 se estiman a partir de la serie original. Se genera un ensemble de muchos datos simulados de ruido rojo y, para cada realización se calcula una matriz de covarianza. Se proyectan las matrices de covarianzas sobre la base de autovectores: y se compara con:

A partir de los EOFs y las componentes principales asociadas (p. ej. las que explican más varianza), se calculan series cuya suma aproxima a la serie original, llamados reconstruidos (RCs). Reconstrucción parcial de la serie Rec Rec Rec

Salto Grande OND: Espectro de serie reconstruida con 6 componentes (estimado por el método de máxima entropía). 6.1 años3.6 años2.4 años Los reconstruidos suelen tener la propiedad de presentar un espectro de banda angosta (es decir que hay una frecuencia predominante).

4 pasos para establecer confianza creciente en un resultado espectral (como, p. ej., la existencia de un modo oscilatorio) 1) Aplicar tests para un método espectral dado 2) Utilizar otros métodos espectrales y sus tests. 3) Encontrar el mismo modo en otras series de interés 4) Dar una explicación física convincente (el desafío mayor)

Salto Grande: Serie original vs reconstruido 1 a 6 ( ) Varianza explicada: 46%

Consecuencias para la predicción de fenómenos climáticos La naturaleza cuasi-cíclica de los RCs implica predictibilidad. Se puede hacer una predicción robusta de cada RC, ajustando un proceso autoregresivo de bajo orden a cada uno, y extendiéndolo hasta el instante deseado. Para elegir los RCs hay un compromiso entre la cantidad de varianza que uno espera predecir, y la confiabilidad de la predicción. Esta última indicaría elegir sólo los RCs oscilatorios. La exactitud de la predicción dependerá en cada caso de cuán bien representan los datos de la serie al comportamiento regular del sistema.

Ejercicio de predicción lineal para Dada la naturaleza oscilatoria de cada reconstruido, se ajusta un proceso auto-regresivo de orden K (AR(K)) a cada uno de ellos y se extrapola al futuro. No hay una forma única de determinar el orden K del AR, siendo conveniente que no sea demasiado grande pues puede provocar inestabilidades numéricas.

Hicimos pruebas con valores de K entre 1 y 15 para el período , y realizamos “predicciones” de los reconstruidos para 2003 a Así obtuvimos un 80% de coincidencias en los signos de anomalías entre la suma de reconstruidos “pronosticados” y observados para K entre 2 y 15. Finalmente, elegimos K = 5.

Salto Grande OND: Reconstruido y su predicción

Pero queremos predecir la serie de anomalías que tiene mucho más varianza…

Ajuste lineal entre reconstruidos y anomalías

Salto Grande OND: Anomalías y predicción

Conclusiones El SSA es una herramienta útil de diagnóstico para identificar señales cuasi- periódicas en series relativamente cortas y “ruidosas”. La naturaleza oscilatoria de esas señales implica la existencia de predictibilidad potencial. La realización de pronósticos útiles usando esta técnica parece promisoria y, a la vez, presenta limitaciones a superar.