Las temperaturas registradas en la Antártida como series de datos funcionales, necesitamos un concepto de tendencia Ricardo Fraiman Universidad de San.

Slides:



Advertisements
Presentaciones similares
DISEÑO DE EXPERIMENTOS EXPERIMENTOS DE COMPARACIÓN SIMPLE
Advertisements

ANALISIS PARAMÉTRICOS
Tema 14. Estimación de parámetros: Estimación puntual y por intervalos
ESTUDIO DE MERCADO. MÉTODOS DE PROYECCIÓN
Planificación y Control de la Producción I
Selección del modelo adecuado
Centro de Investigación Estadística
Índices de cambio climático en el suelo de conservación del sur del D
Representación en espacio de estado
SERIES UNIVARIADAS Toda institución, ya sea la familia, la empresa o el gobierno, tiene que hacer planes para el futuro si ha de sobrevivir y progresar.
Bioestadística Aplicada I
HERRAMIENTAS PARA EL CONTROL ESTADÍSTICO DE CALIDAD.
Adversidades Climáticas: Heladas
Estadística Computacional Prof. Miguel González Velasco
CONTRASTE Y VALIDACIÓN DE UN MODELO
Rejilla de observaciones interpoladas de alta resolución en España para precipitación y temperatura: SpainHR Jesús Fernández.
Habilidades de Pensamiento Científico
Análisis Estadístico de Datos Climáticos Facultad de Ciencias – Facultad de Ingeniería 2009 M. Barreiro – M. Bidegain – A. Díaz Análisis de correlación.
Estudios Ecológicos - correlación.
9 Regresión Lineal Simple
Tema 2: Métodos de ajuste
MEDIDAS DE DISPERSIÓN:
El MODELO DIT 3p para predicción de lluvias máximas
Estadística Descriptiva
Prueba de hipótesis Equivalencia entre la prueba de hipótesis y los intervalos de confianza Valor de probabilidad Valor de probabilidad unilateral Prueba.
Variabilidad observada de los eventos climáticos extremos en Cuyo y sus impactos Olga C. Penalba, Matilde Rusticucci Investigadores: Mariana Barrucand,
Sesión 2: Métodos Probabilísticos Básicos
Curso Práctico de Bioestadística Con Herramientas De Excel Fabrizio Marcillo Morla MBA (593-9)
CONTRASTE Y VALIDACIÓN DE UN MODELO
Seminario sobre evaluación económica de proyectos de transporte Madrid, 15 y 16 de noviembre LA PREDICCIÓN DE LA DEMANDA EN EVALUACIÓN DE PROYECTOS.
Importancia de las aplicaciones de estadística en el control de procesos Guatemala 2010.
1 Asignatura: Autor: Análisis Numérico César Menéndez Titulación: Planificación: Materiales: Conocimientos previos: Aproximación Ingeniero Técnico Informático.
Pronósticos, Series de Tiempo y Regresión
Estadística Descriptiva
Caso: Situación de las Comunidades Autónomas españolasen cuanto a indicadores de bienestar En el periódico “El País” del día 17 de enero de 2002 se publicó.
Teoría frecuentista del contraste de hipótesis
PREPARATORIA FEDERAL POR COOPERACION “LUZAC”
1 Metodología para Estimaciones de la Actividad Económica del Estado de Nuevo León Marzo 2005.
Métodos de calibración: regresión y correlación
Universidad Nacional de Colombia Curso Análisis de Datos Cuantitativos.
ESTADISTICA I CSH M. en C. Gal Vargas Neri.
Programación Lineal Entera Antonio H. Escobar Z Universidad Tecnológica de Pereira – Colombia Posgrado en Ingeniería Maestría en Ingeniería Eléctrica.
Titular: Agustín Salvia
Capacidad de Proceso.
ANALISIS DE SERIES TEMPORALES
Construcción de gráficas: Forma manual y con programados
Herramientas básicas.
SERIES TEMPORALES.
Capítulo 1. Conceptos básicos de la Estadística
Índice: Introducción Conceptos básicos Procesos elementales
Diapositivas de matemáticas
Pruebas de hipótesis.
PRUEBAS ESTADISTICAS NO PARAMETRICAS
Métodos Cuantitativos
Análisis de los Datos Cuantitativos
ESTIMACIÓN DE PARÁMETROS
Método de mínimos cuadrados
MEDIDAS DE TENDENCIA CENTRAL
Ejercicios Dado un conjunto de datos, aplicar el Criterio de Fourier para desechar los posibles valores atípicos.
Métodos de investigación en la psicología clínica
Variables estadísticas bidimensionales
APLICACIONES EN GEOGRAFÍA
Gabriel Caamaño Nelli, Carlos G. Catalini, Carlos M
Técnicas numéricas para el procesamiento de datos reales Antonio Turiel Instituto de Ciencias del Mar de Barcelona.
Clase 17 Introducción a la Estadística Universidad de la República Centro Universitario Regional del Este Pablo Inchausti Licenciatura en Gestión Ambiental.
ESTADISTICA DESCRIPTIVA BIVARIADA MEDIDAS DE RELACIÓN ENTRE VARIABLES CUANTITATIVAS.
REGRESIÓN LINEAL SIMPLE TEMA INTRODUCCIÓN Determinar la ecuación de regresión sirve para: – Describir de manera concisa la relación entre variables.
Estadística y probabilidad aplicada a los negocios
4. Métodos psicofísicos de medida en clínica
TEMA 7 ANÁLISIS DE LOS RESULTADOS TEMA 7 ANÁLISIS DE LOS RESULTADOS.
Transcripción de la presentación:

Las temperaturas registradas en la Antártida como series de datos funcionales, necesitamos un concepto de tendencia Ricardo Fraiman Universidad de San Andrés, Argentina Ana Justel Universidad Autónoma de Madrid Pamela Llop Instituto de Matemática Aplicada del Litoral (IMAL) - CONICET, Argentina Servei d'Estadística 27 de marzo de 2009

Cambio climático global

Cuando se habla del cambio climático en la Antártida, la información existente es muy escasa, y la que se aprovecha mucha menos Los (pocos) estudios que se han hecho dicen que... Hay una cierta evidencia de calentamiento “global” en la Antártida Un enfriamiento en la Antártida Continental Y un calentamiento muy por encima del global del planeta en la Península Antártica Lo dicen… IPCC (2001) Comiso (2000): J. of Climate Doran et al. (2002): Nature Vaughan el al. (2003): Climatic Change Turner et al. (2005): Int. J. Climatology … Steig (Enero, 2009): Nature

Sólo cuatro en la Región de la Península Antártica

PROBLEMAS DETECTADOS EN LOS ESTUDIOS PREVIOS: Se usa una proporción muy baja de los datos existentes, sólo de estaciones con registros de 50 años y de TODO EL AÑO (menos de 20) Conclusiones basadas en el ajuste por mínimos cuadrados de tendencias lineales deterministas No parece muy realista asumir que la evolución de la temperatura es determinista (el futuro está escrito) La estimación de la tendencia da más peso siempre a los datos centrales Las medias anuales o mensuales pueden estar muy sesgadas por la abundancia de rachas de “missing data” Sorprende la poca presencia de estadísticos entre los grupos que han realizado los estudios más relevantes sobre la tendencia de parámetros meteorológicos en la Antártida

NUESTRO OBJETIVO: Proponer nuevas herramientas estadísticas para tratar con datos “malos” Datos anuales en los que sólo se observa una estación Una cantidad alta de atípicos en datos que se observan con mucha frecuencia (observaciones no equiespaciadas) Rachas largas de datos faltantes

EL CASO DE LOS DATOS CLIMATOLÓGICOS DE LA BASE ANTÁRTICA ESPAÑOLA JUAN CARLOS I: BAE-JCI Spanish Antarctic Base Juan Carlos I Funcionando desde enero de 1988, en la costa SO de la Peninsula Hurd, Isla Livingston (South Shetland Islands) Se registran TEMPERATURAS AREAS instantáneamente cada 10 minutos Tomamos la media de datos horarios (media de entre 1 y 5 datos, según el número de missing) Shouth Sheatland Is.

Temperaturas registradas en la Base Antártica Española Juan Carlos I (BAE-JCI) 10 años

NUEVO ENFOQUE DEL PROBLEMA: Suponemos que existe una curva/función de temperatura para cada verano que se observa únicamente en periodos discretos de tiempo debido a las limitaciones que imponen los aparatos de medida Tenemos una serie temporal anual donde para cada año el dato que se observa es una curva verano X1X1 X2X2 X3X3 X4X4 XTXT t

VENTAJAS: No necesitamos observar la serie completa durante todo el año Se utiliza el micro-dato No se pierde la información de la estacionalidad diaria No necesitamos datos equiespaciados

ANÁLISIS DE SERIES TEMPORALES PARA DATOS FUNCIONALES El objetivo es estudiar si una serie temporal de datos funcionales tiene o no tendencia verano X1X1 X2X2 X3X3 X4X4 XTXT t

Temperaturas registradas en la Base Antártica Española Juan Carlos I (BAE-JCI) No se ve nada

ANÁLISIS DE SERIES TEMPORALES PARA DATOS FUNCIONALES El objetivo es estudiar si una serie temporal de datos funcionales tiene o no tendencia verano X1X1 X2X2 X3X3 X4X4 XTXT t Bosq (1991) introduce el FAR(1) Ferraty y Vieu (2006) comentan los resultados de varios autores Tratan el problema de predecir en procesos estacionarios PRINCIPAL DIFICULTAD: No tenemos una definición asociada al concepto de tendencia para el caso de datos funcionales

Buscamos una “DEFINICIÓN” asociada al concepto DE TENDENCIA para el caso de datos funcionales Ideas basadas en RANGOS Dos métodos descriptivos de evaluación de tendenciasDos métodos descriptivos de evaluación de tendencias Proponemos test sobre “curvas máximas”Proponemos test sobre “curvas máximas” Reducimos la dimensión infinita del problemaReducimos la dimensión infinita del problema ANÁLISIS DE SERIES TEMPORALES PARA DATOS FUNCIONALES

Rangos de las curvas IDEA 1: Rangos de las curvas Diremos que la serie tiene tendencia si la serie de los “rangos” de las “series ordenadas” tiene tendencia Rangos de las curvas ordenadas IDEA 2: Rangos de las curvas ordenadas Diremos que la serie tiene tendencia si la “serie de rangos” de las curvas tiene tendencia Métodos descriptivos de evaluación de tendencias

Diremos que la serie tiene tendencia si la serie de “rangos” de las curvas tiene tendencia 1.Para cada curva X t calculamos los rangos en un número finito de instantes R t (1), …, R t (S) s X1X1 X2X2 X3X3 t Rangos de las curvas IDEA 1: Rangos de las curvas

Diremos que la serie tiene tendencia si la serie de “rangos” de las curvas tiene tendencia Rangos de las curvas IDEA 1: Rangos de las curvas Cada conjunto de barras corresponde a una curva, cuenta el número de veces a lo largo del tiempo en que el rango es 1,2, …,17

1.Para cada curva X t calculamos los rangos en un número finito de instantes R t (1), …, R t (S) s X1X1 X2X2 X3X3 t Integramos a lo largo de todo el periodo de observación de la curva R 3 = 17/7 R 2 = 14/7 R 1 = 11/7 Diremos que la serie tiene tendencia si la serie de “rangos” de las curvas tiene tendencia Rangos de las curvas IDEA 1: Rangos de las curvas

Comentarios: Aunque le llamamos “serie de rangos”, no son rangos ya que al tratarse de un promedio de rangos no toman valores enteros Reducimos la dimensión infinita asociando a cada curva un valor real positivo No es importante el orden temporal en s=1,…,S, así que se puede generalizar a cualquier tipo de curva En cada instante que calculamos los rangos tenemos que haber observado todas las series Para aprovechar mejor los datos lo mejor es suavizar la curva antes de discretizar Diremos que la serie tiene tendencia si la serie de “rangos” de las curvas tiene tendencia Rangos de las curvas IDEA 1: Rangos de las curvas

INTERPOLACIÓN “SHAPE PRESERVING” de MATLAB Utiliza información local únicamente de la propia curvaUtiliza información local únicamente de la propia curva Es no paramétricaEs no paramétrica Es un método sencilloEs un método sencillo Y siempre mejorable con una modelización previa…Y siempre mejorable con una modelización previa… Da una solución bastante razonable!!!Da una solución bastante razonable!!!

DATOS CON INTERPOLACIÓN “shape preserving”

Season Percentage of observed data First observed data Last observed data 1987/ / / / / / / / / / / / / / / / / / / / Eliminadas Eliminadas (insuficientes datos) 1076 datos empleados cada año

Diremos que la serie tiene tendencia si la serie de “rangos” de las curvas tiene tendencia Rangos de las curvas IDEA 1: Rangos de las curvas 1.Para cada curva X t calculamos los rangos en un número finito de instantes R t (1), …, R t (S) 2.Integramos a lo largo de todo el periodo de observación de la curva

Rangos de las curvas IDEA 1: Rangos de las curvas Diremos que la serie tiene tendencia si la serie de los “rangos” de las “series ordenadas” tiene tendencia Rangos de las curvas ordenadas IDEA 2: Rangos de las curvas ordenadas Diremos que la serie tiene tendencia si la “serie de rangos” de las curvas tiene tendencia Métodos descriptivos de evaluación de tendencias

1.Se calculan las curvas “ordenadas” x (1), …, x (T) (mínima, segunda,…, máxima) Diremos que la serie tiene tendencia si la serie de los “rangos” de las series “ordenadas” tiene tendencia IDEA 2: Rangos de curvas ordenadas s X1X1 X2X2 X3X3 s X (1) X (2) X (3) R’ 3 = 18/7 R’ 2 = 12/7 R’ 1 = 12/7 2.Para cada x (t) calculamos los “rangos” en un número finito de instantes, R’ t (1),…,R’ t (S), siendo R’ t (j) el orden de la curva asociada en el instante j 3.Integramos a lo largo de todo el periodo de observación de la curva

Diremos que la serie tiene tendencia si la serie de los “rangos” de las series “ordenadas” tiene tendencia IDEA 2: Rangos de curvas ordenadas

Comentarios: Aunque le llamamos serie de “rangos”, no son rangos ya que al tratarse de un promedio de rangos no toman valores enteros, tampoco son las series “ordenadas” Reducimos la dimensión infinita del problema No es importante el orden temporal en s=1,…,S, así que se puede generalizar a cualquier tipo de curva En cada instante que calculamos los rangos tenemos que haber observado todas las series Para aprovechar mejor los datos lo mejor es suavizar la curva antes de discretizar Sirve de base para los test de “curvas máximas”… Diremos que la serie tiene tendencia si la serie de los “rangos” de las series “ordenadas” tiene tendencia IDEA 2: Rangos de curvas ordenadas

Test para curvas máximas Consideramos la cantidad de veces que una curva coincide con la curva máxima 1.Proponemos un test sobre la probabilidad de que una curva coincida con la curva máxima Si no hay calentamiento (H 0 ), las curvas son independientes y la probabilidad es la misma para las T curvas Bajo la hipótesis nula es

Test para curvas máximas

2.Proponemos un test sobre la probabilidad de que una curva coincida con la curva máxima de las observadas hasta el momento Rechazamos para todos los veranos excepto en 2003/04 que fue un verano “sorprendentemente” frío para las personas que estuvimos allí Test para curvas máximas

Test para curvas máximas – Bases Argentinas

CONCLUSIONES: Con este trabajo no pretendemos dar respuesta a la pregunta de si hay o no calentamiento en la Antártida Proponemos herramientas estadísticas que permitan incorporar en los estudios la mayor parte de los datos que se están registrando con gran coste económico y humano Hemos visto que un enfoque basado en el Análisis de Datos Funcionales es útil para tratar series temporales que se observan sólo en una parte del año Las mismas técnicas se pueden utilizar en otros problemas similares. Por ejemplo, evolución del ozono troposférico

Muchas gracias