Análisis Estadístico de Datos Climáticos Facultad de Ciencias – Facultad de Ingeniería 2008 M. Barreiro – M. Bidegain – A. Díaz Verificación y valor de.

Slides:



Advertisements
Presentaciones similares
Tiempo a la falla La Probabilidad, La Confiabilidad, La Rata de Riesgo y La Probabilidad Condicional de Falla.
Advertisements

DISEÑO DE EXPERIMENTOS EXPERIMENTOS DE COMPARACIÓN SIMPLE
Unidad I. Conceptos Básicos y Estadística Descriptiva
ANALISIS PARAMÉTRICOS
ANÁLISIS EXPLORATORIO DE DATOS
Bivariadas y Multivariadas
MÉTODOS DE ANÁLISIS FINANCIEROS
Definiciones y conceptos básicos
Capítulo I. Introducción
Unidad I. Conceptos Básicos y Estadística Descriptiva
Muestreo Obtención de evidencia confiable y pertinente, suficiente para brindar una base razonable sobre la cual emitir una opinión. Procedimientos que.
Capitulo 10: La metodología Box-Jenkins
Ciclo de formulación del proyecto.
Problema de la medición en Psicología
ECONOMÍA DE LA INFORMACIÓN
PROCESAMIENTO DE DATOS DE VIENTO 1º Parte.
Estadística Descriptiva Tema I. Conceptos Básicos
Unidad III. Conceptos Básicos de Estadística
UNIVERSIDAD NACIONAL DEL SANTA
Análisis Estadístico de Datos Climáticos Facultad de Ciencias – Facultad de Ingeniería 2009 M. Barreiro – M. Bidegain – A. Díaz Análisis de correlación.
Tema 2: Métodos de ajuste
Análisis no paramétricos
ANALISIS DE DATOS CON EXCEL
1 Planteamiento del problema ¿Tenemos los humanos la capacidad de percibir si nos miran desde atrás? O, más exactamente: ¿Es defendible que existen otras.
Estadística aplicada al análisis financiero
HUERTA GONZÁLEZ TANIA GPO
Importancia de las aplicaciones de estadística en el control de procesos Guatemala 2010.
ANALISIS DE DATOS CATEGORICOS
Análisis de datos El diseño estadístico.
Análisis de series de tiempo Cuarta semana Abril Julio 2009.
Mt. Martín Moreyra Navarrete.
ESTADÍSTICA DESCRIPTIVA
Elementos Básicos de Probabilidad y Estadística Javier Aparicio División de Estudios Políticos, CIDE Julio 2009
Seminario de TesisUnidad I. Marco Metodológico“Estadística Descriptiva” Dr. Javier Moreno Tapia.
Datos: Estadística.
Universidad Nacional de Colombia Curso Análisis de Datos Cuantitativos.
Capítulo 7 Estimación de Parámetros Estadística Computacional
Medidas de Posición y Centralización Estadística E.S.O.
Capacidad de Proceso.
Inferencia Estadística
Tratamiento de datos y azar
Incorporación de pronósticos climáticos en la gestión del sistema eléctrico - Algunos problemas estadísticos - Rafael Terra A. Díaz y R. Chaer.
Análisis de series de tiempo
Capítulo 1. Conceptos básicos de la Estadística
Pronósticos por ensambles
Eva Medina Moral Profesora Economía Aplicada (UAM) Febrero 2007
LA ESTADÍSTICA PROF.: EDMUNDO C.PARDO H. CARACAS,OCTUBRE DE 2014
El Valor Económico del Pronóstico del Tiempo y Predicción Climática René D. Garreaud Departamento de Geofísica Universidad de Chile.
Métodos Cuantitativos
ESTADÍSTICA Seminario V 15/04/2015. PUNTO 1  Abrimos el fichero y vamos a la vista variable.  cambiamos las escalas de los datos que nos dan.
Análisis de los Datos Cuantitativos
PLANES DE MUESTREO Y GRAFICAS DE CONTROL
Definiciones y conceptos básicos
RIESGO, RENDIMIENTO Y VALOR
Control Estadístico de Procesos
ECONOMÍA DE LA INFORMACIÓN TEOREMA DE BAYES Teoría de la decisión – Facultad de Ciencias Económicas - UBA.
Conceptos Básicos y Estadística Descriptiva
Unidad 4 Análisis de los Datos.
EVALUACION Y RESULTADOS DEL PROYECTO DE INVESTIGACION
Diseño: Mtro Domingo Villavicencio Aguilar
Inferencia Estadística Conceptos Previos. Conceptos Previos Población: Es la colección de toda la posible información que caracteriza a un fenómeno aleatorio.
INFERENCIA ESTADÍSTICA
ESTADÍSTICA DESCRIPTIVA
REGRESIÓN LINEAL SIMPLE
UNIVERSIDAD DE COSTA RICA Sistema de Estudios de Posgrado Escuela de Salud Pública I Ciclo lectivo 2003 Epidemiología – (SP – 2216) Profesora: Carmen.
Estadística descriptiva
Introducción a la Estadística Inferencial con SPSS Juan José Igartua Perosanz Universidad de Salamanca
ELEMENTOS DE ESTADÍSTICA DESCRIPTIVA MIE. GRACIELA ROMERO MERCADO.
Alvaro Alfredo Bravo Dpto. de Matemáticas y Estadística Universidad de Nariño - Colombia METODOS ALEATORIOS.
Transcripción de la presentación:

Análisis Estadístico de Datos Climáticos Facultad de Ciencias – Facultad de Ingeniería 2008 M. Barreiro – M. Bidegain – A. Díaz Verificación y valor de los pronósticos

Verificación de pronósticos Una definición: La verificación de pronósticos es la exploración y evaluación de la calidad de un sistema de pronósticos basado en una muestra de pronósticos previos y en las observaciones correspondientes. Aquí la calidad tiene que ver con la capacidad de los pronósticos para reducir la incertidumbre sobre el estado futuro (desconocido) de un sistema. (Para eso se hacen los pronósticos…)

Está bastante aceptado que la calidad de un pronóstico tiene muchos atributos diferentes que no pueden ser resumidos con un solo indicador o medida (“score”). En general, son necesarios varios scores para poder medir la calidad de un pronóstico. Nota: los métodos para verificar pronósticos son también útiles para otros problemas como comparar dos conjuntos de datos (p. ej., cuando se usa un conjunto para estimar al otro).

Las razones para realizar verificación de pronósticos son de 3 tipos: administrativas científicas económicas Además los resultados de la verificación deberían dar información de interés, no realizarse por mera conveniencia.

El predictando (es decir, aquello que se quiere predecir) puede ser: continuo (temperatura, presión, precipitación, etc) discreto (categórico) (ocurrencia o no ocurrencia, valor por encima o debajo de una referencia, o en un rango, cobertura de nubes (ordinal), tipo de nubes (nominal), etc) univariado

multivariado (viento, varias variables, campos espaciales en puntos de grilla) una probabilidad (la probabilidad de que mañana haya niebla es un 40%) ensembles de pronósticos de modelos

Pronóstico de Tornados (Finley, 1884) O sí O no P sí P no Indicador de performance de Finley: Fracción de aciertos: PC = ( )/2803 = Predictando categórico (caso binario) Matriz de contingencia

Pronóstico alternativo: “Nunca hay Tornado” O sí O no P sí P no Indicador: Fracción de aciertos PC = (0+2752)/2803 = (> 0.966!!)

Comentarios El esquema de Finley pronosticó correctamente más de la mitad de los tornados ocurridos. (El otro obviamente no.) El score “fracción de aciertos” puede no ser el mejor indicador para sintetizar el valor de este esquema de pronósticos en este caso, porque los pronósticos de “no tornado” son en general correctos. Es decir que no es un buen indicador para eventos “raros”. Los aciertos (P sí ; O sí ) son cruciales, y este score no los destaca.

El esquema de Finley: Cuando pronostica tornado, acierta el 28% de los casos. Cuando pronostica “no tornado”, se equivoca menos del 1% de los casos. El otro esquema: Nunca acierta un tornado Se equivoca el 1.8% de los casos Recalibración (usuario):

a = aciertos b = falsa alarma c = fallos d = negativo correcto a + b + c + d = n Otros indicadores para pronósticos binarios es útil si a << d. Para el caso Finley da false alarm ratio (0.72) Hit rate (0.55) etc etc etc… BIAS= (a+b)/(a+c) (1.96)

No hay un solo score que resuma toda la información Al tratar de resumir la información dada por los valores de la tabla en uno solo, se pierde información Se suelen analizar varios conjuntamente

Los valores de pronósticos de un predictando continuo escalar se pueden dividir en dos rangos separados por un umbral, considerarlos como pronósticos categóricos binarios, y calcular los scores ya vistos. También se puede variar ese umbral y graficar los scores en función del umbral.

Ebert, 2002 Ej: Estimación de precipitación por satélite

También se puede dividir en K intervalos o rangos, y obtener una tabla de contingencia de KxK

Murphy y Winkler (1987) establecieron un marco general para la verificación de pronósticos basado en las distribuciones de probabilidad conjuntas de los eventos observados y pronosticados. En el caso de variables discretas, si llamamos x al valor observado, y x’ al correspondiente valor pronosticado, se llama distribución conjunta de pronósticos y observaciones p(x’,x) a la probabilidad de que x’ tome un valor determinado y, al mismo tiempo, x tome otro valor determinado.

A su vez, a partir de la distribución conjunta se definen las distribuciones marginales y condicionales. Para variables discretas, las distribuciones marginales de x’ y x son: y las condicionales:

Un sistema de pronóstico es completamente inútil si los pronósticos son independientes de las observaciones, o sea si: o para todos los valores de x y x’

Habilidad de pronóstico (forecast skill) Se define en relación con un sistema de pronóstico de referencia (típicamente, persistencia o climatología). Si s = s perf, skill = 1 (máximo) Si s = s ref skill = 0 (igual que la referencia) Si s < s ref, skill < 0 (peor que la referencia)

Predictandos continuos Medidas de performance usuales Correlaciones su raíz cuadrada es el RMSE

Pronóstico de probabilidades “La probabilidad de que llueva mañana es 30%” ¿Cómo se evalúa? Con varios (muchos) pronósticos de 30% El sistema de pronóstico debe ser consistente y tener resolución. Consistencia: entre las probabilidades pronosticadas y observadas. Resolución: capacidad de clasificar eventos observados en grupos diferentes entre sí. Por ej., distinguir eventos que ocurren con mayor o menor frecuencia que la climatológica.

“Habilidad artificial” Es una habilidad aparente que no se conserva cuando se aplica el modelo de pronóstico a un conjunto independiente de datos. Cuantos más predictores potenciales se incluyan, es más posible que aparezca esta habilidad artificial. Para evitar este problema: Usar un período de “entrenamiento” y un período de “verificación” Usar validación cruzada.

Características deseables de un esquema de pronóstico Que tenga base física Estadísticamente correcto Reproducible y transparente (NO “caja negra”) Mostrar cómo hubiera funcionado en el tiempo. Que permita tomar decisiones en un área dada. Ser sometido al juicio de los pares, a través de publicación arbitrada.

Valor de los pronósticos Se refiere al valor económico para el usuario, que está relacionado con la calidad del pronóstico. Como dijimos, la calidad tiene que ver con la posibilidad de reducir la incertidumbre sobre el estado futuro del sistema. Veremos un modelo muy sencillo que define el valor de un pronóstico.

Modelo de decisión “costo-pérdida” Se tiene un evento climático cuya ocurrencia produce una pérdida P. Se pueden tomar acciones preventivas, cuyo costo es C. (C<P). La frecuencia climatológica del evento es s. (0 < s < 1) 1)Si no se dispone de pronóstico, (y suponiendo que siempre se realiza la misma acción): E clim = min (C, sP) (valor esperado del gasto)

Modelo de decisión “costo-pérdida” (cont.) 2) Disponiendo de un modelo perfecto: E perf = sC (a éste gasto se quiere llegar) 3) Si se tiene un pronóstico que da un gasto esperado E pron, se define: (es el valor del sistema de pronóstico) Si V > 0, el sistema da beneficio (V max = 1)

El beneficio de un mismo pronóstico será distinto para distintos usuarios, ya que cada uno tiene su C y P. Se demuestra que los pronósticos probabilísticos dan más beneficio que los determinísticos. (Hay una probabilidad umbral óptima dependiendo del valor C/P.) Comentarios