Análisis Estadístico de Datos Climáticos Facultad de Ciencias – Facultad de Ingeniería 2009 M. Barreiro – M. Bidegain – A. Díaz Composites Regresión lineal.

Slides:



Advertisements
Presentaciones similares
ANOVA DE UN FACTOR.
Advertisements

MSP César Eduardo Luna Gurrola
Clase No. 1.
Regresión lineal simple
Regresión mínimo cuadrada (I)
REGRESION LINEAL SIMPLE
Ejemplo Grafico.
ESTADISTICA INFERENCIAL
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
De la muestra a la población
Estimación de parámetros poblacionales
Pronósticos, Series de Tiempo y Regresión
Ingeniería Industrial II CicloEducativo 2011
INFERENCIA ESTADÍSTICA
DISTRIBUCIONES MUESTRALES, DE LAS MUESTRAS O DE MUESTREO
Regresión Lineal y Regresión Polinomial
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
Modelo básico de regresión Lineal
Regresión y correlación
CURSO DE ESTADÍSTICA BÁSICA
Estadística Descriptiva: 4. Correlación y Regresión Lineal
Tema 1- Regresión lineal simple.
Análisis Estadístico de Datos Climáticos Facultad de Ciencias – Facultad de Ingeniería 2009 M. Barreiro – M. Bidegain – A. Díaz Análisis de correlación.
Estadística Descriptiva: 4. Correlación y Regresión Lineal Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.
Regresión lineal Es un modelo matemático para predecir el efecto de una variable sobre otra, ambas cuantitativas. Una variable es la dependiente y otra.
Regresión Lineal Simple
9 Regresión Lineal Simple
División de Estudios Políticos, CIDE
SISTEMAS DE SOPORTE PARA LA TOMA DE DECISIONES
Facultad: Turismo Y Hotelería
Tests de hipótesis Los tres pasos básicos para testear hipótesis son
REGRESION Y CORRELACION
Prueba para la Bondad de ajuste Validación de Modelo
Pronósticos, Series de Tiempo y Regresión
Pronósticos, Series de Tiempo y Regresión
Tema 17: Contraste paramétrico de hipótesis I: Pruebas de contraste para un grupo. Pruebas de contraste para dos grupos: independientes o relacionados.
Programación Numérica
Unidad V: Estimación de
ANALISIS DE FRECUENCIA EN HIDROLOGIA (2)
Métodos de calibración: regresión y correlación
Introducción La inferencia estadística es el procedimiento mediante el cual se llega a inferencias acerca de una población con base en los resultados obtenidos.
Titular: Agustín Salvia
Normalidad, Variabilidad y estimación del Modelo de Regresión
Introducción a la Inferencia Estadística
CORRELACION Y REGRESION LINEAL: Introducción
Inferencia Estadística
Límites y Continuidad.
Regresión lineal múltiple
REGRESION LINEAL II Mario Briones L. MV, MSc
Definición del Modelo de Regresión Simple Estimaciones por MCO Método de MCO Valores Esperados y Varianzas por MCO.
ANÁLISIS DE REGRESIÓN SIMPLE
Análisis de los Datos Cuantitativos
Regresión Lineal Simple
CORRELACIÓN Y REGRESIÓN EMPLEANDO EXCEL
Construcción de modelos con regresión y correlación
Prueba de Hipótesis Una hipótesis estadística es un supuesto que se establece sobre las características de una distribución poblacional El estudio se plantea.
Regresión lineal simple Nazira Calleja
Unidad 4 Análisis de los Datos.
Germán Fromm R. 1. Objetivo Entender los diseños metodológicos predictivos 2.
ECONOMETRIA 2. MODELO LINEAL SIMPLE Hernán Delgadillo Dorado
REGRESIÓN LINEAL SIMPLE
REGRESIÓN LINEAL SIMPLE. Temas Introducción Análisis de regresión (Ejemplo aplicado) La ecuación de una recta Modelo estadístico y suposiciones Estimación.
ESTADISTICA DESCRIPTIVA BIVARIADA MEDIDAS DE RELACIÓN ENTRE VARIABLES CUANTITATIVAS.
REGRESIÓN LINEAL SIMPLE TEMA INTRODUCCIÓN Determinar la ecuación de regresión sirve para: – Describir de manera concisa la relación entre variables.
Intervalos de Confianza M. C. José Juan Rincón Pasaye UMSNH – FIE Mayo de 2003.
Yulieth ariza Villarreal Estadística II. Historia La distribución de Student fue descrita en 1908 por William Sealy Gosset. Gosset trabajaba en una fábrica.
1 REGRESIÓN CON VARIABLES DICOTÓMICAS TEMA 1 (CONTINUACIÓN)
14 Introducción al Análisis de Correlación y de Regresión Lineal
M.E. ADA PAULINA MORA GONZALEZ. Esta parte describe las técnicas para ajustar curvas en base a datos para estimaciones intermedias. Una manera de hacerlo.
ANALISIS DE VARIANZA.
Transcripción de la presentación:

Análisis Estadístico de Datos Climáticos Facultad de Ciencias – Facultad de Ingeniería 2009 M. Barreiro – M. Bidegain – A. Díaz Composites Regresión lineal simple

Composites El método de composites consiste en clasificar los datos en categorías y comparar p. ej. los valores medios o anomalías de otras variables para las distintas categorías. Puede servir para identificar señales no muy fuertes que están ocultas debido a la existencia de ruido.

Composites Ejemplo 1: componemos anomalías de lluvias en el trimestre OND según anomalías simultáneas de TSM positivas (eventos cálidos) o negativas (eventos fríos) en N3.4 en

Episodios cálidos y fríos en la región N3.4 ( )

Composites Eventos cálidos ( ) Composites de lluvias

Composites Eventos fríos ( ) Composites de lluvias

Composites 4 regiones en Uruguay-Río Grande do Sul ( pluviómetros en ) OND Ejemplo 2: aplicación al prónóstico Región Niño 3.4 en el Océano Pacífico Jul-Ago anterior

Composites Climatología de precipitación en OND Subpoblación condicionada a (0.34 ºC < (Jul-Ago N3.4) < º C ) (situación similar a la de N3.4 en Jul-Ago 2004) Los resultados deben someterse a pruebas para determinar si son estadísticamente significativos Se hacen composites de precipitaciones en OND en cada región, condicionados por el índice N3.4 dos meses antes.

Regresión Wilks (Cap. 6) La regresión se usa para describir relaciones que involucran variables medidas en una escala continua. Para vincular variables aleatorias (ej., ancho de un anillo de árbol con la temperatura), o una variable aleatoria con uno o más factores externos no aleatorios (ej modelar trend con un polinomio). Se puede utilizar para la predicción cuando las variables a relacionar no son simultáneas.

Regresión lineal simple Estimación de los parámetros Distribución de los residuos Tabla ANOVA Bondad del ajuste Análisis de los residuos Distribución muestral de coeficientes de la regresión Intervalos de confianza de la predicción

Regresión lineal simple Cor = 0.93 x y Dados los pares de valores: (x 1, y 1 ), (x 2, y 2 )….(x n, y n ) se busca ajustar una recta de ecuación n=58

x variable independiente o predictor y variable dependiente o predictando Pero no se debe suponer que necesariamente existe una relación de causalidad entre ambas variables Regresión lineal simple

Hay distintos criterios para estimar los parámetros. El más habitual es el método de mínimos cuadrados. (suma de errores cuadráticos) Se busca minimizar Estimación de los parámetros

Se plantea la anulación de las derivadas parciales respecto de obteniéndose las soluciones: En el ejemplo: ATENCIÓN: Existe asimetría entre x e y (si se invierten los roles, no se obtiene la misma recta!!) b = r xy σ Y /σ X Estimación de los parámetros

En Matlab: A=[ones(58,1) n34set5007']; Y=n34nov5007'; ab=A\Y ab =

Distribución de los residuos Supondremos que los residuos (o errores) e i son independientes e idénticamente distribuidos (iid) con media 0 y varianza σ ( igual para todos los e i ). Además se suele suponer que los residuos siguen una distribución gaussiana. En general, cuantas más hipótesis se hagan, más ricas serán las conclusiones estadísticas que podremos extraer, pero más limitada será la aplicabilidad del modelo. Cuanto mayor sea el tamaño de la muestra (n), más se atenúa la eventual no gaussianidad.

Distribución de los residuos La suposición de varianza constante implica que la distribución condicionada a x constante, no depende de x.

Estimación de la varianza de los residuos En el ejemplo: pero Distribución de los residuos

suma de cuadrados total suma de cuadrados dada por la regresión (es bueno que se acerque a SST) suma de cuadrados de los residuos Se cumple: SST = SSR + SSE En el ejemplo anterior: SST = (ºC) 2 SSR = (ºC) 2 SSE = 9.98 (ºC) 2

Tabla ANOVA F=MSR/MSE MSE=s e 2 SSEn-2Residuos MSR=SSR/1SSR1Regresión SSTn- 1Total Media cuadrática Suma de cuadrados Grados de libertad (ANOVA = Análisis de varianza)

Tabla ANOVA F=MSR/MSE = MSE=s e 2 =0.18SSE=9.9856Residuos MSR=SSR/1= SSR=62.491Regresión SST= Total Media cuadrática Suma de cuadrados Grados de libertad Para el ejemplo:

1) (da un promedio de la exactitud del ajuste; lo ideal sería MSE=0) Bondad del ajuste Hay 3 indicadores usuales para la bondad de ajuste: 2) Coeficiente de determinación: en el peor caso vale 0, en el mejor, vale 1. 3) El estadístico F=MSR/MSE (es mayor cuanto mejor es el ajuste) En el ejemploR 2 = 0.86

En general, cuanto más cercano a 0 esté el coeficiente angular b, menos información aporta la regresión lineal o, de otra forma, más débil es la relación entre x e y. Bondad del ajuste

Análisis de los residuos

Análisis de los residuos (para el ejemplo) OK

Distribución muestral de coeficientes de la regresión Los estimadores de a y b son insesgados y, en las hipótesis hechas, sus distribuciones son gaussianas, siendo sus desviaciones estándar respectivas: y Sin embargo, como s e es una estimación, para las pruebas de hipótesis hay que usar la distribución t de Student con n-2 grados de libertad.

Distribución muestral de coeficientes de la regresión Por ejemplo, para hacer una prueba en que la hipótesis nula sea H 0 : b = 0, contra la hipótesis H 1 : b 0, observamos que el estadístico en la hipótesis nula sigue una distribución t de Student con n-2 grados de libertad. En nuestro ejemplo, obtenemos: t = 18.7, que, con 56 grados de libertad,,es muy significativa (a menos del 0.1%), por lo que se rechaza la hipótesis nula. No hay que olvidar que los datos pueden no ser independientes

Puede interesar hallar intervalos de confianza para siendo x 0 un valor cualquiera, independiente de los utilizados para construir el modelo. Intervalos de confianza de la predicción Debido a la incertidumbre en la estimación de y de b, la varianza es mayor que s e 2 :

Intervalos de confianza de la predicción No son rectas!