La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Estadística Descriptiva: 4. Correlación y Regresión Lineal Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.

Presentaciones similares


Presentación del tema: "Estadística Descriptiva: 4. Correlación y Regresión Lineal Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María."— Transcripción de la presentación:

1 Estadística Descriptiva: 4. Correlación y Regresión Lineal Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María

2 Estadística Descriptiva Objetivo Obtener información desde una muestra, que permita entender o formular hipótesis acerca del fenómeno que se estudia. Tipos de Análisis: Describir cómo se comporta una variable Describir cómo una variable (digamos explicativa) afecta el comportamiento de a otra (digamos dependiente) Describir cómo interaccionan varias variables

3 Estadística Descriptiva Correlación en Análisis Bivariado Correlación: Medida cuantitativa del grado de asociación entre dos variables X e Y continuas Idea: Si X e Y están correlacionadas un cambio en X se corresponde con un cambio en Y y viceversa. Si un incremento en X genera un incremento en Y diremos que las variables están correlacionadas positivamente. En caso contrario diremos que están correlacionadas negativamente.

4 Estadística Descriptiva Correlación en Análisis Bivariado Ejemplo: Columna del New York Times

5 Estadística Descriptiva Correlación en Análisis Bivariado Covarianza: La idea es medir los cambios con respecto al nivel medio de cada variable Claramente generaliza la varianza: cov(x,x) Problema: la medida depende de las magnitudes absolutas de x e y. Una mayor covarianza no significa mayor asociación

6 Estadística Descriptiva Correlación en Análisis Bivariado Coeficiente de Correlación de Pearson: La idea es normalizar la covarianza con una medida de dispersión para X y para Y Medida acotada entre -1 y 1 (probarlo! se sigue de la desigualdad de Cauchy-Schwarz para productos puntos)

7 Estadística Descriptiva Correlación en Análisis Bivariado Observación: Si x e y tienen una relación lineal exacta la correlación de Pearson es igual al signo de a

8 Estadística Descriptiva Correlación en Análisis Bivariado Observación: Si x e y tienen una relación lineal exacta la correlación de Pearson es igual al signo de a

9 Estadística Descriptiva Correlación en Análisis Bivariado Observación: Si x e y tienen una relación lineal exacta la correlación de Pearson es igual al signo de a

10 Estadística Descriptiva Correlación en Análisis Bivariado Correlación positiva (Pearson)

11 Estadística Descriptiva Correlación en Análisis Bivariado Correlación negativa (Pearson)

12 Estadística Descriptiva Correlación en Análisis Bivariado Correlación nula (Pearson)

13 Estadística Descriptiva Correlación en Análisis Bivariado Ejemplo 1: Se tiene la hipótesis de que el número de años de estudio está correlacionado positivamente con el ingreso de las personas. Para corroborarlo se recogió la siguiente muestra:

14 Estadística Descriptiva Correlación en Análisis Bivariado Ejemplo 1: EncuestadoIngresoAños de Educación #11.250.00019 #21.000.00020 #3400.00016 #4350.00016 #5410.00018 #6290.00012 #7350.00014 #8240.00012 #9500.00016 #10600.00017

15 Estadística Descriptiva Correlación en Análisis Bivariado Correlación y Ruido

16 Estadística Descriptiva Correlación en Análisis Bivariado Limitaciones del Coeficiente de Pearson

17 Estadística Descriptiva Correlación en Análisis Bivariado Limitaciones del Coeficiente de Pearson

18 Estadística Descriptiva Correlación en Análisis Bivariado Limitaciones del Coeficiente de Pearson

19 Estadística Descriptiva Correlación en Análisis Bivariado Limitaciones del Coeficiente de Pearson

20 Estadística Descriptiva Correlación en Análisis Bivariado Anscombe's Quartet Caso ICaso IICaso IIICaso IV xyXyxyxy 10.08.0410.09.1410.07.468.06.58 8.06.958.08.148.06.778.05.76 13.07.5813.08.7413.012.748.07.71 9.08.819.08.779.07.118.08.84 11.08.3311.09.2611.07.818.08.47 14.09.9614.08.1014.08.848.07.04 6.07.246.06.136.06.088.05.25 4.04.264.03.104.05.3919.012.50 12.010.8412.09.1312.08.158.05.56 7.04.827.07.267.06.428.07.91 5.05.685.04.745.05.738.06.89

21 Estadística Descriptiva Regresión Modelo de una variable y como función de otra x x se denomina la variable independiente y se denomina la variable dependiente ε es el residuo, la parte que no logra ser explicada por el modelo (f será usualmente una función determinista)

22 Estadística Descriptiva Regresión Modelo de una variable y como función de otra x A partir de una muestra de valores de x e y, queremos encontrar un modelo apropiado. Qué tipo de función f utilizar? Cómo seleccionar un modelo adecuado en base a la muestra de observaciones?

23 Estadística Descriptiva Regresión ¿Qué función f utilizar?: Una función periódica?

24 Estadística Descriptiva Regresión ¿Qué función f utilizar? un polinomio?

25 Estadística Descriptiva Regresión ¿Qué función f utilizar? una exponencial?

26 Estadística Descriptiva Regresión ¿Qué función f utilizar? una logística?

27 Estadística Descriptiva Regresión Graficar la muestra de valores (x,y) y estudiar la forma de la posible relación

28 Estadística Descriptiva Regresión Lineal Una alternativa simple consiste en modelar y como función lineal de x, es decir

29 Estadística Descriptiva Regresión Lineal Una alternativa simple consiste en modelar y como función lineal de x, es decir

30 Estadística Descriptiva Regresión Lineal ¿Qué parámetros b 0 y b 1 son apropiados para modelar la relación entre x e y? Supongamos que hemos conseguido una muestra de n pares de valores x e y:

31 Estadística Descriptiva Regresión Lineal Ejemplo: ¿El financiamiento entregado a la autoridad Palestina contribuye a mitigar el conflicto en la región?

32 Estadística Descriptiva Regresión Lineal Variables: X: financiamiento entregado a la autoridad palestina. Y: número de homicidios el año siguiente. Muestra: Si medimos x e y en los últimos años tenemos: XY 1999075 200050250 2001450500 2002375275 2003190210 2004300240 2005290375 2006610600

33 Estadística Descriptiva Regresión Lineal Graficando X versus Y

34 Estadística Descriptiva Regresión Lineal Graficando X e Y en cada año

35 Estadística Descriptiva Regresión Lineal Variables: X: financiamiento entregado a la autoridad palestina. Y: número de homicidios el año siguiente. Modelo: Postulamos un modelo lineal

36 Estadística Descriptiva Regresión Lineal Ajustar el modelo lineal consiste en buscar parámetros b 0 y b 1 que hagan el modelo adecuado Cada combinación de parámetros genera una predicción para el valor de y asociado a x

37 Estadística Descriptiva Regresión Lineal b 0 = 10 y b 1 = 1 XYf(X)Y-f(X) 1999075 10 65 200050250 60 190 2001450500 460 40 2002375275 385 - 110 2003190210 200 10 2004300240 310 -70 2005290375 300 75 2006610600 620 -20

38 Estadística Descriptiva Regresión Lineal b 0 = 50 y b 1 = 0.5 XYf(X)Y-f(X)Anterior 1999075 50 25 65- 200050250 75 175 190- 2001450500 275 225 40+ 2002375275 237 38 - 110- 2003190210 145 65 10+ 2004300240 200 40 -70- 2005290375 195 85 75+ 2006610600 355 245 -20+

39 Estadística Descriptiva Regresión Lineal b 0 = 50 y b 1 = 0.75 XYf(X)Y-f(X)Anterior 1999075 50 25 - 200050250 87.5 162 175- 2001450500 387.5 112 225- 2002375275 331.25 -56.25 38+ 2003190210 192.5 17.5 65- 2004300240 275 -35 40- 2005290375 267 107.5 85+ 2006610600 507.5 92.5 245-

40 Estadística Descriptiva Regresión Lineal Lo que necesitamos es definir una función de error y encontrar los parámetros b 0 y b 1 que la minimizan Propuesta: minimizar error cuadrático,

41 Estadística Descriptiva Regresión Lineal Dada la muestra de observaciones buscamos el modelo que minimiza el error promedio

42 Estadística Descriptiva Regresión Lineal Si los paramétros b 0 y b 1 minimizan Se debe verificar

43 Estadística Descriptiva Regresión Lineal Ecuaciones normales: derivando

44 Estadística Descriptiva Regresión Lineal Ecuaciones normales: reordenando y dividiendo por n

45 Estadística Descriptiva Regresión Lineal Despejando b 0 en la primera y reemplazando en la segunda

46 Estadística Descriptiva Regresión Lineal Estimadores de Mínimos Cuadrados del Modelo Lineal para Y en función de X

47 Estadística Descriptiva Regresión Lineal En nuestro ejemplo anterior, variables: X: financiamiento entregado a la autoridad palestina. Y: número de homicidios el año siguiente. Muestra XY 1999075 200050250 2001450500 2002375275 2003190210 2004300240 2005290375 2006610600

48 Estadística Descriptiva Regresión Lineal Calculamos la varianza de la variable predictora y la covarianza entre las variables x e y XY 1999075 -283.125 -240.625 80160 200050250 -233.125 -65.625 54350 2001450500 166.875 184.375 27850 2002375275 91.875 -40.625 8440 2003190210 -93.125 -105.625 8670 2004300240 16.875 -75.625 280 2005290375 6.875 59.375 50 2006610600 326.875 284.375 10685

49 Estadística Descriptiva Regresión Lineal Tenemos entonces que XY 1999075 200050250 2001450500 2002375275 2003190210 2004300240 2005290375 2006610600

50 Estadística Descriptiva Regresión Lineal Predicciones de nuestro modelo XYf(x) 1999075 105.8501 200050250 142.8964 2001450500 439.2672 2002375275 383.6977 2003190210 246.6262 2004300240 328.1281 2005290375 320.7189 2006610600 557.8155

51 Estadística Descriptiva Regresión Lineal Predicciones de nuestro modelo (magenta)

52 Estadística Descriptiva Regresión Lineal ¿Cómo juzgar cuantitativamente qué tan bueno es el modelo?: Análisis de Varianza. variabilidad total de Y variabilidad NO explicada por el modelo variabilidad explicada por el modelo

53 Estadística Descriptiva Regresión Lineal ¿Cómo juzgar cuantitativamente qué tan bueno es el modelo?: Análisis de Varianza. variabilidad explicada por el modelo

54 Estadística Descriptiva Regresión Lineal ¿Cómo juzgar cuantitativamente qué tan bueno es el modelo?: Análisis de Varianza. variabilidad total de Y variabilidad NO explicada por el modelo variabilidad explicada por el modelo

55 Estadística Descriptiva Regresión Lineal Coeficiente de Determinación: Fracción de la variabilidad que sí es explicada por el modelo lineal (% de ajuste) variabilidad explicada por el modelo variabilidad total de Y variabilidad explicada variabilidad explicada + variabilidad NO explicada

56 Estadística Descriptiva Regresión Lineal Coeficiente de Determinación: Fracción de la variabilidad que sí es explicada por el modelo lineal

57 Estadística Descriptiva Regresión Lineal Coeficiente de Determinación: Fracción de la variabilidad que sí es explicada por el modelo lineal

58 Estadística Descriptiva Regresión Lineal Coeficiente de Determinación: Fracción de la variabilidad que sí es explicada por el modelo lineal Coeficiente de correlación de Pearson!!

59 Estadística Descriptiva Regresión Lineal Relación lineal?

60 Estadística Descriptiva Regresión Lineal Idea: Transformaciones. Construir un modelo lineal en una variable independiente auxiliar Ejemplo:

61 Estadística Descriptiva Regresión Lineal Transformaciones

62 Estadística Descriptiva Regresión Lineal Transformaciones

63 Estadística Descriptiva Regresión Lineal Transformaciones

64 Estadística Descriptiva Regresión Lineal Transformaciones


Descargar ppt "Estadística Descriptiva: 4. Correlación y Regresión Lineal Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María."

Presentaciones similares


Anuncios Google