Descargar la presentación
La descarga está en progreso. Por favor, espere
Publicada porNacio Alanis Modificado hace 9 años
1
Estadística Descriptiva: 4. Correlación y Regresión Lineal Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María
2
Estadística Descriptiva Objetivo Obtener información desde una muestra, que permita entender o formular hipótesis acerca del fenómeno que se estudia. Tipos de Análisis: Describir cómo se comporta una variable Describir cómo una variable (digamos explicativa) afecta el comportamiento de a otra (digamos dependiente) Describir cómo interaccionan varias variables
3
Estadística Descriptiva Correlación en Análisis Bivariado Correlación: Medida cuantitativa del grado de asociación entre dos variables X e Y continuas Idea: Si X e Y están correlacionadas un cambio en X se corresponde con un cambio en Y y viceversa. Si un incremento en X genera un incremento en Y diremos que las variables están correlacionadas positivamente. En caso contrario diremos que están correlacionadas negativamente.
4
Estadística Descriptiva Correlación en Análisis Bivariado Ejemplo: Columna del New York Times
5
Estadística Descriptiva Correlación en Análisis Bivariado Covarianza: La idea es medir los cambios con respecto al nivel medio de cada variable Claramente generaliza la varianza: cov(x,x) Problema: la medida depende de las magnitudes absolutas de x e y. Una mayor covarianza no significa mayor asociación
6
Estadística Descriptiva Correlación en Análisis Bivariado Coeficiente de Correlación de Pearson: La idea es normalizar la covarianza con una medida de dispersión para X y para Y Medida acotada entre -1 y 1 (probarlo! se sigue de la desigualdad de Cauchy-Schwarz para productos puntos)
7
Estadística Descriptiva Correlación en Análisis Bivariado Observación: Si x e y tienen una relación lineal exacta la correlación de Pearson es igual al signo de a
8
Estadística Descriptiva Correlación en Análisis Bivariado Observación: Si x e y tienen una relación lineal exacta la correlación de Pearson es igual al signo de a
9
Estadística Descriptiva Correlación en Análisis Bivariado Observación: Si x e y tienen una relación lineal exacta la correlación de Pearson es igual al signo de a
10
Estadística Descriptiva Correlación en Análisis Bivariado Correlación positiva (Pearson)
11
Estadística Descriptiva Correlación en Análisis Bivariado Correlación negativa (Pearson)
12
Estadística Descriptiva Correlación en Análisis Bivariado Correlación nula (Pearson)
13
Estadística Descriptiva Correlación en Análisis Bivariado Ejemplo 1: Se tiene la hipótesis de que el número de años de estudio está correlacionado positivamente con el ingreso de las personas. Para corroborarlo se recogió la siguiente muestra:
14
Estadística Descriptiva Correlación en Análisis Bivariado Ejemplo 1: EncuestadoIngresoAños de Educación #11.250.00019 #21.000.00020 #3400.00016 #4350.00016 #5410.00018 #6290.00012 #7350.00014 #8240.00012 #9500.00016 #10600.00017
15
Estadística Descriptiva Correlación en Análisis Bivariado Correlación y Ruido
16
Estadística Descriptiva Correlación en Análisis Bivariado Limitaciones del Coeficiente de Pearson
17
Estadística Descriptiva Correlación en Análisis Bivariado Limitaciones del Coeficiente de Pearson
18
Estadística Descriptiva Correlación en Análisis Bivariado Limitaciones del Coeficiente de Pearson
19
Estadística Descriptiva Correlación en Análisis Bivariado Limitaciones del Coeficiente de Pearson
20
Estadística Descriptiva Correlación en Análisis Bivariado Anscombe's Quartet Caso ICaso IICaso IIICaso IV xyXyxyxy 10.08.0410.09.1410.07.468.06.58 8.06.958.08.148.06.778.05.76 13.07.5813.08.7413.012.748.07.71 9.08.819.08.779.07.118.08.84 11.08.3311.09.2611.07.818.08.47 14.09.9614.08.1014.08.848.07.04 6.07.246.06.136.06.088.05.25 4.04.264.03.104.05.3919.012.50 12.010.8412.09.1312.08.158.05.56 7.04.827.07.267.06.428.07.91 5.05.685.04.745.05.738.06.89
21
Estadística Descriptiva Regresión Modelo de una variable y como función de otra x x se denomina la variable independiente y se denomina la variable dependiente ε es el residuo, la parte que no logra ser explicada por el modelo (f será usualmente una función determinista)
22
Estadística Descriptiva Regresión Modelo de una variable y como función de otra x A partir de una muestra de valores de x e y, queremos encontrar un modelo apropiado. Qué tipo de función f utilizar? Cómo seleccionar un modelo adecuado en base a la muestra de observaciones?
23
Estadística Descriptiva Regresión ¿Qué función f utilizar?: Una función periódica?
24
Estadística Descriptiva Regresión ¿Qué función f utilizar? un polinomio?
25
Estadística Descriptiva Regresión ¿Qué función f utilizar? una exponencial?
26
Estadística Descriptiva Regresión ¿Qué función f utilizar? una logística?
27
Estadística Descriptiva Regresión Graficar la muestra de valores (x,y) y estudiar la forma de la posible relación
28
Estadística Descriptiva Regresión Lineal Una alternativa simple consiste en modelar y como función lineal de x, es decir
29
Estadística Descriptiva Regresión Lineal Una alternativa simple consiste en modelar y como función lineal de x, es decir
30
Estadística Descriptiva Regresión Lineal ¿Qué parámetros b 0 y b 1 son apropiados para modelar la relación entre x e y? Supongamos que hemos conseguido una muestra de n pares de valores x e y:
31
Estadística Descriptiva Regresión Lineal Ejemplo: ¿El financiamiento entregado a la autoridad Palestina contribuye a mitigar el conflicto en la región?
32
Estadística Descriptiva Regresión Lineal Variables: X: financiamiento entregado a la autoridad palestina. Y: número de homicidios el año siguiente. Muestra: Si medimos x e y en los últimos años tenemos: XY 1999075 200050250 2001450500 2002375275 2003190210 2004300240 2005290375 2006610600
33
Estadística Descriptiva Regresión Lineal Graficando X versus Y
34
Estadística Descriptiva Regresión Lineal Graficando X e Y en cada año
35
Estadística Descriptiva Regresión Lineal Variables: X: financiamiento entregado a la autoridad palestina. Y: número de homicidios el año siguiente. Modelo: Postulamos un modelo lineal
36
Estadística Descriptiva Regresión Lineal Ajustar el modelo lineal consiste en buscar parámetros b 0 y b 1 que hagan el modelo adecuado Cada combinación de parámetros genera una predicción para el valor de y asociado a x
37
Estadística Descriptiva Regresión Lineal b 0 = 10 y b 1 = 1 XYf(X)Y-f(X) 1999075 10 65 200050250 60 190 2001450500 460 40 2002375275 385 - 110 2003190210 200 10 2004300240 310 -70 2005290375 300 75 2006610600 620 -20
38
Estadística Descriptiva Regresión Lineal b 0 = 50 y b 1 = 0.5 XYf(X)Y-f(X)Anterior 1999075 50 25 65- 200050250 75 175 190- 2001450500 275 225 40+ 2002375275 237 38 - 110- 2003190210 145 65 10+ 2004300240 200 40 -70- 2005290375 195 85 75+ 2006610600 355 245 -20+
39
Estadística Descriptiva Regresión Lineal b 0 = 50 y b 1 = 0.75 XYf(X)Y-f(X)Anterior 1999075 50 25 - 200050250 87.5 162 175- 2001450500 387.5 112 225- 2002375275 331.25 -56.25 38+ 2003190210 192.5 17.5 65- 2004300240 275 -35 40- 2005290375 267 107.5 85+ 2006610600 507.5 92.5 245-
40
Estadística Descriptiva Regresión Lineal Lo que necesitamos es definir una función de error y encontrar los parámetros b 0 y b 1 que la minimizan Propuesta: minimizar error cuadrático,
41
Estadística Descriptiva Regresión Lineal Dada la muestra de observaciones buscamos el modelo que minimiza el error promedio
42
Estadística Descriptiva Regresión Lineal Si los paramétros b 0 y b 1 minimizan Se debe verificar
43
Estadística Descriptiva Regresión Lineal Ecuaciones normales: derivando
44
Estadística Descriptiva Regresión Lineal Ecuaciones normales: reordenando y dividiendo por n
45
Estadística Descriptiva Regresión Lineal Despejando b 0 en la primera y reemplazando en la segunda
46
Estadística Descriptiva Regresión Lineal Estimadores de Mínimos Cuadrados del Modelo Lineal para Y en función de X
47
Estadística Descriptiva Regresión Lineal En nuestro ejemplo anterior, variables: X: financiamiento entregado a la autoridad palestina. Y: número de homicidios el año siguiente. Muestra XY 1999075 200050250 2001450500 2002375275 2003190210 2004300240 2005290375 2006610600
48
Estadística Descriptiva Regresión Lineal Calculamos la varianza de la variable predictora y la covarianza entre las variables x e y XY 1999075 -283.125 -240.625 80160 200050250 -233.125 -65.625 54350 2001450500 166.875 184.375 27850 2002375275 91.875 -40.625 8440 2003190210 -93.125 -105.625 8670 2004300240 16.875 -75.625 280 2005290375 6.875 59.375 50 2006610600 326.875 284.375 10685
49
Estadística Descriptiva Regresión Lineal Tenemos entonces que XY 1999075 200050250 2001450500 2002375275 2003190210 2004300240 2005290375 2006610600
50
Estadística Descriptiva Regresión Lineal Predicciones de nuestro modelo XYf(x) 1999075 105.8501 200050250 142.8964 2001450500 439.2672 2002375275 383.6977 2003190210 246.6262 2004300240 328.1281 2005290375 320.7189 2006610600 557.8155
51
Estadística Descriptiva Regresión Lineal Predicciones de nuestro modelo (magenta)
52
Estadística Descriptiva Regresión Lineal ¿Cómo juzgar cuantitativamente qué tan bueno es el modelo?: Análisis de Varianza. variabilidad total de Y variabilidad NO explicada por el modelo variabilidad explicada por el modelo
53
Estadística Descriptiva Regresión Lineal ¿Cómo juzgar cuantitativamente qué tan bueno es el modelo?: Análisis de Varianza. variabilidad explicada por el modelo
54
Estadística Descriptiva Regresión Lineal ¿Cómo juzgar cuantitativamente qué tan bueno es el modelo?: Análisis de Varianza. variabilidad total de Y variabilidad NO explicada por el modelo variabilidad explicada por el modelo
55
Estadística Descriptiva Regresión Lineal Coeficiente de Determinación: Fracción de la variabilidad que sí es explicada por el modelo lineal (% de ajuste) variabilidad explicada por el modelo variabilidad total de Y variabilidad explicada variabilidad explicada + variabilidad NO explicada
56
Estadística Descriptiva Regresión Lineal Coeficiente de Determinación: Fracción de la variabilidad que sí es explicada por el modelo lineal
57
Estadística Descriptiva Regresión Lineal Coeficiente de Determinación: Fracción de la variabilidad que sí es explicada por el modelo lineal
58
Estadística Descriptiva Regresión Lineal Coeficiente de Determinación: Fracción de la variabilidad que sí es explicada por el modelo lineal Coeficiente de correlación de Pearson!!
59
Estadística Descriptiva Regresión Lineal Relación lineal?
60
Estadística Descriptiva Regresión Lineal Idea: Transformaciones. Construir un modelo lineal en una variable independiente auxiliar Ejemplo:
61
Estadística Descriptiva Regresión Lineal Transformaciones
62
Estadística Descriptiva Regresión Lineal Transformaciones
63
Estadística Descriptiva Regresión Lineal Transformaciones
64
Estadística Descriptiva Regresión Lineal Transformaciones
Presentaciones similares
© 2024 SlidePlayer.es Inc.
All rights reserved.