La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

REGRESIÓN LINEAL SIMPLE TEMA 1 1. 1. INTRODUCCIÓN Determinar la ecuación de regresión sirve para: – Describir de manera concisa la relación entre variables.

Presentaciones similares


Presentación del tema: "REGRESIÓN LINEAL SIMPLE TEMA 1 1. 1. INTRODUCCIÓN Determinar la ecuación de regresión sirve para: – Describir de manera concisa la relación entre variables."— Transcripción de la presentación:

1 REGRESIÓN LINEAL SIMPLE TEMA 1 1

2 1. INTRODUCCIÓN Determinar la ecuación de regresión sirve para: – Describir de manera concisa la relación entre variables. – Predecir los valores de una variable en función de la otra. Veremos EXCLUSIVAMENTE relaciones lineales. La regresión lineal simple estudia la relación entre sólo dos variables (el caso de relación más sencillo posible). 2

3 1. INTRODUCCIÓN 3 DENOMINACIÓN DE LAS VARIABLES XY predictora, regresorcriterio explicativaexplicada predeterminadarespuesta independientedependiente exógenaendógena (explica la variabilidad de otra variable)(su variabilidad es explicada por otra variable)

4 2. INTERPRETACIÓN DEL DIAGRAMA DE DISPERSIÓN A grandes rasgos, como paso previo, el diagrama de dispersión permite vislumbrar si: – Existe relación entre variables. – La relación es lineal o de otro tipo. – Intensidad de la relación (por la estrechez de la nube de puntos). – Valores anómalos (outliers) distorsionan la relación. – La dispersión de los datos es o no uniforme (homocedasticidad vs. heterocedasticidad). 4

5 3. ESPECIFICACIÓN DEL MODELO DE REGRESIÓN LINEAL SIMPLE 5 x Y

6 6 : – Puede denominarse: Error Perturbación Residual – Se debe fundamentalmente a: Medición incorrecta de la variable. Influencia de otras variables no incluidas en el modelo. Variabilidad inherente a la conducta humana.

7 3.ESPECIFICACIÓN DEL MODELO DE REGRESIÓN LINEAL SIMPLE 7

8 3.1. Supuestos del modelo Características estadísticas: – Linealidad. – Homocedasticidad: las varianzas de Y para cada valor de X son todas iguales. – Ausencia de autocorrelación: las variables Y son independientes entre sí (problema en estudios longitudinales). – Normalidad. 8

9 3.1. Supuestos del modelo Características como modelo descriptivo: – El modelo ha de estar correctamente especificado: No se excluyen variables independientes relevantes. No se incluyen variables independientes irrelevantes. – La variable independiente ha de haber sido medida sin error. 9

10 4. ESTIMACIÓN DE PARÁMETROS α y β. Mediante mínimos cuadrados. En puntuaciones directas: 10

11 4. ESTIMACIÓN DE PARÁMETROS En puntuaciones diferenciales o centradas: El valor de la b coincide con su valor en la ecuación de regresión en puntuaciones directas. En puntuaciones estandarizadas: 11

12 4. ESTIMACIÓN DE PARÁMETROS: EJEMPLO Con los datos del ejemplo anterior, calcular la ecuación de regresión en puntuaciones directas, centradas y estandarizadas. 12

13 4. ESTIMACIÓN DE PARÁMETROS: EJEMPLO 13 Ecuación de regresión en puntuaciones directas:

14 4. ESTIMACIÓN DE PARÁMETROS: EJEMPLO 14 Ecuación de regresión en puntuaciones centradas: Ecuación de regresión en puntuaciones estandarizadas:

15 5. INTERPRETACIÓN DEL MODELO DE REGRESIÓN En el modelo de regresión lineal distinguimos los siguientes elementos: e  error de estimación o puntuaciones residuales: parte aleatoria; aquello no explicado por el modelo. 15

16 5. INTERPRETACIÓN DEL MODELO DE REGRESIÓN  puntuación estimada: valor promedio previsto para todos los sujetos que han obtenido en la variable X un valor de X i. b  pendiente de la recta: cambio en Y por cada unidad de cambio en X. a  ordenada en el origen: valor medio de Y cuando X=0. 16

17 5. INTERPRETACIÓN DEL MODELO DE REGRESIÓN: EJEMPLO Supongamos que tenemos la ecuación de regresión: Donde X es el número de años de experiencia profesional, e Y es el sueldo mensual. 1. Interpreta a y b. 2. Una persona con 3 años de experiencia laboral, ¿qué sueldo mensual tendrá? Interpreta el resultado. 3. Si una persona con 3 años de experiencia laboral tiene un sueldo mensual de 1700 €, ¿cuál será su error asociado? Interpreta el resultado. 17

18 5. INTERPRETACIÓN DEL MODELO DE REGRESIÓN: EJEMPLO 1.Interpreta a y b. b=300  cambio en Y por cada unidad de cambio en X. Por cada año de experiencia laboral, el sueldo mensual aumenta 300 €. a=600  valor medio de Y cuando X=0. Sueldo medio de aquellas personas sin experiencia laboral. 18

19 5. INTERPRETACIÓN DEL MODELO DE REGRESIÓN: EJEMPLO 2. Una persona con 3 años de experiencia laboral, ¿qué sueldo mensual tendrá? Interpreta el resultado.  valor promedio previsto para todos los sujetos que han obtenido en la variable X un valor de X i. Las personas con 3 años de experiencia tienen un sueldo promedio de 1500 € 19

20 5. INTERPRETACIÓN DEL MODELO DE REGRESIÓN: EJEMPLO 3. Si una persona con 3 años de experiencia laboral tiene un sueldo mensual de 1700 €, ¿cuál será su error asociado? Interpreta el resultado. El modelo estimó un sueldo de 1500 € para una persona con 3 años de experiencia laboral. Si esta persona concreta tiene un sueldo de 1700 €, esta diferencia de 200 € es el error; aquello que el modelo no explica. 20

21 6. COMPONENTES DE VARIACIÓN 21

22 6. COMPONENTES DE VARIACIÓN Suma de cuadrados total = suma de cuadrados explicada + suma de cuadrados no explicada Variación total = variación explicada + variación no explicada 22

23 6. COMPONENTES DE VARIACIÓN: EJEMPLO Determinar los componentes de variación de los datos del primer ejemplo. 23

24 6. COMPONENTES DE VARIACIÓN: EJEMPLO Cálculo de la suma de cuadrados total: 24

25 6. COMPONENTES DE VARIACIÓN: EJEMPLO Cálculo de la suma de cuadrados explicada: 25

26 6. COMPONENTES DE VARIACIÓN: EJEMPLO Cálculo de la suma de cuadrados no explicada: 26

27 6. COMPONENTES DE VARIACIÓN: EJEMPLO Comprobación: SCtotal = SCexplicada+SCresidual 27

28 7. BONDAD DE AJUSTE 28 - Coincide con el coeficiente de determinación. -La proporción de variabilidad no explicada = 1-R 2

29 7. BONDAD DE AJUSTE 29

30 7. BONDAD DE AJUSTE: EJEMPLO Calcular la bondad de ajuste (con las tres fórmulas propuestas) y la proporción de variabilidad no explicada. 30

31 7. BONDAD DE AJUSTE: EJEMPLO 31

32 8. VALIDACIÓN DEL MODELO Fuentes de variación Sumas de cuadrados glVarianzaF Regresión o explicada k Residual o no explicada N-k-1 TotalN-1 32

33 8. VALIDACIÓN DEL MODELO –  Se rechaza la Hipótesis nula. Las variables están relacionadas. El modelo es válido. –  Se acepta la Hipótesis nula. Las variables no están relacionadas. El modelo no es válido. (k = número de variables independientes) 33

34 8. VALIDACIÓN DEL MODELO Otras posibles fórmulas de F: – Con puntuaciones directas: 34

35 8. VALIDACIÓN DEL MODELO En términos de varianza: En términos de R 2 : 35

36 8. VALIDACIÓN DEL MODELO: EJEMPLO Con los datos anteriores, calcula la F (usando las 4 fórmulas propuestas) y concluye sobre la validez del modelo. 36

37 8. VALIDACIÓN DEL MODELO Fuentes de variación Sumas de cuadrados glVarianzaF Regresión o explicada 183,1581 19,025 19 Residual o no explicada 77,01889,627 Total (aprox.) 260,176928,908 37

38 8. VALIDACIÓN DEL MODELO: EJEMPLO 38  Conclusión: Se rechaza la Hipótesis nula. Las variables X e Y están relacionadas. El modelo es válido.

39 8. VALIDACIÓN DEL MODELO: EJEMPLO 39 Otras fórmulas:

40 8. VALIDACIÓN DEL MODELO: EJEMPLO 40

41 9. SIGNIFICACIÓN DE LOS PARÁMETROS DE LA REGRESIÓN Estudio de b (en relación con la variable independiente). En regresión lineal simple, prueba de significación equivalente a F y a la significación de r XY Más interesante en regresión lineal múltiple, donde la F global podría ser significativa y algún parámetro de la ecuación no. 41

42 9. SIGNIFICACIÓN DE LOS PARÁMETROS DE LA REGRESIÓN 42 Hipótesis: H 0 : β = 0H 1 : β = 0

43 9. SIGNIFICACIÓN DE LOS PARÁMETROS DE LA REGRESIÓN 43

44 9. SIGNIFICACIÓN DE LOS PARÁMETROS DE LA REGRESIÓN –  Se rechaza la Hipótesis nula. El modelo es válido. La pendiente es estadísticamente distinta de 0. Existe, por tanto, relación entre las variables. –  Se acepta la Hipótesis nula. El modelo no es válido. La pendiente es estadísticamente igual a 0. No existe, por tanto, relación entre las variables. 44

45 9. SIGNIFICACIÓN DE LOS PARÁMETROS DE LA REGRESIÓN: EJEMPLO Con los datos anteriores, determinar la significación del parámetro b. 45

46 9. SIGNIFICACIÓN DE LOS PARÁMETROS DE LA REGRESIÓN: EJEMPLO 46 Conclusión: se rechaza la hipótesis nula. El modelo es válido. La pendiente es estadísticamente distinta de 0. Existe, por tanto, relación entre las variables.

47 10. PREDICCIÓN Un valor concreto: ¿Qué valor de Y obtendrá una persona con X = 4? 47

48 10. PREDICCIÓN Dando un intervalo: 48

49 10. PREDICCIÓN: EJEMPLO ¿En qué intervalo se encontrará la puntuación en Y de la persona que obtuvo X = 4? 49

50 10. PREDICCIÓN: EJEMPLO 50

51 10. PREDICCIÓN: EJEMPLO Conclusión: existe una probabilidad de 0,95 de que una persona que tenga un valor de X = 4, obtenga una puntuación en Y entre -2,808 y 13,178. 51

52 10. PREDICCIÓN: LIMITACIÓN No extrapolar los valores más allá de los datos de observación. ¿Y si fuera una relación cuadrática? 52


Descargar ppt "REGRESIÓN LINEAL SIMPLE TEMA 1 1. 1. INTRODUCCIÓN Determinar la ecuación de regresión sirve para: – Describir de manera concisa la relación entre variables."

Presentaciones similares


Anuncios Google