Descargar la presentación
La descarga está en progreso. Por favor, espere
1
Regresión lineal simple Nazira Calleja
2
Regresión lineal Propósitos Supuestos Modelo de regresión
Regresión lineal vs correlación Prueba de bondad del ajuste Inferencia para β INTERVALOS DE CONFIANZA PARAβ REGRESIÓN EN SPSS
3
Propósitos de la regresión
Regresión lineal Propósitos de la regresión
4
¿Qué es la regresión? El análisis de regresión: Intenta describir la naturaleza de la asociación mediante la creación de un modelo matemático de "mejor ajuste" .
5
Propósitos de la regresión
El análisis de regresión: 1º Permite examinar el efecto de diferentes variables (VIs / predictoras) sobre una variable de resultados (VD).
6
Propósitos de la regresión
Analiza si una variable predice (explica / impacta) a otra variable.
7
Propósitos de la regresión
VI VD Permite determinar el porcentaje de la varianza de la VD que es explicado por la VI ρ2 Coeficiente de determinación: Porcentaje de variación en Y que es explicado por la variación en X.
8
Propósitos de la regresión
El análisis de regresión: 2º Permite hacer predicciones puntuales del puntaje de una VD (Y) a partir del puntaje de una VI (X).
9
Supuestos de la regresión lineal
10
Supuestos Al utilizar la regresión lineal asumimos que:
Las variables están medidas a nivel cuantitativo. Las variables se asocian de manera lineal.
11
Regresión lineal Modelo de regresión
12
MODELO DE REGRESIÓN LINEAL
Para variables que posiblemente están asociadas (X y Y) asumimos el modelo: Coeficientes que calculamos Y = α + β·X + ε Variables que observamos Parte de Y que X no explica. Es el error aleatorio que define los valores de la vida real.
13
Modelo de regresión lineal
La ecuación Y = α + β • X define la asociación promedio entre X y Y. ε = error (diferencia entre lo observado y lo predicho (x, y) ε β β α Valor predicho para Y por Xi Valor observado para Y por Xi Línea de mejor ajuste
14
Modelo de regresión lineal
Coeficientes de la línea de mejor ajuste Los coeficientes se estiman minimizando los residuales cuadrados. α = β0 = Intercepto β = β1 = Pendiente α indica el punto en el que la línea cruza el eje de las ordenadas (donde X = 0). β es el valor de la pendiente.
15
Encontrar la línea del mejor ajuste
b: estimación de β a: estimación de α
16
Encontrar la línea del mejor ajuste
e: estimación de ε
17
Encontrar la línea del mejor ajuste
Para encontrar la línea que ajuste mejor se evalúa qué tan cercanamente se ajusta cada una de las posibles líneas a los datos observados. Para ello se calculan las distancias verticales de todos los puntos (x,y) a la línea. Estas distancias se llaman “residuales” y corresponden al error, ei .
18
Encontrar la línea del mejor ajuste
La línea de mejor ajuste se define como aquélla en la que la suma de los cuadrados de los residuales es mínima.
19
Regresión lineal vs correlación
20
Regresión lineal vs. Correlación
• La correlación es una medida de la fuerza de la asociación. • La regresión intenta describir la forma de la asociación. El parámetro β (la pendiente) está relacionada con ρ:
21
Regresión lineal ejemplo
22
Ejemplo ¿Cuál es la asociación entre: Consumo de tabaco y
Pérdida de fijación dental?
23
¿Qué es la regresión? Línea de ajuste de la asociación entre el consumo de tabaco (número de cigarros fumados por día) y la pérdida de fijación dental (en mm). N = 28 fumadores. Pérdida media de fijación dental (mm) Número de cigarros fumados por día (autorreporte)
24
Ejemplo: Pérdida de fijación dental y cigarros fumados por día
Consumo de tabaco y pérdida de fijación dental (28 fumadores) Pérdida media de fijación dental (mm) Número de cigarros fumados por día (autorreporte)
25
Ejemplo: Pérdida de fijación dental y cigarros fumados por día
α β Este resultado de SPSS dice que: a = 2.319, b = La línea de mejor ajuste es: Y = × X Nivel promedio de fijación dental Cigarros fumados por día
26
Ejemplo: Pérdida de fijación dental y cigarros fumados por día
Y = × X puede interpretarse como: “Cada cigarro fumado extra por día se asocia con una pérdida adicional de mm de fijación dental." También :“Cada paquete fumado al día (20 cigarros) se asocia con una pérdida de (0.067 × 20) = mm de fijación dental."
27
Las predicciones basadas en regresión
¿Qué nivel de fijación dental tendrá alguien que fuma 30 cigarros al día? La mejor estimación del nivel de pérdida de fijación dental promedio de las personas que fuman 30 cigarrillos / día es: Y = × X Y = (0.067 x 30) = mm
28
Prueba de bondad del ajuste
Regresión lineal Prueba de bondad del ajuste
29
Bondad de ajuste Se considera que el modelo de regresión es una buena explicación de la asociación entre X y Y, es decir, su ajuste a los datos es bueno, cuando el error (ε) es pequeño.
30
Media Cuadrática de Error
Bondad de ajuste Media Cuadrática de Error (MCE o MSE) Es una medida clave del error o de la fuerza de la asociación entre X y Y. Es básicamente la media de los residuales elevados al cuadrado.
31
Bondad de ajuste La MCE se utiliza para estimar el error estándar (ES) de b. Es decir: Se obtienen mejores estimaciones de β cuando la MCE ↓ El ES(b) ↓ en la medida en que la sx ↑ la línea constituye un buen ajuste los puntajes de X están más dispersos
32
Bondad de ajuste El ajuste del modelo se prueba con el estadístico F:
a. Predictor: Número de cigarros fumados por día (autorreporte) b. Variable dependiente: Pérdida de fijación dental (mm) Número de cigarros fumados por día (autorreporte) Pérdida de fijación dental (mm)
33
Regresión lineal Inferencia para β
34
Inferencia para los coeficientes de regresión
Es posible probar H0: β = 0 versus H1: β ≠ 0 utilizando el estadístico t:
35
Ejemplo: Pérdida de fijación dental y cigarros fumados por día
1. Hipótesis de investigación: El número de cigarros fumados por día está relacionado con la fijación dental. 2. Hipótesis estadísticas: H0: β = 0 H1: β ≠ Prueba estadística: Prueba t para la regresión lineal.
36
Ejemplo: Pérdida de fijación dental y cigarros fumados por día
4. Regla de decisión: Puede rechazarse Ho, con p < 0.05 , si |t26 |> Cálculos: t26 = 0.046, p = .046
37
Ejemplo: Pérdida de fijación dental y cigarros fumados por día
6. Resultados Se rechaza Ho. 7. Conclusión: Existe relación entre el número de cigarros fumados diariamente y la fijación dental.
38
INTERVALOS DE CONFIANZA PARA β
Regresión lineal INTERVALOS DE CONFIANZA PARA β
39
Intervalo de confianza para β
Un intervalo de confianza de 1-α para β es: t: valor de t en tablas con n–2: grados de libertad y % de confianza: 1 - α (error tipo 1) / 2 (dos colas) Ej.: Al 95% de confianza: 1 – .95 / 2 = .05/ .025
40
Intervalo de confianza para β
Ejemplo: Cigarros fumados por día y pérdida de fijación dental b = 0.067 ± 0.066 n = 28 ; gl = 26 α = .05/2 colas = .025 t = 2.056 El intervalo de confianza de 95% para β es: SE(b) = 0.032
41
Ejemplo: Pérdida de fijación dental y cigarros fumados por día
Y = × X Con un intervalo de confianza de 95% para β ( ), el valor predicho para la pérdida de fijación dental oscilará entre: Y = × X y Y = × X
42
Regresión lineal REGRESIÓN EN SPSS
43
Regresión en SPSS Generalmente se utiliza un programa de computadora para el cálculo de los coeficientes.
44
Regresión en SPSS
45
Regresión en SPSS Hay tres tablas generales que deben interpretarse en los resultados del análisis de regresión. 1ª Resumen del modelo 2ª ANOVA 3ª Coeficientes
46
a. Predictor: Número de cigarros fumados por día (autorreporte)
Regresión en SPSS 1ª tabla La información que se toma de esta tabla es el R2, que es la proporción de variación en la VD que es explicada por la VI. Se expresa como porcentaje. También se llama coeficiente de determinación. a. Predictor: Número de cigarros fumados por día (autorreporte)
47
Regresión múltiple en SPSS
2ª tabla La tabla prueba el ajuste modelo. Muestra si la proporción de varianza explicada en la primera tabla es significativa. También dice si el efecto total de las VIs sobre la VD es significativa. a. Predictor: Número de cigarros fumados por día (autorreporte) b. Variable dependiente: Pérdida de fijación dental (mm)
48
Regresión múltiple en SPSS
3ª tabla Muestra si el predictor es significativo de (o significativamente relacionado con) la VD.
49
Regresión múltiple en SPSS
3ª tabla Los coeficientes beta estandarizados indican la fuerza y dirección de la relación (se interpretan como coeficientes de r).
Presentaciones similares
© 2024 SlidePlayer.es Inc.
All rights reserved.