Regresión lineal simple Nazira Calleja

Slides:



Advertisements
Presentaciones similares
MSP César Eduardo Luna Gurrola
Advertisements

ANALISIS PARAMÉTRICOS
Tema 6: Regresión lineal.
REGRESION Y CORRELACION
Regresión lineal simple
Regresión mínimo cuadrada (I)
REGRESION LINEAL SIMPLE
Error Estándar de la Media
Ejemplo Grafico.
Estadísticas Inferenciales Capítulo 10
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
MÉTODOS DE MEDICIÓN DE COSTOS.
UNIVERSIDAD AUTÓNOMA DEL CARIBE
Ingeniería Industrial II CicloEducativo 2011
REGRESION Y CORRELACION LINEALES. REGRESION LINEAL SIMPLE Finalidad Estimar los valores de y (variable dependiente) a partir de los valores de x (variable.
Análisis de Regresión Lineal
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
Regresión y correlación
Correlación 1.
Bioestadística Aplicada I
Estadística Descriptiva: 4. Correlación y Regresión Lineal
بسم الله الرحمن الرحيم.
Tema 1- Regresión lineal simple.
Estadística Descriptiva: 4. Correlación y Regresión Lineal Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.
Regresión lineal Es un modelo matemático para predecir el efecto de una variable sobre otra, ambas cuantitativas. Una variable es la dependiente y otra.
Regresión Lineal Simple
9 Regresión Lineal Simple
Regresión Linear Correlación de Pearson, r Regresión Múltiple Regresión Logística Regresión de Poisson.
Regresión y Correlación
Análisis de Correlación y de Regresión lineal simple
Prueba para la Bondad de ajuste Validación de Modelo
15 Análisis de Regresión Múltiple
Módulo 5 Análisis de Regresión y Series de Tiempo.
Pronósticos, Series de Tiempo y Regresión
Pronósticos, Series de Tiempo y Regresión
Modelo de regresión con dos variables: Estimación
Métodos de calibración: regresión y correlación
Titular: Agustín Salvia
Normalidad, Variabilidad y estimación del Modelo de Regresión
Introducción a la Inferencia Estadística
CORRELACION Y REGRESION LINEAL: Introducción
Inferencia Estadística
Concepto Según la estrategia de medidas repetidas, las unidades son observadas a lo largo de una serie reducida de intervalos de tiempo u ocasiones.
RELACIÓN ENTRE VARIABLES
REGRESION LINEAL II Mario Briones L. MV, MSc
Definición del Modelo de Regresión Simple Estimaciones por MCO Método de MCO Valores Esperados y Varianzas por MCO.
ANÁLISIS DE REGRESIÓN SIMPLE
PARA LA REGRESIÓN LINEAL SIMPLE
Análisis de los Datos Cuantitativos
Regresión Lineal Simple
Aplicaciones Estadísticas a las Finanzas Clase 1
CORRELACIÓN Y REGRESIÓN EMPLEANDO EXCEL
Construcción de modelos con regresión y correlación
Ejercicios Dado un conjunto de datos, aplicar el Criterio de Fourier para desechar los posibles valores atípicos.
Unidad 4 Análisis de los Datos.
REGRESIÓN LINEAL MÚLTIPLE.
ANÁLISIS DE LA INFORMACIÓN La relación entre variables.
Modelos de regresión lineal
TEMA : ANALISIS DE REGRESION
Supuestos en el análisis de regresión Miles, J. & Shervin, M. (2011). Applyng regression & correlation. A guide for students and researchers. London: Sage.
Germán Fromm R. 1. Objetivo Entender los diseños metodológicos predictivos 2.
ECONOMETRIA 2. MODELO LINEAL SIMPLE Hernán Delgadillo Dorado
REGRESIÓN LINEAL SIMPLE
REGRESIÓN LINEAL SIMPLE. Temas Introducción Análisis de regresión (Ejemplo aplicado) La ecuación de una recta Modelo estadístico y suposiciones Estimación.
Introducción a la Estadística Inferencial con SPSS Juan José Igartua Perosanz Universidad de Salamanca
REGRESIÓN LINEAL SIMPLE TEMA INTRODUCCIÓN Determinar la ecuación de regresión sirve para: – Describir de manera concisa la relación entre variables.
14 Introducción al Análisis de Correlación y de Regresión Lineal
M.E. ADA PAULINA MORA GONZALEZ. Esta parte describe las técnicas para ajustar curvas en base a datos para estimaciones intermedias. Una manera de hacerlo.
7.2 P ROCEDIMIENTOS PARAMÉTRICOS PARA DATOS CUANTITATIVOS Dos muestras Intervalos de confianza.
Transcripción de la presentación:

Regresión lineal simple Nazira Calleja

Regresión lineal Propósitos Supuestos Modelo de regresión Regresión lineal vs correlación Prueba de bondad del ajuste Inferencia para β INTERVALOS DE CONFIANZA PARAβ REGRESIÓN EN SPSS

Propósitos de la regresión Regresión lineal Propósitos de la regresión

¿Qué es la regresión? El análisis de regresión: Intenta describir la naturaleza de la asociación mediante la creación de un modelo matemático de "mejor ajuste" .

Propósitos de la regresión El análisis de regresión: 1º Permite examinar el efecto de diferentes variables (VIs / predictoras) sobre una variable de resultados (VD).

Propósitos de la regresión Analiza si una variable predice (explica / impacta) a otra variable.

Propósitos de la regresión VI VD Permite determinar el porcentaje de la varianza de la VD que es explicado por la VI ρ2 Coeficiente de determinación: Porcentaje de variación en Y que es explicado por la variación en X.

Propósitos de la regresión El análisis de regresión: 2º Permite hacer predicciones puntuales del puntaje de una VD (Y) a partir del puntaje de una VI (X).

Supuestos de la regresión lineal

Supuestos Al utilizar la regresión lineal asumimos que: Las variables están medidas a nivel cuantitativo. Las variables se asocian de manera lineal.

Regresión lineal Modelo de regresión

MODELO DE REGRESIÓN LINEAL Para variables que posiblemente están asociadas (X y Y) asumimos el modelo: Coeficientes que calculamos Y = α + β·X + ε Variables que observamos Parte de Y que X no explica. Es el error aleatorio que define los valores de la vida real.

Modelo de regresión lineal La ecuación Y = α + β • X define la asociación promedio entre X y Y. ε = error (diferencia entre lo observado y lo predicho (x, y) ε β β α Valor predicho para Y por Xi Valor observado para Y por Xi Línea de mejor ajuste

Modelo de regresión lineal Coeficientes de la línea de mejor ajuste Los coeficientes se estiman minimizando los residuales cuadrados. α = β0 = Intercepto β = β1 = Pendiente α indica el punto en el que la línea cruza el eje de las ordenadas (donde X = 0). β es el valor de la pendiente.

Encontrar la línea del mejor ajuste b: estimación de β a: estimación de α

Encontrar la línea del mejor ajuste e: estimación de ε

Encontrar la línea del mejor ajuste Para encontrar la línea que ajuste mejor se evalúa qué tan cercanamente se ajusta cada una de las posibles líneas a los datos observados. Para ello se calculan las distancias verticales de todos los puntos (x,y) a la línea. Estas distancias se llaman “residuales” y corresponden al error, ei .

Encontrar la línea del mejor ajuste La línea de mejor ajuste se define como aquélla en la que la suma de los cuadrados de los residuales es mínima.

Regresión lineal vs correlación

Regresión lineal vs. Correlación • La correlación es una medida de la fuerza de la asociación. • La regresión intenta describir la forma de la asociación. El parámetro β (la pendiente) está relacionada con ρ:

Regresión lineal ejemplo

Ejemplo ¿Cuál es la asociación entre: Consumo de tabaco y Pérdida de fijación dental?

¿Qué es la regresión? Línea de ajuste de la asociación entre el consumo de tabaco (número de cigarros fumados por día) y la pérdida de fijación dental (en mm). N = 28 fumadores. Pérdida media de fijación dental (mm) Número de cigarros fumados por día (autorreporte)

Ejemplo: Pérdida de fijación dental y cigarros fumados por día Consumo de tabaco y pérdida de fijación dental (28 fumadores) Pérdida media de fijación dental (mm) Número de cigarros fumados por día (autorreporte)

Ejemplo: Pérdida de fijación dental y cigarros fumados por día α β Este resultado de SPSS dice que: a = 2.319, b = 0.067 La línea de mejor ajuste es: Y = 2.319 + 0.067 × X Nivel promedio de fijación dental Cigarros fumados por día

Ejemplo: Pérdida de fijación dental y cigarros fumados por día Y = 2.319 + 0.067 × X puede interpretarse como: “Cada cigarro fumado extra por día se asocia con una pérdida adicional de 0.067 mm de fijación dental." También :“Cada paquete fumado al día (20 cigarros) se asocia con una pérdida de 2.319 +(0.067 × 20) = 3.659 mm de fijación dental."

Las predicciones basadas en regresión ¿Qué nivel de fijación dental tendrá alguien que fuma 30 cigarros al día? La mejor estimación del nivel de pérdida de fijación dental promedio de las personas que fuman 30 cigarrillos / día es: Y = 2.319 + 0.067 × X Y = 2.319 + (0.067 x 30) = 4.329 mm

Prueba de bondad del ajuste Regresión lineal Prueba de bondad del ajuste

Bondad de ajuste Se considera que el modelo de regresión es una buena explicación de la asociación entre X y Y, es decir, su ajuste a los datos es bueno, cuando el error (ε) es pequeño.

Media Cuadrática de Error Bondad de ajuste Media Cuadrática de Error (MCE o MSE) Es una medida clave del error o de la fuerza de la asociación entre X y Y. Es básicamente la media de los residuales elevados al cuadrado.

Bondad de ajuste La MCE se utiliza para estimar el error estándar (ES) de b. Es decir: Se obtienen mejores estimaciones de β cuando la MCE ↓ El ES(b) ↓ en la medida en que la sx ↑ la línea constituye un buen ajuste los puntajes de X están más dispersos

Bondad de ajuste El ajuste del modelo se prueba con el estadístico F: a. Predictor: Número de cigarros fumados por día (autorreporte) b. Variable dependiente: Pérdida de fijación dental (mm) Número de cigarros fumados por día (autorreporte) Pérdida de fijación dental (mm)

Regresión lineal Inferencia para β

Inferencia para los coeficientes de regresión Es posible probar H0: β = 0 versus H1: β ≠ 0 utilizando el estadístico t:

Ejemplo: Pérdida de fijación dental y cigarros fumados por día 1. Hipótesis de investigación: El número de cigarros fumados por día está relacionado con la fijación dental. 2. Hipótesis estadísticas: H0: β = 0 H1: β ≠ 0. 3. Prueba estadística: Prueba t para la regresión lineal.

Ejemplo: Pérdida de fijación dental y cigarros fumados por día 4. Regla de decisión: Puede rechazarse Ho, con p < 0.05 , si |t26 |> 2.056. 5. Cálculos: t26 = 0.046, p = .046

Ejemplo: Pérdida de fijación dental y cigarros fumados por día 6. Resultados Se rechaza Ho. 7. Conclusión: Existe relación entre el número de cigarros fumados diariamente y la fijación dental.

INTERVALOS DE CONFIANZA PARA β Regresión lineal INTERVALOS DE CONFIANZA PARA β

Intervalo de confianza para β Un intervalo de confianza de 1-α para β es: t: valor de t en tablas con n–2: grados de libertad y % de confianza: 1 - α (error tipo 1) / 2 (dos colas) Ej.: Al 95% de confianza: 1 – .95 / 2 = .05/ .025

Intervalo de confianza para β Ejemplo: Cigarros fumados por día y pérdida de fijación dental b = 0.067 0.067 ± 0.066 n = 28 ; gl = 26 α = .05/2 colas = .025 t = 2.056 El intervalo de confianza de 95% para β es: 0.001 - 0.133 SE(b) = 0.032

Ejemplo: Pérdida de fijación dental y cigarros fumados por día Y = 2.319 + 0.067 × X Con un intervalo de confianza de 95% para β (0.001 - 0.133), el valor predicho para la pérdida de fijación dental oscilará entre: Y = 2.319 + 0.001 × X y Y = 2.319 + 0.133 × X

Regresión lineal REGRESIÓN EN SPSS

Regresión en SPSS Generalmente se utiliza un programa de computadora para el cálculo de los coeficientes. 

Regresión en SPSS

Regresión en SPSS Hay tres tablas generales que deben interpretarse en los resultados del análisis de regresión. 1ª Resumen del modelo 2ª ANOVA 3ª Coeficientes

a. Predictor: Número de cigarros fumados por día (autorreporte) Regresión en SPSS 1ª tabla La información que se toma de esta tabla es el R2, que es la proporción de variación en la VD que es explicada por la VI. Se expresa como porcentaje. También se llama coeficiente de determinación. a. Predictor: Número de cigarros fumados por día (autorreporte)

Regresión múltiple en SPSS 2ª tabla La tabla prueba el ajuste modelo. Muestra si la proporción de varianza explicada en la primera tabla es significativa. También dice si el efecto total de las VIs sobre la VD es significativa. a. Predictor: Número de cigarros fumados por día (autorreporte) b. Variable dependiente: Pérdida de fijación dental (mm)

Regresión múltiple en SPSS 3ª tabla Muestra si el predictor es significativo de (o significativamente relacionado con) la VD.

Regresión múltiple en SPSS 3ª tabla Los coeficientes beta estandarizados indican la fuerza y dirección de la relación (se interpretan como coeficientes de r).