REGRESION Y CORRELACION

Slides:



Advertisements
Presentaciones similares
1. MODELO DE REGRESIÓN SIMPLE
Advertisements

Tema 6: Regresión lineal.
Tema.9.Predicción y estimación. Concepto. Cálculo de la ecuación de regresión lineal. Modelo general lineal. Evaluación del modelo. Diagnóstico del modelo.
Tema 3: Estadística descriptiva bivariante y regresión lineal.
CAPÍTULO 2 Elaboración y utilización de gráficas
Tema 3: Estadística descriptiva bivariante y regresión lineal.
Estadística Unidad II Regresión lineal
Error Estándar de la Media
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
Pronósticos, Series de Tiempo y Regresión
Ingeniería Industrial II CicloEducativo 2011
CAPÍTULO 2 Elaboración y utilización de gráficas
REGRESION Y CORRELACION LINEALES. REGRESION LINEAL SIMPLE Finalidad Estimar los valores de y (variable dependiente) a partir de los valores de x (variable.
15. Regresión lineal Este tema, prácticamente íntegro, está calcado de los excelentes apuntes y transparencias de Bioestadística del profesor F.J. Barón.
Introducción a la Estadística. Modelos de regresión
Análisis de Datos en Psicología Análisis de Datos en Psicología * Estadística bivariada Área de Metodología.
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
Econometria 2. Modelo de Regresión Lineal Simple
Estadística 2010 Clase 5 Maestría en Finanzas Universidad del CEMA
Regresión y correlación
Estadística Administrativa II
Estadística Descriptiva: 4. Correlación y Regresión Lineal
Tema 1- Regresión lineal simple.
Estadística Descriptiva: 4. Correlación y Regresión Lineal Ricardo Ñanculef Alegría Universidad Técnica Federico Santa María.
Regresión lineal Es un modelo matemático para predecir el efecto de una variable sobre otra, ambas cuantitativas. Una variable es la dependiente y otra.
Regresión Lineal Simple
1º BACHILLERATO | Matemáticas © Oxford University Press España, S.A Hacer clic en la pantalla para avanzar VARIABLE ESTADÍSTICA UNIDIMENSIONAL Población:
9 Regresión Lineal Simple
División de Estudios Políticos, CIDE
Regresión Linear Correlación de Pearson, r Regresión Múltiple Regresión Logística Regresión de Poisson.
Estadística bidimensional
COMPORTAMIENTO DE LAS DISTRIBUCIONES DE
Análisis de Correlación y de Regresión lineal simple
Facultad: Turismo Y Hotelería
UNIVERSIDAD AUTONOMA DEL PERÚ
Distribuciones bidimensionales. Tablas de contingencia
Tema 3: Estadística descriptiva bivariante y regresión lineal.
Pronósticos, Series de Tiempo y Regresión
Titular: Agustín Salvia
Introducción a la Inferencia Estadística
Estadística bidimensional
LA RECTA DE REGRESIÓN CONTENIDOS:
Primerasdefiniciones y conceptos de la regresión El análisis de la regresión es una técnica estadística que se utiliza para estudiar la relación entre.
Variables estadísticas bidimensionales
RELACIÓN ENTRE VARIABLES
Estadística aplicada a la educación
coeficientes de correlación de
Relaciones entre variables y regresión
SEMINARIO DE INVESTIGACION Titular: Agustín Salvia
Estadística II Regresión Lineal.
Análisis de los Datos Cuantitativos
Regresión Lineal Simple
Variables estadísticas bidimensionales
Correlación Decimos que dos variables, X e Y, están correlacionadas cuando hay una relación cuantitativa entre ellas. X suele ser la variable independiente.
Construcción de modelos con regresión y correlación
Ejercicios Dado un conjunto de datos, aplicar el Criterio de Fourier para desechar los posibles valores atípicos.
Variables estadísticas bidimensionales
Regresión lineal simple Nazira Calleja
Unidad 4 Análisis de los Datos.
ANÁLISIS DE LA INFORMACIÓN La relación entre variables.
Modelos de regresión lineal
TEMA : ANALISIS DE REGRESION
Bioestadística. U. Málaga.Tema 3: Estadística bivariante 1 Bioestadística Tema 3: Estadística descriptiva bivariante y regresión lineal.
UNIDAD IV Regresión y correlación lineal
Tema 2: Estadística bidimensional
REGRESIÓN LINEAL SIMPLE. Temas Introducción Análisis de regresión (Ejemplo aplicado) La ecuación de una recta Modelo estadístico y suposiciones Estimación.
ESTADISTICA DESCRIPTIVA BIVARIADA MEDIDAS DE RELACIÓN ENTRE VARIABLES CUANTITATIVAS.
REGRESIÓN LINEAL SIMPLE TEMA INTRODUCCIÓN Determinar la ecuación de regresión sirve para: – Describir de manera concisa la relación entre variables.
Free and Quick translation of Prof. Anderson's slides1 Analisis de Regresion Multiple y =  0 +  1 x 1 +  2 x  k x k + u 1. Estimacion.
Transcripción de la presentación:

REGRESION Y CORRELACION LINEALES

Relaciones entre variables y regresión El término regresión fue introducido por Galton (1889) refiriéndose a la “ley de la regresión universal”: “Cada peculiaridad en un hombre es compartida por sus descendientes, pero en media, en un grado menor.” Regresión a la media Su trabajo se centraba en la descripción de los rasgos físicos de los descendientes (una variable) a partir de los de sus padres (otra variable). Pearson realizó un estudio con más de 1000 registros de grupos familiares observando una relación del tipo: Altura del hijo = 85cm + 0,5 altura del padre (aprox.) Conclusión: los padres muy altos tienen tendencia a tener hijos que heredan parte de esta altura, aunque tienen tendencia a acercarse (regresar) a la media. Lo mismo puede decirse de los padres muy bajos. Francis Galton Karl Pearson

Regresión Describir la relación entre dos variables numéricas El análisis de regresión sirve para predecir una medida en función de otra medida (o varias). Y = Variable dependiente predicha explicada X = Variable independiente predictora explicativa ¿Es posible descubrir una relación? Y = f(X) + error f es una función de un tipo determinado el error es aleatorio, pequeño, y no depende de X

Diagramas de dispersión , nube de puntos o “Scaterplot” Tenemos las alturas y los pesos de 30 individuos representados en un diagrama de dispersión. Variable dependiente y (peso) Pesa 76 kg. Pesa 50 kg. Mide 187 cm. Mide 161 cm. Variable independiente x (altura)

REGRESION LINEAL SIMPLE Finalidad Modelo Estimar los valores de y (variable dependiente) a partir de los valores de x (variable independiente) y e y b =tg q coeficiente de regresión (pendiente) q a Ordenada en el origen (intercepto) x x

Relación directa e inversa No hay relacion 30 80 130 180 230 280 330 140 150 160 170 190 200 Para valores de X por encima de la media tenemos valores de Y por encima y por debajo en proporciones similares. Para los valores de X mayores que la media le corresponden valores de Y mayores también. Para los valores de X menores que la media le corresponden valores de Y menores también. : relación directa. Para los valores de X mayores que la media le corresponden valores de Y menores. Esto es relación inversa o decreciente.

Es una medida de la variación lineal conjunta de dos variables COVARIANZA Es una medida de la variación lineal conjunta de dos variables + centroide Estimación de  xy + Es un estimador sesgado bnmmn  xy < 0 asociación lineal con pendiente negativa  xy = 0 ausencia de asociación lineal  xy > 0 asociación lineal con pendiente positiva

Coef. de correlación lineal de Pearson El signo de la covarianza nos dice si el aspecto de la nube de puntos es creciente o no, pero no nos dice nada sobre el grado de relación entre las variables. Coef. de correlación lineal de Pearson r Valor en la muestra r (Rho ) en la poblaciòn El coeficiente de correlación lineal de Pearson de dos variables, r, indica si los puntos tienen una tendencia a disponerse alineadamente (excluyendo rectas horizontales y verticales).

Proporción de varianza compartida por las dos variables CORRELACION LINEAL Finalidad Medir la intensidad de la asociación lineal entre dos variables aleatorias coeficiente de correlación covarianza poblacional coeficiente de determinación  2 r 2 Proporción de varianza compartida por las dos variables

Propiedades de r Es adimensional Sólo toma valores entre -1y +1 Las variables NO estàn correlacionadas  r=0 Relación lineal perfecta entre dos variables  r = +1 o r=-1 Excluimos los casos de puntos alineados horiz. o verticalmente. Cuanto más cerca esté r de +1 o -1 mejor será el grado de relación lineal. Siempre que no existan observaciones anómalas. Relación inversa perfecta Relación directa casi perfecta Variables NO correlacionadas -1 +1

r = - 1 -1  r  0 r = + 1 0  r  +1 Correlación negativa Correlación positiva r = + 1 0  r  +1

r = 0 Ausencia de correlación

Animación: Evolución de r y diagrama de dispersión

Testar la Ho: r = 0 equivale a ensayar la Ho:b = 0 ESTIMACION DE  (rho) PRUEBA DE Se compara con el valor critico (t tabulado) CONSIDERACIONES PARA LA VALIDEZ DEL TEST Los residuos ( e ) deben ser : Normales Homocedasticos Independientes Testar la Ho: r = 0 equivale a ensayar la Ho:b = 0

Animación: Residuos del modelo de regresión

ESTADISTICOS USUALES Varianza residual (insesgada) Error tipico de estimación de y Error tipico de estimación de b Coeficiente de Determinación R2

¿Cómo medir la bondad de una regresión? Imaginemos un diagrama de dispersión, y vamos a tratar de comprender en primer lugar qué es el error residual, su relación con la varianza de Y, y de ahí, cómo medir la bondad de un ajuste.

Interpretación de la variabilidad en Y En primer lugar olvidemos que existe la variable X. Veamos cuál es la variabilidad en el eje Y. Y La franja sombreada indica la zona donde varían los valores de Y. Proyección sobre el eje Y = olvidar X

Interpretación del residuo ( ) Fijémonos ahora en los errores de predicción (líneas verticales). Los proyectamos sobre el eje Y. Y Se observa que los errores de predicción, residuos, están menos dispersos que la variable Y original. Cuanto menos dispersos sean los residuos, mejor será la bondad del ajuste.

Bondad de un ajuste Resumiendo:  La dispersión del error residual será una fracción de la dispersión original de Y  Cuanto menor sea la dispersión del error residual mejor será el ajuste de regresión. Y Eso hace que definamos como medida de bondad de un ajuste de regresión, o coeficiente de determinación a:

Consecuencia sobre las estimaciones de y faja de confianza para y faja de confianza para x A medida que los valores se alejan del centroide ( , ) las estimaciones de y son más imprecisas

P Q Buen ajuste a la recta en el intervalo PQ NO implica que la relación sea lineal fuera del mismo

y x La recta de regresión de y sobre x no es la misma que la de x sobre y , salvo que todos los puntos estén sobre la recta

Precauciones en la interpretación de r r significativo NO implica relación de causalidad entre las variables t x y r = 0 NO implica ausencia de asociación entre las variables y y r = 0 r = 0 x x

x variable independiente fija Los problemas de regresión y de correlación lineales se parecen pero difieren En la finalidad En las variables REGRESION CORRELACION x variable independiente fija NO hay distinción entre variable dependiente e independiente y variable dependiente aleatoria x e y son variables aleatorias

Cálculos en correlación y regresión Entrar x  Hallar y  Borrar la memoria estadística Entrar y  Hallar y  Borrar la memoria estadística Entrar los productos (x y)  Hallar Calcular: Testar: