La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

REGRESÍON LINEAL SIMPLE

Presentaciones similares


Presentación del tema: "REGRESÍON LINEAL SIMPLE"— Transcripción de la presentación:

1 REGRESÍON LINEAL SIMPLE
El objeto de un análisis de regresión es investigar la relación estadística que existe entre una variable dependiente (Y) y una o más variables independientes (X1,X2, ...,Xn), cuando solo estudiamos la relación con una variable independiente se establece una relación lineal simple.

2 El análisis de regresión involucra el estudio la relación entre dos variables CUANTITATIVAS
Investigar si existe una asociación entre las dos variables testeando la hipótesis de independencia estadística. Estudiar la fuerza de la asociación, a través de una medida de asociación denominada coeficiente de correlación. Estudiar la forma de la relación. Usando los datos propondremos un modelo para la relación y a partir de ella será posible predecir el valor de una variable a partir de la otra.

3 MODELO Para ello proponemos un MODELO que relaciona una variable dependiente (Y) con una variable independiente (X). La decisión sobre qué análisis usar en una situación particular, depende de la naturaleza del OUTCOME y del tipo de función que se propone para relacionar el outcome y la variable independiente.

4 VARIABLES DE REGRESIÓN
Variables en regresión Covariables o Variables independientes o Variables regresoras Outcome o Variable dependiente o Variable de respuesta Se usan como predictores o son variables de confusión que interesa controlar Atributos sobre los cuales queremos medir cambios o hacer predicciones

5 MODELOS Llamaremos MODELO MATEMÁTICO a la función matemática que proponemos como forma de relación entre la variable dependiente (Y) y la o las variables independientes. La función más simple para la relación entre dos variables es la FUNCIÓN LINEAL: Y = a + b X Esta expresión es una aproximación de la verdadera relación entre X e Y. Para un dado valor de X el modelo predice un cierto valor para Y. Mientras mejor sea la predicción, mejor es el modelo para explicar el fenómeno.

6 Interpretación de los coeficientes:
el coeficiente b es la PENDIENTE de la recta, mide el cambio en Y por cada unidad de cambio en X, en el ejemplo la pendiente es 2. El coeficiente a es la ORDENADA AL ORIGEN, el punto donde la recta intercepta el eje Y, es decir el valor de Y cuando X = 0.

7 MODELOS Consideremos el modelo Y = aX + b
♦ Este modelo es una aproximación de la verdadera relación entre X e Y. ♦ Para un dado valor de X el modelo predice un cierto valor para Y. ♦ Mientras mejor sea la predicción, mejor es el modelo.

8 MODELOS Un MODELO DETERMINÍSTICO supone que bajo condiciones ideales, el comportamiento de la variable dependiente puede ser totalmente descripto por una función matemática de las variables independientes Es decir, en condiciones ideales e modelo permite predecir SIN ERROR el valor de la variable dependiente. ♦ Ejemplo: Ley de la Gravedad. Podemos predecir exactamente la posición de un objeto que cae en caída libre y en el vacío para cada instante de tiempo. Un MODELO ESTADÍSTICO permite la incorporación de un COMPONENTE ALEATORIO en la relación. En consecuencia, las predicciones obtenidas A través de modelos estadísticos tendrán asociado un error de predicción. ♦ Ejemplo: Relación de la altura con la edad en niños.

9 Regresión lineal simple
A través de esta muestra, se desea estudiar la relación existente entre las dos variables X e Y. Es posible representar estas observaciones mediante un gráfico llamado: diagrama de dispersión

10 Diagrama de dispersión

11 Regresión lineal simple
Se conoce como regresión lineal, correlación de Pearson o método de mínimos cuadrados, al procedimiento de encontrar la ecuación de la recta "que mejor se ajuste a un conjunto de puntos". El método de mínimos cuadrados nos permite encontrar el grado de correlación lineal entre un conjunto de pares de valores numéricos.

12 REGRESION LINEAL Se debe postular una relación funcional entre las variables. Debido a su simplicidad analítica, la forma funcional que más se utiliza en la práctica es la relación lineal.  Cuando solo existe una variable independiente, esto se reduce a una línea recta.

13 REGRESION LINEAL SIMPLE
Para poder crear un modelo de regresión lineal, es necesario que se cumpla con los siguientes supuestos: La relación entre las variables es lineal. Los errores en la medición de las variables explicativas son independientes entre sí. Los errores tienen varianza constante.

14 MODELO ECUACION PARA UNA LINEA RECTA Y = β0 + β1x +ε
Y = variable dependiente X= variables independiente β0= ordenada al origen β1= pendiente de la recta ε = termino del error (COMPONENTE ALEATORIO)

15 MODELO Tanto β0 como β1 son constantes numéricas y se denominan parámetros. Para estimar β0 y β1 se utiliza el método de Mínimos cuadrados, que consiste en encontrar aquellos valores de β0 y de β1 que hagan mínima la suma de los cuadrados de las desviaciones de las observaciones respecto de la recta que representa el modelo, en el sentido vertical.

16 REGRESION LINEAL SIMPLE

17 REGRESION LINEAL SIMPLE
En la figura, son los cuadrados de los segmentos verticales cuya suma de cuadrados se debe minimizar, para determinar β0 y β1 . Estos segmentos representan los errores “e” del modelo. β1 se llama pendiente de la recta y β0 se llama intercepto sobre el eje vertical.

18 REGRESION LINEAL SIMPLE

19 Pendiente de la recta

20 La desviación típica residual
La recta de regresión es una recta de medias por eso es necesario complementarla con una medida de variabilidad de los puntos observados en relación a la recta. La desviación entre cada observación de la variable dependiente y la recta es lo que hemos llamado el error de predicción o residuo. Ɛ = valor observado – valor de la recta

21 DESVIACIÓN TIPICA RESIDUAL
MIDE LA CONFIABILIDAD DE LA RECTA DE REGRESION. MIDE LA DISPERSION DE LOS VALORES OBSERVADOS ALREDEDOR DE LA RECTA DE ESTIMACION.

22 Modelo de regresión lineal simple

23 Correlación vs. regresión
En la correlación ambas variables se tratan simétricamente mientras que en la regresión no. Si cambiamos las categorías de las variables obtenemos una recta diferente. x = a +by ≠ y= a + bx

24 Coeficiente de determinación R2
Una vez ajustada la recta de regresión a la nube de observaciones es importante disponer de una medida que mida la bondad del ajuste realizado y que permita decidir si el ajuste lineal es suficiente o se deben buscar modelos alternativos. Como medida de bondad del ajuste se utiliza el coeficiente de determinación. donde 0 < R2 < 1.

25 Coeficiente de determinación R2
Es el cuadrado del coeficiente de correlación de Pearson, y da la proporción de variación de la variable Y que es explicada por la variable X (variable predictora o explicativa). Si la proporción es igual a 0, significa que la variable predictora no tiene NULA capacidad predictiva de la variable a predecir (Y). Cuanto mayor sea la proporción, mejor será la predicción. Si llegara a ser igual a 1 la variable predictora explicaría TODA la variación de Y, y las predicciones NO tendrían error.


Descargar ppt "REGRESÍON LINEAL SIMPLE"

Presentaciones similares


Anuncios Google