CASO 1: REGRESION LINEAL SIMPLE El ejemplo más simple de una aproximación por mínimos cuadrados es el ajuste de una línea recta a un conjunto de parejas de datos observadas: (X1,Y1) , (X2,Y2) , (X3,Y3) , . . . , (Xn,Yn) El procedimiento es el siguiente: Dados este conjunto de valores, en donde solo hay una variable independiente X Y 1 0,5 2 2,5 3 2,0 4 4,0 5 3,5 6 6,0 7 5,5 Para estimar los coeficientes (DE LA RECTA) por medio de mínimos cuadrados, se utilizan las siguientes fórmulas: Universidad del Cauca
CASO 1: REGRESION LINEAL SIMPLE Por lo tanto, el ajuste con mínimos cuadrados es (la ecuación de la recta): y = 0.07142857143 + 0.8392857143x Universidad del Cauca
CASO 1: REGRESION LINEAL SIMPLE Cuantificación del error en la regresión lineal Lo primero que debemos hacer es calcular la Desviación Estándar Total St n - 1 Sy = Donde St es la suma total de los cuadrados de las restas entre cada uno de los puntos y la media, esto es: St = (yi – y) 2 22.714285714 7 - 1 Sy = = 1.94569121 Universidad del Cauca
CASO 1: REGRESION LINEAL SIMPLE Y el error estándar de la aproximación es : Sy/x = Sr n - 2 (yi – bo – (b1*Xi)) 2 Donde Sr = B0 B1 y = 0.0714285714 + 0.8392857143x 2.991071429 7 - 2 Sy/x = = 0.773443137 Como Sy/x < Sy la aproximación se considera aceptable Universidad del Cauca
CASO 1: REGRESION LINEAL SIMPLE Finalmente: St suma total de los cuadrados de las restas entre cada uno de los puntos y la media Sr suma de los cuadrados de las restas alrededor de la línea de regresión La diferencia entre esas 2 cantidades, o St – Sr, cuantifica la mejora en la reducción del error debido al modelo de la línea recta. Esta diferencia se puede normalizar al error total y obtener: St - Sr St r = 2 En donde r es el coeficiente de correlación y r = 2 es el coeficiente de determinación r 2 Para un ajuste perfecto, Sr = 0 y = 1, indicando que la línea recta explica el 100% de la variabilidad. Si = 0, entonces el ajuste no representa mejorías. Para el ejemplo que venimos tratando: 22.714285714 - 2.991071429 22.714285714 r 2 = = 0.86831761 r = 0.931835613 El resultado indica que el 86.83% de la incertidumbre original se ha explicado mediante el modelo lineal. Universidad del Cauca