Análisis de Regresión
Introducción Importancia Principal Aplicación: Determinación relación Y = F(X 1, X 2,... X n )
Tipos de Regresión Regresión lineal Lineal simple Y = + ßX Lineal múltiple Y = + ß 1 X 1 + ß 2 X ß n X n Regresión no lineal Y = B X
Regresión lineal simple Y = + ßX Y = variable dependiente X = variable independiente = intercepto ß = coeficiente angular
Ecuación de la recta de acuerdo al signo de los coeficientes x y y ß = + y x , ß = + y x , ß = -
Método de mínimos cuadrados Media en movimiento Y i = M r + E i Y i = cada observación de Y; M r = media en movimiento; E i = desvíos de Y en relación a M r. Y = + ßX M r = + ßX
Sistema de ecuaciones normales Y i = M r + E i E i = Y i - M r E i = (Y i - M r ) = 0 E i 2 = (Y i - M r ) 2 = mínimo E i 2 = (Y i - - ßX i ) 2 = mínimo
Derivadas parciales E i 2 = (Y i - - ßX i ) 2 = mínimo S= E i 2 = (Y i Y i + + 2 ßX i + ß 2 X i 2 – 2 Y i ßX i ) = mín ds/d = (2 ßX i - 2 Y i ) = 0 ds/dß = (2 ß X i X i - 2 Y i X i ) = 0 Multiplicando por -1 y dividiendo por 2. (Y i - - ßX i ) = 0 Y i = N ß X i (Y i X i - X i - ß X i 2 ) = 0 Y i X i = X i + ß X i 2
Resolución matricial de los coeficientes Y = ß 1 X 1 ( Y) = ß 1 ( X 1 ) ( X 1 Y) = ( X 1 ) + ß 1 ( X1 2 ) Y X 1 X 1 Y X 1 X 1 2 ß 1 X 1 Y X 1 Y X 1 X 1 2 ; 1 X 1 Y X 1 2 ; 2 X 1 X 1 Y = N. X X 1. X 1 ; 1 = Y. X X 1 Y. X 1 ; 2 = . X 1 Y - X 1. Y
Eficiencia de la regresión lineal simple yi yie xi yi - y y yi – y = desvío total ; yie – y = desvío del valor ajustado respecto a la media; yi – yie = desvío del valor observado sobre el ajustado. yi – yie yie – y (yi – y) = (yie – y) + (yi – yie) X Y
SCT SCR SCE ANALISIS DE LA VARIANZA FuenteG.L.S.C.C.M.F Totaln-1SCT Regresió n p-1SCRSCR p CMR CME Error(n-p)SCESCE (n-p)
Intervalo de confianza Estimador = factor de confiabilidad. Error estándar - Intervalo de confianza para ß 1 (estimador b) - Intervalo de para valores de yi
Representación de los limites de confianza yx
Ejemplo de regresión lineal simple utilizando el paquete estadístico SAS DATA R; TITLE "REGRESION DE HT VS DAP EN P. elliottii"; INPUT DAP HT; CARDS; PROC REG; MODEL HT=DAP; OUTPUT OUT=B R=HTRESID; PROC PLOT DATA=B; PLOT DAP*HT; PLOT HTRESID*DAP/ VREF=0; RUN;
Model: MODEL1 Dependent Variable: HT Analysis of Variance Sum of Mean Source DF Squares Square F Value Prob>F Model Error Total Root MSE R-square Dep Mean Adj R-sq C.V
Parameter Estimates Parameter Standard for H0: Variable DF Estimate Error Parameter=0 Prob > |T| INTERCEP DAP
Plot of HT*DAP. Legend: A = 1 obs, B = 2 obs, etc. HT | 30 + | A | B 20 + A A A A | B A A | A 10 + B A | 0 + | DAP
Plot of HTRESID*DAP. Legend: A = 1 obs, B = 2 obs, etc. | 2 + A R | A e | A s | B i | A A d u | A A a | A A l | A B | A
CONSIDERACIONES FINALES
ANEXO 1 Ejemplo de modelaje Forward Entrada de datos data r; input dap ht vol; dap3= dap/100; dap1= dap**2; ht1= ht**2; cards; ……………………. proc stepwise; model vol= dap1 ht1/f; run;
Forward Selection Procedure for Dependent Variable VOL Step 1 Variable DAP1 Entered R-square = C(p) = 3.23 DF Sum of Squares Mean Square F Prob>F Regres Error Total Parameter Standard Type II Variable Estimate Error Sum of Squares F Prob>F INTERCEP DAP Bounds on condition number: 1, 1
Step 2 Variable HT1 Entered R-square = c(p) = 3.00 DF SSquar Mean Square F Prob>F Regression Error Total Parameter Standard Type II Variable Estimate Error Sum of Squares F Prob>F INTERCEP DAP HT