Modelos Lineales CO Práctica 4 Comparación de Modelos Lineales Se desea comparar dos modelos de la forma: (1) y i = 0 + 1 x 1i l x li + i (2) y i = 0 + 1 x 1i l x li + l+1 x (l+1)i k x ki + i Todas las variables explicativas del modelo (1) están contenidas en el modelo (2), es decir, el modelo (1) está anidado en el modelo (2). Comparar estos modelos equivale a contrastar las hipótesis: Ho: l+1 = l+2 =...= k = 0 vs. H 1 : j 0, algún j = l+1,...,k Se rechaza Ho si F > F k-l, n-(k+1) Como caso particular de la comparación de modelos se tiene la prueba de significancia del modelo Ho: 1 = 2 =...= k = 0 vs. H 1 : j 0, algún j =1,...,k La información necesaria para esta prueba está contenida en la Tabla de Análisis de Varianza o Tabla ANOVA.
Modelos Lineales CO Práctica 4 En R, al hacer summary de un modelo, se obtiene el valor de la F correspondiente a la prueba de significancia del modelo. > summary(modelo1) Call: lm(formula = Ozono ~ Rad.S + Temp + Viento, data = ozono) Residuals: Min 1Q Median 3Q Max Coefficients: Value Std. Error t value Pr(>|t|) (Intercept) Rad.S Temp Viento Signif. codes: 0 `***' `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1 Residual standard error: on 37 degrees of freedom Multiple R-Squared: , Adjusted R-squared: F-statistic: 16.7 on 3 and 37 degrees of freedom, p-value: 5.067e-007 Otra opción es determinar el valor en tabla, > qf(0.95,3,37) [1]
Modelos Lineales CO Práctica 4 Por defecto el paquete R compara el modelo que se está ajustando con el modelo más sencillo, es decir, Ozono ~ 0 + 1 Rad.S + 1 Temp + 3 Viento Ozono ~ 0 Para generar la tabla ANOVA para un modelo o para comparar dos modelos anidados, se utiliza el comando anova. Para un modelo particular, > anova(modelo1) Analysis of Variance Table Response: Ozono Terms added sequentially (first to last) Df Sum of Sq Mean Sq F Value Pr(F) Rad.S Temp Viento Residuals
Modelos Lineales CO Práctica 4 >modelo1.1_lm(Ozono~ Temp + Viento + Rad.S ) (alteramos el orden) >anova(modelo1.1) Analysis of Variance Table Response: Ozono Terms added sequentially (first to last) Df Sum of Sq Mean Sq F Value Pr(F) Temp Viento Rad.S Residuals
Modelos Lineales CO Práctica 4 Hemos generado otros modelos con las mismas variables y observamos que las tablas anova no son iguales. El modelo más sencillo sería: >modelo0_lm(Ozono~1) > modelo0 Call: lm(formula = Ozono ~ 1) Coefficients: (Intercept) Degrees of freedom: 41 total; 40 residual Residual standard error: Para comparar modelos anidados se utiliza también el comando anova: >anova(modelo0,modelo1) Analysis of Variance Table Response: Ozono Terms Resid. Df RSS Test Df Sum of Sq F ValuePr(F) Rad.S+Temp+Viento e-007
Modelos Lineales CO Práctica 4 En modelo1 al realizar las pruebas para los coeficientes, las variables Viento y Radiación Solar resultaron no significativas. Dado que el p- valor de la variable Viento es mayor, esa es la variable que debe ser eliminada en primera instancia. (Independencia entre los coeficientes). El nuevo modelo sería: > modelo2<-lm(Ozono~Rad.S+Temp) Para hacer la comparación entre los modelos se utiliza la instrucción anova(modelo más sencillo,modelo más complejo) > anova(modelo2,modelo1) Analysis of Variance Table Model 1: Ozono ~ Rad.S + Temp Model 2: Ozono ~ Rad.S + Temp + Viento Res.Df RSS Df Sum of Sq F Pr(>F) Esta instrucción permite comparar dos modelos anidados a través de una prueba F. En este caso la decisión es de no rechazar la hipótesis nula (modelo más sencillo), es decir, el modelo2. Se analizará la significancia de los coeficientes para este modelo :
Modelos Lineales CO Práctica 4 > summary(modelo2) Call: lm(formula = Ozono ~ Rad.S + Temp) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) Rad.S Temp e-05 *** --- Signif. codes: 0 `***' `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1 Residual standard error: on 38 degrees of freedom Multiple R-Squared: , Adjusted R-squared: F-statistic: on 2 and 38 degrees of freedom, p-value: 2.261e-007 El coeficiente correspondiente a Radiación Solar no es significativo, por lo que debería ser eliminada esa variable. Se considerará el modelo3. > modelo3<-lm(Ozono~Temp)
Modelos Lineales CO Práctica 4 Comparando el modelo 3 con el modelo 2 se obtienen los siguientes resultados: > anova(modelo3,modelo2) Analysis of Variance Table Model 1: Ozono ~ Temp Model 2: Ozono ~ Rad.S + Temp Res. Df RSS Df Sum of Sq F Pr(>F) Signif. codes: 0 `***' `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1 Dado el p-valor de esta prueba, el modelo que no incluye la variable Radiación Solar es el más apropiado (según este criterio). Se analizará la significancia de los coeficientes para este modelo.
Modelos Lineales CO Práctica 4 > summary(modelo3) Call: lm(formula = Ozono ~ Temp) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) * Temp e-07 *** --- Signif. codes: 0 `***' `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1 Residual standard error: on 39 degrees of freedom Multiple R-Squared: , Adjusted R-squared: F-statistic: on 1 and 39 degrees of freedom, p-value: 1.299e-007