La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

CO 3321/22 Modelos Lineales Práctica 3 Consideraremos modelos de la forma: Observación=señal + ruido Estos modelos pueden escribirse en la forma: Y=X 

Presentaciones similares


Presentación del tema: "CO 3321/22 Modelos Lineales Práctica 3 Consideraremos modelos de la forma: Observación=señal + ruido Estos modelos pueden escribirse en la forma: Y=X "— Transcripción de la presentación:

1 CO 3321/22 Modelos Lineales Práctica 3 Consideraremos modelos de la forma: Observación=señal + ruido Estos modelos pueden escribirse en la forma: Y=X  +  Hipótesis básicas sobre los errores: 1.- Los errores tienen media 0: E[  i] = 0 2.- La varianza de los errores es constante, Var[  i] =  2. 3.- Los errores son independientes entre sí. Un modelo lineal de la forma y i =  0 +  1 x 1i +...+  k x ki +  i se denomina modelo de regresión. Los modelos lineales son lineales en los parámetros y el ruido es aditivo.

2 CO 3321/22 Modelos Lineales Práctica 3 En R, el ajuste por mínimos cuadrados se realiza usando el comando lm. La forma general del comando es: lm (fórmula, data, subset, na.action, model=TRUE, x=FALSE, y= FALSE, qr=TRUE) donde fórmula: Una descripción simbólica del modelo a ser ajustado. data: (opcional) Permite indicar una hoja de datos que contiene las variables en el modelo. subset: (opcional) Vector que especifica un subconjunto de observaciones que será usada en el proceso de ajuste. na.action: Indica qué debe suceder con aquellas observaciones que contienen valores perdidos. El valor por defecto es “na.omit” (a menos que se haya modificado usando options() ). Model, x, y, qr: Variable lógicas. Si son verdaderas, se devuelve como parte de la salida del modelo, la matriz x, el vector y y la descomposición QR de la matriz X’X.

3 CO 3321/22 Modelos Lineales Práctica 3 El siguiente conjunto de datos corresponde a 40 observaciones de 4 variables obtenidas en un estudio de desarrollo ambiental. Estas variables estudiadas son: Ozono: concentración superficial del ozono Radiación Solar: cantidad de radiación solar Viento: Velocidad del viento en millas/hora Temperatura: Temperatura medida en grados Fahrenheit En base a los datos que se presentan, se quiere obtener un modelo de regresión para predecir la concentración de Ozono, dependiendo de las variables:radiación solar, viento y temperatura. Obtenga el modelo que mejor ajuste estos datos. En base al modelo obtenido, conteste: ¿Que nivel de ozono obtendría para una radiación solar de 180, velocidad del viento de 6 y una temperatura de 65ºF?. ¿A qué conclusiones llega?

4 CO 3321/22 Modelos Lineales Práctica 3 LECTURA DE DATOS Un archivo puede ser leído usando el comando read.table. El contenido es almacenado en una hoja de datos. >ozono_read.table("modelos.txt", header=T) >ozono > attach(ozono) > objects(2) [1] "Ozono" "Rad.S" "VientoTemp" "row.labels” > class(ozono) [1] "data.frame” AJUSTE DE UN MODELO > modelo1_lm(Ozono~Rad.S + Temp + Viento) > modelo1 Call: lm(formula = Ozono ~ Rad.S + Temp + Viento) Coefficients: (Intercept)Rad.S Temp Viento -0.3921094 0.002129214 0.04930344 -0.04046613 > names(modelo1) [1] "coefficients" "residuals" "fitted.values" [4] "effects" "R" "rank" [7] "assign" "df.residual" "contrasts" [10] "terms" "call"

5 CO 3321/22 Modelos Lineales Práctica 3 > modelo1$coefficients (Intercept) Rad.S Temp Viento -0.3921094 0.002129214 0.04930344 -0.04046613 PRUEBA DE HIPÓTESIS SOBRE LOS PARÁMETROS Se desea probar: Ho:  i = 0 vs. H 1 :  i  0 Esto equivale a comparar el modelo y l =  0 +  1 x 1l +...+  i-1 x i-1,l +  i+1 x i+1,l +...+  k x kl +  l frente al modelo y l =  0 +  1 x 1l +...+  i-1 x i-1,l +  i x i,l +  i+1 x i+1,l +...+  k x kl +  l Puede probarse que el estadístico de interés tiene una distribución t con n-p grados de libertad. Se rechaza H 0 cuando | t | > t n-p,  / 2 Si no es usada con cuidado, la prueba t puede llevar a resultados erróneos, porque las estimaciones de los coeficientes no son independientes. En general, no es recomendable eliminar más de una variable a la vez cuando aplicamos este procedimiento, pues sólo nos permite comparar modelos que difieren en una variable.

6 CO 3321/22 Modelos Lineales Práctica 3 Para los datos de ozono, veamos el resultado de la prueba de significancia de los parámetros utilizando el comando summary (observar que se trata de otro objeto, por lo que la salida del comando es diferente a la obtenida con anterioridad) > summary(modelo1) Call: lm(formula = Ozono ~ Rad.S + Temp + Viento, data = ozono) Residuals: Min 1Q Median 3Q Max -2.141 -0.3899 0.02451 0.4766 1.14 Coefficients: Value Std. Error t value Pr(>|t|) (Intercept) -0.3921 0.9954 -0.3939 0.6959 Rad.S 0.0021 0.0011 1.9259 0.0618 Temp 0.0493 0.0123 4.0075 0.0003 Viento -0.0405 0.0292 -1.3868 0.1738 Signif. codes: 0 `***' 0.001 `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1 Residual standard error: 0.6435 on 37 degrees of freedom Multiple R-Squared: 0.5752, Adjusted R-squared: 0.5407 F-statistic: 16.7 on 3 and 37 degrees of freedom, p-value: 5.067e-007


Descargar ppt "CO 3321/22 Modelos Lineales Práctica 3 Consideraremos modelos de la forma: Observación=señal + ruido Estos modelos pueden escribirse en la forma: Y=X "

Presentaciones similares


Anuncios Google