Práctica 2 CO2124 Pruebas de Hipótesis Las pruebas de hipótesis más usadas se basan en la suposición de que los datos provienen de una distribución normal. En R el comando t.test permite realizar pruebas de hipótesis sobre la media de una población normal, o comparar las medias de dos poblaciones normales, con datos apareados o no. La forma general de este comando es: t.test(x, y = NULL, alternative = c(“two sided”, ”less”, “greater”), mu =0, paired = FALSE, var.equal = FALSE, conf.level = 0.95) El comando también proporciona intervalos de confianza apropiados a la alternativa especificada. Si se desea probar la hipótesis de que las varianzas son iguales, puede usarse el comando var.test, la forma general es: var.test(x, y, ratio = 1, alternative = c(“two sided”, ”less”, “greater”), conf.level = 0.95) Práctica 2
var.test(operario1,operario2) F test for variance equality CO2124 Pruebas de Hipótesis Con el conjunto de datos operarios, podemos comparar las mediciones realizadas por el trabajador 1 y el trabajador 2. El primer paso es establecer si las varianzas son iguales o no: var.test(operario1,operario2) F test for variance equality data: operario1 and operario2 F = 1.655, num df = 24, denom df = 24, p-value = 0.2244 alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: 0.7293209 3.7557250 sample estimates: variance of x variance of y 63.37667 38.29333 El p-valor es mayor que el nivel de significancia utilizado (=0.05). Luego, no existen evidencias para rechazar la hipótesis de que las varianzas son iguales (Hipótesis Nula Ho:). Práctica 2
CO2124 Pruebas de Hipótesis Una vez establecida la relación entre las varianzas, se plantean las siguientes interrogantes: a.- ¿ El promedio de las mediciones realizadas por el operario 1 son mayores que 38 Unidades? b.- ¿ El promedio de las mediciones realizadas por el operario 2 son diferentes a 40 Unidades? c.- ¿ El promedio de las mediciones del operario 1 son distintas que las del operario 2 ? Para responder la primera interrogante aplicamos la prueba de medias para una población: > t.test(operario1,alternative="greater",mu=38) One-sample t-Test data: operario1 t = 2.3364, df = 24, p-value = 0.0141 alternative hypothesis: true mean is greater than 38 95 percent confidence interval: 38.99595 NA sample estimates: mean of x 41.72 > qt(0.95, 24 ) [1] 1.710882 Práctica 2
CO2124 Pruebas de Hipótesis > t.test(operario2,mu=44) One-sample t-Test data: operario 2 t = -2.1977, df = 24, p-value = 0.0379 alternative hypothesis: true mean is not equal to 44 95 percent confidence interval: 38.72565 43.83435 sample estimates: mean of x 41.28 > qt(0.975,24) [1] 2.063899 > t.test(operario1,operario2,var.equal=T) Standard Two-Sample t-Test data: operario1 and operario2 t = 0.2182, df = 48, p-value = 0.8282 alternative hypothesis: true difference in means is not equal to 0 -3.614708 4.494708 mean of x mean of y 41.72 41.28 > qt(0.975,48) [1] 2.010635 Práctica 2
CO2124 Datos Apareados Ejercicio Un fabricante desea comparar el proceso de armado común para uno de sus productos con un método propuesto que supuestamente reduce el tiempo de armado. Se seleccionaron ocho trabajadores de la planta de armado y se les pidió que armaran las unidades con ambos procesos. ¿ Mejora el tiempo en que se arman las unidades con el método propuesto? Los siguientes son los tiempos observados en minutos. actual<- c(38,32,41,35,42,32,45,37) propuesto<- c(30,32,34,37,35,26,38,32) mean(actual) [1] 37.75 > mean(propuesto) [1] 33 Práctica 2
Datos Apareados CO2124 t.test(actual,propuesto, paired=T,var.equal=T) Paired t-Test data: actual and propuesto t = 3.6374, df = 7, p-value = 0.0083 alternative hypothesis: true mean of differences is not equal to 0 95 percent confidence interval: 1.6621 7.8379 sample estimates: mean of x - y 4.75 Práctica 2
Datos Apareados CO2124 Paired t-Test data: actual and propuesto Si deseamos conocer si efectivamente hay una mejora en el proceso, realizamos un constraste de una cola: t.test(actual,propuesto,alternative=c("greater"),paired=T,var.equal=T) Paired t-Test data: actual and propuesto t = 3.6374, df = 7, p-value = 0.0042 alternative hypothesis: true mean of differences is greater than 0 95 percent confidence interval: 2.2759 NA sample estimates: mean of x - y 4.75 Práctica 2