DISEÑOS POR BLOQUES ALEATORIZADOS
DISEÑO EN BLOQUES ALEATORIZADOS Introducción ¿Por qué el diseño por bloques? Problema Hipótesis Análisis de varianza (ANOVA) Comparaciones múltiples Verificación de supuestos Residuales Varianza constante Independencia Normalidad Construcción del Anova
Ejemplo: Introducción Se diseño un experimento para estudiar el rendimiento de cuatro detergentes, las siguientes lecturas de "blancura" se obtuvieron con un equipo especial diseñado para 12 cargas de lavado distribuidas en tres modelos de lavadoras: BLANCURA Detergente R1 R2 R3 A 45 43 51 B 47 44 52 C 50 49 57 D 42 37
Variable de respuesta: Blancura Factor controlado: Tipo de detergente Hipótesis: Ho: no hay efecto del tipo de detergente en la blancura de la ropa Ha: si hay efecto del tipo de detergente en la blancura de la ropa Fuente Suma de cuadrados GL Cuadrados Medios Razón-F Valor P Detergentes 133.667 3 44.5556 2 0.1923 Error 178 8 22.25 Total 311.667 11 No existen diferencias en los tipos de detergente, con una confianza estadística de 95%.
Ahora bien, notemos que en el texto del problema, que se habla del uso de tres modelos diferentes de lavadoras. Dichas lavadoras al ser diferentes producen una variación que puede afectar en el análisis. FACTOR PERTURBADOR Factor perturbador es un factor del diseño que probablemente tenga efecto sobre la respuesta, pero en el que no existe interés especifico. En cualquier experimento, la variabilidad que surge de un factor perturbador puede afectar los resultados.
¿Por qué el diseño por bloques? Cuando existe una fuente de variación adicional (debido a un factor perturbador) que puede y debe ser sistematizada y controlada durante el experimento, se deberá utilizar el diseño por bloques.
Ejemplo: Se diseño un experimento para estudiar el rendimiento de cuatro detergentes, las siguientes lecturas de "blancura" se obtuvieron con un equipo especial diseñado para 12 cargas de lavado distribuidas en tres modelos de lavadoras: Lavadora Detergente 1 2 3 A 45 43 51 B 47 44 52 C 50 49 57 D 42 37
Variable de respuesta: Blancura Factor controlado: Tipo de detergente Bloque: Tipo de lavadora Hipótesis: Ho: no hay efecto del tipo de detergente en la blancura de la ropa Ha: si hay efecto del tipo de detergente en la blancura de la ropa Fuente Suma de Cuadrados Gl Cuadrado Medio Razón-F Valor-P EFECTOS PRINCIPALES A:DETERGENTE 133.667 3 44.5556 34.13 0.0004 B:BLOQUE 170.167 2 85.0833 65.17 0.0001 ERROR 7.83333 6 1.30556 TOTAL (CORREGIDO) 311.667 11 Para un nivel de confianza =0.05 se puede concluir que si existen diferencias significativas entre los tipos de detergentes con respecto a la blancura
SCTOTAL=SCFACTOR+SCBLOQUE+SCERROR SCTOTAL=SCFACTOR+SCERROR 311.667= 133.667 + 178 SCTOTAL=SCFACTOR+SCBLOQUE+SCERROR 311.667=133.667 + 170.167 + 7.8333 DE ESTA MANERA EL ERROR EXPERIMENTAL SE REDUCIRÁ, Y LA PRECISIÓN DEL DISEÑO AUMENTARÁ.
COMPARACIONES MULTIPLES ¿Cuál detergente es mejor? LSD Cuando se rechaza la hipótesis nula, se procede a realizar la prueba de rangos múltiples. Dos medias se consideran diferentes si la diferencia de dos medias es mayor que el valor de LSD.
A-B A-C A-D B-C B-D C-D A 46.3 B 47.6 C 52 D 42.6 1.333 5.667 3.667 Detergente Promedios A 46.3 B 47.6 C 52 D 42.6 Pares A-B A-C A-D B-C B-D C-D |Dif.| 1.333 5.667 3.667 4.333 5 9.333 Menor a LSD Mayor a LSD Conclusión La blancura del detergente A no es diferente al del detergente B Existe diferencia significativa de blancura entre el tipo de detergente A y el detergente C. Existe diferencia significativa de blancura entre el tipo de detergente A y el detergente D. Existe diferencia significativa de blancura entre el tipo de detergente B y el detergente C. Existe diferencia significativa de blancura entre el tipo de detergente B y el detergente D. Existe diferencia significativa de blancura entre el tipo de detergente C y el detergente D. El Detergente C es el que da mayor blancura, ya que presenta el mayor promedio significativo que los otros tres
Prueba de rangos múltiples (LSD) para detergentes Casos Media LS Sigma LS Grupos Homogéneos D 3 42.6667 0.659686 X A 46.3333 B 47.6667 C 52.0 Contraste Sig. Diferencia +/- Límites A - B -1.33333 2.28282 A - C * -5.66667 A - D 3.66667 B - C -4.33333 B - D 5.0 C - D 9.33333 Hay 3 grupos homogéneos, un grupo es el detergente D, otro grupo lo son los detergentes A y B, finalmente el tercer grupo lo es el detergente C. Para maximizar la blancura de la ropa se recomienda el detergente C.
GRAFICAS DE MEDIAS Error Límite Nivel Media Est. Inferior Superior MEDIA GLOBAL 47.1667 DETERGENTE A 46.3333 0.659686 44.7191 47.9475 B 47.6667 46.0525 49.2809 C 52.0 50.3858 53.6142 D 42.6667 41.0525 44.2809 Se puede establecer que en promedio el detergente C es mejor, ya que presenta el mejor promedio de los 4 tipos de detergentes. Si el detergente C es el recomendado se esperarían promedios entre 50.38 y 53.61
Verificación de supuestos Modelo Verificar si los residuos cumplen con los supuestos de: VARIANZA CONSTANTE INDEPENDENCIA NORMALIDAD Para ello, primeramente se calculan los residuales mediante la siguiente formula: Donde yij es el valor obtenido en el experimento, es el promedio del i-ésimo detergente, es el j-ésimo bloque, es el promedio general. Ejemplo: e11=45-46.33-46+47.167=-0.16
RESIDUALES Tabla de residuales: DETERGENTES A B C D -0.1667 0.5 -0.833 0.5833 0.25 0.9166 -1.75 -0.41667 -0.75 -0.0833 1.25
SUPUESTO DE VARIANZA CONSTANTE Para checar el supuesto de varianza constante, es necesario realizar la siguiente grafica: GRAFICA DE RESIDUALES VS LOS NIVELES DEL FACTOR En este caso no se presenta patrón inusual por lo que podemos concluir que si se cumple el supuesto de varianza constante.
SUPUESTO DE INDEPENDENCIA Para verificar el supuesto de independencia se requiere ordenar los residuales según el orden en que se corrió el experimento DETERGENTES A B C D -0.167 (2) 0.5 (1) -0.833 (4) 0.5 (3) 0.583 (4) 0.25 (2) 0.916 (1) -1.75 (3) -0.416 (2) -0.75 (1) -0.083 (4) 1.25 (3) De acuerdo a esta gráfica se puede concluir que si se cumple el supuesto de independencia.
NORMALIDAD En está gráfica se puede ver que la mayoría de los puntos se ajustan a la línea recta, lo que significa que los residuales si cumplen el supuesto de normalidad.
Análisis de varianza (ANOVA) de un diseño de bloques completos aleatorios Fuente de variación Suma de cuadrados Grados de libertad Cuadrados medios F0 F (Tabla) Tratamientos SSTratamientos a-1 Bloques SSBloques b-1 Error SSError (a-1)(b-1) Total SSTotal Si F0 es mayor a se rechaza Ho, de igual manera si el P-value es menor al nivel de significancia ( ) se rechaza H0, Y se concluye que factor si afecta significativamente a la variable de respuesta.