Elementos del Diseño de Experimentos y Análisis de la Varianza

Elementos del Diseño de Experimentos y Análisis de la Varianza

¿Qué es un estudio observacional?
Sobre un proceso existente se observa una o más variables aleatorias (registrar información) Finalidad: explorar, describir, confirmar hipótesis

¿Qué es un experimento? “Prueba o serie de pruebas en las cuales se inducen cambios deliberados en las variables de entrada de un proceso o sistema, de manera que sea posible observar e identificar las causas de los cambios en la respuesta de salida” (Montgomery 1991). Finalidad: confirmar hipótesis, modelar, predecir

Experimentos Comparativos
Consisten en la aplicación de tratamientos a un conjunto de unidades experimentales para valorar y comparar las respuestas obtenidas desde diferentes tratamientos Se busca incrementar la precisión y el alcance de la inferencia realizada Diseño

Algunos diseños clásicos
Completamente aleatorizado Bloques completos aleatorizados Cuadrado latino Experimentos factoriales Diseños en parcelas divididas

Diseño de Experimentos: Elementos
Unidad experimental Factores y Tratamientos Fuentes de Error Aleatorización Repetición Estructura de parcelas Estructura de tratamientos

Unidad Experimental (UE)
Porción de material, individuo o grupo de individuos, que recibe un tratamiento y sobre la que se observa una respuesta. El tamaño de la UE es usualmente una decisión arbitraria, pero afecta la calidad de la observación de la variable respuesta. La UE es definida y tratada de forma tal que provea una respuesta “nueva” o estadísticamente independiente de la provista por otras UE.

Variables de respuesta
Las respuestas suelen llamarse variables de respuesta o variables dependientes. Las variables de respuesta pueden ser cualitativas o cuantitativas. Las observaciones de la respuesta pueden ser uni o multivariadas.

Factores Las potenciales fuentes de variación de la respuesta en un experimento identificadas a priori son llamadas factores. Los distintos estados o valores de los factores se llaman niveles. La combinación de niveles evaluados para un conjunto de factores recibe el nombre de tratamiento.

Error experimental El término de error experimental es la diferencia entre el valor observado de la variable respuesta sobre una UE y su valor esperado. El error experimental es la fuente de variación observada entre UE tratadas de la misma forma.

Aleatorización Aunque la aleatorización “distribuye los errores” y controla el sesgo, no elimina ni minimiza el error experimental. Cuando se puede reconocer una fuente sistemática de variación en el error, entonces es posible incorporarla al modelo y descontarla del error experimental. El bloqueo es el resultado de un reconocimiento a priori de fuentes sistemáticas de error y permite obtener experimento más eficientes.

Repetición Repetición de un tratamiento es la aplicación del tratamiento a una nueva UE Dado que toda observación tiene error, la única forma de estimar insesgadamente el efecto de un tratamiento es promediando sobre un conjunto de repeticiones La identificación de las fuentes de error facilita obtener repeticiones genuinas de un tratamiento Pseudoréplicas

Estructura de parcelas
El diseño de la estructura de parcelas consiste en el agrupamiento de unidades experimentales homogéneas en grupos o bloques

Estructura de parcelas
Unidades experimentales homogéneas, es decir sin estructura Diseño Completamente al Azar Unidades experimentales heterogéneas, es decir que presentan variabilidad sistemática natural o inducida Diseño en Bloques

Estructura de tratamientos
Consiste en el conjunto de tratamientos o poblaciones que el experimentador ha seleccionado para estudiar y/o comparar

Modelo A través de la modelación estadística se analiza la respuesta del sistema en estudio El modelo debe incluir todas las fuentes de variación reconocidas, ya sean debida a factores de tratamiento o a la estructura de las UE También debe reconocer fuentes de variación no explicadas (error) de naturaleza aleatoria El modelo debe incluir supuestos distribucionales sobre las componentes aleatorias

Diseño Completamente Aleatorizado

Diseño Completamente Aleatorizado:
Modelo variable respuesta = media general + efecto de tratamiento + error aleatorio Media general de las observaciones () Efecto del tratamiento (i ) El error aleatorio (ij )

Yij = + i + ij , con i=1,...,a y j=1,..,n
Diseño Completamente Aleatorizado: Modelo Yij = + i + ij , con i=1,...,a y j=1,..,n donde: Yij es la j-ésima observación del i-ésimo tratamiento  es la media general de las observaciones i es el efecto del i-ésimo tratamiento ij es una variable aleatoria normal, indep. distribuida con esperanza 0 y varianza 2 ij

El objetivo del ANAVA de efectos fijos es contrastar las hipótesis
Diseño Completamente Aleatorizado El objetivo del ANAVA de efectos fijos es contrastar las hipótesis H0: µ1=...=µa versus H1: Al menos un par de medias difieren

H1: Al menos un tratamiento tiene efecto no nulo
Diseño Completamente Aleatorizado O bien: H0: 1=...=a= 0 vs. H1: Al menos un tratamiento tiene efecto no nulo

La prueba consiste en calcular el estadístico F utilizando los estimadores de 2E y 2D de la siguiente forma:

Diseño Completamente Aleatorizado: ejemplo
El porcentaje de humedad relativa (HR) es determinante para el ataque de hongos en semillas. Para evaluar la susceptibilidad de las semillas de una forrajera al ataque de un hongo se realizó un ensayo en cámaras de cría con tres porcentajes de HR: 70%, 80% y 90%. Se tomaron cinco observaciones para cada porcentaje de HR, registrándose el número de semillas atacadas en un grupo de 100 semillas.

Diseño Completamente Aleatorizado:
ejemplo

Diseño Completamente Aleatorizado: ejemplo
Cuadro de Análisis de la Varianza F.V. SC gl CM F p-valor Modelo HR Error Total _

Diseño Completamente aleatorizado: ejemplo
Si  = 0.05 luego el punto crítico que delimita la zona de aceptación y rechazo de H0 es F(2,12; 0.95) = 3.88 Valor p= Se concluye, con un nivel de significación del 5%, que se rechaza la hipótesis nula de igualdad de medias, por lo tanto al menos una de las HR produce un grado de ataque de hongos diferente de los restantes.

Comparaciones Múltiples
Si se rechaza la hipótesis nula del ANAVA, la pregunta que sigue es ¿cuál o cuáles de las medias poblacionales en estudio son las diferentes? Existe una gama muy amplia de alternativas para llevar adelante este tipo de pruebas, entre las que se destacan las pruebas de Tukey (Tukey, 1949), Scheffé (Scheffé, 1953), Duncan (Duncan, 1955), Dunnet (Dunnet, 1964) y la de Fisher (Fisher, 1966), entre otras

Prueba de Tukey La DMS de la prueba de Tukey para el ejemplo es 4.37
Luego, se debe observar que las diferencias entre medias muestrales sean mayores que 4.37

Prueba de Tukey Así se concluye: 70%  80% 70%  90% 80% = 90%

Prueba de Tukey Test: Tukey Alfa= 0.05 DMS= 4.37841
Error: gl: 12 HR Medias n A B B Letras distintas indican diferencias significativas (p <= 0.05)

Verificación de Supuestos
Los errores se suponen normales con esperanza cero, varianza común e independientes. Los predictores de los errores son los residuos Se llama residuo de la observación j-ésima correspondiente al i-ésimo nivel del factor tratamiento al predictor de ij, que se denota por eij y se obtiene como la diferencia entre el valor observado y el valor predicho por el modelo

Normalidad Seleccionando los residuos como variable de análisis, una de las técnicas más usadas es construir un Q-Q plot normal. Mediante esta técnica se obtiene un diagrama de dispersión en el que, si los residuales son normales y no hay otros defectos del modelo, entonces se alinean sobre una recta a 45°

Normalidad InfoStat provee automáticamente el coeficiente de correlación (r) entre los residuos y los estadísticos de orden muestrales, en el gráfico Q-Q plot. El cuadrado de r es el estadístico r2 de Shapiro-Francia, para la prueba de normalidad. Los valores de significancia asociados a r2 para muestras de tamaño 35 a 99 fueron publicados por Shapiro y Francia en 1972 (Rawlings,1988). Valores de r2 cercanos a 1 sugieren distribución normal de la variable en estudio.

Homogeneidad de Varianzas
Cuando los errores son homocedásticos, haciendo un gráfico de dispersión de residuos vs. valores predichos por el modelo se debe observar una nube de puntos sin patrón alguno. Un patrón típico que indica falta de homogeneidad en las varianzas, se muestra en la siguiente figura:

Homogeneidad de Varianzas:
Ejemplo

Para modelar es importante identificar DOS tipos de estructuras
Estructura de parcelas Aleatorización Estructura de tratamientos

Estratificación o Bloqueo de UE
El balance de algunos factores que influyen sobre las unidades experimentales se puede mejorar aleatorizando separadamente dentro de subgrupos de unidades (estratificando o bloqueando). Toda restricción a la aleatorización completa debe ser considerada durante el análisis.

Diseño en Bloques completos
aleatorizados

Homogeneidad dentro de bloques Heterogeneidad entre bloques
Diseño en Bloques completos aleatorizados Homogeneidad dentro de bloques Heterogeneidad entre bloques

Yij =  + i + j + ij con i=1,...,a j=1,...,b
Modelo Yij =  + i + j + ij con i=1,...,a j=1,...,b  corresponde a la media general i el efecto del i-ésimo tratamiento j el efecto del j-ésimo bloque ij es el error aleatorio El error aleatorio está asociado con la unidad experimental en el bloque j , que recibe el tratamiento i. Comúnmente los términos de error se asumen normalmente distribuidos con esperanza cero y varianza común 2.

Diseño en Bloques completos aleatorizados: ejemplo
Se realizó un ensayo para evaluar el rendimiento en kg de materia seca por hectárea de una forrajera con distintos aportes de N2 en forma de urea. Las dosis de urea probadas fueron 0 (control), 75, 150, 225 y 300 kg/ha. El ensayo se realizó en distintas zonas, en las que por razones edáficas y climáticas se podían prever rendimientos diferentes. Las zonas en este caso actuaron como bloques.

Diseño en Bloques completos
aleatorizados

Comentarios finales El DBCA es una estrategia experimental para disminuir el efecto de variaciones sistemáticas entre UE sobre la comparación de medias de tratamiento. Tales variaciones son reconocidas antes de realizar el experimento. Un bloque es un grupo de UE homogéneas. El DBCA representa una restricción a la aleatorización. Los tratamientos son aleatorizados por bloques.

Elementos del Diseño de Experimentos y Análisis de la Varianza

Presentaciones similares

Presentación del tema: "Elementos del Diseño de Experimentos y Análisis de la Varianza"— Transcripción de la presentación:

Presentaciones similares

Sobre el proyecto

Feedback

Iniciar la sesión

Autorizarse a través de una red social:

Elementos del Diseño de Experimentos y Análisis de la Varianza

Presentaciones similares

Presentación del tema: "Elementos del Diseño de Experimentos y Análisis de la Varianza"— Transcripción de la presentación:

Presentaciones similares

Sobre el proyecto

Feedback