La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Elementos del Diseño de Experimentos y Análisis de la Varianza.

Presentaciones similares


Presentación del tema: "Elementos del Diseño de Experimentos y Análisis de la Varianza."— Transcripción de la presentación:

1 Elementos del Diseño de Experimentos y Análisis de la Varianza

2 Sobre un proceso existente se observa una o más variables aleatorias (registrar información) ¿Qué es un estudio observacional? Finalidad: explorar, describir, confirmar hipótesis

3 Prueba o serie de pruebas en las cuales se inducen cambios deliberados en las variables de entrada de un proceso o sistema, de manera que sea posible observar e identificar las causas de los cambios en la respuesta de salida (Montgomery 1991). ¿Qué es un experimento? Finalidad: confirmar hipótesis, modelar, predecir

4 Consisten en la aplicación de tratamientos a un conjunto de unidades experimentales para valorar y comparar las respuestas obtenidas desde diferentes tratamientos Experimentos Comparativos Se busca incrementar la precisión y el alcance de la inferencia realizada Diseño

5 Algunos diseños clásicos Completamente aleatorizado Bloques completos aleatorizados Cuadrado latino Experimentos factoriales Diseños en parcelas divididas

6 Diseño de Experimentos: Elementos Unidad experimental Factores y Tratamientos Fuentes de Error Aleatorización Repetición Estructura de parcelas Estructura de tratamientos

7 Unidad Experimental (UE) Porción de material, individuo o grupo de individuos, que recibe un tratamiento y sobre la que se observa una respuesta. Porción de material, individuo o grupo de individuos, que recibe un tratamiento y sobre la que se observa una respuesta. El tamaño de la UE es usualmente una decisión arbitraria, pero afecta la calidad de la observación de la variable respuesta. El tamaño de la UE es usualmente una decisión arbitraria, pero afecta la calidad de la observación de la variable respuesta. La UE es definida y tratada de forma tal que provea una respuesta nueva o estadísticamente independiente de la provista por otras UE. La UE es definida y tratada de forma tal que provea una respuesta nueva o estadísticamente independiente de la provista por otras UE.

8 Variables de respuesta Las respuestas suelen llamarse variables de respuesta o variables dependientes. Las respuestas suelen llamarse variables de respuesta o variables dependientes. Las variables de respuesta pueden ser cualitativas o cuantitativas. Las variables de respuesta pueden ser cualitativas o cuantitativas. Las observaciones de la respuesta pueden ser uni o multivariadas. Las observaciones de la respuesta pueden ser uni o multivariadas.

9 Factores Las potenciales fuentes de variación de la respuesta en un experimento identificadas a priori son llamadas factores. Las potenciales fuentes de variación de la respuesta en un experimento identificadas a priori son llamadas factores. Los distintos estados o valores de los factores se llaman niveles. Los distintos estados o valores de los factores se llaman niveles. La combinación de niveles evaluados para un conjunto de factores recibe el nombre de tratamiento. La combinación de niveles evaluados para un conjunto de factores recibe el nombre de tratamiento.

10 Error experimental El término de error experimental es la diferencia entre el valor observado de la variable respuesta sobre una UE y su valor esperado. El término de error experimental es la diferencia entre el valor observado de la variable respuesta sobre una UE y su valor esperado. El error experimental es la fuente de variación observada entre UE tratadas de la misma forma. El error experimental es la fuente de variación observada entre UE tratadas de la misma forma.

11 Aunque la aleatorización distribuye los errores y controla el sesgo, no elimina ni minimiza el error experimental. Aunque la aleatorización distribuye los errores y controla el sesgo, no elimina ni minimiza el error experimental. Cuando se puede reconocer una fuente sistemática de variación en el error, entonces es posible incorporarla al modelo y descontarla del error experimental. Cuando se puede reconocer una fuente sistemática de variación en el error, entonces es posible incorporarla al modelo y descontarla del error experimental. El bloqueo es el resultado de un reconocimiento a priori de fuentes sistemáticas de error y permite obtener experimento más eficientes. El bloqueo es el resultado de un reconocimiento a priori de fuentes sistemáticas de error y permite obtener experimento más eficientes. Aleatorización

12 Repetición Repetición de un tratamiento es la aplicación del tratamiento a una nueva UE Repetición de un tratamiento es la aplicación del tratamiento a una nueva UE Dado que toda observación tiene error, la única forma de estimar insesgadamente el efecto de un tratamiento es promediando sobre un conjunto de repeticiones Dado que toda observación tiene error, la única forma de estimar insesgadamente el efecto de un tratamiento es promediando sobre un conjunto de repeticiones La identificación de las fuentes de error facilita obtener repeticiones genuinas de un tratamiento La identificación de las fuentes de error facilita obtener repeticiones genuinas de un tratamiento Pseudoréplicas

13 El diseño de la estructura de parcelas consiste en el agrupamiento de unidades experimentales homogéneas en grupos o bloques Estructura de parcelas

14 Unidades experimentales homogéneas, es decir sin estructura Diseño Completamente al Azar Unidades experimentales heterogéneas, es decir que presentan variabilidad sistemática natural o inducida Diseño en Bloques

15 Consiste en el conjunto de tratamientos o poblaciones que el experimentador ha seleccionado para estudiar y/o comparar Estructura de tratamientos

16 Modelo A través de la modelación estadística se analiza la respuesta del sistema en estudio A través de la modelación estadística se analiza la respuesta del sistema en estudio El modelo debe incluir todas las fuentes de variación reconocidas, ya sean debida a factores de tratamiento o a la estructura de las UE El modelo debe incluir todas las fuentes de variación reconocidas, ya sean debida a factores de tratamiento o a la estructura de las UE También debe reconocer fuentes de variación no explicadas (error) de naturaleza aleatoria También debe reconocer fuentes de variación no explicadas (error) de naturaleza aleatoria El modelo debe incluir supuestos distribucionales sobre las componentes aleatorias El modelo debe incluir supuestos distribucionales sobre las componentes aleatorias

17 Diseño Completamente Aleatorizado

18 variable respuesta = media general + efecto de tratamiento + error aleatorio Diseño Completamente Aleatorizado: Modelo Media general de las observaciones ( ) Efecto del tratamiento ( i ) El error aleatorio ( ij )

19 Y ij = + i + ij, con i=1,...,a y j=1,..,n donde: Y ij es la j-ésima observación del i-ésimo tratamiento es la media general de las observaciones i es el efecto del i-ésimo tratamiento ij es una variable aleatoria normal, indep. distribuida con esperanza 0 y varianza 2 ij Diseño Completamente Aleatorizado: Modelo

20 Diseño Completamente Aleatorizado El objetivo del ANAVA de efectos fijos es contrastar las hipótesis H 0 : µ 1 =...= µ a versus H 1 : Al menos un par de medias difieren

21 Diseño Completamente Aleatorizado O bien: H 0 : 1 =...= a = 0 vs. H 1 : Al menos un tratamiento tiene efecto no nulo

22 Diseño Completamente Aleatorizado La prueba consiste en calcular el estadístico F utilizando los estimadores de 2 E y 2 D de la siguiente forma :

23 Diseño Completamente Aleatorizado

24 Diseño Completamente Aleatorizado: ejemplo El porcentaje de humedad relativa (HR) es determinante para el ataque de hongos en semillas. Para evaluar la susceptibilidad de las semillas de una forrajera al ataque de un hongo se realizó un ensayo en cámaras de cría con tres porcentajes de HR: 70%, 80% y 90%. Se tomaron cinco observaciones para cada porcentaje de HR, registrándose el número de semillas atacadas en un grupo de 100 semillas.

25 Diseño Completamente Aleatorizado: ejemplo

26 Diseño Completamente Aleatorizado: ejemplo Cuadro de Análisis de la Varianza F.V. SC gl CM F p-valor Modelo HR Error Total _

27 Diseño Completamente aleatorizado: ejemplo Si = 0.05 luego el punto crítico que delimita la zona de aceptación y rechazo de H 0 es F (2,12; 0.95) = 3.88 Valor p= Se concluye, con un nivel de significación del 5%, que se rechaza la hipótesis nula de igualdad de medias, por lo tanto al menos una de las HR produce un grado de ataque de hongos diferente de los restantes.

28 Comparaciones Múltiples Si se rechaza la hipótesis nula del ANAVA, la pregunta que sigue es ¿cuál o cuáles de las medias poblacionales en estudio son las diferentes? Existe una gama muy amplia de alternativas para llevar adelante este tipo de pruebas, entre las que se destacan las pruebas de Tukey (Tukey, 1949), Scheffé (Scheffé, 1953), Duncan (Duncan, 1955), Dunnet (Dunnet, 1964) y la de Fisher (Fisher, 1966), entre otras

29 Prueba de Tukey La DMS de la prueba de Tukey para el ejemplo es 4.37 Luego, se debe observar que las diferencias entre medias muestrales sean mayores que 4.37

30 Prueba de Tukey Así se concluye: 70% 80% 70% 90% 80% = 90%

31 Prueba de Tukey Test: Tukey Alfa= 0.05 DMS= Error: gl: 12 HRMedias n A B B Letras distintas indican diferencias significativas (p <= 0.05)

32 Verificación de Supuestos Los errores se suponen normales con esperanza cero, varianza común e independientes. Los predictores de los errores son los residuos Se llama residuo de la observación j- ésima correspondiente al i-ésimo nivel del factor tratamiento al predictor de ij, que se denota por e ij y se obtiene como la diferencia entre el valor observado y el valor predicho por el modelo

33 Normalidad Seleccionando los residuos como variable de análisis, una de las técnicas más usadas es construir un Q-Q plot normal. Mediante esta técnica se obtiene un diagrama de dispersión en el que, si los residuales son normales y no hay otros defectos del modelo, entonces se alinean sobre una recta a 45°

34 Normalidad InfoStat provee automáticamente el coeficiente de correlación (r) entre los residuos y los estadísticos de orden muestrales, en el gráfico Q-Q plot. El cuadrado de r es el estadístico r 2 de Shapiro-Francia, para la prueba de normalidad. Los valores de significancia asociados a r 2 para muestras de tamaño 35 a 99 fueron publicados por Shapiro y Francia en 1972 (Rawlings,1988). Valores de r 2 cercanos a 1 sugieren distribución normal de la variable en estudio.

35 Homogeneidad de Varianzas Cuando los errores son homocedásticos, haciendo un gráfico de dispersión de residuos vs. valores predichos por el modelo se debe observar una nube de puntos sin patrón alguno. Un patrón típico que indica falta de homogeneidad en las varianzas, se muestra en la siguiente figura:

36 Homogeneidad de Varianzas: Ejemplo

37 Para modelar es importante identificar DOS tipos de estructuras Estructura de parcelas Aleatorización Estructura de tratamientos

38 El balance de algunos factores que influyen sobre las unidades experimentales se puede mejorar aleatorizando separadamente dentro de subgrupos de unidades (estratificando o bloqueando). Toda restricción a la aleatorización completa debe ser considerada durante el análisis. Estratificación o Bloqueo de UE

39 Diseño en Bloques completos aleatorizados

40 Diseño en Bloques completos aleatorizados Homogeneidad dentro de bloques Heterogeneidad entre bloques

41 Modelo Y ij = + i + j + ij con i=1,...,a j=1,...,b con i=1,...,a j=1,...,b corresponde a la media general i el efecto del i- é simo tratamiento j el efecto del j- é simo bloque ij es el error aleatorio El error aleatorio está asociado con la unidad experimental en el bloque j, que recibe el tratamiento i. Comúnmente los términos de error se asumen normalmente distribuidos con esperanza cero y varianza común 2.

42 Diseño en Bloques completos aleatorizados: ejemplo Se realizó un ensayo para evaluar el rendimiento en kg de materia seca por hectárea de una forrajera con distintos aportes de N 2 en forma de urea. Las dosis de urea probadas fueron 0 (control), 75, 150, 225 y 300 kg/ha. El ensayo se realizó en distintas zonas, en las que por razones edáficas y climáticas se podían prever rendimientos diferentes. Las zonas en este caso actuaron como bloques.

43 Diseño en Bloques completos aleatorizados: ejemplo

44 Diseño en Bloques completos aleatorizados

45 Diseño en Bloques completos aleatorizados: ejemplo

46 Comentarios finales El DBCA es una estrategia experimental para disminuir el efecto de variaciones sistemáticas entre UE sobre la comparación de medias de tratamiento. Tales variaciones son reconocidas antes de realizar el experimento. Un bloque es un grupo de UE homogéneas. El DBCA representa una restricción a la aleatorización. Los tratamientos son aleatorizados por bloques.


Descargar ppt "Elementos del Diseño de Experimentos y Análisis de la Varianza."

Presentaciones similares


Anuncios Google