Anova de una via Diseños completamente aleatorios Diseño experimental 2137 Juan C. Benavides Tomado en parte de: http://webspace.ship.edu/pgmarr/Geo441/Lectures/
Para que diseñar un experimento? Control del error experimental Exactitud -sin sesgo El promedio es en el centro del blanco Precisión -repetición Dispersión alrededor de la media
Para que diseñar un experimento? Aleatorización Eliminar el sesgo en la selección Independencia entre las observaciones Pruebas estadisticas lo requieren Fertilidad Low High Old New Old New Old New Old New Organización de parcelas no completamente al azar, las percelas nuevas estan en sitios de mayo fertilidad
Diseños completamente aleatorios Replicación La repetición de un tratamiento en una experimento A B D A C A
Diseños completamente aleatorios Replicación Cada tratamiento es aplicado de manera independiente a dos o mas unidades experimentales Variación entre parcelas con el mismo tratamiento puede ser medida Incrementa la precisión. Al aumentar n el error disminuye Sample variance Number of replications Standard error of a mean
Diseños completamente aleatorios Replicación
Diseños completamente aleatorios El error experimental Diferencia entre lo que se mide y el valor real que debe tener la medida, depende de la exactitud y precisión Manejo del error experimental con un buen diseño Unidades experimental del tamaño apropiado Tener tantas unidades (parcelas) como sea posible Tratamientos comparables e informativos Medir variables relacionadas (covariables)
Forma de las parcelas Cuadradas (menor borde) Rectangulares (mas faciles) Circulares (menos borde, mas rapidas) Abanicos (densidades)
Forma de las parcelas Las parcelas deben estar orientadas perpendicular a la direccion de los gradientes ambientales presentes para que todas sean afectadas de la misma manera
Efecto de borde en las parcelas La forma de las parcelas determina el efecto que el borde va a tener sobre la obsevacion Objetos en el borde tienen menor intensidad del tratamiento Riesgo de incluir objetos que no estan completamente en la parcela Riesgo de contaminar unidades experimentales entre si
Diseño experimental Esquema mediante el cual se asignan los tratamientos a las parcelas en el experimento Las diferencias en los diseños se encuentran en la manera en la cual loas parcelas son agrupadas antes de que los tratamientos sean aplicados Restricciones en la aleatorización A B C D
Para que me sirve un diseño experimental Estimar el error experimental (diferencias entre los tratamientos) Aumentar la precisión (menor dispersión) Restricciones en la aplicación de los tratamientos
Diseño completamente aleatorio El mas sencillo de todos los diseños Cada parcela (unidad experimental) tiene la misma probabilidad de ser asignada un tratamiento Problemas en la segregación de las parcelas A B C D A B D A C D B C B A D C
Diseño completamente aleatorio https://foster.ku.edu/sites/foster.drupal.ku.edu/files/images/general/E3_aerial.JPG
Diseño completamente aleatorio anova de una vía La anova mas basica Dos variables: una categorica – independiente Una cuantitativa - dependiente Contesta a la pregunta básica si (los promedios de) la variable cuantitativa dependen de la variable categorica Diferencia entre al menos dos de los tratamientos Puede comparar múltiples tratamientos no solo dos como la prueba t
Anova de una vía Un anova debe tener: Muestras independientes (parte del diseño experimental) Residuos con una distribución normal Homogeneidad de varianza
Anova de una vía en R Anova es una forma de regresion donde la variable independiente son categorias #analysis of variance function aov(Alertness~Dosage,data=data.ex1)
Analisis de varianza ANOVA mide dos fuentes de variación en los datos y compara sus tamaños relativos La variación entre los grupos para cada valor en los datos lo compara con la diferencia entre la media de su grupo y la media general La variación dentro de los grupos para cada valor de los datos nos fijamos en la diferencia entre dicho valor y la media de su grupo El analisis de varianza (ANOVA) es una prueba F de H0: m1 = m2 = = mg Ha: Los promedios no son iguales
Analisis de varianza El analisis de varianza (ANOVA) es una prueba F de H0: m1 = m2 = = mg Ha: Los promedios no son iguales
Analisis de varianza-tabla Anova Valor F calculado Grados de libertad Variabilidad entre grupos Variabilidad dentro de los grupos http://www.personal.kent.edu/~jortiz/earthstats/BasicEquations/ANOVA_table.png
Analisis de varianza-resultados y1 = c(18.2, 20.1, 17.6, 16.8, 18.8, 19.7, 19.1) y2 = c(17.4, 18.7, 19.1, 16.4, 15.9, 18.4, 17.7) y3 = c(15.2, 18.8, 17.7, 16.5, 15.9, 17.1, 16.7) y = c(y1, y2, y3)> n = rep(7, 3) group = rep(1:3, n) data = data.frame(y = y, group = factor(group)) fit = lm(y ~ group, data) fit = aov(y ~ group, data) summary(fit) # Df Sum Sq Mean Sq F value Pr(>F) #group 2 11.01 5.503 3.968 0.0373 * #Residuals 18 24.96 1.387 #Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Tabla Anova summary(fit) # Df Sum Sq Mean Sq F value Pr(>F) Probabilidad F de que los promedios sean iguales Valor F calculado Grados de libertad summary(fit) # Df Sum Sq Mean Sq F value Pr(>F) #group 2 11.01 5.503 3.968 0.0373 * #Residuals 18 24.96 1.387 Variabilidad entre grupos Variabilidad dentro de los grupos
Anova de una vía en R #tell where the data come from datafilename=http://personality-project.org/r/datasets/R.appendix1.data data.ex1=read.table(datafilename,header=T) #read the data into a table aov.ex1 = aov(Alertness~Dosage,data=data.ex1) #do the analysis of variance summary(aov.ex1) #show the summary table print(model.tables(aov.ex1,"means"),digits=3) #report the means and the number of subjects/cell boxplot(Alertness~Dosage,data=data.ex1) #graphical summary appears in graphics window
Diseño propagación en vivero Parcelas divididas con cinco factores: Temperatura Sustrato Tamaño de los propágulos Aplicación de fertilizantes Especies
Siembra
Ejercicio anova de una vía Diferencias en las tasas de producción de hojarasca en 4 sitios diferentes: Bosque intervenido Nevados Bosque no intervenido Nevados Bosque intervenido Chingaza Bosque no intervenido Chingaza hojarasca.csv https://goo.gl/opZ9p8 litter$rate.year <-litter$tC.ha/litter$dias * 365#ton C ha-1 year-1 litter$tx <- interaction(litter$sitio,litter$Localidad) aov1<-aov(rate.year ~ tx, data=litter) boxplot(rate.year ~ tx, data=litter)