Diseño experimental 2137 Juan C. Benavides Medidas repetidas Diseño experimental 2137 Juan C. Benavides Tomado en parte de: http://webspace.ship.edu/pgmarr/Geo441/Lectures/
Cigarrilos a la semana Grupo de apoyo y control
Anova ANOVA=análisis de varianza Anova vs regresión, Ancova Independencia de las observaciones en Anova install.packages(c("lattice","lme4")) https://livejaverianaedu-my.sharepoint.com/:f:/g/personal/jubenavides_javeriana_edu_co/Eg3Pu03_WIxPhsb0aAKa6FsBOg4xerY7zbuxcGazwjD9xw?e=IpXNhu
Anova Una observación por individuo o muestra Aplicar el tratamiento, observar la respuesta una sola vez Una vez aplicado el tratamiento no se puede regresar el tiempo y medir la muestra antes de la aplicación En medidas repetidas la variación de cada individuo/muestra es su control-error Control alto de las fuentes de variabilidad
El error es la interacción entre los sujetos (dentro de cada tratamiento) y el tiempo (repeticiones)
Ejemplo Anova Una observación por individuo o muestra set.seed(5250) myData <- data.frame(PID = as.factor(rep(seq(from = 1, to = 50, by = 1), 20)), cardio = sample(x = 1:100, size = 1000, replace = TRUE), activity = sample(c("Active", "Passive"), stimulus = sample(c("predator", "nopred"), replace = TRUE) ) myData <- myData[order(myData$PID), ] head(myData)
Ejemplo Anova Una observación por individuo o muestra plot(myData$cardio~myData$activity) plot(myData$cardio~myData$stimulus) interaction.plot(myData$activity, myData$stimulus, myData$cardio) myData.mean <- aggregate(myData$cardio, by = list(myData$PID, myData$stimulus, myData$activity), FUN = 'mean') colnames(myData.mean) <- c("PID","stimulus","activity","cardio") stress.aov <- with(myData.mean, aov(cardio ~ activity* stimulus+ Error(PID / (activity* stimulus))) )
Formas de organizar la información Forma extensa (multivariada) id time1 time2 time3 time4 1 31 29 15 26 2 24 28 20 32 3 14 20 28 30 4 38 34 30 34 5 25 29 25 29 6 30 28 16 34
Formas de organizar la información Forma larga (univariada) id time score 1 1 31 1 2 29 1 3 15 4 26 2 1 24 2 28 2 3 20 2 4 32 3 1 14 3 2 20 3 3 28 3 4 30 id time score 4 1 38 4 2 34 4 3 30 4 4 34 5 1 25 2 29 5 3 25 4 29 6 1 30 6 2 28 6 3 16 6 4 34
Perfiles individuales-forma larga
Perfiles individuales-respuesta promedio
Perfiles dos grupos (tto y placebo) id group time1 time2 time3 time4 1 A 31 29 15 26 2 A 24 28 20 32 3 A 14 20 28 30 4 B 38 34 30 34 5 B 25 29 25 29 6 B 30 28 16 34
Perfiles por grupo
Perfiles por grupo-promedios
Estructuras de correlación entre las medidas
Estructuras de correlación entre las medidas
Estructuras de correlación entre las medidas Relaciones entre las observaciones determinan el tipo de análisis usado En el ejemplo anterior tiempos no pueden ser aleatorios, fijos para todos los individuos Variables (varianzas) correlacionadas
Estructuras de correlación entre las medidas En medidas repetidas las mediciones nunca serán independientes (ni sus varianzas)
Estructuras de correlación entre las medidas Simetria compuesta El efecto de los tratamientos es aleatorio y no afecta la estructura de covarianza Homogeneidad de varianzas
Estructuras de correlación entre las medidas-no homogeneidad Si la matriz de covarianza entre mediciones es Entonces tenemos una matriz tipo H (Huynh-Feldt) y podemos usar los cuadrados medios en la prueba de tratamientos
Estructuras de correlación entre las medidas-no homogeneidad Estructura de la matriz H siguiendo la prueda de Esfericidad de Mauchly Homogeneidad de varianzas multivariada
Cuando la matriz H no se puede calcular
Homogeneidad de varianzas
Estructuras de correlación entre las medidas-varianza multivariada humedad.suelo<-c("control","control","control","h0.24","h0.24","h0.24","h0.26","h0.26","h0.26","H0.28","H0.28","H0.28") contenedor<-c("C1","C2","C3","C4","C5","C6","C7","C8","C9","C10","C11","C12") dia2<-c(0.22,0.68,0.68,2.53,2.59,0.56,0.22,0.45,0.22,0.22,0.22,0.22) dia4<-c(0.56,0.91,0.45,2.7,1.43,1.37,0.22,0.28,0.33,0.8,0.62,0.56) dia6<-c(0.66,1.06,0.72,2.1,1.35,1.87,0.2,1.24,0.34,0.8,0.89,0.69) dia8<-c(0.89,0.8,0.89,1.5,0.74,1.21,0.11,0.86,0.2,0.37,0.95,0.63) Data<-data.frame(humedad.suelo,contenedor,dia2,dia4,dia6,dia8) m1<-as.matrix(Data[,c(3:6)],ncol=4,byrow = TRUE, dimnames = list(subj = 1:12, cond = c("dia2","dia4","dia6","dia8"))) mlmfit_co2 <-lm(m1 ~ humedad.suelo) SSD(mlmfit_co2) mauchly.test(mlmfit_co2,X=~1) #homogeneidad de varianzas Existen otras estructuras de correlación que se usan en medidas repetidas no tan estrictas
Anova Medidas repetidas no admite datos faltantes En caso de tener datos faltantes se debe remover la observación o estimarla a partir de la estructura de correlación (inputación) Subject HRSD 1 HRSD 2 HRSD 3 HRSD 4 Subject 1 20 13 Subject 2 21 19 Subject 3 18 10 6 Subject 4 30 25 23
Pruebas de hipotesis- pruebas F Prueba de efectos fijos Prueba de tiempo
Grados de libertad - Satterthwaite
Diseños mas complejos en MR lme4 require(lme4) require(lattice) require(lmerTest) data(sleepstudy) head(sleepstudy) str(sleepstudy) xyplot(Reaction ~ Days | Subject, sleepstudy, type = c("g","p","r"), index = function(x,y) coef(lm(y ~ x))[1], xlab = "Days of sleep deprivation", ylab = "Average reaction time (ms)", aspect = "xy") (fm1 <- lmer(Reaction ~ Days + (Days|Subject), sleepstudy)) (fm2 <- lmer(Reaction ~ Days + (1|Subject) + (0+Days|Subject), sleepstudy))
Diseños mas complejos en MR Lme4 https://cran.r-project.org/web/packages/lme4/lme4.pdf treat <- rep(c('treat', 'control'), e=5) pre <- c(20,10,60,20,10,50,10,40,20,10) post <- c(70,50,90,60,50,20,10,30,50,10) id<-factor(1:10) dflong <- data.frame(id=c(id,id),treat=c(treat,treat),time=rep(c("pre","post"),each=10),score=c(pre,post)) lmeModel <- lmer(score ~ treat*time + (1|id), data=dflong) anova(lmeModel)
Taller