La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Diseño de experimentos

Presentaciones similares


Presentación del tema: "Diseño de experimentos"— Transcripción de la presentación:

1 Diseño de experimentos
Tema 4 Diseño de experimentos

2 Etapas de una investigación
Análisis : tests estadísticos, ajuste de curvas , …. Exploración de datos Obtención datos, calibrados, etc. Para hacer un buen análisis de datos hay que seguir sistematicamente unos pasos que no se deben omitir. Lo primero de todo es el diseño del experimento (plantearlo correctamente), viene luego la exploración exhaustiva de los datos y por último el análisis propiamente dicho. Veremos brevemente algunas ideas sobre el diseño de experimentos y luego nos centraremos en la exploración de datos que es el tema principal de esta charla. Diseño de experimentos Antecedentes Bibliográficos

3 Diseño de experimentos = Un asunto de equilibrio
Maximizar la posibilidad de distinguir bien un efecto Minimizar costos Evitar la interferencia de variables de confusión (hacer réplicas, elegir muestras al azar)  Cuantificar la precisión y exactitud del efecto (intervalos de confianza, calibrados)  Nº de muestras suficientes pero no innecesarias (Tamaño de muestra y potencia del test estadístico a utilizar)

4 Estudio observacional
Primero definir bien el tipo de estudio y la técnica estadística que se va a utilizar Determinar la Km y Vmax de una enzima usando ajuste de curvas por regresión no lineal. Estudio experimental (habrá que diseñar el nº de puntos experimentales, espaciado entre puntos, nº de réplicas, etc.) Diferencia en la respuesta a dos tratamientos médicos usando comparación de 2 medias por test “t de student”. Estudio observacional (habrá que diseñar el tamaño de muestra y potencia del test estadístico a utilizar, el tipo de muestreo, etc.)

5 Diseño de investigaciones experimentales de laboratorio

6 Diseño en estudios experimentales ( ajuste curvas)
Margen de la variable controlada (por ej. [S]) Normalmente el más amplio posible Nº de puntos experimentales y espaciado. Normalmente Espaciado lineal o logarítmico Espaciado lineal ( mM) Espaciado logarítmico( mM) Si se trate de diseñar experimentos del tipo ajuste de curvas, por ejemplo velocidad-[Sustrato], para determinar la Vmax y la Km de una enzima, habrá que proyectar el experimento teniendo en cuenta el margen de la variable controlada (normalmente el más amplio posible), el nº de puntos, el espaciado entre ellos…etc. La simulación por ordenador nos puede ayudar a decidir entre las diferentes posibilidades.

7 Expresiones para el cálculo de los espaciados
Espaciado lineal Xsuperior Xinferior n puntos Espaciado logarítmico Xsuperior Xinferior n puntos y para los puntos de i=2 a i=n se sigue esta expresión: Para todos los puntos: Para el punto 1: Si se trate de diseñar experimentos del tipo ajuste de curvas, por ejemplo velocidad-[Sustrato], para determinar la Vmax y la Km de una enzima, habrá que proyectar el experimento teniendo en cuenta el margen de la variable controlada (normalmente el más amplio posible), el nº de puntos, el espaciado entre ellos…etc. La simulación por ordenador nos puede ayudar a decidir entre las diferentes posibilidades.

8 Necesidad de hacer réplicas
Fuentes de variabilidad De muestreo (preparación muestra): Se repite toma de muestra y tratamiento de la muestra ¡CV(%) grande! Enzima Sustrato + 2) De técnica analítica: Se repite la medida de absorbancia, fluorescencia…. ¡CV(%) pequeño!

9 Se suelen hacer réplicas de muestreo
Enzima + Sustrato 1 Réplicas de muestreo (3-5 réplicas a cada sustrato) Se toma una alícuota de cada muestra Medida Absorbancia No suele ser necesario hacer réplicas de técnica (basta 1 medida a cada muestra)

10 ¿Cuántas réplicas se deben hacer?
1) Cuando se desea estimar la media: nº réplicas CV(%) 1 2 3 4 5 (La media se estabiliza a partir de 3) 2) Cuando se desea estimar la desviación estándar: nº réplicas CV(%) 1 2 3 4 5 (La desviación estándar se estabiliza a partir de 5) Si se trate de diseñar experimentos del tipo ajuste de curvas, por ejemplo velocidad-[Sustrato], para determinar la Vmax y la Km de una enzima, habrá que proyectar el experimento teniendo en cuenta el margen de la variable controlada (normalmente el más amplio posible), el nº de puntos, el espaciado entre ellos…etc. La simulación por ordenador nos puede ayudar a decidir entre las diferentes posibilidades.

11 Simulaciones por ordenador (SIMFIT)
a) Diseño de estudios experimentales Simulaciones por ordenador (SIMFIT) Simular datos exactos, por ejemplo: [S] necesaria [S] v

12 Simulaciones por ordenador (SIMFIT)
a) Diseño de estudios experimentales Simulaciones por ordenador (SIMFIT) Se pueden perturbar datos exactos para simular algún tipo de error experimental : [S] v Error relativo constante del 7.5 %. 5 réplicas por punto. Si se trate de diseñar experimentos del tipo ajuste de curvas, por ejemplo velocidad-[Sustrato], para determinar la Vmax y la Km de una enzima, habrá que proyectar el experimento teniendo en cuenta el margen de la variable controlada (normalmente el más amplio posible), el nº de puntos, el espaciado entre ellos…etc. La simulación por ordenador nos puede ayudar a decidir entre las diferentes posibilidades.

13 Simulaciones por ordenador (SIMFIT)
a) Diseño de estudios experimentales Simulaciones por ordenador (SIMFIT) Gráfica de datos perturbados en forma de media y barras de error (95 %) : v [S] Si se trate de diseñar experimentos del tipo ajuste de curvas, por ejemplo velocidad-[Sustrato], para determinar la Vmax y la Km de una enzima, habrá que proyectar el experimento teniendo en cuenta el margen de la variable controlada (normalmente el más amplio posible), el nº de puntos, el espaciado entre ellos…etc. La simulación por ordenador nos puede ayudar a decidir entre las diferentes posibilidades. (Las Barras de error representan límites de confianza al 95% calculados con la t de student)

14 Diseño de investigaciones
observacionales

15 Diseño de estudios observacionales
Población Muestra Subconjunto individuos Conjunto todos los individuos Inferencia estadística Media (m) Desviación Estándar (s) Media

16 Pasos en tests de contraste de hipótesis
b) Diseño en estudios observacionales Pasos en tests de contraste de hipótesis 1) Decidir hipótesis nula y alternativa a comparar, por ej. con 2 medias: H0= Las 2 medias poblacionales son iguales H1= Las 2 medias son diferentes (test bilateral o de 2 colas) (test unilateral ó 1 cola superior) H1= La media 2 es mayor que la 1 H1= La media 2 es menor que la 1 (test unilateral ó 1 cola inferior) 2) Decidir el test a usar: Paramétrico (test “t” Student) No Paramétrico (test U de Mann Whitney) 3) Fijar un nivel de probabilidad de equivocarse: Riesgo de equivocarse del 5 ó 1 % 4) Aplicar el test y “aceptar” el resultado

17 Tests paramétricos y no paramétricos
b) Diseño de estudios observacionales Tests paramétricos y no paramétricos Requisitos de los tests paramétricos: La muestra pertenece a una población cuya distribución de probabilidad es conocida (por ej. distribución normal). Se comparan los grupos a través de un “parámetro” de la distribución (por ej: la media en el caso de la distribución normal)(De ahí “paramétricos”) Se utilizan con muestras no excesivamente pequeñas en las que sea posible comprobar la distribución que siguen los datos. Tests no paramétricos: No se presupone que los datos sigan una distribución determinada. Se realizan con procedimientos de ordenación (rangos) y recuento. Se usan con muestras pequeñas (n < 10) en las que se desconoce la distribución que siguen los datos, también para corroborar los resultados obtenidos a partir de los tests paramétricos.

18 Tests paramétricos: La distribución normal (Gaussiana)
b) Diseño de estudios observacionales Tests paramétricos: La distribución normal (Gaussiana) Normal: Normal estandarizada: Entre las funciones de distribución de probabilidad, la más importante es la distribución normal o Gaussiana. Se (Basado en Domenech 1982, “Bioestadística”, Ed. Herder)

19 Otras distribuciones de interés
b) Diseño de estudios observacionales Otras distribuciones de interés Distribución t de Student: Otras distribuciones: Poisson, Ji-cuadrado, binomial. Distribución F de Snedecor : Y así otras muchas distribuciones como la distribución de Poisson, Ji-cuadrado…etc

20 b) Diseño de estudios observacionales
Ejemplo: comparación de 2 medias por el test paramétrico “t de Student” Distribuciones normales Misma varianza 15.2, 16.3, 17.2, 16.1, 14.1, 13.3, 14.2, 13.1, Se quiere determinar si la presión sistólica en hombres y mujeres de Salamanca es la misma Hombres Mujeres Requisitos: Test “t-Student” de datos independientes bilateral (2 colas) Estadístico T Si... Si... (Las medias en las poblaciones de hombres y mujeres no son iguales) (Las medias en las poblaciones de hombres y mujeres son iguales) H1 = Si hay diferencia (p<0.05) H0 = No hay diferencia

21 Test bilateral (2 colas) o unilateral (1 cola)
b) Diseño de estudios observacionales Test bilateral (2 colas) o unilateral (1 cola) Test t-student bilateral con riesgo a = 0.05 Curva distribución “t” Test unilateral cola inferior con a = 0.05 - tc Test unilateral cola superior con a = 0.05 tc

22 Clasicamente: tablas de valores “tc” para 2 colas y 1 cola
b) Diseño de estudios observacionales Clasicamente: tablas de valores “tc” para 2 colas y 1 cola 2 colas 0.05: 2 colas 2.10 0.05: 1 cola 1 cola superior Degrees of freedom = n1 +n2-2 = =18 1.73 Actualmente: ordenadores dan p-valor exacto T El doble

23 b) Diseño de estudios observacionales
Los dos riesgos asociados a un test de hipótesis: Error tipo I (riesgo a) y tipo II (riesgo b) Imaginemos 2 poblaciones y un test unilateral donde el estadístico fuera el valor de la media: Realidad: Acierto Potencia del test = 1-b Simil: declarar culpable a un inocente (a) y viceversa (b). Realidad Decisión test a b m0 m1 Región de aceptación H0 Región de rechazo H0 Región de rechazo H1 Región de aceptación H1 Línea de decisión (riesgo):

24 b) Diseño de estudios observacionales
¿Cómo estimar el Tamaño de muestra y potencia de la prueba para diferentes tests estadísticos (SIMFIT)? Se elige el test deseado y se fijan los correspondientes riesgos y valores: Si se trata de diseñar experimentos a los que se les van a aplicar tests estadísticos de contrastes de hipótesis, por ejemplo de tipo comparación de 2 medias por el test “t”, habrá que calcular el tamaño de muestra necesario para detectar una determinada diferencia entre ellas (si es que existe). Así en el caso

25 Tamaño muestra: n = 21 (n1 = 21 y n2 = 21)
b) Diseño de estudios observacionales Ejemplo: tamaño de muestra y potencia del test para comparación de 2 medias por test “t de student” bilateral Test bilateral (2 colas) a = 0.05 = ; (1-b) = (80 %) Varianza (S2) = 1.0 Diferencia entre medias (d) = 1.0 Fijamos: 21 Curva del % de potencia Tamaño de muestra % de potencia del test Tamaño muestra: n = (n1 = 21 y n2 = 21) Si se trata de diseñar experimentos a los que se les van a aplicar tests estadísticos de contrastes de hipótesis, por ejemplo de tipo comparación de 2 medias por el test “t”, habrá que calcular el tamaño de muestra necesario para detectar una determinada diferencia entre ellas (si es que existe). Así en el caso

26 Tipos de asignación o muestreo :
b) Diseño de estudios observacionales Estimado ya el tamaño de muestra (cuántos) ¿Cómo elegir los sujetos (quiénes)? Muchas veces una investigación consiste en observar una variable en dos grupos, uno de tratamiento (A) y otro de control (B). Tipos de Grupos: Datos independientes Datos apareados Tipos de asignación o muestreo : Probabilísticos Asignación aleatoria simple No Probabilísticos Casos consecutivos Con voluntarios Asignación aleatoria balanceada

27 Procedimientos de aleatorización (¿A o B?)
Asignación aleatoria simple Tirar una moneda al aire (cara asignarles “A” y a cruz asignarles “B”) Generar números aleatorios y a los pares asignarles “A” y a los impares “B” (practicar con SIMFIT). El problema es que por azar los dos grupos pueden estar desequilibrados (con 10 sujetos podrían salir 3 caras (A) y 7 cruces (B) Asignación aleatoria balanceada Se suele hacer en base a generar permutaciones aleatorias: Por ejemplo si hay que asignar 10 sujetos a 2 grupos (A y B) se genera una permutación al azar de los números del 1 al 10 y luego se asignan alternativamente a “A” o “B”. Consiste en asignar aleatoriamente los sujetos pero garantizando que los dos grupos tengan el mismo número. Asignación aleatoria estratificada y balanceada Por ejemplo, si el habito de fumar puede influir en los resultados, los grupos deberían estar balanceados respecto a esa variable (tener mismo número) La asignación hay que realizarla como en el caso anterior para cada uno de los estratos: 10 Fumadores (A y B) y 10 No-fumadores (A y B)

28 Procedimientos de aleatorización en SIMFIT
b) Diseño de estudios observacionales Procedimientos de aleatorización en SIMFIT Generar Permutaciones Aleatorias: Permutación aleatoria de la serie entera 1-10: 9, 3, 4, 2, 6,10,1, 7, 5, 8 A, B, A, B, A, B, A, B, A, B Luego asignamos:

29 Enmascaramiento Etiqueta abierta Ciego Doble ciego

30 Comparando “n” medias (ANOVA de 1 factor) (1/5)
Dieta [colesterol total] Carbohidratos , 130, 20,……….. Grasas , 194, 199,………. Proteinas , 136, 134, ……… H0= Las 3 medias son iguales H1= Al menos 2 medias son distintas Planteamiento Dieta 1 n Dieta 2 n Dieta 3 mezclados N=3n Razonamiento H0=Las 3 dietas producen el mismo colesterol, los datos proceden misma población con s2 Si H0 fuese verdad, entonces la varianza sb2 estimada a partir de las medias (“entre” (bentween) las dietas) habría de ser aproximadamente igual a la varianza promedio sw2 estimada a partir de cada una de las dietas (“dentro” (within) de las dietas), ya que ambas estiman el mismo s2 de una misma población Luego el cociente entre y sb2 y sw2 debería ser aproximadamente 1:

31 Cálculos y tabla final de un ANOVA de 1 factor (2/5)
Las varianzas “entre” (b) y “dentro” (w) se calculan así: Este estadístico “ F ” se compara con la distribución “F” de Snedecor y se determina su “p” valor. (Cuanto más se separe F de 1 (mayor sea F), más probabilidad tiene la hipótesis alternativa) La costumbre es mostrar estos cálculos con la siguiente tabla que es equivalente: Fuente de variación SSQ NDOF MSQ F p Entre Grupos (b) E E E Dentro grupos(w) E E+02 Total E (Suma cuadrados) (Nº grados libertad) (Cuadrado medio)

32 Ejemplo de ANOVA de 1 factor (3/5)
Dieta [colesterol total] Carbohidratos , 130, 20,……….. Grasas , 194, 199,………. Proteinas , 136, 134, ……… Datos ficticios con fines de ejemplo H0= Las 3 medias son iguales H1= Al menos 2 medias son distintas Fuente de variación SSQ NDOF MSQ F p Entre Grupos E E E Dentro grupos E E+02 Total E Luego rechazamos H0 con riesgo p= de equivocarnos (las 3 medias no son iguales, hay diferencia significativa entre ellas).

33 Representación de las medias del ejemplo anterior (4/5)

34 Ejemplo: test de Tukey en ANOVA de 1 factor
Test de Tukey para comparaciones 2 a 2 a posteriori Varianza dentro de grupos (MSQ dentro) Y la p del estadístico Q se obtiene de la distribución q de rango studientizado

35 Ejemplo: test de Tukey en ANOVA de 1 factor
Test de Tukey para comparaciones 2 a 2 a posteriori Test Q de Tukey para 3 medias y 3 comparaciones Columnas Q p % % E * * E * * E NS NS Hay diferencias significativas (p<0.01) entre las medias 2 y 1 y 2 y 3, pero no entre las medias 3 y 1.

36 ¿Cómo estimar el Tamaño de muestra para un ANOVA con SIMFIT?
b) Diseño de estudios observacionales ¿Cómo estimar el Tamaño de muestra para un ANOVA con SIMFIT? Se elige la opción ANOVA y se fijan los respectivos riesgos y valores: Si se trata de diseñar experimentos a los que se les van a aplicar tests estadísticos de contrastes de hipótesis, por ejemplo de tipo comparación de 2 medias por el test “t”, habrá que calcular el tamaño de muestra necesario para detectar una determinada diferencia entre ellas (si es que existe). Así en el caso

37 ¿Cómo estimar el Tamaño de muestra para un ANOVA con SIMFIT?
b) Diseño de estudios observacionales ¿Cómo estimar el Tamaño de muestra para un ANOVA con SIMFIT? Test bilateral (2 colas) a = 0.05 = ; (1-b) = (80 %) Varianza (S2) = 1.0 Diferencia entre medias (d) = 1.0 K = 4 (nº de grupos) n = 20 (tamaño aproximado por grupo) Fijamos: Si se trata de diseñar experimentos a los que se les van a aplicar tests estadísticos de contrastes de hipótesis, por ejemplo de tipo comparación de 2 medias por el test “t”, habrá que calcular el tamaño de muestra necesario para detectar una determinada diferencia entre ellas (si es que existe). Así en el caso

38 Enfoque de un factor a la vez
Variar sucesivamente cada factor en un rango, manteniendo constantes los factores restantes en el nivel de su línea base. Este enfoque desestima el efecto de la interacción entre los factores, que podría existir y ser importante. Normalmente es más interesante estudiar 2 ó 3 factores simultáneamente, con el fin de investigar el efecto de los factores individuales (efectos principales) así como también el efecto debido a las interacciones entre los factores (efecto de interacción). Ing. Felipe Llaugel

39 Comparando medias con más de un factor (ANOVA de 2 factores)
Imaginemos un tratamiento para disminuir el colesterol, donde la variable respuesta que se mide es la concentración de colesterol total en plasma, pero ahora se quieren estudiar 2 factores: “Dieta” con 2 niveles(carbohidratos, grasas) y “Ejercicio” con 2 niveles (poco, mucho). Factor “dieta” Carbohidratos Grasas Factor “ejercicio” 220 190 145 192 188 143 124 210 [Colesterol] Poco Mucho Paciente 1 2 3 4 5 6 7 8 Datos ficticios con fines de ejemplo ……etc Ing. Felipe Llaugel

40 Comparando medias con más de un factor (ANOVA de 2 factores)
Dieta Ejercicio Dieta x ejercicio En SIMFIT es la opción: “Factorial, 2 factores” Ing. Felipe Llaugel


Descargar ppt "Diseño de experimentos"

Presentaciones similares


Anuncios Google