Diseño de experimentos

Slides:



Advertisements
Presentaciones similares
Fco. Javier Burguillo Universidad de Salamanca
Advertisements

Diseño de experimentos
LEONARDO LÓPEZ C. ECONOMIA ESTADISTICA COMPUTARIZADA PARALELO: 261.
PRINCIPIOS DE ESTADÍSTICAS INFERENCIALES PRUEBA DE HIPÓTESIS: MUESTRAS PEQUEÑAS.
TEMA 2: PARÁMETROS ESTADÍSTICOS. ÍNDICE 1. Parámetros estadísticos. 2.Interpretación de la media y desviación típica. 3. Coeficiente de variación.
ESTADÍSTICA II Ing. Danmelys Perozo MSc. Blog:
Diseños de investigación.  Arnau (1995a) define el diseño de investigación como un plan estructurado de acción que, en función de unos objetivos básicos,
PPTCES047MT22-A16V1 Clase Medidas de dispersión y muestreo MT-22.
Bioestadística Distribuciones muestrales para variables cuantitativas.
PRUEBA DE HIPÓTESIS. 1. Una prueba de hipótesis consiste en contrastar dos hipótesis estadísticas. Tal contraste involucra la toma de decisión acerca.
ESTADÍSTICA Mercedes de la Oliva ESTADÍSTICA INFERENCIAL Teorema Central del límite Distribución de media y proporción muestral.
Recordatorio Estadística Paramétrica Se basa en el conocimiento que los datos presentan una distribución estadística conocida y cada distribución tiene.
HERRAMIENTAS ESTADÍSTICAS PARA LA TOMA DE DECISIONES
DOCTORADO EN EDUCACION
Valor que toma la variable aleatoria
Capitulo 3 Análisis descriptivo inferencial: comparaciones de muestras
ESCUELA PROFESIONAL CIENCIA POLITICA Y GOBIERNO
ESTADÍSTICAS INFERENCIALES
Muestreo PRUEBAS Y VALIDACION DE HIPOTESIS Carlos Willian Rincón Pérez
PSICOESTADÍSTICAS INFERENCIALES
Instituto Nacional de Estadística y Geografía
PRUEBA DE HIPÓTESIS: MUESTRAS PEQUEÑAS
Intervalos de Confianza
puede o no ser verdadero, relativo a una o más poblaciones.
7.1 Procedimientos paramétricos para datos cuantitativos
¿Qué es? ¿Para que se utiliza?
“Bootstrap” Jaime Mojica Cuevas
Análisis de varianza Paramétricos vs. No Paramétricos
ESTADÍSTICA UNIDIMENSIONAL
ESTADÍSTICA II Ing. Danmelys Perozo MSc.
INFERENCIA ESTADÍSTICA PARA DOS POBLACIONES
Clase 8: Contraste de Hipótesis
Tamaño de la muestra.
CHI CUADRADO  2 OBJETIVOS –Describir situaciones donde es adecuado la utilización de la prueba de Chi Cuadrado (  2 ) –Formular Hipótesis para diferentes.
¿Cuándo usar esta distribución?
TEMA II. ESTUDIO DE MERCADO 2.2 El muestreo estadístico en la investigación de mercados. Métodos de pronósticos de corto plazo.
DISTRIBUCIÓN GAMMA. La distribución gamma se deriva de la función gamma. La distribución gamma tiene un caso especial que es la distribución exponencial.
REGRESÍON LINEAL SIMPLE
puede o no ser verdadero, relativo a una o más poblaciones.
DISTRIBUCIÓN MUESTRAL DE UNA MEDIA.
ESTADÍSTICA INFERENCIAL
DISEÑO DE EXPERIMENTOS
Tema: Distribución t-Student para una muestra Curso: Seminario de Estadística Aplicada a la Investigación Educacional UNIVERSIDAD NACIONAL DE EDUCACIÓN.
ESTADÍSTICA INFERENCIAL. La estadística Inferencial, es el proceso por el cual se deducen (infieren) propiedades o características de una población a.
“Formulación de Hipótesis Estadística”
COMPARACION DE MEDIAS Para comparar media utilizando la prueba T hay Ttres opciones diferentes utilizando contrastes de hipotesis sobre : PARA UNA MUESTRA.
Tamaño de muestra Ecología Marina. Una población se define como un conjunto de individuos de una especie que habita un área determinada. Los métodos disponibles.
Capítulo 10 Test de Hipótesis Capítulo 10 Test de Hipótesis.
PRUEBAS PARAMETRICAS Y NO PARAMETRICAS. Cómo aplicar las pruebas paramétricas bivariadas t de Student y ANOVA en SPSS. Caso práctico., María José Rubio.
ESTIMACIÓN (Inferencia Estadística) Intervalos de Confianza
AJUSTE DE CURVAS TEMA #10. AJUSTE DE CURVAS Si se necesita la versión simplificada de una función complicada. Una manera de hacerlo es calcular valores.
ANALISIS DE VARIANZA
TEMA: EL PROYECTO DE TESIS: DISEÑO Y ELABORACIÓN. Walter Antonio Campos Ugaz.
DISEÑO Y ANALISIS DE EXPERIMENTOS
INTRODUCCION A LA ESTADÍSTICA INFERENCIAL
Identificación de los efectos de los diseños experimentales.
Dr. Carlomagno Araya Alpízar
INTRODUCCION A LOS CONTRASTES BASADOS EN RANGOS
Fco. Javier Burguillo Universidad de Salamanca
1 TEMA 2. INTRODUCCION A LA ESTADISTICA DESCRIPTIVA E INFERENCIAL 2.1 DEFINIICION 2.2. AZAR Y PROBABILIDAD 2.3 MUESTREO 2.4 ESTIMACION DE PARAMETROS
PRUEBA DE H DE KRUSKAL WALLIS Presenta: LIC. EN BIOLOGÍA JESSICA ALEJANDRA ZAPATA GARCÍA ESTUDIANTE DOCTORADO EN CIENCIAS BIOMÉDICAS 1 BIOESTADÍSTICA DOCTOR.
Tamaño de muestra.
INTRODUCCIÓN A LA ESTADÍSTICA PARA NO ESPECIALISTAS
PRUEBAS ESTADISTICAS NO PARAMETRICAS. Pruebas tradicionales Necesitan la especificación de una distribución Son métodos robustos para las distribuciones.
TRATAMIENTO Y EVALUACION DE RESULTADOS ANALITICOS 1.Conceptos generales sobre la medida. Tipos de errores, concepto, componentes, corrección. Distribución.
1 Afectados de cierto grado de INCERTIDUMBRE SIEMPRE HAY UN ERROR EN SU MEDIDA ESTABLECER LA FIABILIDAD DE LOS DATOS ¿Podemos evaluar la magnitud del error.
DISEÑO Y ANALISIS DE EXPERIMENTOS
ESTADÍSTICA APLICADA  ZEUS DE JESÚS RODRÍGUEZ BUDA  GABRIELA MÁRQUEZ TORRES  MARÍA ENRIQUETA GIL CÓRDOVA  ELIÁN ANTONIO GONZALEZ GARCÍA  CRISTELL.
Transcripción de la presentación:

Diseño de experimentos Tema 4 Diseño de experimentos

Objetivos de hoy Estudios experimentales de laboratorio Aprender a calcular el número de puntos experimentales y su espaciado. Aprender a calcular el número de réplicas. Investigaciones clínicas Aprender a calcular el tamaño de muestra. Aprender a elegir los sujetos.

Etapas de una investigación Análisis : tests estadísticos, ajuste de curvas , …. Exploración de datos Obtención datos, calibrados, etc. Para hacer un buen análisis de datos hay que seguir sistematicamente unos pasos que no se deben omitir. Lo primero de todo es el diseño del experimento (plantearlo correctamente), viene luego la exploración exhaustiva de los datos y por último el análisis propiamente dicho. Veremos brevemente algunas ideas sobre el diseño de experimentos y luego nos centraremos en la exploración de datos que es el tema principal de esta charla. Diseño de experimentos Antecedentes Bibliográficos

Diseño de experimentos = Un asunto de equilibrio Maximizar la posibilidad de distinguir bien un efecto Minimizar costos Evitar la interferencia de variables de confusión (hacer réplicas, elegir muestras al azar)  Cuantificar la precisión y exactitud del efecto (intervalos de confianza, calibrados)  Nº de muestras suficientes pero no innecesarias (Tamaño de muestra y potencia del test estadístico a utilizar)

Diseño: Primero definir bien el tipo de estudio y la técnica estadística que se va a utilizar Determinar la Km y Vmax de una enzima usando ajuste de curvas por regresión no lineal. Estudio experimental delaboratorio (habrá que diseñar el nº de puntos experimentales, espaciado entre puntos, nº de réplicas, etc.) Estudio clínico observacional Estudios de cohortes. Riesgos relativos, proporciones. (Diseñar el tamaño de muestra y potencia de la prueba) Diferencia en la respuesta a dos tratamientos médicos usando comparación de 2 medias por test “t de student”. Estudio clínico de intervención (habrá que diseñar el tamaño de muestra y potencia del test estadístico a utilizar, el tipo de muestreo, etc.)

Diseño de investigaciones experimentales de laboratorio

Diseño en estudios experimentales ( ajuste curvas) Margen de la variable controlada (por ej. [S] o [Fár.]) Normalmente el más amplio posible Nº de puntos experimentales y espaciado. Normalmente Espaciado lineal o logarítmico Espaciado lineal (0.01-1 mM) Espaciado logarítmico(0.01-1 mM) Si se trate de diseñar experimentos del tipo ajuste de curvas, por ejemplo velocidad-[Sustrato], para determinar la Vmax y la Km de una enzima, habrá que proyectar el experimento teniendo en cuenta el margen de la variable controlada (normalmente el más amplio posible), el nº de puntos, el espaciado entre ellos…etc. La simulación por ordenador nos puede ayudar a decidir entre las diferentes posibilidades.

Expresiones para el cálculo de los espaciados Espaciado lineal Xsuperior Xinferior n puntos Espaciado logarítmico Xsuperior Xinferior n puntos y para los puntos de i=2 a i=n se sigue esta expresión: Para todos los puntos: Para el punto 1: Si se trate de diseñar experimentos del tipo ajuste de curvas, por ejemplo velocidad-[Sustrato], para determinar la Vmax y la Km de una enzima, habrá que proyectar el experimento teniendo en cuenta el margen de la variable controlada (normalmente el más amplio posible), el nº de puntos, el espaciado entre ellos…etc. La simulación por ordenador nos puede ayudar a decidir entre las diferentes posibilidades.

Necesidad de hacer réplicas Fuentes de variabilidad De muestreo (preparación muestra): Se repite toma de muestra y tratamiento de la muestra ¡CV(%) grande! Enzima Sustrato + 2) De técnica analítica: Se repite la medida de absorbancia, fluorescencia…. ¡CV(%) pequeño!

Se suelen hacer réplicas de muestreo Enzima + Sustrato 1 Réplicas de muestreo (3-5 réplicas a cada sustrato) Se toma una alícuota de cada muestra Medida Absorbancia No suele ser necesario hacer réplicas de técnica (basta 1 medida a cada muestra)

¿Cuántas réplicas se deben hacer? 1) Cuando se desea estimar la media: nº réplicas CV(%) 1 2 3 4 5 (La media se estabiliza a partir de 3) 2) Cuando se desea estimar la desviación estándar: nº réplicas CV(%) 1 2 3 4 5 (La desviación estándar se estabiliza a partir de 5)

Simulaciones por ordenador (SIMFIT) a) Diseño de estudios experimentales Simulaciones por ordenador (SIMFIT) Simular datos exactos, por ejemplo: [S] necesaria [S] v

Diseño de investigaciones clínicas: a) Observacionales b) Experimentales (de intervención)

Desviación Estándar (s) Diseño de estudios Población Muestra Subconjunto individuos Conjunto todos los individuos Inferencia estadística Media (m) Desviación Estándar (s) Media

Pasos en tests de contraste de hipótesis Diseño en estudios Pasos en tests de contraste de hipótesis 1) Decidir hipótesis nula y alternativa a comparar, por ej. con 2 medias: H0= Las 2 medias poblacionales son iguales H1= Las 2 medias son diferentes (test bilateral o de 2 colas) (test unilateral ó 1 cola superior) H1= La media 1 es mayor que la 2 H1= La media 1 es menor que la 2 (test unilateral ó 1 cola inferior) 2) Decidir el test a usar: Paramétrico (test “t” Student) No Paramétrico (test U de Mann Whitney) 3) Fijar un nivel de probabilidad de equivocarse: Riesgo de equivocarse al rechazar H0 siendo verdadera del 5 ó 1 % 4) Aplicar el test y “aceptar” el resultado

Tests paramétricos y no paramétricos Diseño de estudios Tests paramétricos y no paramétricos Requisitos de los tests paramétricos: La muestra pertenece a una población cuya distribución de probabilidad es conocida (por ej. distribución normal). Se comparan los grupos a través de un “parámetro” de la distribución (por ej: la media en el caso de la distribución normal)(De ahí “paramétricos”) Se utilizan con muestras no excesivamente pequeñas en las que sea posible comprobar la distribución que siguen los datos. Tests no paramétricos: No se presupone que los datos sigan una distribución determinada. Se realizan con procedimientos de ordenación (rangos) y recuento. Se usan con muestras pequeñas (n < 10) en las que no se conoce la distribución que siguen los datos, también para corroborar los resultados obtenidos a partir de los tests paramétricos.

Tests paramétricos: La distribución normal (Gaussiana) Diseño de estudios Tests paramétricos: La distribución normal (Gaussiana) Normal: Normal estandarizada: Entre las funciones de distribución de probabilidad, la más importante es la distribución normal o Gaussiana. Se Curva simétrica respecto al 0 (valores positivos y negativos (Basado en Domenech 1982, “Bioestadística”, Ed. Herder)

Otras distribuciones de interés Diseño de estudios Otras distribuciones de interés Distribución t de Student: Otras distribuciones: Poisson, Ji-cuadrado, binomial. Distribución F de Snedecor : Y así otras muchas distribuciones como la distribución de Poisson, Ji-cuadrado…etc

Diseño de estudios Ejemplo: comparación de 2 medias por el test paramétrico “t de Student” de datos independientes Distribuciones normales Misma varianza 15.2, 16.3, 17.2, 16.1,...........15.7 14.1, 13.3, 14.2, 13.1,...........12.7 Se quiere determinar si la presión sistólica en hombres y mujeres de Salamanca es la misma Hombres Mujeres Requisitos: Test “t-Student” de datos independientes bilateral (2 colas) Estadístico T Si... (Las medias en las poblaciones de hombres y mujeres son iguales) H0 = No hay diferencia (p<0.05) Si... (Las medias en las poblaciones de hombres y mujeres no son iguales) H1 = Si hay diferencia

Test bilateral (2 colas) o unilateral (1 cola) Diseño de estudios Test bilateral (2 colas) o unilateral (1 cola) Test t-student bilateral con riesgo a = 0.05 Curva distribución “t” Test unilateral cola inferior con a = 0.05 - tc Test unilateral cola superior con a = 0.05 tc

Clasicamente: tablas de valores “tc” para 2 colas y 1 cola Diseño de estudios Clasicamente: tablas de valores “tc” para 2 colas y 1 cola 2 colas 0.05: 2 colas 2.10 0.05: 1 cola 1 cola superior Degrees of freedom = n1 +n2-2 = 10 +10 - 2 =18 1.73 Actualmente: ordenadores dan p-valor exacto no el tc que hay que sobrepasar T Estadístico T El doble

Diseño de estudios ¿Cómo estimar el Tamaño de muestra y potencia de un test estadístico (SIMFIT)? Se elige el test deseado y se fijan los correspondientes riesgos y valores: Si se trata de diseñar experimentos a los que se les van a aplicar tests estadísticos de contrastes de hipótesis, por ejemplo de tipo comparación de 2 medias por el test “t”, habrá que calcular el tamaño de muestra necesario para detectar una determinada diferencia entre ellas (si es que existe). Así en el caso

Riesgos al tomar decisiones Los datos pueden refutarla Es la que se acepta si las pruebas no indican lo contrario El riesgo de rechazarla por error tiene graves consecuencias H0: Hipótesis nula Es inocente H1: Hipótesis alternativa Es culpable No debería ser aceptada sin una gran evidencia a favor. El riego de rechazarla por error tiene consecuencias consideradas menos graves que la anterior Basado en: Fco. Javier Barón (U. Málaga)

Diseño de estudios Los dos riesgos asociados a un test de hipótesis: Error tipo I (riesgo a) y tipo II (riesgo b) Decisión test Acierto H0 Potencia del test = 1-b Realidad Simil: declarar culpable a un inocente (a) y viceversa (b).

Tamaño muestra: n = 21 (n1 = 21 y n2 = 21) Diseño de estudios Ejemplo: tamaño de muestra y potencia del test para comparación de 2 medias por test “t de student” 2 colas Test 2 colas (bilateral)) a = 0.05 = 0.20 ; (1-b) = 0.80 (80 % potencia) Varianza (S2) = 1.0 Diferencia entre medias (d) = 1.0 Fijamos: 21 Curva del % de potencia Tamaño de muestra % de potencia del test Tamaño muestra: n = 21 (n1 = 21 y n2 = 21) Si se trata de diseñar experimentos a los que se les van a aplicar tests estadísticos de contrastes de hipótesis, por ejemplo de tipo comparación de 2 medias por el test “t”, habrá que calcular el tamaño de muestra necesario para detectar una determinada diferencia entre ellas (si es que existe). Así en el caso

Tipos de asignación o muestreo : Diseño de estudios Estimado ya el tamaño de muestra (cuántos) ¿Cómo elegir los sujetos (quiénes)? Muchas veces una investigación consiste en observar una variable en dos grupos, uno de tratamiento (A) y otro de control (B). Tipos de Grupos: Datos independientes Datos apareados Tipos de asignación o muestreo : Probabilísticos Muestreo aleatorio simple No Probabilísticos Casos consecutivos Con voluntarios Muestreo aleatorio balanceado Muestreo estratificado proporcional Muestreo estratificado balanceado

Procedimientos de aleatorización (¿A o B?) Asignación aleatoria simple Tirar una moneda al aire (cara asignarles “A” y a cruz asignarles “B”) Generar números aleatorios y a los pares asignarles “A” y a los impares “B” (practicar con SIMFIT). El problema es que por azar los dos grupos pueden estar desequilibrados (con 10 sujetos podrían salir 3 caras (A) y 7 cruces (B) Asignación aleatoria balanceada Se suele hacer en base a generar permutaciones aleatorias: Por ejemplo si hay que asignar 10 sujetos a 2 grupos (A y B) se genera una permutación al azar de los números del 1 al 10 y luego se asignan alternativamente a “A” o “B”. Consiste en asignar aleatoriamente los sujetos pero garantizando que los dos grupos tengan el mismo número. Asignación aleatoria estratificada y balanceada Por ejemplo, si el habito de fumar puede influir en los resultados, los grupos deberían estar balanceados respecto a esa variable (tener mismo número) La asignación hay que realizarla como en el caso anterior para cada uno de los estratos: 10 Fumadores (A y B) y 10 No-fumadores (A y B)

Procedimientos de aleatorización en SIMFIT b) Diseño de estudios observacionales Procedimientos de aleatorización en SIMFIT Ejemplo de asignación aleatoria blanceada en dos grupos Se generan permutaciones aleatorias: Permutación aleatoria de la serie entera 1-10: 9, 3, 4, 2, 6,10,1, 7, 5, 8 A, B, A, B, A, B, A, B, A, B Luego asignamos: