Hipótesis para dos Muestras

Slides:



Advertisements
Presentaciones similares
DISEÑO DE EXPERIMENTOS EXPERIMENTOS DE COMPARACIÓN SIMPLE
Advertisements

DSITRIBUCION T DE STUDENT.
UNIVERSIDAD NACIONAL DE EDUCACIÓN Alma Máter del Magisterio Nacional
ANOVA DE UN FACTOR.
Intervalos de Confianza para la Media de la Población
DISEÑO DE EXPERIMENTOS
Clase No. 1.
Curso de Bioestadística Parte 9 Comparación de dos medias
MÉTODOS Y DISEÑOS DE INVESTIGACIÓN METODOLOGÍAS DE INVESTIGACIÓN
Tema 15. Contraste de hipótesis: Planteamiento de las hipótesis
Demostración de Asociación
Pruebas de hipótesis: Media de una población © Pedro Juan Rodríguez Esquerdo Departamento de Matemáticas Recinto de Río Piedras Universidad de.
Test de Hipótesis.
Inferencia Estadística
Contraste de Hipótesis
De la muestra a la población
KRUSKAL WALLIS Jorge Iván Betancur Marta Isabel Naranjo García
Hipótesis de dos muestras Capitulo 8. Introducción Comparación de dos muestras para inferir si las poblaciones son distintas Distribución de F - descrita.
Comprobación de diferencias entre medias
Angela María Serna López Johana Elena Cortés Karina Mustiola Calleja
La prueba U DE MANN-WHITNEY
PRUEBAS DE HIPOTESIS Un grupo - medias (s conocida)
Contraste de Hipótesis ETSITGC Madrid Unidad Docente de Matemáticas.
INFERENCIA ESTADÍSTICA
puede o no ser verdadero, relativo a una o más poblaciones.
PRUEBAS DE HIPOTESIS HIPOTESIS
Prueba de Hipótesis La Prueba t Carlos B. Ruiz-Matuk.
Supongamos que seleccionamos al azar a dos alumnos de dos cursos diferentes que llamaremos D8 y C1…
METODOLOGÍA DE INVESTIGACIÓN Titular: Agustín Salvia
Estimación por Intervalos de confianza
Introducción Media y varianza poblacional Sea
COMPARACIONES PAREADAS
Análisis de varianza Análisis de varianza de un factor
MUESTREO DE ACEPTACIÓN DE LOTES POR VARIABLES
Tests de hipótesis Los tres pasos básicos para testear hipótesis son
Clase 5 Hipótesis de diferencias de grupos
Principios de Bioestadística: «PRUEBA t»
REGRESION Y CORRELACION
UNIVERSIDAD INCA GARCILASO DE LA VEGA
Pronósticos, Series de Tiempo y Regresión
Universidad de Chile Facultad de Ciencias Químicas y Farmacéuticas
Estadística Administrativa II
ESTADÍSTICA BÁSICA EN ECOLOGÍA EVOLUTIVA Juan J. Soler Cruz Estación Experimental de Zonas Áridas Almería.
Inferencias con datos categóricos
Unidad V: Estimación de
DISTRIBUCION NORMAL Mario Briones L. MV, MSc 2005.
Métodos de calibración: regresión y correlación
Introducción La inferencia estadística es el procedimiento mediante el cual se llega a inferencias acerca de una población con base en los resultados obtenidos.
Análisis Cuantitativo de Datos (Básico)
Inferencia Estadística
TAMAÑO MINIMO DE MUESTRA PARA COMPARACIONES DE PROMEDIOS Mario Briones L. MV, MSc 2005.
La Distribución Normal.
Pruebas de hipótesis.
COMPROBACION DE HIPOTESIS SOBRE DOS PROMEDIOS Mario Briones L. MV, MSc 2005.
BASES PARA EL RAZONAMIENTO EN ESTADÍSTICA INFERENCIAL
INTERVALO DE CONFIANZA
Prueba de Hipótesis Una hipótesis estadística es un supuesto que se establece sobre las características de una distribución poblacional El estudio se plantea.
CISO 3155: Capítulo 91 Evaluando los promedios de dos grupos distintos Capítulo 9.
INFERENCIA ESTADÍSTICA
Metodología de la Investigación Cát. I
UNIDAD I.- Analisis 3.4 Prueba de Hipotesis.
INTRODUCCIÓN AL ANÁLISIS DE DATOS CATEGÓRICOS. Temas Carácterísticas de la distribución Chi-cuadrada Prueba de bondad de ajustes Prueba de homogeneidad.
DISTRIBUCIÓN “t” DE STUDENT
RESUMEN DE LA DISTRIBUCION MUESTRAL PARA LA MEDIA MUESTRAL X INTERVALOS DE CONFIANZA PARA LA MEDIA POBLACIONAL  TIPO DE PROBLEMA ESPERANZA Y VARIANZA.
Bioestadística Inferencia estadística y tamaño de muestra
Estimación estadística
Viviana Acosta Estadística II. Que es Es una distribución de probabilidad que surge del problema de estimar la media de una población normalmente distribuida.
PRUEBA DE SIGNIFICANCIA
DISTRIBUCIÓN “T” DE STUDENT MARCELA MENDIVELSO III SEMESTRE.
Transcripción de la presentación:

Hipótesis para dos Muestras Con frecuencia es necesario la comparación de dos estadísticos (media, mediana, varianza, coeficiente de variación o índices de diversidad). La comparación se realiza para inferir si existen diferencias entre dos poblaciones muestreadas. Estadística Biología Marina 2003

Distribución de Student Es una prueba estadística para evaluar si dos grupos difieren entre sí de manera significativa respecto a sus medias. Se simboliza por la letra “t”. Estadística Biología Marina 2003

Es análoga a la distribución Z ES corresponde al error estándar de la muestra, el que puede ser definido por el error en el muestreo, o la desviación promedio de un estimado de los valores reales de la población. Estadística Biología Marina 2003

20 30 me Si el ajuste entre lo observado y lo esperado es pobre, entonces en base de la precisión de la medición, se espera rechazar Ho. Acepto H0 Frecuencia 20 30 40 50 60 10 me Rechazo H0 Observado Esperado Largo de caninos Estadística Biología Marina 2003

“Dependiendo de lo que nosotros estemos interesados en probar o inferir sobre la población, la prueba de hipótesis va a ser una o dos colas.” Estadística Biología Marina 2003

Hipótesis de dos colas (2). Nos interesa determinar si existe o no diferencia entre dos medias: Ho: Media A = Media B Ha: Media A  Media B Estadística Biología Marina 2003

Áreas de aceptación y rechazo en t-test de dos colas. Ho: Media A = Media B Ha: Media A  Media B Estadística Biología Marina 2003

Hipótesis de una cola (1). Se aplica cuando existe una presunción de que no solo existen diferencia entre las muestras. Inferimos si el tratamiento producirá una diferencia orientada en alguna dirección en particular. La región de rechazo corresponde a un lado de la distribución. Estadística Biología Marina 2003

La media del grupo al que se aplicó el tratamiento será más grande que la media del grupo control. Ho: Media Control  Media del tratamiento Ha: Media Control < Media del tratamiento Estadística Biología Marina 2003

La media del grupo al que se aplicó el tratamiento será más pequeña que la media del grupo control. Ho: Media Control  Media del tratamiento Ha: Media Control > Media del tratamiento Estadística Biología Marina 2003

Ejemplo Mediciones de la concentración de monóxido de carbono en el aire mg/m3 realizadas dentro de un taller mecánico. La concentración máxima permitida es de 10.00 mg/m3. 10.25 10.37 10.66 10.47 10.56 10.22 10.44 10.38 10.48 10.63 10.40 10.39 10.26 10.32 10.35 10.54 10.33 10.68 ¿Las mediciones se diferencian del valor permitido? Estadística Biología Marina 2003

¿Cual sería la hipótesis?: 10.25 10.37 10.66 10.47 10.56 10.22 10.44 10.38 10.48 10.63 10.40 10.39 10.26 10.32 10.35 10.54 10.33 10.68 ¿Cual sería la hipótesis?: Ho: Media = 10.00 mg/m3 Ha: Media  10.00 mg/m3 T-test: Calcular media, varianza, Error estándar. Estadística Biología Marina 2003

Resultados Media = 10.43 mg/m3 Varianza = 0.019 mg/m3 ER = 0.033 mg/m3 10.43 – 10.00 = 13.43 0.033 Grados de libertad = n-1 El valor crítico se busca en la tabla B.3 t 0.05 (2), 17 = 2.110 Estadística Biología Marina 2003

Conclusión Se rechaza la Ho. Existen diferencias significativas entre la concentración de dióxido de carbono máxima permitida y los valores estimados en el taller mecánico (t test P < 0.001) Estadística Biología Marina 2003

¿La concentración de dióxido de carbono es más alta que los valores permitidos? Hipótesis: Ho: Media Control (10.00 mg/m3)  Media del tratamiento Ha: Media Control (10.00 mg/m3) < Media del tratamiento t = 13.43 t 0.05 (1), 17 = 1.753 ¿Conclusión? Estadística Biología Marina 2003

“Las concentraciones de dióxido de carbono estimadas en el taller mecánico, son significativamente mayores a la concentración de dióxido de carbono máxima permitida (t test P < 0.001)” Estadística Biología Marina 2003

Tener en cuenta: Los valores tabulados de los test de una cola son menores que los de dos colas. Las hipótesis estadísticas (una o dos colas) deben ser declaradas antes de examinar los datos y deben reflejar la pregunta de interés sobre la población. Estadística Biología Marina 2003

Ejemplo 1: Una máquina producía tapas de 0.05 pulgadas de espesor. Para determinar si sigue en buen estado, se toma una muestra de 10 tapas, que dan un espesor medio de 0.053 ± 0.003 in. ¿La maquina sigue produciendo tapas de 0.05 in? Estadística Biología Marina 2003

Ejemplo 2: Una prueba de 6 linternas de cultivo de ostión dio una tensión media de ruptura de 7150 ± 145 lb. El fabricante las promocionaba con una resistencia de 8000 lb. En base a estos datos: ¿Las linternas resistirán menos que lo anunciado por el fabricante? Estadística Biología Marina 2003

Comparación de medias de dos muestras. Control Frecuencia s2C s2T Tratamiento Apropiado cuando existen dos grupos para comparar (e.g. control y tratamiento). En principio, podemos comparar cualquier estadístico de una muestra, e.g. medias, medianas, varianzas, etc. Estadística Biología Marina 2003

Por Ejemplo: Dos muestras (1, 2) con valores medios que difieren en cierta cantidad . ¿Cual es la probabilidad p de observar esta diferencia bajo la hipótesis H0 que las dos medias son de echo iguales? Muestra 2 Muestra 1 Frecuencia Estadística Biología Marina 2003

Dependiendo de las características de nuestras muestras, existen dos opciones de comparación t-test para muestras independientes. t-test para muestras agrupadas (pareadas). Estadística Biología Marina 2003

t-test para muestras independientes. Dieta En el test de muestras independientes, no existe una correlación experimental o “asociación” entre las observaciones (muestras) de los dos grupos. E.g. Peso a los 6 meses de una muestra aleatoria de diferentes cerdos aliementados con dos dietas distintas. Estadística Biología Marina 2003

t-test para muestras agrupadas. En los test de muestras pareadas, las observaciones (muestras) en un grupo se encuentran relacionadas con las observaciones en el otro grupo. E.g. Peso a los 6 meses de 2 cerdos, ambos de la misma madre, alimentados con diferentes dietas. Dieta Progenitora Estadística Biología Marina 2003

t-test para muestras independientes. EJEMPLO: Droga B Droga G 8.8 9.9 8.4 9.0 7.9 11.1 8.7 9.6 9.1 10.4 9.5 n1 = 6 n2 = 7 Gl1 =5 Gl2 = 6 Media 1 = 8.75 min Media 2 = 9.74 min SS1 = 1.6950 min2 SS2 = 4.0171 min2 Tiempo de coagulación sanguínea, de un grupo de 13 personas, probando las drogas (B Y G): Estadística Biología Marina 2003

Ho: Media Droga B = Media Droga G Ha: Media Droga B  Media Droga G La interrogante en el experimento era si la sangre de las personas tratadas con la droga B presentaba el mismo tiempo medio de coagulación que las personas tratadas con la droga G. ¿HIPÓTESIS? Ho: Media Droga B = Media Droga G Ha: Media Droga B  Media Droga G Estadística Biología Marina 2003

Cálculo: El cálculo es análogo a la formula de Student ya conocida. De esta manera el estadístico t-Student para dos muestras es: Con Gl = (n1 + n2) – k Estadística Biología Marina 2003

El error estándar es: Si n1 y n2 son iguales 2003 Estadística Biología Marina 2003

De vuelta con el ejemplo: Droga B Droga G 8.8 9.9 8.4 9.0 7.9 11.1 8.7 9.6 9.1 10.4 9.5 n1 = 6 n2 = 7 Gl1 =5 Gl2 = 6 Media 1 = 8.75 min Media 2 = 9.74 min SS1 = 1.6950 min2 SS2 = 4.0171 min2 t0.05(2), 11 = 2.201 ¿CONCLUSIÓN? Estadística Biología Marina 2003

Rechazamos Ho: El tiempo de coagulación de la sangre es diferente entre los grupos de personas tratadas con diferentes tipos de drogas (t-test 0.02 < P <0.05). Estadística Biología Marina 2003

Requisitos para aplicar el t-test: Ambas muestras son obtenidas al azar. Las muestras son independientes unas de otras. La variable debe ser continua. Las variables deber tener distribución normal. Las varianzas deben ser homocedásticas. Estadística Biología Marina 2003

Homocedásticidad de varianzas: TEST DE FISHER (F) Trabaja verificando si las varianzas de los grupos que estamos comparando son significativamente iguales o distintas. Las hipótesis son: Ho: Existe homocedásticidad de varianzas entre el grupo 1 y el grupo 2. Ha: No Existe homocedásticidad de varianzas entre el grupo 1 y el grupo 2. Estadística Biología Marina 2003

El valor critico se busca en la tabla Fisher como : F0.05 (2) n1,n2 Cálculo de Fisher (F): Siempre se debe tener presente que la varianza mayor debe ir en el numerador, y la menor en el denominador. Los grados de libertad son: Gl= n1, n2 El valor critico se busca en la tabla Fisher como : F0.05 (2) n1,n2 Estadística Biología Marina 2003

Test de Fisher con los datos del ejemplo: Droga B Droga G 8.8 9.9 8.4 9.0 7.9 11.1 8.7 9.6 9.1 10.4 9.5 n1 = 6 n2 = 7 Gl1 =5 Gl2 = 6 Media 1 = 8.75 min Media 2 = 9.74 min SS1 = 1.6950 min2 SS2 = 4.0171 min2 S21= 0.3390 y S22= 0.6695 F = 0.6695/0.339 = 1.9749 F 0.05 (2) 7,6 = 5.70 ¿CONCLUSIÓN? Estadística Biología Marina 2003

Para tener presente: El test de Fisher es un prerrequisito del test de Student entonces: Primero debemos determinar si las varianzas son homocedásticas para luego realizar el t-test. Estadística Biología Marina 2003

Otros datos… La capacidad del t-test se relaciona directamente con el cumplimiento de sus requisitos. Si éstos no se cumplen existen otras alternativas (no paramétricas). En general, si se aumenta el tamaño de las muestras el test tiende a ser más robusto. Estadística Biología Marina 2003

Es posible realizar un t-test, con la aproximación de Welsh. Si tenemos dos medias con distribución normal, pero con varianzas heterocedásticas. Es posible realizar un t-test, con la aproximación de Welsh. Estadística Biología Marina 2003

El Calculo es: Si  no es un entero se aproxima al entro próximo más pequeño. De esta forma se paga por heterocedasticidad con una disminución en . Estadística Biología Marina 2003

Ejemplo: Un jardinero, desea utilizar un nuevo tipo de fertilizante aparecido en el mercado que promociona un mejer crecimiento que el fertilizante que ha utilizado siempre. El jardinero era un genio en estadística y diseño un experimento para probar si el nuevo fertilizante produce plantas más grandes que el antiguo. Estadística Biología Marina 2003

Los datos son: Fertilizante viejo Fertilizante nuevo 48.2 52.3 54.6 57.4 58.3 55.6 47.8 53.2 51.4 61.3 52.0 58.0 55.2 59.8 49.1 54.8 49.9 52.6 Crecimiento de plantas (cm) después de dos meses de plantadas: Plantear hipótesis. Realizar el test. Conclusión. Estadística Biología Marina 2003

Independencia de las observaciones La ausencia de independencia usualmente ocurre porque las observaciones están correlacionadas en el tiempo o espacio. E.g. Mediciones de concentración de arsénico río arriba y río abajo desde el punto donde se piensa que es la fuente. Río arriba Río abajo Estadística Biología Marina 2003

Test student para muestras agrupadas. En este tipo de test, las muestras del grupo 1 se encuentran relacionadas con las del grupo 2. Es decir se encuentran “Pareados”. Aquí,no se analizan los datos originales, sino que se trabaja con las diferencias entre los miembros de cada par. Estadística Biología Marina 2003

t-Test para muestras agrupadas Es utilizado cuando un mismo objeto es medido bajo diferentes tratamientos (e.g. cambio en el peso de una rata antes y después del tratamiento con una droga)… … o cuando existe una correlación entre las observaciones de las dos muestras. Use paired t-statistic. Estadística Biología Marina 2003

t-test para muestras agrupadas- versus muestras independientes. Cuando existe una correlación, el t-test agrupado es mucho mas poderoso porque la desviación estándar de las diferencias promedios es usualmente mucho menor que el error estándar de las diferencias entre las dos medias. Si no existe una correlación, el test pareado es más débil porque N es el número de parejas, no el número de observaciones. s2a = 8.67, s2d= 21.58, s2DW = 2.81 Estadística Biología Marina 2003

Queremos verificar la hipótesis nula de que el largo de la pata delantera y la pata trasera de los Pudú del zoológico, es el mismo. De esta manera los datos son tabulados en pares Ciervo Pata Delantera (X1) Pata Trasera (X2) Diferencia (d = X1 – X2) 1 142 138 4 2 140 136 3 144 147 -3 139 5 143 -1 6 146 141 7 149 8 150 145 9 10 148 Estadística Biología Marina 2003

Cálculo del test: Las hipótesis estadísticas son: Ho: μ1 – μ2 = 0 o Ho: μd = 0 Ha: μ1 – μ2  0 o Ha: μd  0 Las formulas del test son: donde Sd (error estándar) es: Los grados de libertad son: Gl= n-1 A que se parece esto? Estadística Biología Marina 2003

Para el ejemplo: ¿CONCLUSIÓN? 2003 n = 10 Gl = 10-1 = 9 Ciervo Pata Delantera (X1) Pata Trasera (X2) Diferencia (d = X1 – X2) 1 142 138 4 2 140 136 3 144 147 -3 139 5 143 -1 6 146 141 7 149 8 150 145 9 10 148 n = 10 Gl = 10-1 = 9 d media= 3.3 cm S2d = 9.34 cm2 t0.05(2),9= 2.262 ¿CONCLUSIÓN? Estadística Biología Marina 2003

Se rechaza Ho. Se determinó que el largo de las patas delanteras difiere significativamente con el largo de las patas traseras de los Pudú del zoológico metropolitano (t-test 0.005 < P < 0.01). Estadística Biología Marina 2003

Para tener en cuenta: El t-test de pares agrupados no asume normalidad de los datos. Tampoco asume homocedásticidad de las varianzas. Pero si asume que las diferencias de los pares si se distribuyen de forma normal. Estadística Biología Marina 2003

¿Porque no comparar mas de dos grupos? Un poco mas del t-test. Solo se han analizado casos desde comparamos dos grupos. ¿Porque no comparar mas de dos grupos? Estadística Biología Marina 2003

Riesgo de cometer un error de tipo I Número de Comparaciones % Riesgo de cometer error Tipo I 2 5 3 12 4 20 6 37 8 51 10 63 Corrección de Bonferroni: Se aplica para realizar este tipo de comparaciones múltiples. Produce un cambio en el valor de  (0.05). Para corregir se divide el valor de  por el número (P) de comparaciones. De esta manera ´=  / P. Para 5 comparaciones: ´=0.05/5 = 0.01 Estadística Biología Marina 2003

Plantear hipótesis. Realizar el test. Conclusión. 2003 Ejemplo: Se esta probando la efectividad de una droga que permite bajar de peso. El medicamento se le administró a 9 voluntarios a los que se les midió la cantidad de grasa corporal (kg) antes y después de dos semanas de iniciado el tratamiento. Antes Después 1 22.50 19.20 2 24.10 20.20 3 22.60 20.60 4 22.00 19.60 5 23.60 6 23.20 21.40 7 22.40 19.80 8 23.00 19.40 9 20.90 17.90 Plantear hipótesis. Realizar el test. Conclusión. Estadística Biología Marina 2003