La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Hipótesis para dos Muestras

Presentaciones similares


Presentación del tema: "Hipótesis para dos Muestras"— Transcripción de la presentación:

1 Hipótesis para dos Muestras
Con frecuencia es necesario la comparación de dos estadísticos (media, mediana, varianza, coeficiente de variación o índices de diversidad). La comparación se realiza para inferir si existen diferencias entre dos poblaciones muestreadas. Estadística Biología Marina 2003

2 Distribución de Student
Es una prueba estadística para evaluar si dos grupos difieren entre sí de manera significativa respecto a sus medias. Se simboliza por la letra “t”. Estadística Biología Marina 2003

3 Es análoga a la distribución Z
ES corresponde al error estándar de la muestra, el que puede ser definido por el error en el muestreo, o la desviación promedio de un estimado de los valores reales de la población. Estadística Biología Marina 2003

4 20 30 me Si el ajuste entre lo observado y lo esperado es pobre, entonces en base de la precisión de la medición, se espera rechazar Ho. Acepto H0 Frecuencia 20 30 40 50 60 10 me Rechazo H0 Observado Esperado Largo de caninos Estadística Biología Marina 2003

5 “Dependiendo de lo que nosotros estemos interesados en probar o inferir sobre la población, la prueba de hipótesis va a ser una o dos colas.” Estadística Biología Marina 2003

6 Hipótesis de dos colas (2).
Nos interesa determinar si existe o no diferencia entre dos medias: Ho: Media A = Media B Ha: Media A  Media B Estadística Biología Marina 2003

7 Áreas de aceptación y rechazo en t-test de dos colas.
Ho: Media A = Media B Ha: Media A  Media B Estadística Biología Marina 2003

8 Hipótesis de una cola (1).
Se aplica cuando existe una presunción de que no solo existen diferencia entre las muestras. Inferimos si el tratamiento producirá una diferencia orientada en alguna dirección en particular. La región de rechazo corresponde a un lado de la distribución. Estadística Biología Marina 2003

9 La media del grupo al que se aplicó el tratamiento será más grande que la media del grupo control.
Ho: Media Control  Media del tratamiento Ha: Media Control < Media del tratamiento Estadística Biología Marina 2003

10 La media del grupo al que se aplicó el tratamiento será más pequeña que la media del grupo control.
Ho: Media Control  Media del tratamiento Ha: Media Control > Media del tratamiento Estadística Biología Marina 2003

11 Ejemplo Mediciones de la concentración de monóxido de carbono en el aire mg/m3 realizadas dentro de un taller mecánico. La concentración máxima permitida es de mg/m3. 10.25 10.37 10.66 10.47 10.56 10.22 10.44 10.38 10.48 10.63 10.40 10.39 10.26 10.32 10.35 10.54 10.33 10.68 ¿Las mediciones se diferencian del valor permitido? Estadística Biología Marina 2003

12 ¿Cual sería la hipótesis?:
10.25 10.37 10.66 10.47 10.56 10.22 10.44 10.38 10.48 10.63 10.40 10.39 10.26 10.32 10.35 10.54 10.33 10.68 ¿Cual sería la hipótesis?: Ho: Media = mg/m3 Ha: Media  mg/m3 T-test: Calcular media, varianza, Error estándar. Estadística Biología Marina 2003

13 Resultados Media = 10.43 mg/m3 Varianza = 0.019 mg/m3 ER = 0.033 mg/m3
10.43 – 10.00 = 13.43 0.033 Grados de libertad = n-1 El valor crítico se busca en la tabla B.3 t 0.05 (2), 17 = 2.110 Estadística Biología Marina 2003

14 Conclusión Se rechaza la Ho.
Existen diferencias significativas entre la concentración de dióxido de carbono máxima permitida y los valores estimados en el taller mecánico (t test P < 0.001) Estadística Biología Marina 2003

15 ¿La concentración de dióxido de carbono es más alta que los valores permitidos?
Hipótesis: Ho: Media Control (10.00 mg/m3)  Media del tratamiento Ha: Media Control (10.00 mg/m3) < Media del tratamiento t = 13.43 t 0.05 (1), 17 = 1.753 ¿Conclusión? Estadística Biología Marina 2003

16 “Las concentraciones de dióxido de carbono estimadas en el taller mecánico, son significativamente mayores a la concentración de dióxido de carbono máxima permitida (t test P < 0.001)” Estadística Biología Marina 2003

17 Tener en cuenta: Los valores tabulados de los test de una cola son menores que los de dos colas. Las hipótesis estadísticas (una o dos colas) deben ser declaradas antes de examinar los datos y deben reflejar la pregunta de interés sobre la población. Estadística Biología Marina 2003

18 Ejemplo 1: Una máquina producía tapas de 0.05 pulgadas de espesor. Para determinar si sigue en buen estado, se toma una muestra de 10 tapas, que dan un espesor medio de ± in. ¿La maquina sigue produciendo tapas de 0.05 in? Estadística Biología Marina 2003

19 Ejemplo 2: Una prueba de 6 linternas de cultivo de ostión dio una tensión media de ruptura de 7150 ± 145 lb. El fabricante las promocionaba con una resistencia de 8000 lb. En base a estos datos: ¿Las linternas resistirán menos que lo anunciado por el fabricante? Estadística Biología Marina 2003

20 Comparación de medias de dos muestras.
Control Frecuencia s2C s2T Tratamiento Apropiado cuando existen dos grupos para comparar (e.g. control y tratamiento). En principio, podemos comparar cualquier estadístico de una muestra, e.g. medias, medianas, varianzas, etc. Estadística Biología Marina 2003

21 Por Ejemplo: Dos muestras (1, 2) con valores medios que difieren en cierta cantidad . ¿Cual es la probabilidad p de observar esta diferencia bajo la hipótesis H0 que las dos medias son de echo iguales? Muestra 2 Muestra 1 Frecuencia Estadística Biología Marina 2003

22 Dependiendo de las características de nuestras muestras, existen dos opciones de comparación
t-test para muestras independientes. t-test para muestras agrupadas (pareadas). Estadística Biología Marina 2003

23 t-test para muestras independientes.
Dieta En el test de muestras independientes, no existe una correlación experimental o “asociación” entre las observaciones (muestras) de los dos grupos. E.g. Peso a los 6 meses de una muestra aleatoria de diferentes cerdos aliementados con dos dietas distintas. Estadística Biología Marina 2003

24 t-test para muestras agrupadas.
En los test de muestras pareadas, las observaciones (muestras) en un grupo se encuentran relacionadas con las observaciones en el otro grupo. E.g. Peso a los 6 meses de 2 cerdos, ambos de la misma madre, alimentados con diferentes dietas. Dieta Progenitora Estadística Biología Marina 2003

25 t-test para muestras independientes. EJEMPLO:
Droga B Droga G 8.8 9.9 8.4 9.0 7.9 11.1 8.7 9.6 9.1 10.4 9.5 n1 = 6 n2 = 7 Gl1 =5 Gl2 = 6 Media 1 = 8.75 min Media 2 = 9.74 min SS1 = min2 SS2 = min2 Tiempo de coagulación sanguínea, de un grupo de 13 personas, probando las drogas (B Y G): Estadística Biología Marina 2003

26 Ho: Media Droga B = Media Droga G Ha: Media Droga B  Media Droga G
La interrogante en el experimento era si la sangre de las personas tratadas con la droga B presentaba el mismo tiempo medio de coagulación que las personas tratadas con la droga G. ¿HIPÓTESIS? Ho: Media Droga B = Media Droga G Ha: Media Droga B  Media Droga G Estadística Biología Marina 2003

27 Cálculo: El cálculo es análogo a la formula de Student ya conocida.
De esta manera el estadístico t-Student para dos muestras es: Con Gl = (n1 + n2) – k Estadística Biología Marina 2003

28 El error estándar es: Si n1 y n2 son iguales 2003
Estadística Biología Marina 2003

29 De vuelta con el ejemplo:
Droga B Droga G 8.8 9.9 8.4 9.0 7.9 11.1 8.7 9.6 9.1 10.4 9.5 n1 = 6 n2 = 7 Gl1 =5 Gl2 = 6 Media 1 = 8.75 min Media 2 = 9.74 min SS1 = min2 SS2 = min2 t0.05(2), 11 = 2.201 ¿CONCLUSIÓN? Estadística Biología Marina 2003

30 Rechazamos Ho: El tiempo de coagulación de la sangre es diferente entre los grupos de personas tratadas con diferentes tipos de drogas (t-test 0.02 < P <0.05). Estadística Biología Marina 2003

31 Requisitos para aplicar el t-test:
Ambas muestras son obtenidas al azar. Las muestras son independientes unas de otras. La variable debe ser continua. Las variables deber tener distribución normal. Las varianzas deben ser homocedásticas. Estadística Biología Marina 2003

32 Homocedásticidad de varianzas:
TEST DE FISHER (F) Trabaja verificando si las varianzas de los grupos que estamos comparando son significativamente iguales o distintas. Las hipótesis son: Ho: Existe homocedásticidad de varianzas entre el grupo 1 y el grupo 2. Ha: No Existe homocedásticidad de varianzas entre el grupo 1 y el grupo 2. Estadística Biología Marina 2003

33 El valor critico se busca en la tabla Fisher como : F0.05 (2) n1,n2
Cálculo de Fisher (F): Siempre se debe tener presente que la varianza mayor debe ir en el numerador, y la menor en el denominador. Los grados de libertad son: Gl= n1, n2 El valor critico se busca en la tabla Fisher como : F0.05 (2) n1,n2 Estadística Biología Marina 2003

34 Test de Fisher con los datos del ejemplo:
Droga B Droga G 8.8 9.9 8.4 9.0 7.9 11.1 8.7 9.6 9.1 10.4 9.5 n1 = 6 n2 = 7 Gl1 =5 Gl2 = 6 Media 1 = 8.75 min Media 2 = 9.74 min SS1 = min2 SS2 = min2 S21= y S22= F = /0.339 = F 0.05 (2) 7, = 5.70 ¿CONCLUSIÓN? Estadística Biología Marina 2003

35 Para tener presente: El test de Fisher es un prerrequisito del test de Student entonces: Primero debemos determinar si las varianzas son homocedásticas para luego realizar el t-test. Estadística Biología Marina 2003

36 Otros datos… La capacidad del t-test se relaciona directamente con el cumplimiento de sus requisitos. Si éstos no se cumplen existen otras alternativas (no paramétricas). En general, si se aumenta el tamaño de las muestras el test tiende a ser más robusto. Estadística Biología Marina 2003

37 Es posible realizar un t-test, con la aproximación de Welsh.
Si tenemos dos medias con distribución normal, pero con varianzas heterocedásticas. Es posible realizar un t-test, con la aproximación de Welsh. Estadística Biología Marina 2003

38 El Calculo es: Si  no es un entero se aproxima al entro próximo más pequeño. De esta forma se paga por heterocedasticidad con una disminución en . Estadística Biología Marina 2003

39 Ejemplo: Un jardinero, desea utilizar un nuevo tipo de fertilizante aparecido en el mercado que promociona un mejer crecimiento que el fertilizante que ha utilizado siempre. El jardinero era un genio en estadística y diseño un experimento para probar si el nuevo fertilizante produce plantas más grandes que el antiguo. Estadística Biología Marina 2003

40 Los datos son: Fertilizante viejo Fertilizante nuevo 48.2 52.3 54.6 57.4 58.3 55.6 47.8 53.2 51.4 61.3 52.0 58.0 55.2 59.8 49.1 54.8 49.9 52.6 Crecimiento de plantas (cm) después de dos meses de plantadas: Plantear hipótesis. Realizar el test. Conclusión. Estadística Biología Marina 2003

41 Independencia de las observaciones
La ausencia de independencia usualmente ocurre porque las observaciones están correlacionadas en el tiempo o espacio. E.g. Mediciones de concentración de arsénico río arriba y río abajo desde el punto donde se piensa que es la fuente. Río arriba Río abajo Estadística Biología Marina 2003

42 Test student para muestras agrupadas.
En este tipo de test, las muestras del grupo 1 se encuentran relacionadas con las del grupo 2. Es decir se encuentran “Pareados”. Aquí,no se analizan los datos originales, sino que se trabaja con las diferencias entre los miembros de cada par. Estadística Biología Marina 2003

43 t-Test para muestras agrupadas
Es utilizado cuando un mismo objeto es medido bajo diferentes tratamientos (e.g. cambio en el peso de una rata antes y después del tratamiento con una droga)… … o cuando existe una correlación entre las observaciones de las dos muestras. Use paired t-statistic. Estadística Biología Marina 2003

44 t-test para muestras agrupadas- versus muestras independientes.
Cuando existe una correlación, el t-test agrupado es mucho mas poderoso porque la desviación estándar de las diferencias promedios es usualmente mucho menor que el error estándar de las diferencias entre las dos medias. Si no existe una correlación, el test pareado es más débil porque N es el número de parejas, no el número de observaciones. s2a = 8.67, s2d= 21.58, s2DW = 2.81 Estadística Biología Marina 2003

45 Queremos verificar la hipótesis nula de que el largo de la pata delantera y la pata trasera de los Pudú del zoológico, es el mismo. De esta manera los datos son tabulados en pares Ciervo Pata Delantera (X1) Pata Trasera (X2) Diferencia (d = X1 – X2) 1 142 138 4 2 140 136 3 144 147 -3 139 5 143 -1 6 146 141 7 149 8 150 145 9 10 148 Estadística Biología Marina 2003

46 Cálculo del test: Las hipótesis estadísticas son:
Ho: μ1 – μ2 = o Ho: μd = 0 Ha: μ1 – μ2  o Ha: μd  0 Las formulas del test son: donde Sd (error estándar) es: Los grados de libertad son: Gl= n-1 A que se parece esto? Estadística Biología Marina 2003

47 Para el ejemplo: ¿CONCLUSIÓN? 2003 n = 10 Gl = 10-1 = 9
Ciervo Pata Delantera (X1) Pata Trasera (X2) Diferencia (d = X1 – X2) 1 142 138 4 2 140 136 3 144 147 -3 139 5 143 -1 6 146 141 7 149 8 150 145 9 10 148 n = 10 Gl = 10-1 = 9 d media= 3.3 cm S2d = 9.34 cm2 t0.05(2),9= 2.262 ¿CONCLUSIÓN? Estadística Biología Marina 2003

48 Se rechaza Ho. Se determinó que el largo de las patas delanteras difiere significativamente con el largo de las patas traseras de los Pudú del zoológico metropolitano (t-test < P < 0.01). Estadística Biología Marina 2003

49 Para tener en cuenta: El t-test de pares agrupados no asume normalidad de los datos. Tampoco asume homocedásticidad de las varianzas. Pero si asume que las diferencias de los pares si se distribuyen de forma normal. Estadística Biología Marina 2003

50 ¿Porque no comparar mas de dos grupos?
Un poco mas del t-test. Solo se han analizado casos desde comparamos dos grupos. ¿Porque no comparar mas de dos grupos? Estadística Biología Marina 2003

51 Riesgo de cometer un error de tipo I
Número de Comparaciones % Riesgo de cometer error Tipo I 2 5 3 12 4 20 6 37 8 51 10 63 Corrección de Bonferroni: Se aplica para realizar este tipo de comparaciones múltiples. Produce un cambio en el valor de  (0.05). Para corregir se divide el valor de  por el número (P) de comparaciones. De esta manera ´=  / P. Para 5 comparaciones: ´=0.05/5 = 0.01 Estadística Biología Marina 2003

52 Plantear hipótesis. Realizar el test. Conclusión. 2003
Ejemplo: Se esta probando la efectividad de una droga que permite bajar de peso. El medicamento se le administró a 9 voluntarios a los que se les midió la cantidad de grasa corporal (kg) antes y después de dos semanas de iniciado el tratamiento. Antes Después 1 22.50 19.20 2 24.10 20.20 3 22.60 20.60 4 22.00 19.60 5 23.60 6 23.20 21.40 7 22.40 19.80 8 23.00 19.40 9 20.90 17.90 Plantear hipótesis. Realizar el test. Conclusión. Estadística Biología Marina 2003


Descargar ppt "Hipótesis para dos Muestras"

Presentaciones similares


Anuncios Google