La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Hipótesis para dos Muestras Con frecuencia es necesario la comparación de dos estadísticos (media, mediana, varianza, coeficiente de variación o índices.

Presentaciones similares


Presentación del tema: "Hipótesis para dos Muestras Con frecuencia es necesario la comparación de dos estadísticos (media, mediana, varianza, coeficiente de variación o índices."— Transcripción de la presentación:

1 Hipótesis para dos Muestras Con frecuencia es necesario la comparación de dos estadísticos (media, mediana, varianza, coeficiente de variación o índices de diversidad). La comparación se realiza para inferir si existen diferencias entre dos poblaciones muestreadas. Estadística Biología Marina 200 3

2 Distribución de Student Es una prueba estadística para evaluar si dos grupos difieren entre sí de manera significativa respecto a sus medias. Se simboliza por la letra t. Estadística Biología Marina 200 3

3 Es análoga a la distribución Z ES corresponde al error estándar de la muestra, el que puede ser definido por el error en el muestreo, o la desviación promedio de un estimado de los valores reales de la población. Estadística Biología Marina 200 3

4 Si el ajuste entre lo observado y lo esperado es pobre, entonces en base de la precisión de la medición, se espera rechazar Ho. Estadística Biología Marina Largo de caninos Frecuencia Rechazo H 0 Acepto H 0 Observado Esperado e e

5 Estadística Biología Marina Dependiendo de lo que nosotros estemos interesados en probar o inferir sobre la población, la prueba de hipótesis va a ser una o dos colas.

6 Nos interesa determinar si existe o no diferencia entre dos medias: Ho: Media A = Media B Ha: Media A Media B Estadística Biología Marina Hipótesis de dos colas ( 2 ).

7 Áreas de aceptación y rechazo en t-test de dos colas. Estadística Biología Marina Ho: Media A = Media B Ha: Media A Media B

8 Se aplica cuando existe una presunción de que no solo existen diferencia entre las muestras. Inferimos si el tratamiento producirá una diferencia orientada en alguna dirección en particular. La región de rechazo corresponde a un lado de la distribución. Estadística Biología Marina Hipótesis de una cola ( 1 ).

9 La media del grupo al que se aplicó el tratamiento será más grande que la media del grupo control. Ho: Media Control Media del tratamiento Ha: Media Control < Media del tratamiento Estadística Biología Marina 200 3

10 La media del grupo al que se aplicó el tratamiento será más pequeña que la media del grupo control. Ho: Media Control Media del tratamiento Ha: Media Control > Media del tratamiento Estadística Biología Marina 200 3

11 Ejemplo Mediciones de la concentración de monóxido de carbono en el aire mg/m 3 realizadas dentro de un taller mecánico. La concentración máxima permitida es de mg/m 3. Estadística Biología Marina ¿Las mediciones se diferencian del valor permitido?

12 ¿Cual sería la hipótesis?: Estadística Biología Marina Ho: Media = mg/m 3 Ha: Media mg/m 3 T-test: Calcular media, varianza, Error estándar.

13 Resultados Media = mg/m 3 Varianza = mg/m 3 ER = mg/m 3 Estadística Biología Marina t =10.43 – 10.00= Grados de libertad = n-1 El valor crítico se busca en la tabla B.3 t 0.05 (2), 17 = 2.110

14 Conclusión Se rechaza la Ho. Existen diferencias significativas entre la concentración de dióxido de carbono máxima permitida y los valores estimados en el taller mecánico (t test P < 0.001) Estadística Biología Marina 200 3

15 ¿La concentración de dióxido de carbono es más alta que los valores permitidos? Hipótesis: Estadística Biología Marina Ho: Media Control (10.00 mg/m3) Media del tratamiento Ha: Media Control (10.00 mg/m3) < Media del tratamiento t = t 0.05 (1), 17 = ¿Conclusión?

16 Las concentraciones de dióxido de carbono estimadas en el taller mecánico, son significativamente mayores a la concentración de dióxido de carbono máxima permitida (t test P < 0.001) Estadística Biología Marina 200 3

17 Tener en cuenta: Los valores tabulados de los test de una cola son menores que los de dos colas. Las hipótesis estadísticas (una o dos colas) deben ser declaradas antes de examinar los datos y deben reflejar la pregunta de interés sobre la población. Estadística Biología Marina 200 3

18 Ejemplo 1: Una máquina producía tapas de 0.05 pulgadas de espesor. Para determinar si sigue en buen estado, se toma una muestra de 10 tapas, que dan un espesor medio de ± in. ¿La maquina sigue produciendo tapas de 0.05 in? Estadística Biología Marina 200 3

19 Una prueba de 6 linternas de cultivo de ostión dio una tensión media de ruptura de 7150 ± 145 lb. El fabricante las promocionaba con una resistencia de 8000 lb. En base a estos datos: ¿Las linternas resistirán menos que lo anunciado por el fabricante? Estadística Biología Marina Ejemplo 2:

20 Comparación de medias de dos muestras. Estadística Biología Marina Apropiado cuando existen dos grupos para comparar (e.g. control y tratamiento). En principio, podemos comparar cualquier estadístico de una muestra, e.g. medias, medianas, varianzas, etc. Apropiado cuando existen dos grupos para comparar (e.g. control y tratamiento). En principio, podemos comparar cualquier estadístico de una muestra, e.g. medias, medianas, varianzas, etc. Control Frecuencia s2Cs2C s2Ts2T Tratamiento

21 Por Ejemplo: Estadística Biología Marina Dos muestras (1, 2) con valores medios que difieren en cierta cantidad. ¿Cual es la probabilidad p de observar esta diferencia bajo la hipótesis H0 que las dos medias son de echo iguales? Dos muestras (1, 2) con valores medios que difieren en cierta cantidad. ¿Cual es la probabilidad p de observar esta diferencia bajo la hipótesis H0 que las dos medias son de echo iguales? Frecuencia Muestra 2 Muestra 1

22 Dependiendo de las características de nuestras muestras, existen dos opciones de comparación t-test para muestras independientes. t-test para muestras agrupadas (pareadas). Estadística Biología Marina 200 3

23 t-test para muestras independientes. Estadística Biología Marina En el test de muestras independientes, no existe una correlación experimental o asociación entre las observaciones (muestras) de los dos grupos. E.g. Peso a los 6 meses de una muestra aleatoria de diferentes cerdos aliementados con dos dietas distintas. En el test de muestras independientes, no existe una correlación experimental o asociación entre las observaciones (muestras) de los dos grupos. E.g. Peso a los 6 meses de una muestra aleatoria de diferentes cerdos aliementados con dos dietas distintas. Dieta

24 t-test para muestras agrupadas. Estadística Biología Marina En los test de muestras pareadas, las observaciones (muestras) en un grupo se encuentran relacionadas con las observaciones en el otro grupo. E.g. Peso a los 6 meses de 2 cerdos, ambos de la misma madre, alimentados con diferentes dietas. En los test de muestras pareadas, las observaciones (muestras) en un grupo se encuentran relacionadas con las observaciones en el otro grupo. E.g. Peso a los 6 meses de 2 cerdos, ambos de la misma madre, alimentados con diferentes dietas. Dieta Progenitora

25 Tiempo de coagulación sanguínea, de un grupo de 13 personas, probando las drogas (B Y G): Estadística Biología Marina t-test para muestras independientes. EJEMPLO: Droga BDroga G n 1 = 6n 2 = 7 Gl 1 =5Gl 2 = 6 Media 1 = 8.75 minMedia 2 = 9.74 min SS 1 = min 2 SS 2 = min 2

26 La interrogante en el experimento era si la sangre de las personas tratadas con la droga B presentaba el mismo tiempo medio de coagulación que las personas tratadas con la droga G. ¿HIPÓTESIS? Ho: Media Droga B = Media Droga G Ha: Media Droga B Media Droga G Estadística Biología Marina 200 3

27 Cálculo: El cálculo es análogo a la formula de Student ya conocida. De esta manera el estadístico t-Student para dos muestras es: Con Gl = (n1 + n2) – k Estadística Biología Marina 200 3

28 El error estándar es: Estadística Biología Marina Si n1 y n2 son iguales

29 De vuelta con el ejemplo: Estadística Biología Marina Droga BDroga G n 1 = 6n 2 = 7 Gl 1 =5Gl 2 = 6 Media 1 = 8.75 minMedia 2 = 9.74 min SS 1 = min 2 SS 2 = min 2 t 0.05(2), 11 = ¿CONCLUSIÓN?

30 Rechazamos Ho: El tiempo de coagulación de la sangre es diferente entre los grupos de personas tratadas con diferentes tipos de drogas (t-test 0.02 < P <0.05). Estadística Biología Marina 200 3

31 Requisitos para aplicar el t-test: Ambas muestras son obtenidas al azar. Las muestras son independientes unas de otras.Las muestras son independientes unas de otras. La variable debe ser continua. Las variables deber tener distribución normal. Las varianzas deben ser homocedásticas. Estadística Biología Marina 200 3

32 Homocedásticidad de varianzas: TEST DE FISHER (F) Trabaja verificando si las varianzas de los grupos que estamos comparando son significativamente iguales o distintas. Las hipótesis son: –Ho: Existe homocedásticidad de varianzas entre el grupo 1 y el grupo 2. –Ha: No Existe homocedásticidad de varianzas entre el grupo 1 y el grupo 2. Estadística Biología Marina 200 3

33 Cálculo de Fisher (F): Siempre se debe tener presente que la varianza mayor debe ir en el numerador, y la menor en el denominador. Los grados de libertad son: Gl= n1, n2 El valor critico se busca en la tabla Fisher como : F 0.05 (2) n1,n2 Estadística Biología Marina 200 3

34 Test de Fisher con los datos del ejemplo: S 2 1 = y S 2 2 = F = /0.339 = F 0.05 (2) 7,6 = 5.70 ¿CONCLUSIÓN? Estadística Biología Marina Droga BDroga G n 1 = 6n 2 = 7 Gl 1 =5Gl 2 = 6 Media 1 = 8.75 minMedia 2 = 9.74 min SS 1 = min 2 SS 2 = min 2

35 Para tener presente: El test de Fisher es un prerrequisito del test de Student entonces: Primero debemos determinar si las varianzas son homocedásticas para luego realizar el t-test. Estadística Biología Marina 200 3

36 Otros datos… La capacidad del t-test se relaciona directamente con el cumplimiento de sus requisitos. Si éstos no se cumplen existen otras alternativas (no paramétricas). En general, si se aumenta el tamaño de las muestras el test tiende a ser más robusto. Estadística Biología Marina 200 3

37 Si tenemos dos medias con distribución normal, pero con varianzas heterocedásticas. Es posible realizar un t-test, con la aproximación de Welsh. Estadística Biología Marina 200 3

38 El Calculo es: Si no es un entero se aproxima al entro próximo más pequeño. De esta forma se paga por heterocedasticidad con una disminución en. Estadística Biología Marina 200 3

39 Ejemplo: Un jardinero, desea utilizar un nuevo tipo de fertilizante aparecido en el mercado que promociona un mejer crecimiento que el fertilizante que ha utilizado siempre. El jardinero era un genio en estadística y diseño un experimento para probar si el nuevo fertilizante produce plantas más grandes que el antiguo. Estadística Biología Marina 200 3

40 Los datos son: Crecimiento de plantas (cm) después de dos meses de plantadas: Estadística Biología Marina Fertilizante viejoFertilizante nuevo Plantear hipótesis. Plantear hipótesis. Realizar el test. Realizar el test. Conclusión. Conclusión. Plantear hipótesis. Plantear hipótesis. Realizar el test. Realizar el test. Conclusión. Conclusión.

41 Independencia de las observaciones Estadística Biología Marina La ausencia de independencia usualmente ocurre porque las observaciones están correlacionadas en el tiempo o espacio. E.g. Mediciones de concentración de arsénico río arriba y río abajo desde el punto donde se piensa que es la fuente. La ausencia de independencia usualmente ocurre porque las observaciones están correlacionadas en el tiempo o espacio. E.g. Mediciones de concentración de arsénico río arriba y río abajo desde el punto donde se piensa que es la fuente. Río arriba Río abajo

42 Test student para muestras agrupadas. En este tipo de test, las muestras del grupo 1 se encuentran relacionadas con las del grupo 2. Es decir se encuentran Pareados. Aquí,no se analizan los datos originales, sino que se trabaja con las diferencias entre los miembros de cada par. Estadística Biología Marina 200 3

43 t-Test para muestras agrupadas Estadística Biología Marina Es utilizado cuando un mismo objeto es medido bajo diferentes tratamientos (e.g. cambio en el peso de una rata antes y después del tratamiento con una droga)… … o cuando existe una correlación entre las observaciones de las dos muestras. Use paired t-statistic. Es utilizado cuando un mismo objeto es medido bajo diferentes tratamientos (e.g. cambio en el peso de una rata antes y después del tratamiento con una droga)… … o cuando existe una correlación entre las observaciones de las dos muestras. Use paired t-statistic.

44 Estadística Biología Marina t-test para muestras agrupadas- versus muestras independientes. Cuando existe una correlación, el t-test agrupado es mucho mas poderoso porque la desviación estándar de las diferencias promedios es usualmente mucho menor que el error estándar de las diferencias entre las dos medias. Si no existe una correlación, el test pareado es más débil porque N es el número de parejas, no el número de observaciones. Cuando existe una correlación, el t-test agrupado es mucho mas poderoso porque la desviación estándar de las diferencias promedios es usualmente mucho menor que el error estándar de las diferencias entre las dos medias. Si no existe una correlación, el test pareado es más débil porque N es el número de parejas, no el número de observaciones. s 2 a = 8.67, s 2 d = 21.58, s 2 W = 2.81

45 Queremos verificar la hipótesis nula de que el largo de la pata delantera y la pata trasera de los Pudú del zoológico, es el mismo. De esta manera los datos son tabulados en pares Estadística Biología Marina Ciervo Pata Delantera (X 1 ) Pata Trasera (X 2 ) Diferencia (d = X 1 – X 2 )

46 Cálculo del test: Las hipótesis estadísticas son: Ho: μ1 – μ2 = 0 o Ho: μd = 0 Ha: μ1 – μ2 0 o Ha: μd 0 Las formulas del test son: donde Sd (error estándar) es: Los grados de libertad son: Gl= n-1 Estadística Biología Marina A que se parece esto?

47 Para el ejemplo: Estadística Biología Marina Ciervo Pata Delantera (X 1 ) Pata Trasera (X 2 ) Diferencia (d = X 1 – X 2 ) n = 10 Gl = 10-1 = 9 d media= 3.3 cm S 2 d = 9.34 cm 2 t 0.05(2),9 = t 0.05(2),9 = ¿CONCLUSIÓN?

48 Se rechaza Ho. Se determinó que el largo de las patas delanteras difiere significativamente con el largo de las patas traseras de los Pudú del zoológico metropolitano (t- test < P < 0.01). Estadística Biología Marina 200 3

49 Para tener en cuenta: El t-test de pares agrupados no asume normalidad de los datos. Tampoco asume homocedásticidad de las varianzas. Pero si asume que las diferencias de los pares si se distribuyen de forma normal. Estadística Biología Marina 200 3

50 Un poco mas del t-test. Solo se han analizado casos desde comparamos dos grupos. ¿Porque no comparar mas de dos grupos? Estadística Biología Marina 200 3

51 Riesgo de cometer un error de tipo I Corrección de Bonferroni: –Se aplica para realizar este tipo de comparaciones múltiples. –Produce un cambio en el valor de (0.05). –Para corregir se divide el valor de por el número (P) de comparaciones. –De esta manera ´= / P. Estadística Biología Marina Número de Comparaciones % Riesgo de cometer error Tipo I Para 5 comparaciones: ´=0.05/5 = 0.01 ´=0.05/5 = 0.01

52 Ejemplo: Se esta probando la efectividad de una droga que permite bajar de peso. El medicamento se le administró a 9 voluntarios a los que se les midió la cantidad de grasa corporal (kg) antes y después de dos semanas de iniciado el tratamiento. Estadística Biología Marina Plantear hipótesis. Plantear hipótesis. Realizar el test. Realizar el test. Conclusión. Conclusión. Plantear hipótesis. Plantear hipótesis. Realizar el test. Realizar el test. Conclusión. Conclusión. AntesDespués


Descargar ppt "Hipótesis para dos Muestras Con frecuencia es necesario la comparación de dos estadísticos (media, mediana, varianza, coeficiente de variación o índices."

Presentaciones similares


Anuncios Google