COMPROBACION DE HIPOTESIS SOBRE DOS PROMEDIOS Mario Briones L. MV, MSc 2005
Caso I: Supuestos - Población con distribución normal - Desviación estándar conocida - Bilateral Comprobación de hipótesis acerca de la Media de la muestra de una población
Cada vez que se comparan dos promedios, se obtiene una diferencia entre las infinitas diferencias posibles entre ambos grupos o poblaciones, con muestras del mismo tamaño. Comprobación de hipótesis acerca de la Media de la muestra de una población
POBLACION A POBLACION B
por ejemplo, si se quiere comparar el peso de dos poblaciones de peces, sólo podemos tener acceso a dos muestras, una de cada población. Cada una de estas muestras, como ya sabemos, tiene error. Por lo tanto, cada vez que se repitiese la comparación, habría distintos promedios y distintas diferencias entre cada una de las dos poblaciones.
Es importante aquí comprender que si en realidad no hay diferencia entre ambos promedios poblacionales (caso en que la hipótesis nula es verdadera), entonces la sumatoria de todas las diferencias obtenidas en cada una de las sucesivas comparaciones, SERÍA CERO.
Si no existe diferencia entre 1 y 2, muestreos sucesivos darán similar cantidad de valores positivos y negativos a la expresión x 1 -x 2, lo que significa que 1 - 2 =0 DISTRIBUCION DE LA DIFERENCIA
2 x1-x2 = 2 1 /n 1 + 2 2 /n 2 x 1 -x 2 x1-x2 = 1 - 2 =0 Esta es la unidad de distribución de esta curva: la varianza de las diferencias.
(x 1 -x 2 ) - ( 1 - 2 ) Z= 2 1 /n 1 + 2 2 /n 2 X1X1 X2X2 X 2 -X 1
X1X1 X2X2 Puede verse que si la hipótesis nula (ausencia de diferencia entre los promedios) es verdadera, la media real de la diferencia es cero, ya que se cancelan todas las diferencias al estarse estimando con ambas muestras, el mismo valor
X1X1 X2X2 X 2 -X 1 Puede verse que si la hipótesis nula (ausencia de diferencia entre los promedios) es verdadera, la media real de la diferencia es cero, ya que se cancelan todas las diferencias al estarse estimando con ambas muestras, el mismo valor
H 0 : 2 - 1 = 0 H A : 2 - 1 0 H 0 : 2 - 1 0 H A : 2 - 1 < 0 H 0 : 2 - 1 0 H A : 2 - 1 > 0 Todas estas son posibles hipótesis nulas y alternativas al comparase dos promedios, uni o bilaterales.
Caso I: Supuestos -Muestreo a partir de poblaciones con distribución normal - Desviación estándar conocida - Bilateral Comprobación de hipótesis acerca de dos medias
Un grupo de investigadores desea saber si los datos que han reunido proporcionan evidencia suficiente que indique una diferencia en las concentraciones medias de ácido úrico en suero entre individuos normales e individuos con síndrome de Down. Se dirá que los datos proporcionan dicha evidencia si puede rechazarse la hipótesis nula de que las medias son iguales.
1. Datos: Mediciones de ácido úrico en el suero de 12 individuos con síndrome de Down y 15 individuos normales. Los promedios son Individuos con síndrome de Down, X 1 = 4.5 mg/100 ml Individuos normales, X 2 = 3.4 mg/100 ml
2. Supuestos: Los datos constituyen dos muestras aleatorias independientes, cada una extraída de una población con distribución normal y con varianza igual a 1mg/100ml. 3. Hipótesis: H 0 : 2 - 1 = 0 H A : 2 - 1 0
4. Estadística de prueba: (X 1 - X 2 ) - ( 1 - 2 ) z= 2 1 n 1 n 2 5. Distribución de la estadística de prueba: Normal unitaria, cuando la hipótesis nula es verdadera
6. Regla de decisión: Sea = Los valores críticos de z son 1.96 Se rechaza H 0 a menos que < z calculada < 1.96
7. Estadística de prueba calculada: ( ) - z= = = 2.82
8. Decisión estadística: Se rechaza H 0 ya que 2.82 > Conclusión: En base a los datos disponibles, hay una indicación de que las medias no son iguales para la concentración de ácido úrico entre individuos normales e individuos con síndrome de Down.
Caso I: Supuestos -Muestreo a partir de poblaciones con distribución normal - Desviación estándar desconocida - Bilateral Comprobación de hipótesis acerca de dos medias
Alternativas varianza desconocida e igual en ambas poblaciones varianza desconocida y distinta en ambas poblaciones (n 1 -1)s (n 2 -1)s 2 2 s 2 P = n 1 +n 2 -2
Se dispone de valores de perímetro torácico en caballos chilenos adultos, machos y hembras. Se quiere comprobar que el sexo del animal influye sobre el perímetro del tórax. Para esto se debe rechazar la Hipótesis nula de que el sexo de los caballos no tiene importancia o no influye sobre el perímetro.
1. Datos: machos n 1 = 38 X 1 = cm s 1 = 4 cm hembras n 2 =39 X 2 = cm s 2 = 6.15 cm
2. Supuestos: Los datos constituyen muestras aleatorias INDEPENDIENTES, se desconoce la varianza pero se supone que es igual en ambas poblaciones. (Independientes significa que no existe relación entre los individuos de una y otra población. Por ej. No son hermanos)
3. Hipótesis: H 0 : 2 - 1 = 0 H A : 2 - 1 0
4. Estadística de prueba: (X 1 - X 2 ) - ( 1 - 2 ) t= s 2 P s 2 P + n 1 n 2
5. Distribución de la estadística de prueba Cuando la hipótesis nula es verdadera, la estadística de prueba sigue la distribución t de Student con n 1 + n grados de libertad
6. Regla de decisión Sea = 0.05, los valores críticos de t son 1.99 Se rechaza H 0 a menos que -1.99<t calculada <1.99
7. Estadística de prueba calculada: A) varianza promedio s 2 P (n 1 -1)s (n 2 -1)s 2 2 s 2 P = n 1 +n 2 -2 (38-1)4 2 + (39-1) s 2 P = = =
B) Estadística calculada ( ) t= = =
8. Decisión estadística: No puede rechazarse H 0, ya que < 1.26 < Conclusión: Con los datos disponibles no se puede concluir que el perímetro torácico de los caballos chilenos, machos y hembras, sea diferente.
Intervalo de confianza para la media real de la diferencia en la población Cuando se conoce la varianza de la población
Ej: concentración de ácido úrico en individuos con y sin sídrome de Down Individuos con síndrome de Down, X 1 = 4. 5 mg/100 ml Individuos normales, X 2 = 3.4 mg/100 ml Diferencia observada 4.5 – 3.4= 1.1 Límite inferior= 1.1–0.759= Límite superor= = Con un 95% de confianza la diferencia real entre los promedios de las concentraciones de ácido úrico de las personas con y sin síndrome de Down, se encuentra entre y mg/100 ml (observe que este intervalo no incluye al cero).
Intervalo de confianza para la media real de la diferencia en la población Cuando no se conoce la varianza de la población
Ej: perímetro toráxico en caballos machos y hembras Perímetro de machos= cm Perímetro de hembras= cm Diferencia observada= – = –1.77 Límite inferior= –1.77–2.36 =–4.13 Límite superior= – =0.59 Con un 95% de confianza la media real de la diferencia puede ser cero