EPE MA 148 ESTADÍSTICA INFERENCIAL TEMA: PRUEBA DE HÍPÓTESIS PARA DOS PARÁMETROS
LOGRO DE APRENDIZAJE LOGRO DE APRENDIZAJE DE LA UNIDAD: Al finalizar la Unidad 1, el alumno obtiene conclusiones relevantes para los parámetros de una o dos poblaciones a partir del planteamiento y la verificación de hipótesis, lo cual le permitirá tomar decisiones objetivas en el campo de su especialidad.
TEMARIO DE LA SESIÓN Prueba de hipótesis para dos varianzas Prueba de hipótesis para dos promedios con varianzas homogéneas Prueba de hipótesis para dos promedios con varianzas heterogéneas
Variabilidad del tiempo de atención Se desea comparar dos restaurantes de Lima que venden los mismos tipos de comida ¿Qué característica compararía? Tiempo de atención Variabilidad del tiempo de atención Calidad del servicio ¿Qué parámetros compararía?
Hipótesis estadísticas: Se pueden plantear diferentes preguntas de investigación, las cuales pueden expresarse como hipótesis. Por ejemplo: ¿El restaurante A es más eficiente que el restaurante B con respecto al tiempo de atención? ¿µA < µB? o ¿µA - µB < 0? ¿El tiempo promedio de atención en el restaurante B supera al tiempo promedio de atención del restaurante A en más de 15 min? ¿µB - µA > 15?
Recordar: Al desarrollar una prueba de hipótesis se deben seguir los siguientes pasos: Planteamiento de las hipótesis Fijar el nivel de significación Identificar el estadístico de prueba y su valor(es) Región crítica y Valor(es) crítico(s): Decisión: Conclusión:
Prueba de hipótesis para dos varianzas Unilateral izquierda Bilateral derecha H0: s 21 ≥ s 22 H0: s 21 = s 22 H0: s 21 ≤ s 22 H1: s 21 < s 22 H1: s 21 ≠ s 22 H1: s 21 > s 22 Estadístico de prueba: Supuestos: poblaciones normales, muestras indep. y al azar
Ejemplo: Una operación de ensamblaje en una planta manufacturera requiere de un período de entrenamiento de aproximadamente un mes para que un nuevo operario alcance la máxima eficiencia. Se realizó una prueba para comparar un nuevo método con el procedimiento estándar. Se entrenó a dos grupos, de diez y nueve obreros cada uno, durante tres semanas; un grupo utilizó el nuevo método y el otro el procedimiento estándar. Se registró el tiempo, en minutos, que tardó cada trabajador en montar el dispositivo al final del periodo de tres semanas. Estas mediciones aparecen en la siguiente tabla: Procedimiento estándar 32 37 35 28 41 44 31 34 42 Procedimiento nuevo 29 25 40 27 Si se supone que los tiempos de ensamble se distribuyen normalmente, ¿se puede afirmar con un nivel de significación del 3%, que la variabilidad de los tiempos de ensamble de cada procedimiento son iguales?
Procedimiento estándar Resultados con Excel: Prueba F para varianzas de dos muestras Procedimiento estándar Procedimiento nuevo Media 35.9 31.5555556 Varianza 26.3222222 20.0277778 Observaciones 10 9 Grados de libertad 8 F calculado 1.31428571 P(F<=f) una cola 0.35534902 Valor crítico para F (una cola) 4.0868323 𝐹 0.015,9,8 =5.1807 𝐹 0.985,9,8 =0.2070 𝐹 𝑐𝑎𝑙 =1.3143 No se rechaza Ho Conclusión: No se rechaza Ho, las varianzas son homogéneas. No se puede afirmar que la variabilidad de los tiempos de ensamble sean diferentes
Prueba de hipótesis para dos medias con varianzas desconocidas pero homogéneas Unilateral izquierda Bilateral derecha H0: m1 – m2 ≥ k H0: m1 – m2 = k H0: m1 – m2 ≤ k H1: m1 – m2 < k H1: m1 – m2 ≠ k H1: m1 – m2 > k
Estadístico de prueba: Además: Supuestos: poblaciones normales, muestras independientes y elegidas al azar. Estadística Inferencial
Retomando el ejercicio anterior: A un nivel de significación del 3%, se puede afirmar que el procedimiento nuevo ofrece un tiempo promedio de ensamble menor que el procedimiento estándar?
Solución: 𝐻 0 : 𝜇 𝑒 ≤ 𝜇 𝑛 𝐻 1 : 𝜇 𝑒 > 𝜇 𝑛 𝛼=0.03 𝐻 0 : 𝜇 𝑒 ≤ 𝜇 𝑛 𝐻 1 : 𝜇 𝑒 > 𝜇 𝑛 𝛼=0.03 𝑇 𝑐 = 𝑥 1 − 𝑥 2 −𝑘 𝑆 𝑝 2 1 𝑛 1 + 1 𝑛 2 = 1.95632528 Regiones Críticas y criterio de decisión: Si Tc < 2.01500234, No se rechaza la H0 Conclusión: A un nivel de significación del 3%, no se puede afirmar que el procedimiento nuevo ofrece un tiempo promedio de ensamble menor que el procedimiento estándar
Resultados en Excel: Conclusión: t cal < 2.01500234, no se RHo Prueba t para dos muestras suponiendo varianzas iguales Procedimiento estándar Procedimiento nuevo Media 35.9 31.5555556 Varianza 26.3222222 20.0277778 Observaciones 10 9 Varianza agrupada 23.3601307 Diferencia hipotética de las medias Grados de libertad 17 Estadístico t 1.95632528 P(T<=t) una cola 0.03353069 Valor crítico de t (una cola) 2.01500234 P(T<=t) dos colas 0.06706138 Valor crítico de t (dos colas) 2.36805476 Conclusión: t cal < 2.01500234, no se RHo No se puede afirmar que el tiempo de ensamble con el método estándar sea mayor que con el método nuevo.
Resolver el siguiente ejercicio: Un grupo de empresarios inauguró el año pasado dos restaurantes en las zonas más representativas de Lima. Después de una año de actividades deciden medir y comparar, el nivel de consumo de ambos locales para lo cual eligen muestras aleatorias de los ingresos diarios (miles de soles) y encuentran lo siguiente: Local 1 3.15 2.63 2.58 3.91 1.63 2.53 2.05 2.45 2.03 3.09 Local 2 1.96 2.04 1.75 1.61 1.47 2.02 2.35 0.6 2.26 2.41 2.42 Se puede afirmar que la variabilidad de los ingresos no es la misma. Asuma que la variable ingreso mensual tiene distribución normal y use un nivel de significación del 4%.
Prueba de hipótesis para dos medias con varianzas desconocidas pero heterogéneas Unilateral izquierda Bilateral derecha H0: m1 – m2 ≥ k H0: m1 – m2 = k H0: m1 – m2 ≤ k H1: m1 – m2 < k H1: m1 – m2 ≠ k H1: m1 – m2 > k
Estadístico de prueba: Grados de libertad: Supuestos: poblaciones normales, muestras independientes y al azar.
Ejemplo: Una entidad financiera está evaluando los montos correspondientes a préstamos financieros otorgados por dos entidades bancarias: «en ti confío» y «presto al toque». Se selecciona una muestra aleatoria de cada entidad financiera encontrándose los siguientes montos en miles de dólares en calidad de préstamo En ti confío 95 80 72 63 45 81 92 50 65 54 Presto al toque 75 88 120 140 82 57 42 150 49 130 85 90 Se puede afirmar al nivel de significación del 4%, que los montos promedio de préstamos otorgados por la empresa en ti confío son menores a los otorgados por presto al toque. Asuma varianzas heterogéneas.
Solución: El valor crítico es -1.83965114 Conclusión: Prueba t para dos muestras suponiendo varianzas desiguales En ti confío Presto al toque Media 69.4615385 89.3333333 Varianza 253.769231 1068.52381 Observaciones 13 15 Diferencia hipotética de las medias Grados de libertad 21 Estadístico t -2.08593276 P(T<=t) una cola 0.02468427 Valor crítico de t (una cola) 1.83965114 P(T<=t) dos colas 0.04936854 Valor crítico de t (dos colas) 2.18942727 El valor crítico es -1.83965114 Conclusión: Se rechaza la Ho, se puede afirmar que los montos otorgados por «en ti confío» son menores a los de «presto al toque»
Resolver el siguiente ejercicio: Un grupo de empresarios inauguró el año pasado dos restaurantes en las zonas más representativas de Lima. Después de una año de actividades deciden medir y comparar, el nivel de consumo de ambos locales para lo cual eligen muestras aleatorias de los ingresos diarios (miles de soles) y encuentran lo siguiente: Local 1 3.15 2.63 2.58 3.91 1.63 2.53 2.05 2.45 2.03 3.09 Local 2 1.96 2.04 1.75 1.61 1.47 2.02 2.35 0.6 2.26 2.41 2.42 Se puede afirmar que el local 1 tiene ingresos promedios mayores que los del local 2. Si esto es cierto en el local 1 se incrementará el número de mesas. Asuma que la variable ingreso mensual tiene distribución normal y use un nivel de significación del 4%.
Evaluación: En cada uno de los siguientes casos se le pide: Planteamiento de la hipótesis Fijar el nivel de significación Identificar el estadístico de prueba y su valor Región crítica y Valor(es) crítico(s): Decisión: Conclusión:
Evaluación: Considerando el planteamiento de la hipótesis, tome una decisión: Usando un nivel de significación del 2%
Evaluación: Considerando el planteamiento de la hipótesis, tome una decisión: Usando un nivel de significación del 1% ≤
Continúa reforzando lo aprendido Desarrollando la autoevaluación Número 1 ….…