Estadística Administrativa II USAP Estadística Administrativa II 2016-1 Análisis de varianza
𝜎 2 ANOVA Análisis de varianza
La prueba ANOVA A menudo se necesitan hacer comparaciones para más de dos medias y para ello se utilizan la metodología del análisis de varianza (ANOVA), que recurre a la distribución F.
Principio Experimentos en agricultura Variación de tratamiento Variación aleatoria Muestra 1 Muestra 2 Muestra 3 Muestra 4
Variación de tratamiento “VARIACIÓN DE TRATAMIENTO: Suma de las diferencias entre la media de cada tratamiento y la media global elevada al cuadrado.” (Lind |Marchal |Wathen, 2008, p.331). Media aritmética global Media aritmética de cada muestra 𝑋 = 𝑋 𝑖 𝑛
Variación de tratamiento 𝑉𝑇= 𝑛 1 𝑋 𝑚 1 − 𝑋 𝑔 2 + 𝑛 2 𝑋 𝑚 2 − 𝑋 𝑔 2 + … Calcular la media aritmética de cada muestra Calcular la media aritmética de todos los datos en análisis La diferencia entre la media muestral y la media global; se eleva al cuadrado Se suman todas las diferencias cuadradas
Ejemplo . . . (sin demostrar hipótesis) El gerente de un centro financiero regional desea comparar la productividad, medida por el número de clientes atendidos, de 3 de sus empleados. Selecciona 4 días en forma aleatoria y registra el número de clientes que atendió cada empleado. Los resultados obtenidos fueron:
. . . Ejemplo 𝑋 𝐿 = 224 4 =56 𝑋 𝐵 = 280 4 =70 𝑋 𝐶 = 192 4 =48 𝑋 𝑔 = 696 12 =58
. . . Ejemplo 𝑋 𝑚 − 𝑋 𝑔 2 𝑉𝑇=992
Variación Aleatoria 𝑋 = 𝑋 𝑖 𝑛 “VARIACIÓN ALEATORIA: Suma de las diferencias entre cada observación y su media de tratamiento, elevada al cuadrado.” (Lind |Marchal |Wathen, 2008, p.331). Observación ≡Dato de una muestra Media aritmética de cada muestra 𝑋 = 𝑋 𝑖 𝑛
Variación Aleatoria Calcular la media aritmética de cada muestra 𝑉𝐴= 𝑋 𝑖 − 𝑋 𝑚 1 2 + 𝑋 𝑗 − 𝑋 𝑚 2 2 + … Calcular la media aritmética de cada muestra La diferencia entre el dato observado y la media de la muestra se eleva al cuadrado Se suman todas las diferencias cuadradas
Ejemplo 1 . . . (sin demostrar hipótesis) El gerente de un centro financiero regional desea comparar la productividad, medida por el número de clientes atendidos, de 3 de sus empleados. Selecciona 4 días en forma aleatoria y registra el número de clientes que atendió cada empleado. Los resultados obtenidos fueron:
. . . Ejemplo 1 𝑋 𝑖 − 𝑋 𝑚 2 𝑉𝐴=90
Distribución F para ANOVA 𝐹= 𝑠 1 2 𝑠 2 2
Distribución F para Anova 𝐹= 𝐸𝑠𝑡𝑖𝑚𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙 𝑏𝑎𝑠𝑎𝑑𝑎 𝑒𝑛 𝑙𝑎𝑠 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑐𝑖𝑎𝑠 𝑒𝑛𝑡𝑟𝑒 𝑚𝑒𝑑𝑖𝑎𝑠 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙𝑒𝑠 𝐸𝑠𝑡𝑖𝑚𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙 𝑏𝑎𝑠𝑎𝑑𝑎 𝑒𝑛 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 𝑑𝑒𝑛𝑡𝑟𝑜 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 𝑜 𝑒𝑟𝑟𝑜𝑟 𝑚𝑒𝑑𝑖𝑜 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑜 (𝑀𝑆𝐸) = 𝑉𝑇 𝑘−1 𝑉𝐴 𝑛−𝑘 𝑘 es el total de muestras en análisis 𝑛 es el total de elementos en análisis
Tabla resumen ANOVA Error medio cuadrado MSE
Ejemplo 1 . . . El gerente de un centro financiero regional desea comparar la productividad, medida por el número de clientes atendidos, de 3 de sus empleados. Selecciona 4 días en forma aleatoria y registra el número de clientes que atendió cada empleado. Con los datos observados, se obtuvo una variación de tratamiento de 992 y una variación aleatoria de 90. Los resultados se obtuvieron de las siguientes muestras: ¿Existe alguna diferencia entre las medias de la población con nivel de significancia de 0.10?
. . . Ejemplo 1 Paso 1: Hipótesis nula y alternativa 𝐻 0 : 𝜇 𝑙𝑜𝑏𝑜 = 𝜇 𝑏𝑙𝑎𝑛𝑐𝑜 = 𝜇 𝑐ó𝑟𝑑𝑜𝑏𝑎 𝐻 𝑎 :𝑁𝑜 𝑡𝑜𝑑𝑎𝑠 𝑙𝑎𝑠 𝑚𝑒𝑑𝑖𝑎𝑠 𝑠𝑜𝑛 𝑖𝑔𝑢𝑎𝑙𝑒𝑠 Paso 2: Nivel de significancia 𝛼=0.10 Paso 3: Estadístico de prueba 𝐹= 𝑠 1 2 𝑠 2 2
. . . Ejemplo 1 Paso 4: Regla de decisión 𝐹=4.26 𝐻 0 : 𝜇 𝑙𝑜𝑏𝑜 = 𝜇 𝑏𝑙𝑎𝑛𝑐𝑜 = 𝜇 𝑐ó𝑟𝑑𝑜𝑏𝑎 2 𝑐𝑜𝑙𝑎𝑠 𝛼= 0.10 2 =0.05 𝑔𝑙 1 =3−1=2 𝑘=3 𝑔𝑙 2 =12−3=9 𝑛=12 𝐹=4.26
La hipótesis nula se rechaza 𝐹=4.26 . . . Ejemplo 1 Paso 5: Toma de decisión La hipótesis nula se rechaza Existe evidencia fuerte de que no todas las medias de la población son iguales
Ejemplo 2 . . . La siguiente información se refiere a dos muestras. Verificar la hipótesis de que las medias de tratamiento son iguales con nivel de significancia de 0.02. Tratamiento 1 Tratamiento 2 Tratamiento 3 8 3 5 2 4 10 9
. . . Ejemplo 2 Paso 1: Hipótesis nula e hipótesis alternativa 𝐻 0 : 𝜇 1 = 𝜇 2 = 𝜇 3 𝐻 𝑎 :𝑁𝑜 𝑡𝑜𝑑𝑎𝑠 𝑙𝑎𝑠 𝑚𝑒𝑑𝑖𝑎𝑠 𝑠𝑜𝑛 𝑖𝑔𝑢𝑎𝑙𝑒𝑠 Paso 2: Nivel de significancia 𝛼=0.02 Paso 3: Estadístico de prueba 𝐹= 𝑠 1 2 𝑠 2 2
. . . Ejemplo 2 Paso 4: Regla de decisión 𝐹=8.02 𝐻 0 : 𝜇 1 = 𝜇 2 = 𝜇 3 2 𝑐𝑜𝑙𝑎𝑠 𝛼= 0.02 2 =0.01 𝑘=3 𝑔𝑙 1 =3−1=2 𝑔𝑙 2 =12−3=9 𝑛=12 𝐹=8.02
. . . Ejemplo 2 𝑃𝑎𝑠𝑜 5:𝑇𝑜𝑚𝑎 𝑑𝑒 𝐷𝑒𝑐𝑖𝑠𝑖ó𝑛 𝑘=3 𝑛=12 𝑀𝑒𝑑𝑖𝑎 𝑎𝑟𝑖𝑡𝑚é𝑡𝑖𝑐𝑎 de cada muestra 𝑀𝑒𝑑𝑖𝑎 𝑎𝑟𝑖𝑡𝑚é𝑡𝑖𝑐𝑎 global
. . . Ejemplo 2
La hipótesis nula se rechaza 𝐹=8.02 . . . Ejemplo 2 La hipótesis nula se rechaza Existe evidencia suficiente que indica que no todas las medias de la población son iguales
Práctica 1 Las temperaturas promedio de las tres principales ciudades fueron registradas en las siguientes muestras: Tegucigalpa San Pedro Sula Ceiba 18 29 31 22 32 30 24 38 35 19 28 Con un nivel de significancia de 0.10. probar si las temperaturas son iguales en las 3 ciudades.
Desarrollo práctica 1 Paso 1: Hipótesis nula e hipótesis alternativa 𝐻 0 : 𝜇 1 = 𝜇 2 = 𝜇 3 𝐻 𝑎 :𝑁𝑜 𝑡𝑜𝑑𝑎𝑠 𝑙𝑎𝑠 𝑚𝑒𝑑𝑖𝑎𝑠 𝑠𝑜𝑛 𝑖𝑔𝑢𝑎𝑙𝑒𝑠 Paso 2: Nivel de significancia 𝛼=0.10 Paso 3: Estadístico de prueba 𝐹= 𝑠 1 2 𝑠 2 2
Desarrollo práctica 1 Paso 4: Regla de decisión 𝐹=3.89 𝐻 0 : 𝜇 1 = 𝜇 2 = 𝜇 3 2 𝑐𝑜𝑙𝑎𝑠 𝛼 2 = 0.10 2 =0.05 𝑘=3 𝑔𝑙 1 =3−1=2 𝑔𝑙 2 =15−3=12 𝑛=15 𝐹=3.89
Desarrollo práctica 1 𝑃𝑎𝑠𝑜 5:𝑇𝑜𝑚𝑎 𝑑𝑒 𝐷𝑒𝑐𝑖𝑠𝑖ó𝑛 𝑘=3 𝑛=15 Tegucigalpa San Pedro Sula Ceiba 18 29 31 22 32 30 24 38 35 19 28 𝑘=3 𝑛=15 𝑀𝑒𝑑𝑖𝑎 𝑎𝑟𝑖𝑡𝑚é𝑡𝑖𝑐𝑎 de cada muestra 𝑀𝑒𝑑𝑖𝑎 𝑎𝑟𝑖𝑡𝑚é𝑡𝑖𝑐𝑎 global
Desarrollo práctica 1
Desarrollo práctica 1 𝐹=3.89 Valor crítico La hipótesis nula se rechaza
Hipótesis nula rechazada La hipótesis nula rechazada indica que no todas las medias son iguales; sin embargo, se puede identificar un par de muestras para establecer el intervalo de confianza que nos indique que tanto es esa diferencia.
De eso se trata el siguiente tema Muchas gracias Lind, D.A., Marchal, W.G., Wathen, S.A. (15). (2012). Estadística Aplicada a los Negocios y la Economía. México: McGrawHill David M. Levine, Timothy C. Krehbiel, Mark L. Berenson. 2006. Estadística para Administración. (4° edición). Naucalpan de Juárez, México.: Pearson Prentice Hall