Descargar la presentación
La descarga está en progreso. Por favor, espere
1
Estadística Administrativa II
2014-3 Análisis de Varianza
2
Distribución F Prueba de dos muestras con varianzas iguales
Comparación de varias medias poblacionales en forma simultánea Análisis de Varianza (ANOVA) Distribución normal Datos en escala de intervalos 𝑃𝑎𝑟á𝑚𝑒𝑡𝑟𝑜𝑠: 𝐺𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑 𝑛𝑢𝑚𝑒𝑟𝑎𝑑𝑜𝑟 𝐺𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑 𝑑𝑒𝑛𝑜𝑚𝑖𝑛𝑎𝑑𝑜𝑟
3
Distribución F Características Distribución continua
Distribución no negativa Sesgo positivo Asintótica La hipótesis se prueba a través de las varianzas
4
Comparación de dos varianzas poblacionales
𝐻 0 : 𝜎 1 2 = 𝜎 2 2 𝐻 𝑎 : 𝜎 1 2 ≠ 𝜎 2 2 𝐹= 𝑠 𝑠 2 2 Estadístico de prueba para comparar dos varianzas Análisis para 2 colas
5
Ejemplo Lammers Co. ofrece servicio de limusina de Toledo, Ohio al aeropuerto metropolitano de Detroit; el recorrido se hace por 2 rutas; la carretera 25 y la autopista I-75. Se desea estudiar el tiempo que tardaría en conducir al aeropuerto por cada una de las rutas. Usando el nivel de significancia de ¿Hay alguna diferencia entre las variaciones de los tiempos de manejo por las dos rutas. El tiempo medio por la carretera 25 es de minutos y por la autopista I-75 es de 59 minutos. Los tiempos de variación de la muestra entre cada recorrido es una desviación estándar de ’ para la carretera 25 y para la autopista I-75.
6
. . . Ejemplo 1 La distancia por la autopista I-75 es más larga que por la carretera 24. Es importante que el servicio sea tanto puntual como consistente, por lo que se realizará una prueba estadística para determinar si existe una diferencia en las variaciones entre ambas rutas. Para lo cual se tomó una muestra de 7 recorridos por la carretera 25 y 8 por la autopista I-75. 𝐻 0 : 𝜎 25 2 = 𝜎 𝐼−75 2 𝐻 𝑎 : 𝜎 25 2 ≠ 𝜎 𝐼−75 2 𝛼=0.10 𝐹= 𝑠 𝑠 2 2
7
. . . Ejemplo 1 Regla de decisión 2 colas 𝛼=0.10 𝑛 1 =7 𝑛 2 =8 𝑔𝑙 1 =6
𝑔𝑙 2 =7 𝑏𝑢𝑠𝑐𝑎𝑟 𝑒𝑙 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑓 𝑒𝑛 𝑙𝑎 𝑡𝑎𝑏𝑙𝑎 𝑑𝑒 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑓=3.87
8
. . . Ejemplo 1 Población 1 = C-25 Población 2 = I-75
Toma de decisión con los datos de la muestra 𝑠 1 =8.9947 𝑠 2 =4.3753 𝑛 1 =7 𝑛 2 =8 𝐹= 𝑠 𝑠 𝑠 2 = =4.23 La hipótesis nula no se acepta. Se concluye que existe una diferencia entre las variaciones de los tiempos recorridos por las dos rutas.
9
Comparación de dos varianzas poblacionales
𝐻 0 : 𝜎 1 2 > 𝜎 2 2 𝐻 𝑎 : 𝜎 1 2 ≤ 𝜎 2 2 𝐹= 𝑠 𝑠 2 2 Estadístico de prueba para comparar dos varianzas Análisis para 1 cola
10
Ejemplo . . . Steele Electric Products, ensambla componentes electricos para teléfonos celulares. Durante los últimos 10 días Mark Nagy ha promediado 9 productos rechazados, con una desviación estándar de 2 rechazos por día. Debbie Richmond promedio 8.5 productos rechazados, con una desviación estándar de 1.5 rechazos durante el mismo periodo. Con un nivel de significancia de 0.05, ¿podría concluir que hay mas variación en el numero de productos rechazados por día en la muestra de Mark? 𝑛=10 𝑎𝑚𝑏𝑎𝑠 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑠 𝑃𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 𝑃𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 2 𝑠 1 = 𝑠 2 =1.5 𝑋 1 = 𝑋 2 =8.5
11
. . . Ejemplo 𝐻 0 : 𝜎 1 2 < 𝜎 2 2 𝐻 𝑎 : 𝜎 1 2 ≥ 𝜎 2 2 𝛼=0.05
𝐹= 𝑠 𝑠 2 2 Regla de decisión 1 𝑐𝑜𝑙𝑎 𝑛 1 =10≡ 𝑔𝑙 1 =9 𝑛 2 =10≡ 𝑔𝑙 2 =9 𝐹=3.18
12
. . . Ejemplo Con los datos de la muestra tomar la decisión
𝐹= 𝑠 𝑠 2 2 = =1.78 1.78<3.18 La hipótesis nula no se rechaza La variación es la misma para ambos empleados
13
Análisis de varianza (ANOVA)
𝐻 0 : 𝜎 1 2 > 𝜎 2 2 𝐻 𝑎 : 𝜎 1 2 ≤ 𝜎 2 2 𝐹= 𝑠 𝑠 2 2 Múltiples medias poblacionales
14
ANOVA ANOVA se desarrolló para aplicaciones en agricultura, y aún se emplean muchos de los términos relacionados con ese contexto. En particular, con el termino tratamiento se identifican las poblaciones diferentes que se examinan. Por ejemplo, el tratamiento se refiere a cómo una extensión de terreno se trató con un tipo particular de fertilizante.
15
Características de ANOVA
Poblaciones distribuidas normalmente Desviación estándar iguales Poblaciones independientes Posibilidad de error tipo I si se utiliza la comparación de medias poblacionales
16
Cálculos ANOVA Media Global 𝑥 𝑖 Variación total
Calcular la media de todas las muestras extraídas ( 𝑋 𝑔 ) Variación total Resta de cada dato y la media global ( 𝑥 𝑖 − 𝑋 𝑔 ), elevar al cuadrado y sumar los resultados Variación de tratamiento Resta de cada media de la muestra y la media global, una por cada dato, elevar al cuadrado y sumar los resultados Variación aleatoria Resta de cada dato a su respectiva media, elevar al cuadrado y sumar los resultados 𝑥 𝑖 𝑥 𝑖 − 𝑋 𝑔 2 𝑛 𝑖 𝑋 𝑖 − 𝑋 𝑔 2 𝑥 𝑖 − 𝑋 𝑗 2
17
Cálculos ANOVA Varianza 1 Varianza 2 Distribución F
𝑠 1 2 = 𝑉𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑡𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜 𝑀𝑢𝑒𝑠𝑡𝑟𝑎𝑠 −1 Varianza 2 𝑠 2 2 = 𝑉𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎 𝑡𝑎𝑚𝑎ñ𝑜 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 𝑔𝑙𝑜𝑏𝑎𝑙 −𝑡𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜𝑠 Distribución F 𝐹= 𝑠 𝑡 2 𝑠 𝑎 2 = 𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑑𝑒 𝑡𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜 𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎
18
Ejemplo Joan Kulman es la gerente de un centro financiero y desea comparar la productividad de los empleados en su atención al cliente, Toma de base 3 empleados y revisa el número de clientes que atendieron durante 4 días. Los resultados de las muestras son: Media global 𝑋 𝑔 = =58
19
. . . Ejemplo 1 Variación Total Variación Tratamiento
𝑥 𝑖 − 𝑋 𝑔 2 = 55− − − −58 2 + 66− − − −58 2 + 47− − − −58 2 =1082 Variación Tratamiento 𝑛 𝑖 𝑋 𝑖 − 𝑋 𝑔 2 = 4 56− − −58 2 =992
20
. . . Ejemplo 1 Variación Aleatoria Varianzas
𝑥 𝑖 − 𝑋 𝑗 2 = 55− − − −56 2 + 66− − − −70 2 + 47− − − −48 2 =90 Varianzas 𝑠 𝑡 2 = 992 3−1 = =496 𝑠 𝑎 2 = 90 12−3 = 90 9 =10 𝐹= =49.6
21
Prueba de hipótesis ANOVA
22
Ejemplo . . . Metroya es una empresa de investigación de mercados que analizó el comportamiento de los pasajeros de 4 aerolíneas. Diseñó una encuesta valorada en 100 puntos para medir la satisfacción de los clientes. Con un nivel de significancia de 0.01 procesar las 4 muestras obtenidas. Determinar si hay alguna diferencia en el nivel de satisfacción medio entre las 4 aerolíneas
23
. . . Ejemplo 𝐻 0 : 𝜇 1 = 𝜇 2 = 𝜇 3 = 𝜇 4 𝐻 𝑎 :𝑁𝑜 𝑡𝑜𝑑𝑎𝑠 𝑙𝑎 𝜇 𝑠𝑜𝑛 𝑖𝑔𝑢𝑎𝑙𝑒𝑠 𝛼=0.01 Estadístico 𝐹= 𝑠 𝑠 2 2 Regla de decisión 2 colas Grados de libertad del numerador: muestras – 1 = 4 – 1 = 3 𝑔𝑙=3 Grados de libertad del denominador: Total global – tratamientos = 22 – 4 = 18 𝑔𝑙=18
24
. . . Ejemplo 𝑔𝑙=3 Toma de decisión Regla de decisión 2 colas 𝛼=0.01
𝑔𝑙=18 Toma de decisión Media global Media de tratamientos 𝐹=5.09 𝑋 𝑔 = =75.64
25
. . . Ejemplo Variación Total Variación Tratamiento 𝑋 𝑔 =75.64
𝑋 𝑔 =75.64 𝑉 𝑡𝑜𝑡𝑎𝑙 = 𝑉 𝑡𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜 =890.68
26
. . . Ejemplo Variación Aleatoria 𝑋 𝑔 =75.64 𝑉 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎 =594.4
27
. . . Ejemplo Varianza 1 Varianza 2 Distribución F
𝑠 𝑡 2 = 𝑉 𝑡𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑠 −1 = −1 = =296.9 Varianza 2 𝑠 𝑎 2 = 𝑉 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎 𝑡𝑎𝑚𝑎ñ𝑜 𝑔𝑙𝑜𝑏𝑎𝑙−𝑡𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜𝑠 = −4 = =33.0 Distribución F 𝐹= =8.99 𝐿𝑎 ℎ𝑖𝑝ó𝑡𝑒𝑠𝑖𝑠 𝑛𝑢𝑙𝑎 𝑛𝑜 𝑠𝑒 𝑎𝑐𝑒𝑝𝑡𝑎. 𝐸𝑥𝑖𝑠𝑡𝑒 𝑒𝑣𝑖𝑑𝑒𝑛𝑐𝑖𝑎 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑡𝑖𝑣𝑎 𝑑𝑒 𝑞𝑢𝑒 𝑙𝑎𝑠 4 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑠 𝑛𝑜 𝑠𝑜𝑛 𝑖𝑔𝑢𝑎𝑙𝑒𝑠
28
Tratamiento e inferencia sobre pares de medias poblacionales
Distribución t
29
Tratamiento e inferencia sobre pares de medias poblacionales
Análisis después de que una hipótesis ha sido rechazada o no aceptada. Se tiene sospecha que solo algunas de las muestras afectan el resultado Análisis sobre dos muestras a la vez Utilización de intervalos Error muestral calculado en base de la distribución t
30
Intervalo de confianza sobre pares de medias
𝐼𝐶= 𝑋 1 − 𝑋 2 ±𝑡 𝑠 𝑎 𝑛 𝑛 2 𝑋 1 ≡𝑀𝑒𝑑𝑖𝑎 𝑑𝑒 𝑙𝑎 𝑝𝑟𝑖𝑚𝑒𝑟𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 𝑒𝑙𝑒𝑔𝑖𝑑𝑎 𝑋 2 ≡𝑀𝑒𝑑𝑖𝑎 𝑑𝑒 𝑙𝑎 𝑠𝑒𝑔𝑢𝑛𝑑𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 𝑒𝑙𝑒𝑔𝑖𝑑𝑎 𝑡≡𝐸𝑠𝑡𝑎𝑑í𝑠𝑡𝑖𝑐𝑜 𝑑𝑒 𝑝𝑟𝑢𝑒𝑏𝑎 𝑡 𝑠 𝑎 2 ≡𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎 𝑛 1 ≡𝑇𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑝𝑟𝑖𝑚𝑒𝑟𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 𝑒𝑙𝑒𝑔𝑖𝑑𝑎 𝑛 2 ≡𝑇𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑠𝑒𝑔𝑢𝑛𝑑𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 𝑒𝑙𝑒𝑔𝑖𝑑𝑎 𝑔𝑙=𝑀𝑢𝑒𝑠𝑡𝑟𝑎 𝑔𝑙𝑜𝑏𝑎𝑙 −𝑇𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜𝑠
31
Ejemplo . . . Metroya rechazó la hipótesis de que las 4 muestras son iguales. Se va a hacer una revisión de la muestras de Eastern y AA para determinar si los clientes de estas empresas inciden en los resultados obtenidos. Calcular el intervalo de confianza utilizando un nivel de confianza del 95% 𝑋 1 =87.3 𝑋 2 =69.0 𝑛 𝑔 =22 𝑡𝑟𝑎𝑡=4 𝑔𝑙=22−4=18 𝑛 1 =4 𝑛 2 =6 𝛼=0.05 2 𝑐𝑜𝑙𝑎𝑠 𝑡=2.101
32
. . . Ejemplo 𝑋 1 − 𝑋 2 ±𝑡 𝑠 𝑎 𝑛 𝑛 2 = 87.3−69.0 ± = 18.3±2.101(3.709) 𝑋 1 =87.3 𝑋 2 =69.0 𝑛 1 =4 𝑛 2 =6 𝑡=2.101 𝑠 𝑎 2 =33.02 𝐼𝐶 95% = 18.3−7.793= =26.04 Ambas están al mismo lado de la curva. Con un 95% de confianza las medias varían significativamente.
33
Fin de la presentación Muchas gracias
Lind, D.A., Marchal, W.G., Wathen, S.A. (15). (2012). Estadística Aplicada a los Negocios y la Economía. México: McGrawHill
Presentaciones similares
© 2024 SlidePlayer.es Inc.
All rights reserved.