Sesión 7 Pruebas de Bondad de ajuste Universidad Javeriana Inferencia Estadística
Objetivo Determinar si la distribución de un conjunto de datos, seleccionados al azar y de forma independiente, se ajusta a alguna distribución conocida específica. Distribuciones discretas o por intervalos
Ejemplo Considere el lanzamiento de un dado. Se quiere evaluar la hipótesis de que la distribución de los resultados sea equiprobable, es decir, uniforme discreta, con 5 % de significancia. Suponga que se lanza el dado 120 veces. Lo esperado es que el dado caiga en cada cara 20 veces. No obstante se aprecian otros resultados, como los que se muestran a continuación
Ejemplo 5 %95 % χ 2 (6-1) 11,07 1,7
Ejemplo Compruebe la hipótesis de que la duración de un grupo de 40 baterías para automóvil (en años) se puede aproximar normal con media de 3,5 y desviación 0,7. Utilice una significancia de 0,05. La información fue listada como se presenta a continuación:
Ejemplo Se calculan los valores esperados a través de la probabilidad para cada intervalo multiplicado por el total de la muestra (40). Por ejemplo para la cuarta clase:
Ejemplo No obstante, se deben agrupar aquellos datos donde el valor observado sea menor o igual a 5. Posteriormente se calcula el valor del estadístico.
Ejemplo 5 %95 % χ 2 (4-1) 7,815 3,05 De esta manera, no se rechaza la Ho y se puede asumir que la distribución normal representa un buen ajuste a los datos proporcionados.
Ejercicio Un proceso de fabricación de rodamientos para la industria automotriz presenta la siguiente frecuencia de producción (en unidades) para una de sus máquinas: ¿Se puede afirmar que el proceso de la máquina sigue una distribución normal con media 50 y desviación 15 unidades? Utilice una significancia del 5 % ClaseFrecuencia Menos de o más2 TOTAL150
Ejemplo ParticiónDistribución
Ejemplo Partición
Ejemplo Partición
Prueba de Kolgomorov-Smirnof
Ejemplo Una empresa textil se encuentra realizando un estudio sobre la longitud de las mangas para una prenda de cierta talla que planea lanzar al mercado. Las longitudes de los brazos para 15 modelos (en centímetros) son: 85 82,5 83, , ,2 85,3 86,5 82,9 86, ,4 83,5 84. Compruebe que la longitud de las mangas para la prenda sigue una distribución normal con media 84,7 y desviación 1,46. Utilice una significancia del 5 %. Sn(x) cada observación es diferente por lo que las frecuencias acumuladas serán 1/15, 2/15…. Datos (ordenados)Sn(x) 82,51/15 = 0, ,92/15 = 0, /15 = 0,2 …… 86,614/15 = 0, /15 = 1
Ejemplo Datos (ordenados)Sn(x)Fx(n) 82,51/15 = 0,06670,066 82,92/15 = 0,13330, /15 = 0,20,122 ……… 86,614/15 = 0,93330, /15 = 10,942
Este valor se compara contra el punto crítico de la tabla para una significancia de 5 % y n = 15 Como el valor de prueba es menor que el punto crítico No se rechaza la hipótesis nula y se concluye que los datos si se pueden ajustar a una distribución normal. Ejemplo Datos (ordenados)Sn(x)Fn(x)|Sn(x) – Fn(x)| 82,51/15 = 0,06670,0660, ,92/15 = 0,13330,1080, /15 = 0,20,1220,0779 ………… 86,614/15 = 0,93330,9030, /15 = 10,9420,0576
Ejemplo Se requiere comprobar si el número de materias aprobadas en una convocatoria universitaria sigue una distribución Poisson con media 1,9833, utilizando una sgnificancia del 5 %. Para lo anterior se cuenta con una muestra de 60 estudiantes: Asignaturas aprobadasNúmero de estudiantes
Ejemplo Sn(x) Fn(x) Dn = |Sn(x) – Fn(x)| Como el valor de prueba es menor que el punto crítico, No se rechaza la hipótesis nula y se concluye que los datos si se pueden ajustar a una distribución Poisson
Ejemplo Una prueba de habilidad de 8 personas para un puesto laboral arrojó los siguientes resultados: 48,1 47,8 45,1 46,3 45,4 47,2 46,6 46. ¿Se puede afirmar que la distribución de los puntajes sigue una normal con media 40 y desviación de 3? Utilice 1 % de significancia.
Ejemplo Como el valor de prueba es mayor al punto crítico, se rechaza la hipótesis nula y se establece que no hay evidencia estadística que soporte que los datos siguen una distribución normal con media 40 y desviación 3.
Ejercicios de repaso Pruebe si los datos se ajustan a una distribución normal con media 1,8 y desviación 0,4. Utilice significancia de 0,01.