El estadístico Chi- cuadrado ING. RAÚL ALVAREZ GUALE, MPC
Análisis de Contingencia
Objetivo Desarrollar una tabla de análisis contingencia y evaluar la independencia a través de la prueba chi-cuadrado.
Análisis de Contigencia Se ha visto pruebas de hipótesis referidas a una o dos proporciones poblacionales, ¿Qué de las situaciones que involucran múltiples proporciones poblacionales?
Ejemplos Una compañía de fondos mutuos ofrece 6 tipos diferentes de fondos. Se desea determinar si la proporción de clientes que selecciona cada fondo está vinculada o no a las 4 regiones de venta en que opera la compañía. El administrador de un hospital recolecta data de satisfacción con el servicio de los pacientes a través de ratings por departamento y desea saber si hay diferencias significativas entre los mismos. Un gerente de personal está interesado en determinar si hay una relación entre el nivel de satisfacción del trabajador con su trabajo y el tipo de trabajo. En estos tres casos las proporciones se refieren a características categóricas de la variable de interés.
Análisis de Contingencia El procedimiento estadístico de Análisis de Contingencia puede ser adecuado para la toma de decisiones en contextos de múltiples proporciones, con data de tipo nominal u ordinal y valores determinados por conteo de número de ocurrencias en cada categoría.
Análisis de Contingencia Se aplica en situaciones que involucran propor- ciones poblacionales múltiples. Los datos deben ser categóricos. Usado para clasificar observaciones muestrales de acuerdo a dos o más características. Usa el estadístico Chi-cuadrado para determinar independencia de las características de interés. Los datos son resumidos en una tabla de contingencia (también llamada tabla cruzada).
Análisis de Contingencia: Ejemplo H 0 : La preferencia manual es independiente del género H A : La preferencia manual no es independiente del género Preferencia manual vs. Género (dos variables), =0.05. Preferencia manual: Izquierda vs. Derecha Género: Masculino vs. Femenino
Análisis de Contingencia: Ejemplo Los resultados muestrales se encuentran organizados en una tabla de contingencia: (continuación) Género Preferencia manual IzquierdaDerecha Femenino Masculino De 120 mujeres, 12 son zurdas De 180 hombres, 24 son zurdos Tamaño muestral n =300
Lógica de la Prueba Si H 0 es verdadera, entonces la proporción de mujeres zurdas debería ser la misma como la proporción de hombres zurdos Las dos proporciones anteriores deberían ser las mismas como la proporción de zurdos (femenino y masculino) del total H 0 : La preferencia manual es independiente del género H A : La preferencia manual no es independiente del género
Hallando Frecuencias Esperadas Total: P(Zurdos) = 36/300 = 0.12 Si fueran independientes, entonces P(Zurdas | Femenino) = P(Zurdos | Masculino) = 0.12 Se esperaría que el 12% de 120 (femenino) y el 12% de 180 (masculino) sean zurdos… Es decir: (120)(0.12) = 14.4 mujeres serían zurdas (180)(0.12) = 21.6 hombres serían zurdos De 120 mujeres, 12 son zurdas De 180 hombres, 24 son zurdos
Hallando Frecuencias Esperadas Frecuencias esperadas: (continuación) Ejemplo: Total de mujeres Total muestral Total de zurdos Frecuencia esperada de mujeres zurdas
Frecuencias Observadas vs. Esperadas Género Preferencia manual IzquierdaDerecha Femenino Observado = 12 Esperado = 14.4 Observado = 108 Esperado = Masculino Observado = 24 Esperado = 21.6 Observado = 156 Esperado =
Frecuencias Marginales Una frecuencia marginal es la suma de las celdas de una fila o columna Ejemplo, la frecuencia marginal (femenino) en el estudio fue =120 La frecuencia marginal esperada para una categoría DEBE SER IGUAL a la frecuencia marginal observada de la misma categoría Es decir, la frecuencia marginal esperada (femenino) en el estudio debe también ser 120
Estadístico de Prueba Chi- cuadrado Donde: o ij = Frecuencia observada en la celda (i, j) e ij = Frecuencia esperada en la celda (i, j) r = Número de filas c = Número de columnas El estadístico de prueba Chi-cuadrado es: NOTA: Todas las filas y columnas deben ser usadas
Estadístico de Prueba Chi-cuadrado Género Preferencia manual IzquierdaDerecha Femenino Observado = 12 Esperado = 14.4 Observado = 108 Esperado = Masculino Observado = 24 Esperado = 21.6 Observado = 156 Esperado = (continuación)
Análisis de Contingencia 3.841= , g.l.=(r-1)(c-1)=1 Rechazar H 0 = 0.05 Regla de decisión: Si 2 > 3.841, rechazar H 0 ; en otro caso, no rechazar H 0 No rechazar H 0 Estadístico de prueba: Decisión: Como 2 = < 3.841, no se rechaza H 0 Conclusión: No hay suficiente evidencia para concluir que el género y la preferencia manual no son independientes
Prueba Chi-cuadrado: Consideraciones La distribución chi-cuadrado es solamente una aproximación de la verdadera distribución Pero es aceptable cuando todas las frecuencias esperadas son mayores que o iguales a 5 Cuando las frecuencias son menores que 5, el valor del estadístico de prueba chi-cuadrado podría incrementar la probabilidad del error tipo I Como regla, si la hipótesis nula no es rechazada, acepte el resultado así se tenga celdas con frecuencias esperadas menores a 5.9. Si las frecuencias esperadas son pequeñas: Primero, incrementar el tamaño muestral Si es necesario, combinar las categorías de las variables
Resumen Se usó la prueba chi-cuadrado en tablas de contingencia para evaluar independencia (análisis de contingencia) Se comparó las celdas de frecuencias observadas con las esperadas.
Problema H0: La opinión de un votante respecto a la nueva reforma fiscal es independiente de su nivel de ingreso,
Gracias