Tema 3. El estadístico Chi-cuadrado y contrastes asociados RONALD AYLMER FISHER
¿Qué vamos hacer ahora? Veamos un estadístico para ver si dos variables están o no asociadas Hay variables - Muy relacionadas - Muy poco relacionadas El estadístico Chi-cuadrado
H0: Las variables en filas y columnas no están asociadas H1: Las variables en filas y columnas están asociadas Las hipótesis son: Necesitamos “frecuencias esperadas”
EJEMPLO (supervivencia en el Titanic) SobreviveNo sobreviveTotal Primera clase Segunda clase Tercera clase Total Frecuencias esperadas
SobreviveNo sobreviveTotal Primera clase 110,6211,4 322 Segunda clase 96,2183,8 280 Tercera clase 244,2466,8 711 Total Calculemos Chi-cuadrado Ya vuelven los matemáticos a complicar las cosas
Traducción Tenemos dos tablas (sin totales): Frecuencias absolutas Frecuencias esperadas 1)Hagamos otra tabla, donde restamos a la primera la segunda SobreviveNo sobrevive Primera clase Segunda clase Tercera clase SobreviveNo sobrevive Primera clase110,6211,4 Segunda clase96,2183,8 Tercera clase244,2466,8 SobreviveNo sobrevive Primera clase ( ,6)( ,4) Segunda clase (119-96,2)( ,8) Tercera clase ( ,2)( ,8)
3) Dividido por el valor que tengamos en la segunda tabla 2) Este valor elevado al cuadrado SobreviveNo sobrevive Primera clase ( ,6)^2( ,4)^2 Segunda clase (119-96,2)^2( ,8)^2 Tercera clase ( ,2)^2( ,8)^2 SobreviveNo sobrevive Primera clase ( ,6)^2/110,6( ,4)^2/211,4 Segunda clase (119-96,2)^2/96,2( ,8)^2/183,8 Tercera clase ( ,2)^2/244,2( ,8)^2/466,8
Obtenemos la siguiente tabla en nuestro ejemplo SobreviveNo sobrevive Primera clase Segunda clase Tercera clase
Probabilidad de un valor superior - Alfa (α) Grados libertad0,10,050,0250,010,005 12,713,845,026,637,88 24,615,997,389,2110,60 36,257,819,3511,3412,84 47,789,4911,1413,2814,86 59,2411,0712,8315,0916,75 610,6412,5914,4516,8118,55
Tenemos: 1) grados de libertad, son: K = (número de fila-1)x(número de columnas-1) = (3-1)x(2-1) = 2 Ahora calculemos el valor de la tabla Chi-cuadrado 2) El valor alfa (0,05 si no se dice). 3) El valor que buscamos SIGNIFICADO: La probabilidad de obtener un valor mayor que 5,99 es 0,05
Tenemos: Por tanto: SIGNIFICADO: Las variables no son independientes SIGNIFICADO en el ejemplo: El salvamento de los viajeros en el Titanic no fue independiente de su clase social.
Hemos hecho un contraste de hipótesis Los pasos en un contraste son: 1) Fijar las hipótesis que se quieren contrastar: 2) Fijar el nivel de significación: 3) Elegir un estadístico de contraste: 4) Se toma la decisión de rechazar o no la hipótesis: Aceptar Rechazar Independientes Dependientes
Contraste de homogeneidad 1) Fijar las hipótesis que se quieren contrastar: 2) Fijar el nivel de significación: la distribución de la variable Y en alguna de estas subpoblaciones es diferente Las subpoblaciones tienen idéntica distribución para la variable Y.
3) Elegir un estadístico de contraste: 4) Se toma la decisión de rechazar o no la hipótesis: Aceptar Rechazar
EJEMPLO Se desea saber si la distribución de los grupos sanguíneos es similar en los individuos de dos poblaciones. Para ello se elige una muestra aleatoria de cada una de ellas, obteniéndose los siguientes datos ¿Qué decisión se debe tomar? ABAB0Total Muestra Muestra Total
Calculamos las frecuencias esperadas: ABAB0 Muestra Muestra Componentes de la Chi-cuadrado Estadístico de contraste:
Calculemos el valor Entonces: Los grados de libertad: La decisión de rechazar o no la hipótesis: Aceptar
¿Cuando podemos aplicar el estadístico Chi-cuadrado? 1) Siempre hacemos un contraste unilateral. 2) No debe usarse si hay frecuencias esperadas inferiores a 1. 3) Como máximo el 20% de las frecuencias esperadas pueden ser menores que el valor 5.
RESUMEN - El estadístico Chi-cuadrado - Fijar hipótesis - Fijar nivel de significación - Grados de libertad - Valores del estadístico - Contraste de independencia - Contraste de homogeneidad - Condiciones de aplicar el Chi-cuadrado
GRACIAS POR LA ATENCIÓN