La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Clases 4 Pruebas de Hipótesis

Presentaciones similares


Presentación del tema: "Clases 4 Pruebas de Hipótesis"— Transcripción de la presentación:

1 Clases 4 Pruebas de Hipótesis
Curso de Metodología de la Investigación Profesor Manuel Lobos González Año 2011

2 PRUEBA CHI CUADRADO Sean X e Y dos variables categóricas. X con r categorías e Y con c categorías. Podemos utilizar una tabulación cruzada entre las variables para identificar la relación que existe entre ambas. En este caso la tabulación cruzada entre X e Y tendrá r filas y c columnas. Las respuestas para (X, Y) pueden ser pensadas como provenientes de alguna población tal que se pueden definir probabilidades para cada celda de la tabla. Cuando las celdas de una tabla contienen las frecuencias de respuestas, la tabla se denomina de contingencia.

3 PRUEBA CHI CUADRADO Una de las principales preguntas que uno quiere responder cuando analiza la asociación entre dos variables es si existe alguna relación entre ellas o lo que muestra la tabla es simple error muestral. Para responder a esta pregunta, se utiliza un test de hipótesis conocido como el test Chi-cuadrado de Pearson. La hipótesis nula del test es que las dos variables analizadas son independientes. La hipótesis alternativa es que las variables no son independientes, es decir que existe una relación entre las dos variables.

4 PRUEBA CHI CUADRADO Ejemplo: La siguiente tabla de contingencia muestra la tabulación cruzada de la variable Cantidad de libros en Biblioteca (dividido en tres categorías, menos de 2000; entre 2000 y 4000 y más de 4000) y la dependencia del colegio (dividida en tres categorías, Municipal, Particular Subvencionado y Particular Pagado).

5 PRUEBA CHI CUADRADO Tablas de Contingencia y Medidas de Asociación DEPENDENCIA CANTIDAD LIBROS PARTICULAR PAGADO PARTICULAR SUBVENCIONADO MUNICIPAL Total Menos de 2000 45 95 62 202 65 80 100 245 más de 4000 90 89 241 200 237 251 688

6 Tablas de Contingencia y Medidas de Asociación
PRUEBA CHI CUADRADO Tablas de Contingencia y Medidas de Asociación Las entradas de la tabla representan el número de colegios en la muestra con cada combinación de cantidad de libros en la biblioteca y dependencia del colegio. Por ejemplo, 45 colegios particulares pagados tienen menos de 2000 libros. El test Chi-cuadrado de Pearson se basa en encontrar cual hubiera sido el valor de cada entrada si las variables fueran independientes. Es decir el valor esperado de cada celda de la tabla si las variables cantidad de libros en la biblioteca y dependencia del colegio son independientes.

7 Tablas de Contingencia y Medidas de Asociación
PRUEBA CHI CUADRADO Tablas de Contingencia y Medidas de Asociación Si cantidad de libros en la biblioteca y dependencia del colegio son independientes, la probabilidad del evento conjunto "A1: tener menos de 2000 libros" y "B1: dependencia particular pagada" es el producto de esas dos probabilidades: Pr(A1 y B1) = Pr(A1)*Pr(B1) Pr(A1) = A1/A = 202/688, Pr(B1) = B1/B = 200/688 Donde A y B son las frecuencias totales de los eventos.

8 Tablas de Contingencia y Medidas de Asociación
PRUEBA CHI CUADRADO Tablas de Contingencia y Medidas de Asociación Por lo tanto: Pr(A1 y B1) = Pr(A1)*Pr(B1) = 202*200/(688*688) = El número esperado en la entrada A1B1 es entonces: N* Pr(A1 y B1) = 688* = 58,72

9 Tablas de Contingencia y Medidas de Asociación
PRUEBA CHI CUADRADO Tablas de Contingencia y Medidas de Asociación En general la fórmula del valor esperado es: Eij = (NAi*NBj)/N. Eij = número esperado NAi= número de elementos en la categoría Ai NBi= número de elementos en la categoría Bi Para A1B1 el número esperado es: E11 = (202*200)/688 = 58,72

10 Tablas de Contingencia y Medidas de Asociación
PRUEBA CHI CUADRADO Tablas de Contingencia y Medidas de Asociación Este proceso se debe repetir para cada una de las entradas de la tabla. Una vez hecho esto el estadístico Chi-cuadrado se calcula con la siguiente fórmula: r = número de categorías de la variable en las filas c = número de categorías de la variable en las columnas Oij = número observado en entrada ij Eij = número esperado en la entrada ij Este estadístico Chi-cuadrado tiene (r-1)*(c-1) grados de libertad.

11 Tablas de Contingencia y Medidas de Asociación
PRUEBA CHI CUADRADO Tablas de Contingencia y Medidas de Asociación En nuestro ejemplo hay (3-1)*(3-1) = 4 grados de libertad. Realizando todos los cálculos con la tabla del ejemplo, el estadístico da 27,389. Se debe comparar este número con el valor crítico de la distribución Chi-cuadrado con 4 grados de libertad a un nivel de significación estadística del 5%

12 Tablas de Contingencia y Medidas de Asociación
PRUEBA CHI CUADRADO Tablas de Contingencia y Medidas de Asociación El valor crítico de la distribución Chi-cuadrado con 4 grados de libertad a un nivel de significación estadística del 5% el valor crítico correspondiente es 9,48. Como 27,389 > 9,48 se rechaza la hipótesis nula. Es decir, las variables no son independientes.

13 Tablas de Contingencia y Medidas de Asociación
PRUEBA CHI CUADRADO Tablas de Contingencia y Medidas de Asociación Limitaciones La muestra de tamaño n debe ser suficientemente grande, de modo que ninguna de las frecuencias esperadas Eij sea menor que 1 y no más del 20 % de los mismos sea menor que 5.

14 Ejemplo PRUEBA CHI CUADRADO Considere un estudio sobre consumo que esta interesado en investigar las preferencias de las familias por diferentes Tipos de colegios. A priori, uno pensaría que sería más probable que familias más numerosas eligieran colegios municipales o subvencionados y que familias con menos miembros optaran por colegio particulares pagados.

15 Ejemplo PRUEBA CHI CUADRADO Supongamos que para investigar esta relación, el investigador toma una muestra aleatoria de tamaño n=300 de todas aquellas familias que matricularon a sus hijos en las escuelas de una región. La siguiente tabla provee la clasificación de los 300 datos:

16 DEPENDENCIA DEL COLEGIO PARTICULAR SUBVENCIONADO
PRUEBA CHI CUADRADO EJEMPLO TAMAÑO DE FAMILIA DEPENDENCIA DEL COLEGIO 2 Y 3 4 Y 5 más de 5 Total PARTICULAR PAGADO 25 37 8 70 PARTICULAR SUBVENCIONADO 10 62 53 125 MUNICIPAL 5 41 59 105 40 140 120 300

17 Ejemplo PRUEBA CHI CUADRADO Nuestra tarea es determinar si el tamaño de la familia afecta la decisión del tipo de colegio. La hipótesis nula es que las variables son independientes (esto es, no hay relación entre tamaño familiar y la elección del colegio); la hipótesis alternativa es que las variables no son independientes.

18 Ejemplo PRUEBA CHI CUADRADO Trabajemos con un nivel de confianza del 95% y calculemos el estadístico de Pearson. Para esto asignemos las siguientes letras a los eventos de la tabla: A1 Dependencia particular pagada A2 Dependencia particular subvencionada A3 Dependencia municipal

19 Ejemplo B1 Familia de 2 a 3 miembros B2 Familia de 4 a 5 miembros
PRUEBA CHI CUADRADO B1 Familia de 2 a 3 miembros B2 Familia de 4 a 5 miembros B3 Familia de más de 5 miembros Sabemos que el número esperado de observaciones que se esperarían en la celda (Ai, Bj) si las variables fueran independientes esta definido por: Eij = (NAi*NBj)/N, por lo tanto:

20 Ejemplo E11 = ( NA1 * NB1 ) / N = E12 = ( NA1 * NB2 ) / N =
PRUEBA CHI CUADRADO E11 = ( NA1 * NB1 ) / N = E12 = ( NA1 * NB2 ) / N = E13 = ( NA1 * NB3 ) / N = E21 = ( NA2 * NB1 ) / N = E22 = ( NA2 * NB2 ) / N = E23 = ( NA2 * NB3 ) / N = E31 = ( NA3 * NB1 ) / N = E32 = ( NA3 * NB2 ) / N = E33 = ( NA3 * NB3 ) / N = 70 140 32.67 300 40 120 125 105 9.33 28 58.33 16.67 50 49 14 42

21 Ejemplo La fórmula de cálculo del estadístico viene dada por
PRUEBA CHI CUADRADO La fórmula de cálculo del estadístico viene dada por

22 Ejemplo PRUEBA CHI CUADRADO El valor crítico desde una tabla Chi-cuadrado con 4 grados de libertad y un margen de error del 5% es 9,488 Como el valor del estadístico de Pearson es mayor al valor crítico de la tabla se rechaza la hipótesis nula. Por lo tanto, podemos afirmar que no existe independencia entre el tamaño de la familia y la elección del tipo de colegio.

23 Tablas de Contingencia y Medidas de Asociación
PRUEBA CHI CUADRADO Tablas de Contingencia y Medidas de Asociación El estadístico de Pearson nos dice si dos variables son independientes una de otra pero no nos dice nada acerca de la naturaleza de la relación. Esto es, no sabemos cuan fuerte es la asociación entre las variables analizadas. Para medir el grado de relación entre las variables se utiliza el denominado Coeficiente de Contingencia (C).

24 Tablas de Contingencia y Medidas de Asociación
PRUEBA CHI CUADRADO Tablas de Contingencia y Medidas de Asociación El coeficiente de contingencia se calcula fácilmente desde el estadístico de Pearson: donde n es el tamaño muestral.

25 Tablas de Contingencia y Medidas de Asociación
PRUEBA CHI CUADRADO Tablas de Contingencia y Medidas de Asociación Del ejemplo anterior sabemos que el número de miembros que tenga la familia afecta la decisión de la elección del colegio, pero esa es solamente una parte del análisis. En particular, cuál es el grado de relación entre las dos variables?

26 Tablas de Contingencia y Medidas de Asociación
PRUEBA CHI CUADRADO Tablas de Contingencia y Medidas de Asociación ¿Este valor de indica una relación fuerte entre las variables? Para poder responder esta pregunta necesitamos saber los límites de variación de C. Cuando no hay relación entre las variables el coeficiente C = 0. El valor máximo de C está dado por

27 Tablas de Contingencia y Medidas de Asociación
PRUEBA CHI CUADRADO Tablas de Contingencia y Medidas de Asociación En nuestro caso: Entonces: El valor calculado se encuentra más o menos en la mitad entre el valor mínimo y máximo de C por lo que uno puede afirmar que existe una relación moderada entre el tamaño de la familia y la elección del tipo de colegio.


Descargar ppt "Clases 4 Pruebas de Hipótesis"

Presentaciones similares


Anuncios Google