La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Pruebas de significancia para datos cualitativos Chi cuadrado.

Presentaciones similares


Presentación del tema: "Pruebas de significancia para datos cualitativos Chi cuadrado."— Transcripción de la presentación:

1 Pruebas de significancia para datos cualitativos Chi cuadrado

2 ¿ z, t y r son todos calculados de datos cualitativos o cuantitativos? ¿ z, t y r son todos calculados de datos cualitativos o cuantitativos? Cuantitativos. Cuantitativos. Χ es la letra griega chi que se usa para representar las puebas de chi cuadrado que se simboliza por Χ 2. Χ es la letra griega chi que se usa para representar las puebas de chi cuadrado que se simboliza por Χ 2. Estas pruebas dependen de f al igual que en las pruebas de t. Estas pruebas dependen de f al igual que en las pruebas de t. Donde recordemos que f representa el número de grados de libertad. Donde recordemos que f representa el número de grados de libertad.

3 Los datos cualitativos son usualmente contados en grupos o categorías Un ejemplo son los grupos sanguíneos. Un ejemplo son los grupos sanguíneos. La hipótesis de nulidad dice que cualquier variación entre el número observado en el grupo y lo que usted espera encontrar se debe a________ La hipótesis de nulidad dice que cualquier variación entre el número observado en el grupo y lo que usted espera encontrar se debe a________ La casualidad La casualidad

4 Si hay una diferencia significativa la variación es más de lo esperado por casualidad y esto sugiere que hay algún otro factor envuelto.

5 Al igual que con z y t si el valor calculado de Χ 2 es mayor que el valor significativo usted acepta/rechaza la hipótesis de nulidad. Al igual que con z y t si el valor calculado de Χ 2 es mayor que el valor significativo usted acepta/rechaza la hipótesis de nulidad. Si Χ 2 es mayor, p es menor; la hipótesis de nulidad es rechazada. Si Χ 2 es mayor, p es menor; la hipótesis de nulidad es rechazada.

6 Al igual que con z y t las tablas de X 2 son usadas directamente en las pruebas de 2 colas

7

8

9 ¿qué significan las columnas? ¿qué significan las columnas? Qué significan las filas? Qué significan las filas? ¿cuál es la diferencia con las tablas de t? ¿cuál es la diferencia con las tablas de t? ¿qué significan los niveles 0.99 y 0.95? ¿qué significan los niveles 0.99 y 0.95?

10 Criterios para aplicar X 2 Las muestras son tomadas al azar. Las muestras son tomadas al azar. Los datos son cualitativos Los datos son cualitativos Idealmente la frecuencia esperada más baja en cualquier grupo no es menor de 5. Idealmente la frecuencia esperada más baja en cualquier grupo no es menor de 5.

11 Un genetista estaba interesado por saber si dos plantas tenían el genotipo Aa. El las cruzó para ver qué tan cerca de la razón teórica se encontraban las progenies. Las razones teóricas son: ½ Aa:¼ AA:¼ aa Hubo 100 progenies y estos fueron los resultados (muestra al azar) genotipo Número observado (O) Número esperado (E) por la teoría AaAAaa total100100

12 ¿se aplican todos los criterios para usar X 2 ? ¿se aplican todos los criterios para usar X 2 ? Establezca la hipótesis de nulidad y su alternativa. Establezca la hipótesis de nulidad y su alternativa.

13 (número observado – número esperado) 2 X 2 = Σ número esperado Lo vamos a representar de ahora en adelante por ( O – E ) 2 Σ E

14

15 Substituyendo los números según el cuadro tenemos que Substituyendo los números según el cuadro tenemos que X 2 = 0.38 X 2 = 0.38 Debemos buscar ahora f Debemos buscar ahora f

16 Uso de X 2 para probar si lo observado se ajusta a una teoría En este caso X 2 se usa para ver si los resultados obtenidos se ajustan a esta teoría genética en particular. En este caso X 2 se usa para ver si los resultados obtenidos se ajustan a esta teoría genética en particular. En estos casos f=k-1, donde k= número de clases. En estos casos f=k-1, donde k= número de clases. Las clases en este caso son los genotipos, o sea, 3. Las clases en este caso son los genotipos, o sea, 3. Por consiguiente f= 2 Por consiguiente f= 2

17 Los investigadores que usan X 2 casi siempre están interesados en dos colas. Es decir, están interesados en las diferencias entre lo observado y lo esperado, en cualquier dirección ¿es éste o no el caso en nuestro problema? ¿es éste o no el caso en nuestro problema? Si Si Recuerde que las tablas de X 2 tal cual están, registran ambas colas. Recuerde que las tablas de X 2 tal cual están, registran ambas colas. Entonces el X 2 significativo con f=2 es Entonces el X 2 significativo con f=2 es X 2 = al nivel 0.05 y al nivel 0.01 X 2 = al nivel 0.05 y al nivel 0.01

18 X 2 calculado es 0.38 y es menor que el valor significativo de X 2. ¿cuál es su conclusión? X 2 significativa 0 X2X2 X 2 calculada Ud. Acepta la hipótesis de nulidad. La conclusión es que la variación es insuficiente para sospechar que hay otro factor envuelto y ésta es debida solamente a la casualidad. Es decir, los resultados se ajustan a la teoría genética

19 En pruebas ordinarias de t donde µ no es conocida, f = N-1. en X2 cuando probamos si algo se ajusta a la teoría, f = k-1. N en las pruebas de t es el número de resultados, mientras que en X2 k representa el número de clases

20 En las pruebas pareadas de t, también f = N-1. aquí, N es el número de diferencias

21

22 El mismo genetista decide hacer otro experimento para comprobar si la combinación de dos factores de segregación genética se ajustan a la teoría genética que establece que estos se combinan de acuerdo a la razón: 9 AB: 3Ab: 3aB: 1ab Sus resultados fueron los siguientes: fenotipo Número observado(O) ABAbaBab total400 ¿cuáles son los números esperados? ¿podemos aplicar X 2 ? ¿por qué? X2=X2= f= ¿una o dos colas? ¿cuál es X 2 significativo? ¿conclusión? Número esperado(E)

23 Uso de X 2 para probar asociación en vez de ajuste a una teoría Se afecta f (lo veremos más adelante) Se afecta f (lo veremos más adelante) Los datos para probar asociación se arreglan en una tabla de contingencia Los datos para probar asociación se arreglan en una tabla de contingencia

24

25 En un estudio, para ayudar a decidir si una inoculación en particular tiene alguna propiedad protectiva, se obtuvieron los siguientes resultados durante una epidemia Inoculados No inoculados Total de fila Afectados No afectados Total de columna Establezca la hipótesis de nulidad y su alternativa Asumimos la hipótesis de nulidad como cierta y calculamos los resultados esperados usando los totales de las filas y las columnas. ¿es esta una tabla de observados o esperados

26 Podemos observar, usando los totales de columnas que 100 de un total de 300, o sea 1/3 fueron inoculados. Como hemos asumido como cierta la hipótesis de nulidad, entonces se deriva que la inoculación no está asociada con la incidencia de la enfermedad. Esperamos entonces que 1/3 de aquellos afectados fueron inoculados. En el cuadro vemos también que se afectaron 60 personas. Por consiguiente podemos esperar que1/3 de ellos fueron inoculados(pues la vacuna no está asociada con la incidencia de la enfermedad). Así, tenemos que 20 fueron inoculados y tuvieron la enfermedad. De manera similar, 2/3 del total no fueron inoculados, de modo que se puede esperar que 2/3 de los 60 afectados, o sea 40, no fueron inoculados Ya que se asume que la inoculación no tiene ningún efecto y 1/3 han sido inoculados se puede esperar también que 1/3 de los 240 no afectados fueron inoculados. Es decir, 80 personas. Finalmente, ¿cuántos no inoculados, no afectados podría esperar? 2/3 de 240, o sea 160

27 Complete entonces su tabla de resultados esperados

28 Abajo se observan las tablas de contingencia para los resultados observados y los esperados Inoculados No inoculados Total de fila Afectados No afectados Total de columna Inoculados No inoculados Total de fila Afectados No afectados Total de columna Observados (O) Esperados (E) Observe que el total de filas es igual al total de columnas en las dos tablas Observe también que cada resultado esperado es igual a Su total de fila x total de columna gran total ¿cuál sería el resultado esperado para el grupo afectado inoculado? 60 x = 20

29 Recuerde que estamos interesados en saber si la inoculación protege contra la enfermedad. Recuerde que estamos interesados en saber si la inoculación protege contra la enfermedad. Si esto es así, esperamos observar menos gente inoculada afectada que lo esperado. ¿esto es así? Si esto es así, esperamos observar menos gente inoculada afectada que lo esperado. ¿esto es así? De otra manera debíamos rechazar la teoría inmediatamente De otra manera debíamos rechazar la teoría inmediatamente ¿esta es una prueba de una o dos colas? ¿esta es una prueba de una o dos colas? Si Si Se esperaban 20 pero sólo 5 fueron observados en este grupo. Se esperaban 20 pero sólo 5 fueron observados en este grupo. Prueba de una sóla cola. Prueba de una sóla cola. Una vez resuelto todo lo anterior podemos entonces utilizar la fórmula ya conocida y calcular X 2. Una vez resuelto todo lo anterior podemos entonces utilizar la fórmula ya conocida y calcular X 2.

30 Cuando X 2 fué usado para probar el ajuste a una teoría, f = k-1 Cuando X 2 fué usado para probar el ajuste a una teoría, f = k-1 Ahora que usamos X 2 para probar asociación usando las tablas de contingencia, f = (r-1) (c-1), donde r es el número de filas y c el número de columnas en el cuerpo de la tabla. Ahora que usamos X 2 para probar asociación usando las tablas de contingencia, f = (r-1) (c-1), donde r es el número de filas y c el número de columnas en el cuerpo de la tabla. Por consiguiente, en nuestro problema f = (2-1) (2-1) = 1 Por consiguiente, en nuestro problema f = (2-1) (2-1) = 1 O sea que hay 1 grado de libertad. O sea que hay 1 grado de libertad. Esto es porque si 1 resultado esperado es calculado en una tabla de contingencia de dos filas y dos columnas, ya que los totales de las filas y las columnas son fijos, el resto de los números en la tabla no se pueden escoger libremente. Esto es porque si 1 resultado esperado es calculado en una tabla de contingencia de dos filas y dos columnas, ya que los totales de las filas y las columnas son fijos, el resto de los números en la tabla no se pueden escoger libremente.

31 ¿cuál es el valor de f en una tabla de contingencia con 3 filas y 8 columnas? ¿cuál es el valor de f en una tabla de contingencia con 3 filas y 8 columnas? (3-1)(8-1) = 14 (3-1)(8-1) = 14 En este caso el grado de libertad para escoger resultados se amplía por haber un número mayor de filas y de columnas. En este caso el grado de libertad para escoger resultados se amplía por haber un número mayor de filas y de columnas.

32 Con toda la información que tenemos podemos ir a la tabla y buscar el valor significativo de X 2. Con toda la información que tenemos podemos ir a la tabla y buscar el valor significativo de X 2. Los cuales son: para 0.05 y para 0.01 Los cuales son: para 0.05 y para 0.01 ¿cuál es su conclusión? ¿cuál es su conclusión? La hipótesis de nulidad es rechazada. Podemos ver que menos gente que está inoculada contrae la enfermedad. Ahora podemos decir también que el grado de protección es estadísticamente significativo (0.01 > p) La hipótesis de nulidad es rechazada. Podemos ver que menos gente que está inoculada contrae la enfermedad. Ahora podemos decir también que el grado de protección es estadísticamente significativo (0.01 > p)

33 Para probar el nivel de ajuste a una teoría, ésta por si misma es usada para calcular los resultados esperados. Sin embargo, cuando usamos X2 para probar una asociación, usamos los resultados observados para calcular los resultados esperados


Descargar ppt "Pruebas de significancia para datos cualitativos Chi cuadrado."

Presentaciones similares


Anuncios Google