Pruebas de significancia para datos cualitativos

Slides:



Advertisements
Presentaciones similares
DISEÑO DE EXPERIMENTOS EXPERIMENTOS DE COMPARACIÓN SIMPLE
Advertisements

PRUEBA DE SIGNIFICANCIA
Prueba de Hipótesis (Test de Hipótesis)
ANALISIS PARAMÉTRICOS
Dr. M. H. Rahbar Profesor de Bioestadística
Tema 16: Contraste paramétrico de hipótesis I: Pruebas de contraste para un grupo. Pruebas de contraste para dos grupos: independientes o relacionados.
Tema 15. Contraste de hipótesis: Planteamiento de las hipótesis
Tema.11. Principales modelos de distribución de probabilidad en Psicología: Variables discretas: binomial y Poisson. Variables continuas: normal, chi.
Tema 22: Análisis de tablas de contingencia Prueba c2 como medida de asociación y como prueba de contraste. Coeficientes derivados de c2. Interpretación.
Tema 20: Contrastes para datos categóricos Pruebas de contraste para una proporción. Pruebas de contraste para dos proporciones relacionadas y no relacionadas.
LOS RESULTADOS DE MENDEL Y LA PROBABILIDAD
Demostración de Asociación
Epidemiología clínica
DISEÑO DE EXPERIMENTOS
PATRONES DE DISTRIBUCIÓN ESPACIAL
Creación del Dr. Esteban Morales. basado en apuntes de clases dictadas por W.M.Castle en U de Liverpool, enriquecido con experiencias del autor. Pruebas.
Adaptación por el autor de apuntes de clases dictadas por la Dra. G Castle en la Universidad de Liverpool, enriquecidas con experiencias del propio autor.
Pruebas de hipótesis: Media de una población © Pedro Juan Rodríguez Esquerdo Departamento de Matemáticas Recinto de Río Piedras Universidad de.
FACTORIZACIÓN LU Bachilleres:
Pruebas de hipótesis.
Bioestadística Distribución Normal
Bioestadística Diplomado en Sanidad
Chi cuadrada y otras Pruebas no paramétricas
La minimización de los costes
La prueba U DE MANN-WHITNEY
Contraste de Hipótesis ETSITGC Madrid Unidad Docente de Matemáticas.
Prueba de Hipótesis La Prueba t Carlos B. Ruiz-Matuk.
Supongamos que seleccionamos al azar a dos alumnos de dos cursos diferentes que llamaremos D8 y C1…
METODOLOGÍA DE INVESTIGACIÓN Titular: Agustín Salvia
1.2 Variables aleatorias..
La distribución Multinomial en genética
ANOVA Modelo I: Comparación entre medias
Probabilidad condicional
Prueba de hipótesis Equivalencia entre la prueba de hipótesis y los intervalos de confianza Valor de probabilidad Valor de probabilidad unilateral Prueba.
Tests de hipótesis Los tres pasos básicos para testear hipótesis son
ANALISIS DE DATOS CON EXCEL
Unidad VI: PRUEBAS DE HIPOTESIS
CHI-CUADRADO Y DISTRIBUCION NORMAL
Clases 4 Pruebas de Hipótesis
1 Planteamiento del problema ¿Tenemos los humanos la capacidad de percibir si nos miran desde atrás? O, más exactamente: ¿Es defendible que existen otras.
REGRESION Y CORRELACION
Probabilidad y prueba de significancia de Chi-Cuadrado (X²)
ANALISIS DE DATOS CATEGORICOS
Tema 17: Contraste paramétrico de hipótesis I: Pruebas de contraste para un grupo. Pruebas de contraste para dos grupos: independientes o relacionados.
AÑO DE PROMOCIÓN DE LA INDÚSTRIA RESPONZABLE Y COMPROMISO CLIMÁTICO
Inferencias con datos categóricos
Datos: Estadística.
Curso de Bioestadística. ANOVA
Universidad Nacional de Colombia Curso Análisis de Datos Cuantitativos.
Pruebas No paramétricas
CORRELACIÓN y ASOCIACIÓN
Clase 4a Significancia Estadística y Prueba Z
Pruebas de hipótesis.
Clase 6 Hipótesis de diferencias de grupos
Pruebas Ji Cuadrado ©1998 Pedro Juan Rodríguez Esquerdo Departamento de Matemáticas Recinto de Río Piedras Universidad de Puerto Rico.
Estadística Reporte Ejecutivo
Prueba de Hipótesis Una hipótesis estadística es un supuesto que se establece sobre las características de una distribución poblacional El estudio se plantea.
CISO 3155: Capítulo 91 Evaluando los promedios de dos grupos distintos Capítulo 9.
Metodología de la Investigación Cát. I
Pasos del Método Científico.
UNIDAD I.- Analisis 3.4 Prueba de Hipotesis.
INTRODUCCIÓN AL ANÁLISIS DE DATOS CATEGÓRICOS. Temas Carácterísticas de la distribución Chi-cuadrada Prueba de bondad de ajustes Prueba de homogeneidad.
Introducción a la Estadística Inferencial con SPSS Juan José Igartua Perosanz Universidad de Salamanca
PRUEBA DE SIGNIFICANCIA
PRUEBA CHI-CUADRADO UNIDAD 2: ESTADÍSTICA.
PRUEBA DE SIGNIFICANCIA
YASIR MOUBARIK GONZALEZ ESTADISTICA Y TIC SUBGRUPO 19 UNIDAD DOCENTE VIRGEN DEL ROCIO.
Evaluando los promedios de grupos distintos UNIDAD 7 1.
Transcripción de la presentación:

Pruebas de significancia para datos cualitativos Chi cuadrado

¿ z, t y r son todos calculados de datos cualitativos o cuantitativos? Χ es la letra griega chi que se usa para representar las puebas de chi cuadrado que se simboliza por Χ2. Estas pruebas dependen de f al igual que en las pruebas de t. Donde recordemos que f representa el número de grados de libertad.

Los datos cualitativos son usualmente contados en grupos o categorías Un ejemplo son los grupos sanguíneos. La hipótesis de nulidad dice que cualquier variación entre el número observado en el grupo y lo que usted espera encontrar se debe a________ La casualidad

Si hay una diferencia significativa la variación es más de lo esperado por casualidad y esto sugiere que hay algún otro factor envuelto.

Al igual que con z y t si el valor calculado de Χ2 es mayor que el valor significativo usted acepta/rechaza la hipótesis de nulidad. Si Χ2 es mayor, p es menor; la hipótesis de nulidad es rechazada.

Al igual que con z y t las tablas de X2 son usadas directamente en las pruebas de 2 colas

revisemos las tablas de chi cuadrado

¿qué significan las columnas? Qué significan las filas? ¿cuál es la diferencia con las tablas de t? ¿qué significan los niveles 0.99 y 0.95?

Criterios para aplicar X2 Las muestras son tomadas al azar. Los datos son cualitativos Idealmente la frecuencia esperada más baja en cualquier grupo no es menor de 5.

Número esperado (E) por la teoría Aa AA aa 53 23 24 50 25 Un genetista estaba interesado por saber si dos plantas tenían el genotipo Aa. El las cruzó para ver qué tan cerca de la razón teórica se encontraban las progenies. Las razones teóricas son: ½ Aa : ¼ AA : ¼ aa Hubo 100 progenies y estos fueron los resultados (muestra al azar) genotipo Número observado (O) Número esperado (E) por la teoría Aa AA aa 53 23 24 50 25 total 100

¿se aplican todos los criterios para usar X2? Establezca la hipótesis de nulidad y su alternativa.

( O – E )2 Σ (número observado – número esperado)2 X2 = Σ Lo vamos a representar de ahora en adelante por ( O – E )2 Σ E

resuelva

Substituyendo los números según el cuadro tenemos que X2 = 0.38 Debemos buscar ahora f

Uso de X2 para probar si lo observado se “ajusta” a una teoría En este caso X2 se usa para ver si los resultados obtenidos se ajustan a esta teoría genética en particular. En estos casos f=k-1, donde k= número de clases. Las clases en este caso son los genotipos, o sea, 3. Por consiguiente f= 2

¿es éste o no el caso en nuestro problema? Si Los investigadores que usan X2 casi siempre están interesados en dos colas. Es decir, están interesados en las diferencias entre lo observado y lo esperado, en cualquier dirección ¿es éste o no el caso en nuestro problema? Si Recuerde que las tablas de X2 tal cual están, registran ambas colas. Entonces el X2 significativo con f=2 es X2 = 5.991 al nivel 0.05 y 9.210 al nivel 0.01

X2 calculado es 0. 38 y es menor que el valor significativo de X2 X2 calculado es 0.38 y es menor que el valor significativo de X2. ¿cuál es su conclusión? Ud. Acepta la hipótesis de nulidad. La conclusión es que la variación es insuficiente para sospechar que hay otro factor envuelto y ésta es debida solamente a la casualidad. Es decir, los resultados “se ajustan a la teoría genética” X2 significativa X2 X2 calculada

En pruebas ordinarias de t donde µ no es conocida, f = N-1 En pruebas ordinarias de t donde µ no es conocida, f = N-1. en X2 cuando probamos si algo se ajusta a la teoría, f = k-1. N en las pruebas de t es el número de resultados, mientras que en X2 k representa el número de clases

En las pruebas pareadas de t, también f = N-1 En las pruebas pareadas de t, también f = N-1. aquí, N es el número de diferencias

veamos otro experimento

El mismo genetista decide hacer otro experimento para comprobar si la combinación de dos factores de segregación genética se ajustan a la teoría genética que establece que estos se combinan de acuerdo a la razón: 9 AB: 3Ab: 3aB: 1ab Sus resultados fueron los siguientes: ¿cuáles son los números esperados? fenotipo Número observado(O) AB Ab aB ab 245 80 70 5 total 400 Número esperado(E) 225 75 25 400 ¿podemos aplicar X2? ¿por qué? X2= ¿cuál es X2 significativo? f= ¿una o dos colas? ¿conclusión?

Uso de X2 para probar asociación en vez de “ajuste a una teoría” Se afecta f (lo veremos más adelante) Los datos para probar “asociación” se arreglan en una “tabla de contingencia”

ejemplo

Establezca la hipótesis de nulidad y su alternativa En un estudio, para ayudar a decidir si una inoculación en particular tiene alguna propiedad protectiva, se obtuvieron los siguientes resultados durante una epidemia Establezca la hipótesis de nulidad y su alternativa Inoculados No inoculados Total de fila Afectados No afectados 5 95 55 145 60 240 Total de columna 100 200 300 Asumimos la hipótesis de nulidad como cierta y calculamos los resultados esperados usando los totales de las filas y las columnas. ¿es esta una tabla de observados o esperados

Podemos observar, usando los totales de columnas que 100 de un total de 300, o sea 1/3 fueron inoculados. Como hemos asumido como cierta la hipótesis de nulidad, entonces se deriva que la inoculación no está asociada con la incidencia de la enfermedad. Esperamos entonces que 1/3 de aquellos afectados fueron inoculados. En el cuadro vemos también que se afectaron 60 personas. Por consiguiente podemos esperar que1/3 de ellos fueron inoculados(pues la vacuna no está asociada con la incidencia de la enfermedad). Así, tenemos que 20 fueron inoculados y tuvieron la enfermedad. Ya que se asume que la inoculación no tiene ningún efecto y 1/3 han sido inoculados se puede esperar también que 1/3 de los 240 no afectados fueron inoculados. Es decir, 80 personas. De manera similar, 2/3 del total no fueron inoculados, de modo que se puede esperar que 2/3 de los 60 afectados, o sea 40, no fueron inoculados Finalmente, ¿cuántos no inoculados, no afectados podría esperar? 2/3 de 240, o sea 160

Complete entonces su tabla de resultados esperados

Abajo se observan las tablas de contingencia para los resultados observados y los esperados Observados (O) Observe que el total de filas es igual al total de columnas en las dos tablas Inoculados No inoculados Total de fila Afectados No afectados 5 95 55 145 60 240 Total de columna 100 200 300 Observe también que cada resultado esperado es igual a Su total de fila x total de columna gran total Esperados (E) Inoculados No inoculados Total de fila Afectados No afectados 20 80 40 160 60 240 Total de columna 100 200 300 ¿cuál sería el resultado esperado para el grupo afectado inoculado? 60 x 100 300 = 20

Recuerde que estamos interesados en saber si la inoculación protege contra la enfermedad. Si esto es así, esperamos observar menos gente inoculada afectada que lo esperado. ¿esto es así? De otra manera debíamos rechazar la teoría inmediatamente ¿esta es una prueba de una o dos colas? Si Se esperaban 20 pero sólo 5 fueron observados en este grupo. Prueba de una sóla cola. Una vez resuelto todo lo anterior podemos entonces utilizar la fórmula ya conocida y calcular X2.

Cuando X2 fué usado para probar el “ajuste a una teoría”, f = k-1 Ahora que usamos X2 para probar asociación usando las tablas de contingencia, f = (r-1) (c-1), donde r es el número de filas y c el número de columnas en el cuerpo de la tabla. Por consiguiente, en nuestro problema f = (2-1) (2-1) = 1 O sea que hay 1 grado de libertad. Esto es porque si 1 resultado esperado es calculado en una tabla de contingencia de dos filas y dos columnas, ya que los totales de las filas y las columnas son fijos, el resto de los números en la tabla no se pueden escoger libremente.

¿cuál es el valor de f en una tabla de contingencia con 3 filas y 8 columnas? (3-1)(8-1) = 14 En este caso el grado de libertad para escoger resultados se amplía por haber un número mayor de filas y de columnas.

Con toda la información que tenemos podemos ir a la tabla y buscar el valor significativo de X2. Los cuales son: 2.706 para 0.05 y 5.412 para 0.01 ¿cuál es su conclusión? La hipótesis de nulidad es rechazada. Podemos ver que menos gente que está inoculada contrae la enfermedad. Ahora podemos decir también que el grado de protección es estadísticamente significativo (0.01 > p)

Para probar el nivel de “ajuste a una teoría”, ésta por si misma es usada para calcular los resultados esperados. Sin embargo, cuando usamos X2 para probar una “asociación”, usamos los resultados observados para calcular los resultados esperados