Inferencias con datos categóricos

Inferencias con datos categóricos
Bioestadística Inferencias con datos categóricos

Posibles escenarios Error Tipo I (α) Error Tipo II (β)
ESTADO REAL (VERDAD) desconocido Hay diferencia, Ha es verdadera No hay diferencia, H0 es verdadera Diferencia (Rechazar H0 y aceptar Ha) Error Tipo I (α) NO HAY ERROR EVIDENCIA ( DATOS) observado Error Tipo II (β) No diferencia (No rechazar H0) NO HAY ERROR

Interpretando pruebas:
Prob. de error tipo Prob(Ho verdadera) Rechazo Ho y acepto Ha Me preocupo de que Ho pueda ser verdadera, particularmente si el p-value es < 0.05 pero no muy “pequeño” SI P-value de la muestra < 0.05 No puedo rechazar Ho y no puedo afirmar nada sobre la validez de Ha La diferencia/asociación observada tiene relevancia biológica? El tamaño de muestra dió suficiente “potencia” (1-β)? Si es fácil, calcule la potencia α o nivel de significancia NO

Usos de la prueba Chi2: Para determinar si dos variables categóricas están asociadas entre sí Para determinar el ajuste de datos empíricos provenientes de una muestra a una cierta distribución teórica Para hacer estimación por intervalos y prueba de hipótesis de una muestra sobre la varianza de una población

Principio central: Cálculo de las diferencias (al cuadrado) entre los valores observados y esperados de una o mas variables Los valores esperados se calculan de acuerdo a una distribución planteada como hipótesis nula Si la suma de las diferencias es “grande”, la distribución propuesta para los valores esperados (H0) no “predice” bien los valores que hemos observado. Se rechaza H0.

Ejemplo: relación entre el género y el status social

La pregunta de interés:
¿El status social está relacionado con el género en las personas encuestadas en el estudio de DEVIDA? ¿La distribución por clase social es diferente entre varones y mujeres? ¿La proporción de varones y mujeres difiere entre los grupos sociales estudiados?

Hipótesis: Comparando la distribución por clase social:
Hipótesis nula (Ho): Claseshombres = Clasesmujeres Hipótesis alternativa (Ha): Claseshombres  Clasesmujeres Comparando la distribución por sexo: Sexoalta = Sexomedia = Sexobaja Sexoalta , Sexomedia , Sexobajano son iguales. Al menos una de estas proporciones difiere de las otras

Entendiendo el método:
Un eje para calcular marginales

Calculando valores esperados:
108 * = * = 1,261 * = ,261 * = 3,481 * = 2, ,481 * = 2,473.0

Escogiendo otro eje: Eje para calcular marginales

Calculando valores esperados:
2,107 * = 2,107 * = 2,107 * = 1,512.3 2,743 * = 2,743 * = 2,743 * = 1,968.7

Cálculo de la Chi2: Grados de libertad = (filas – 1) * (columnas –1) = (3-1) * (2-1) = 2

En Stata:

Chi2 con 2 grados de libertad:
Chi2 calculado = 7.10 (p=0.029) Si Chi2>5.99 (α=0.05), rechaza H0

Interpretación: Según el estadístico Chi2 , el sexo no es independiente del status social La proporción de varones y mujeres difiere según el status social La proporción de varones es diferente estadísticamente entre los tres estratos socioeconómicos La distribución según estrato social difiere entre varones y mujeres

La prueba Chi2:

Pregunta de Interés: La distribución entre sexos difiere entre las cuatro regiones El sexo es independiente de la región (?)

Hipótesis Planteadas:
Hipótesis nula (Ho): %VaronesLima = %VaronesCosta = %VaronesSierra = %VaronesSelva Hipótesis alternativa (Ha): La proporción de varones difiere al menos entre dos de las regiones

Cálculos: Eje a escoger Valores esperados Grados de libertad

Interpretación: El sexo es independiente de la región geográfica
La proporción de varones no cambia entre las cuatro regiones geográficas

Ejemplo 3: La proporción de varones y mujeres en la encuesta es 50%

Prueba exacta de Fisher:
Válida para tablas 2x2 y para N x M Usa permutaciones y se basa en las probabilidades marginales observadas No requiere un mínimo valor esperado por celda

Prueba exacta de Fisher:

Concordancia entre dos pruebas:
T E S T A Sin enfermedad (A+) Con enfermedad (A-) TEST B A+ y B+ a A- y B+ b Sin enfermedad (B+) A+ y B- c A- y B- d Con enfermedad (B-)

El estadístico Kappa: Concordancia Observada – Concordancia Aleatoria
Concordancia Observada = (a + d) / (a + b + c + d) Concordancia Aleatoria = [a / (a + b)] * [a / (a + c)] + (esperada) [d / (c + d)] * [d / (b + d)]

Calculando a mano: Observada: 0.0509 + .6765 = 0.7274
Aleatoria: ( ,120.3)/4850 =

Cálculos: Kappa = ----------------------------------------------
Concordancia Observada – Concordancia Aleatoria Kappa = 1 - Concordancia Aleatoria – Kappa = = = 1 –

Estadístico Kappa:

Que debemos recordar de hoy:
El concepto y los supuestos para la aplicación de la prueba Chi2 Como aplicar la prueba Chi2 para determinar si dos variables categóricas están asociadas entre si El uso de la prueba Chi2 para determinar la validez de una cierta distribución teórica sobre un conjunto de datos empíricos La aplicación e interpretación de la prueba Kappa de concordancia

Inferencias con datos categóricos

Presentaciones similares

Presentación del tema: "Inferencias con datos categóricos"— Transcripción de la presentación:

Presentaciones similares

Sobre el proyecto

Feedback

Iniciar la sesión

Autorizarse a través de una red social:

Inferencias con datos categóricos

Presentaciones similares

Presentación del tema: "Inferencias con datos categóricos"— Transcripción de la presentación:

Presentaciones similares

Sobre el proyecto

Feedback