Descargar la presentación
La descarga está en progreso. Por favor, espere
1
Inferencias con datos categóricos
Bioestadística Inferencias con datos categóricos
2
Posibles escenarios Error Tipo I (α) Error Tipo II (β)
ESTADO REAL (VERDAD) desconocido Hay diferencia, Ha es verdadera No hay diferencia, H0 es verdadera Diferencia (Rechazar H0 y aceptar Ha) Error Tipo I (α) NO HAY ERROR EVIDENCIA ( DATOS) observado Error Tipo II (β) No diferencia (No rechazar H0) NO HAY ERROR
3
Interpretando pruebas:
Prob. de error tipo Prob(Ho verdadera) Rechazo Ho y acepto Ha Me preocupo de que Ho pueda ser verdadera, particularmente si el p-value es < 0.05 pero no muy “pequeño” SI P-value de la muestra < 0.05 No puedo rechazar Ho y no puedo afirmar nada sobre la validez de Ha La diferencia/asociación observada tiene relevancia biológica? El tamaño de muestra dió suficiente “potencia” (1-β)? Si es fácil, calcule la potencia α o nivel de significancia NO
4
Usos de la prueba Chi2: Para determinar si dos variables categóricas están asociadas entre sí Para determinar el ajuste de datos empíricos provenientes de una muestra a una cierta distribución teórica Para hacer estimación por intervalos y prueba de hipótesis de una muestra sobre la varianza de una población
5
Principio central: Cálculo de las diferencias (al cuadrado) entre los valores observados y esperados de una o mas variables Los valores esperados se calculan de acuerdo a una distribución planteada como hipótesis nula Si la suma de las diferencias es “grande”, la distribución propuesta para los valores esperados (H0) no “predice” bien los valores que hemos observado. Se rechaza H0.
6
Ejemplo: relación entre el género y el status social
7
La pregunta de interés:
¿El status social está relacionado con el género en las personas encuestadas en el estudio de DEVIDA? ¿La distribución por clase social es diferente entre varones y mujeres? ¿La proporción de varones y mujeres difiere entre los grupos sociales estudiados?
8
Hipótesis: Comparando la distribución por clase social:
Hipótesis nula (Ho): Claseshombres = Clasesmujeres Hipótesis alternativa (Ha): Claseshombres Clasesmujeres Comparando la distribución por sexo: Sexoalta = Sexomedia = Sexobaja Sexoalta , Sexomedia , Sexobajano son iguales. Al menos una de estas proporciones difiere de las otras
9
Entendiendo el método:
Un eje para calcular marginales
10
Calculando valores esperados:
108 * = * = 1,261 * = ,261 * = 3,481 * = 2, ,481 * = 2,473.0
11
Escogiendo otro eje: Eje para calcular marginales
12
Calculando valores esperados:
2,107 * = 2,107 * = 2,107 * = 1,512.3 2,743 * = 2,743 * = 2,743 * = 1,968.7
13
Cálculo de la Chi2: Grados de libertad = (filas – 1) * (columnas –1) = (3-1) * (2-1) = 2
14
En Stata:
15
Chi2 con 2 grados de libertad:
Chi2 calculado = 7.10 (p=0.029) Si Chi2>5.99 (α=0.05), rechaza H0
16
Interpretación: Según el estadístico Chi2 , el sexo no es independiente del status social La proporción de varones y mujeres difiere según el status social La proporción de varones es diferente estadísticamente entre los tres estratos socioeconómicos La distribución según estrato social difiere entre varones y mujeres
17
La prueba Chi2:
18
Pregunta de Interés: La distribución entre sexos difiere entre las cuatro regiones El sexo es independiente de la región (?)
19
Hipótesis Planteadas:
Hipótesis nula (Ho): %VaronesLima = %VaronesCosta = %VaronesSierra = %VaronesSelva Hipótesis alternativa (Ha): La proporción de varones difiere al menos entre dos de las regiones
20
Cálculos: Eje a escoger Valores esperados Grados de libertad
21
Interpretación: El sexo es independiente de la región geográfica
La proporción de varones no cambia entre las cuatro regiones geográficas
22
Ejemplo 3: La proporción de varones y mujeres en la encuesta es 50%
23
Prueba exacta de Fisher:
Válida para tablas 2x2 y para N x M Usa permutaciones y se basa en las probabilidades marginales observadas No requiere un mínimo valor esperado por celda
24
Prueba exacta de Fisher:
25
Concordancia entre dos pruebas:
T E S T A Sin enfermedad (A+) Con enfermedad (A-) TEST B A+ y B+ a A- y B+ b Sin enfermedad (B+) A+ y B- c A- y B- d Con enfermedad (B-)
26
El estadístico Kappa: Concordancia Observada – Concordancia Aleatoria
Concordancia Observada = (a + d) / (a + b + c + d) Concordancia Aleatoria = [a / (a + b)] * [a / (a + c)] + (esperada) [d / (c + d)] * [d / (b + d)]
27
Calculando a mano: Observada: 0.0509 + .6765 = 0.7274
Aleatoria: ( ,120.3)/4850 =
28
Cálculos: Kappa = ----------------------------------------------
Concordancia Observada – Concordancia Aleatoria Kappa = 1 - Concordancia Aleatoria – Kappa = = = 1 –
29
Estadístico Kappa:
30
Que debemos recordar de hoy:
El concepto y los supuestos para la aplicación de la prueba Chi2 Como aplicar la prueba Chi2 para determinar si dos variables categóricas están asociadas entre si El uso de la prueba Chi2 para determinar la validez de una cierta distribución teórica sobre un conjunto de datos empíricos La aplicación e interpretación de la prueba Kappa de concordancia
Presentaciones similares
© 2024 SlidePlayer.es Inc.
All rights reserved.