La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Curso de Bioestadística Parte 14 Análisis de datos binarios pareados

Presentaciones similares


Presentación del tema: "Curso de Bioestadística Parte 14 Análisis de datos binarios pareados"— Transcripción de la presentación:

1 Curso de Bioestadística Parte 14 Análisis de datos binarios pareados
Dr. en C. Nicolás Padilla Raygoza Departamento de Enfermería y Obstetricia División Ciencias de la Salud e Ingenierías Campus Celaya-Salvatierra Universidad de Guanajuato México

2 Presentación Médico Cirujano por la Universidad Autónoma de Guadalajara. Pediatra por el Consejo Mexicano de Certificación en Pediatría. Diplomado en Epidemiología, Escuela de Higiene y Medicina Tropical de Londres, Universidad de Londres. Master en Ciencias con enfoque en Epidemiología, Atlantic International University. Doctorado en Ciencias con enfoque en Epidemiología, Atlantic International University. Profesor Asociado B, Facultad de Enfermería y Obstetricia de Celaya, Universidad de Guanajuato.

3 Competencias Conocerá como mostrar datos binarios pareados.
Aplicará prueba de hipótesis para datos binarios pareados – Chi cuadrada de McNemar. Calculará el intervalo de confianza para datos binarios pareados. Obtendrá Razón de Momios e intervalos de confianza para estudios de casos y controles pareados.

4 Introducción En las partes 12 y 13 conocimos los métodos para comparar dos proporciones estimadas de muestras independientes. Si las observaciones en un estudio no son independientes, necesitamos usar métodos diferentes. Con frecuencia usamos dos tipos de estudios que dan lugar a observaciones que no son independientes: Observaciones repetidas en el mismo individuo  Estudios casos y controles pareados

5 Ejemplo Tuberculosis puede ser diagnosticada por sembrar medios de cultivo y observando si Mycobacterium tuberculosis crece. En un experimento para comparar dos medios de cultivo para el diagnóstico de tuberculosis, muestras de esputo de 100 pacientes con tuberculosis fueron sembrados en los dos medios. La mitad de la muestra fue sembrada en el medio A y la otra mitad en el medio B. En este estudio, los resultados de un mismo individuo dan dos observaciones que son pareadas una a la otra. Cada resultado puede ser + o – para el bacilo de la tuberculosis.

6 Ejemplo En un estudio en Nueva Zelanda, para examinar la relación entre cáncer de mama y el uso de anticonceptivos orales, mujeres con cáncer de mama fueron pareadas a mujeres de edad similar quienes no tenían cáncer de mama, seleccionadas de los registros electorales.   Esto es un ejemplo de un estudio de casos-controles donde cada individuo con cáncer de mama es pareado con un individuo sin la enfermedad pero de edad similar, para controlar el efecto potencial confusor de edad.

7 Mostrando datos categóricos pareados
Usar las pruebas de z o de Chi cuadrada para datos pareados sería algo erróneo, ya que no tomaríamos en cuenta la naturaleza pareada de los datos. Paciente Medio A Medio B 1 - 2 3 + 4 5 6 7 8 9 10 11 12 13 14 15 Paciente Medio A Medio B 16 + 17 18 - 19 20 21 22 23 24 25 26 27 28 29 30 Paciente Medio A Medio B 31 - 32 + 33 34 35 36 37 38 39 40 41 42 43 44 45 Paciente Medio A Medio B 46 + 47 - 48 49 50

8 Mostrando datos categóricos pareados
Paciente Medio A Medio B 51 - 52 53 + 54 55 56 57 58 59 60 61 62 63 64 65 Paciente Medio A Medio B 66 + 67 68 - 69 70 71 72 73 74 75 76 77 78 79 80 Paciente Medio A Medio B 81 - 82 + 83 84 85 86 87 88 89 90 91 92 93 94 95 Paciente Medio A Medio B 96 + 97 - 98 99 100

9 Mostrando datos categóricos pareados
El experimento comparó la capacidad de cada medio de cultivo para detectar Mycobacterium tuberculosis. Los resultados fueron positivos (+) o negativos (-). Estamos interesados en comparar los especimenes encontrados positivos por los dos medios de cultivo. La tabla resume los resultados. Medio de cultivo + - Total A 64 36 100 B 44 56

10 Mostrando datos categóricos pareados
De esto, ¿piensas que el medio A es mejor que el B para detectar el bacilo tuberculoso?   Para hacer un análisis adecuado, necesitamos comparar los resultados con los dos medios en cada sujeto. Hay cuatro combinaciones de resultados que podrían ocurrir en cada sujeto. Combinación Medio A Medio B Pares 1 + k 2 - r 3 s 4 m Señalamos: • El número de veces que ambos medios son positivos = k • El número de veces que A es positivo y B es negativo = r • El número de veces que A es negativo y B es positivo = s • El número de veces que ambos medios fueron negativos = m

11 Mostrando datos categóricos pareados
Para comparar los resultados en cada sujeto, necesitamos contar cuantas veces ocurre cada combinación. Una forma fácil de mostrar los valores es tabular los resultados de una muestra contra la otra. Medios B + - A + k r k + r A - s m s + m k + s r + m N Señalamos: • El número de veces que ambos medios son positivos = k • El número de veces que A es positivo y B es negativo = r • El número de veces que A es negativo y B es positivo = s • El número de veces que ambos medios fueron negativos = m

12 Mostrando datos categóricos pareados
Los pares que son del mismo resultado son pares concordantes, y estos no dan información acerca de cual medio es mejor en detectar el bacilo tuberculoso. De los restantes los resultados fueron diferentes entre los dos medios: 24 fueron positivos para el medio A y negativos para el B.  4 fueron negativos para el A y positivos para el B. Las pares cuyos resultados fueron diferentes entre ambos medios, se llaman pares discordantes.  Medios B + - A + 40 24 64 A - 4 32 36 44 56 100 Donde N es el total de pares, N = 100 en esta tabla Los 72 pares que concuerdan no dan información alguna acerca de cuál medio es mejor para detectar el bacilo. Por esta razón, sólo tomaremos en cuenta los pares que no concuerdan, en el análisis. La diferencia entre las proporciones pareadas es de 64% – 44% = 20%. Significa que el medio A tuvo 20% más de positivos que el medio B. El siguiente paso es comprobar la hipótesis de que no hay diferencia entre las proporciones pareadas, tomando en cuenta la naturaleza pareada de los datos.

13 Prueba de hipótesis para datos binarios pareados
Si no hubiera diferencia entre los medios, deberíamos esperar número similares de r y s, o sea r ≈ s Podemos usar una prueba llamada McNemar para evaluar si la diferencia entre los números de los pares discordantes es mayor de lo que esperaríamos por azar. Para probar la hipótesis nula de que no hay diferencia entre las dos proporciones , usamos la prueba de McNemar: (|r-s|-1)2 X2pareada= r + s Restando 1 nos permite una corrección continua. El valor obtenido es referido a la distribución X2 con un grado de libertad.

14 Prueba de hipótesis para datos binarios pareados
Para el estudio de los medios de cultivo del bacilo tuberculoso: 24 fueron positivos para el medio A y negativos para el medio B 4 fueron negativos para el medio A y positivos para el medio B (|r-s|-1)2 (|24-4|-1) X2pareada= = = = p<0.05 r + s Rechazamos la hipótesis nula de no diferencia entre los medios de cultivo. El valor obtenido es referido a la distribución X2 con un grado de libertad.

15 Intervalos de confianza para la diferencia de dos proporciones pareadas
Sabemos que la diferencia entre proporciones de datos pareados puede ser calculada por: r – s / N Donde:  r y s son los números de pares discordantes N es el total de pares El error estándar de la diferencia entre proporciones pareadas es: √r +s ES(p1-p2) = N

16 Intervalos de confianza para la diferencia de dos proporciones pareadas
La fórmula general para calcular los intervalos de confianza al 95% es:  Estimado ± 1.96 x ES De la tabla de las pruebas de esputo con dos medios de cultivo, A y B. Usando los valores de r y s, podemos calcular el intervalo de confianza al 95% para la diferencia en proporciones pareadas: r-s / N ± √r +s/N = 24-4/100±1.96 √24+4/100 = 0.2±0.10 = 0.1 a 0.3 = 10% a 30%- El intervalo de confianza de 0.1 a 0.3 significa que el porcentaje de cultivos positivos al bacilo de la tuberculosis podría estar entre 10% y 30% más alto con el medio A que con el medio B.

17 Razón de momios para datos pareados
En estudios de casos y controles, usualmente queremos evaluar el riesgo asociado con la exposición a un factor de riesgo; para estos estudios necesitamos una medida de efecto en lugar de una medida de cambio. En estudios de casos y controles usamos la RM, que es la razón de las probabilidades de la exposición entre los casos entre la probabilidad de exposición en los controles. El cálculo de la RM con datos pareados está basado en los pares discordantes, igual que la diferencia entre proporciones de datos pareados.

18 Razón de momios para datos pareados
Tabla de exposición en casos contra exposición en controles Controles Casos Expuestos No expuestos Expuestos k r No expuestos s m  k = número de parejas donde el caso y el control estuvieron expuestos r = número de parejas donde el caso estuvo expuesto y el control no s = número de parejas donde el caso no estuvo expuesto y el control si. m = número de parejas donde los casos y controles no estuvieron expuestos. Como antes, los pares de casos y controles que concuerdan, no dan información acerca del riesgo asociado con la exposición. Esta información es dada por los pares donde la exposición entre casos y controles difieren.

19 Razón de momios para datos pareados
La razón de momios (RM) es calculada como la razón de los dos grupos de pares discordantes. r casos expuestos controles no expuestos RM = ---- = s casos no expuestos controles expuestos  

20 Razón de momios para datos pareados
La tabla muestra los resultados de un estudio de casos-controles pareados, diseñado para investigar la asociación entre el uso de anticonceptivos orales (ACO) y tromboembolismo. Controles Casos Uso ACO No uso ACO Uso ACO NO uso ACO RM = 57/13 = 4.38

21 Intervalo de confianza para RM pareada
El cálculo del intervalo de confianza es un poco más complicado. Se calcula usando la raíz cuadrada del valor de X2 de la prueba de McNemar, en lugar del error estándar. Intervalo de confianza al 95% para RM de datos pareados es: RM1±1.96/ X

22 Razón de momios para datos pareados
RM = 4.4 X²pareada = 26.41  Xpareada = 5.14 Entonces el intervalo de confianza al 95% es: De / a / 5.14 a 2.5 a 7.7 En este estudio, la probabilidad de caso expuesto a anticonceptivos orales es 4.4 veces más alta que la probabilidad de controles expuestos a los anticonceptivos orales. Tenemos 95% de confianza que en la población la probabilidad de casos siendo expuestos está entre 2.5 y 7.7 veces más alta que la probabilidad en los controles siendo expuestos. Si el límite inferior fuera menor a 1, los datos deberían ser compatibles con la probabilidad de exposición en los controles fuera mayor que en los casos.

23 Bibliografía 1.- Last JM. A dictionary of epidemiology. New York, 4ª ed. Oxford University Press, 2001:173. 2.- Kirkwood BR. Essentials of medical ststistics. Oxford, Blackwell Science, 1988: 1-4. 3.- Altman DG. Practical statistics for medical research. Boca Ratón, Chapman & Hall/ CRC; 1991: 1-9.


Descargar ppt "Curso de Bioestadística Parte 14 Análisis de datos binarios pareados"

Presentaciones similares


Anuncios Google