Validez, integridad y monitoreo para la enfermedad

Slides:



Advertisements
Presentaciones similares
Evaluación de medicamentos en procesos neoplásicos
Advertisements

Lectura crítica de la literatura biomédica
Monitoreo y detección temprana. Parte I Bases epidemiológicas para el control de la enfermedad – Otoño 2001 Joel L. Weissfeld, M.D. M.P.H.
Una breve introducción a la epidemiología - XIII (Crítica de la investigación: Consideraciones estadísticas) ¿Quién es Betty C Jung? Revise mi página Web:
Distribución de muestreo
Asociación estadística y causalidad
Estudios casos y controles
Dr. M. H. Rahbar Profesor de Bioestadística
Conferencia 5.1 Nigel Paneth
Objetivo Disponemos de estimaciones de la probabilidad de un suceso en dos muestras independientes. Queremos calcular qué tamaño muestral deberíamos utilizar.
Curso de Actualización del Personal de Enfermería en el Area de la Epidemiología ENFOQUE DE RIESGO.
Diagnostico. Es un proceso a través del cual el clínico determina el estado de salud del paciente. Comprende: Historia clínica.
VARIABLES Una de las etapas fundamentales de toda investigación es la identificación de variables, entendiendo como variable la medida de una característica.
Escala de inteligencia de Wechsler (WAIS-III)
Dr.. Roy Martin Angulo Reyes
CONCEPTOS BÁSICOS DE DISEÑO DE ESTUDIOS EPIDEMIOLÓGICOS
Pruebas de significancia para datos cualitativos
DEMANDA DE MERCADO Y ELASTICIDAD
De la muestra a la población
RAPIDO EN DEPORTES.. MIDE TU VELOCIDAD.
NOCIONES BASICAS PARA LA LECTURA DE ARTICULOS DE INVESTIGACION MEDICA
Clasificación de variables
TIPOS DE ESTUDIOS CLINICO EPIDEMIOLOGICOS
n=muestra dad. CALCULO DE LA MUESTRA
PROBABILIDAD CONDICIONAL Y TEOREMA DE BAYES
El área sombreada indica la asignatura.. En este espacio verás las unidades que puede tener cada asignatura.
VALOR DE p INTERVALO DE CONFIANZA
Técnicas de muestreo y tamaño de muestra
Sección 1. Actividades e integración del conocimiento S1 Actividad 1.
ESTUDIOS EPIDEMIOLÓGICOS
Diseños epidemiológicos
Departamento de Salud Pública Facultad de Medicina UNAM
La entrevista de investigación
CONFIABILIDAD DEL INSTRUMENTO
Elaborado por: Ricardo Alfonso Marcillo Del Castillo Asistente de Gerencia.
El grado de concordancia en el diagnóstico de la retinopatía hipertensiva es bajo van den Born B-JH, Hulsman CAA, Hoekstra JBL, Schlingemann RO, van Montfrans.
Análisis de datos El diseño estadístico.
Aritmética y Álgebra Razones/Proporciones/Porcentajes
DISCRIMINACIÓN DIAGNÓSTICA DE LAS PRUEBAS Iván Darío Camacho Tatiana Huetio María Fernanda Montero Yeritza Molina.
El viaje Detectives en la clase — Investigación 2-6: El viaje.
¿Qué se entiende por EPIDEMIOLOGÍA?
Ensayo Clínico Diseño metodológico que evalúa la eficacia de un tratamiento en el ser humano mediante la comparación de la frecuencia de un determinado.
Precisión y Exactitud La precisión se refiere a cuánto concuerdan dos o más mediciones de una misma cantidad. Ej.Todos los lanzamientos de las flechas.
Inferencias con datos categóricos
DISTRIBUCIONES DE MUESTREO
MEDICION Medir es tipificar o caracterizar un propiedad en un elemento de estudio. Previamente se debe conceptualizar la propiedad por medirse y obtener.
ESTADÍSTICAS DESCRIPTIVA
Estudios de cohorte El paradigma de los estudios de cohorte es la clasificación de los sujetos de estudio según su condición en relación con la exposición.
Métodos de calibración: regresión y correlación
ORIGEN Y CALIDAD DE LA INFORMACIÓN
Mediciones y observaciones clínicas y epidemiológicas Preparado por: Dr. Juan José García García.
DISEÑO DE LA INVESTIGACIÓN
Medición de la concordancia
MEDIDAS DE PRECISIÓN Fijación de complemento = FC Sensibilidad = Se
TAMAÑO MINIMO DE MUESTRA PARA COMPARACIONES DE PROMEDIOS Mario Briones L. MV, MSc 2005.
Normalidad Preparado por: Dr. Juan José García García.
“Dividiendo los dolores...” Gracias Felipe La mujer con su marido fueron al hospital para tener un hijo. Cuando llegaron, el médico les dijo que habían.
No todo lo que sabemos es cierto
UNIVERSIDAD AUTONOMA DE NUEVO LEON FACULTAD DE ODONTOLOGIA APLICACION DE LAS TECNOLOGIAS DE INFORMACIÓN “Asociación de apiñamiento anteroinferior.
“Hacia un sistema estandarizado de evaluación de causalidad de RAM en el sistema hospitalario” Procedimiento de Trabajo 12 noviembre 2014.
PRUEBAS DIAGNOSTICAS.
Precisión de la clasificación
Estimación y contraste de hipótesis
Sesgos y errores en la investigación epidemiológica
Unidad 1: Generalidades sobre estadística
Tablas de Sobrevida y vida
Métodos de investigación en la psicología clínica
Pruebas diagnosticas. Tamizaje
Un estudio de exactitud de Diagnóstico
PROBABILIDAD CONDICIONAL Y TEOREMA DE BAYES
Transcripción de la presentación:

Validez, integridad y monitoreo para la enfermedad Nigel Paneth TRADUCCIÓN DEL PARTE VII del Curso de Epidemiología del Dr. Paneth, realizada por Nicolás Padilla, Facultad de Enfermeria de Celaya, Universidad de Guanajuato, México

Medición de integridad Terminología Integridad es análogo a precisión Validez es análogo a seguridad Integridad es cuan bien un observador clasifica al mismo individuo bajo diferentes circunstancias. Validez es cuan bien una prueba refleja su resultado bajo otra prueba de mayor seguridad conocida.

Integridad y validez Integridad incluye: evaluación por el mismo observador en diferente tiempo - Integridad intraobservador evaluación de diferentes observadores al mismo tiempo - Integridad interobservador Integridad asume que todas las pruebas u observadores son iguales; validez asume que hay un estándar de “oro” con el cual la prueba o el observador será comparado.

Evaluando integridad ¿Cómo evaluamos la integridad? Una forma es observar el porcentaje de concordancia. - Porcentaje de concordancia es la proporción de todos los diagnósticos clasificados en la misma manera por los dos observadores.

Ejemplo A dos médicos se les dan 100 radiografías para verlas independientemente y son preguntados acerca de si neumonía está presente o ausente. Cuando ambos grupos de diagnósticos son comparados, se encuentra que 95% de los diagnósticos son los mismos.

¿Es el diagnóstico íntegro ¿Es el diagnóstico íntegro? ¿El porcentaje de concordancias es sufiente para indicar integridad? ¿95% de concordancia entre los dos médicos y la ausencia o presencia de enfermedad en una muestra de 100 pacientes siempre indica buena concordancia? ¿Te senírías tranquilo de que tu hospital estaba haciendo un trabajo consistente en las lecturas de rayos X si muestran un 95% de integridad?

Compare las dos tablas: Tabla 1 Tabla 2 MD#1 Si No MD#2 1 3 2 94 MD#1 Si No MD#2 43 3 2 52 En ambos ejemplos, los médicos concuerdan en el 95%. ¿Son los dos médicos igualmente íntegros en las dos tablas?

¿Cuál es la diferencia esencial entre las dos tablas? El problema surge de la facilidad de concordancia en eventos comúnes (v.gr. No teniendo neumonía en la tabla 1). Una medida de concordancia deberá tomar en cuenta la “facilidad” de concordancia debido sólo al azar.

Uso de Kappa para evaluar integridad Kappa es una prueba ampliamente usada de concordancia inter o intra observadores (o integridad) el cual corrige por concordancia al azar.

Kappa varía de + 1 a - 1 + 1 significa que los dos observadores concuerdan perfectamente. Ellos clasifican a todos en la misma forma. 0 significa que no hay relación entre las clasificaciones de los dos observadores. - 1 significa que los dos observadores clasifican exactamente lo opuesto. Si un observador dice si, el otro siempre dice no.

Guía del uso de kappa en epidemiología y medicina: Kappa > .80 es considerado excelente Kappa .60 - .80 es considerado bueno Kappa .40 - .60 es considerado regular Kappa < .40 es considerado pobre

Primera forma de calcular Kappa: 1. Calcule la concordancia observada (celdas en las cuales el observador concuerdan/total de celdas). En tablas 1 y 2 es de 95%   2. Calcule la concordancia esperada (concordancia al azar) basado en los totales marginales

En la tabla 1 los totales marginales son: OBSERVADOS MD#1 Si No MD#2 1 3 4 2 94 96 97 100

¿Cómo calculamos el N esperado por azar en cada celda? Asumimos que cada celda refleja las distribuciones marginales, v.gr. La proporción de respuestas si y no deberá ser la misma dentro de la tabla de cuatro celdas como en los totales marginales. OBSERVADOS MD #1 Si No MD#2 1 3 4 2 94 96 97 100 ESPERADOS MD #1 Si No MD#2 4 96 3 97 100

Para hacer esto, encontramos la proporción de respuestas en cada columna (3% y 97%, si y no respectivamente para MD #1) o renglón (4% y 96% si y no respectivamente para MD #2) totales marginales y aplica una de las dos proporciones al otro total marginal. Por ejemplo, 96% de los totales de renglones en la categoría “No”. Por lo tanto, por azar 96% of MD #1 es “No” debería estar en la columna “No”. 96% de 97 es 93.12. ESPERADOS MD#1 Si No MD#2 4 93.12 96 3 97 100

Por restas, llene todas las otras celdas y cada distribución de si/no refleja la distribución marginal. Cualquier celda podría ser usada para hacer el cálculo, debido a que una vez que la celda es especificada en una tabla 2 x 2 con distribuciones marginales fijadas, todas las otras celdas son también especificadas. ESPERADOS MD #1 Si No MD#2 0.12 3.88 4 2.88 93.12 96 3 97 100

Ahora puede ver que sólo por el azar , 93 Ahora puede ver que sólo por el azar , 93.24 de las 100 observaciones deberían concordar por los dos observadores (93.12 + 0.12) ESPERADO MD #1 Si No MD#2 0.12 3.88 4 2.88 93.12 96 3 97 100

Ahora comparemos la concordancia actual con la esperada Concordancia esperada es 6.76% de la perfecta concordancia del 100% (100 – 93.24) Concordancia actual fue 5.0% de la perfecta concordancia del 100% (100 – 95) Así, nuestros dos observadores fueron 1.76% mejor que el azar, pero si ellos hubieran concordado perfectamente, deberían haber estado 6.76% mejor que el azar. Ellos están sólo cerca de ¼ mejor que el azar (1.76/6.76)

Fórmula para el cálculo de Kappa de la concordancia esperada C. observada - C. esperada 1 - C. esperada   95% - 93.24% = 1.76% = .26 1 - 93.24% 6.76% C=concordancia

¿Es buena la Kappa de 0.26? Kappa > .80 es considerada excelente Kappa .60 - .80 es considerada buena Kappa .40 - .60 es considerada regular Kappa < .40 es considerada pobre

En el segundo ejemplo, la concordancia observada fue también de 95%, pero los totales marginales fueron muy diferentes   ACTUAL MD #1 Si No MD#2 46 54 45 55 100

Usando el mismo procedimiento como antes, calculamos el esperado de N, basado en los totales marginales. Por ejemplo, la celda abajo a la derecha es 54% de 55, el cual es 29.7 ACTUAL MD #1 Si No MD#2 46 29.7 54 45 55 100

Y, por restar las otras celdas están como abajo Y, por restar las otras celdas están como abajo. Las celdas que indican concordancia son resaltadas en amarillo y suman 50.4% ACTUAL MD #1 Si No MD#2 20.7 25.3 46 24.3 29.7 54 45 55 100

1 - Concordancia esperada Entre las dos concordancias (C) en la fórmula:   C. observada - C. esperada 1 - Concordancia esperada 95% - 50.4% = 44.6% = .90 1 - 50.4% 49.6% En este ejemplo, los observadores tienen la misma % de concordancia, pero ahora ellos están muy diferentes del azar. Kappa de 0.90 es considerado excelente

Otra forma de calcular Kappa 2(AD - BC) N1N4 + N2N3 donde las Ns son los totales marginales etiquetados así: MD#1 Si No MD#2 A B N1 C D N2 N3 N4 total

Mire la tabla de la diapositiva 7. Para Tabla 1:   2(94 x 1 - 2 x 3) = 176 = .26 4 x 97 + 3 x 96 676 Para Tabla 2: 2(52 x 43 - 3 x 2) = 4460 = .90 46 x 55 + 45 x 54 4960

Note paralelismos entre: LA RAZON DE MOMIOS ( ODDS RATIO) LA CHI-CUADRADA ESTADISTICA LA KAPPA ESTADISTICA Note que los productos cruzados de la tabla de cuatro celdas y su relación a los totales marginales , son centrales en las tres expresiones

Validez y monitoreo Tres mediciones claves de la validez SENSIBILIDAD ESPECIFICIDAD VALORES PREDICTIVOS

TABLA DE CUATRO CELDAS PARA EVALUAR LA RELACION PRUEBA-ENFERMEDAD Estado de enfermedad + - Resultado de la prueba + Enfermo, prueba positiva No enfermo, prueba positiva PRUEBA POSITIVA - Enfermo, prueba negativa Libre de enfermedad, prueba negativa PRUEBA NEGATIVA NO ENFERMO ENFERMO

Sensibilidad Nos indica que tan bien una prueba positiva detecta la enfermedad. Es definida como la fracción de los enfermos que dan positivos en la prueba. Su complemento es la tasa de falsos negativos, definida como la fracción de los enfermos que dan negativo con la prueba. Sensibilidad y tasa de falsos negativos suman uno.

Especificidad Nos indica que tan bien una prueba negativa no detecta la enfermedad. Es definida como la fracción de los no enfermos cuya prueba fue negativa. Su complemento es la tasa de falsos positivos, definida como la fracción de los no enfermos cuya prueba fue positiva. Especificidad más tasa de falsos positivos dan uno.

Valores Predictivos Valor predictivo positivo es la proporción de toda la gentes con pruebas positivas quienes tienen la enfermedad. Valor predictivo negativo es la proporción de toda las personas con pruebas negativas quienes no tienen la enfermedad. En general, el valor predictivo positivo es el más usado. Valor predictivo positivo y sensibilidad son, quizá, los dos más importantes parámetros en el entendimiento de la utilidad de una prueba bajo condiciones de campo.

Puntos clave a recordar Sensibilidad, especificidad, falsos positivos y falsos negativos son denominadores a personas enfermas o no enfermas. (Usándolos, en totales de columnas). Por lo contrario, valores predictivos son denominadores para el status de la prueba, positivo o negativo (usandolos en totales de renglones). Sensibilidad y especificidad no varían de acuerdo a la prevalencia de la enfermedad en la población. Valores predictivos de una prueba, sin embargo, son ALTAMENTE DEPENDIENTES de la prevalencia ode la enfermedad en la población.

Calculando sensibilidad, especificidad y valores predictivos Una prueba es usada en 50 personas con la enfermedad y 50 personas sin ella. Estos son los resultados: Enfermedad + - Prueba 48 3 51 2 47 49 50 100

+ - + - Sensibilidad = 48/50 = 96% Especificidad = 47/50 = 94% Enfermedad + - Prueba + 48 3 51 - 2 47 49 50 50 100 Sensibilidad = 48/50 = 96% Especificidad = 47/50 = 94% Valor predictivo positivo = 48/51 = 94% Valor predictivo negativo = 47/49 = 96%

Ahora, apliquemos esta prueba en una población donde 2% de las personas tienen la enfermedad, no el 50% como en el ejemplo anterior. Asuma que hay 10,000 personas, y la misma sensibilidad y especificidad de antes, 96% y 94% respectivamente. Enfermedad + - Prueba 192 588 780 8 9,212 9,220 200 9,800 10,000

¿Cuál es el valor predictivo positivo ahora?  192/780 = 24.6%  Cuando la prevalencia de la enfermedad es 50%, 94% de las pruebas positivas indican enfermedad. Pero cuando la prevalencia es sólo 2%, menos de 1 en cuatro pruebas señalan una persona con la enfermedad y 2% actualmente deberían representar una muy común enfermedad. Falsos positivos tienden a esconderse en verdaderos positivos en poblaciones, debido a que muchas enfermedades que probamos son raras.

Cambiando el límite para una prueba Cuando enfermedad es definida por un límite en una prueba contínua, las características de la prueba pueden ser alteradas cambiando el límite o punto de corte. Disminuyendo el límite mejora la sensibilidad, pero el precio es la disminución de la especificidad (v.gr. Más falsos positivos). Aumentando el límite mejora la especificidad, per el precio es la disminución de la sensibilidad (v.gr. Más falsos negativos). Esto es especialmente importante cuando la distribución de una característica es unimodal, como la tensión arterial, colesterol, peso, etc. (debido a que la zona gris es grande)

Problemas con monitoreo ¿Tenemos el correcto umbral? ¿Hay un tratamiento verdaderamente efectivo disponible para la enfermedad? ¿Es el tratamiento más efectivo en casos monitoreados que en los no monitoreados? ¿Cuáles son los eventos adversos del proceso de monitoreo? ¿Cuán eficiente es el monitoreo?v.gr. ¿cuánta gente tiene que ser monitoreada para encontrar un caso?

Ejemplo Un ensayo aleatorizado para evaluar un programa de monitoreo para cáncer de cólon es implementado. El grupo de la intervención tiene regular monitoreo, el grupo control es dejado a merced de sus recursos.

Después de cinco años, se encontró que: Más casos son descubiertos en el grupo monitoreado que en el grupo control. Los casos son descubiertos a un más temprano estadío del cáncer en el grupo monitoreado. La sobrevida a cinco años es mayor en las personas con cáncer monitoreadas. ¿Podemos concluir que este programa de monitoreo es necesariamente efectivo?

No, el programa no necesariamente será efectivo Los aparantes beneficios sólo demuestran los efectos del SESGO DEPENDIENTE DEL TIEMPO.  Si es posible diagnosticar una condición en forma temprana, pero no mejorar la sobrevida después del diagnóstico, el programa de monitoreo tendrá una sobre representación de casos diagnosticados más temprano, cuya sobrevida será incrementada por exactamente el tiempo en que su diagnóstico fue hecho en forma más temprana por el programa de monitoreo. Así, ellos no se han beneficiado, pero la cantidad de tiempo que ellos saben que tienen cáncer ha aumentado.

Considere cuánto cambia el tiempo de diagnóstico en el monitoreo en el escenario de abajo: grupo sin motorear: Dx Muerte Edad50 51 52 53 54 55 Grupo monitoreado: Dx Muerte Edad 50 51 52 53 54 55

Otros sesgo en monitoreo: sesgo de longitud de tiempo Muchas enfermedades crónicas, especialmente cánceres, no progresan con la misma rapidez en todos los pacientes. Cualquier grupo de enfermos incluirá algunos en quienes la enfermedad se desarrolla más lento y algunos en quienes se desarrolla más rápido. Monitoreo preferencialmente incluirán enfermedades de desarrollo lento (mayor oportunidad de ser monitoreados) y que usualmente tienen mejor pronóstico.

En el escenario previo, la incidencia de la enfermedad es inicialmente más alta, diagnóstico es hecho más temprano, estadio de diagnóstico es más temprano y la duración de sobrevida desde el diagnóstico es más larga. Todos ellos dan la impresión de beneficiarse del monitoreo. Sin embargo, no se benefician, como la muerte no es pospuesta. La sóla evidencia de efectividad de un programa de monitoreo es una reducción de la morbilidad o mortalidad específica por edad total, idealmente demostrada en un ensayo aleatorizado. Ejercicio Mamografía 1. Menos de 50 años, sensibilidad es 75%, desúés de 50 años, la sensibilidad es de 90%. 2. Menos de 50 años, 640 mamografías anormales se confirmaron con cáncer; la razón FP/TP es 623/17 = 36.7. Sobre 50, 100 mamografías anormales se confirmaron 14 anceres; razón FP/TP es 86/14 = 6.1. Expresando esas como valores predictivos positivos, tenemos 17/640 = 2.7% y 14/100 = 14%., respectivamente. 3. Menos de 50, incidencia es 1.42/1,000/año (basado en 1/70 en 10 años, o 1/700/año) y mortalidad es 0.37/1,000/año (basado en 37 muertes en 10,000 en 10 años). Sobre 50, incidencia - 2.5/1,000/año (basado en 1/40/10 años). Mortalidad – 0.67/1,000/año (basado en 1/150 en 10 años).