MEDIDAS DE LOS RESULTADOS EN LOS ENSAYOS CLÍNICOS

Slides:



Advertisements
Presentaciones similares
“Sólo la comprensión confiere la capacidad de convertirse en una persona autónoma” LA REGLA DEL “1”: Por cada “1” paciente en el que es más efectivo.
Advertisements

DISEÑOS DE ESTUDIO EN EPIDEMIOLOGIA
DISEÑO DE EXPERIMENTOS EXPERIMENTOS DE COMPARACIÓN SIMPLE
ESTIMACION DE PARAMETRO
Metodología para la evaluación de nuevos fármacos Delegación SEFH País Vasco Bilbao 1-2 de Junio 2012 Eficacia y seguridad. Extracción de datos de.
Aplicación de estadígrafos (II)
Relación entre la exposición a pesticidas y el desarrollo de carcinoma urotelial vesical superficial de bajo grado Peláez y cols. Med Clin (Barc) 2004;123(15):571-4.
Evaluación de la Eficacia Francesc Puigventós Centre d´Avaluació i Informació del Medicament Servei de Farmàcia. Hospital Universitari Son Dureta 6 Marzo.
Bases metodológicas para la evaluación de la eficacia y seguridad de los nuevos medicamentos en la terapéutica de AR y LES Francesc Puigventós Servei de.
Eficacia, relevancia y aplicabilidad
Evaluación de la eficacia
Evaluación de nuevos medicamentos en oncología: Fuentes de información y posicionamiento terapéutico Parte 3 Francesc Puigventós Servei de Farmàcia. Hospital.
Taller de Evaluación de la Eficacia 6ª Curso de Evaluación y Selección de Medicamentos Palma de Mallorca 7 de Mayo 2008 Jordi Ginés Servicio de Farmacia.
6º Curso de Evaluación y Selección de medicamentos Palma de Mallorca 6, 7 y 8 de Mayo 2008 TALLER DE REDACCIÓN DE UN INFORME DE EVALUACIÓN Aplicación práctica.
Ensayos de no inferioridad y ensayos secuenciales
Evaluación de la eficacia
Evaluación de la eficacia
Epidemiología y demografía sanitaria
Una breve introducción a la epidemiología - XIII (Crítica de la investigación: Consideraciones estadísticas) ¿Quién es Betty C Jung? Revise mi página Web:
Tema 15. Contraste de hipótesis: Planteamiento de las hipótesis
INVESTIGACIÓN PRÁCTICA
Evaluar el efecto de un tratamiento (1)
Estadística Aplicada a Ecología
Demostración de Asociación
Estudios de Cohorte Dra. Pilar Jiménez M..
Estudios de Casos y Controles
Dr.. Roy Martin Angulo Reyes
Ejemplo Grafico.
MEDICIONES UTILIZADAS EN EPIDEMIOLOGIA Y FUENTES DE INFORMACIÓN
CONCEPTOS BÁSICOS DE DISEÑO DE ESTUDIOS EPIDEMIOLÓGICOS
Pruebas de hipótesis.
De la muestra a la población
Análisis de supervivencia
Estadística Teórica II
Tema 7: Introducción a los contrastes de hipótesis
TIPOS DE ESTUDIOS CLINICO EPIDEMIOLOGICOS
La Estadística en 37 preguntas
Bioestadística Diplomado en Sanidad
Evaluación de la Eficacia Francesc Puigventós Servei de Farmàcia. Hospital Universitari Son Dureta 5º Curso de evaluación y selección de medicamentos Sevilla.
Universidad Mariano Gálvez de Guatemala Facultad de Ciencias Médicas y de la Salud Curso de Epidemiología (código 200 – 523) Décima novena clase, Riesgo.
VALOR DE p INTERVALO DE CONFIANZA
¿Qué es una tabla de contingencia,
Medidas epidemiológicas de asociación
TEMA III.
Introducción a la lectura crítica de un ensayo clínico
ESTUDIOS EPIDEMIOLÓGICOS
ANÁLISIS “No todo lo que sea estadísticamente significativo es útil”
Estadística Computacional Prof. Miguel González Velasco
CURSO DE EPIDEMIOLOGIA BASICA 4b
Hospital Privado de Córdoba Octubre  Este estudio estableció desde 1987 estudiar el efecto de la radioterapia (RT) después de la cirugía conservadora.
Pruebas de hipótesis Walter Valdivia Miranda
Seguridad de la combinación de metformina y sulfonilureas Rao AD, Kuhadiya N, Reynolds K, Fonseca VA. Is the Combination of Sulfonylureas and Metformin.
Unidad VI: PRUEBAS DE HIPOTESIS
Análisis de datos El diseño estadístico.
Servicio Clínica Médica Centro Adherente a la Red Cochrane Ibero Americana Prof. Dr. Hugo N. Catalano Hospital Alemán Diseños de Investigaciones.
Medidas de frecuencia y asociación en Epidemiología
Estudios de cohorte El paradigma de los estudios de cohorte es la clasificación de los sujetos de estudio según su condición en relación con la exposición.
Estudios de casos y controles
Análisis y diseño de experimentos
Cholesterol Treatment Trialists
Eficacia del tratamiento intensivo para reducir el colesterol LDL en la prevención de las enfermedades cardiovasculares Cholesterol Treatment Trialists´
La tolerancia y la seguridad de los anticoagulantes orales en ancianos es peor en las condiciones de uso habituales que en los ensayos clínicos Hylek EM,
Pruebas de hipótesis.
Elaborado por: Dr. Juan José García García. Algunas preguntas acerca de la necesidad de llevar a cabo una intervención Puede mejorarse la situación de.
BASES PARA EL RAZONAMIENTO EN ESTADÍSTICA INFERENCIAL
Eficacia de las estatinas en diabéticos Cholesterol Treatment Trialists´ (CTT) Collaborators. Efficacy of cholesterol-lowering therapy in people.
Elementos del Diseño de Investigación Defina el Problema Revise la literatura Formule una hipótesis Planee investigar y probar su hipótesis Planee necesidades.
MEDICIONES EPIDEMIOLOGICAS
TAMAÑO DE LA MUESTRA. Para definir el tamaño de la muestra se debe tener en cuenta los recursos disponibles y las necesidades del plan de análisis, el.
POBLACIÓN Y MUESTRA CÁLCULO DEL TAMAÑO MUESTRAL. Descripción e inferencia Población Muestra Muestreo Inferencia Resultado.
Transcripción de la presentación:

MEDIDAS DE LOS RESULTADOS EN LOS ENSAYOS CLÍNICOS Catalina Barceló 8 de Mayo 2012 Hospital Universitari Son Espases

MEDIDAS DE LOS RESULTADOS EN LOS ENSAYOS CLÍNICOS Qué resultados medimos? Como expresamos estos resultados? To “p” or not to “p” Intervalos de confianza

MEDIDAS DE LOS RESULTADOS EN LOS ENSAYOS CLÍNICOS Qué resultados medimos? Como expresamos estos resultados? To “p” or not to “p” Intervalos de confianza

¿Qué resultados medimos? Medicamentos Variables intermedias, subclínicas, subrogadas, u orientadas a la enfermedad Variables clínicas finales, u orientadas al paciente Antihipertensivos Reducción de tensión arterial Disminución de la incidencia de infarto de miocardio, mortalidad cardiovascular, etc. Hipocolesterolemiantes Reducción de colesterol-LDL, reducción de placa de ateroma Antidiabéticos Reducción de hemoglobina glicosilada Reducción de complicaciones vasculares de la diabetes Anticoagulantes en prevención tromboembólica Disminución de la incidencia de tromboembolismo subclínico, detectado por venografía Disminución de la incidencia de tromboembolismo sintomático Tocolíticos en el parto pretérmino Retraso del parto Disminución de la morbimortalidad perinatal y neonatal Antineoplásicos Aumento de la respuesta Aumento de la supervivencia Antibióticos Mayor espectro antibacteriano Aumento del índice de curación Protectores gástricos en tratamientos con AINE Disminución de ulceraciones subclínicas, detectadas por endoscopia Disminución de la incidencia de úlcera gastroduodenal y hemorragia digestiva Anestésicos locales Mayor potencia sobre receptores Eficacia analgésica en escala visual analógica

Cualitativas (datos no métricos): Tipos de variables Variable: caracteres o aspectos que se registran en los sujetos del estudio y que pueden tomar distintos valores Cualitativas (datos no métricos): Categóricas nominales: Binarias (2 categorías): sexo >2 categorías: histología tumoral Categóricas ordinales: clasificadas según su magnitud* - Clasificación funcional NYHA para ICC Cuantitativas (datos métricos): Discretas: recuentos (nº de caídas al año) Continuas: medidas (edad, peso, TA)* Ojo con las escalas, es diferente considerarlas como el resultado de la puntuación total (quantitativa discreta) o como categoríasdonde por ejemplo no significa que grado 3 este tres veces peor que el 1. Variables continuas siempre presentan un aspecto discreto: dependiendo de la exactitud de la medida, por ejemplo 51,5 kg (±0,5 kg). Daremos simpre valores redondeados y por lo tanto perdemos cierta continuidad. Establecemos intervalos. Excepción donde no redondeamos: Tiempo transcurrido= diferencia entre dos fechas. habitualmente se presenta como tiempo cumplido (años cumplidos, días de estancia cumplidos..) este valor entero no es que esté redondeado (1 día para cumplir los 13 años 12 años cumplidos) sinó truncado. Establecemos de nuevo intervalos. Algunos autores, en vez del valor truncado prefieren dar un valor que llaman aproximado que consiste en el caso de la edad en corregir la edad cumplida en +0,5 años (tiene ventajas en cuanto al análisis estadístico) Importante determinar el tipo de variable de un estudio porque será fundamental a la hora de escoger el método estadístico de análisis más adecuado. Además con algunas variables es posible registrarlas con diferentes escalas. Por ejemplo el hábito de fumar: fumador SI/NO, (categórica binaria), consumo de cigarrillos (quantitativa discreta). Importante tener claro al inicio de un estudio como vamos a recoger los datos, y simepre tenderemos a elegir la variable que nos dé más información. Por ejemplo, recogiendo el consumo de cigarrillos de un paciente simpre podremos categorizar-lo después en fumador/no fumador. En cambio al revés… Time-to-an-Event: - Tiempo hasta restauración del ritmo sinusal

Cualitativas (datos no métricos): Tipos de variables Variable: caracteres o aspectos que se registran en los sujetos del estudio y que pueden tomar distintos valores Cualitativas (datos no métricos): Categóricas nominales: Binarias (2 categorías): sexo >2 categorías: histología tumoral Categóricas ordinales: clasificadas según su magnitud* - Clasificación funcional NYHA para ICC Cuantitativas (datos métricos): Discretas: recuentos (nº de caídas al año) Continuas: medidas (edad, peso, TA)* Variables continuas siempre presentan un aspecto discreto: dependiendo de la exactitud de la medida, por ejemplo 51,5 kg (±0,5 kg). Daremos simpre valores redondeados y por lo tanto perdemos cierta continuidad. Establecemos intervalos. Excepción donde no redondeamos: Tiempo transcurrido= diferencia entre dos fechas. habitualmente se presenta como tiempo cumplido (años cumplidos, días de estancia cumplidos..) este valor entero no es que esté redondeado (1 día para cumplir los 13 años 12 años cumplidos) sinó truncado. Establecemos de nuevo intervalos. Algunos autores, en vez del valor truncado prefieren dar un valor que llaman aproximado que consiste en el caso de la edad en corregir la edad cumplida en +0,5 años (tiene ventajas en cuanto al análisis estadístico) Importante determinar el tipo de variable de un estudio porque será fundamental a la hora de escoger el método estadístico de análisis más adecuado. Además con algunas variables es posible registrarlas con diferentes escalas. Por ejemplo el hábito de fumar: fumador SI/NO, (categórica binaria), consumo de cigarrillos (quantitativa discreta). Importante tener claro al inicio de un estudio como vamos a recoger los datos, y simepre tenderemos a elegir la variable que nos dé más información. Por ejemplo, recogiendo el consumo de cigarrillos de un paciente simpre podremos categorizar-lo después en fumador/no fumador. En cambio al revés… Time-to-an-Event: - Tiempo hasta restauración del ritmo sinusal

Cuantitativa discreta Categórica nominal: binaria Tipos de variables Efficacy was assessed at 0–48 h (at 0, 2, 6, 24, and 48 h) after surgery. Patients were monitored continuously in the postanesthesia care unit, and emetic episodes and/or use of rescue therapy were recorded throughout the hospital stay. An emetic episode was defined as one or more continuous episodes of vomiting (oral expulsion of stomach contents) or retching (an attempt to vomit that is not productive of stomach contents); distinct episodes were those occurring at least 1 min apart. Cuantitativa discreta Categórica nominal: binaria

Categórica nominal: binaria Tipos de variables There was no significant difference in the percentage of patients with no vomiting and no rescue (complete response) over 0–24 h between aprepitant 40 mg (45%) or 125 mg (43%) and ondansetron (42%; P 0.5 for both odds ratios of aprepitant:ondansetron). Categórica nominal: binaria

Tipos de variables Nausea was assessed at 2, 6, 24, and 48 h postoperatively, at any time the patient complained of nausea, and immediately before administration of rescue medication. Patients rated nausea on an 11-point Verbal Rating Scale (VRS), with 0 equal to “no nausea” and 10 equal to “nausea as bad as it could be.” Categórica ordinal

Time-to-an event: tiempo transcurrido Tipos de variables Additional safety assessments included awakening time (interval between end of surgery and patient’s ability to obey commands) and duration of recovery from anesthesia (postanesthesia recovery score of 8 on a 0–10 scale) (19). Time-to-an event: tiempo transcurrido

Expresión de los resultados Cualitativas (datos no métricos): Categóricas nominales o ordinales RR, OR, RRR, RAR Cuantitativas (datos métricos): Discretas o continuas Medias y medianas Incidencia, incidencia acumulada, tasa de incidencia Variables continuas siempre presentan un aspecto discreto: dependiendo de la exactitud de la medida, por ejemplo 51,5 kg (±0,5 kg). Daremos simpre valores redondeados y por lo tanto perdemos cierta continuidad. Establecemos intervalos. Excepción donde no redondeamos: Tiempo transcurrido= diferencia entre dos fechas. habitualmente se presenta como tiempo cumplido (años cumplidos, días de estancia cumplidos..) este valor entero no es que esté redondeado (1 día para cumplir los 13 años 12 años cumplidos) sinó truncado. Establecemos de nuevo intervalos. Algunos autores, en vez del valor truncado prefieren dar un valor que llaman aproximado que consiste en el caso de la edad en corregir la edad cumplida en +0,5 años (tiene ventajas en cuanto al análisis estadístico) Importante determinar el tipo de variable de un estudio porque será fundamental a la hora de escoger el método estadístico de análisis más adecuado. Además con algunas variables es posible registrarlas con diferentes escalas. Por ejemplo el hábito de fumar: fumador SI/NO, (categórica binaria), consumo de cigarrillos (quantitativa discreta). Importante tener claro al inicio de un estudio como vamos a recoger los datos, y simepre tenderemos a elegir la variable que nos dé más información. Por ejemplo, recogiendo el consumo de cigarrillos de un paciente simpre podremos categorizar-lo después en fumador/no fumador. En cambio al revés… Time-to-an-Event: Hazard ratio (HR)

Expresión de los resultados Prevalencia Proporción de individuos que presenta una determinada característica o evento en una población y en un momento de tiempo determinado. Estudios transversales y caso-control Incidencia Número de casos nuevos de una determinada característica o evento que se desarrollan en una población durante un período de tiempo determinado. Estudios de cohorte y experimentales

Expresión de los resultados Incidencia acumulada (IA) Número de sujetos que presentan la condición estudiada en un determinado tiempo de observación Es una proporción, no una tasa. Para poder interpretarla es preciso que se acompañe del período de observación. Sin embargo: Los pacientes entran en el estudio en diferentes momentos El seguimiento de los pacientes no es uniforme: de algunos no se obtiene toda la información Algunos pacientes abandonan el estudio

Expresión de los resultados Densidad (Tasa) de incidencia (DI) Preferida para la evaluación del impacto poblacional de un determinado evento Corresponde al riesgo promedio por persona y unidad de tiempo No es una proporción sino una tasa, ya que el denominador incorpora la dimensión tiempo

Medidas del efecto: variables binarias Medidas relativas: Riesgo Relativo (RR) Odds ratio (OR) Reducción relativa de riesgo (RRR) Medidas absolutas: Reducción absoluta de riesgo (RAR) NNT

Medidas del efecto: variables binarias Medidas relativas: Riesgo Relativo (RR) Odds ratio (OR) Reducción relativa de riesgo (RRR) Estiman la magnitud de asociación entre la exposición y el efecto observado e indican cuánto es más probable que el efecto o evento ocurra en el grupo de sujetos expuestos al factor de exposición en relación al grupo no expuesto.

Medidas relativas del efecto Riesgo relativo: RR= B/A (A = control B = intervención) Razón de incidencias (proporciones) Valores entre 0 e infinito Valor 1 = neutro. No diferencias entre grupos Valor >1 = grupo intervención con mayor proporción del efecto que midamos Valor <1 = grupo intervención con menor proporción del efecto que midamos

Medidas relativas del efecto Odds Ratio: OR Razón de odds. Odds: p/1-p p = probabilidad de que ocurra el evento 1-p = probabilidad de que no ocurra Valores entre 0 e infinito Valor 1 = neutro. No diferencias entre grupos Valor >1 = grupo intervención con mayor proporción del efecto que midamos Valor <1 = grupo intervención con menor proporción del efecto que midamos

Medidas relativas del efecto Odds Ratio: OR Razón de odds. Odds: p/1-p OR: p1/1-p1: p2/1-p2 p = probabilidad de que ocurra el evento 1-p = probabilidad de que no ocurra ÉXITO FRACASO INTERV a b a+b CONTROL c d c+d Total éxitos Total fracasos Total pacientes

Medidas relativas del efecto 5 BALAS Odds = 4/1 =4 Odds = 1/4=0,25

Relación entre RR y OR RR= razón de proporciones (valores 0-1) OR= razón de odds (valores 0-infinito) Expresan lo mismo pero con dos escalas numéricas diferentes

Relación entre RR y OR RR= 0,3 OR=

Relación entre RR y OR Curaciones No Curaciones Total Tto experimental 90 10 100 Tto control 75 25 165 35 200 OR=90 x 25/75 x 10= 3 3 a 1, exp es mejor que control? ¿Hasta qué punto el tratamiento A es 3 veces mejor que el B? Nuestro modo habitual de razonar es que el tratamiento A cura un 90% y el B un 75%, luego RR=0,9/0,75=1,2 Luego A es 1,2 veces mejor que B

Cuando utilizaremos OR? Relación entre RR y OR Resultados con OR: más magnificados (valores más extremos) Sobretodo cuando la incidencia de un suceso en un grupo es > 10% y/o hay diferencias entre ellos La OR sólo se aproxima al RR cuando el suceso es raro. Su interpretación debe matizarse en función de lo frecuente que sea el suceso en estudio IC 95% de OR son más amplios Cuando utilizaremos OR?

Riesgo relativo: razón de incidencias Relación entre RR y OR Riesgo relativo: razón de incidencias No puede utilizarse en los estudios transversales ni en los estudios de casos y controles Porque las características de estos estudios no nos permiten conocer las tasas de incidencia del resultado. Odds Ratio

Medidas relativas del efecto Reducción relativa de riesgo: RRR RRR = [(B-A) / A]*100 RRR = 1-RR

Medidas del efecto: variables binarias Medidas absolutas: Reducción absoluta de riesgo (RAR) NNT

Medidas del efecto: variables binarias Medidas absolutas: Reducción absoluta de riesgo o diferencia de riesgo RAR= diferencia de proporciones entre grupos (B-A) RAR= 3,3%-10,9%= -7,6%

Medidas del efecto: variables binarias NNT (nº necesario a tratar para conseguir una unidad más de eficacia). Si se evalúa un efecto adverso (NNH) 1/ RAR o 100/RAR (riesgo en %) Dimensiona la eficacia de la intervención mediante el esfuerzo necesario para conseguir una unidad de eficacia. Cuanto mayor sea el efecto del tratamiento menor será el NNT Cálculos farmacoeconómicos y toma de decisiones También hay fórmulas para calcular el NNT a partir del OR

Medidas del efecto: variables binarias NNT = 1/ RAR o 100/RAR RAR= 3,3%-10,9%= -7,6% NNT= 100/7,6= 13,1

Medidas del efecto: variables binarias Limitaciones del NNT: - Resultado NNT, aplicable a nuestro medio si el riesgo basal del ensayo es similar Índices relativos (OR, RR) tienden a ser más parecidos entre diferentes ensayos del mismo tratamiento que los índices absolutos (RAR, NNT) Metanálisis: NNT global poco informativo si heterogeneidad en los riesgos basales No es un índice aplicable directamente de forma individual a un paciente con unas características concretas. Se trata como un dato poblacional

Pregunta: ¿Cuál de la siguientes afirmaciones sobre el NNT es FALSA? A) Se calcula a partir de la RAR B) Es independiente de la incidencia del evento en el grupo control C) Cuanto mayor es el efecto del tratamiento menor es la NNT D) Como cualquier parámetro estadístico debe expresarse con su intervalo de confianza

¿Cuál de la siguientes afirmaciones sobre el NNT es FALSA? Pregunta: ¿Cuál de la siguientes afirmaciones sobre el NNT es FALSA? A) Se calcula a partir de la RAR B) Es independiente de la incidencia del evento en el grupo control C) Cuanto mayor es el efecto del tratamiento menor es la NNT D) Como cualquier parámetro estadístico debe expresarse con su intervalo de confianza

Relación entre medidas absolutas-relativas: Riesgo basal grupo control 40% 20% 10% 5% Incidencia grupo interv 30% 15% 7,5% 3,75% RRR 25% RAR 2,5% 1,25% NNT 10 20 40 80 Las medidas relativas no tienen en cuenta el riesgo basal de los pacientes, y por ello no permiten diferenciar entre un beneficio grande o pequeño. Las medidas relativas son características del tratamiento, mientras que las absolutas dependen del tratamiento y también del riesgo basal.

Pregunta: Un fármaco ↓mortalidad de un 6% a un 2%. Podemos decir realmente que….? Ha disminuido la mortalidad un 4% en términos absolutos (RAR) Ha disminuído la mortalidad un 66,6% en términos relativos (RRR) Ha aumentado la supervivencia del 94% al 98%, es decir un 4,2% en términos relativos (RRR) Riesgo relativo: 2%/6%= 0,33 (RR) Odds ratio: 0,02/ 0,98 : 0,06/0,94 = 0,31 (OR) Por cada 25 pacientes, 1 más sobrevive. NNT = 100/4= 25

Relación entre medidas absolutas-relativas: Resumen: Relación entre medidas absolutas-relativas: RR y OR son más difíciles de interpretar, si no se traducen en diferencias absolutas de riesgo RAR y NNT se pueden calcular a partir de RR si tenemos la incidencia del grupo control

Cómo presentamos los resultados?

Cómo presentamos los resultados?

Ejercicio práctico: estudio ARISTOTLE Granger CB et al N Eng J Med 2011; 365(11): 981-92) Evento No evento Total Warfarina (A) Según INR 265 8816 9081 Apixaban (B) 5mg/12h 212 8908 9120 Variable principal: eventos de ictus o embolismo sistémico

Ejercicio práctico Cálculo Resultado Riesgo A (Warfarina) 265/9081    Cálculo Resultado Riesgo A (Warfarina) 265/9081 0,02918 (2,92 %) Riesgo B (Apixaban) 212/9120 0,02324 (2,32%) RAR NNT B-A 0,02324 – 0,02918 = -0,00594 En %: 2,3 % - 2,9 %= -0,6 % -0,006  (-0,6%) 1/(B-A) 1/RAR: 1 / 0,006 = 166,7 si en %: 100 / 0,6 = 166,7 166,7 (167)

   Cálculo Resultado Riesgo A (Warfarina) 265/9081 0,02918 (2,92 %) Riesgo B (Apixaban) 212/9120 0,02324 (2,32%) RR OR RRR B/A = 2,32/ 2,92 = 0,796 0,796 B´/A´ (Odds) A´=265/8816 = 0,030 B´= 212/8908 = 0,024 B´/A´: 0,024/0,030 = 0,80 0,80 [(B-A)/A] x 100= (-0,006/0,02918) x 100 = 20,56 %; 1-RR: 1- 0,796 = 0,204 20,56%  (20,4 %)

MEDIDAS DE LOS RESULTADOS EN LOS ENSAYOS CLÍNICOS Qué resultados medimos? Como expresamos estos resultados? To “p” or not to “p” Intervalos de confianza

To “p” or not to “p” Comprobación de hipótesis: enfoque frecuencista vs enfoque bayesiano pruebas de significación de la hipótesis nula (Fisher 1922, 1925) y pruebas de hipótesis (Neyman y Pearson 1928, 1933) Realidad en la población Decisión del investigador (muestra) H0 Error tipo II Probabilidad ß Error tipo I Probabilidad α Potencia (1-ß)

To “p” or not to “p” Comprobación de hipótesis: Mi nuevo tratamiento es más efectivo que el antiguo? H0= no hay diferencias entre los 2 tratamientos H1= hipótesis contraria. Son diferentes Realidad en la población Decisión del investigador (EC: muestra) H0 Error tipo II Probabilidad ß =0,20 Error tipo I Probabilidad α=0,05 Potencia (1-ß) 80%

To “p” or not to “p” Comprobación de hipótesis: Mi nuevo tratamiento es más efectivo que el antiguo? p = 0,05 = probabilidad empírica de cometer error tipo I = probabilidad de que las diferencias observadas entre los dos grupos puedan ser debidas al azar Realidad en la población Decisión del investigador (EC: muestra) H0 Error tipo II Probabilidad ß =0,20 Error tipo I Probabilidad α=0,05 Potencia (1-ß) 80%

To “p” or not to “p” Comprobación de hipótesis: Mi nuevo tratamiento es más efectivo que el antiguo? Valor p= grado de compatibilidad de los datos con la H0

To “p” or not to “p” Comprobación de hipótesis: Mi nuevo tratamiento es más efectivo que el antiguo? Valor p= grado de compatibilidad de los datos con la H0

La ausencia de diferencia To “p” or not to “p” Comprobación de hipótesis: Mi nuevo tratamiento es más efectivo que el antiguo? Si p < α (0,05)  podemos rechazar H0 Si p > α (0,05)  NO podemos rechazar H0 OJO! No podemos aceptarla tampoco! No concluyente p > 0,05: muestra pequeña (poder insuficiente) diferencias menores de lo esperado dispersión datos subgrupos de pacientes La ausencia de diferencia no es evidencia de equivalencia Altman DG. BMJ 1995; 311; 485.

significantitis, ley del todo o nada To “p” or not to “p” Críticas al valor p: Su valor se ha universalizado demasiado y se interpreta mal significantitis, ley del todo o nada No confundir significación estadística con relevancia clínica Pequeñas diferencias SIN interés clínico pueden ser estadísticamente significativas con muestras muy grandes Importantes diferencias pueden NO ser estadísticamente significativas a causa de un pequeño tamaño muestral

Intervalos de confianza Intervalo de probabilidad: α =0,05 α/2 p (1-α) α/2 -1,96 x SE ± z α/2 x SE 1,96 x SE

Intervalos de confianza Intervalo de probabilidad: α =0,1 -1,64 x SE ± z α/2 x SE 1,64 x SE

Intervalos de confianza Comprobación de hipótesis: Mi nuevo tratamiento es más efectivo que el antiguo? Intervalo de confianza de la diferencia entre A y B (RAR) Siempre que sepamos que sigue una distribución normal o sea una muestra grande > 30 pacientes ± 1,96 x SE

Intervalos de confianza Comprobación de hipótesis: Mi nuevo tratamiento es más efectivo que el antiguo? Intervalo de confianza del RR entre tto A y B 1 Siempre que sepamos que sigue una distribución normal o sea una muestra grande > 30 pacientes ± 1,96 x SE

Intervalos de confianza Permite conocer los límites entre los cuales tenemos nuestro valor verdadero con un determinado nivel de confianza (IC 95%) Permite también conocer la significación estadística (p) Permiten valorar la relevancia práctica o clínica (la magnitud del efecto) Permite ver si incluye o excluye el mínimo valor considerado de relevancia clínica (δ) Siempre que sepamos que sigue una distribución normal o sea una muestra grande > 30 pacientes

Intervalos de confianza Diferencias entre los tratamientos (RAR) Siempre que sepamos que sigue una distribución normal o sea una muestra grande > 30 pacientes

IC próximo a 1 pero no lo incluye Intervalos de confianza Intervalos de confianza que se solapan: Hay diferencias IC próximo a 1 pero no lo incluye Siempre que sepamos que sigue una distribución normal o sea una muestra grande > 30 pacientes Obese Non Obese

IC próximo a 1 pero no lo incluye Intervalos de confianza Intervalos de confianza que se solapan: Hay diferencias IC próximo a 1 pero no lo incluye Siempre que sepamos que sigue una distribución normal o sea una muestra grande > 30 pacientes

Intervalos de confianza Intervalos de confianza que se solapan: p values for testing equality of two means when two confidence intervals overlap % of overlap of two confidence intervals 0% 5% 10% 15% 20% 25% 0.0056 0.0085 0.0126 0.0185 0.0266 0.0376 Ojo: Al comparar 2 medias, pueden solapar hasta un 29% y ser diferentes con significación estadística

Conclusiones Variables de un estudio: diseño del estudio recoger máx información análisis estadístico Medidas de resultados: RR vs OR absolutas vs relativas p de significación estadística e intervalos de confianza Ley del todo nada Significación estadística vs relevancia clínica

Gracias por vuestra atención