La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Predeterminación del tamaño muestral

Presentaciones similares


Presentación del tema: "Predeterminación del tamaño muestral"— Transcripción de la presentación:

1 Predeterminación del tamaño muestral
Iñaki Pérez Estadístico Unidad de Desarrollo Clínico J. Uriach y Compañía S.A.

2 Sumario ¿Por qué? Procedimiento Software Ejemplos

3 Necesidad del cálculo de tamaño muestral
Ensayo Clínico Estudio Epidemiológico Estudio Observacional Encuesta El número de sujetos a incluir en un estudio es un compromiso entre los objetivos del mismo y los motivos éticos, científicos y logísticos/económicos. Éticos -> El número de sujetos (pacientes o voluntarios sanos) que se van a incluir en un estudio debe ser el estrictamente necesario para poder contestar de forma adecuada las preguntas planteadas. En definitiva, el número de sujetos que se exponen a riesgos potenciales debe ser el menor posible y adecuado a los objetivos del estudio. Científicos -> El número de sujetos debe ser suficiente para poder detectar diferencias entre tratamientos, si estas diferencias existen realmente. Es decir, si no se detectan diferencias entre tratamientos, no es consecuencia del bajo poder (potencia) del estudio Logísticos/Económicos -> Al incrementar el número de sujetos, se incrementa de forma directamente proporcional el coste del estudio en unidades monetarias y en tiempo. Otra limitación es que el número de pacientes disponibles en el caso de enfermedades infrecuentes puede no ser suficiente.

4 Necesidad del cálculo de tamaño muestral
Ensayo Clínico Estudio Epidemiológico Estudio Observacional Encuesta El número de sujetos a incluir en un estudio es un compromiso entre los objetivos del mismo y los motivos éticos, científicos y logísticos/económicos. Éticos -> El número de sujetos (pacientes o voluntarios sanos) que se van a incluir en un estudio debe ser el estrictamente necesario para poder contestar de forma adecuada las preguntas planteadas. En definitiva, el número de sujetos que se exponen a riesgos potenciales debe ser el menor posible y adecuado a los objetivos del estudio. Científicos -> El número de sujetos debe ser suficiente para poder detectar diferencias entre tratamientos, si estas diferencias existen realmente. Es decir, si no se detectan diferencias entre tratamientos, no es consecuencia del bajo poder (potencia) del estudio Logísticos/Económicos -> Al incrementar el número de sujetos, se incrementa de forma directamente proporcional el coste del estudio en unidades monetarias y en tiempo. Otra limitación es que el número de pacientes disponibles en el caso de enfermedades infrecuentes puede no ser suficiente.

5 Sumario

6 Muestra de la población
Población en estudio Población diana

7 Muestra de la población
El número de sujetos a incluir en un estudio es un compromiso entre los objetivos del mismo y los motivos éticos, científicos y logísticos/económicos. Éticos -> El número de sujetos (pacientes o voluntarios sanos) que se van a incluir en un estudio debe ser el estrictamente necesario para poder contestar de forma adecuada las preguntas planteadas. En definitiva, el número de sujetos que se exponen a riesgos potenciales debe ser el menor posible y adecuado a los objetivos del estudio. Científicos -> El número de sujetos debe ser suficiente para poder detectar diferencias entre tratamientos, si estas diferencias existen realmente. Es decir, si no se detectan diferencias entre tratamientos, no es consecuencia del bajo poder (potencia) del estudio Logísticos/Económicos -> Al incrementar el número de sujetos, se incrementa de forma directamente proporcional el coste del estudio en unidades monetarias y en tiempo. Otra limitación es que el número de pacientes disponibles en el caso de enfermedades infrecuentes puede no ser suficiente.

8 Tamaño muestral: ¿Por qué?
El principio general que justifica trabajar con muestras es que resulta más barato, más rápido y más fácil que hacerlo con poblaciones completas El número de pacientes necesario para contestar adecuadamente las preguntas Éticos Económicos Suficiente para detectar las diferencias si existen realmente Científicos El número de sujetos a incluir en un estudio es un compromiso entre los objetivos del mismo y los motivos éticos, científicos y logísticos/económicos. Éticos -> El número de sujetos (pacientes o voluntarios sanos) que se van a incluir en un estudio debe ser el estrictamente necesario para poder contestar de forma adecuada las preguntas planteadas. En definitiva, el número de sujetos que se exponen a riesgos potenciales debe ser el menor posible y adecuado a los objetivos del estudio. Científicos -> El número de sujetos debe ser suficiente para poder detectar diferencias entre tratamientos, si estas diferencias existen realmente. Es decir, si no se detectan diferencias entre tratamientos, no es consecuencia del bajo poder (potencia) del estudio Logísticos/Económicos -> Al incrementar el número de sujetos, se incrementa de forma directamente proporcional el coste del estudio en unidades monetarias y en tiempo. Otra limitación es que el número de pacientes disponibles en el caso de enfermedades infrecuentes puede no ser suficiente. Incrementar pacientes incrementa proporcionalmente el coste del estudio

9 Tipos de muestreo Muestreo aleatorio simple Muestreo estratificado
Cada sujeto tiene la misma probabilidad de ser incluido en la muestra El más utilizado Evita sesgos Muestreo estratificado Se clasifica a los individuos según variables conocidas de interés (sexo, grupos etarios,…) Muestreo simple dentro de cada estrato Mayor precisión pero análisis más complicado El número de sujetos a incluir en un estudio es un compromiso entre los objetivos del mismo y los motivos éticos, científicos y logísticos/económicos. Éticos -> El número de sujetos (pacientes o voluntarios sanos) que se van a incluir en un estudio debe ser el estrictamente necesario para poder contestar de forma adecuada las preguntas planteadas. En definitiva, el número de sujetos que se exponen a riesgos potenciales debe ser el menor posible y adecuado a los objetivos del estudio. Científicos -> El número de sujetos debe ser suficiente para poder detectar diferencias entre tratamientos, si estas diferencias existen realmente. Es decir, si no se detectan diferencias entre tratamientos, no es consecuencia del bajo poder (potencia) del estudio Logísticos/Económicos -> Al incrementar el número de sujetos, se incrementa de forma directamente proporcional el coste del estudio en unidades monetarias y en tiempo. Otra limitación es que el número de pacientes disponibles en el caso de enfermedades infrecuentes puede no ser suficiente. Muestreo por conglomerados Se clasifica a los individuos según grupos (familías, escuelas, barrios,…) Selección de los grupo y de todos los individuos que lo componen

10 El tamaño de la muestra depende de...
Las características, objetivos y diseño del estudio La(s) variable(s) principal(es) y distribución de referencia La magnitud del efecto del tratamiento ( ó ) a detectar La variabilidad de la medida o imprecisión Contraste de hipótesis (pruebas de hipótesis) Los errores de Tipo I y II y el poder (,  y 1-) La tasa de retiradas del estudio y pérdidas de seguimiento Diseño . Por bloques/ estratificado /

11 Características, objetivos y diseño
Estimación de parámetros poblacionales Contraste de hipótesis Prevalencia de migraña en la población Podría un programa de vacunación reducir la mortalidad infantil en más de un 15% Promedio de las cifras de colesterol en la población infantil Es diferente la eficacia analgésica de A en relación a B Diseño . Por bloques/ estratificado / Riesgo relativo de padecer retinopatia en los diabéticos tipo I frente a los de tipo II Está asociada la microalbuminuria con las cifras de TA

12 Estimación por intervalos de confianza
Información de la muestra Estadísticos s p OR Características de la población Parámetros μ σ π ω Diseño . Por bloques/ estratificado /

13 Estimación de parámetros (población infinita)
Queremos estimar una proporción en una población de origen ¿Qué tamaño de la muestra deberíamos tomar? K: Factor relacionado con la confianza p1: previsión del resultado w: Imprecisión (error) admisible en la estimación

14 Estimación de parámetros (población finita)
Queremos estimar una proporción en una población de origen ¿Qué tamaño de la muestra deberíamos tomar? Muestra representa más de 5% del total de la población K: Factor relacionado con la confianza p1: previsión del resultado w: Imprecisión (error) admisible en la estimación

15 Distribución del estadístico p1 en el muestro
π p1 -w +w

16 Valores de K y niveles de confianza
Nivel de confianza 3.29 0.999 2.8 0.995 2.58 0.99 2.32 0.98 2.24 0.97 1.96 0.95 1.64 0.90 1.28 0.80 1.03 0.70 0.84 0.60 0.67 0.50 0.52 0.40 0.38 0.30 0.25 0.20

17 Ejemplo 1: Estimación de proporciones
¿ Cual es el número de niños en edad escolar que es necesario analizar para estimar la prevalencia de la dislexia ? K: nivel de confianza de 95% =1.96 p1: previsión del resultado = 10% w: imprecisión (error) admisible en la estimación = 3%

18 Ejemplo 2: Y si la realidad es diferente…
Disléxicos (n=385) Prevalencia Imprecisión 4 0.01 19 0.05 0.02 39 0.1 0.03 77 0.2 0.04 116 0.3 La imprecisión aumenta con resultados hacia el 50%

19 Ejemplo 3: Estimación de proporciones (finita)
¿ Cual es el número de niños en edad escolar que es necesario analizar para estimar la prevalencia de la dislexia ? K: nivel de confianza de 95% =1.96 p1 : previsión del resultado = 10% w: imprecisión (error) admisible en la estimación = 3%

20 Ejemplo 4: Estimación de medias
¿ Cuál es el número de casos que es necesario analizar para estimar la media de la densidad en mujeres postmenopausicas (<55 años) ? K: nivel de confianza de 95% =1.96 : media esperada = 1050 mg/ml σ : desviación típica se asume que es 100 mg/ml w: imprecisión máxima aceptable es mg/ml

21 Ejemplo 5: Estimación de OR
¿ Qué tamaño de muestra se necesitaría en cada uno de los grupos de un estudio de casos-controles para estimar el OR con un IC de 0.95 ? : nivel de confianza de 95% =1.96 OR esperado = 2 p1 : proporción de expuestos en los controles = 0.30 p2 : proporción de expuestos en los casos = 0.46 w: imprecisión máxima aceptable es

22 Estimación de RR

23 Características, objetivos y diseño
Prevalencia de migraña en la población Estimación de parámetros poblacionales Promedio de las cifras de colesterol en la población infantil Riesgo relativo de padecer retinopatia en los diabéticos tipo I frente a los de tipo II Contraste de hipótesis Podría un programa de vacunación reducir la mortalidad infantil en más de un 15% Es diferente la eficacia analgésica de A en relación a B Diseño . Por bloques/ estratificado / Está asociada la microalbuminuria con las cifras de TA

24 Fórmula intuitiva (Variabilidad) (Tamaño del efecto) A N = K  B

25 Ejemplo : Pigmeos vs jugadores de basket (1)
140(5) Jugadores Basket 190(5)

26 Ejemplo : Pigmeos vs jugadores de basket (2)
140(10) Jugadores Basket 190(10)

27 Ejemplo : Pigmeos vs jugadores de basket (3)
Fórmula intuitiva A N = K  B Pigmeos 140(20) Jugadores Basket 190(20)

28 El tamaño de la muestra depende de...
Las características, objetivos y diseño del estudio La(s) variable(s) principal(es) y distribución de referencia La magnitud del efecto del tratamiento ( ó ) a detectar La variabilidad de la medida o imprecisión Contraste de hipótesis (pruebas de hipótesis) Los errores de Tipo I y II y el poder (,  y 1-) La tasa de retiradas del estudio y pérdidas de seguimiento Diseño . Por bloques/ estratificado /

29 Objetivos Eficacia (superioridad/no inferioridad) y/o Seguridad y tolerabilidad Determinación del perfil farmacocinético Biodisponibilidad relativa /bioequivalencia / Interacción con alimentos Búsqueda de dosis Eficacia y/o Seguridad en determinadas poblaciones (por edades, sexos, etc.) Dos parametros bioquímicos están asociados

30 Diseño (1) a) Paralelo randomizado FR: Fármaco de referencia

31 Diseño (2) b) Cruzado randomizado

32 Diseño (3) : Efecto diseño
Diseño paralelo versus cruzado DE Dif. Diseño Paralelo Cruzado 0.2 2.64 2 28 16 1 109 57 1.74 13 8 49 26 0.1 38 20 146 75 17 10 64 34

33 Diseño (4). Tipos de comparación entre tratamientos
Procedimiento Características, objetivos y diseño del estudio Diseño (4). Tipos de comparación entre tratamientos Superioridad E Equivalencia C No-inferioridad E C C E

34 Variable principal La hipótesis de trabajo se centra en una variable de interés que puede ser categórica o continua El teorema central del límite permite aproximar las distribución de la proporción o de las medias de todas las muestras posibles mediante la distribución normal cuando n> 30 sujetos En caso contrario se deben contemplar distribuciones como binomial exacta, la de Poisson, la de Student, etc

35 Variable principal: Ejemplos
Procedimiento Variable Principal de eficacia Variable principal: Ejemplos Porcentaje de pacientes que experimentan como mínimo un acontecimiento cardíaco: muerte por cualquier causa o infarto de miocardio agudo o revascularización Porcentaje de pacientes que experimentan una mejoría del dolor de cabeza a las dos horas de la administración del fármaco Valoración del dolor por el paciente mediante una Escala Analógica Visual (EAV) en mm; 0 = sin dolor, 100 = máximo dolor Presión arterial diastólica en mm de Hg

36 Si desconocemos la 2E, entonces 2 = 2C
La magnitud del efecto del tratamiento a detectar y variabilidad de los datos Magnitud del efecto del tratamiento a detectar ( ó ):  ó  =  E - C  donde, E es el efecto del tratamiento experimental y C es el efecto del tratamiento control o estándar Variabilidad de los datos (variabilidad = 2): 2 = 2E + 2C Si desconocemos la 2E, entonces 2 = 2C Magnitud -> Se trata de un criterio enteramente clínico y epidemilogico Variabilidad -> para cont y discretas

37 La magnitud del efecto del tratamiento a detectar : Efecto lupa
Diferencias reales diminutas Diferencias reales Diferencias reales gandes Magnitud : Se trata de un criterio enteramente clínico y epidemilogico

38 Contraste de hipótesis: clases
Bilateral (dos colas) Ho: E - C = 0 H1: E - C  0 Unilateral (una cola) Ho: E - C = 0 H1: E - C > 0 ó H1: E - C < 0

39 Los errores de Tipo I, II y el poder
Bilateral (dos colas) Ho: E - C = 0 H1: E - C  0 Error tipo I (): La probabilidad de rechazar la hipótesis nula siendo verdadera El valor del error tipo I ó  es igual o inferior a 0.05 (5%) Si C aumenta p{Error II} crece sii p{Error I} disminuye Si C disminuye p{Error II} decrece sii p{Error I} aumenta Error tipo II (): La probabilidad de aceptar la hipótesis nula siendo falsa El valor del error tipo II ó  es igual o inferior a 0.20 (20%)

40 Tasa de pérdidas de seguimiento
La tasa de pérdidas de seguimiento es el porcentaje de sujetos que abandonan el estudio La relación entre el tamaño de la muestra ajustado (n’) y la tasa de abandonos (d) es la siguiente: n n’ = 1 - d El tamaño de la muestra estimado se refiere a los pacientes disponibles para el análisis al final del estudio y no a los inicialmente incluidos. En enfermedades graves, se puede estimar un % de pérdidas del 10-20% con una alta dependencia por parte del paciente, mientras que en patologías más banales el número de pérdidas puede superar el 50%. Las retiradas del estudio, las pérdidas de seguimiento y os drop-in(administración de un tratamiento en estudio diferente al asignado por aleatorización o de un tratamiento o prohibido) han de preverse en el cálculo donde n es el tamaño de la muestra estimado

41 Tamaño de la muestra ¿Qué información se necesita para la estimación del tamaño de la muestra ? Magnitud del efecto del tratamiento a detectar () Variabilidad de las observaciones (2 ) Errores Tipo I y II ( y ) Relación: C  2 Tamaño de la muestra = ()2 El resultado de calcular el tamaño de la muestra es una estimación , ya que es imposible predecir los hallazgos reales del estudio que se diseña. Se parte por tanto de daos hipotéticos basados, en el mejor de los casos , en experiencias del pasado. Como todas estimación, está sujeta a error, cuya magnitud dependerá de la validez de los datos de referencia utilizados donde C es una función de  y : f(, )

42 Fórmulas : parámetros a decidir
=(E-C) es la diferencia clínicamente relevante entre tratamientos que se quiere detectar s2 es, normalmente, desconocida y es estimada en el momento del análisis. Sin embargo, debe ser estimada antes del inicio del estudio Los valores de  ( 0.05),  ( 0.20) y el poder (1-) ( 0.80) El criterio para establecer la magnitud de esta diferencia es enteramente clínico o epidemiolçogico. Por ejemplo, una reducción en la mortalidad de 5 unidades porcentuales (de un 20 en el control a un 15 en el experimental) representa una mejora importante desde el punto de vista clínico. Para detectar este diferencia como estadísticamente significativa se requerirían unos sujetos por grupo con los niveles de error habituales. Por otro lado, no resulta tan evidente que la reducción de una unidad porcentual en la mortalidad represente un beneficio terapéutico relevante. Por ejemplo, para pasar de 20% al 19% serían necesarios unos sujetos en cada grupo. Ejemplo estudio GUSTO, sobre la eficacia de la fibronólisi8s en el infarto de miocardio es un ejemplo de un estudio que necesitó de más de pacientes para demostrar como estadísticamente significativa una diferencia de mortalidad de poco menos de una unidad porcentual entre dos tratamientos trombolíticos.

43 Valores de f(, )

44 Fórmulas Comparación de medias : Comparación proporciones :
pE (1 - pE) + pC (1 - pC) n = f(, ) (pE - pC)2 Aproximación normal a la distribución binomial. Se puede utilizar este método cuando las proporciones se encuentran entre el 20-80% y tanto n*p como n*(1-p) son superiores a 5. n = número de sujetos por grupo de tratamiento

45 Fórmulas : distribución normal
Tratamiento experimental: E Tratamiento control: C E es la verdadera media de E es la estimación de E c es la verdadera media de C es la estimación de C es una estimación de (E - C) ~ N ((E - C), 2 2/n) s2 es la estimación de la verdadera varianza (variabilidad) entre pacientes en un mismo tratamiento (2) :

46 Ejemplo 6: Comparación de medias (dist. Normal)
Queremos comparar el cambio de la presión arterial de un nuevo fármaco frente a placebo. Esperamos encontrar una diferencia de 5 mmHg, con una desviación estándard de 10 mmHg ¿cuántos pacientes son necesarios para un ensayo con =0.05 bilateral y un poder de 1-=0.9? Bilateral (dos colas) Ho: E - C = 0 H1: E - C  0

47 Fórmulas : datos binarios (porcentajes)
pE (1 - PE) + pC (1 - PC) n = f(, ) (pE - pC)2 Tratamiento experimental: E Tratamiento control: C PE es la verdadera proporción de sujetos que presentan un determinado evento en E En la fórmulas, pE es la estimación de PE PC es la verdadera proporción de sujetos que presentan un determinado evento en C En la fórmulas, pC es la estimación de PC = (pE - pC) es una estimación de (PE - PC) s2 es la estimación de la verdadera varianza (variabilidad) entre pacientes en un mismo tratamiento (2) :

48 Ejemplo 7: Comparación de proporciones
Se está planteando un ensayo con estimulación eléctrica transcutánea (EET) para el alivio de dolor en pacientes con osteoartritis en base a resultados preliminares que obtuvieron un 25% de respuesta con placebo y un 65% con EET ¿cuántos pacientes son necesarios para un ensayo con =0.05 bilateral y un poder de 1-=0.9? Bilateral (dos colas) Ho: E - C = 0 H1: E - C  0 pE (1 - PE) + pC (1 - PC) n = f(, ) (pE - PC)2 0.65 (1 – 0.65) (1 – 0.25) n = (0.65 – 0.25)2

49 Ejemplo : magnitud del efecto
El tamaño de la muestra depende del valor de la magnitud del efecto  =E - C y 2 :

50 Ejemplo : Tasa de pérdidas de seguimiento
Si la tasa de pérdidas esperada es del 25%: 26990 n’ = = pacientes

51 K> 2 grupos a comparar (1)
¿Y si tenemos más de dos grupos comparar ? Existen varios métodos para el cálculo de la N NQuery 4.0 realiza cálculos de N para más de un grupo en determinados casos: Comparación de Medias Comparación de Proporciones NO realiza cálculos para Supervivencia, Asociación o Regresión Problema de la multiplicidad!!!

52 K> 2 grupos a comparar (2)
Habitualmente Bonferroni: Pero en realidad es: Pero tranquilos, no hay grandes diferencias!!!!

53 Software nQuery Advisor 4.0 Statistical Solutions
Se puede descargar un versión “Demo” Granmo IMIM Libre utilización ENE Servicios y Productos Bioestadísticos de GSK en España


Descargar ppt "Predeterminación del tamaño muestral"

Presentaciones similares


Anuncios Google