La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Aspectos relevantes en el diseño y análisis de las encuestas de salud pública. María del Mar Rueda García Dpto. de Estadística e I.O. Universidad de Granada.

Presentaciones similares


Presentación del tema: "Aspectos relevantes en el diseño y análisis de las encuestas de salud pública. María del Mar Rueda García Dpto. de Estadística e I.O. Universidad de Granada."— Transcripción de la presentación:

1 Aspectos relevantes en el diseño y análisis de las encuestas de salud pública. María del Mar Rueda García Dpto. de Estadística e I.O. Universidad de Granada

2 Las encuestas de salud pública Son un elemento esencial para la toma de decisiones Son un elemento esencial para la toma de decisiones Proporcionan conocimiento Proporcionan conocimiento - Situación epidemiológica - Tendencias de salud - Hábitos de vida - Utilización de servicios sanitarios

3 Objetivos Monotorizar las tendencias en la salud percibida, los hábitos de vida y la utilización de servicios sanitarios Monotorizar las tendencias en la salud percibida, los hábitos de vida y la utilización de servicios sanitarios Identificar los principales grupos de riesgo en la salud, en los hábitos de vida y en el acceso a los servicios sanitarios. Identificar los principales grupos de riesgo en la salud, en los hábitos de vida y en el acceso a los servicios sanitarios.

4 Principales aspectos en las encuestas de salud pública Diseño muestral Diseño muestral Inferencia Inferencia Estimación de las varianzas Estimación de las varianzas Tratamiento de datos faltantes Tratamiento de datos faltantes Software para el análisis de los datos Software para el análisis de los datos

5 Diseño muestral Se determina atendiendo a objetivos primarios de la encuesta objetivos primarios de la encuesta restricciones económicas, temporales y materiales restricciones económicas, temporales y materiales tamaño y características de la población bajo estudio tamaño y características de la población bajo estudio

6 Diseños muestrales d=(S,p) p:S R s=(i 1,i 2,…,i n(s) ) 0

7 Principales diseños usados en encuestas de salud Muestreo por conglomerados Muestreo por conglomerados Muestreo estratificado Muestreo estratificado Muestreo sistemático Muestreo sistemático Muestreo con probabilidades proporcionales al tamaño Muestreo con probabilidades proporcionales al tamaño Diseños muestrales complejos Diseños muestrales complejos Muestreo de unidades raras Muestreo de unidades raras

8 Muestreo estratificado Procedimiento: Dividir la población en estratos disjuntos (ciudades, pueblos, distritos, áreas rurales,…) y seleccionar en cada uno una muestra Razones: Poder hacer estimaciones separadas en cada estrato, asegurar la representación de todos los estratos, menor error,…

9 Muestreo por conglomerados Objetivo: seleccionar muestras cuando no se tiene un listado de individuos Objetivo: seleccionar muestras cuando no se tiene un listado de individuos Procedimiento: se seleccionan grupos de unidades (conglomerados) y se muestrean unidades de los conglomerados seleccionados Procedimiento: se seleccionan grupos de unidades (conglomerados) y se muestrean unidades de los conglomerados seleccionados

10 Muestreo polietápico Procedimiento: seleccionar una muestra de conglomerados (UP) y dentro de éstos seleccionar otra muestra de elementos (US). Dentro de las US se muestrean otros elementos (UT)… Uso: Es más barato y sólo necesita un marco de las unidades seleccionadas en cada etapa.

11 Muestreo bietápico Muestreo por conglomerados Muestreo trietápico

12 Muestreo sistemático Problema: no se tiene un listado de las unidades, no se conoce el tamaño de la población, es difícil localizar las unidades,… Procedimiento: Se elige un número aleatorio i, y se analizan las unidades: i,i+k,i+2k,…i+(n-1)k

13 Hogares como unidades de muestreo El listado es fácil de obtener El listado es fácil de obtener Las unidades dentro del hogar son heterogéneas (sexo, edad,…) Las unidades dentro del hogar son heterogéneas (sexo, edad,…) La información se obtiene a partir de La información se obtiene a partir de -una unidad representativa -una unidad representativa - una unidad muestreada (Kish grid) - una unidad muestreada (Kish grid)

14 Muestreo estratificado polietápico de hogares Se utilizan para elaborar el marco y agrupar entrevistadores de forma que el coste sea pequeño Se utilizan para elaborar el marco y agrupar entrevistadores de forma que el coste sea pequeño Es el diseño más usado tanto en países desarrollados como en vías de desarrollo. Es el diseño más usado tanto en países desarrollados como en vías de desarrollo.

15 Estructura típica de un diseño muestral de hogares característica Posible definición EstratoRegiones Tipo de comunidad U Primaria Secciones censales Pueblos en áreas rurales Manzanas en áreas urbanas U Secundaria Viviendas U Terciaria Miembros de las viviendas U observación Individuos

16 National Health Interview Survey (EEUU) Población marco: mujeres años que viven en hogares. Población marco: mujeres años que viven en hogares UPs (pueblos o conjuntos de éstos) 1900 UPs (pueblos o conjuntos de éstos) UP se estratificaron usando variables socioeconómicas y demográficas. UP se estratificaron usando variables socioeconómicas y demográficas. Se seleccionan 198 UP con probabilidades proporcionales al tamaño dentro de cada estrato. Se seleccionan 198 UP con probabilidades proporcionales al tamaño dentro de cada estrato. Dentro de cada UP se selecciono una muestra de manzanas (US) Dentro de cada UP se selecciono una muestra de manzanas (US) Dentro de cada US se selecciona una muestra de aprox. 8 hogares (UT) Dentro de cada US se selecciona una muestra de aprox. 8 hogares (UT) hogares en la muestra hogares en la muestra

17 Tetanus toxoid inmunization sample survey BURUNDI (World Health Organization) Estrato 1: Bujumbura (estrato urbano) Estrato 1: Bujumbura (estrato urbano) Estrato 2: resto del pais (estrato rural) Estrato 2: resto del pais (estrato rural) UP (areas geográficas) en cada estrato con probabilidades proporcionales al tamaño UP (areas geográficas) en cada estrato con probabilidades proporcionales al tamaño US viviendas con probabilidades iguales US viviendas con probabilidades iguales Todas las mujeres de la vivienda nacidas en el último año son seleccionadas Todas las mujeres de la vivienda nacidas en el último año son seleccionadas

18 Muestreo de unidades poco frecuentes. Obtener estimaciones con precisión satisfactoria suele ser muy costoso Obtener estimaciones con precisión satisfactoria suele ser muy costoso Ejemplo: m.a.s. Ejemplo: m.a.s. P=0.02, n=800 error relativo=50% P=0.02, n=800 error relativo=50% P=0.02, n=80000 error relativo=5% P=0.02, n=80000 error relativo=5% Diseños muestrales usados: Muestreo inverso, muestreo de redes, muestreo dual, muestreo en bola de nieve Diseños muestrales usados: Muestreo inverso, muestreo de redes, muestreo dual, muestreo en bola de nieve

19 Muestreo inverso Fija de antemano el número de unidades raras a incluir en la muestra. Fija de antemano el número de unidades raras a incluir en la muestra. Se continúa el muestreo hasta completar dicho número cualquiera que sea el tamaño total de la muestra Se continúa el muestreo hasta completar dicho número cualquiera que sea el tamaño total de la muestra

20 Muestreo en bola de nieve seleccionar una muestra inicial de n individuos de forma probabilística seleccionar una muestra inicial de n individuos de forma probabilística en cada entrevista cada individuo nombra a otros K nuevos individuos de la población en estudio que han de entrevistarse. en cada entrevista cada individuo nombra a otros K nuevos individuos de la población en estudio que han de entrevistarse. inmigrantes, minorías étnicas, personas con dificultades o marginados inmigrantes, minorías étnicas, personas con dificultades o marginados

21 Ejemplo: En una encuesta destinada a estudiar la ocurrencia de una rara enfermedad se selecciona una muestra aleatoria de centros médicos. De los registros de cada centro médico de la muestra, se obtienen los ficheros de los pacientes tratados en el centro de esa enfermedad. No obstante un paciente dado puede haber sido tratado por más de un centro. Cuanto mayor sea el número de centros en los cuales haya sido tratado un enfermo, más probabilidad tiene éste de pertenecer a la muestra. Muestreo de nexos (network sampling )

22 Se selecciona una muestra aleatoria de unidades de selección, y todas las unidades de observación que están asociadas con cada unidad seleccionada se incluyen en la muestra y son observadas. La multiplicidad del individuo es el número de unidades de selección al cual está ligado. Se define un nexo como el conjunto de unidades de observación con un determinado patrón de ligadura. Uso: por la imposibilidad de realizar un muestreo convencional

23 Muestreo dual La estimación se realiza a partir de dos encuestas independientes La estimación se realiza a partir de dos encuestas independientes SINO SIx12x1 NO x2 Encuesta 2 Encuesta 1Encuesta 1 N~ x1*x2/x12

24 Inferencia Formulación de resultados acerca de la población completa en base a la parte seleccionada Inferencia basada en el diseño (la aleatorización proviene del diseño muestral) Inferencia basada en el diseño (la aleatorización proviene del diseño muestral) Inferencia basada en el modelo (la aleatorización proviene del modelo estocástico) Inferencia basada en el modelo (la aleatorización proviene del modelo estocástico)

25 Tipos de análisis Estudios descriptivos Estudios descriptivos - parámetros fijos - parámetros fijos - basada en el diseño - basada en el diseño Estudios analíticos Estudios analíticos - relaciones complejas (asociación, causalidad,…) - relaciones complejas (asociación, causalidad,…)

26 Estudios descriptivos - Media de una variable Y = U y i /N - Total de una variable T = U y i - Proporción de individuos que presentan una característica. P= U A i /N P= U A i /N

27 Estimador de Horvitz- Thompson d= (S d, p d ) diseño muestral d= (S d, p d ) diseño muestral π i = p(i sea seleccionada) Propiedades: Insesgado, tiene un estimador simple de su varianza, es admisible, consistente, …

28 El uso de información auxiliar Sea y= variable objeto de estudio Sea y= variable objeto de estudio Sea x= variable auxiliar que está relacionada con la variable y. Sea x= variable auxiliar que está relacionada con la variable y. y, x x U s

29 La información auxiliar se puede utilizar La información auxiliar se puede utilizar - en la fase de selección (muestreo estratificado, m. con probabilidades desiguales) - en la fase de selección (muestreo estratificado, m. con probabilidades desiguales) - en la fase de estimación - en la fase de estimación

30 Estimadores indirectos Sea T x conocido, en la muestra s se observan y, x. Sea T x conocido, en la muestra s se observan y, x. Si c=1 estimador de diferencia Si c=T y /T x =R estimador de razón Si c=b= coef. De regresión, estimador de regresión

31 La calibración consiste en sustituir, en el estimador de H-T, dk, por otros pesos k, tan cercanos como sea posible, con respecto a una métrica dada, a dk y respetando la ecuación de calibración : Estimadores de calibración.

32 Estimador de calibración ESTIMADOR DE REGRESIÓN GENERALIZADO (Cassel, Särndal y Wretman,1976)

33 Estimadores de verosimilitud empírica (Chen y Qin, 1993) Consiste en sustituir, en el estimador de H-T, dk, por otros pesos p k que se obtienen maximizando la función de verosimilitud empírica sujeta a las restricciones Σ s p i =1Σ s p i u i =0Σ u u i /N =0 T VE =Σ s p i y i

34 Ejemplo Estudio sobre la mortalidad por cáncer de mama en los estados de Carolina y Georgia Estudio sobre la mortalidad por cáncer de mama en los estados de Carolina y Georgia Variable a estudio: número de muertes por cáncer de mama Variable a estudio: número de muertes por cáncer de mama Variable auxiliar: número de mujeres adultas en la población Variable auxiliar: número de mujeres adultas en la población

35 nEstima Horvitz-T11111 Razón Hartley-R GREG Calibración Ver. Empir Cocientes entre las varianzas de los estimadores indirectos de la media respecto al estimador de Horvitz-Thompson

36 nEstima directo11111 Razón Chambers Diferencia Calibración Ver. Empir Cocientes entre las varianzas de los estimadores indirectos de la mediana respecto al estimador directo

37 Estudios analíticos Contraste de significación de proporciones Contraste de significación de proporciones H o : p1-p2=0 H1: p1-p2<>0 H o : p1-p2=0 H1: p1-p2<>0 Regresión Regresión y N = X N β + ε N y N = X N β + ε N Análisis categórico de datos Análisis categórico de datos tabla de contingencia a x b tabla de contingencia a x b

38 Contraste de significación de proporciones H 0 : p 1 -p 2 =0 H 1 : p 1 -p 2 <>0 H 0 : p 1 -p 2 =0 H 1 : p 1 -p 2 <>0 - M odelo superpoblación pob.1. I i i.i.d. pob.2. J i i.i.d. Independie. pob.2. J i i.i.d. Independie. - Problemas potenciales: mala especificación del modelo y la muestra no representa la distribución - Consecuencias: los estimadores son sesgados y los errores incorrectos

39 Contraste de significación de proporciones Aproximación basada en el diseño Aproximación basada en el diseño 1 fase produce la población finita 2 fase produce la muestra Se considera el mismo modelo de superpoblación D HT = p1 HT -p2 HT es diseño insesgado de D V(D HT ) puede ser estimada insesgadamente por el estimador basado en el diseño Los estimadores son robustos

40 Determinación del tamaño muestral. Tipo de análisis empleado Tipo de análisis empleado El nivel de precisión requerida El nivel de precisión requerida Homogeneidad de la población Homogeneidad de la población Información disponible Información disponible Diseño muestral usado Diseño muestral usado

41 Errores en las encuestas Es la diferencia entre el valor estimado y el parámetro desconocido: ׀est -θ ׀ Es la diferencia entre el valor estimado y el parámetro desconocido: ׀est -θ ׀ Tipos: Errores de muestreo Errores ajenos al muestreo Errores ajenos al muestreo

42 Errores de muestreo Son los debidos a haber analizado sólo una parte de la población Son los debidos a haber analizado sólo una parte de la población Se define como V(est) 1/2 Se define como V(est) 1/2 Se puede determinar el error que se comete con un muestra concreta Se puede determinar el error que se comete con un muestra concreta Se puede fijar de antemano y seleccionar el tamaño de muestra necesario para obtener ese error máximo Se puede fijar de antemano y seleccionar el tamaño de muestra necesario para obtener ese error máximo

43 Estimación de errores muestrales permite decidir acerca del grado de validez o confianza de los datos en relación con el uso que se va a hacer de ellos. permite decidir acerca del grado de validez o confianza de los datos en relación con el uso que se va a hacer de ellos. Parametro ParametroDiseño lineal lineal No lineal No lineal simpleab complejocd

44 Estimación de errores muestrales a- Expresión algebraica de la varianza a- Expresión algebraica de la varianza Aproximación lineal (Taylor) Aproximación lineal (Taylor) b,c,d Replicación de muestras b,c,d Replicación de muestras Exploración intensiva de muestras Exploración intensiva de muestras grupos aleatorios, semimuestras bootstrap, jackknife

45 Errores ajenos al muestreo Tienen lugar tanto en censos como en muestras Tienen lugar tanto en censos como en muestras Son debidos a muchos factores: falta de respuesta, recogida, registro y procesamiento incorrecto de los datos, marcos imperfectos, errores de campo, errores de respuesta… Son debidos a muchos factores: falta de respuesta, recogida, registro y procesamiento incorrecto de los datos, marcos imperfectos, errores de campo, errores de respuesta… Imposible cuantificarlos en su totalidad Imposible cuantificarlos en su totalidad Su tratamiento es muy caro Su tratamiento es muy caro Suelen ser el principal problema de las encuestas Suelen ser el principal problema de las encuestas

46 Tipos de errores ajenos al muestreo sobrecobertura sobrecobertura De observación medida De observación medida procesamiento procesamiento De no observación cobertura De no observación cobertura falta de respuesta falta de respuesta

47 Tratamiento de la falta de respuesta Primario: Encuestas repetidas, encuestas delegadas, sustitución de unidades, uso de incentivos, método de Kish y Hace,… Primario: Encuestas repetidas, encuestas delegadas, sustitución de unidades, uso de incentivos, método de Kish y Hace,… En la fase de campo: métodos de Hansen y Hurvitz, de Politz y Simmons, de Demming, respuesta aleatorizada,… En la fase de campo: métodos de Hansen y Hurvitz, de Politz y Simmons, de Demming, respuesta aleatorizada,… En la fase de procesamiento: métodos gráficos, de Platek, de Thompsen, … En la fase de procesamiento: métodos gráficos, de Platek, de Thompsen, … En la fase de análisis: Imputación (de registro donante, de regresión, probabilística, múltiple), formulación de estimadores con datos parcialmente faltantes. En la fase de análisis: Imputación (de registro donante, de regresión, probabilística, múltiple), formulación de estimadores con datos parcialmente faltantes.

48 Software para el análisis de encuestas por muestreo De propósito general ( C, Visual basic, fortran, matlab, hojas de cálculo,…) De propósito general ( C, Visual basic, fortran, matlab, hojas de cálculo,…) De aplicaciones estadísticas (SPSS, Statgraphics, SAS, Splus, R,…) De aplicaciones estadísticas (SPSS, Statgraphics, SAS, Splus, R,…) Específico de muestreo (Sudaan, PcCarp, Wesvar, survey…) Específico de muestreo (Sudaan, PcCarp, Wesvar, survey…)

49 Software de muestreo Obtención de muestras desde diseños muestrales Obtención de muestras desde diseños muestrales Cálculos asociados al proceso de estimación Cálculos asociados al proceso de estimación

50 Comparativa Diseños muestrales disponibles Diseños muestrales disponibles Métodos de estimación de la varianza Métodos de estimación de la varianza Análisis estadísticos realizados Análisis estadísticos realizados Apariencia Apariencia Disponibilidad y precios Disponibilidad y precios

51 Recomendaciones Es necesario el uso de un software específico para el análisis de datos de muestras complejas. Es necesario el uso de un software específico para el análisis de datos de muestras complejas. Si ya se utiliza previamente un software general que incluya la estimación usando el diseño muestral o tenga algún modulo optativo, utilizar dicho software.(Stata, SAS, Epi Info, SPSS) Si ya se utiliza previamente un software general que incluya la estimación usando el diseño muestral o tenga algún modulo optativo, utilizar dicho software.(Stata, SAS, Epi Info, SPSS) Si el software usado no lo incluye hay que considerar un software especializado (SUDAAN, WESVAR, PC-CARP, CENVAR) Si el software usado no lo incluye hay que considerar un software especializado (SUDAAN, WESVAR, PC-CARP, CENVAR)

52 Recomendaciones Para pequeños usuarios usar un programa gratuito (Epi Info, CENVAR, WESVAR 2, R) Para pequeños usuarios usar un programa gratuito (Epi Info, CENVAR, WESVAR 2, R) Para grandes empresas, institutos de estadística, centros de estudios, … Para grandes empresas, institutos de estadística, centros de estudios, … - adquirir una licencia (WESVAR, PC-CARP, STATA, SUDAAN, SAS) - adquirir una licencia (WESVAR, PC-CARP, STATA, SUDAAN, SAS) -utilizar su propio código -utilizar su propio código

53 PROBLEMAS RELACIONADOS CON LOS MEDICAMENTOS EN LOS USUARIOS DEL SERVICIO DE URGENCIAS Instituto de Salud Carlos III

54 Gracias por su atención


Descargar ppt "Aspectos relevantes en el diseño y análisis de las encuestas de salud pública. María del Mar Rueda García Dpto. de Estadística e I.O. Universidad de Granada."

Presentaciones similares


Anuncios Google