Ámbito Geográfico. Población y Muestra. Tabulación y Análisis de Datos Universidad Nacional Mayor de San Marcos Doctorado en Ciencias de la Salud Seminario Nº 5 Diseño Metodológico : Ámbito Geográfico. Población y Muestra. Tabulación y Análisis de Datos Mag. Ivonne Bernuí Leo 01-08-2009
Ámbito Geográfico
Ámbito Geográfico Delimitación espacial del proyecto de investigación. Descripción del área de estudio donde recogerán los datos. Es importante delimitar el área a investigar: una ciudad, una calle, un país. Como regla general puede decirse que la descripción del área de estudio, debe contener todos los aspectos que la diferencian de otras áreas y que puedan ser de importancia al realizar la investigación y al interpretar los hallazgos. Se refiere a la delimitación espacial que tendrá el proyecto de investigación. Es la descripción del área de estudio donde recogerán los datos, se llevarán a cabo las actividades. Es importante delimitar el área a investigar: una ciudad, una calle, un país. En esta sección se deben incluir características como son[1]: Lugar donde se realizará la investigación (país, zona geográfica, área urbana o rural entre otros). Ubicación (delimitación geográfica). Tamaño (población, tamaño de la institución). Institución (hospital, centro de salud, escuela, entre otros). El contexto sociocultural tiene que ver con las características sociales, económicas, educativas y culturales de los integrantes de la población. Cuando se trata de investigaciones en ciencias sociales es muy importante determinar este contexto, que influye en muchos fenómenos sociales y psicológicos, y puede ser determinante a la hora de formular las preguntas del instrumento para interpretar los resultados. Eso no impide que el investigador pueda incluir otras características que estime conveniente para que se entienda el contexto en que se llevará a cabo la investigación. Como regla general puede decirse que la descripción del área de estudio, debe contener todos los aspectos que la diferencian de otras áreas y que puedan ser de importancia al realizar la investigación y al interpretar los hallazgos. [1] Pineda EB, de Alvarado EL. Metodología de la Investigación. 3ª edición. Serie Paltex Nº 47. Organización Panamericana de la Salud. 2008. pp. 172-3. Pineda EB, de Alvarado EL. Metodología de la Investigación. 3ª edición. Serie Paltex Nº 47. Organización Panamericana de la Salud. 2008. pp. 172-3.
Ámbito Geográfico Lugar (país, zona geográfica, área urbana o rural). Ubicación (delimitación geográfica). Tamaño (población, tamaño de la institución). Institución (hospital, centro de salud, escuela, entre otros). En esta sección se deben incluir características como son[1]: Lugar donde se realizará la investigación (país, zona geográfica, área urbana o rural entre otros). Ubicación (delimitación geográfica). Tamaño (población, tamaño de la institución). Institución (hospital, centro de salud, escuela, entre otros). El contexto sociocultural tiene que ver con las características sociales, económicas, educativas y culturales de los integrantes de la población. Cuando se trata de investigaciones en ciencias sociales es muy importante determinar este contexto, que influye en muchos fenómenos sociales y psicológicos, y puede ser determinante a la hora de formular las preguntas del instrumento para interpretar los resultados. Eso no impide que el investigador pueda incluir otras características que estime conveniente para que se entienda el contexto en que se llevará a cabo la investigación. Como regla general puede decirse que la descripción del área de estudio, debe contener todos los aspectos que la diferencian de otras áreas y que puedan ser de importancia al realizar la investigación y al interpretar los hallazgos. [1] Pineda EB, de Alvarado EL. Metodología de la Investigación. 3ª edición. Serie Paltex Nº 47. Organización Panamericana de la Salud. 2008. pp. 172-3. Pineda EB, de Alvarado EL. Metodología de la Investigación. 3ª edición. Serie Paltex Nº 47. Organización Panamericana de la Salud. 2008. pp. 172-3.
Población y Muestra cuantitativa usted deberá demostrar que sus resultados se sostienen por sí solos y no se han visto afectados por: Simple azar: deberá dar cuenta del nivel de confianza de sus resultados y los valores de "p" obtenidos, analizar la variabilidad de sus datos y características de su distribución. Inadecuada potencia: si sus resultados no cumplen sus expectativas: ¿Los hallazgos son reales o podrían originarse por una muestra reducida que no es capaz de expresar lo que realmente ocurre? Errores de medición y sesgos: deberá descartar o reconocer cuando ocurre error aleatorio o sistemático. Acción de una variable ajena a su estudio (confusora), a través de la cual se produce el efecto que usted observa, y que en la práctica no es tal.
Población Conjunto de individuos que guardan similitud entre sí en los aspectos que son relevantes para los objetivos de la investigación. Por limitaciones económicos y de tiempo; Falta de recurso humano calificado para realizar las observaciones o para obtener las mediciones necesarias y Dificultades geográficas y logísticas. La población o universo puede definirse como un conjunto de individuos que guardan similitud entre sí en los aspectos que son relevantes para los objetivos de la investigación. Entre las razones que limitan la medición en todos los sujetos de la población debe considerarse: las limitaciones económicos y de tiempo; la falta de recurso humano calificado para realizar las observaciones o para obtener las mediciones necesarias y las dificultades geográficas y logísticas. Por ello estas limitaciones pueden ser superadas estudiando a un sub-grupo de la población total llamada ‘muestra’. Por lo tanto la muestra se define como un sub-conjunto de la población, que permite inferir, estimar o extrapolar los resultados de la observación a la población[1]. [1] Ardila J, Rodríguez MN, Gil F. Capítulo 8: Población y Muestreo. En Ruiz AM, Morillo LE. Epidemiología Clínica. Editorial Médica Panamericana. Bogotá. Colombia. 2004. Ardila J, Rodríguez MN, Gil F. Capítulo 8: Población y Muestreo. En Ruiz AM, Morillo LE. Epidemiología Clínica. Editorial Médica Panamericana. Bogotá. Colombia. 2004.
MUESTRA Sub-conjunto de la población, que permite inferir, estimar o extrapolar los resultados de la observación a la población. Consecuencias de no tener el tamaño adecuado: Por defecto no podremos ser precisos al estimar los parámetros y además no encontraremos diferencias significativas cuando en la realidad sí existen. Por exceso, podríamos estudiar un número innecesario de pacientes. Pita S. Determinación del tamaño muestral serie [Metodología de la investigación]. Fisterra.com [Portal de internet]. 2001[último acceso 2009 junio 30]. Disponible http://www.fisterra.com/mbe/investiga/9muestras/9muestras.asp. Ardila J, Rodríguez MN, Gil F. Capítulo 8: Población y Muestreo. En Ruiz AM, Morillo LE. Epidemiología Clínica. Editorial Médica Panamericana. Bogotá. Colombia. 2004.
Calculo del tamaño de Muestra
Criterios Criterio: recursos disponibles (máximo tamaño posible); plan de análisis (mínimo tamaño deseable). Tamaño absoluto: N=100, n=30 (30%), pero si N=50000 y n=500 (1%) Muestra grande no necesariamente representativa. > variabilidad > tamaño. Si se planean comparaciones de grupos, asegurarse de 20 – 30 unidades por casilleros. Criterio: recursos disponibles (máximo tamaño posible); plan de análisis (mínimo tamaño deseable). Tamaño absoluto: N=100, n=30 (30%), pero si N=50000 y n=500 (1%) Muestra grande no necesariamente representativa. > variabilidad > tamaño. Si se planean comparaciones de grupos, asegurarse de 20 – 30 unidades por casilleros.
Existen varias fórmulas para determinar el tamaño de la muestra. Dos más comunes: Variable principal es una proporción. Variable principal es un promedio. Debemos conocer ciertas características de población ANTES de empezar el estudio.
Fórmula para Proporciones n = N z2 p q / d2 (N-1) + z2 p q n = Tamaño de muestra N = población z = nivel de confianza p = proporción estimada de la población q = 1 – p d = Precisión ó error máximo permisible Wayne, D. Bioestadística. Trad. 5ª ed. Ingles. Pag. 206
Tamaño de Muestra: Proporciones Universo : Niños < 6 años. PPJJ “Chavín Huantar” .VES Variable Principal: Prevalencia Retardo Crecimiento n = 360 * (1.96)2 * 0.38 * 0.62 2 (0.05)2 (360-1) + (1.96)2 * 0.38 * 0.62 n = 182 niños N = 360 z = 95% (1.96) p , prevalencia de Ret. Crec. = 38% q , prevalencia niños crec. Normal = 62% d = 5%
n = N z2 s2 / d2 (N-1) + z2 s2 n = Tamaño de muestra N = Población Fórmula para Medias n = N z2 s2 / d2 (N-1) + z2 s2 n = Tamaño de muestra N = Población z = nivel de confianza s2 = Varianza poblacional d = Precisión ó error máximo permisible Wayne, D. Bioestadística. Trad. 5ª ed. Ingles. Pag. 203
Tamaño de Muestra: Media Universo : Mujeres Socias de Comedores. Distrito Surco Variable Principal: Promedio de Consumo de Energía n = 608 * (1.96)2 * 625 = 144 100 * 607+ (1.96)2 * 625 n = Tamaño de muestra N = 608 z = 95% (1.96) s2 = 625 d = 10 Wayne, D. Bioestadística. Trad. 5ª ed. Ingles. Pag. 203
Fórmula para Comparar Proporciones n = Z *2p(1- p) + Z * p1(1- p1)+p2(1- p2) 2 (p1-p2)2 n = sujetos necesarios en cada uno de las muestras Z = Valor Z correspondiente al riesgo deseado Z b = Valor Z correspondiente al riesgo deseado p1 = Valor de la proporción en el grupo de control p2 = Valor de la proporción en el grupo de tratamiento. p = Media de las dos proporciones p1 y p2. Pita S. Determinación del tamaño muestral serie [Metodología de la investigación]. Fisterra.com [Portal de internet]. 2001[último acceso 2009 junio 30]. Disponible http://www.fisterra.com/mbe/investiga/9muestras/9muestras.asp.
Fórmula para Comparar Medias n = 2 ( Z + Z)2 *S2 d2 n = Tamaño de muestra Z = Valor Z correspondiente al riesgo deseado Z = Valor Z correspondiente al riesgo deseado s2 = Varianza poblacional d = Precisión ó error máximo permisible Pita S. Determinación del tamaño muestral serie [Metodología de la investigación]. Fisterra.com [Portal de internet]. 2001[último acceso 2009 junio 30]. Disponible http://www.fisterra.com/mbe/investiga/9muestras/9muestras.asp.
Tamaño muestral ajustado a las pérdidas Posibles pérdidas por pérdida de información, abandono, no respuesta Por lo que se debe incrementar el tamaño muestral respecto a dichas pérdidas. El tamaño muestral ajustado a las pérdidas se puede calcular: Muestra ajustada a las pérdidas = n (1 / 1–R) • n = número de sujetos sin pérdidas • R = proporción esperada de pérdidas Así por ejemplo si se calculó 48 como tamaño de muestra y se espera tener un 15% de pérdidas el tamaño muestral necesario seria: 48 (1 / 1-0.15) = 56 pacientes en cada grupo.
Tipos de Muestreo
Tipo de muestreo más importante que tamaño de muestra Fuente:
Cuatro Muestras Diferentes de UNIVERSO = 15 personas Cuatro Muestras Diferentes de 2, 3, 5, 10 personas 2 6 12 n Naranjas/ per cap/ mes x 2 6, 14 10 3 16, 18, 8 14.0 5 26, 14, 18, 2, 28 17.6 22,16,24,22,8,14,28,20, 2 15.8 18 30 20 10 8 22 14 26 24 16 4 Media Poblacional= 16 naranjas ⁄ mes
Fuente: TIPOS DE MUESTREO PROBABILISTICO NO PROBABI- LISTICO Estrati- ficado Aleatorio Simple Por cuotas Por conve- niencia Sistemático Deliberado Conglo- merado Fuente:
Cuenta con un Marco Muestral Probabilístico TODOS elementos universo misma probabilidad de ser seleccionados Muestreo Aleatorio Simple: cada unidad de muestreo tiene la misma probabilidad de ser escogida. Ejemplo: Se tiene una lista de 100 alumnos ordenados del 1 al 100 y se tiene que seleccionar 5 alumnos. Se colocan 100 papelitos con números del 1 al 100 en una caja, se “chocolean” y se seleccionan cinco números. Es sencillo de fácil comprensión. Pero requiere de una LISTA completa de toda la población (marco muestral). Argimon JM & Jiménez J. Métodos de investigación. Clínica y Epidemiológica. 2da. Ed.Harcourt. Madrid. 1999 Muestreo Aleatorio Sistemático: se basa en aplicar una regla sistemática simple, como elegir uno de cada n individuos. Ejemplo: Tenemos una población de 1000 H C y deseamos seleccionar una muestra 200 HC. k= 1000/200=5 Se escoge una de cada 5 La primera historia se elige aleatoriamente entre los números del 1 a 5. Si la elegida es 2, la siguientes serán: 7, 12, 17, 22, 27, 32, etc. Hasta completar las 200 HC Fácil de aplicar. Si constante está asociada a variable de interés puede haber sesgo. Pasos a seguir: Se calcula la constante del muestreo (k) y se divide el total de la población candidata entre el tamaño de muestra deseado. Se extrae la primera unidad al azar entre las k primeras unidades de muestreo y se le suma la constante de forma sucesiva hasta completar el tamaño de muestra.
Muestreo sistemático Se basa en aplicar una regla sistemática simple, como elegir uno de cada ‘n’ individuos. http://www2.uiah.fi/projekti/metodi/252.htm Ejemplo: Tenemos una población de 1000 H C y deseamos seleccionar una muestra 200 HC. k= 1000/200=5 Se escoge una de cada 5 La primera historia se elige aleatoriamente entre los números del 1 a 5. Si la elegida es 2, la siguientes serán: 7, 12, 17, 22, 27, 32, etc. Hasta completar las 200 HC
POBLACION
Estratificado por un Factor Modificación del MAS, para que la muestra presente misma distribución que la población en relación a determinadas variables. Estimaciones más precisas. Población se divide en estratos en función de las categorías de la (s) variable (s). Se forman sub-grupos que son mutuamente excluyentes. Requiere: Conocer en población distribución de las variables de estratificación. Marco Muestral
Estratificado por 2 factores Ejemplo: Listado de 2000 personas con HTA, y se necesitan 250 personas. Se conoce que la HTA varía en función del sexo y presencia de obesidad. Población Hombres Mujeres Total Obesidad 240 (12%) 320(16%) 560(28%) No obesidad 960 (48%) 480 (24%) 1440(72%) Muestra Hombres Mujeres Total Obesidad 30 (12%) 40(16%) 70(28%) No obesidad 120(48%) 60 (24%) 180(72%)
MUESTREO ALEATORIO ESTRATIFICADO Modificación del MAS, para que la muestra presente misma distribución que la población en relación a determinadas variables. Estimaciones más precisas. Población se divide en estratos en función de las categorías de la (s) variable (s). Se forman sub-grupos que son mutuamente excluyentes. Requiere: Conocer en población distribución de las variables de estratificación. Marco Muestral Ejemplo: Listado de 2000 personas con HTA, y se necesitan 250 personas. Se conoce que la HTA varía en función del sexo y presencia de obesidad. Población Hombres Mujeres Total Obesidad 240 (12%) 320 (16%) 560 (28%) No obesidad 960 (48%) 480 (24%) 1440 (72%) Muestra Hombres Mujeres Total Obesidad 30 (12%) 40 (16%) 70 (28%) No obesidad 120 (48%) 60 (24%) 180 (72%)
Por conglomerados Objetivo: seleccionar muestras cuando no se tiene un listado de individuos Procedimiento: se seleccionan grupos de unidades (conglomerados) y se muestrean unidades de los conglomerados seleccionados. La selección se hace entre unidades muestrales en vez de hacerla directamente entre personas. Se emplea cuando: Población es grande y dispersa. O se carece de marco muestral. Puede ser bietápico (unidades primarias, secundarias), multietápico (u. primarias, secundarias, terciarias, etc.) . Económico y práctico Estimaciones menos precisas que Muestreo Aleatorio Simple o M. Estratificado. Even when a list of individual houses is available, economic considerations may point to the choice of a larger cluster unit. For a given size of sample, a small unit usually gives more precise results than a large unit. For example a SRS of 600 houses covers a town more evenly than 20 city blocks containing an average of 30 houses apiece. But greater field costs are incurred in locating 600 houses and in traveling between them than in covering 20 city blocks. When cost is balanced against precision, the larger unit may prove superior. Important things about cluster sampling: Most large scale surveys are done using cluster sampling; Clustering may be combined with stratification, typically by clustering within strata; In general, for a given sample size n cluster samples are less accurate than the other types of sampling in the sense that the parameters you estimate will have greater variability than an SRS, stratified random or systematic sample.
Instituciones Educativos Ejemplo: Evaluación Antropométrica en Escolares de Lima Metropolitana Muestreo por etapas: UGEL (UPM) Unidad Primaria Muestreo Instituciones Educativos (USM) U. Secundaria Muestreo AULAS (UTM) U. Terciaria Muestreo ESCOLARES Unidad de Análisis
Estructura típica de un diseño muestral de hogares Característica Posible definición Estrato Regiones Tipo de comunidad U Primaria Secciones censales Pueblos en áreas rurales Manzanas en áreas urbanas U Secundaria Viviendas U Terciaria Miembros de las viviendas U observación Individuos
Muestro No probabilístico, por conveniencia Elección de los elementos depende de las causas relacionadas con las características de la investigación. se desconoce la probabilidad de elección de cada unidad o elemento del universo No se puede estimar el error muestral, no se pueden hacer inferencias.
Muestro No probabilístico, por conveniencia Selección depende de características relacionadas con la investigación. Se desconoce la ‘p’ de elección de cada unidad del universo No se puede estimar el error muestral, no se pueden hacer inferencias. Es útil para los estudios piloto. en los cuales la elección de los elementos depende de las causas relacionadas con las características de la investigación. También es conocido como muestreo por conveniencia, se desconoce la probabilidad de elección de cada unidad o elemento del universo. Es útil para los estudios piloto en los cuales la meta sólo es tener una impresión general de la forma en que ciertas variables se distribuyen en la población. También se utiliza en los estudios cualitativos. Según Patton (1990) citado por Pineda[1] existen diferentes tipos de muestreo : [1] Pineda EB, de Alvarado EL. Op cit pag. 138-9. Pineda EB, de Alvarado EL. Op cit pag. 138-9.
Muestro No probabilístico, por conveniencia Muestreo de casos extremos o inusuales. Muestreo de máxima variabilidad Muestras homogéneas Muestreo de casos típicos Muestreo de informantes clave. Pineda EB, de Alvarado EL. Op cit pag. 138-9.
Muestreo por avalancha / cadena / bola de nieve http://www2.uiah.fi/projekti/metodi/252.htm
Compromiso entre lo deseable y lo viable
Recolección datos Carolina Blossiers