“Universo y muestra” “
Cuestiones preliminares Las decisiones relativas a la selección, como a cualquier etapa de la investigación dependen del problema que se aborde. Así como el problema de investigación representa el “algo” que se quiere estudiar, la unidad de análisis representa el “alguien”. Una “unidad de análisis” delimitada espacial y temporalmente constituye una población.
La representatividad en la selección El concepto de representatividad se asocia a las pretensiones de generalización de los resultados. Dos tipos de representatividad: 1. Estadística: posibilidad de generalizar los resultados a la población desde donde fue extraída la muestra. Se relaciona estrechamente con la investigación de corte cuantitativo. 2. Analítica: posibilidad de extrapolación al conjunto de teorías al que el (los) caso(s) se dirige(n). Se encuentra íntimamente vinculada a los llamados “estudios de caso” y así a la metodología cualitativa.
El problema de la representatividad estadística “Una muestra es representativa si reproduce – en una escala reducida- la población objeto del estudio” (Corbetta 2003:159) Es decir, la representatividad se juzga confrontando las características de la muestra con la población, de modo que si algún atributo es sensiblemente diferente esta muestra no será representativa. Sin embargo… ¿Qué es sensiblemente diferente? ¿Qué sucede con los otros atributos?
El problema de la representatividad estadística La representatividad debe ser probada y afirmada para cada atributo (variable) por separado. Solo se puede evaluar para variables cuya distribución en la población es conocida. La extracción aleatoria solo otorga garantías de representatividad en el sentido de no introducir sesgos en la muestra en la dirección de la distribución de la población y los intereses del investigador.
El problema de la representatividad analítica El concepto lo propone Znaniecki (1934) bajo la noción de “inducción analítica”. Sin embargo ha sido fuente de constantes criticas debido justamente a la arbitrariedad de criterios a la hora de la selección. Variados autores (Campbell, 1975 y Stake, 1994 entre otros) indican que más que generalización, lo que se pretende es “falsear generalizaciones” o bien establecer límites a ellas.
Las decisiones de selección Básicamente existen tres posibilidades: 1. Escoger al conjunto de la población para el estudio (censo o muestreo por saturación) 2. Escoger una muestra en base a criterios de representatividad estadística. 3. Escoger uno o más casos en base a criterios teóricos.
Muestreos probabilísticos Todos los casos tienen posibilidad de ser elegidos, y esta probabilidad es distinta de 0 Funcionan en base al azar Es necesaria la existencia de un marco muestral actualizado Aleatoria simple Sistemática Estratificada (con afijación proporcional o uniforme) Por etapas (polietapica) Entre otras
No es posible determinar la probabilidad de ser elegidos de los casos. Son muestras intencionadas. No permiten la generalización. Intencionada Oportunista Por bolo de nieve Por cuotas –Ésta es la única que permite la generalización estadística, aunque para tener el mismo poder que la probabilística su tamaño debe ser el doble que en éstas Muestreos no probabilísticos
Muestreos no probabilísticos Criterios para la selección de casos Regularmente se escogerán casos “ejemplificadores”, donde se debe buscar maximizar lo que potencialmente podemos aprender del caso y su accesibilidad. 1. Extremo o desviado: Casos inusuales en el marco de una teoría. 2. Máxima variación: selección de varios casos con criterio en su diferencia. 3. Crítico: Se encuentran presentes todas las características que se desean estudiar. 4. Paradigmáticos: Resaltan las características más generales de la sociedad. (Flyvbjerg 2004 en Marradi, Archenti y Piovani 2007)
Muestreos probabilísticos Tamaño de la muestra A la hora de estimar el tamaño de la muestra, debemos tener presente que existen dos tipos básicos de errores: Error tipo I: Ocurre cuando se afirma que existe diferencia y en realidad ésta no existe Error tipo II: Consiste en declarar que no hemos encontrado diferencias estadísticamente significativas cuando realmente si existen entre los grupos
Muestreos probabilísticos Tamaño de la muestra En los casos donde se busca la representatividad estadística, generalmente la muestra se calculará en base a la formula conocida: n ∞ = Z 2 ∙ σ 2 e 2 Si N < n ∞ (n ∞ -1) aplicamos: N = n ∞_____ 1+ n ∞ N Con: n ∞ : Tamaño de la muestra para poblaciones infinitas Z: Nivel de confianza estandarizado σ: Varianza poblacional e: Error muestral n: Tamaño de la muestra para el número de casos deseado N: Tamaño de la población
Muestreos probabilísticos Tamaño de la muestra O bien n= N ∙ Z 2 ∙ p ∙ q _ (N-1)e 2 + Z 2 ∙p ∙ q Donde: n: Tamaño de la muestra N: Tamaño de la población Z: Nivel de confianza estandarizado p: Posibilidad de éxito (1-q) q: Posibilidad de fracaso (1-p) e: Error muestral
Muestreos probabilísticos Tamaño de la muestra Métodos secuenciales de muestreo Consiste en la definición de umbrales, superados los cuales se detiene el experimento. Se efectúa los cálculos a medida que se van recogiendo casos y se evalúan los resultados obtenidos hasta ese momento. Para mantener la probabilidad global de error tipo I en un valor inferior al prefijado, es necesario utilizar un nivel de significación menor para cada paso. Un criterio para detener el estudio, suele ser cuando los datos acumulados hasta ese momento muestran una diferencia estadísticamente significativa (a un nivel de probabilidad tal que se garantiza el objetivo), o bien, continuar con el estudio hasta llegar a un tamaño máximo N, momento en el que se detendrá el estudio y se aceptará la hipótesis nula. El nivel de probabilidad a utilizar en cada paso depende del valor de N, cuanto mayor sea éste menor debe ser ese valor crítico.
Bibliografía recomendada Hernandez, R. ;Fernández C. ;Baptista, P. (1997) “Metodología de la Investigación”. Ciudad de México, Mc Graw Hill. Marradi, Archenti y Piovani (2007) “Metodología de las Ciencias Sociales”, Buenos Aires, Emecé
Diferencia entre la realidad y el enunciado ERROR El método científico considera que, ante la discrepancia entre la realidad y el enunciado, debe concederse más valor a la realidad
TIPOS DE ERROR Error aleatorio o de muestreo Error sistemático o sesgo (bias)
ERROR ALEATORIO Distorsión de la medición debida a la variabilidad del fenómeno que se mide
El Error Aleatorio se debe a: La Variabilidad de la variable (A mayor varianza mayor error aleatorio) El tamaño muestral “n” observado: Mientras mayor sea la muestra “n” menor será el error estándar ES de los estimadores (ES = / n ) ERROR ALEATORIO
EL ERROR ALEATORIO Es inherente a la variabilidad de la realidad. (Puede reducirse pero no eliminarse por completo) Afecta la validez interna del estudio pero menos que los sesgos
EL ERROR ALEATORIO SE CONTROLA: Aumentando el tamaño muestral Mejorando la eficiencia del diseño Garantizando la aleatoriedad de la muestra
Es la distorsión de la medición causada por el investigador ERROR SISTEMÁTICO Puede reducirse con un buen diseño El sesgo de Confusión (confounding) puede reducirse además en el análisis. Afecta gravemente la validez interna del estudio
Es el grado en que se reduce la incertidumbre debida al azar (error aleatorio) Una medida imprecisa puede desviarse del verdadero valor en cualquier dirección Es la falta de error sistemático (ausencia de sesgos) Capacidad de la prueba para generar mediciones que se acerquen al valor verdadero PRECISIÓN (PRECISE): Exactitud (Accuracy):
Es la desviación sistemática de la medición en una dirección determinada, que aleja los resultados del valor real. Los sesgos son originados por errores del diseño (No por el azar). Sesgo (Bias)...
TIPOS DE SESGOS Sesgo de selección Sesgo de autoselección Sesgo de autoselección Sesgo de confusión (confounding) Sesgo de clasificación (de diagnóstico o de información) Diferencial no diferencial
SESGO DE SELECCIÓN Error generado por el investigador al tomar muestras donde los participantes no tienen la misma probabilidad de exposición o desenlace que los demás elegibles. Las muestras no son representativas de los universos elegibles El criterio de muestreo no garantiza la aleatoriedad de las características
No ocurre con el Censo. Ocurre con muestras mal tomadas La relación entre Exposición y Daño no se da por igual en Participantes y No Participantes El efecto observado es una mezcla del efecto real y de la participación SESGO DE SELECCIÓN
SESGO DE CLASIFICACIÓN (DIAGNÓSTICO O INFORMACIÓN) Error introducido por el investigador cuando mide mal la variable en estudio
Según su origen, el sesgo de clasificación puede ser de tres tipos: Sesgo del Observado (de memoria) Sesgo del observador (investigador mal estandarizado) Sesgo del instrumento (instrumento defectuoso)
Según su ámbito de ocurrencia, el sesgo de clasificación puede ser de dos tipos: Diferencial: El error ocurre solo al medir uno de los grupos comparados No Diferencial: El error ocurre al medir en ambos grupos comparados
MALA CLASIFICACIÓN DIFERENCIAL La mala clasificación introduce diferencias en ambos grupos (Se intensifican las diferencias en ambos grupos) El resultado del estudio es impredecible
SESGO DE MEMORIA (O DE RECUERDO) Es un tipo de sesgo de clasificación Los grupos comparados recuerdan de manera diferente Especialmente importante en Casos y controles donde éstos suelen recordar menos la exposición
SESGO DEL OBSERVADOR - ENCUESTADOR Es un tipo de sesgo de clasificación El observador mide de manera diferente en ambos subgrupos
RANDOMIZACIÓN Es diferente de muestreo aleatorio Solo se da en estudios de intervención Consiste en asignar la intervención experimental al azar buscando una distribución idéntica de otras variables Es más efectivo en estudios grandes Implica mantener una Ocultación de la Secuencia de Aleatorización OSA
El equiparamiento es de dos tipos: Pareamiento individual (pareo) Para cada sujeto se selecciona entre uno y tres individuos “comparables” (1 a 1; 1 a 2; 1 a 3. Pareamientos mayores no agregan valor al diseño) Equiparamiento por frecuencias Para cada subgrupo se selecciona una muestra comparable de tamaño similar