La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

TECNICAS DE MUESTREO HERNANDEZ ALFARO ROMAN MARTINEZ SANCHEZ RAFAEL

Presentaciones similares


Presentación del tema: "TECNICAS DE MUESTREO HERNANDEZ ALFARO ROMAN MARTINEZ SANCHEZ RAFAEL"— Transcripción de la presentación:

1 TECNICAS DE MUESTREO HERNANDEZ ALFARO ROMAN MARTINEZ SANCHEZ RAFAEL
NO RESPUESTA TECNICAS DE MUESTREO HERNANDEZ ALFARO ROMAN MARTINEZ SANCHEZ RAFAEL

2 INDICE Introducción Efectos de la no-respuesta Tipos de no respuesta
Ausencia de respuesta total Métodos de ponderación para la ausencia de respuesta Reentrevista Un modelo matemático ¿Qué es una tasa de respuesta aceptable? Conclusiones Bibliografía

3 INTRODUCCION La mejor manera de enfrentar la ausencia de respuesta es prevenirla. Ante la ausencia de respuesta es posible, modelar los datos faltantes, pero predecir esos datos nunca es tan bueno como observarlos de primera mano. Las personas que no responden con frecuencia difieren de manera crucial de las personas que si lo hacen.

4 INTRODUCCION Si la tasa de no respuesta no es despreciable, la inferencia basada tan sólo en quienes contestaron puede tener fallas serias. Podemos tener no respuesta de la siguiente manera: no respuesta por unidad (falta toda la unidad de observación) y no respuesta por elemento (falta al menos un individuo).

5 INTRODUCCION Por ejemplo en una encuesta de personas, la no respuesta por unidad significa que la persona no proporciona información para la encuesta; la ausencia de respuesta por elemento significa que la persona no responde a un punto particular del cuestionario.

6 INTRODUCCION Haremos un análisis a grandes rasgos de cómo enfrentar la no respuesta de la siguiente manera: Prevención. Diseño de la encuesta de modo que la ausencia de respuesta sea pequeña. Extraer una submuestra representativa de quienes no responden; y utilizarla para establecer inferencias acerca de quienes no contestaron. Utilizar modelos para predecir u observar como se comportan los valores de quienes no responden.

7 EFECTOS POR IGNORAR LA AUSENCIA DE RESPUESTA
Thomsen y Siring (1983) reportaron los datos de una encuesta de 1969 acerca del comportamiento electoral, realizada por la Oficina Central de Estadística de Noruega. En esta investigación, después de tres llamadas telefónicas se enviaba un cuestionario por correo. La tasa final de no-respuesta fue de 9.9%, que generalmente se considera pequeña. ¿Diferían las personas que no contestaron de las que sí?

8 EFECTOS POR IGNORAR LA AUSENCIA DE RESPUESTA
Edad Todos 20-24 25-29 30-49 50-69 70-69 Personas que no contestaron 71 59 56 72 78 74 Muestra seleccionada 88 81 84 90 91 En el registro de votantes de Noruega era posible determinar si una persona había votado. El porcentaje de electores que votaron se podía comparar entre quienes contestaron la encuesta y quienes no.

9 EFECTOS POR IGNORAR LA AUSENCIA DE RESPUESTA
La diferencia en la tasa de votación entre quienes no contestaron y la muestra seleccionada era más grande en los grupos de menor edad. Entre quienes no contestaron, la tasa de votación varió con el tipo de ausencia de respuesta. La tasa global de votación para las personas que se rehusaron a participar fue de 81%, la tasa de votación para quienes no estaban en casa fue de 65% y la tasa de votación para quienes padecían enfermedades mentales y físicas fue de 55%, lo que implica que la ausencia o la enfermedad fueron las principales causas del sesgo por no-respuesta.

10 EFECTOS POR IGNORAR LA AUSENCIA DE RESPUESTA
Se ha demostrado que la no respuesta puede tener grandes efectos en los resultados de una encuesta; en el ejemplo una tasa de no-respuesta de menos de 10% condujo a una sobreestimación de la tasa de votación de Noruega. Incrementar el tamaño de la muestra sin enfrentar la no-respuesta no reduce el sesgo por esa razón; una muestra mayor sólo proporciona más observaciones de la clase de personas que contestarían la encuesta.

11 EFECTOS POR IGNORAR LA AUSENCIA DE RESPUESTA
Al aumentar el tamaño de la muestra, el sesgo por la no-respuesta podría empeorar, ya que tal vez se desperdiciaron recursos que hubiesen servido para reducir o remediar la no-respuesta, o provocar una recolección de datos menos cuidadosa. El propio censo de USA, no incluye toda la población, y la tasa de subcobertura varía para los diversos grupos demográficos. A principios de 1990, la no-respuesta y la subcobertura en este censo provocaron un litigio de ciertas ciudades para obligar a la oficina de censos a realizar ajustes por la no-respuesta.

12 EFECTOS POR IGNORAR LA AUSENCIA DE RESPUESTA
La mayoría de las encuestas pequeñas ignoran la no-respuesta y reportan los resultados con base sólo en registros completos. La no-respuesta también se ignora en muchas encuestas que aparecen en los periódicos. El análisis de los registros completos tiene como hipótesis la idea de que quienes no responden son similares a quienes sí, y que las unidades con elementos faltantes son similares a las unidades que tienen las respuestas de todas las preguntas. Muchas evidencias indican que estas hipótesis son erróneas.

13 EFECTOS POR IGNORAR LA AUSENCIA DE RESPUESTA
Los resultados de un análisis exclusivo de registros completos deben considerarse como representativos únicamente de la población de personas que respondieron a la encuesta, lo que rara vez equivale a la población objetivo. Si usted insiste en estimar las medias y totales de la población usando sólo los registros completos sin realizar ajustes por no-respuesta, al menos deberá informar de la tasa correspondiente.

14 EFECTOS POR IGNORAR LA AUSENCIA DE RESPUESTA
Supongamos que las unidades de población (N) pueden ser dividas en dos estratos: N1: Número de unidades que si responden N2: Número de unidades que no responden Entonces: N = N1 + N2 y W1=N1/N, W2=N2/N siendo W2 la proporción de no-respuesta en la población.

15 EFECTOS POR IGNORAR LA AUSENCIA DE RESPUESTA
Por lo que el sesgo que se obtiene al utilizar estimar a la media poblacional es: Al utilizar a de la población: Finalmente, si se utiliza a proporción de la población:

16 EFECTOS POR IGNORAR LA AUSENCIA DE RESPUESTA
Como la muestra no provee información sobre el estrato de no respondientes, los tamaños de sesgos son desconocidos lo que dificulta el calcular intervalos de confianza para los estimadores de las características de interés. Sin embargo, para el caso de estimar proporciones el intervalo de confianza estará dado de la siguiente manera: Faltan fórmulas

17 EFECTOS POR IGNORAR LA AUSENCIA DE RESPUESTA
Además, Birnbaum y Sirken muestran que un valor de n que garantiza un error menor que d es:

18 Tipos de no respuesta Una clasificación aproximada de los tipos de no-respuesta es la siguiente: No cubrimiento. Falla en la localización o la visita a algunas unidades de la muestra. Este es un problema con unidades de muestreo que son áreas, en las cuales el entrevistador debe encontrar y enlistar todas las viviendas en una manzana de la ciudad. También surge del uso de listas incompletas. Algunas veces el mal tiempo o las escasas facilidades de transporte hacen imposible alcanzar ciertas unidades durante el periodo de la encuesta.

19 Tipos de no respuesta Los no-en-casa. Este grupo contiene personas que residen en el lugar pero que se encuentran temporalmente fuera de casa. Las familias en las cuales ambos padres trabajan y las familias sin niños son más difíciles de alcanzar. Incapaz de contestar. El entrevistado puede no tener la información requerida para ciertas preguntas o puede mostrarse poco inclinado a darla. Una redacción hábil del cuestionario y su prueba son una salvaguardia.

20 Tipos de no respuesta Los “hueso duro”. Las personas que inexorablemente rechazan ser entrevistados, que están incapacitadas o que están fuera de casa durante todo el tiempo disponible para el trabajo de campo. Esto representa una fuente de sesgo que persiste, sin importar cuánto esfuerzo se ponga en la perfección de las listas. Algunas medidas que se pueden tomar para este tipo de no-respuesta son las siguientes:

21 Tipos de no respuesta La identificación y medida del no-cubrimiento son difíciles. Cuando el marco principal es un directorio de direcciones por calles, el mismo se puede completar con muestra de área, cuyo propósito es muestrear parte de la ciudad (p. ej. edificios nuevos) no cubierta por el directorio, y en partes donde el directorio parece exacto, buscar direcciones no incluidas en el mismo. Con respecto a los no-en-casa, el problema es más fácil en encuestas en las cuales cualquier adulto en la casa es capaz de contestar las preguntas, que en aquellas en las que se entrevista un solo adulto escogido al azar.

22 Ausencia de respuesta total
Una característica común de las encuestas pobres es la falta de tiempo invertido en su diseño y en el seguimiento de la no-respuesta, simplemente comienzan a reunir datos sin tomar en cuenta los problemas potenciales en su proceso de recolección. Estas razones se pueden descubrir mediante algunos experimentos y la aplicación de métodos de mejoramiento de calidad a la recolección y procesamiento de datos.

23 Ausencia de respuesta total

24 Ausencia de respuesta total

25 Ausencia de respuesta total

26 Ausencia de respuesta total

27 Ausencia de respuesta total
Contenido de la encuesta. Una encuesta sobre el uso de drogas o asuntos financieros puede tener gran cantidad de rechazos. A veces, se puede aumentar la tasa de respuesta ordenando con cuidado las preguntas o utilizando una técnica de respuesta aleatoria. Diseño del cuestionario. Ya hemos visto que la formulación de las preguntas tiene un efecto importante sobre las respuestas recibidas, pero también puede afectar al hecho de que se conteste a un elemento del cuestionario. Tiempo de la encuesta. Algunos periodos para realizar llamadas o temporadas de año pueden producir mayores tasas de respuesta que otras. Por ejemplo, el mes vacacional de agosto sería un mal momento para realizar una encuesta de casa en casa en Alemania.

28 Ausencia de respuesta total
Entrevistadores. Se pueden aplicar los métodos estándar de mejoramiento de calidad para aumentar las tasas de respuesta y la precisión de los entrevistadores. Los mismos métodos se pueden aplicar al proceso de codificación de datos. Método de recolección de datos. Las encuestas telefónicas y por correo tienen una tasa de respuesta menor que las encuestas personales (auque también son más baratos). Presentación de la encuesta. La presentación de la encuesta proporciona el primer contacto entre el entrevistador y la persona potencialmente contestará; una buena presentación, que motive la respuesta, puede incrementar drásticamente las tasas de respuesta. La persona que responde debe saber la finalidad con la que se utilizarán los datos (personas sin escrúpulos frecuentemente pretenden estar realizando una encuesta cuando en realidad tratan de atacar a los clientes) y garantizar la confidencialidad.

29 Ausencia de respuesta total
Agobio de las personas que responden. Quienes contestan una encuesta le hacen un favor inmenso, y por lo que la encuesta debe ser lo menos entrometida posible. Un cuestionario breve, que requiera menos detalles, puede reducir el agobio de la persona que responde, técnicas como la estratificación puede reducir ese agobio pues una muestra menor basta para obtener la precisión requerida. Incentivos y antiincentivos. Los incentivos, financieros o de otros tipos, pueden incrementar la tasa de respuesta. Los antiincentivos también pueden ser útiles. Seguimiento. El contacto inicial de la muestra es menos costoso por unidad que el seguimiento de quienes respondieron inicialmente si la encuesta se realiza por correo, un recordatorio puede incrementar la tasa de respuesta. Pero no todos contestaran todas las llamadas de seguimiento; algunas personas se negarán a responder la encuesta sin importar la frecuencia con que se establezca contacto con ellas. Usted debe decidir la cantidad de llamadas de seguimiento que debe realizar antes que los resultados marginales no justifiquen el dinero invertido.

30 Ausencia de respuesta total
Se debe tratar de obtener al menos cierta información acerca de quienes no respondan, que puede emplearse para realizar ajustes por la no-respuesta e incluir elementos sustitutos que se pueden utilizar en la no-respuesta por elementos. La calidad de los datos de una encuesta queda determinada en gran medida en la etapa de diseño. Las palabras de Fisher (1938) acerca de los experimentos se pueden aplicar también al diseño de encuestas con muestras: “Llamar a un estadístico después de realizar un experimento, sería como pedirle que realice una autopsia: él solo puede decir de qué murió el experimento”.

31 Ajuste de rastrilleo Ajuste de rastrilleo
El restrilleo es un método de estratificación posterior que se puede usar cuando los estratos posteriores se forman usando más de una variable, pero solo se conocen los totales marginales de la población. Considere la siguiente tabla de sumas de pesos de una muestra: El rastrilleo es un método de estratificación posterior que se puede usar cuando los estratos posteriores se forman usando más de una variable, pero solo se conocen los totales marginales de la población. Considere la siguiente tabla de sumas de pesos de una muestra: Ahora consideramos que conocemos las cifras reales para la población para los totales marginales y son: 1510 mujeres y 1490 hombres, 600 negros, 2120 blancos,15 asiáticos, 100 indígenas y 30 personas en la categoría “Otros”. Sin embargo, las cifras de la población para cada celda de la tabla son desconocidas.

32 El rastrilleo nos permite ajustar los pesos para que las sumas de los pesos en los márgenes sean igual a las cifras de la población. Primero estamos los renglones, multiplicando cada entrada por: En este ejemplo, al multiplicar el renglón de las mujeres por y el de los hombres por obtenemos la siguiente tabla: Ahora, los totales por renglones están bien, pero los totales por columna no son iguales a los totales de la población. Repetimos el mismo procedimiento hasta que los totales por renglón y por columna sea iguales a las cifras de l a población

33 El proceso converge siempre que todas las cifras de las celdas sean positivas.
En este ejemplo, la tabla final de cifra ajustadas es: Las entradas de esta última tabla podrían ser mejores estimadores de las poblaciones de la celda, es decir, menor varianza que las estimaciones ponderadas originales. El rastrilleo tiene algunas dificultades: el algoritmo puede no converger si algunas de las estimaciones por celda se anulan. Hay también un cierto peligro de “ajuste excesivo”: si existe poca relación entre la dimensión adicional en el rastrilleo y las medias de la celda, el rastrilleo puede incrementar la varianza en lugar de disminuirla

34 Estimación de la probabilidad de respuesta
Algunos métodos de clases de ponderación usan pesos que son los recíprocos de la probabilidad de respuesta estimada. Un ejemplo famoso es el de método de Politz-Simmons para ajustar la disponibilidad de los miembros de la muestra. Con esta técnica se pretende evitar por completo las visitas adicionales mediante la recolección de las primeras visitas solamente, que a continuación se corrigen con información acerca de la probabilidad de encontrar al entrevistado. Se le pregunta en qué cantidad de k periodos similares habría estado disponible para entrevista; si la respuesta es r, se pondera la entrevista con Por lo regular se utiliza k=5. Por ejemplo, si el entrevistado dice que ha estado disponible en r=1 periodos similares, obtiene la ponderación 6/2. Así, de 600 sujetos, cada uno de los cuales tiene la probabilidad 1/3 de ser encontrado en su casa, se encontrará a 200.

35 Selección del número de reentrevistas
Si en una muestra aleatoria de tamaño n se obtiene únicamente respuestas, entonces los dos grupos (respuesta y no respuesta) pueden ser manejados como una muestra aleatoria estratificada con dos estratos. Nótese que propiamente no se trata de un muestreo ya que las n’s son variables aleatorias, cuyos valores son determinados hasta que el muestreo inicial es completado. Pero pensar en términos de muestreo estratificado, nos permite estimar reglas optimas aproximadas para la asignación de recursos a las reentrevistas. Supóngase que de entrevistados con no respuesta, decidimos hacer entrevistas intensivas en r de ellos, donde para la constante k > 1. Y supóngase que se tienen costos: Donde: es el costo inicial del muestreo de cada elemento. costo para obtener una respuesta estándar. costo de una respuesta de reentrevista

36 Si denota el promedio de las respuestas iniciales y el promedio del as r respuestas de reentrevista, entonces: Es un estimador insesgado de la media poblacional. Ase puede derivar una expresión teórica para la varianza de y entonces podemos encontrar los valores de k y n que minimicen el costo esperado del muestreo para un valor fijo deseado de , por ejemplo . Donde es la tasa de no respuesta para la población, , y son la varianza para la población completa y para el grupo de no respuesta.

37 Ejemplo: La varianza de puede ser estimada por:
Se va a usar un cuestionario por correo para recolectar datos a fin de estimar a la cantidad promedio por semana que un grupo de 1,000 estudiantes gasta en diversión. De experiencias pasadas se anticipa que la tasa de respuesta es alrededor de 60% se piensa que y (El grupo de no respuesta tiende a ser aquellos que no están interesados en diversiones y por esto gastan menos y tienen una menor variación en sus hábitos de gasto). Suponga , y y que se usa inicialmente una muestra irrestricta aleatoria. Encuentre n y k de tal manera que la varianza del estimador resultante sea aproximadamente igual a cinco unidades.

38 Solución Obsérvese que . Entonces o bien 35
Ya que la , podemos esperar que aproximadamente 21 personas respondan inicialmente y o bien 6 Reentrevistas se van a tener que hacer

39 Efectos de la reentrevista un enfoque matemático (Ejemplo)
Se tiene una población con tres clases, se intenta que las y las representen encuestas en las cuales se entrevista a un adulto al azar. Durante la primer visita las probabilidades de obtener una encuesta se tomaron como 0.6, 0.5 y 0.1 en las tres clases. Durante las segunda y subsecuentes visitas, la probabilidad condicional de entrevistar a una persona omitida anteriormente son binomiales con parámetros 0.9, 0.5, y 0.2 respectivamente. Se consideran dos grupos de (I, II). Por simplicidad la varianza dentro de clase se tomaron todas como 2,500. Los costos relativos por entrevista completa en visitas sucesivas se dan mas adelante.

40 Se trabaja con una población dividida en tres clases (j)
Se trabaja con una población dividida en tres clases (j). En la cual se encuesta a un adulto al azar. : proporción de la población que cae en la j-ésima clase. A su vez la población se encuentra dividida en dos grupos, cuyas se muestran a continuación. : es la media de la característica para la j-ésima clase

41 : es la probabilidad de que se encuentre un entrevistado de la j-ésima clase antes de k i-ésima visita. Es una probabilidad condicionada al del número de visitas. El número de entrevistas obtenidas en i-ésima visita se obtiene por medio de: Donde es el tamaño inicial de la muestra.

42 Como se puede apreciar en la tabla, el número de entrevistas obtenidas aumenta conforme aumenta el número de reentrevistas lo cual permite obtener mejores estimaciones de los parámetros poblacionales. Por otro lado el costo promedio de la entrevista y el tiempo de obtención de la información aumentan, lo cual significa una fuerte restricción. Con el fin de observar los beneficios de las revisitas, se calculó el sesgo para la estimación de la media para las dos poblaciones. En ambos casos se aprecia un menor sesgo cuando aumentan las visitas a las unidades muestrales que no contestaron. La media verdadera de la población para la característica esta dada por: Bajo el supuesto de las de los datos iniciales

43 La media de la muestra obtenida después de i visitas, es también una esperanza condicional, dado el numero de visitas. Los sesgos que se obtuvieron en ambos grupos son los siguientes:

44 Una política que requiere tres visitas, por ejemplo reduce el sesgo de manera considerable. Pero hay restricción monetaria, por la cual no es posible hacer un número elevado de revisitas; por lo tanto se desea encontrar el estimador con menor ECM dado el número inicial de la muestra ( ) que determino el presupuesto disponible. En la siguiente tabla se muestran los ECM de los estimadores con diferentes tamaños de muestras iniciales para cada uno de los grupos. Con =1000 se obtiene el mejor estimador con 3 visitas, en el grupo 2 esto pasa con 4 visitas, pues un mayor numero de reentrevistas resultan innecesarias e incluso perjudiciales ya que aumenta el ECM

45 Con =2000 el número de visitas que son necesarias para obtener la información que proporcione los estimados de menor ECM es 4 visitas en el grupo I y cinco en el grupo II. La mayor virtud del modelo yace en su capacidad de establecer políticas económicas para buscar el número de revisitas para obtener información que proporciones los estimadores con menor ECM para cualquier tipo de encuesta.

46 ¿Qué es una tasa de respuesta aceptable?
Con frecuencia el investigador dirá: “espero una tasa de respuesta de 60% en mi encuesta ¿Es esto aceptable? ¿Me dará la a encuesta resultados validos?” La repuesta a estas preguntas depende de la naturaleza de la no respuesta: si los que no responden son completamente aleatorios, entonces podemos ignorar por completo la no respuesta y utilizar a quienes contestan como muestra representativa de la población. Si quienes no contestan tienden a diferir, de quienes si, entonces los sesgos de los resultados al usar solo a quienes si respondieron hará que toda la encuesta pierda su valor. Muchas referencias proporcionan consejos acerca de las cuotas para la aceptación de las tasas de respuesta, pero en general el establecimiento de tales criterios absolutos para una tasa de respuesta aceptable es peligroso y a llevado a muchos investigadores de encuestas a una complacencia infundada acerca de la ausencia de respuesta.

47 Se debe tomar en cuenta que las tasa de respuesta se pueden manipular al definirlas de otra manera, y se acumulan resultados distintos para las tasa de respuesta, según la definición utilizada: Obsérvese que una “tasa de respuesta“ calculada con la última formula será mucho mayor que la calculada mediante la primer fórmula pues el denominador es menor.

48 Por lo anterior se sugiere que se reporten varias tasas de respuesta para una encuesta:
Tasa fuera de alcance: el cociente del número de unidades fuera de alcance entre la cantidad de unidades al alcance y no respuesta. Tasa de no contactos: el cociente del número de no contactos y las unidades no resueltas entre las cantidad de unidades al alcance y no resueltas. Tasa de rechazo: el cociente del número de rechazos entre la cantidad de unidades al alcance. Tasa de no respuesta: el cociente del número de quienes no responden y las unidades no resueltas entre la cantidad de unidades al alcance y no resueltas.

49 Las distintas medidas de no respuesta pueden ser adecuadas para distintas encuestas y no intentamos dar una definición de tasa de respuesta que se ajuste a tolos casos. Sin embargo, las cantidades utilizadas para calcular la tasa de respuesta deben quedar definidas en cada encuesta, para lo que se recomienda lo siguiente: 1. Los equipos de la encuesta deben calcularla de una manera uniforme con respecto del tiempo y documentar los componentes en cada edición de una encuesta. 2. Los componentes de la tasa de respuesta deben publicarse en los informes de la encuesta; los lectores pueden recibir las definiciones de las tasas utilizadas, incluyendo las cifras reales, así como comentarios sobre la importancia de la tasa de respuesta para la calidad de los datos de la encuesta. 3. Un poco de investigación acerca de la no respuesta debe tener sus dividendos, se debe de apoyar como una forma de mejorar la eficacia de las operaciones de recolección de datos.

50 CONCLUSIONES La ausencia de respuesta puede tener varias causas por lo que no se recomienda un único método para cada encuesta. La mejor manera de enfrentar la ausencia de respuesta es prevenirla. Prevención. Diseño de la encuesta de modo que la ausencia de respuesta sea pequeña. Este es, con mucho, el mejor método. Ante la ausencia de respuesta es posible, modelar los datos faltantes, pero predecir esos datos nunca es tan bueno como observarlos de primera mano.

51 CONCLUSIONES Se ha demostrado que la no respuesta puede tener grandes efectos en los resultados de una encuesta.

52 Bibliografía Sharon L. Lohr. Muestreo(1999): Diseño y análisis. Internacional Thomson Editores. Mendenhall, Et. Al(2006): Elementos de muestreo. Thomson. Sexta Edición. Cochran, W. G(1977): Sampling Tecniques. New York, Wiley.Tercera edición. Azorin, F. Y Sánchez-Crespo (1986): Métodos y aplicaciones del muestreo. Ed. Alianza


Descargar ppt "TECNICAS DE MUESTREO HERNANDEZ ALFARO ROMAN MARTINEZ SANCHEZ RAFAEL"

Presentaciones similares


Anuncios Google