La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Instituto de Investigaciones en Matemáticas Aplicadas y en Sistemas Especialidad en Estadística Aplicada Muestreo Profesora: Patricia Mercado.

Presentaciones similares


Presentación del tema: "Instituto de Investigaciones en Matemáticas Aplicadas y en Sistemas Especialidad en Estadística Aplicada Muestreo Profesora: Patricia Mercado."— Transcripción de la presentación:

1

2 Instituto de Investigaciones en Matemáticas Aplicadas y en Sistemas Especialidad en Estadística Aplicada Muestreo Profesora: Patricia Mercado

3 Equipo 8 Claudia Alcalá Ana Jacobo Yolanda Jiménez Nina Jiménez

4 RESPUESTA ALEATORIZADA

5 Practica AGUILA: ¿Has probado algún tipo de droga? SI NO SOL: ¿Eres mujer? SI NO Lanza una moneda y según el resultado contesta la pregunta correspondiente:

6 Definiciones Características Sensitivas. Características en donde los entrevistados sienten dañada su intimidad al pedir que respondan un cuestionario Preguntas Sensitivas Son las preguntas que sirven para captar las caracteristicas sensitivas Proporción Sensitiva Proporcion de poblacion con caracteristicas sensitivas

7 ¿Cuándo se utiliza? Cuando las personas que son entrevistadas, se niegan a contestar o dan una respuesta falseada a preguntas sensitivas, que las ponen en aprietos o les pueden ser dañinas en algún sentido. Se utiliza para estimar las proporciones de población sensitiva

8 ¿Cuándo se utiliza?

9 Método 1 (Warner 1965) Se supone una población con cierta característica sensitiva, lo que se quiere es calcular la proporción p de los elementos que tienen esa característica.

10 Supuestos Los supuestos del modelo de Warner son los siguientes: Los entrevistados responden verazmente. La pregunta que se debe responder es seleccionada con probabilidad preasignada, ó 1 –, (0 < < 1). La población es susceptible de clasificar en el conjunto A, los poseedores de la característica sensitiva, ó A c, que no tiene la característica.

11 Supuestos Los entrevistados forman parte de una muestra probabilística de tamaño n, seleccionada con reemplazo. (sin pérdida de generalidad se puede suponer un censo en cuyo caso el tamaño de muestra es igual al tamaño de la población n = N).

12 El método de Warner propone 2 enunciados y en ambos la respuesta es SI ó NO: Q1.Tienes la característica sensitiva SI NO Q2.No tienes la característica sensitiva SI NO La probabilidad de que el individuo conteste Q1 es conocida y 1- es la probabilidad de que conteste Q2

13 El mecanismo de aleatorización que originalmente utilizó Warner es una aguja giratoria en un disco con dos regiones delimitadas. La aguja apunta con probabilidad a la región A y con 1 - a la región A c, el entrevistado responde a la pregunta Q a si la aguja señala la región A, o a la pregunta Q a c si la aguja señala la región A c, de esta manera, todo se conjuga para que el entrevistador sólo anote SI ó NO para cada entrevistado.

14 Ejemplo El entrevistado elige una de las preguntas mediante un proceso aleatorio, por ejemplo, lanza un dado y si obtiene {1,2,3,4}contesta Q1, si obtiene {5,6} entonces debe responder Q2.

15 Sea P la proporción de la población para la cual la respuesta verdadera de Q a es SI, entonces 1 – P es la proporción de personas que contestan SI a Q a c, entonces la probabilidad de respuestas SI debería estar dada por: Pr(SI) = P + (1 - )(1 –P) Despejando P: P= P(si)-(1-

16 Estimador de la Proporción Sensitiva

17 Método 2 (Horvitz,Shah y Simmons, 1967) Pregunta inocua: es aquélla pregunta que no es sensitiva y que no está relacionada con ella. Reemplazar Q a c con una pregunta inocua y define Q I como una probabilidad conocida de responder SI a la pregunta.

18 Q a = ¿Ha robado algún artículo de una tienda? SI NO Q I = ¿En el lanzamiento de la moneda, le salió sol? SI NO

19 Definiciones de Probabilidades Prob de contestar Q a es Prob de contestar Q I es 1- La prob Q I de responder SI es ( CONOCIDA ) P(si)= p+ (1- p= P(si)-(1-

20 ESTIMADORES Los estimadores basados en X contestaciones en una muestra de tamaño n

21 ¿Qué método es mejor? Supongamos valores p=0.3 =0.6 =0.5 Método 1 Método 2 Casi 10 veces más eficaz que el de Warner

22 Algunos ejemplos y extensiones o adecuaciones del modelo

23 Ejemplo método Warner 1973 encuesta fecundidad en Alberta, Canadá. Conocer el no. de abortos ilegales. Selección de 3 muestras independientes, 327, 269 y 342 mujeres en edad fértil. Entre otras preguntas, se formulaba la siguiente: ¿Tuvo un aborto provocado (terapéutico o ilegal) durante 1972? Procedimientos diferentes en la aplicación de la encuesta en cada una de las muestras. 1ra. Interrogatorio directo. 2da. Respuesta anónima por correo 3ra. Respuesta aleatorizada.

24 Técnica de aleatorización

25 Resultados

26 Ejemplo método de Horvitz Estimar en una universidad la proporción de estudiantes que han usado cocaína. Método: en una caja se colocaron y revolvieron 30 bolas rojas, 16 azules y 4 blancas; se pidió a cada estudiante que extrajera una bola de la caja, si la bola extraída era roja se contestaba la pregunta 1 y en caso contrario la pregunta 2. Pregunta 1: ¿Alguna vez has usado droga? Pregunta 2: ¿Es blanca la bola que extrajo?

27 Resultados

28 Técnica de RA en datos cuantitativos 1969 Greenberg, Horvitz, et. al. Estimar el no. de abortos en 5 áreas metropolitanas de Carolina del Norte. 2 muestras de mujeres adultas. Preguntas realizadas: 1. ¿Cuantos abortos había tenido durante su vida? 2: Si una mujer tiene que trabajar tiempo completo ¿Cuántos hijos cree ud. que debería tener? Técnica: Caja 35 bolas rojas y 15 azules. Si bola roja respondían pregunta 1, y si bola azul pregunta 2.

29 Resultados

30 Técnica RA con dos preguntas alternas 1971, Greenberg, Horvitz, et al. Se utiliza cuando la proporción de la población con la característica no sensitiva no se conoce, y se requiere estimar la proporción de la población que posee la característica sensitiva. Se requiere la aplicación de dos muestras, y consiste en la aplicación de dos preguntas no sensitivas en conjunto con la pregunta sensitiva.

31 Otoño 1971, Research Triangle Institute aplicó el modelo para conocer la relación entre la bebida y el conducir un automóvil en el Condado de Mecklenburg, Carolina del Nte. La población de interés eran personas no abstemias mayores de 16. Método de aleatorización: lanzamiento de moneda (P=1/2). Y las preguntas: Sensitiva: A) ¿Ha tenido un accidente automovilístico durante el año pasado en el que yo tuve la culpa.? Dos preguntas alternas: B-1) ¿Nació en Abril? B-2) ¿Vivía en Carolina del Nte., pero no en el Condado de Mecklenburg en 1966? Muestra 1Muestra 2 P. Si/A= 11.79P. Si/A = 22.3 P. Si/B-1= 10.24 P. Si/B-2 =8.41 P. Si/ambas =.9364 P. Si/ambas = 1.18 n = 184m = 239 La proporción estimada ¶ = 24.72 y Var (¶) = 3.92

32 Modelo RA con 2 características sensitivas Tesis Acturía, 1976, Ramón Vera. Objetivo estimar la proporción marginal de presencia de cada característica y la proporción conjunta. Se utilizan 6 preguntas, enumeradas y organizadas en grupos de 3. La pregunta 1 y 2 son de las características sensitivas, las otras 4 no tienen relación con las anteriores, pero las 3 últimas están interrelacionadas. Respuesta Si o NO. 1. ¿Has hecho uso de drogas en más de 3 veces en los últimos 12 meses? 2. ¿En los últimos 15 días te has masturbado alguna vez cuando menos? 3. ¿Naciste en el mes de Abril? 4. ¿Tu no. de cuenta termina en 0,1 ó 2? 5. ¿Tu no. de cuenta termina en 0 ó 1? 6. ¿Tu no. de cuenta termina en 2?

33 Grupos formados A: Pregunta 1-4 (Drogra - No. Cuenta) B: Pregunta 2-3 (Masturbación - Nacimiento) C: Pregunta 5-6 (No. Cuenta - No. Cuenta) Método de aleatorización: De una baraja española entrevistado elegía una carta. Paso 1 Si 1,2,3,4,5,6,7 contesta la pregunta 1 si 10,11,12 contesta 4 Paso 2 Si contestó 1, la segunda pregunta se elige del grupo B, ó del grupo C si contestó a 4. Paso 3 Para elegir la pregunta en cualquiera de estos grupos, se elegía una carta de una baraja americana. Grupo BGrupo C Si A,2,3,4,5,6,7,8,9,10 Pregunta 2 Pregunta 5 Caso contrario Pregunta 3 Pregunta 6 Las respuestas se depositaban en una urna, y se cruzaba si/no.

34 Se tomaron dos muestras alumnos Fac. Ciencias 2do. Semestre 1976, cursaban estadística I, estadística II y Procesos Estocásticos. n = 80 m= 36

35 Otras extensiones Modelos para datos continuos, ordinales. Kuk (1990). El encuestado genera dos variables binarias de respuesta independientes. Bajo supuesto de dos distribuciones Bernoulli. k eventos por intrevistado. Clark y Desharnais (1998). Modelo para determinar la proporción de los entrevistados deshonestos.

36 Ejemplo NO optimo Duffy y Waterton (1988) realizaron un muestreo por conglomerados en dos etapas para aplicar una encuesta para medir la incidencia de problemas relacionados con alcohol en Edimburgo, Escocia. UPMs fueron distritos de votación y las USMs personas. 1/5 se elige aleatoriamente para contestar preguntas directas y el resto en respuesta aleatorizada (RA). Resultados: tasa de respuesta 81.1% grupo de preguntas directas, 76.5% grupo de respuesta aleatorizada. Estimación de la proporción de personas que habían bebido más del límite legal inmediatamente antes de conducir un auto, fue de 0.469 grupo preguntas directas y 0.382 grupo RA (diferencia no significativa estadísticamente). Aquí RA no aumentó la tasa de respuesta ni la incidencia estimada de la característica sensitiva.

37 Ventajas Desventajas Aumenta la probabilidad de contestar la verdad que en una pregunta directa. Mayor índice de respuesta. Aumento en la complejidad de la pregunta. Dificultad en entender el método de aleatorización.

38 Sugerencias generales La técnica debe de incorporarse en una parte de la muestra piloto y el método regular en la otra parte, a fin de evaluar su comprensión, grado de aceptación y funcionamiento general en la población. En su fase de aplicación es preciso constatar que cada interrogado ha comprendido lo que debe de hacer como que el método confiere absoluta privacidad. Las preguntas tratadas por RA deben aparecer al fianl del cuestionario, después de las que se formulan por vías convencionales y previa explicación de que se trata de un procedimiento para cuya aplicación se solicita especial cooperación

39 RESULTADOS DE LA PRACTICA

40 Bibliografía De la Vega Sergio, Vera Ramón Modelo de respuesta aleatorizada para una doble clasificación sensitiva. Tesis Actuario 1976 Zellner, A. An efficient method of estimating seemingly unrelated regressions and tests for aggregation bias, JASA, June 1962 348-368. Warner, S., Randomized response: a survey technique for eliminating evasive answer bias. JASA, March 1965, 63-69. Abul-Ela, A., Greenberg, B., and Horvitz, A., A multi- proportions randomized response model. JASA, Sept. 1967, 990-1008. Greenberg, B., Abdul-Ela, A., Simmons, W., and Horvitz, D., The unrelated question randomized response model: theorectical framework. JASA, June 1969, 520-539.

41 Gould,A. Shah, B., and Abernathy, J., Unrelated question randomized response techniques with two trials per respondent. Proceedings of the Social Statistics Section of the ASA, 1971. Grrenberg, B., Abernathy, J., and Horvitz, D., Application of the randomized response technique in obtaining quantitative data JASA, June 1971, 243-250. Warner, S., The linear randomized response model. JASA, Dec. 1971, 884-888. Cambell, C. and Joiner, B., How to get the answer without being sure you've asked the question. The American Statistician, Dec. 1973, 229-231. Dowling, T. and Shactman, Ran On the relative efficiency of randomized response models. JASA, March 1975, 84-87.


Descargar ppt "Instituto de Investigaciones en Matemáticas Aplicadas y en Sistemas Especialidad en Estadística Aplicada Muestreo Profesora: Patricia Mercado."

Presentaciones similares


Anuncios Google