Instituto de Investigaciones en Matemáticas Aplicadas y en Sistemas

Slides:



Advertisements
Presentaciones similares
DISEÑO DE EXPERIMENTOS EXPERIMENTOS DE COMPARACIÓN SIMPLE
Advertisements

ESTIMACIÓN DE DENSIDAD
Página 1 Encuesta sobre conducción y seguridad viaria Diciembre 2004 Presentación.
ESTIMACION DE PARAMETRO
TESTS METODOLOGÍA. 1.- El MÉTODO CIENTÍFICO es: –A) el sujeto de la investigación –B) el objeto de la investigación –C) el nexo de unión entre el sujeto.
Conocimiento, Uso y Evaluación de Medicamentos Genéricos
Estudio de mercado En un mercado de libre competencia, es el consumidor o comprador el que tiene la decisión final sobre el éxito o fracaso de un producto.
La mediana La mediana es el valor tal que el 50 % de las observaciones son menores y 50 % de ellas son mayores a dicho valor. En otra palabras, la mediana.
Endeudamiento Juvenil
1 ESTUDIO DE OPINIÓN PÚBLICA: LA SEXUALIDAD DE LOS CHILENOS ABRIL 2006 ¿Informados o desinformados? Principal fuente de información Las enseñanzas durante.
M. Dolores Frías-Navarro
Tema 13. Inferencia estadística Principales conceptos. Muestreo
Tema 15. Contraste de hipótesis: Planteamiento de las hipótesis
Árboles de decisión Tema 9 Parte teórica Minería de datos
Metodología de la Investigación Social
CAPÍTULO 1 ¿Qué es la economía?
Conceptos y Procedimiento
FRANCISCO MARÍN HERRADA
MUESTREO (NAGA´s) BOLETÍN 5020
Estadística Capítulo 4.3 TEOREMA DE BAYES.
ESTADISTICA APLICADA A LAS COMUNICACIONES: CONCEPTOS EN LA INVESTIGACION POR MUESTREO Docente : Fernando Camones SESION 01 Lima, 26 de Octubre 2010.
UNIDAD III: Semana No. 23 MARCO METODOLÓGICO
Unidad de competencia II Estadística descriptiva:
Unidad de competencia II Estadística descriptiva:
Estudios de usuarios de archivo TEMA 12. Estudios de usuarios de archivo Entendemos por estudio de usuarios a: las herramientas de planificación, análisis.
PRUEBA DE HIPOTESIS Denominada también prueba de significación, tiene como objetivo principal evaluar suposiciones o afirmaciones acerca de los valores.
CiFP RODRÍGUEZ FABRÉS (Departamento de Orientación)
Estadística Administrativa I
Estimación de parámetros poblacionales
Estadística Administrativa I
APLICAWEB SERVICIOS LEGALES DE PUERTO RICO
Investigación cuantitativa
Sistemas de Ecuaciones
} LISSET BÁRCENAS MONTERROZA
Tema 6 La demanda del mercado.
CUESTIONARIO El Cuestionario es un instrumento de investigación. Esta constituido por un conjunto de preguntas orientadas a obtener información específica.
PLANTEAMIENTO DEL PROBLEMA
La ley de los grandes números
Instituto de Investigaciones en Matemáticas Aplicadas y en Sistemas Especialidad en Estadística Aplicada Muestreo Profesora: Patricia Mercado.
VALOR DE p INTERVALO DE CONFIANZA
DEL TEMA AL PROBLEMA DE INVESTIGACIÓN
METODOLOGÍA DE INVESTIGACIÓN Titular: Agustín Salvia
La transformada de Laplace
DISEÑO DE LA MUESTRA ¿Para qué necesitamos recolectar datos?
Variables e Hipótesis de Investigación
Inferencia Estadística
ESTADÍSTICA INFERENCIAL I
SUCESIONES Y PROGRESIONES.
Estadística Administrativa II
Estadística Administrativa I
LA IDEA PARA INVESTIGAR EL PLANTEAMIENTO DEL PROBLEMA
Curso: Muestreo Básico (Resumen)
Clases 4 Pruebas de Hipótesis
HERRAMIENTAS DE INVESTIGACIÓN
El problema científico
ORGANIZACIÓN Y PRESENTACIÓN
ESTADÍSTICA DESCRIPTIVA
Capítulo 1. Conceptos básicos de la Estadística
Pruebas de hipótesis.
MERCADOTECNIA. EL OBJETIVO DEL MATERIAL ES AYUDAR Y DAR APOYO, AL FACILITADOR EN LA PRESENTACION DE LOS TEMAS QUE SON: LA DEFINICION DEL PRODUCTO Y/O.
Elementos de información
Ejemplos y claridad para avanzar la propuesta de investigación en el Trabajo colaborativo Sandra Melo Zipacon.
MUESTREO : Generalidades
Aspectos generales de la investigación educativa en el SNIT
Alumno: Ariedne Niurca Aranda García Tutor: BIBIANA PORTUGAL FRIAS MÉTODOS DE INVESTIGACIÓN II Unidad 1 Actividad 2.
MEDIDAS DE DISPERSIÓN Pedro Godoy Gómez. Miden qué tanto se dispersan las observaciones alrededor de su media. MEDIDAS DE DISPERSIÓN.
Alvaro Alfredo Bravo Dpto. de Matemáticas y Estadística Universidad de Nariño - Colombia MUESTREOS DETERMINISTICOS (NO PROBABILISTICOS)
PEDRO GODOY G. HIPÓTESIS. La hipótesis es el eslabón necesario entre la teoría y la investigación que nos lleva al descubrimiento de nuevos hechos.
INTERVALO DE CONFIANZA
Transcripción de la presentación:

Instituto de Investigaciones en Matemáticas Aplicadas y en Sistemas Especialidad en Estadística Aplicada MUESTREO Profra.: Patricia Romero Mares Méndez Castrejón E. Ilana Quintana Carrillo Roger Humberto 5/dic/2007

RESPUESTA ALEATORIZADA

RESPUESTA ALEATORIZADA:ÍNDICE ENCUESTAS Y DESEABILIDAD SOCIAL ESTRATEGIAS DEFINICIÓN DE RA SUPUESTOS CASOS

ENCUESTAS Y DESEABILIDAD SOCIAL Las encuestas son un procedimiento que emplean los investigadores para obtener información sobre una muestra de individuos. Existen ocasiones que éstas incluyen una o más preguntas que se refieren a aspectos personales que pueden considerarse “íntimos” y hacen que el entrevistado se sienta en peligro o apenado si la responden correctamente (Méndez, I et. al;2004). Por ello deben cuidar que sean elaboradas con la calidad correspondiente. Es decir, para que los resultados obtenidos sean creíbles, es necesario cuidar la forma de hacer las preguntas.

Por lo tanto, en la búsqueda de respuestas seguras, los encuestadores se enfrentan a varias dificultades, las cuales son inherentes a toda persona encuestada: inclinaciones, actitudes, formas de pensar, comportamientos, tiempo disponible, desconfianzas y una propensión a mantener la intimidad. A partir de lo anterior, el problema típico que surge consiste en la deseabilidad social, la cual se define: como la tendencia de las personas encuestadas a responder en función de lo que es aceptable socialmente, por lo tanto existen:

Características Sensitivas: Situaciones en donde los entrevistados sienten dañada su intimidad al pedir que respondan un cuestionario. Preguntas Sensitivas: Son las preguntas que sirven para captar las características sensitivas de los entrevistados; las cuales se tienen que manejar con cuidado debido a la no respuesta o a la respuesta falseada, contestando lo socialmente deseable.

Se generan sesgos: Hay otras fuentes de error/sesgo Las poblaciones objetivo y de estudio pueden diferir en cuanto a las variables que estudiamos, por ejemplo: El nivel económico en la población de estudio es mayor que en la objetivo. Los individuos que se eligen en la calle pueden ser de mayor edad (mayor frecuencia de jubilados) Hay otras fuentes de error/sesgo No respuesta a encuestas embarazosas Consumo de drogas, violencia doméstica, prácticas poco éticas,… Mentir en las preguntas “delicadas”, deseabilidad social.

Gran número de investigaciones han proliferado a lo largo de la historia de la metodología de encuestas, para asegurarse de la calidad y veracidad de las respuestas obtenidas sobre temas íntimos: consumo de drogas, de alcohol, prácticas delictivas o fraudulentas, preferencias políticas , preferencias religiosas , prácticas abortivas o hábitos sexuales. De esta manera, la necesidad del hombre por hacerse de información que tiene carácter íntimo o por combatir la no respuesta en los cuestionarios, lo han conducido a desarrollar nuevas técnicas en la metodología del muestreo, entre ellas: respuesta aleatorizada.

¿Cuándo se utiliza esta técnica? Cuando las personas que son entrevistadas, se niegan a contestar o dan una respuesta falseada a preguntas sensitivas, que las ponen en aprietos o les pueden ser dañinas en algún sentido. Se utiliza para estimar las proporciones de población sensitiva.

¿Cuándo se utiliza?

Otro ejemplo sería, robar en una tienda se tipifica como negativo Otro ejemplo sería, robar en una tienda se tipifica como negativo. Y, al hacer la pregunta: ¿Ha sentido usted en alguna ocasión la tentación de llevarse algo de una tienda, sin pagarlo? La respuesta esperada sería un NO, aunque la experiencia del encuestado sea todo lo contrario.

En síntesis: Las estrategias para combatir la resistencia de las personas a responder con sinceridad cuando el tema es íntimo o poco confesable, se dividen en dos tipos: Una basada en la redacción de las preguntas o del bloque de preguntas en el que se inserta la cuestión que se quiere medir, la otra; se refiere al procedimiento para recabar la respuesta, en la cual se encuentra el método de respuesta aleatorizada.

Respuesta aleatorizada: definición La técnica de respuesta aleatorizada es un método especialmente diseñado para asegurar privacidad a los entrevistados en el estudio de temas sensibles, delicados o embarazosos. Se intenta intenta con ello evitar sesgos de los entrevistados en ciertas conductas hacia la respuesta socialmente más deseable. Es decir, le asegura al entrevistado, que su respuesta sobre temas sensibles (falsa o verdadera) no será conocida por el entrevistador, de ahí el nombre de RA; la respuesta se realiza al azar. Se ha utilizado para analizar temas desde copiar en los exámenes, insolvencia, fraudes, haber sido arrestado, conducir bajo los efectos del alcohol, infidelidad, tener hijos fuera del matrimonio, prácticas abortivas etc.

Supuestos de la Técnica de RA: a) Los eventos son independientes del valor de la variable verdadera; es decir son mutuamente excluyentes del tipo “Aporté todos mis ingresos en la declaración de ISR del año pasado” “Mi color favorito es” b) El número de personas entrevistadas debe ser grande (ley de los grandes números) c) Las personas entrevistadas entiendan perfectamente el procedimiento y lo sigan correctamente.

Las técnicas de respuesta aleatorizada: Reducen la motivación para mentir (o no responder) a las encuestas. ¿Y, si digo la verdad…? ¿Cómo se hace? Pídele que lance una moneda antes de responder y… Si sale cara que diga la “opción comprometido” (no tiene por qué avergonzarse, la culpa es de la moneda) Si sale cruz que diga la verdad (no tiene por qué avergonzarse, el encuestador no sabe si ha salido cara o cruz) Aunque no podamos saber cuál es la verdad en cada individuo, podemos hacernos una idea porcentual sobre la población, viendo en cuánto se alejan las respuestas del 50%

Ejemplo: ¿Ha tomado drogas alguna vez? Sin respuesta aleatorizada ¡Insinseros! 100% No Con respuesta aleatorizada 40% No 60% Sí

Método 1 (Warner 1965) Supone una población con cierta característica sensitiva, lo que se quiere es calcular la proporción p de los elementos que tienen esa característica.

Supuestos del Modelo Warner Los entrevistados responden verazmente. La pregunta que se debe responder es seleccionada con probabilidad preasignada,  ó 1 – , (0 <  < 1). La población es susceptible de clasificar en el conjunto A, los poseedores de la característica sensitiva, ó Ac, que no tiene la característica.  Los entrevistados forman parte de una muestra probabilística de tamaño n, seleccionada con reemplazo. (sin pérdida de generalidad se puede suponer un censo en cuyo caso el tamaño de muestra es igual al tamaño de la población n = N).

¿Has probado algún tipo de droga? Ejemplo: Por un procedimiento aleatorio, se determina si debe contestar a la primera o a la segunda pregunta, ambas con opciones de respuesta “si o no” de modo que el entrevistador desconoce a qué cuestión corresponde la respuesta aportada por el entrevistado. Lanza una moneda y según el resultado contesta la pregunta correspondiente: SOL: ¿Eres mujer? SI NO AGUILA: ¿Has probado algún tipo de droga? SI NO

El método de Warner propone 2 enunciados y en ambos la respuesta es SI ó NO: Q1. Tienes la característica sensitiva SI NO Q2. No tienes la característica sensitiva La probabilidad  de que el individuo conteste Q1 es conocida y 1- es la probabilidad de que conteste Q2

El mecanismo de aleatorización que originalmente utilizó Warner es una aguja giratoria en un disco con dos regiones delimitadas. La aguja apunta con probabilidad  a la región A y con 1 -  a la región Ac, el entrevistado responde a la pregunta Qa si la aguja señala la región A, o a la pregunta Qac si la aguja señala la región Ac, de esta manera, todo se conjuga para que el entrevistador sólo anote SI ó NO para cada entrevistado.

En el planteamiento de Warner, la probabilidad de obtener una respuesta afirmativa responde a la siguiente fórmula: Donde p(si) representa la probabilidad conocida de respeustas afirmativas, es decir, el número de respuestas afirmativas del total de encuestados, P(A) es la probailidad de que por el método aleatorio le toque responder a la primera afirmación, P(B) representa la probabilidad de que responda a la segunda afirmación,  y -1 son complementarias y representan la probabilidad de haber declarado sus impuestos vs. Decir su color favorito.

Mientras que la varianza se vería incrementada por el hecho de introducir aleatoriedad en el proceso de respuesta y se expresa de la siguiente manera:

Ejemplos: numéricos y aplicación

Mendez, I .et al. (2004); proponen el siguiente ejemplo: Supongase que se desea conocer la proporción de estudiantes de la UNAM que fuman marihuana. La pregunta sensitiva es: ¿fuma usted mariguana por lo menos una vez a la semana?. La pregunta inocua es: ¿su número de cuenta en la UNAM es par? Suponga que se usa una probabilidad igual a 0.7 de seleccionar la pregunta sensitiva, se cuentan diez canicas o tarjetas, de las cuales siete son rojas y tres son blancas y se pide al entrevistado tomar una canica o tarjeta y sin decir qué color fue, regresarla al conjunto. Se le pide que responda correctamenet a la pregunta que aparecio aleatoriamente, sin que el entrevistador sepa a qué pregunta está respondiendo, si se tiene un color rojo es la pregunta sensitiva y si es blanco es la inocua. Sólo responde “si” o “no”. Se registrar el número de respuestas que son “si”, sea éste n1, en una muestra tamaño n.

Entonces se tiene: También se require estimar n1/n Se llama P a la proporción de “si” a la pregunta sensitiva, en el ejemplo es la proporción de personas que fuman marihuana. El valor de 0.5 se sabe que es la proporción de personas con número de cuenta par. Pregunta sensitiva = 0.7 Pregunta inocua = 0.3

Entonces, el estimador buscado es: (hay que despejar p con gorro, posteriormente calcular el tamaño de muestra)

Ejemplo numérico (Mendenhall, 1989): Se diseña un estudio para estimar la proporción de personas que dieron información falsa en su declaración de impuestos, en cierto distrito. Ya que los entrevistados no admitirán que falsearon en su declaración, se usa una técnica de respuesta aleatorizada. El experimentador prepara un mazo de cartas de las cuales ¾ son marcadas con F, denotando una declaración falsa, y ¼ son marcadas con C, denotando una declaración correcta. Se selecciona una m.a.s. de n=400 personas de una población grande que contribuye en el distrito. En entrevistas separadas se le pide a cada uno que elija una carta de mazo y que responda “si” cuando la letra de la carta concuerde al grupo que pertenece . El experimento original n1=120 respuesta “si”. Estime p la proporción de contribuyentes en el distrito que han mentido en su declaración y establezca un límite de error de estimación.

Método Warner:aplicación En 1973 se realizó en Alberta, Canadá; una encuesta de fecundidad. Cuyo objetivo era conocer el no de abortos ilegales. Para ello, se seleccionaron 3 muestras independientes de tamaño (n): 327, 269 y 342 mujeres en edad fértil. Entre otras preguntas, se formulaba la siguiente: ¿Tuvo un aborto provocado (terapéutico o ilegal) durante 1972? Los resultados se analizaron a partir de tres tipos de encuesta en cada una de las muestras: 1ra. Interrogatorio directo. 2da. Respuesta anónima por correo o cuestionario 3ra. Respuesta aleatorizada (Monedas, dados, cartas, pelotas de colores, etc.)

Resultados

Modelos aleatorizados: evolución Modelos Aleatorizados para poblaciones dicotómicas. Warner (1965) ideó el “Modelo Aleatorizado para la obtención de datos cualitativos en poblaciones dicotómicas con una característica íntima, sensitiva o estigmatizante”. El mecanismo de aleatorización implica la formulación de dos proposiciones: 1) Pertenezco al grupo que posee la característica íntima. 2) No pertenezco al grupo que posee la característica íntima. Modelo Aleatorizado para poblaciones tricotómicas. Una ampliación del modelo de Warner fue el realizado por Abul Ela, Greemberg y Horvitz (1967) quienes lo trasladaron al caso de poblaciones multicotómicas y particularmente tricotómicas. Aquí se contesta una de tres preguntas, a diferencia del caso anterior que era una de dos.

Modelo Aleatorizado con una pregunta inocua Modelo Aleatorizado con una pregunta inocua. Simmons (1967) sostenía que la confianza de los entrevistados se vería incrementada si en vez de contestar aleatoriamente a una de dos preguntas, las dos referidas a la característica estigmatizante (modelo de Warner), lo hicieran con una de dos preguntas una de las cuales fuese inocua y totalmente desvinculada de la característica íntima. Los fundamentos teóricos fueron elaborados por Greemberg, Abul Ela, Simmons y Horvitz (1969). Modelo Aleatorizado con una pregunta inocua, optimizado. En relación a una consideración sobre el mecanismo de aleatorización, que los autores hacen en el Modelo aleatorizado con una pregunta inocua, Moors (1971) retoma el modelo y lo optimiza, aplicando la técnica de aleatorización a la primera muestra y un procedimiento de interrogación directa en la segunda muestra.

Modelo Aleatorizado para la obtención de datos cuantitativos Modelo Aleatorizado para la obtención de datos cuantitativos. Greemberg, Kuebler,Abernathy y Horvitz (1971) desarrollaron el basamento teórico del Modelo Aeatorizado para la obtención de datos cuantitativos. Este modelo conserva las mismas características que el Modelo Aleatorizado con una pregunta inocua en cuanto al mecanismo de aleatorización, pero en este caso la característica en estudio es susceptible de tomar valores cuantitativos. Modelo lineal de respuestas aleatorizadas. Warner (1971) desarrolló un modelo lineal de respuestas aleatorizadas y demuestró que todos los modelos aleatorizados existentes hasta entonces eran casos particulares del “Modelo lineal general”.

Modelo Aleatorizado con dos preguntas inocuas alternadas Modelo Aleatorizado con dos preguntas inocuas alternadas. Es desarrollado por Folsom, Greemberg, Horvitz y Abernathy (1973). Se utiliza en el caso en que la poblacional con la característica inocua es desconocida y por lo tanto se hace necesaria la extracción de dos muestras simples al azar independientes y no superpuestas. En este modelo se utilizan dos preguntas inocuas en forma alternada, además de la pregunta referida a la característica íntima en estudio. Modelo Aleatorizado de respuesta al Azar. Aaker y Day 1989). Modelo Aleatorizado de alternativa forzada.Fox y Tracy (1986) y Chaudhuri mukerjee (1988). Ellos, aportaron una variante sobre la técnica de Warner, a la que denominaron método de alternativa forzada (basado en el lanzamiento de dos dados).

Ventajas y desventajas Aumento en la complejidad de la pregunta. Dificultad en entender el método de aleatorización. Requiere de tamaños de muestra grandes. Aumenta la probabilidad de contestar la verdad que en una pregunta directa. Mayor índice de respuesta.

Comentarios finales: La técnica debe de incorporarse en una parte de la muestra piloto y el método regular en la otra parte, a fin de evaluar su comprensión, grado de aceptación y funcionamiento general en la población. En su fase de aplicación es preciso constatar que cada entrevistado haya comprendido lo que debe hacer, así como que el método confiere absoluta privacidad. Las preguntas tratadas por RA deben aparecer al final del cuestionario, después de las que se formulan por vías convencionales y previa explicación de que se trata de un procedimiento para cuya aplicación se solicita especial cooperación.

Bibliografía: Basulto, J. (1982)/ El diseño de respuesta aleatorizada de Warner: Un modelo de superpoblación”; en http://www.ine.es/revistas/estaespa/96_3.pdf Cabañeros, J; García, E. y Lozano, L.M. (2003)/ “Efecto de la deseabilidad social en preguntas sobre temas comprometidos”, en http://www.udc.es/dep/mate/biometria2003/Archivos/ps44.pdf Lohr, S. (2000)/ Muestreo: diseño y análisis; International Thomson Editores Manzano, V.(2003)/ “ Respuesta Aleatorizada: primer contacto”, en http://www.aloj.us.es/vmanzano/pdf/academia/respuestaaleatorizada.pdf Méndez, I; Eslava, G. y P. Romero (2004)/ “Conceptos Básicos de Muestreo”; Monografías; Vol 12; No.27. IIMAS, UNAM. Sáenz, M.L. (2003)/ “ Respuesta aleatorizada con pregunta no relacionada, frente a pregunta directa en entrevista individual y grupal”; en http://www.sipie.net/esp/modules/news/article.php?storyid=30

Sanchez, J.L. (1985)/ “ Curso básico intensivo de muestreo” en http://www.eustat.es/prodserv/vol07_c.html Sanchez, J.L. (1972)/ “ El tratamiento de preguntas de carácter íntimo: modelo de respuesta aleatorizada” en     http://www.ine.es/revistas/estaespa/55_1.pdf Scheaffer,R y W. Mendenhall (1987)/ Elementos de Muestreo, Grupo Editorial Iberoamérica S.A. de C.V. Ruíz, M. (1990)/ “Una nota sobre la protección de la intimidad con respuesta aleatorizada”, en http://dialnet.unirioja.es/servlet/articulo?codigo=2362336 Warner, S., Randomized response: a survey technique for eliminating evasive answer bias. JASA, March 1965, 63-69. Warner, S., The linear randomized response model. JASA, Dec. 1971, 884-888.

¡Gracias por su atención!