La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Universidad Autónoma del Estado de México Centro Universitario UAEMex Lic. En Relaciones Económicas Internacionales Unidad de aprendizaje: Estadística.

Presentaciones similares


Presentación del tema: "Universidad Autónoma del Estado de México Centro Universitario UAEMex Lic. En Relaciones Económicas Internacionales Unidad de aprendizaje: Estadística."— Transcripción de la presentación:

1 Universidad Autónoma del Estado de México Centro Universitario UAEMex Lic. En Relaciones Económicas Internacionales Unidad de aprendizaje: Estadística Inferencial (Introducción al Muestreo) M. En C. Rafael Morales Ibarra Agosto, 2015

2 Contenido I. Introducción Objetivos Conceptos básicos Técnicas de muestreo Tipos de muestreo a). Probabilístico b). No probabilísticos II. Muestreo Aleatorio Simple sin reemplazo Estimación de la media poblacional Estimación del total poblacional Estimación del tamaño de muestra Desigualdad de Chevysheff Estimación de una proporción Cálculo del tamaño de muestra. III. Muestreo Aleatorio Sistemático Introducción Una estimación de μ Limite del error de estimación Cálculo de la muestra IV. Muestreo Aleatorio irrestricto Replicado Estime la proporción (p) Ejemplo estimación de μ Ejemplo estimación de (p) Ejemplo estimación del limite de error

3

4 Introducción En un curso tradicional de inferencia estadística se estudia cómo realizar estimaciones de los parámetros poblacionales, en función de la información disponible en una muestra, el objetivo de estas notas, es proporcionar la base teórica al estudiante para poder tener un manejo adecuado de los métodos de muestro más usuales en las disciplinas económico administrativas y licenciatura en Relaciones Económicas Internacionales y Economía. Particularmente nos interesa analizar: Como seleccionar la observaciones en una muestra. Como proceder en esa selección con muestras pequeñas. La importancia del muestreo cobra importancia por ser una herramienta fundamental en la investigación económica y empresarial, dado ayuda a generar datos de poblaciones, y contrastar hipótesis sobre ellas o realizar descripciones o análisis prospectivos. La primera parte de este material se detiene en considerar y precisar algunos conceptos básicos en el estudio del muestreo, la segunda parte se refiere a los métodos probabilísticos de muestreo; aleatorio simple, sistemático, estratificado y por conglomerados. El alumno encontrará las referencias bibliográficas que le permitan adentrarse con una mayor precisión a la teoría y aplicación de dichas técnicas.

5 Justificación El plan de estudios de la licenciatura en Relaciones Económicas internacionales de la UAEMex, no contempla la materia de muestreo y no obstante una gran parte de los trabajos de investigación de campo, tareas y trabajos de tesis se fundamentan en información en las que se requieren técnicas solidas de la aplicación de encuestas. Por ello, la teoría de la probabilidad y estadística cobra relevancia en descubrir aspectos del mundo que nos rodea; nos ayuda responder preguntas; nos auxilia a evaluar los riesgos de generalizar a partir de un conjunto de observaciones. Esta es la esencia de la práctica de la estadística: hacer afirmaciones probabilísticas sobre las características de un conjunto de elementos con base en la información que podamos obtener sobre un subconjunto de él. Por la importancia que esto representa es necesario poner especial atención en la recopilación de la información y por tanto, en la realización de un buen diseño de muestreo que permita la representatividad de la población que se estudia, y ello se logra atendiendo estrictamente las consideraciones teóricas del muestreo.

6 Objetivo General Analizar cómo se realizan las estimaciones de los principales parámetros y el tamaño de muestra mediante los distintos tipos de muestreo probabilístico. Objetivos particulares: Particularmente nos interesa analizar: Cómo seleccionar los elementos u observaciones de una muestra según el tipo de muestreo empleado. Cómo proceder en esa selección y cuál es su tamaño adecuado, cuando se tienen muestras pequeñas. Acompañar la mayoría de las aplicaciones con ejemplos para busca apoyar la comprensión y entendimiento. Impulsar que el alumno emprenda un proyecto en grupo para aplicar lo aprendido.

7 2. Conceptos estadísticos básicos  Muestreo: Proceso mediante el cual un subconjunto de la población se emplea para realizar inferencias de una población.  Población (N): Conjunto total de unidades, objetos, individuos, cosas, que comparten una característica en común.  Muestra (n): Parte representativa de la población, debe ser representativa y reflejar las similitudes y diferencias encontradas en la población.  Muestreo estadístico: se basa en el principio de equiprobabilidad.  todos los individuos, elementos, tienen la misma probabilidad de ser elegidos 

8 Conceptos estadísticos básicos….  Marco muestral: listado que identifica a los elementos de la población objetivo.  Elemento: cada una de las unidades sobre las que interesa obtener información.  Unidad muestral: unidad seleccionada de la población para la aplicación de la técnica de investigación; contiene los elementos de la población que pueden formar parte de la muestra.  Potencia de una prueba; Se refiere a la probabilidad de detectar diferencias estadísticamente significativas entre las sub poblaciones analizadas. (Potencia = 1 – Beta).  Parámetro: característica numérica que proviene de la población.  Estadístico: Característica numérica que proviene de la muestra.

9 Conceptos estadísticos básicos….  Teorema Central del Límite: si el n >30 y si las muestras se extraen aleatoriamente, el TCL nos dice que la distribución de muestreo de la media aproximadamente tendrá una distribución normal con una media igual a la µ y varianza igual a  2 /n.  Inferencia estadística: Consiste en declarar respecto algún parámetro poblacional con base en las observaciones hechas sobre un subconjunto de la población; muestra.  Intervalo de confianza: intervalo con una determinada probabilidad de incluir el valor poblacional. Se determina a partir de los resultados muestrales y .  Método de muestreo: procedimiento utilizado para seleccionar de forma representativa las unidades muestrales.

10 Técnicas de muestreo  Muestreos probabilístico Se conoce la probabilidad de que un elemento sea elegido para la muestra. Apropiados para uso de teoría estadística y matemática.  Muestreos no probabilistas  No tiene el carácter de aleatoriedad.  Técnicas de muestreo con tendencia al sesgo.  Ejemplo: Muestreo intencional, casual o incidental, por conveniencia, bola de nieve.

11 Tipos de muestreo Muestreo aleatorio  Si tenemos una población finita, de la que deseamos extraer una muestra.  Si el proceso de extracción garantiza a cada elemento de la población la misma probabilidad de ser elegido. Muestreo aleatorio Sin reemplazo Con reemplazo

12 Características; Muestreo probabilístico  Las muestras se seleccionan al azar, no se seleccionan por los investigadores.  Cada elemento de la población tiene la misma probabilidad de ser elegido.  Se puede conocer el error muestral, el nivel de confianza y el nivel de precisión de las estimaciones.  Los resultados se pueden generalizar.  Es el único método que puede evaluar la representatividad de la muestra.  Es más caro que el muestreo no probabilística.  Es, en general, más lento y complicado que el muestreo no probabilística.

13 13 Fuentes de sesgo Las poblaciones objetivo y de estudio pueden diferir en cuanto a las variables que estudiamos. El nivel económico en la población de estudio es mayor que en la objetivo. Los individuos que se eligen en la calle pueden ser de mayor edad (mayor frecuencia de jubilados p.ej.)… – En este caso, diremos que las muestras que se elijan estarán sesgadas. Al tipo de sesgo debido a diferencias sistemáticas entre población objetivo y población de estudio se denomina sesgo de selección. Otras fuentes de sesgo – No respuesta a encuestas “delicadas” Consumo de drogas, violencia doméstica, prácticas poco éticas,… – Mentir en las preguntas. Para evitar este tipo de sesgo se utilizan la técnica de respuesta aleatorizada.

14 14 Técnicas de muestreo Cuando elegimos individuo de una población de estudio para formar muestras podemos encontrarnos en las siguientes situaciones: – Muestreos probabilistas Conocemos la probabilidad de que un individuo sea elegido para la muestra. Interesantes para usar estadística matemática con ellos. – Muestreos no probabilistas No se conoce la probabilidad. Son muestreos que seguramente esconden sesgos. En principio no se pueden extrapolar los resultados a la población. – A pesar de ello una buena parte de los estudios que se publican usan esta técnica. ++En adelante vamos a tratar exclusivamente con muestreos probabilísticos.

15 Muestreo Aleatorio Simple (MAS)  Procedimiento probabilístico de selección de muestras más sencillo y conocido.  Requiere de un marco muestral.  Asigna un número a cada individuo de la población  Empleando una técnica aleatoria seleccionar tantos elementos para integrar la muestra requerida.  Una condición para emplear este método es que la población se numerable.  finita   Útil en poblaciones pequeñas.  Ampliamente utilizado en estudios experimentales.  Base para el desarrollo de métodos más complejos (muestreo estratificado y en etapas).

16 Inconvenientes del MAS  Su utilización está supeditada a la existencia de un marco muestral.  La extracción al azar dispersa totalmente a los componentes de la muestra.  No tiene en cuenta criterios de homogeneidad/heterogeneidad entre conjuntos de elementos del universo.  Es un método lento, sobre todo cuando el número de elementos que constituyen el universo objeto de estudio y/o la muestra es elevado.

17 Muestreo Aleatorio Sistemático (MASI)  Técnica que requiere de numerar todos los elementos de la población, pero en lugar de extraer n-números aleatorios sólo se extrae uno (k).  Se parte de este i-esimo número aleatorio, y los elementos que integran la muestra son los que ocupa los lugares i, i+k, i+2k, i+3k,...,i+(n-1)k.  El número i que empleamos como punto de partida será un número al azar entre 1 y k.  Tiene más precisión que el MAS, ya que recorre la población de un modo más uniforme.

18 Muestreo Aleatorio Estratificado (MAC)  Se aplica cuando existen ciertos factores (variables, subpoblaciones o estratos) que pueden influir en el estudio y se requiere asegurar el tener cierta cantidad mínima de individuos de cada tipo:  Hombres y mujeres, pobres y muy pobres, sur y norte,…  Jóvenes, adultos y ancianos,…  Se realiza entonces una MAS de los individuos de cada uno de los estratos.  Para realizar la inferencias de los resultados, debe tenerse en cuenta el tamaño relativo del estrato respecto al total poblacional

19 Muestreo por conglomerados (MAC)  Se aplica cuando es difícil tener el marco muestral de la población en estudio, sin embargo, se sabe que se encuentran agrupados naturalmente en grupos.  Se eligen varios grupos al azar, y ya elegidos algunos se estudia a todos los individuos de los grupos elegidos o bien se puede seguir replicar más muestreos por grupos, por estratos, aleatorios simples.  Al igual que en el MAE al extrapolar los resultados a la población debe tenerse en cuenta el tamaño relativo de unos grupos con respecto a otros.  Útil cuando la población se encuentra dispersa. La selección de la muestra puede requerir varias etapas.

20 3. Proceso de selección de la muestra 1.Definición de la población objetivo: en términos de contenido, unidades, extensión y tiempo. 2.Identificar el marco muestral. 3.Determinar el método de muestreo. 4.Determinar el tamaño de la muestra: Considerar los siguientes factores cualitativos:  Importancia de la decisión.  Naturaleza de la investigación.  Número de variables.  Naturaleza del análisis.  Revisión de estudios similares.  Restricciones de recursos.  Bibliografía

21 3. Etapas en la selección de la muestra… 5.Selección material de la muestra: elegir los componentes de la muestra y localizar físicamente las unidades. 6.Decidir el trato que se ha de dar a la falta de respuestas: la no respuesta, no se localiza, no sabe contestar o no es accesible. Para reducir este riesgo de no respuesta hay varios procedimientos:  Mejorar el diseño de la investigación para reducir las negativas.  Repetir los intentos.  Rediseñar instrumentos  Capacitar a los encuestadores  Estimar los efectos de la falta de respuesta en lo que respecta a la calidad de la información.

22 6. Proceso de selección de la muestra….  Precisión: La selección de una “n” representativa es importante para todos los investigadores. No obstante, el grado de precisión necesario o la tolerancia del investigador al error de muestreo y de no muestreo pueden ser distintos en cada proyecto, sobre todo cuando se busca reducir precisión por ahorrar costos.  Recursos: Los costos asociados a las diversas técnicas de muestreo varían. Si los recursos financieros y humanos del investigador son restringidos, habrán de eliminarse ciertas opciones.  Tiempo: El investigador que necesite cumplir con un plazo o completar un proyecto rápidamente seguramente elegirá un diseño simple que ocupe poco tiempo.  Conocimiento previo de la población: disponibilidad del marco muestral.  Necesidad de análisis estadístico.

23 I Muestreo Aleatorio Simple (MAS)

24 Muestreo aleatorio simple (sin reemplazo)  Método más usado, la condición es p cuando se tiene un marco de muestreo que especifique la manera de identificar cada unidad en la población.  Además no se tiene conocimiento a priori sobre los posibles valores de Y i ni otras mediciones asociadas a Y i.  En este caso cada unidad se extrae con igual probabilidad, por etapas, y sin reemplazo, hasta tener las n unidades de la muestra.

25  En la primera extracción, la probabilidad de que se seleccione una de las n unidades es.  En la segunda extracción la probabilidad de que se seleccione una de las restantes n-1 unidades es: y así sucesivamente.  En la selección k, la probabilidad de una unidad l es.

26  Para estimar se obtiene el promedio de la muestra:  Este es un estimador insesgado (, el promedio de los posibles valores al tomar muchas muestras es ). … (1)

27  La varianza de es: donde  Nótese que si N es infinito,, es el resultado que se obtiene para poblaciones infinitas.

28  es la fracción de muestreo o proporción de la población que se muestrea, y  es el factor de corrección por finitud (fcf).  Se puede demostrar que con este proceso de selección, la probabilidad de que cualquier unidad u i esté en la muestra es y la de que ambas una u i y una u j estén en la muestra es

29 Para estimar el total tenemos: Además si, entonces:

30 Si no conocemos tenemos que estimarla: En el caso particular del “mas” tenemos:

31  En el caso particular del “mas” tenemos:  = error absoluto.

32  Despejando n de se tiene:

33  Recordemos que:

34 Estimación del total poblacional (  )  Si lo que se quiere estimar es Y. Entonces

35 prueba piloto“adivina”  El valor de S 2 y ó  2 y se estima con una prueba piloto o bien se “adivina” usando tablas, así como del conocimiento previo sobre la población.  Si se considera que no se ajusta a la distribución normal, se usa el criterio de fijar la magnitud de la varianza o del coeficiente de variación de. Se determina n para que produzca un coeficiente de variación dado (CV 0 ) usando estimaciones “gruesas” de y de S 2 y. Tamaño de la muestra

36  Así Despejando n, se obtiene:

37 Así:

38 Si se desea un tamaño de muestra tal que el error de estimación sea inferior a  con una probabilidad de 1- , esto es:, dividiendo entre

39 De las tablas de la normal estándar, Z~N(0,1), se obtiene un valor z  /2 tal que (z  /2 es el valor de Z obtenido en las tablas que deja un área de  /2 a la derecha de él).

40 Como, hacemos que sea un valor arbitrario de Z y que: (a)

41 De aquí (a) se despeja n: si  = 0.05 entonces:

42 Se puede usar como una primera aproximación y luego corregir usando desigualdad de Tchebycheff Si no se puede suponer normalidad de la distribución del estimador, se recurre a la desigualdad de Tchebycheff.

43 Desigualdad de Tchebycheff Sea U una variable aleatoria con cualquier distribución y

44

45 En las expresiones anteriores, si tanto  como S se expresan en por ciento de la media, (2),la expresión (2) se transforma a:

46 Tchebycheff Si no se supone normalidad para la distribución de y con confianza del 95%, por la desigualdad de Tchebycheff, entonces (2) se transforma a:

47 presencia o ausencia de una característica Y(u i ) es una medida o indicador de la presencia o ausencia de una característica en la unidad u i con valor 1 si la característica está presente y 0 si no es así. En este caso proporciónpoblación = proporción de unidades en la población que tienen la característica Estimación de una proporción poblacional (P)

48 proporción muestra que es la proporción de unidades en la muestra con la característica. El valor de S 2 y en términos de P resulta:

49 con estimador Con este nuevo valor la expresión resulta: (4) a priori Para usar esta expresión, se estima a priori o con una prueba piloto el valor de P y se fija el CV o que se desea.

50 Tchebycheff Si utilizamos la desigualdad de Tchebycheff tenemos:

51 aumenta Nótese que si P está cercano a cero, el valor de n aumenta. muchas unidades Esto indica que para estimar la proporción de unidades con una característica rara se requieren muchas unidades en la muestra.

52 Esto es lo contrario de lo que sucede si se usa la aproximación a la normal, en cuyo caso se usa la expresión (4) con

53 Si se quiere conocer P, las Y i son 0 ó 1.

54 Si, además como la varianza de es máxima cuando P = 0.5, se usa P(1-P)=(.5)(.5)=0.25 como margen de seguridad

55 debe Además, si entonces se debe reportar el resultado de la estimación de P con un intervalo de confianza aproximado dado por:

56 Así Despejando n, se obtiene: Cálculo de “n”

57 Si n es "grande” se espera que el teorema Central del Límite dé una buena aproximación de la distribución de.

58 Así:

59 Entonces se distribuye aproximadamentecomo una normal estandarizada (media cero y varianza uno), donde

60 Si se desea un tamaño de muestra tal que el error de estimación sea inferior a  con una probabilidad de 1- , esto es:, diviendo entre

61 De las tablas de la normal estándar, Z~N(0,1), se obtiene un valor z  /2 tal que (z  /2 es el valor de Z obtenido en las tablas que deja un área de  /2 a la derecha de él).

62 Como, hacemos que sea un valor arbitrario de Z y que: (a)

63 De aquí (a) se despeja n: si  = 0.05 entonces:

64 Se puede usar como una primera aproximación y luego corregir usando desigualdad de Tchebycheff Si no se puede suponer normalidad de la distribución del estimador, se recurre a la desigualdad de Tchebycheff.

65

66 II Muestreo Aleatorio Sistemático (MASI)

67  Este tipo de muestreo se utiliza mucho en el control de la calidad en los procesos de líneas de fabricación en donde se opera sin interrupciones.  No es un muestreo probabilístico pero si representativo del proceso de producción de la unidades mustrales, generalmente más acucioso que un muestreo CA (Complet la Azar) y sobre todo, más económico.

68 Muestreo Aleatorio Sistemático (MASI) Introducción Como ya se había comentado el MASI, es una técnica en la que se elige mediante una observación (k) cualquiera al azar, una vez elegida esta se hace una sucesivamente respetando el intervalo o distancia preestablecido. Método empleado cuando se desea cubrir el rango de las unidades comprendidas en la población. Integración de la muestra: Se hará de manera sistemática a partir de la primera (k) según el proceso siguiente.  Generamos un número aleatorio (R). Obtenga su valor entero comprendido en el rango de 1 a N.  A partir de este número se obtiene un cierto valor “k” donde k = N/n Sumamos k a R para obtener el siguiente número que corresponde a segundo elemento muestral seleccionado.  Procedimiento que se repite para cada número seleccionado, recorriendo así todo el marco muestral de la población. Nota: Si la secuencia proporciona un elemento muestral fuera del rango, se continúa a partir del límite inferior del rango de forma tal que se recorra la imagen de los datos poblacionales.

69  Para determinar que elementos conforman la muestra, se procede a asignar un número de identificación a los elementos muestrales.  Estos serán los elementos que conforman la población.  mediante números aleatorios se seleccionan uno a uno hasta completar el tamaño de n.  Los números aleatorios se pueden generar mediante un software, calculadora o en última instancia recurrir a las tablas de números aleatorios.  En caso de repetirse un número ya escogido se desecha y se continúa el proceso. Nota: si los números aleatorios son generados por computadora o la calculadora, tendrán valores entre 0 y 1, por lo que deben multiplicarse por un Número k, tal que proporcione un número entero.

70 Ejemplo. Un investigador desea determinar la calidad del jarabe contenido en la savia de las árboles. El número total de árboles N es desconocido; par lo tanto es imposible realizar una muestra irrestricta aleatoria de árboles. Como un procedimiento alternativo, el investigador decide usar una muestra sistemática de 1-en-7. Los datos se listan a continuación. Donde el porcentaje del contenido de la savia en los árboles muestreadas. Emplear los datos para estimar μ, el contenido de savia promedio de los árboles y establezca un límite para el error de estimación. Árbol Contenido de azúcar muestreado en la savia, y Y 1 82 6724 2 76 5776 3 83 6889... 210 84 7056 211 80 6400 212 79 6241

71 Solución  Una estimación de μ esta dada por  Para encontrar un límite para el error de estimación, primero debemos calcular  Intuitivamente, podemos suponer que la población de árboles en la finca es aleatoria. Según esta suposición la varianza estimada de esta dada por

72 habiendo realizado la muestra de 1 – en – 7, conocemos N. Suponiendo N = 1484 resulta Un limite aproximado para el error de estimación esta dado por  En resumen, estimamos que el promedio de azúcar contenido en la savia es de 80.5%. Estamos bastante confiados en que el limite para el error de estimación es menor de 2.9%.

73 Ejemplo 2. Una muestra sistemática de 1 en 6 es obtenida de una lista de votantes registrados para estimar la proporción de votantes que están a favor de la emisión de bonos propuesta. Los resultados codificados de esta encuesta de elección previa se cuestan en la tabla siguiente. Estime la proporción (p) de los N= 5,775 votantes registrados que están a favor de la emisión de bonos propuesta y obtenga un limite para el error de estimación. Votante Respuesta 4 1 10 0 16 1. 5760 0 5766 0 5772 ----------------

74 Solución  La proporción muestral es:  Puesto que N es grande y varios puntos de inicio aleatorio fueron seleccionado en la extracción de la muestra sistemática, podemos suponer que  Proporciona una buena estimación de  El limite de error de estimación es  Por lo tanto se estima que 67.8% de los votantes registrados favorecen a la emisión de bonos propuesta.  Con un error de estimación menor al 2.8%.

75 MASI Replicado  Es el MASI con iteraciones. Es decir, es la selección de más de una muestra sistemática.  Por ejemplo:10 muestras sistemáticas de 1 en 50, cada una conteniendo 6 mediciones, podría ser obtenidas en aproximadamente en el mismo tiempo que una muestra sistemática de 1 en 5 conteniendo 60 mediciones.  Ambos procedimientos producen 60 mediciones para estimar la media poblacional μ. La bondad del procedimiento de muestreo replicado permite estimar al emplear el cuadrado de las desviaciones de las n s = 10 medias muestrales individuales alrededor de su media.  El promedio de las 10 medias muestrales permitirá estimar μ.

76 Ejemplo 3. Un parque estatal cobra la admisión por automóvil en lugar de por persona, y un funcionario del parque quiere estimar el numero promedio de personas por automóvil para un día efectivo en particular durante el verano. El funcionario sabe por experiencia que entraran al parque alrededor de 400 automóviles y quiere muestrear 80 de ellos. Para obtener una estimación de la varianza, utiliza el muestreo sistemático replicado con 10 muestras de 8 automóviles de cada una. usando los datos que se presentan en la tabla adjunta estime el numero promedio de personas por automóvil y establezca un limite para el error de estimación

77 Punto de inicio aleatorio Segundo elemento Tercer elemento Cuarto elemento Quinto elemento Sexto elemento Séptimo elemento Octavo elemento 2(3)52(4)102(5)152(3)202(6)252(1)302(4)352(4)3.75 5(5)55(3)105(4)155(2)205(4)255(2)305(3)355(4)3.38 13(6)63(4)113(6)163(7)213(2)263(3)313(2)363(7)2.88 26(4)76(5)126(7)176(4)226(2)276(6)326(2)376(6)4.50 31(7)81(6)131(4)181(4)231(3)281(6)331(7)381(5)5.25 35(3)85(3)135(2)185(3)235(6)285(5)335(6)385(8)4.50 40(2)90(6)140(2)190(5)240(5)290(4)340(4)390(5)4.12 45(2)95(6)145(3)195(6)245(4)295(4)345(5)395(4)4.25 46(6)96(5)146(4)196(6)246(3)296(3)346(5)396(3)4.38

78 Solucion  Para una muestra sistemática por lo tanto para = 10 muestras k’ = 10k = 10(5) = 50  Los siguientes 10 números aleatorios entre el 1 y el 50 son: 13,35,2,40,26,7,31,45,5,46 Los automóviles con estos números forman los puntos de inicio aleatorio para las muestras sistemáticas.  La cantidad de la tabla es el promedio para la primera hilera, es el promedio de la segunda hilera, y así sucesivamente. La estimación de μ es puede establecerse la siguiente identidad

79 sustituyendo, se obtiene  Varianza estimada de es:  Estimación de μ con un limite para el error de estimación es Observe que la mejor estimación del promedio de personas por automóvil es 4.16. y con un error de estimación menor a 0.38 con probabilidad de 0.95

80 III Muestreo Aleatorio Estratificado (MAE)

81 Muestreo Aleatorio Estratificado (MAE) Características:  Este tipo de muestreo se utiliza especialmente cuando se sospecha que la población es heterogénea en cuanto a alguna característica asociada a las variables de estudio.  Esto obliga a dividir a la población en subpoblaciones o estratos de acuerdo a la variabilidad de esta característica, con el objeto de mejorar las estimaciones.  Se realiza una MAS de cada una de los estratos.  Para generar este tipo de muestreo es necesario identificar dentro de la población cada subpoblación o estrato y luego realizar una selección aleatoria simple de los elementos al interior de cada una de estas subpoblaciones.  Método que permite reducir los costos, es definiendo estrato.

82 Para conformar los estratos es importantes que los elementos sean homogéneos en su interior, diferentes entre si en propiedades y tamaño. Estrato 1 Estrato 2 Estrato 3 Estrato 4 Nota: Los estratos más grandes tendrán mayor probabilidad de ser representados

83 Tipos de estratos 1.Afijación uniforme: selecciona la misma cantidad de elementos en cada uno de los estratos (Ei) 2.Afijación óptima: caso particular del anterior, consiste en seleccionar la muestra de tal manera que los estrato más heterogéneos tengan mas casos. Ello requiere conocer la variabilidad entre estratos.

84 Afijación uniforme  Selecciona la misma cantidad de elementos en cada uno de los estratos (Ei)  Ajusta convencionalmente los tamaños de los estratos muestrales para aumentar la eficiencia de la selección de los grupos más pequeños.  Esta condición se deberá tener en cuenta al hacer inferencias (corregir las inferencias).

85 Muestreo estratificado no proporcional Ejemplo: estudio comparativo de accesos a servicios de salud entre personas que viven en municipios o comunidades pequeñas, medianas y grandes. Si MAS, muy poca gente de municipios pequeños. Muestras muy pequeñas ⇒ error muestral grande ⇒ imposible realizar inferencias y análisis comparativo. Solución, realizar muestreo estratificado con muestras del mismo tamaño de personas que viven en municipios pequeños, medianos y grandes.

86 1. Afijación proporcional:  El número de unidades de análisis, seleccionado de cada estrato, es proporcional al número de elementos en cada estrato para la población.  Establece la distribución proporcional del universo y aplica esta distribución a su tamaño muestral para conformar estratos en la muestra.  Se eligen aleatoriamente los elementos al interior de cada estrato hasta ajustar su tamaño.  Es mejor que el MAS pues disminuye el error estándar de la medición muestral.

87 Muestreo estratificado proporcional Ejemplo: muestras de estudiantes. Se sospecha que el genero influye en la respuesta. Se conoce la proporción de hombres y mujeres en la población. Muestreo Estratificado Proporcional Calcular numero de hombre y mujeres con la proporción poblacional. MAS de hombres y mujeres. Resultado. “Mejor” que la aplicación de MAS Error muestral puede ser menor al existente con MAS.

88 Afijación óptima  Caso particular del anterior, consiste en seleccionar la muestra de tal manera que los estrato más heterogéneos tengan mas casos. Ello requiere conocer la variabilidad entre estratos.  Selecciona el tamaño de los estratos en función de la desviación estándar de cada uno de ellos, de tal manera que los estratos más heterogéneos (mayores varianzas) aporten más casos a la muestra total.

89 Ejemplo, suponga que se realiza una encuesta donde a una empresa cuenta con tiempo y dinero suficientes para entrevistar n= 40 hogares y decide seleccionar m.a de tamaño n 1 =20 del pueblo A, n 2 = 8 del pueblo B y n 3 = 12 del área rural. Se seleccionan las muestras irrestrictas aleatorias y se realizan las entrevistas. Los resultados, de mediciones del tiempo en horas por semana que se ve TV se muestran en las siguientes tablas. ( A) Estime el tiempo promedio que se ve televisión, en horas por semana para (a) los hogares de la Región I y (b) hogares de la Región II. B). Fije un límite para el error de estimación. C). Estime . D). Fije un límite para el error de estimación. E1 Región I E2 Región II E3 Región III 35 28 26 41 43 29 32 37 36 25 29 31 39 38 40 45 28 27 35 34 27 4 49 10 15 41 25 30 8 15 21 7 14 30 20 11 12 32 34 24 E1E2E3

90 Solución: A). de los valores de la segunda tabla y usando Es la mejor estimación del número promedio de horas por semana en que en todos los hogares de la ciudad ve TV. La estimación de la media poblacional, con un limite para el error de estimación al nivel del 0.95, esta dada por

91  Entonces se estima que el número promedio de horas que se ve televisión en los hogares del ciudad= 27.7 hrs.  Error de estimación= 2.8 hrs con una probabilidad de 0.95. B). Las n=8 observaciones del E2 provienen de una MAI, por lo tanto la estimación del tiempo promedio de ver TV en la Región II, su error de estimación es:  Se observa un límite grande para el error de estimación debido a la presencia de una varianza amplia y un tamaño de “n” pequeño.  No obstante, la estimación de µ es buena pero la media del estrato no.  Por lo tanto, si se desea una estimación para un estrato en particular, su “n” debe ser lo bastante grande para proporcionar un límite de error de estimación razonable.

92 C). Se obtiene: Con varianza estimada: D). Por lo que, la estimación del total del número de horas que la población dedica a ver TV, con un limite para el error de estimación será:

93 Ejemplo, de la encuesta anterior sugiere que las varianzas de los estratos del ejemplo 1 son aproximadamente.  Estimar µ.  Obtener un límite en el error de estimación igual a 2 horas Si las fracciones asignadas son  Nota suponga que toma un igual número de observaciones para cada Ei. Solución  Limite de error de estimación de 2 hrs implica que  Por lo tanto D = 1

94 Se sabe que: Por lo tanto N 2 D = Entonces: Por lo que se debe tomar n= 57 observaciones distribuidas de la siguiente manera:

95  Por otra parte, la empresa tiene el interés de estimar la P de hogares en el ciudad donde se ve el programa X. Recuerde que la Cd. Esta dividida en tres estratos: E1, E2, y E3.  Los estratos contienen hogares, respectivamente. Una muestra aleatoria estratificada de n = 40 se toma una MIA de cada estrato de la siguente manera:  Las entrevistas son tomadas en los 40 hogares muestreados; los resultados se presentan en la siguiente tabla. a). Estimar de hogares donde se ve el programa X. b). Fije un límite para el error de estimación. EinNúm. de hogares donde se ve el programa X p 1n 1 = 20160.80 2n 2 = 820.25 3n 3 = 1260.50

96 Solución Las varianzas para cada Ei: Entonces la varianza es Error de estimación es Límite del error de estimación:

97 IV Muestreo por conglomerados

98 Muestreo por conglomerados A veces muestreo aleatorio simple, sistemático o estratificado no es posible Requieren listas (totales o por estratos) En muchos casos: esas listas no existen (o no son accesibles legalmente) Pero sí existen listas de “grupos heterogéneos de sujetos”, o conglomerados Hacemos muestreo aleatorio de conglomerados Dentro de los conglomerados elegidos: todos los elementos, o muestreo aleatorio simple

99 Ejemplo: estudio sobre estudiantes universitarios españoles No hay lista de todos los estudiantes, ni por estratos Pero sí: lista de universidades y facultades Muestreo por conglomerados: ◆ Muestreo aleatorio simple de universidades ◆ Idem de facultades ◆ Idem de grupos ◆ Dentro del grupo (ya hay lista): todos, o muestreo aleatorio simple

100 Solución muy práctica cuando conglomerados definidos geográficamente: enorme reducción costes extracción datos (viajes, tiempo, etc...) Diferencia con estratos: Estratos son homogéneos internamente; interesa conocer diferencias entre estratos Conglomerados son heterogéneos internamente; no interesa particularmente diferencias; es sólo un medio de tomar datos más económico y simple

101 Requisitos: los conglomerados lo más heterogéneos posibles (como la población) internamente; muy parecidos entre sí. Esto nunca es del todo así Sobre todo conglomerados geográficos: gente igual vive junta (barrios, ciudades). Resultados: más error muestral que muestra aleatoria simple Métodos inferencia: diferentes

102 V Muestreo polietápico

103 Muestreo polietápico Combinación de varios métodos de muestreo Para poblaciones complejas Diferentes pasos en la selección de la muestra que usan diferentes métodos Ejemplo: ◆ Municipios de Castilla-La Mancha son conglomerados, pero heterogéneos entre sí ◆ Hacer “estratos de conglomerados” por tamaño de la población, o por actividad económica dominante ◆ Seleccionar aleatoriamente, dentro de cada estrato, un número de municipios (muestreo estratificado por conglomerados)

104 Dentro de cada municipio, las manzanas son conglomerados Distribuir las manzanas de cada municipio en estratos por niveles de renta, u otro indicador conocido Hacer muestreo aleatorio de manzanas en cada estrato de cada municipio (otra vez: muestreo estratificado por conglomerados) En cada manzana hacer un muestreo sistemático de casas En cada casa hacer un muestreo aleatorio simple de los individuos residentes en la casa

105 Muestreos no probabilísticos Aquellos en los que no es posible calcular la probabilidad de las diferentes muestras NO ES POSIBLE aplicar métodos de estadística inferencial cuando usamos estos muestreos. Típico ejemplo: muestra voluntaria ◆ Cupón en revista, que pide contestación por correo ◆ Oyentes de programa de radio o televisión, a los que se pide que llamen a un teléfono ★ Doble distorsión: el programa y el sentimiento intenso sobre el tema NO es una muestra representativa: es una muestra sesgada. AUNQUE LLAMEN CIENTOS DE MILES DE PERSONAS!!!!

106 Otro ejemplo: muestreo “de calle”: entrevistador se planta en una esquina y entrevista a gente que pasa. Muestra sesgada: lugar, hora, día de la semana, proceso de “selección” por el entrevistador de a quién parar... Otro ejemplo: Muestreo de conveniencia: empresa que encuesta a sus clientes para conocer las opiniones de los compradores de un producto; sindicato que encuesta a sus afiliados para conocer opiniones de los trabajadores. Todos estos ejemplos: error o sesgo de selección NO se pueden aplicar métodos de estadística inferencial NO son muestras representativas

107 VI No probabilísticos

108 Muestreo accidental. El investigador elige a aquellos individuos que están a mano. No se utilizan ningún criterio especial de elección.

109 Muestreo por cuotas. Consiste en facilitar al entrevistador el perfil de las personas: – Criterio. – Elección específica. – Cumplan con el perfíl. Se aplica en la última fase del muestreo.

110 Muestreo intencionado. Se basa en una buena estrategia y el buen juicio del muestreo. Frecuentemente se toman elementos que se juzgan típicos o representativos de la población, suponiendo que los errores en la selección se compensan unos con otros. Problema: comprobación de si los casos típicos lo son en realidad, y como afecta a esos casos típicos los posibles cambios que se producen.

111 Bibliografía 1.COCHRAN, William. "Técnicas de Muestreo". Compañía Editorial Continental, S.A. México. 1.985.TécnicasMéxico 2.DOWNIE, M. "Métodos Estadísticos Aplicados". Harper & Row Publishers INC. México. 1.973 3.LEWIS, Alvin. "Bioestadística". Compañía Editorial Continental, S.A. México. S/F. 4.NETER y Otros. "Fundamentos de Estadística para Negocios y Economía". Compañía Editorial Continental, S.A. México. S/F.Negocios Economía 5.STEVENSON, William. "Estadística para Administración y Economía". HARLA. México. 1.981.Administración


Descargar ppt "Universidad Autónoma del Estado de México Centro Universitario UAEMex Lic. En Relaciones Económicas Internacionales Unidad de aprendizaje: Estadística."

Presentaciones similares


Anuncios Google