05 MUESTREO APLICADO EN LAS ENCUESTAS

Slides:



Advertisements
Presentaciones similares
DISEÑO DE EXPERIMENTOS EXPERIMENTOS DE COMPARACIÓN SIMPLE
Advertisements

ANOVA DE UN FACTOR.
ESTIMACION DE PARAMETRO
CONTENIDOS Teoría del muestreo ¿Cómo seleccionar una muestra?
Estadística Unidad III
Variable Aleatoria Continua. Principales Distribuciones
De la muestra a la población
Estimación de parámetros poblacionales
Introducción al tema El único método científico para validar conclusiones sobre un grupo de individuos a partir de la información que nos proporciona un.
FRANCISCO JAVIER RODRÍGUEZ
Universidad de Chile Facultad de Ciencias Químicas y Farmacéuticas
PRUEBAS DE HIPOTESIS HIPOTESIS
Estimación por intervalos de confianza.
METODOLOGÍA DE INVESTIGACIÓN Titular: Agustín Salvia
Estimación por Intervalos de confianza
Uso de pruebas estadísticas paramétricas y no paramétricas
2. ESTIMACIÓN Depto. Matemáticas – IES Elaios
Giancarlo Vivanco Juan Pablo Villarroel
Nombre: Israel Espinosa Jiménez Matricula: Carrera: TIC Cuatrimestre: 4 Página 1 de 5.
MUESTREO DE ACEPTACIÓN DE LOTES POR VARIABLES
MEDIDAS DE DISPERSIÓN:
Tests de hipótesis Los tres pasos básicos para testear hipótesis son
UNIVERSIDAD INCA GARCILASO DE LA VEGA
Inferencia Estadística
CHI-CUADRADO Y DISTRIBUCION NORMAL
VARIABLE ALEATORIA Y DISTRIBUCION DE PROBABILIDAD
INTERVALO DE CONFIANZA
Elementos Básicos de Probabilidad y Estadística Javier Aparicio División de Estudios Políticos, CIDE Julio 2009
Unidad V: Estimación de
ESTADISTICA TEMA y 223.
ESTIMACION En varios pasajes de este libro hemos planteado la dificultad que se confronta en las investigaciones, de llegar a conclusiones sobre una población.
Gerenciamiento Técnico de Proyectos
ANALISIS DE FRECUENCIA EN HIDROLOGIA (2)
Estimación Sea una característica, un parámetro poblacional cuyo valor se desea conocer a partir de una muestra. Sea un estadístico ( función.
DISTRIBUCION NORMAL Mario Briones L. MV, MSc 2005.
Coeficiente de Variación
Introducción La inferencia estadística es el procedimiento mediante el cual se llega a inferencias acerca de una población con base en los resultados obtenidos.
Universidad Nacional de Colombia Curso Análisis de Datos Cuantitativos.
Inferencia Estadística
Estadística para administradores
ESTIMACIÓN ESTADÍSTICA POR INTERVALO DE CONFIANZA
Unidad V: Estimación de
Capítulo 1. Conceptos básicos de la Estadística
Pruebas de hipótesis.

Tema 6: Distribuciones estadísticas
Tipos de Variables.- Cualitativas. Describen cualidades de los elementos de la muestra. Nominales. Categorías excluyentes y sin orden. (Ej. Sexo) Ordinales.
Elementos Básicos de Probabilidad y Estadística
Estimación y contraste de hipótesis
Análisis de los Datos Cuantitativos
INTERVALOS DE CONFIANZA
BASES PARA EL RAZONAMIENTO EN ESTADÍSTICA INFERENCIAL
ESTIMACIÓN DE PARÁMETROS
INTERVALO DE CONFIANZA
Ejercicios Dado un conjunto de datos, aplicar el Criterio de Fourier para desechar los posibles valores atípicos.
Prueba de Hipótesis Una hipótesis estadística es un supuesto que se establece sobre las características de una distribución poblacional El estudio se plantea.
La doctora Inferencia Estadística: Efectos secundarios
INFERENCIA ESTADÍSTICA
DEFINICIÓN DE NORMALIDAD MEDIDAS DE DESCRIPCIÓN DE DATOS
UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE CIENCIAS ECONOMICAS INFERENCIA ESTADISTICA TEMA: ESTIMACION PUNTUAL, PROPIEDADES DE LAS ESTIMACIONES;
UNIDAD I.- Analisis 3.4 Prueba de Hipotesis.
7. Distribución normal Sin duda la distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus aplicaciones.
TAMAÑO DE LA MUESTRA. Para definir el tamaño de la muestra se debe tener en cuenta los recursos disponibles y las necesidades del plan de análisis, el.
DISTRIBUCIÓN “t” DE STUDENT
Estimación Estadística Tares # 3. Estimación Estadística Conjunto de técnicas que permiten dar un valor aproximado de un parámetro de una población a.
Estadística Inferencial
Estimación estadística
Medidas de tendencia central
TAMAÑO DE LA MUESTRA Alvaro Alfredo Bravo Dpto. de Matemáticas y Estadística Universidad de Nariño - Colombia.
Viviana Acosta Estadística II. Que es Es una distribución de probabilidad que surge del problema de estimar la media de una población normalmente distribuida.
Transcripción de la presentación:

05 MUESTREO APLICADO EN LAS ENCUESTAS Mag. Renán Quispe Llanos Enero, 2005

VARIABLE ALEATORIA DISCRETA Una variable Aleatoria Discreta tiene la forma: X ={ X1 con probabilidad p1 X2 con probabilidad p2 . Xn con probabilidad pn Una Función de Probabilidad Discreta P (X) Se define como: P (X=x) = a alguna expresión que contiene a x y que produce la probabilidad de observar a x, =P (x)

VARIABLE ALEATORIA CONTINUA Una variable aleatoria Continua está dada sobre un rango continuo de valores, donde una Función de Probabilidad Continua P (X), se define como: 1. P (x) es un valor entre 0 y 1 para todo rango de x de la forma a ≤ x ≤ b. 2.

Definición: Es una función no negativa de integral 1. FUNCION DE DENSIDAD Definición: Es una función no negativa de integral 1. Se puede pensar como la generalización del histograma con frecuencias relativas para variables continuas. b a

La curva normal adopta un número infinito de formas, determinadas por sus parámetros y expresada por la función de densidad: f(x) =  2 x  e  donde:  (media) y  (desviación típica) son parámetros de la distribución e = 2.718 (base de Ln) x = valores observados de la variable en estudio

Características de la distribución Normal Tiene forma de campana, es asintótica al eje de las abscisas (para x =  ) Simétrica con respecto a la media () donde coinciden la mediana (Mn) y la moda (Mo ) Los puntos de inflexión tienen como abscisas los valores        +   -   +  , Mo, Mn

Es una traslación , y un cambio de escala de la variable original ¿Cómo calcular probabilidades asociadas a una curva normal específica? Dado que tanto  como  pueden asumir infinitos valores lo que hace impracticable tabular las probabilidades para todas las posibles distribuciones normales, se utiliza la distribución normal reducida o tipificada ?? x -  Se define una variable z =  Es una traslación , y un cambio de escala de la variable original

La nueva variable z se distribuye como una NORMAL con media  = 0 y desviación típica  = 1 Una regla empírica indica que en cualquier distribución normal las probabilidades delimitadas entre :  1  68 %  2  95 %  3  99 % 99% 68% 95% 99% z -3 -2 -1 0 1 2 3

Pero para valores intermedios esta regla es insuficiente. Las probabilidades de la variable tipificada (z) están tabuladas para los diferentes valores de la variable. Entonces una vez transformada la variable a valores de z se busca en la tabla el área correspondiente

Hay varios tipos de tablas de la distribución normal La que se explica aquí representa las áreas para los diferentes valores de z desde 0 hasta + Los valores negativos de z NO están tabulados, ya que la distribución es simétrica +

*Margen izquierdo : Los enteros de z y su primer decimal la tabla consta de: * Margen superior: segundo decimal * Cuerpo de la tabla: áreas correspondientes, acumuladas, desde 0 hasta 3.99 0 1 2 3 4 5 6 7 8 9 0.0 0.1 0.2 0.3 0.4 0.5 .0000 .0040 .0080 .0120 .0160 .0199 .0239 .0279 .0319 .0359 .0398 .0438 .0478 .0517 .0557 .0596 .0363 .0675 .0675 .0754 .0793 .0832 .0871 .0910 .0948 .0987 .1026 .... ...... ...... .1179 ..... ...... ...... ...... .1554 .... ..... .... .1915 ....

EJEMPLOS: 1.-¿Cuál es la probabilidad de que un valor de z esté entre 0 y -2.03? 2.-¿Cuál es la probabilidad de que un valor de z esté entre -2.03 y +2.03? 4. Hallar P ( -0.34 < z < ) 3. Hallar P( z >1.25 ) 5. Hallar P ( 0.34 < z < 2.30 )

¿Cuál es la probabilidad de que un valor de z esté entre 0 y -2.03? ejemplo 1 ¿Cuál es la probabilidad de que un valor de z esté entre 0 y -2.03? ? Cómo la curva es simétrica P (-2.03 < z < 0) = P (0 < z < 2.03) z -3 -2 -1 0 1 2 3

¿Cuál es la probabilidad de que un valor de z esté entre 0 y -2.03? ejemplo 1 ¿Cuál es la probabilidad de que un valor de z esté entre 0 y -2.03? Se busca en la tabla el área correspondiente a z = 2.03 1 2 3 4 1.8 1.9 2.0 2.1 0.47882 47. 88% z -3 -2 -1 0 1 2 3

ejemplo 2 ¿Cuál es la probabilidad de que un valor de z esté entre -2.03 y 2.03 ? En el ejemplo 1, vimos que la probabilidad de que z estuviera entre 0 y 2.03= 0.47882 La misma área hay entre 0 y -2.03 , por lo tanto P ( -2.03< z< 2.03) = 0.95764 47.88% ? 47.88% 95.76% z -3 -2 -1 0 1 2 3

¿Cuál es la probabilidad de que un valor de z sea mayor a 1.25 ? ejemplo 3 ¿Cuál es la probabilidad de que un valor de z sea mayor a 1.25 ? 1.- La probabilidad de 0 < z < + = 0.500 2.- La probabilidad de 0 < z < 1.25 = 0.39435 3.- La probabilidad de z > 1.25 = 0.500 - 0.39435= 0.10565 50% 39.44% 10.56% ? z -3 -2 -1 0 1 2 3

Hallar P( -0.34 < z <  ) ejemplo 4 Hallar P( -0.34 < z <  ) 63.31% P(0 < z <0.34) = 0.13307 = P(-0.34 < z < 0) P (0 < z <  ) = 0.50000 P( -0.34 < z < ) = 0.13307 + 0.50000 = 0.63307 13.31% 50% z -3 -2 -1 0 1 2 3

ejemplo 5 Hallar P( 0.34 < z < 2.30) 35.62% z -3 -2 -1 0 1 2 3

EJEMPLO Sea una variable distribuida normalmente con media  = 4 y desviación típica  = 1.5. ¿Cuál es la probabilidad de encontrar un valor x  6 (P(x  6 ))?

 = 4  = 1.5 Hallar P ( x > 6 ) 1.- transformar x en un valor de z z = (6 - 4)/1.5 = 1.33 2.- Hallar P ( 0 < z < 1.33) = 3.- 0.5000 - 0.40824 = 0.5 0.40824 ? 0.09176 x 6 -0.5 1 2.5 4 5.5 7 8.5 -3 -2 -1 0 1 1.33 2 3 z

¿Cómo hallar un valor de x, dada la probabilidad? Hasta ahora vimos como dado un valor x de la variable, hallar probabilidades transformando (estandarización) la variable en valores de x -   z = ¿Cómo hallar un valor de x, dada la probabilidad? Ejemplo: Sea una variable distribuida normalmente con  =4 y  =2 . Hallar el valor de x que deja por encima de él un 38.20% (0.3820) Se debe desestandarizar : x = z  +  Se busca en la tabla de acuerdo al área. Con su signo 0.5000 - 0.382 = 0.118  Se busca en la tabla el valor más aproximado :0.1179 corresponde a z =+ 0.30 38.20% Sustituyendo en la fórmula 0.30x2+4 =4.60 x = ? 4.60

TABLA: DISTRIBCION t DE ESTUDENT

TEORIA DE LA ESTIMACION La estadística aborda dos tipos de problemas: La Teoría de la estimación es parte de la inferencia estadística que sirve para determinar el valor de los parámetros poblacionales Estas formas de estimación son complementarias. La estimación puntual representa el primer paso para obtener la estimación por intervalos, que es la que siempre se debe de obtener

El Concepto de Distancia para un Estimador El “mejor” estimador es el que está más cercano al parámetro de la población que es estimado.

Cuándo un estimador es bueno? Cuando su varianza y el sesgo al cuadrado son pequeños.

Contraste de Hipótesis Contrastar una Hipótesis Estadísticamente es juzgar si cierta propiedad supuesta para una población es compatible con lo observado en una muestra de ella. Alternativas: Hipótesis A v/s Hipótesis B, donde A y B no pueden cumplirse simultáneamente. Tipos de Hipótesis: Hipótesis Alternativas Hipótesis Anidadas Anidadas: Hipótesis A y B, donde A es un caso especial de B.

 Valor crítico o tabulado HIPOTESIS A CONTRASTAR Se definen:  medida de discrepancia con una distribución de probabilidad conocida  Regla de decisión(nivel de significación a)  Valor crítico o tabulado datos de la muestra Se calcula una medida de discrepancia Valor calculado Se comparan los valores calculado con tabulado ¿se rechaza Ho? H1 SI NO Se extraen conclusiones

Población (podría ser una distribución de cualquier forma, como está) Media = $15,000

Consultoría Virgen del Carmen S.A.

Consultoría Virgen del Carmen S.A.

Población y Muestra Se tiene información sobre los ingresos mensuales en soles correspondientes una población de 6 personas que trabajan en la pequeña empresa CVC. Se desea conocer el ingreso promedio y la dispersión de los datos alrededor del promedio (desviación standart): INDIVIDUO INGRESO S/. A 4800 B 3100 C 2200 D 1900 E 1500 F 900 Ingreso medio 2400 Varianza: Desviación estándar: Coeficiente de Variación: El ingreso promedio de las 6 personas es de 2,400 nuevos soles mensual con una desviación típica de 1264.91 que al comparar con el ingreso promedio nos muestra una elevada dispersión que en términos relativos representa el 52.7%.

La cuasivarianza de la población es de la siguiente manera: La cuasivarianza se aplica para fines de utilizarlo como alternativo de la varianza por las propiedades estadísticas relacionadas con su estimador. La cuasivarianza en la muestra es un estimador insesgado de la cuasivarianza poblacional.

Siendo los ingresos de la población lo siguiente: Con el propósito de analizar la relación entre todas las muestras posibles y la población se realiza el siguiente ejercicio. La muestra podría ser de tamaño 2, 3 o 4, pero se trabajará con una muestra de tamaño 3. Se halla todas las muestras posibles de tamaño 3 sin reposición y se calcula su respectiva media: Siendo los ingresos de la población lo siguiente: A B C D E F 4800 3100 2200 1900 1500 900 Se trabajará con las 20 muestras posibles de tamaño 3

Promedio de Varianzas Promedio de medias Suma Nº de muestra Muestras Posibles Varianza Muestral 1 ABC 3367 934444 1743333 2 ABD 3267 751111 2123333 3 ABE 3133 537778 2723333 4 ABF 2933 284444 3823333 5 ACD 2967 321111 2543333 6 ACE 2833 187778 3023333 7 ACF 2633 54444 3943333 8 ADE 2733 111111 3243333 9 ADF 2533 17778 4103333 10 AEF 2400 4410000 11 BCD 390000 12 BCE 2267 643333 13 BCF 2067 1223333 14 BDE 2167 693333 15 BDF 1967 1213333 16 BEF 1833 1293333 17 CDE 1867 123333 18 CDF 1667 463333 19 CEF 1533 423333 20 DEF 1433 253333 2,400 6400000 1920000 Promedio de Varianzas Promedio de medias Suma

Al calcular el valor promedio (valor esperado) de las medias muestrales de todas las muestras posibles su valor reproduce el promedio poblacional. El error de muestreo de estimar la media poblacional

Al calcular el valor promedio (valor esperado) de las medias muestrales de todas las muestras posibles su valor reproduce el promedio poblacional. El error de muestreo de estimar la media poblacional

Estimación del Error Muestral Una forma alternativa de obtener el error de estimación es a partir de la fórmula siguiente, para lo cual se requiere conocer, el tamaño de la población N, el tamaño de la muestra n, y el valor de la varianza poblacional :

Entonces, tanto el promedio poblacional como el proveniente de todas las muestras posibles son iguales. Del mismo modo hay una igualdad entre la desviación estándar de la media muestral respecto a la media poblacional y el error estándar de la media muestral o error de muestreo. Como en la práctica sólo se dispone de información de una muestra, se procede a estimar la cuasivarianza poblacional con la muestra , y luego se reemplaza como estimador de la Cuasivarianza poblacional en la formula del Sx

Nº de muestra Muestras Posibles Error standart Margen de error 1 ABC 539 2318 1049 5685 2 ABD 595 2558 709 5825 3 ABE 674 2897 236 6030 4 ABF 798 3433 -499 6366 5 ACD 651 2800 167 5766 6 ACE 710 3052 -219 5886 7 ACF 811 3486 -853 6119 8 ADE 735 3161 -428 5895 9 ADF 827 3556 -1023 6089 10 AEF 857 3686 -1286 6086 11 BCD 255 1096 1304 3496 12 BCE 327 1408 859 3675 13 BCF 452 1942 125 4008 14 BDE 340 1462 705 3628 15 BDF 450 1934 33 3900 16 BEF 464 1996 -163 3830 17 CDE 143 616 1250 2483 18 CDF 278 1195 472 2862 19 CEF 266 1142 391 2676 20 DEF 205 884 550 2317

Qué es el “error muestral”? . . . . Promedio muestral Parámetro La magnitud de esa variación se la denomina Error Muestral, para un estadístico, un tamaño de muestra y un tipo de diseño dados.

Qué es el “error muestral”? B) Estimación Muestral Parámetro Tamaño de muestra de A menor que de B El Error Muestral para un estadístico y un tipo de diseño dado disminuye según aumente el tamaño de la muestra

Error de muestreo (SX): Es el error muestral expresado en unidades de la variable que se está analizando. Es calculada con los datos de una muestra. Es una medida de su variación en todas las muestras posibles. Mide el grado de precisión de la estadística basado en la muestra Coeficiente de Variación (CV): Es el error muestral expresado en términos relativos.

Distribución muestral de las medias del tamaño muestral n = 400 Distribución normal Media = $ 15, 000

Cómo se estima el “Error Muestral”? A partir de la desviación estándar estimado con los datos de la muestra.

Cómo se estima el “Error Muestral”? A partir de la desviación estándar estimado con los datos de la muestra.

Cuando tendremos “buena” precisión? dispersión débil tasa de muestreo cercana a 1 tamaño de muestra grande

Qué es el “margen de error” ? 95% de las estimaciones sobre todas las muestras posibles Márgenes de Error Tamaño de muestra fijo, bajo un mismo diseño muestral y para un porcentaje de muestras igual a 95%

Cómo se estima el “Margen de Error” para una muestra con tamaño dado? A partir del desvío estándar estimado, una constante que depende del nivel de confianza y el tamaño de la muestra. Para el caso de un nivel de confianza del 95% se tiene:

Qué es el “Nivel de Confianza” ? (cont.) Nivel de Confianza del 95% Márgenes de Error El Nivel de Confianza señala de alguna forma el porcentaje de muestras “buenas” que nos permitimos

Márgenes de Error y Nivel de Confianza para tamaño A Márgenes de Error para tamaño B Márgenes de Error para un mismo nivel de confianza (95%) pero con tamaños de muestra distintos

INTERVALO DE CONFIANZA “S” conocida “S” desconocida Es un rango de posibles valores para el valor del parámetro. Ese rango se determina fijando un valor superior y otro inferior a partir del margen de error deseado.

Qué es un “Intervalo de confianza” al 95%? Caso: N grande: Intervalo de Confianza

Calculo de Error Standart, Margen de Error e Intervalo de confianza

TABLA: DISTRIBCION t DE ESTUDENT

TAMAÑO DE LA MUESTRA Deducción del Tamaño: A partir del margen de Error

TAMAÑO DE LA MUESTRA Cómo razono para calcular el tamaño de una muestra simple al azar para un promedio o proporción? (cont.) Tanto para el caso de un promedio (de edad, de ingreso, de gasto, de bovinos, de horas frente al televisor) o bien para una proporción (% de casados, % de niños en jardín de infantes, % de fumadores) usualmente se acompaña a la estimación con el + - el margen de error

Relación entre los elementos que determinan el tamaño de una muestra n tamaño de la muestra Znivel Constante s Dispersión c margen de error

Nivel de Confianza del 95% Cómo razono para calcular el tamaño de una muestra simple al azar para un promedio o proporción? Qué bueno sería que mí muestra sea una de las “buenas” o sea que mi estimación esté entre las que componen el 95% de las estimaciones favorables !! Nivel de Confianza del 95%

O sea, (mi estimación - el parámetro) <= c Cómo razono para calcular el tamaño de una muestra simple al azar para un promedio o proporción? (cont.) Para esto fijo el máximo valor (C) para la diferencia entre mi estimación y el valor del parámetro, y a esto llamo mi margen de error deseado Nivel de Confianza del 95% C C O sea, (mi estimación - el parámetro) <= c

Qué es el “Nivel de Riesgo” ? (cont.) Nivel de Riesgo del 5% Márgenes de Error El Nivel de Riesgo señala de alguna forma el porcentaje de muestras “malas” que nos permitimos

ESTIMACION DEL TAMAÑO DE LAS MUESTRAS EN EL INEI Tamaño de muestra para la estimación de la media: Tamaño de muestra para la estimación de las proporciones:

1.- DETERMINACIÓN DEL TAMAÑO DE LA MUESTRA Precisión Es considerada en función de la variabilidad de los indicadores asociados a las categorías del estudio más importantes de la encuesta. Coeficiente de Variación (CV%): Es el error muestral expresado en términos relativos. Se define como la razón entre el error estándar y la estadística calculada de la muestra. CV CALCULADO PRECISIÓN OBTENIDA Hasta 5% Muy Buena De 5% a 10% Buena De 10% a 20% Aceptable Más de 20% No confiable (sólo referencial)

Errores Relativos (CV) Para diferentes valores de “P”, según Tamaño de Muestra

FASES PARA DETERMINAR EL DISEÑO DE UNA MUESTRA C. Niveles de inferencia Los niveles de inferencia determinan el tamaño final de la muestra. Puede estar referido al nivel de desagregación geográfica, o al nivel de la desagregación categórica en el cual se quieren presentar los resultados. El detalle geográfico o temático en el cual se quiere presentar la información con un nivel de confianza aceptable, ya sea del 5% o 1%, es un elemento muy importante para determinar el tamaño de la muestra final. Por ejemplo si en términos geográficos, se desea que los niveles de inferencia sean a nivel de áreas que contengan más de un distrito, necesitará de un tamaño de muestra menor, que si se presentara resultados confiables a nivel distrital.

¿Puede estimarse P con cierto grado de confianza? Si Si No Use P = como estimación, porque un tamaño menor de la muestra es satisfactorio si P .5 Sea conservador; use P = .5 en el calculo del tamaño de la muestra. Determine el máximo error E, que está dispuesto a aceptar entre las proporción de la muestra y la proporción de la verdadera población. Calcule el nivel de confianza que desea en la proporción de la muestra, que se encuentre dentro de E en la proporción de la población.

FASES PARA DETERMINAR EL DISEÑO DE UNA MUESTRA PASOS ESPECÍFICOS PARA DETERMINAR EL TAMAÑO DE LA MUESTRA 1º se tiene que fijar los niveles de precisión a nivel del lugar donde se realizará el estudio en función del cálculo del CV o error relativo. Se fija el (los) principales indicador(es) socio-económico(s) de referencia para estimar el tamaño de la muestra. Para hacer en forma simultánea varios estudios ad-hoc, se requieren de variables específicas para determinar por cada uno los tamaños de muestra. En estos casos la determinación del tamaño de la muestra se hace en función de todas las variables o indicadores socioeconómicos importantes. Una de las mecánicas a seguir es tomar la categoría con mayor variabilidad para determinar el tamaño de la muestra, ello asegura la representatividad para las otras categorías.

Consultoría Virgen del Carmen S.A.

Consultoría Virgen del Carmen S.A.

Consultoría Virgen del Carmen S.A.