La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

LOGO Muestreo Pedro Godoy G.. LOGO Inferencia estadística La Inferencia Estadística es aquella rama de la Estadística mediante la cual se trata de sacar.

Presentaciones similares


Presentación del tema: "LOGO Muestreo Pedro Godoy G.. LOGO Inferencia estadística La Inferencia Estadística es aquella rama de la Estadística mediante la cual se trata de sacar."— Transcripción de la presentación:

1 LOGO Muestreo Pedro Godoy G.

2 LOGO Inferencia estadística La Inferencia Estadística es aquella rama de la Estadística mediante la cual se trata de sacar conclusiones de una población en estudio, a partir de la información que proporciona una muestra representativa de la misma.

3 LOGO  La muestra se obtiene por observación o experimentación  La necesidad de obtener un subconjunto reducido de la población es obvia si tenemos en cuenta los costes económicos de la experimentación o el hecho de que muchos de los métodos de medida son destructivos.

4 LOGO

5  La muestra ha de ser representativa de la población, en el sentido de que debe tener una composición similar en cuanto a la proporción de distintas características. Por ejemplo, una muestra para un estudio de estaturas no incluirá solamente individuos bajos o altos, sino individuos de ambas clases en proporciones similares a las de la población. La representatividad de la muestra queda garantizada con la elección correcta del método de muestreo.

6 LOGO

7 Muestra Una muestra es un subconjunto del cual se espera obtener información y a partir del que se infieren ciertas características de la población o conjunto objeto de estudio. Así, la muestra escogida debe ser representativa de la población. En la elección de la muestra debe estar presente la aleatoriedad en el proceso, es decir, cada uno de los componentes de la población debe tener las mismas Posibilidades de ser escogidos como parte de la muestra.

8 LOGO Por ejemplo, si al finalizar un partido de fútbol en el que participan 22 jugadores, se seleccionan al azar 4 de ellos ( dos de cada equipo) Para ser sometidos al control antidopaje. ¿todos los jugadores tienen igual probabilidad de ser elegidos?

9 LOGO 9 Técnicas de muestreo Cuando elegimos individuo de una población de estudio para formar muestras podemos encontrarnos en las siguientes situaciones: –Muestreos probabilistas Conocemos la probabilidad de que un individuo sea elegido para la muestra. Interesantes para usar estadística matemática con ellos. –Muestreos no probabilistas No se conoce la probabilidad. Son muestreos que seguramente esconden sesgos. En principio no se pueden extrapolar los resultados a la población. –A pesar de ello una buena parte de los estudios que se publican usan esta técnica. En adelante vamos a tratar exclusivamente con muestreos con la menor posibilidad de sesgo (probabilistas): aleatorio simple, sistemático, estratificado y por grupos.

10 LOGO Muestreo aleatorio simple (m.a.s.) Se eligen individuos de la población de estudio, de manera que todos tienen la misma probabilidad de aparecer, hasta alcanzar el tamaño muestral deseado. Se puede realizar partiendo de listas de individuos de la población, y eligiendo individuos aleatoriamente con un ordenador. Normalmente tiene un coste bastante alto su aplicación. En general, las técnicas de inferencia estadística suponen que la muestra ha sido elegida usando m.a.s., aunque en realidad se use alguna de las que veremos a continuación.

11 LOGO Para seleccionar una muestra utilizando el muestreo aleatorio sistemático, puedes seguir los siguientes pasos 1.Ordena los elementos de la población y asígnales un número correlativo 2. Calcula la parte entera del cociente r entre la cantidad de elementos N de la población y el número de elementos n de la muestra, es decir, 3. Selecciona aleatoriamente un número m entre 1 y r y aplica los pasos anteriores para obtener los otros elementos de la muestra de la siguiente manera:

12 LOGO Ejemplo : Se quiere hacer una encuesta a 400 estudiantes sobre sus preferencias deportivas. Para ello, se selecciona de manera sistemática una muestra de 15 estudiantes. 1° Ordena los elementos de la población y asígnales un número correlativo en este caso del 1 al 400. 2. La parte entera del cociente entre la cantidad de elementos de la pobalción y la muestra es 3 selecciona aleatoriamente un número entre 1 y 26, por ejemplo, 9. Luego, la muestra de 15 estudiantes se forma con los numerados por:

13 LOGO Muestreo aleatorio estratificado Los elementos de la población se dividen en grupos o estratos. Luego, la muestra se obtiene seleccionando una muestra aleatoria simple de cada estrato. Para asegurar la representatividad de la Muestra, la división en grupos o estratos debe ser proporcional a la presencia de estos grupos en la población. Es decir; Donde i es el estrato, y para todo N i (tamaño del estrato i) y n i es el tamaño de la muestra del estrato i

14 LOGO Ejemplo : Se quiere determinar la estatura promedio de un curso de 2° Medio que tiene 40 estudiantes, de los cuales 18 son mujeres y 22 son hombres. Aplicando muestreo estratificado para tomar una muestra de 20 estudiantes, se tiene que los grupos o estratos presentes son mujeres y hombres, entonces: Por lo tanto, la muestra aleatoria de 20 estudiantes debería tener 9 mujeres y 11 hombres

15 LOGO

16

17 Para seleccionar una muestra aleatoria de una población en estudio utilizando el muestreo aleatorio por conglomerado, puedes realizar lo siguiente: 1. analizar la población en estudio y sus diferentes distribuciones en agrupaciones o conglomerados. 2.Seleccionar aleatoriamente algunos de los conglomerados descritos en el paso anterior 3.De cada uno de los conglomerados escogidos, seleccionar una muestra aleatoria simple o bien escoger a todos los individuos del conglomerados 4.Finalmente, la muestra requerida será la reunión de las muestras obtenidas de cada conglomerado

18 LOGO Ejemplo: Considerando el caso de 100 estudiantes, es posible obtener la muestra realizando lo siguiente: 1° seleccionar aleatoriamente algunas comunas de la ciudad, en este caso, los conglomerados serían las comunas. 2° luego, en cada comuna seleccionar aleatoriamente algún colegio, correspondería a un conglomerado. 3° dentro de cada colegio seleccionar aleatoriamente algún curso de enseñanza media. Luego, en este curso es posible seleccionar una muestra aleatoria simple de los estudiantes, ya sea generando números que representen a cada uno o simplemente utilizando los números de lista. 4° repitiendo el proceso con otros cursos, se obtiene la muestra solicitada.

19 LOGO El número N n corresponde a la cantidad de muestras aleatorias de tamaño n que se pueden extraer con reposición de una población de tamaño N, mientras que el número Donde n  N, corresponde a la cantidad de muestras aleatorias de tamaño n que se pueden extraer sin reposición de una población de tamaño N.

20 LOGO Ejemplo: Si en una tómbola hay 25 bolitas numeradas del 1 al 25 y se quiere seleccionar una muestra de tamaño 5, se tiene que:  Hay muestras de tamaño 5 que pueden seleccionarse con reposición.  Hay muestras de tamaño 5 que pueden seleccionarse sin reposición.

21 LOGO Estadísticos, estimadores y parámetros La inferencia estadística pretende aproximarse a los parámetros de la población a partir de los estimadores de la muestra. Un estadístico es una medida usada para describir alguna característica de una muestra (media, mediana, desviación típica,...) y un parámetro es una medida usada para describir las mismas características pero de la población (media, mediana, desviación típica,...). Cuando el estadístico se calcula en una muestra con idea de hacer inferencia sobre la misma característica en la población, se le llama estimador

22 LOGO Para distinguir los estimadores (valores muestrales) de los parámetros (valores poblacionales) los representaremos a partir de ahora con diferentes símbolos:

23 LOGO Los estadísticos muestrales nos proporcionan información sobre los parámetros poblacionales correspondientes si la muestra se ha recogido correctamente. Hay dos características de los estadísticos que los hacen especialmente deseables: Diremos que un estadístico es un estimador consistente de un parámetro poblacional si al aumentar el tamaño de la muestra la diferencia entre el estadístico y el parámetro tiende a desaparecer. Diremos que un estimador es preciso si al calcular el estadístico para distintas muestras los valores de éste son parecidos. Se dice que un estimador de un parámetro es insesgado si la media de su distribución es igual al verdadero valor del parámetro. De otro modo, se dice que el estimado está sesgado.

24 LOGO Las distribuciones muestrales para un estimador insesgado y estimador sesgado se ven en la figura. La distribución muestral para el estimador sesgado está corrida a la derecha del verdadero valor del parámetro. Este estimador sesgado es más probable que uno insesgado para sobreestimar el valor del parámetro.

25 LOGO Es decir la variación muestral será en general mas baja cuanto mas grande sea la muestra utilizada para calcular nuestro estimador. Si tomamos distintas muestras de la temperatura corporal en población sana tendremos una variación muestral bastante baja (la variabilidad de esta variable es baja entre diferentes personas). Si tomamos la presión arterial en la población chilena obtendremos una variación muestral bastante mas elevada. (Variabilidad de esta variable alta). Si tomamos muestras de tamaño 10 y calculamos medias muestrales, por ejemplo, se parecerán entre ellas menos, que si las muestras que tomamos son de tamaño 1000. EJEMPLOS Y COMENTARIOS

26 LOGO La segunda característica deseable de un estimador es que la dispersión (medida por la varianza) de la distribución muestral debe ser tan pequeña como sea posible. Esto asegura que, con una alta probabilidad, una estimación individual caerá cerca del valor verdadero del parámetro OTRA CARACTERISTICA DE UN ESTIMADOR

27 LOGO Error estándar de la media muestral El Teorema Central del Límite nos asegura que si nuestra muestra es razonablemente grande la distribución de la media muestral de cualquier variable sigue una distribución Normal y que además, la desviación típica de esta media tiene como expresión: donde  es la desviación típica de la variable original y n es el tamaño de la muestra. A la expresión anterior se le llama error estándar de la media.

28 LOGO Se entiende que el error estándar sería la desviación típica resultante de la obtención de las medias de distintas muestras aleatorias de la población. El error estándar sería el efecto de la variabilidad muestral sobre el valor que obtenemos de la media en cada muestra, es decir la desviación típica de la media se conoce como error estándar. Si se toman varias muestras de tamaño suficientemente grande y llamamos a la variable que guarda las medias muestrales para cada una de las muestras, por el Teorema Central del Límite tenemos asegurado:

29 LOGO Ejemplo Comportamiento de las medias muestrales (de tamaño 50) de una variable con media 10 y desviación típica 1,5. Supongamos que tenemos una variable que en la población tiene media μ = 10 y desviación típica = 1,5. Si el comportamiento de esta variable fuera aproximadamente Normal, la mayoría de valores de esta variable estarían alrededor del valor 10 más/menos dos desviaciones típicas por arriba y por abajo de este valor (es decir, entre 10 − 3 = 7 y 10 + 3 = 13 estarían la mayor parte de los valores de la variable)

30 LOGO ¿Cómo se comportarían las medias muestrales si extrajéramos varias muestras de tamaño 50? Pues según el Teorema Central del Límite, las medias muestrales seguirán una distribución Normal con media μ = 10 y desviación típica Por tanto, las medias muestrales estarían alrededor del valor 10, pero con más/menos dos desviaciones típicas por arriba y por abajo (es decir, entre 9,5758 y 10,4242 estarían la mayor parte de las medias de las muestras). Así observamos que en general las medias muestrales son más precisas que las variables de las que provienen y serán más precisas cuantos más valores tengamos en nuestra muestra.

31 LOGO En el caso de que la variable de interés sea una variable nominal no tiene sentido que nos planteemos el error estándar de su media (de hecho la media de una variable nominal no tiene tampoco sentido) sino el de su porcentaje de individuos en cada uno de sus valores. En este caso si P es el porcentaje de respuestas en ese valor su error estándar será:

32 LOGO En la expresión anterior se ha supuesto que la variable P está expresada en tantos por 100, si estuviera expresada en tantos por uno (es decir P es un valor entre 0 y 1) únicamente habríamos de cambiar en ella el valor 100 por 1 y la expresión seguiría siendo válida. Supongamos que tenemos una variable categórica y que nos interesa estimar el porcentaje de una de sus categorías en la población, al que llamamos P. Si tomamos varias muestras de tamaño suficientemente grande (n) y en cada una de esas muestras obtenemos una estimación del porcentaje de interés, si llamamos a la variable que guarda los porcentajes de esas muestras, se cumple que esta variable aleatoria sigue la siguiente distribución:

33 LOGO Se supone que el peso de los niños de un año de edad siguen una distribución normal de media μ = 10 Kg y desviación típica =2 Kg. Se extrae una muestra de 25 niños cuyo peso medio ha resultado ser x = 12,2 Kg. A la vista del resultado, ¿parece cierto el supuesto de que el peso medio poblacional de los niños de un año de edad esté entorno a los 10 Kg? Ejemplo Solución: Si la muestra de niños es representativa de la realidad (cosa que supuestamente es así), el peso medio muestral debería estar “cerca” del peso medio poblacional del que procede (10 kg). Sabemos que Es decir, la probabilidad de encontrar muestras de 25 niños con pesos medios muestrales superiores al observado (12,5) debería ser común.

34 LOGO Calculemos Es decir, 12.5 Kg es un peso medio extremadamente extraño si procede de la población. Por lo tanto, podemos afirmar que el peso medio real de los niños de un año de edad es significativamente mayor que 10 Kg.

35 LOGO Ejercicio Se supone que la longitud de un feto, en la semana 20 de gestación, sigue una distribución normal con media μ = 23,5 cm y desviación típica = 2,85 cm. Los resultados de las ecografías, en la semana 20 de gestación, de 9 mujeres dan las siguientes longitudes de feto: 21,9 ; 24,7 ; 15,0 ; 21,7; 25,9 ; 22,6 ; 23,5 ; 17,8 ; 22,1 Calcula

36 LOGO www.themegallery.com Cierta empresa afirma que las baterías de las bombas de insulina que fabrica para suministra a los hospitales, siguen una distribución normal con una duración media de 1.200 horas y una desviación típica de 400 horas. Supón que el hospital le compra a la empresa nueve bombas de insulina y que su duración media ha sido de 1050 horas. Calcula ¿Qué conclusión deduces del resultado?.

37 LOGO


Descargar ppt "LOGO Muestreo Pedro Godoy G.. LOGO Inferencia estadística La Inferencia Estadística es aquella rama de la Estadística mediante la cual se trata de sacar."

Presentaciones similares


Anuncios Google