La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Bioestadística Distribuciones muestrales para variables cuantitativas.

Presentaciones similares


Presentación del tema: "Bioestadística Distribuciones muestrales para variables cuantitativas."— Transcripción de la presentación:

1 Bioestadística Distribuciones muestrales para variables cuantitativas

2 Uso de las muestras. n Cuando no podemos estudiar una población en su totalidad recurrimos a seleccionar una muestra y a partir de ella estimamos los parámetros de la población de interés.

3

4

5

6

7

8 Pregunta n ¿Qué nos hace pensar que una muestra cualquiera nos permita calcular un valor que sea un buen estimador del parámetro de interés?

9 Conceptos importantes n Siempre que tomamos una muestra seleccionamos una del universo de muestras posibles. n El número de muestras en el universo de muestras depende del tamaño de la muestra y de que el muestreo se haga con reemplazo o sin reemplazo. n Este universo de muestras es estudiada por las distribuciones muestrales.

10 Conceptos importantes n Siempre que tomamos una muestra seleccionamos una del universo de muestras posibles. n El número de muestras en el universo de muestras depende del tamaño de la muestra y de que el muestreo se haga con reemplazo o sin reemplazo. n Este universo de muestras es estudiada por las distribuciones muestrales.

11 Conceptos importantes n Siempre que tomamos una muestra seleccionamos una del universo de muestras posibles. n El número de muestras en el universo de muestras depende del tamaño de la muestra y de que el muestreo se haga con reemplazo o sin reemplazo. n Este universo de muestras es estudiada por las distribuciones muestrales.

12 Distribuciones muestrales n Una distribución muestral es una distribución de probabilidad de un estadístico muestral calculado a partir de todas la muestras posibles de tamaño n, elegidas al azar en una población determinada.

13 Distribuciones muestrales. n Para construirla: –Se extraen todas las muestras posibles de tamaño n. –Se calcula el estadístico de interés para cada muestra. –Se enumeran en una columna los diferentes valores observados del estadístico y, en otra columna, la frecuencia correspondiente de la ocurrencia de cada uno de estos valores.

14 Distribuciones muestrales. n Para construirla: –Se extraen todas las muestras posibles de tamaño n. –Se calcula el estadístico de interés para cada muestra. –Se enumeran en una columna los diferentes valores observados del estadístico y, en otra columna, la frecuencia correspondiente de la ocurrencia de cada uno de estos valores.

15 Distribuciones muestrales. n Para construirla: –Se extraen todas las muestras posibles de tamaño n. –Se calcula el estadístico de interés para cada muestra. –Se enumeran en una columna los diferentes valores observados del estadístico y, en otra columna, la frecuencia correspondiente de la ocurrencia de cada uno de estos valores.

16 Distribuciones muestrales. n Para construirla: –Cuando la población es de gran tamaño, o infinita, la distribución muestral teórica se construye mediante la extracción de un gran número de muestras aleatorias para lograr buenas aproximaciones de la distribución muestral verdadera.

17 Distribuciones muestrales. n En términos generales, estamos interesados en conocer una o más de las siguientes características de una distribución muestral. –Su forma general (cómo aparece en una representación gráfica). –Su media. –Su desviación estándar. n A partir del conocimiento anterior, es posible calcular la probabilidad de obtener un resultado (media, proporción, etc.) particular en una muestra, cuando los parámetros ya son conocidos.

18 Distribuciones muestrales. n En términos generales, estamos interesados en conocer una o más de las siguientes características de una distribución muestral. –Su forma general (cómo aparece en una representación gráfica). –Su media. –Su desviación estándar. n A partir del conocimiento anterior, es posible calcular la probabilidad de obtener un resultado (media, proporción, etc.) particular en una muestra, cuando los parámetros ya son conocidos.

19 Distribuciones muestrales. n Supongamos que nos interesa estudiar una población de 5 elementos que tienen los valores 1, 2, 3, 4 y 5. –Su media poblacional, μ, es igual a 3 –Su desviación estándar poblacional, σ, es igual a 1.414.

20 Muestreo con remplazo. 12345 11.01.52.02.53.0 21.52.02.53.03.5 32.02.53.03.54.0 42.53.03.54.04.5 53.03.54.04.55.0 Muestras tamaño n = 2, y sus medias, que se obtienen de un conjunto formado por los elementos 1, 2, 3, 4 y 5.

21 Distribución de frecuencias del conjunto de medias obtenidas de muestras tamaño n = 2 a partir de un conjunto formado por los elementos 1, 2, 3, 4 y 5. mediafrecuenciaprobabilidad 1.010.04 1.520.08 2.030.12 2.540.16 3.050.20 3.540.16 4.030.12 4.520.08 5.010.04 25

22 Histograma de frecuencias del conjunto de medias obtenidas de muestras tamaño n = 2 a partir de un conjunto formado por los elementos 1, 2, 3, 4 y 5.

23 Distribución de frecuencias del conjunto de medias obtenidas de muestras tamaño n = 3 a partir de un conjunto formado por los elementos 1, 2, 3, 4 y 5 mediafrec.p.mediafrec.p. 1.0010.008 1.3330.0243.33180.144 1.6760.0483.67150.120 2.00100.0804.00100.080 2.33150.1204.3360.048 2.67180.1444.6730.024 3.00190.1525.0010.008 125

24 Distribución de frecuencias del conjunto de medias obtenidas de muestras tamaño n = 3 a partir de un conjunto formado por los elementos 1, 2, 3, 4 y 5

25 Distribución de frecuencias del conjunto de medias obtenidas de muestras tamaño n = 4 a partir de un conjunto formado por los elementos 1, 2, 3, 4 y 5 mediafrec.p.mediafrec.p. 1.0010.0016 1.2540.00643.25800.1280 1.50100.01603.50680.1088 1.75200.03203.75520.0832 2.00350.05604.00350.0560 2.25520.08324.25200.0320 2.50680.10884.50100.0160 2.75800.12804.7540.0064 3.0850.13605.0010.0016 625

26 Distribución de frecuencias del conjunto de medias obtenidas de muestras tamaño n = 4 a partir de un conjunto formado por los elementos 1, 2, 3, 4 y 5

27 Medias y desviaciones estándar obtenidas de muestras tamaño 2, 3 y 4 obtenidas a partir del conjunto formado por los elementos 1, 2, 3, 4 y 5. n 231.000 330.816 430.707

28 n Cuando el muestreo se hace con remplazo en una población finita, la media de la distribución muestral es igual a la media de la población original y la varianza de la distribución muestral es igual a la varianza de la población dividida por el tamaño de la muestra. Es decir: La media y la varianza de medias muestrales.

29 Medias y desviaciones estándar obtenidas de muestras tamaño 2, 3 y 4 obtenidas a partir del conjunto formado por los elementos 1, 2, 3, 4 y 5. n 23 33 43

30 Forma funcional de la distribución de medias muestrales a partir de una población con distribución plana n = 2 n = 3 n = 15 n = 30

31 Forma funcional de la distribución de medias muestrales a partir de una población con distribución normal n = 2 n = 3 n = 15 n = 30

32 Forma funcional de la distribución de medias muestrales a partir de una población con distribución bimodal n = 2 n = 3 n = 15 n = 30

33 Forma funcional de la distribución de medias muestrales a partir de una población con distribución sesgada n = 2 n = 3 n = 15 n = 30

34 n Si la media de una muestra aleatoria de tamaño n es sacada de una población distribuida normalmente con media y varianza finita, entonces la distribución muestral está normalmente distribuida. Por lo tanto, está distribuida normalmente con media igual a 0, y desviación estándar igual a 1. Forma funcional de la distribución de medias muestrales

35 Teorema del límite central. n Cuando la muestra procede de una población no distribuida normalmente, aplicamos el teorema del límite central, que dice: –Dada una población de cualquier forma funcional, la distribución muestral de la media, calculada a partir de muestras de tamaño n de esta población, estará distribuida aproximadamente en forma normal cuando el tamaño de la muestra es grande. n Una regla empírica afirma que, en la mayoría de las situaciones prácticas, resulta satisfactorio un tamaño de la muestra de 30.

36 Cálculo de probabilidades: ejemplo. 1.- Cuando la población se distribuye normalmente. 1.1- Trazamos un figura que represente la campana de Gauss, con una línea horizontal en la base y otra línea que represente la media poblacional. 1.2.- Conviene anotar el valor de la media poblacional.

37 Cálculo de probabilidades: ejemplo. 2.- Trazamos una línea perpendicular a la base que definirá el área de interés. 3.- Sombreamos el área de interés. En este ejemplo, valores que sean menores a 3,250 g.

38 Cálculo de probabilidades: ejemplo.

39

40 7.- Buscamos el área de la curva normal que corresponde al espacio de Z = 0 a Z = 1.12

41 Cálculo de probabilidades: ejemplo.

42 Cálculo de probabilidades: ejercicio.

43 P(X < 2,750 g) = 0.13

44 nZp P(X < 2,750 g) -0.500.31 5-1.120.13 10-1.580.06 15-1.940.03 20-2.240.013 25-2.500.0062 30-2.740.0031 35-2.960.0015 40-3.160.00078 45-3.350.00040 Población de recién nacidos, donde el peso μ = 3,000 g, y σ = 500 g Restricciones: población de X distribuida normalmente, o n ≥ 30

45 nZp P(X < 2,750 g) -0.500.31 5-1.120.13 10-1.580.06 15-1.940.03 20-2.240.013 25-2.500.0062 30-2.740.0031 35-2.960.0015 40-3.160.00078 45-3.350.00040 Población de recién nacidos, donde el peso μ = 3,000 g, y σ = 500 g Restricciones: población de X distribuida normalmente, o n ≥ 30

46 nZp P(X < 2,750 g) -0.500.31 5-1.120.13 10-1.580.06 15-1.940.03 20-2.240.01 25-2.50<0.01 30-2.74<0.01 35-2.96<0.01 40-3.16<0.01 45-3.35<0.01 Población de recién nacidos, donde el peso μ = 3,000 g, y σ = 500 g Restricciones: población de X distribuida normalmente, o n ≥ 30

47 n Cuando se desea comparar dos poblaciones mediante sus medias, nuestro interés se dirige a la diferencia de las mismas. n En otras palabras, estamos interesados en el parámetro Distribuciones de la diferencia entre dos medias muestrales. n Que estimaremos mediante el estadístico

48 n Cuando se desea comparar dos poblaciones mediante sus medias, nuestro interés se dirige a la diferencia de las mismas. n En otras palabras, estamos interesados en el parámetro Distribuciones de la diferencia entre dos medias muestrales. n Que estimaremos mediante el estadístico

49 n Cuando se desea comparar dos poblaciones mediante sus medias, nuestro interés se dirige a la diferencia de las mismas. n En otras palabras, estamos interesados en el parámetro Distribuciones de la diferencia entre dos medias muestrales. n Que estimaremos mediante el estadístico

50 n La distribución muestral de la diferencia entre dos medias muestrales, calculadas a partir de muestras aleatorias independientes extraídas de dos poblaciones distribuidas normalmente, estará distribuida normalmente y tendrá una media y una varianza igual a Distribuciones de la diferencia entre dos medias muestrales.

51 n Si n 1 y n 2 son grandes, la distribución muestral de la diferencia entre dos medias muestrales será aproximadamente normal sin tener en cuenta la forma funcional de las poblaciones originales. n En estas condiciones cuando el muestreo se hace con remplazo.

52 Distribuciones de la diferencia entre dos medias muestrales. n Si n 1 y n 2 son grandes, la distribución muestral de la diferencia entre dos medias muestrales será aproximadamente normal sin tener en cuenta la forma funcional de las poblaciones originales. n En estas condiciones cuando el muestreo se hace con remplazo.

53 El supuesto de la hipótesis nula. n Cuando comparamos dos muestras cuantitativas, al realizar una prueba de hipótesis, asumimos que ambas muestras proceden de la misma población. n Bajo este supuesto, μ 1 = μ 2, y cuando el muestreo se hace con remplazo.

54 El supuesto de la hipótesis nula. n Cuando comparamos dos muestras cuantitativas, al realizar una prueba de hipótesis, asumimos que ambas muestras proceden de la misma población. n Bajo este supuesto, μ 1 = μ 2, y cuando el muestreo se hace con remplazo.

55 Cálculo de probabilidades: ejemplo. n Asumamos que el peso al nacer se distribuye según la campana de Gauss, con un promedio poblacional, µ, de 3,000 g, y una desviación estándar poblacional, σ, de 500 g. n Seleccionamos dos muestras de 20 recién nacidos (una en el Hospital Civil y otra en el Hospital 110 del IMSS). El peso promedio en el HC fue de 2,900 g; en el H110 fue de 3,100 g. n Pregunta: si las dos muestras proceden de la misma población, cual es la probabilidad de observan una diferencia absoluta ≥ 200 g.

56 Cálculo de probabilidades: ejemplo. n Asumamos que el peso al nacer se distribuye según la campana de Gauss, con un promedio poblacional, µ, de 3,000 g, y una desviación estándar poblacional, σ, de 500 g. n Seleccionamos dos muestras de 20 recién nacidos (una en el Hospital Civil y otra en el Hospital 110 del IMSS). El peso promedio en el HC fue de 2,900 g; en el H110 fue de 3,100 g. n Pregunta: si las dos muestras proceden de la misma población, cual es la probabilidad de observan una diferencia absoluta ≥ 200 g.

57 Cálculo de probabilidades: ejemplo. n Asumamos que el peso al nacer se distribuye según la campana de Gauss, con un promedio poblacional, µ, de 3,000 g, y una desviación estándar poblacional, σ, de 500 g. n Seleccionamos dos muestras de 20 recién nacidos (una en el Hospital Civil y otra en el Hospital 110 del IMSS). El peso promedio en el HC fue de 2,900 g; en el H110 fue de 3,100 g. n Pregunta: si las dos muestras proceden de la misma población, cual es la probabilidad de observan una diferencia absoluta ≥ 200 g.

58 Cálculo de probabilidades: ejemplo.

59

60 1.- Trazamos un figura que represente la campana de Gauss, con una línea horizontal en la base y otra línea que represente la media poblacional. 1.1.- Conviene anotar el valor de la media poblacional del universo de diferencias. Es decir: μ 1 - μ 2 = 3,000 – 3,000 = 0.

61 Cálculo de probabilidades: ejemplo. 2.- Trazamos una línea perpendicular a la base que definirá el área de interés. 3.- Sombreamos el área de interés. En este ejemplo, valores que sean mayores a |200| g. 3.1.- Para este ejemplo sombreamos los dos extremos, porque estamos buscando el área que tenga muestras con diferencias > |200|g. (Recordemos que |-200| = 200)

62 Cálculo de probabilidades: ejemplo.

63

64 7.- Buscamos el área de la curva normal que corresponde al espacio de Z = 0 a Z = 1.26

65 Cálculo de probabilidades: ejemplo.

66 Cálculo de probabilidades: ejercicio.

67

68 Muestreo sin remplazo. 12345 11.01.52.02.53.0 21.52.02.53.03.5 32.02.53.03.54.0 42.53.03.54.04.5 53.03.54.04.55.0 Muestras tamaño n = 2, y sus medias, que se obtienen de un conjunto formado por los elementos 1, 2, 3, 4 y 5. En el muestreo sin remplazo, las muestras señaladas en amarillo no pueden ser seleccionadas.

69 La media y la varianza de medias muestrales. n Si el muestreo se hace sin remplazamiento en una población finita, la media de la distribución de las medias muestrales es igual a la media de la población y la varianza es igual a: n El factor (N - n)/(N - 1) se denomina factor de corrección de población finita (CPF). Podemos pasarlo por alto si el tamaño de la muestra es pequeño en relación con el tamaño de la población (n < N*0.05)

70 La media y la varianza de medias muestrales. n Si el muestreo se hace sin remplazamiento en una población finita, la media de la distribución de las medias muestrales es igual a la media de la población y la varianza es igual a: n El factor (N - n)/(N - 1) se denomina factor de corrección de población finita (CPF). Podemos pasarlo por alto si el tamaño de la muestra es pequeño en relación con el tamaño de la población (n < N*0.05)


Descargar ppt "Bioestadística Distribuciones muestrales para variables cuantitativas."

Presentaciones similares


Anuncios Google