Distribución de la media muestral © Pedro Juan Rodríguez Esquerdo Departamento de Matemáticas UPR Río Piedras
Una caja con números del 1 al 100 Selecciona 100 muestras con reemplazo de tamaño n = 5. Estudia el comportamiento de los datos y de las medias de la muestra ¿Alrededor de qué valor se distribuyen las medias de cada muestra? ¿Qué ocurre con la dispersión de las medias? Repite este análisis para n = 50 y n = 250
Población de números del 1 al 100 Teóricamente los datos tienen: media poblacional µ =( )/2 = 50.5 varianza poblacional σ 2 = ( )/12 = Desviación estándar poblacional σ = 28.87
Distribución de datos 100 muestras de tamaño 5
Distribución de medias 100 muestras de tamaño 5
Distribución de medias estandarizadas 100 muestras de tamaño 5
¿Qué ocurre? n = 5 Los datos se distribuyen casi en iguales cantidades entre los 10 intervalos (uniformemente) Los valores de la media: se agrupan alrededor de un número ¿Cuál? su dispersión es menor que los datos originales La forma de la distribución de las medias parece simétrica, acampanada y unimodal Las medias estandarizadas tienen la misma forma de distribución
Distribución de datos 100 muestras de tamaño 20
Distribución de medias 100 muestras de tamaño 20
Distribución de medias estandarizadas 100 muestras de tamaño 20
¿Qué ocurre? n = 20 Los datos se distribuyen casi en iguales cantidades entre los 10 intervalos Los valores de media se agrupan alrededor de un número ¿Cuál? su dispersión es menor aún que la de las medias con n=5 y que los datos originales La forma de la distribución de las medias parece simétrica ¿acampanada? ¿unimodal? Las medias estandarizadas tienen distribución acampanada, unimodal y simétrica
Distribución de datos 100 muestras de tamaño 50
Distribución de medias 100 muestras de tamaño 50
Distribución de medias estandarizadas de 100 muestras de tamaño 50
¿Qué ocurre? n = 50 Los datos se distribuyen casi en iguales cantidades entre los 10 intervalos Los valores de la media muestral se agrupan alrededor de un número ¿Cuál? su dispersión es menor aún que la de las medias con n=5, n =20 y que los datos originales La forma de la distribución de las medias parece simétrica ¿acampanada? ¿unimodal? Las medias estandarizadas tienen distribución acampanada, unimodal y simétrica
En resumen No importa el tamaño de n, los datos se distribuyen casi en iguales cantidades entre los 10 intervalos A medida que n aumenta, los valores de la media muestral se acercan a un número su dispersión se hace cada vez menor tienen un distribución que se hace cada vez más simétrica, unimodal y acampanada
Estadísticas sobre las medias La media poblacional de los datos es µ = 50.5 La desviación estándar poblacional de los datos es σ = Toma 100 muestras de tamaño n=5, n=20, n=50
Resultados A medida que n aumenta los valores de la media muestral se acercan más y más a la media poblacional µ su desviación estándar (el error estándar) se hace más pequeña Su distribución se acerca cada vez a la normal con media µ y desviación estándar