INTERVALO DE CONFIANZA PARA LA MEDIA, DISTRIBUCION t Y TAMAÑO DE MUESTRA Mario Briones L. MV, MSc 2005.

Slides:



Advertisements
Presentaciones similares
DISEÑO DE EXPERIMENTOS EXPERIMENTOS DE COMPARACIÓN SIMPLE
Advertisements

DSITRIBUCION T DE STUDENT.
UNIVERSIDAD NACIONAL DE EDUCACIÓN Alma Máter del Magisterio Nacional
Intervalos de Confianza para la Media de la Población
Intervalos de Confianza para la Varianza de la Población
ESTIMACION DE PARAMETRO
Presentación de datos e interpretación de resultados
Tema 13. Inferencia estadística Principales conceptos. Muestreo
Ejemplo A continuación aparecen las tasas de retorno de dos fondos de inversión durante los últimos 10 años. 1. ¿Cuál es más riesgoso? 2. ¿En cuál invertiría.
Unidad de competencia II Estadística descriptiva:
Estadística Administrativa I
Variable Aleatoria Continua. Principales Distribuciones
Bioestadística Distribución Normal
De la muestra a la población
Estimación de parámetros poblacionales
} LISSET BÁRCENAS MONTERROZA
Binomial Poisson Hipergeométrico Modelos Discretos
Introducción al tema El único método científico para validar conclusiones sobre un grupo de individuos a partir de la información que nos proporciona un.
Estimación por intervalos de confianza.
Estimación por Intervalos de confianza
Clase 3 Universo y Muestra
CURSO DE ESTADÍSTICA BÁSICA
Universidad de América
Nombre: Israel Espinosa Jiménez Matricula: Carrera: TIC Cuatrimestre: 4 Página 1 de 5.
INFERENCIA ESTADÍSTICA
Distribución muestral de la Media
Bioestadística III. Escala cuantitativa. n Cuando la escala de medición es cuantitativa, y el análisis requiere un solo valor numérico que resuma alguna.
Facultad: Turismo Y Hotelería
Diseño Estadístico y Herramientas para la Calidad
Pronósticos, Series de Tiempo y Regresión
VARIABLE ALEATORIA Y DISTRIBUCION DE PROBABILIDAD
INTERVALO DE CONFIANZA
Elementos Básicos de Probabilidad y Estadística Javier Aparicio División de Estudios Políticos, CIDE Julio 2009
Distribuciones derivadas del muestreo
ESTADISTICA I CSH M. en C. Gal Vargas Neri.
DISTRIBUCIONES DE MUESTREO
ESTADISTICA TEMA 12.
Unidad V: Estimación de
ESTADISTICA TEMA y 223.
ESTIMACION En varios pasajes de este libro hemos planteado la dificultad que se confronta en las investigaciones, de llegar a conclusiones sobre una población.
ANALISIS DE FRECUENCIA EN HIDROLOGIA (2)
Datos: Estadística.
DISTRIBUCION NORMAL Mario Briones L. MV, MSc 2005.
ESTADÍSTICAS DESCRIPTIVA
El promedio como variable aleatoria: error estándar e intervalo de confianza para la media de la muestra Mario Briones L. MV, MSc 2005.
FACILITADOR JOSE HERIBERTO CRUZ GARCÍA
Métodos de calibración: regresión y correlación
Introducción La inferencia estadística es el procedimiento mediante el cual se llega a inferencias acerca de una población con base en los resultados obtenidos.
Universidad Nacional de Colombia Curso Análisis de Datos Cuantitativos.
Inferencia Estadística
ESTADÍSTICA DESCRIPTIVA
LA FAMILIA T.
Pruebas de hipótesis.
Probabilidad y Estadística X = x Unidad de muestreo Mediremos un atributo Variable aleatoria Valor que toma la variable aleatoria.
COMPROBACION DE HIPOTESIS SOBRE DOS PROMEDIOS Mario Briones L. MV, MSc 2005.
Estimación y contraste de hipótesis
ESTIMACIÓN DE PARÁMETROS
Aspectos generales de la investigación educativa en el SNIT
INFERENCIA ESTADÍSTICA
MEDIDAS DE DISPERSIÓN Pedro Godoy Gómez. Miden qué tanto se dispersan las observaciones alrededor de su media. MEDIDAS DE DISPERSIÓN.
TAMAÑO DE LA MUESTRA. Para definir el tamaño de la muestra se debe tener en cuenta los recursos disponibles y las necesidades del plan de análisis, el.
DISTRIBUCIÓN “t” DE STUDENT
Estimación Estadística Tares # 3. Estimación Estadística Conjunto de técnicas que permiten dar un valor aproximado de un parámetro de una población a.
Estimación estadística
Medidas de tendencia central
Yulieth ariza Villarreal Estadística II. Historia La distribución de Student fue descrita en 1908 por William Sealy Gosset. Gosset trabajaba en una fábrica.
DISTRIBUCION DE T-STUDENT
DISTRIBUCIÓN T DE STUDENT
Viviana Acosta Estadística II. Que es Es una distribución de probabilidad que surge del problema de estimar la media de una población normalmente distribuida.
INTERVALO DE CONFIANZA
Transcripción de la presentación:

INTERVALO DE CONFIANZA PARA LA MEDIA, DISTRIBUCION t Y TAMAÑO DE MUESTRA Mario Briones L. MV, MSc 2005

Estimador puntual El descriptor de tendencia central que es la media aritmética o promedio, ocupa una posición puntual sobre la recta numérica x

El promedio como variable aleatoria Si una muestra bien tomada sobre una población dada ha generado un promedio Una segunda muestra generará “probablemente” un promedio nuevo, diferente del anterior PREGUNTA: alguno de los promedios es incorrecto?

El promedio como variable aleatoria Esto significa que cada vez que se toma una muestra de tamaño n, el promedio obtenido puede considerarse como una observación perteneciente a una población con una distribución Esta distribución tiene media m y varianza s2/n

El error estándar de la media La dispersión de la media muestreal para un tamaño n, fluctua alrededor de m con una desviación estándar igual a s/n Si la muestra es grande, la distribución de la media muestreal será aproximadamente normal, sin importar si la población de origen de los datos no tiene distribución normal.

Las probabilidades de la curva normal aplicadas a la distribución del promedio Si la distribución de los promedios sigue una curva normal, entonces hay una probabilidad total de ocurrencia de estos promedios, bajo la curva normal

Las probabilidades de la curva normal aplicadas a la distribución del promedio 100% de probabi- lidades de todos los promedios obtenidos con muestras de tamaño n x -3 -2 -1 +1 +2 +3 Unidades de desviación Unidades de error estándar

x Si la distribución de los promedios sigue una curva normal, entonces hay una probabilidad total de ocurrencia de estos promedios, bajo la curva normal 100% de probabi- lidades de todos los promedios obtenidos con muestras de tamaño n x -3 -2 -1 +1 +2 +3 Unidades de desviación Unidades de error estándar

En resumen: El promedio de todos los posibles promedios de infinidad de muestras de tamaño n, cae exactamente sobre la media poblacional m. Esto se debe a que la probabilidad de cada promedio de caer por encima o por debajo de m es exactamente la misma, aunque la distribución de la variable original no sea normal y siempre que el tamaño de la muestra sea grande.

Por lo tanto: Utilizando las propiedades de la distribución normal, se puede dar una magnitud a la probabilidad de ocurrencia de m a partir del promedio calculado. Primero que nada, esto significa que entre menos una y más una unidad de error estándar (cualquiera sea su magnitud) se encuentra APROXIMADAMENTE, el 68% de esas probabilidades.

Promedios y error estándar de peso de terneros al nacimiento en 43 muestras de tamaño 10 tomadas sobre un total de 530 pesos (con promedio 38.9)

Histograma de frecuencia de los 43 promedios obtenidos con muestras de tamaño 10

Promedios y error estándar de peso de terneros al nacimiento en 43 muestras de tamaño 40 tomadas sobre un total de 530 pesos (con promedio 38.9)

Histograma de frecuencia de los 43 promedios obtenidos con muestras de tamaño 40

68% x -3 -2 -1 +1 +2 +3

Probabilidades de 95 y 99% Si queremos cubrir, a partir de nuestro estimador de la media, un 95% de las probabilidades de incluir, con el mismo tamaño de muestra, la media real de la población, tenemos que dividir en dos un área igual a 0.95. Esto da 0.475.

La probabilidad de la media poblacional es simétrica alrededor de la media de la muestra ? m ? m ? m ? m ? m ? x

Límites de la curva normal para dejar sólo un 5% de probabilidad de error de no cubrir con el intervalo de confianza a la media poblacional 5% 95% 2.5% 2.5% z: -0.475 z: + 0.475

Probabilidades de 95 y 99% El valor de z que deja hacia entre cero y z un 0.475 de las probabilidades es 1.96. Esto significa que ± 1.96 unidades de error estándar a partir del promedio, se ubica ese 95% de probabilidades. El valor respectivo para 99% de confianza es de 2.58.

Promedios e intervalos de confiaza de 95% para la media de la población, con muestras de tamaño 40

Estimación de intervalo: el error estándar de la media Para conocer cuanta es la distancia hacia arriba o hacia debajo de la media, expresada en las unidades de medición de la variable, sólo es necesario multiplicar el error estándar (que está expresado en unidades de la variable) por el valor de z que define la probabilidad (ZP). La siguiente expresión se aplica CUANDO DE CONOCE LA VARIANZA DE LA POBLACION: x  zP x s/n

EJEMPLO: Los datos siguientes corresponden a los niveles de Hormona Luteinizante (LH) en nanogramos por ml de suero de 5 ovejas administradas con Naloxona a las 20 semanas de edad, durante la noche y el día

1.96(s/n) 1.96(s/n) 0.62 conc. LH (ng/ml) Intervalo de confianza para la concentración diurna de LH. 1.96(s/n) 1.96(s/n) 0.62 conc. LH (ng/ml)

Intervalo de confianza para la concentración diurna de LH. 1.96 x 0.11 1.96 x 0.11 0.62 conc. LH (ng/ml)

Intervalo de confianza de 95% para la media de la Concentración de LH en la población de referencia, asumiendo que se conoce la varianza de la población: 0.62  0.22 0.22 0.22 0.40 0.62 0.84 conc. LH (ng/ml)

QUE PASA CUANDO NO SE CONOCE LA VARIANZA DE LA POBLACION?

s Asumir que la desviación estándar de la población se conoce, significa que, aunque no se conozca la media poblacional, se conoce la forma de la campana que es característica de esa variable y por lo tanto se puede utilizar para estimar la ubicación probable de m

Asumir que la desviación estándar de la población no se conoce, implica no tener claridad acerca de la forma real de la campana de la variable, lo cual va a redundar en una menor exactitud al momento de determinar un rango para la probable ubicación de m

El significado práctico de la desviación “típica” En la práctica, cuando la muestra es pequeña, la certeza sobre la “veracidad” de s2 como estimador de s2 es mucho menor que cuando s2 se ha calculado en una muestra de gran tamaño; en el primer caso, lo más conveniente es ASUMIR que no es s2 sino s2 (un estimador)

El desconocimiento de la varianza y por ende de la desviación estándar, agrega incertidumbre a la estimación del intervalo de confianza que debería traducirse en un intervalo de mayor tamaño para la potencial ubicación de la media poblacional.

Esto significa que la distribución normal no permite conocer las probabilidades igual que antes, se necesita corregir la curva normal.

Distribución de t de student Distribución t para 200, 50 y 10 grados de libertad Distribución normal

Relación entre la estadística y la cerveza...¿!?

William Sealy Gosset fue el hijo mayor del coronel Frederic Gosset, R.E. Nació en Canterbury en el año de 1876 y falleció el 16 de octubre de 1937. Se educó en Winchester, en donde más tarde fue profesor, y en el New College de Oxford en donde estudió química y matemáticas. En 1899 se inició en trabajos en el departamento de fermentación de la compañía cervecera de los Sres. Guinness en Dublin. No se sabe con exactitud en qué momento empezó a interesarse Gosset en la estadística, sin embargo en ese época se empezaron a usar métodos científicos y determinaciones de laboratorio para técnicas de fermentación, por lo que es muy posible que siendo Gosset el de mayor inclinación matemática del departamento de fermentación recibiera las preguntas que le hacían sus colegas sobre los métodos estadísticos en uso y sobre la masa de datos que se colectaban

Su principal herramienta y con la que inició sus estudios fueron los libros "Teoría de errores de observaciones" de G.B.Airy y "El método de mínimos cuadrados" de M. Merriman. Se sabe que ya en 1903 él calculaba el error probable. Las circunstancias en las que se llevan a cabo los procesos de fermentación en la producción de cerveza, con materiales variables, susceptibilidad a cambio de temperaturas y necesariamente series pequeñas de experimentos, son tales que pronto demostraron a Gosset las limitaciones de la teoría de muestras grandes y le enfatizaron la necesidad de un método correcto para el tratamiento de muestras pequeñas. No fue entonces un accidente, sino más bien las circunstancias de su trabajo, las que dirigieron a Gosset hacia este problema, y lo condujeron al descubrimiento de la distribución de la desviación estándar muestral, lo cual dio origen a lo que en su forma moderna se conoce como la prueba t.

Debido a que los administradores de la empresa Guiness no autorizaron al Mr. Gosset a publicar los trabajos, él utilizó el seudónimo Student.

Distribución de t de Student Si se observa la tabla de t, se puede notar que cuando el tamaño de la muestra es infinito, la probabilidad es igual que en la tabla de distribución normal, por ejemplo, 1.96 para la probabilidad de 95%.

Distribución de t de student

INTERVALO DE CONFIANZA PARA LA MEDIA CUANDO NO SE CONOCE LA VARIANZA. La única diferencia, cuando la varianza de la Población no se conoce, es que el valor de probabilidad que debe emplearse para determinar el intervalo de confianza de la media, es el valor de t para los grados de libertad correspondientes. Es fácil observar que asumir conocimiento de la varianza tiene mucho mayor efecto cuando el tamaño de la muestra es pequeño.

-t 0 +t

EJEMPLO: Los datos siguientes corresponden a los niveles de Hormona Luteinizante (LH) en nanogramos por ml de suero de 5 ovejas administradas con Naloxona a las 20 semanas de edad, durante la noche y el día

2.78(s/n) 2.78(s/n) 0.62 conc. LH (ng/ml) Intervalo de confianza para la concentración diurna de LH. 2.78(s/n) 2.78(s/n) 0.62 conc. LH (ng/ml)

Intervalo de confianza para la concentración diurna de LH. 2.78 x 0.11 2.78 x 0.11 0.62 conc. LH (ng/ml)

Intervalo de confianza de 95% para la media de la concentración de LH en la población de referencia, asumiendo que no se conoce la varianza de la población: 0.62  0.31 0.31 0.31 0.31 0.62 0.93 conc. LH (ng/ml)

x  zP x s/n x  tP-Gl x s/n INTERVALO DE CONFIANZA PARA LA MEDIA CUANDO SE CONOCE LA VARIANZA DE LA POBLACION x  zP x s/n INTERVALO DE CONFIANZA PARA LA MEDIA CUANDO NO SE CONOCE LA VARIANZA DE LA POBLACION x  tP-Gl x s/n

DETERMINACION DEL TAMAÑO DE LA MUESTRA NECESARIO PARA DESCRIBIR APROPIADAMENTE UNA POBLACION La paradoja del muestreo se resuelve sobre la base del conocimiento previo de la varianza de la población y el error admisible que se desea para el estimador.

x  zP x s/n Al querer determinar a priori un tamaño de Si el intervalo de confianza para la media se define como x  zP x s/n Al querer determinar a priori un tamaño de muestra para un error predeterminado, se puede asumir que zP y s se conocen y n es la incógnita.

Resolviendo para n: probabilidad de 95%, y asumiendo 1.96= 2 para mayor simplicidad n= 4s2/L2 donde L= error admisible en unidades de medición para probabilidad de 99% n= 6.6s2/L2

Ejemplo: asumiendo que la desviación estándar de la población de los valores de LH diurna después de la inyección de naloxona es igual a 0.25, los tamaños apropiados de muestra para diferentes magnitudes de error (con 95% de confianza) son los siguientes: Error n ± 0.01 4 x (0.25)2/(0.01)2= 2500 ± 0.05 4 x (0.25)2/(0.05)2= 100 ± 0.10 4 x (0.25)2/(0.10)2= 25 ± 0.15 4 x (0.25)2/(0.15)2= 11