Estimación. Estimación Puntual Estimación por intervalos

Slides:

Advertisements

Presentaciones similares

Intervalos de Confianza para la Varianza de la Población

Advertisements

ESTIMACION DE PARAMETRO

Prof. Rosario Martínez Verdú

Tema 14. Estimación de parámetros: Estimación puntual y por intervalos

Tema 7: Introducción a la inferencia estadística

CONTENIDOS Teoría del muestreo ¿Cómo seleccionar una muestra?

Contraste de Hipótesis

De la muestra a la población

Estimación de parámetros poblacionales

Inferencia Estadística

Inferencia estadística

} LISSET BÁRCENAS MONTERROZA

Estimación I Intervalos de confianza

Introducción al tema El único método científico para validar conclusiones sobre un grupo de individuos a partir de la información que nos proporciona un.

Universidad de Chile Facultad de Ciencias Químicas y Farmacéuticas

INFERENCIA ESTADÍSTICA

DISTRIBUCIONES MUESTRALES, DE LAS MUESTRAS O DE MUESTREO

INFERENCIA ESTADISTICA

Estimación por Intervalos de confianza

2. ESTIMACIÓN Depto. Matemáticas – IES Elaios

GRADO DE CONFIANZA DE LA INFERENCIA

Introducción Media y varianza poblacional Sea

Nombre: Israel Espinosa Jiménez Matricula: Carrera: TIC Cuatrimestre: 4 Página 1 de 5.

INFERENCIA ESTADÍSTICA

MUESTREO DE ACEPTACIÓN DE LOTES POR VARIABLES

Población y Muestra.

Diseño Estadístico y Herramientas para la Calidad

Unidad V: Estimación de

VARIABLE ALEATORIA Y DISTRIBUCION DE PROBABILIDAD

INTERVALO DE CONFIANZA

Elementos Básicos de Probabilidad y Estadística Javier Aparicio División de Estudios Políticos, CIDE Julio 2009

Distribuciones derivadas del muestreo

DISTRIBUCIONES DE MUESTREO

Unidad V: Estimación de

ESTADISTICA TEMA y 223.

ESTIMACION En varios pasajes de este libro hemos planteado la dificultad que se confronta en las investigaciones, de llegar a conclusiones sobre una población.

1 M. en C. Gal Vargas Neri. 2 Planeación del curso TEMACAP.TITULODÍASSEMFEC FIN TEMA 00MOTIVACION Y PLANEACION1111/01 TEMA I1-2ESTADISTICA Y MEDICION2115/01.

Tema 8: Estimación 1. Introducción.

Distribución Normal o gaussiana

Estimación Sea una característica, un parámetro poblacional cuyo valor se desea conocer a partir de una muestra. Sea un estadístico ( función.

DISTRIBUCION NORMAL Mario Briones L. MV, MSc 2005.

Introducción La inferencia estadística es el procedimiento mediante el cual se llega a inferencias acerca de una población con base en los resultados obtenidos.

Universidad Nacional de Colombia Curso Análisis de Datos Cuantitativos.

ESTADISTICA I CSH M. en C. Gal Vargas Neri.

Capítulo 7 Estimación de Parámetros Estadística Computacional

ESTIMACION POR INTERVALOS

Inferencia Estadística

Estadística para administradores

Unidad V: Estimación de

Capítulo 1. Conceptos básicos de la Estadística

MÉTODOS DE ANÁLISIS EN LA TOMA DE DECISIONES EXISTEN PROCEDIMIENTOS DE ORDEN MATEMÁTICO, FINANCIERO, ECONÓMICO, ESTADÍSTICO ENTRE OTROS, PARA LA TOMA DE.

Estimación y contraste de hipótesis

Aplicaciones Estadísticas a las Finanzas Clase 1

INTERVALOS DE CONFIANZA

ESTIMACIÓN DE PARÁMETROS

MUESTREO ALEATORIO SIMPLE SIN REEMPLAZO (“mas”)

INTERVALO DE CONFIANZA

Intervalos de confianza

Aspectos generales de la investigación educativa en el SNIT

INFERENCIA ESTADÍSTICA

UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE CIENCIAS ECONOMICAS INFERENCIA ESTADISTICA TEMA: ESTIMACION PUNTUAL, PROPIEDADES DE LAS ESTIMACIONES;

MEDIDAS DE DISPERSIÓN Pedro Godoy Gómez. Miden qué tanto se dispersan las observaciones alrededor de su media. MEDIDAS DE DISPERSIÓN.

TAMAÑO DE LA MUESTRA. Para definir el tamaño de la muestra se debe tener en cuenta los recursos disponibles y las necesidades del plan de análisis, el.

Intervalos de Confianza

PROCEDIMIENTO DE MUESTREO

Estimación Estadística Tares # 3. Estimación Estadística Conjunto de técnicas que permiten dar un valor aproximado de un parámetro de una población a.

Intervalos de Confianza M. C. José Juan Rincón Pasaye UMSNH – FIE Mayo de 2003.

Estimación estadística

TAMAÑO DE LA MUESTRA Alvaro Alfredo Bravo Dpto. de Matemáticas y Estadística Universidad de Nariño - Colombia.

INTERVALO DE CONFIANZA

Transcripción de la presentación:

Estimación. Estimación Puntual Estimación por intervalos Propiedades deseables de los estimadores Estimaciones puntuales (media, proporción, varianza) Estimación por intervalos Estimación de la media y diferencias de medias Estimación de la proporción y diferencia de proporciones Estimación de la varianza y cociente de varianzas Relación entre ambas estimaciones Tamaño de la muestra Ejercicios

Inferencia Estadística, Estadística Inductiva, Teoría de Muestras Introducción Inferencia Estadística, Estadística Inductiva, Teoría de Muestras Existe una de la que el investigador selecciona una que genera unos usados para evaluar unos que se usan para estimar que describen

Estimación puntual Una estimación puntual de algún parámetro poblacional  es un valor único del estadístico . Por ejemplo, el valor de la estadística calculado a partir de una muestra de tamaño n, es una estimación puntual del parámetro poblacional . El estadístico que se utiliza para obtener una estimación puntual recibe el nombre de estimador o función de decisión. Generalmente muestras diferentes conducen a acciones o estimaciones diferentes. No se espera que un estimador obtenga sin error el valor del parámetro poblacional, sino que no se aleje mucho del valor real. Es posible definir muchas estadísticas para estimar un parámetro desconocido . Entonces, cómo seleccionar un buen estimador de ? Cúales son los criterios para juzgar cuándo un estimador de  es "bueno" o "malo"?. Por ejemplo, pudo elegirse la mediana muestral o la moda para estimar el valor de la media poblacional, en qué nos basamos para elegir como estimador la media muestral?

Estimación puntual Propiedades Deseables de los Estimadores Puntuales: Básicamente para que un estimador sea bueno, se desea que la varianza del estimador sea lo más pequeña posible, mientras que la distribución de muestreo debe concentrarse alrededor del valor del parámetro. Estimadores Insesgados (Centrados): Se dice que la estadística = H(X1, X2, ..., Xn) es un estimador insesgado del parámetro , si . Es decir, si los valores del estimador se centran alrededor del parámetro en cuestión.

Estimación puntual Estimadores Consistentes: Es razonable esperar que un buen estimador de un parámetro  , sea cada vez mejor conforme crece el tamaño de la muestra y la información se vuelve más completa. La distribución de muestreo de un buen estimador se encuentra cada vez más concentrada alrededor del parámetro . Si un estimador es consistente, converge en probabilidad al valor del parámetro que está intentando estimar conforme el tamaño de la muestra crece. Esto implica que la varianza de un estimador consistente disminuye conforme n crece. Se dice que es un estimador consistente de  si:

Estimación puntual Estimadores Eficientes (Insesgados de Varianza Mínima): El hecho de que un estimador sea centrado no garantiza que sus realizaciones caigan cerca del valor del parámetro, hace falta además que tenga la varianza pequeña. La varianza de un estimador insesgado es la cantidad más importante para decidir qué tan bueno es el estimador para estimar el parámetro . Sean y cualesquiera dos estimadores insesgados de . Se dice que es un estimador más eficiente de  que , si , cumpliéndose la desigualdad en el sentido estricto para algún valor de . El cociente se llama eficiencia relativa de respecto a , y su valor está entre 0 y 1 (0  e  1). Si e está próximo a 0 es mejor que .

Estimación puntual

Estimación puntual Estimación de la Media Poblacional: La media muestral es un estimador centrado y consistente de la media poblacional. Este resultado es válido sin importar la distribución de probabilidad de la población de interés, siempre y cuando la varianza tenga un valor finito. en donde  y 2 son la media y la varianza de la distribución de la población, a partir de la cual se obtuvo la muestra. Nótese que conforme el tamaño de la muestra crece, la precisión de la media muestral para estimar la media poblacional aumenta (es un estimador consistente).

Estimación puntual

Estimación puntual Ejemplo: Los datos siguientes representan los pesos en gramos del contenido de 16 cajas de cereal que se seleccionaron al azar de un proceso de llenado con el propósito de verificar el peso promedio. 506 508 499 503 504 510 497 512 514 505 493 496 506 502 509 496 Calcular la estimación puntual para el peso promedio. Solución: gramos.

Estimación puntual Estimación de la Varianza Poblacional: Cuando se desconoce la media poblacional , debemos sustituir este parámetro por su estimador muestral, y el estimador a usar para la varianza poblacional, que es centrado o insesgado sin importar cuál sea la distribución de la población de interés, es la cuasivarianza muestral S2. Demostración:

Estimación puntual

Estimación puntual Si hubiésemos utilizado como estimador, la varianza muestral (desconociendo la media poblacional), no sería una estimación insesgada o centrada:

Estimación puntual Ejemplo: El cobre es un micronutriente requerido por la mayoría de las plantas. Su concentración en una planta se mide analizando las cenizas obtenidas al quemarla completamente. En un estudio de la variabilidad de la concentración de cobre en las plantas de la cuenca del Jarama, se seleccionó una muestra de 16 plantas. Se obtuvieron los siguientes datos (en partes por millón): 5 3 34 18 27 14 8 50 38 43 35 20 70 25 60 19 Calcular una estimación puntual para la variabilidad de la concentración. Solución:

Estimación puntual Estimación de la Proporción: Tenemos una población dividida en dos subconjuntos, en función de una característica determinada, de forma que la proporción de la población que posee la característica es p, y la de los que no la poseen es 1-p. Tratamos de estimar el valor de p. El estadístico dado por la expresión siguiente, es un estimador centrado y consistente de la proporción poblacional. Demostración:

Estimación puntual Ejemplo: Los huevos de la mosca azul producen infecciones al ser depositados en la sangre de un animal. Se efectuó un experimento para controlar el crecimiento de la población de este tipo de moscas. Las pupas fueron sometidas a radiación al objeto de esterilizar al mayor número posible de machos. Cada hembra se emparejó con un único macho. Se estudiaron 500 emparejamientos, de los cuales 415 resultaron estériles. Calcular una estimación puntual de la proporción poblacional de machos estériles. Solución:

Estimación por intervalos Una estimación por intervalo de un parámetro poblacional  es un intervalo de la forma L1 <  < L2, donde L1 y L2 dependen del valor del estadístico para una muestra particular y también de la distribución muestral de . Un intervalo de confianza al nivel de confianza (1-) 100% (donde 0 <  < 1) para el parámetro poblacional , a partir de una muestra seleccionada, es un intervalo aleatorio tal que: P (L1 <  < L2) = 1 -  El intervalo de estimación indica, por su longitud, la precisión de la estimación puntual. El intervalo L1 <  < L2, que se calcula a partir de la muestra seleccionada, se denomina entonces intervalo de confianza del (1 - ) 100%, la fracción (1- ) recibe el nombre de coeficiente de confianza o grado de confianza, y los puntos extremos L1 y L2, se llaman límites de confianza inferior y superior. Ya que muestras distintas generalmente dan valores distintos de y, por tanto, de L1 y L2, estos puntos extremos del intervalo son los valores de las variables aleatorias correspondientes L1 y L2.

Estimación por intervalos A partir de la distribución muestral de será posible determinar L1 y L2 tales que P(L1 <  < L2) sea igual para cualquier valor fraccional positivo que se desee especificar. Si, por ejemplo, se encuentran L1 y L2 tales que, P (L1 <  < L2) = 1 -  para 0 <  < 1, entonces se tiene una probabilidad de (1- ) de seleccionar una muestra aleatoria que produzca un intervalo que contenga a . En términos generales, la construcción de un intervalo de confianza para un parámetro desconocido  consiste en encontrar un estadístico suficiente y relacionarlo con una v. a. X que involucre a , a , no contenga ningún otro valor desconocido, y cuya distribución en el muestreo sea conocida. Entonces se seleccionan dos valores L1 y L2 tales que P(L1<X<L2) = 1 -  y, despejando, se obtiene la estimación de 

Estimación por intervalos Estimación de la Media, conocida la Varianza: Si la muestra se selecciona de una población normal o, a falta de esto, si n es lo bastante grande, se puede establecer un intervalo de confianza de  considerando la distribución muestral de . De acuerdo con el Teorema del Límite Central, es de esperarse que la distribución muestral de sea aproximadamente normal con media y desviación típica Al escribir z/2 para el valor z sobre el cual se encuentra un área de /2, se advierte que: P(-z/2 < Z < z/2) = 1 -  donde si x1, x2, ..., xn es una m.a.s. de una población de media  y varianza 2 conocida

Estimación por intervalos Por tanto: Si es la media de una m.a.s. de tamaño n de una población, aproximadamente normal, con varianza conocida 2, el intervalo de confianza de (1 - ) 100% para la media poblacional  es : donde z/2 es el valor de z a la derecha del cual se tiene un área de /2

Estimación por intervalos Ejemplo: Los datos siguientes representan los pesos en gramos del contenido de 16 cajas de cereal que se seleccionaron al azar de un proceso de llenado con el propósito de verificar el peso promedio. 506 508 499 503 504 510 497 512 514 505 493 496 506 502 509 496 Si el peso de cada caja de cereal es una v. a. normal con una desviación típica  = 5 gr., obtener el intervalo de confianza estimado del 95% para la media de llenado de este proceso. Solución: Para el coeficiente de confianza de 95%, =0.05. El valor de z0.025 se obtiene de la tabla normal y es de 1.96, ya que P(z >1.96) = 0.025. A partir de los datos muestrales, se obtiene que: gramos.

Estimación por intervalos Entonces, el intervalo de confianza al 95% para la media del proceso de llenado es: L1= = 503.75 - 1.96 * = 501.3 L2= = 503.75 + 1.96 * = 506.2 P(L1 <  < L2) = 95%

Estimación por intervalos Estimación de la Media Desconociendo la Varianza: La mayoría de las veces no se conoce la varianza de la población de la cual se seleccionan las muestras aleatorias. El valor de S2 proporciona una buena estimación de 2. ¿Qué le ocurre entonces al estadístico correspondiente (2) si se reemplaza por S2? Si la población de partida era normal, (2) seguía un distribución normal independientemente del tamaño de la muestra. Si ahora sustituimos 2 por S2, aunque la población de partida sea normal, la distribución del estadístico (3) puede desviarse de la normalidad. En este caso, si la n  30 puede seguir suponiéndose que sigue una distribución normal sin que por ello el error cometido sea muy grande.

Estimación por intervalos Sin embargo, si el tamaño de la muestra es pequeño, los valores de S2 fluctúan considerablemente de muestra a muestra y la distribución de la variable aleatoria (3) se desvía en forma apreciable de la normal estándar, siguiendo entonces una distribución t de Student con (n-1) grados de libertad. Al igual que habíamos visto en el apartado anterior: donde t/2 es el valor t con (n-1) grados de libertad, sobre el cual se encuentra un área de /2. Al multiplicar cada término de la desigualdad por y después de restar y multiplicar por (-1), se obtiene:

Estimación por intervalos Si y S son la media y la cuadesviación típica de una muestra aleatoria de una población aproximadamente normal con varianza desconocida 2 (aproximada por el valor de S2), un intervalo de confianza del (1 - ) 100% para  es: donde t/2 es el valor t con (n-1) grados de libertad, lo que deja un área de /2 a la derecha.

Estimación por intervalos Ejemplo: Los contenidos de 7 recipientes similares de ácido sulfúrico son: 9.8, 10.2, 10.4, 9.8, 10, 10.2, 9.6 litros. Encuentre un intervalo de confianza del 95% para la media de todos los recipientes, suponiendo una distribución aproximadamente normal. Solución: La media muestral y su desviación estándar para los datos que se dan son: = 10 S=0.283 t0.025 = 2.447 para 6 grados de libertad. El intervalo de confianza para  es: 10 - 2.447 * <  < 10 + 2.447 * lo cual se reduce a: 9.74 <  < 10.26

Estimación por intervalos Estimación de la Diferencia de Medias: Seleccionamos dos muestras aleatorias independientes de tamaños n1 y n2 de dos poblaciones normales con medias 1 y 2 y varianzas 21 y 22 respectivamente. El estimador puntual de 1 - 2 lo da el estadístico . Se puede esperar que la distribución muestral de esté distribuída aproximadamente en forma normal, con media y desviación típica

Estimación por intervalos Varianzas conocidas (12 Y 22) La variable normal estándar. caerá entre -z/2 y z/2 con una probabilidad (1 - ). P(-z/2 < Z < z/2) = 1 -  sustituyendo Z por la expresión anterior y siguiendo los mismos pasos que en casos anteriores, obtenemos: Si y son las medias de muestras aleatorias independientes de tamaños n1 y n2 de poblaciones aproximadamente normales, con varianzas conocidas 12 y 22 respectivamente, un intervalo de confianza de (1 - ) 100% para 1 - 2 es: donde z/2 es el valor de z que tiene un área de /2 a la derecha. Si las poblaciones son normales, el grado de confianza es exacto. Para poblaciones que no son normales, el Teorema del Límite Central proporciona una buena aproximación para muestras de tamaño razonable.

Estimación por intervalos Varianzas desconocidas y muestras grandes (n1 + n2  30 y n1  n2) Según especialistas estadísticos se puede seguir utilizando la aproximación normal, pero utilizando S12 y S22 en lugar de las varianzas correspondientes. Varianzas desconocidas pero iguales y muestras pequeñas (n1 + n2 < 30) Aquí tenemos que pero se desconoce su valor. El estadístico a usar en este caso será: donde Sp es La estimación muestral Sp de la varianza poblacional debe ser un promediado de las estimaciones muestrales S12 y S22, porque aunque las varianzas poblacionales 12 y 22 se supongan iguales, sus estimaciones muestrales no tienen por qué serlo, ya que se obtendrán valores diferentes según las muestras tomadas.

Estimación por intervalos Si y son las medias de muestras aleatorias independientes, de tamaños n1 y n2 respectivamente, de poblaciones aproximadamente normales, con varianzas iguales pero desconocidas, un intervalo de confianza de (1 - ) 100% para 1 - 2 es: donde y t/2 es el valor de t con (n1 + n2 -2) grados de libertad, con un área /2 a la derecha.

Estimación por intervalos Ejemplo: Biólogos marinos están estudiando dos especies de moluscos. Miden la longitud de las conchas para obtener información que les permita comparar las dos especies. Desconocen la variabilidad de la longitud de las conchas, pero tienen motivos para suponer que son iguales en ambas especies. La información de muestra da los resultados: n1= 10 n2=10 s12=1.611 s22=1.533 Construya un intervalo de confianza al 95% para la diferencia media entre las longitudes de las conchas de las dos especies. Solución: = 1.5722 Sp = 1.2538 (1-)100% = 95%   = 0.05 /2 = 0.025 t0.025,18 = 2.101 = 6.71 - 4.72 = 1.99 Entonces, el intervalo de confianza al 95% para la diferencia de medias es:

Estimación por intervalos

Estimación por intervalos Varianzas desconocidas y distintas, muestras pequeñas (n1 + n2 < 30) El estadístico que con más frecuencia se utiliza en este caso es: que sigue aproximadamente una distribución t con v grados de libertad donde Dado que v rara vez es un entero, se redondea al entero más cercano.

Estimación por intervalos Si y y S12 y S22 son las medias y cuasivarianzas de muestras pequeñas independientes de tamaños n1 y n2 respectivamente, de distribuciones aproximadamente normales con varianzas diferentes y desconocidas, un intervalo de confianza aproximado del (1 - ) 100% para 1 - 2 está dado por: donde t/2 es el valor t con grados de libertad, con un área de /2 a la derecha.

Estimación por intervalos Ejemplo: Los siguientes datos representan los tiempos de duración de las películas que producen dos compañías cinematográficas: Calcule el intervalo de confianza del 90% para la diferencia entre los tiempos promedio de duración de las películas que producen las dos compañías. Suponga que el tiempo de duración tiene una distribución aproximadamente normal. Solución: n1 = 5 t0.05,7 = 1.833 n2 = 7 = 98.4 - 110.7 = -12.31 (1-)100% = 90%   = 0.10 /2 = 0.05 s12= (21.16+19.36+134.56+129.96+0.16)=76.3 s22= (188.08+824.51+151.94+350.22+4132.65+515.94+53.08)=1036.07 Compañía Tiempo (min.) I 103 94 110 87 98 II 97 82 123 92 175 88 118

Estimación por intervalos

Estimación por intervalos Observaciones pareadas: En este caso se estima la diferencia de dos medias cuando las muestras no son independientes. Entonces, cada unidad experimental tiene un par de observaciones, una para cada población. Consideramos las diferencias d1, d2, ..., dn en las observaciones pareadas. Estas diferencias son los valores de una población de diferencias que se asumirá distribuida normalmente, con media d = 1 - 2 y varianza Se estima d2 por Sd2, la varianza de las diferencias que constituyen la muestra. El estimador puntual de d lo representa , la media de las diferencias que constituyen la muestra. Una vez obtenidas las diferencias, su estudio se reduce al caso de estimación de la media desconocida de una población aproximadamente normal, desconocida su varianza (ya visto anteriormente).

Estimación por intervalos El estadístico a utilizar en esta ocasión es: que sigue una distribución t con (n-1) grados de libertad. Obtener el intervalo de confianza es la rutina de siempre. Si y Sd son la media y la desviación típica de las diferencias normalmente distribuídas de n pares aleatorios de mediciones, un intervalo de confianza del (1 -  ) 100% para d = 1 - 2 es : donde t/2 es el valor t con (n-1) grados de libertad, con un área de /2 a la derecha.

Estimación por intervalos Ejemplo: Investigadores famosos han formulado la hipótesis de que el fuego puede cambiar los niveles de calcio presentes en la tierra y entonces afectar la cantidad de este mineral disponible para los venados. Se seleccionó un área grande de terreno para un incendio controlado. Se tomaron muestras de la tierra de 12 parcelas de la misma área antes del incendio y después de este para verificar su contenido en calcio. Se obtuvieron los resultados indicados en la tabla que sigue. Determine un intervalo de confianza al 95% para la diferencia promedio en el nivel de calcio presente en la tierra antes y después del incendio. Asuma que la distribución de la diferencia de los niveles de calcio es aproximadamente normal.

Estimación por intervalos Nivel de calcio Parcela Antes Después Diferencia 1 50 9 41 2 18 32 3 82 45 37 4 64 46 5 6 73 7 77 8 54 23 10 36 11 27 12

Estimación por intervalos Solución: = 40.583 S2d = (0.173889 + 73.668 + 12.838 + 29.344 + 548.36 + 548.36 + 19.51 + 19.51 + 1266.15 + 21.004 + 184.5 + 19.51) = 249.357 Sd =15.79 1- = 0.95   = 0.05  /2 = 0.025 t (n-1),0.025 = t 11, 0.025 = 2.201 L1= - t/2 = 40.583 - 2.201* = 30.5504 L2= + t/2 = 40.583 + 2.201* = 50.616

Estimación por intervalos Estimación de la proporción: Un estimador puntual de la proporción p en un experimento binomial está dado por el estadístico = X/n donde X representa el nº de éxitos en n intentos y sigue una distribución binomial de parámetros n y p. y es justo la media muestral de estos n valores. Por el Teorema del Límite Central, para una n lo bastante grande, está distribuida aproximadamente en forma normal, con media: y varianza:

Estimación por intervalos Si p no es cercano a 0 ni a 1 y n grande, X  N (np, npq) Se puede asegurar que: donde y z/2 es el valor de la curva normal estándar sobre la cual se encuentra un área de /2. Sustituyendo z obtenemos:

Estimación por intervalos Multiplicando ambos términos por y después de restar X/n y multiplicar por (-1), se obtiene: Por tanto los extremos del intervalo de confianza que obtenemos, dependerían del parámetro desconocido. ¿Cómo solucionarlo? Cuando n es grande, se introducen muy pocos errores al sustituir la p bajo el signo radical por su estimación puntual =X/n. Entonces se puede escribir:

Estimación por intervalos Si es la proporción de éxitos en una muestra aleatoria de tamaño n, un intervalo de confianza aproximado de (1-) 100% para el parámetro binomial p es: donde z/2 es el valor z con un área /2 a la derecha. Cuando n es pequeño y se cree que la proporción desconocida p se acerca a 0 o a 1, el procedimiento establecido para el intervalo de confianza no es confiable y no debe ser utilizado. Para estos casos se han desarrollado diferentes métodos gráficos y analíticos, en los que no vamos a entrar, para calcular el intervalo de confianza de p.

Estimación por intervalos Ejemplo: Los huevos de la mosca azul producen infecciones al ser depositados en la sangre de un animal. Se efectuó un experimento para controlar el crecimiento de la población de este tipo de moscas. Las pupas fueron sometidas a radiación al objeto de esterilizar al mayor número posible de machos. Cada hembra se emparejó con un único macho. Se estudiaron 500 emparejamientos, de los cuales 415 resultaron estériles. Construir un intervalo de confianza al 95% para la proporción poblacional de machos estériles. Solución: 1- = 0.95   = 0.05  /2 = 0.025  z0.025 = 1.96

Estimación por intervalos Estimación de Diferencia de Proporciones: Deseamos estimar la diferencia entre dos parámetros binomiales p1 y p2. Para establecer un intervalo de confianza para p1-p2 consideraremos la distribución muestral de están distribuidos cada uno en forma aproximadamente normal, con medias p1 y p2 y varianzas respectivamente. Al seleccionar muestras independientes de las dos poblaciones, las variables p1 y p2 serán independientes y entonces estará distribuida aproximadamente normal con media : y varianza:

Estimación por intervalos Por tanto se puede asegurar que donde Siguiendo todos los mismos pasos que en los demás casos, obtenemos: Si y son las proporciones de éxitos en muestras aleatorias de tamaños n1 y n2 respectivamente, un intervalo aproximado de confianza del (1- ) 100% para la diferencia entre dos parámetros binomiales p1 - p2 es: donde z/2 es el valor de z con un área de /2 a la derecha.

Estimación por intervalos Ejemplo: El departamento de tráfico ha preparado dos exámenes para conductores. Se desea determinar la diferencia entre las proporciones de conductores que pasan el examen 1 y los que pasan el examen 2. Su estudio revela lo siguiente: n1=250 n2=300 Construya un intervalo de confianza aproximado del 90% para la verdadera diferencia entre las proporciones de conductores que pasan los dos exámenes. Solución: Con la información suministrada podemos calcular: Además sabemos que 1- = 0.90   = 0.1  /2 = 0.05  z0.05 = 1.645

Estimación por intervalos Estimación de la Varianza: Si se toma una muestra de tamaño n de una población normal con varianza 2 y se calcula la cuasivarianza muestral S2, esta varianza calculada se puede utilizar como estimación puntual de 2. Para establecer una estimación de intervalo de 2 se utiliza el estadístico que, como ya sabemos, sigue una distribución 2 con (n-1) grados de libertad cuando las muestras se seleccionan de una población normal. Siguiendo todos los mismos pasos que en casos anteriores, obtenemos:

Estimación por intervalos Si s2 es la cuasivarianza de una muestra aleatoria de tamaño n de una población normal, un intervalo de confianza del (1-)100% para 2 es: donde 2/2 y 21 - /2 son valores de una distribución 2 con (n-1) grados de libertad, con áreas de /2 y 1- /2 a la derecha, respectivamente. Un intervalo de confianza del (1-) 100% para , se obtiene sacando la raíz cuadrada de cada punto extremo del intervalo para 2

Estimación por intervalos Ejemplo: El cobre es un micronutriente requerido por la mayoría de las plantas. Su concentración en una planta se mide analizando las cenizas obtenidas al quemarla completamente. En un estudio de la variabilidad de la concentración de cobre en las plantas de la cuenca del Jarama, se seleccionó una muestra de 16 plantas. Se obtuvieron los siguientes datos (en partes por millón): 5 3 34 18 27 14 8 50 38 43 35 20 70 25 60 19 Calcular un intervalo de estimación al 90% para la variabilidad de la concentración. Solución: 1 -  = 0.9   = 0.1  /2 = 0.05  1 - /2 = 0.95  n = 16 El intervalo es (226.41, 779.43) para 2, o bien (15.05, 27.92) para 

Estimación por intervalos Estimación de la Razón de dos Varianzas: Una estimación puntual del cociente de dos varianzas poblacionales 12/22 está dada por la razón S12/S22 de las cuasivarianzas muestrales. Si 12 y 22 son las varianzas de poblaciones normales, se puede establecer un intervalo de estimación de 12/22 utilizando el estadístico: donde S12 y S22 son las cuasivarianzas muestrales obtenidas de muestras aleatorias independientes de tamaños n1 y n2 que se sacan de las poblaciones normales con varianzas 12 y 22. En tal caso el estadístico F anterior, sigue una distribución F de Snedecor con (n1 -1) y (n2 -1) grados de libertad.

Estimación por intervalos Si s12 y s22 son las cuasivarianzas de muestras independientes de tamaños n1 y n2 respectivamente de poblaciones normales, entonces un intervalo de confianza del (1-) 100% para 12/22 es: donde f/2 (v1,v2) es el valor f con v1 = (n1 -1) y v2= (n2-1) grados de libertad con un área de /2 a la derecha, y f/2 (v2,v1) es un valor similar f con v2= (n2-1) y v1=(n1-1) grados de libertad. Un intervalo de confianza del (1-)100% para 1/2 se obtiene al sacar la raíz cuadrada de cada punto extremo del intervalo para 12/22

Estimación por intervalos Ejemplo: Determine un intervalo de confianza del 90% para el cociente de varianzas en el ejercicio de las compañías cinematográficas visto para la diferencia de medias. ¿Se debió suponer entonces que las varianzas eran iguales al determinar el intervalo de confianza para la diferencia de medias? Solución: n1 = 5 n2 = 7 1- = 0.90   = 0.1  /2 = 0.05  f0.05 (6,4) = 6.16 S12 = 76.3  S22 = 1035.9 El 1 no cae en el intervalo, por tanto no podemos suponer que las varianzas sean iguales  Bien hecho el problema de diferencia de medias

Relación entre ambas estimaciones Existe una distinción bastante clara entre los objetivos de las estimaciones puntuales y las estimaciones del intervalo de confianza. Los primeros proveen un número único que se extrae a partir de un conjunto de datos experimentales, y los últimos proporcionan intervalos, dados los datos experimentales, que son razonables para el parámetro, esto es, el 100 (1- )% de tales intervalos calculados "cubren" el parámetro. Sin embargo, a pesar de esta distinción clara, las dos aproximaciones a la estimación se relacionan una con otra. El "hilo común" es la distribución muestral del estimador puntual. Habíamos indicado que una medición de la calidad de un estimador insesgado era su varianza, y el error estándar de un estimador es su desviación típica. El límite de confianza lo podemos relacionar con la estimación puntual, de la siguiente forma.

Relación entre ambas estimaciones Para el caso de la estimación de la media  concociendo  tenemos: Estimador puntual: Distribución del estimador puntual: Varianza del estimador puntual: 2/n Desviación Típica del est. puntual: Luego, para el caso de X el límite de confianza calculado sería: Si desconocemos  y la reemplazamos por S obtenemos: Estimador puntual Distribución del estimador puntual: tn-1 Varianza del estimador puntual: S2/n Desviación típica de X:

Relación entre ambas estimaciones El intervalo de confianza no es mejor (en términos de anchura) que la calidad de la estimación puntual. Esto significa que los anchos de los intervalos de confianza se hacen menores en la medida en que mejora la calidad de las correspondientes estimaciones puntuales. Se puede argumentar, en definitiva, que un intervalo de confianza es tan sólo una ampliación de la estimación puntual para considerar la precisión de la misma.

Tamaño de la muestra Muchas veces estamos interesados en determinar el tamaño de la muestra necesario para obtener, con una confianza del (1-) 100%, una estimación del parámetro poblacional , de tal manera que el error de estimación no supere un determinado valor de error permitido . Hemos comentado que la anchura del intervalo de confianza, alrededor del estimador puntual del parámetro, nos da una medida de la precisión de este. Por tanto, para la determinación del tamaño muestral en cuestión basta coger la semilongitud del intervalo de confianza e igualarlo al error máximo permitido, despejando cuál será el valor de n que verifique esa igualdad. Si se utiliza como estimación de , se puede tener una confianza del (1-) 100% de que el error no excederá una cantidad especificada  cuando el tamaño de la muestra es:

Tamaño de la muestra Queremos que , es decir Con una confianza del (1-) 100% sabemos que luego Despejando de esa expresión la n obtenemos: Los valores fraccionarios de n se redondean al entero superior.

Tamaño de la muestra En la estimación de un intervalo de confianza para la proporción, hemos visto que si se utiliza como una estimación de p, se puede tener una confianza del (1-) 100% de que el error cometido no excederá de Si deseamos determinar qué tan grande debe ser una muestra para asegurar que el error al estimar p será menor que una cantidad especificada , tendremos que escoger una n, de tal forma que y ese valor de n es:

Tamaño de la muestra La expresión anterior puede resultar paradójica ya que para calcular ya debemos conocer n porque . Tenemos entonces dos opciones: a) Obtener una muestra con n  30 valores, a partir de la cual calcular la aproximación y usar esta aproximación para calcular cuantas observaciones serían necesarias para obtener la precisión deseada. b) Establecer un límite superior para el valor de n observando que es como máximo ¼, ya que cae entre 0 y 1. El valor máximo de n sería entonces: Al utilizar el máximo valor de , n aumenta más de lo necesario para el nivel de confianza deseado, y por tanto aumenta también el nivel de confianza.

Tamaño de la muestra Ejemplo: Se estudia la efectividad de un nuevo medicamento en el tratamiento de cierta enfermedad. Se suministra el medicamento a 14 pacientes de los cuales 13 reaccionan positivamente. Dar el tamaño de la muestra necesario para obtener una confianza del 99% de que el error de estimación de p no excederá de  2 % (0.02) Solución: Si suponemos que tenemos una buena estimación previa de p:

Tamaño de la muestra Si lo hacemos sin considerar la estimación previa de p, sino considerando el máximo: Como podemos apreciar es un tamaño de muestra considerablemente superior al caso anterior.

Ejercicios Ejercicio 6.1 Un fabricante de televisores está desarrollando un nuevo modelo de televisor en color, y para este fin se pueden utilizar dos tipos de esquemas transistorizados, cuyos tiempos de vida se suponen normalmente distribuidos. El fabricante selecciona una muestra de esquemas transistorizados del primer tipo de tamaño 12, y otra del segundo tipo de tamaño 11. Los datos muestrales respecto a la vida de cada esquema son los siguientes: Se pide: a) Construir un intervalo de confianza del 95% para la diferencia de vida media de cada tipo de esquema. b) Construir un intervalo de confianza del 90% para el cociente de varianzas de la vida de cada tipo de esquema.

Ejercicios Ejercicio 6.2 Una agencia de alquiler de automóviles necesita estimar el número medio de kilómetros diarios que realiza su flota de automóviles; a tal fin, en varios días de la semana toma los recorridos de 100 vehículos de su flota y obtiene que la media muestral es de 165 Km/día, y la cuasidesviación típica muestral de 6 Km/día. Se pide: a) Bajo la hipótesis de normalidad de la característica de estudio (nº de km por día), construir un intervalo de confianza para la media de dicha distribución a un nivel de confianza del 95%. b) Bajo la misma hipótesis de normalidad que en a), construir un intervalo de confianza del 90% para la varianza de dicha distribución.

Ejercicios Ejercicio 6.3 En un cruce de Melanogaster se han obtenido 60 moscas con alas vestigiales de un total de 300. Se pide: a) Encontrar un intervalo de confianza al 95% para la proporción de moscas con alas vestigiales entre los individuos resultantes de un gran número de cruces como este. b) Qué número de cruces hay que realizar de modo que la proporción de moscas con alas vestigiales entre los individuos resultantes de un gran número de cruces y la de la muestra difiera en valor absoluto en menos de 0.01 con una probabilidad del 95%?