La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Estimación. Estimación Puntual Propiedades deseables de los estimadores Estimaciones puntuales (media, proporción, varianza) Estimación por intervalos.

Presentaciones similares


Presentación del tema: "Estimación. Estimación Puntual Propiedades deseables de los estimadores Estimaciones puntuales (media, proporción, varianza) Estimación por intervalos."— Transcripción de la presentación:

1 Estimación. Estimación Puntual Propiedades deseables de los estimadores Estimaciones puntuales (media, proporción, varianza) Estimación por intervalos Estimación de la media y diferencias de medias Estimación de la proporción y diferencia de proporciones Estimación de la varianza y cociente de varianzas Relación entre ambas estimaciones Tamaño de la muestra Ejercicios

2 Introducción Inferencia Estadística, Estadística Inductiva, Teoría de Muestras Existe una de la que el investigador selecciona una que genera unos usados para evaluar unos que se usan para estimar que describen

3 Estimación puntual Una estimación puntual de algún parámetro poblacional es un valor único del estadístico. Por ejemplo, el valor de la estadística calculado a partir de una muestra de tamaño n, es una estimación puntual del parámetro poblacional. El estadístico que se utiliza para obtener una estimación puntual recibe el nombre de estimador o función de decisión. Generalmente muestras diferentes conducen a acciones o estimaciones diferentes. No se espera que un estimador obtenga sin error el valor del parámetro poblacional, sino que no se aleje mucho del valor real. Es posible definir muchas estadísticas para estimar un parámetro desconocido. Entonces, cómo seleccionar un buen estimador de ? Cúales son los criterios para juzgar cuándo un estimador de es "bueno" o "malo"?. Por ejemplo, pudo elegirse la mediana muestral o la moda para estimar el valor de la media poblacional, en qué nos basamos para elegir como estimador la media muestral?

4 Estimación puntual Propiedades Deseables de los Estimadores Puntuales: Básicamente para que un estimador sea bueno, se desea que la varianza del estimador sea lo más pequeña posible, mientras que la distribución de muestreo debe concentrarse alrededor del valor del parámetro. Estimadores Insesgados (Centrados): Se dice que la estadística = H(X 1, X 2,..., X n ) es un estimador insesgado del parámetro, si. Es decir, si los valores del estimador se centran alrededor del parámetro en cuestión.

5 Estimación puntual Estimadores Consistentes: Es razonable esperar que un buen estimador de un parámetro, sea cada vez mejor conforme crece el tamaño de la muestra y la información se vuelve más completa. La distribución de muestreo de un buen estimador se encuentra cada vez más concentrada alrededor del parámetro. Si un estimador es consistente, converge en probabilidad al valor del parámetro que está intentando estimar conforme el tamaño de la muestra crece. Esto implica que la varianza de un estimador consistente disminuye conforme n crece. Se dice que es un estimador consistente de si:

6 Estimación puntual Estimadores Eficientes (Insesgados de Varianza Mínima): El hecho de que un estimador sea centrado no garantiza que sus realizaciones caigan cerca del valor del parámetro, hace falta además que tenga la varianza pequeña. La varianza de un estimador insesgado es la cantidad más importante para decidir qué tan bueno es el estimador para estimar el parámetro. Sean y cualesquiera dos estimadores insesgados de. Se dice que es un estimador más eficiente de que, si, cumpliéndose la desigualdad en el sentido estricto para algún valor de. El cociente se llama eficiencia relativa de respecto a, y su valor está entre 0 y 1 (0 e 1). Si e está próximo a 0 es mejor que.

7 Estimación puntual

8 Estimación de la Media Poblacional: La media muestral es un estimador centrado y consistente de la media poblacional. Este resultado es válido sin importar la distribución de probabilidad de la población de interés, siempre y cuando la varianza tenga un valor finito. en donde y 2 son la media y la varianza de la distribución de la población, a partir de la cual se obtuvo la muestra. Nótese que conforme el tamaño de la muestra crece, la precisión de la media muestral para estimar la media poblacional aumenta (es un estimador consistente).

9 Estimación puntual

10 Ejemplo: Los datos siguientes representan los pesos en gramos del contenido de 16 cajas de cereal que se seleccionaron al azar de un proceso de llenado con el propósito de verificar el peso promedio Calcular la estimación puntual para el peso promedio. Solución: gramos.

11 Estimación puntual Estimación de la Varianza Poblacional: Cuando se desconoce la media poblacional, debemos sustituir este parámetro por su estimador muestral, y el estimador a usar para la varianza poblacional, que es centrado o insesgado sin importar cuál sea la distribución de la población de interés, es la cuasivarianza muestral S 2. Demostración:

12 Estimación puntual

13 Si hubiésemos utilizado como estimador, la varianza muestral (desconociendo la media poblacional), no sería una estimación insesgada o centrada:

14 Estimación puntual Ejemplo: El cobre es un micronutriente requerido por la mayoría de las plantas. Su concentración en una planta se mide analizando las cenizas obtenidas al quemarla completamente. En un estudio de la variabilidad de la concentración de cobre en las plantas de la cuenca del Jarama, se seleccionó una muestra de 16 plantas. Se obtuvieron los siguientes datos (en partes por millón): Calcular una estimación puntual para la variabilidad de la concentración. Solución:

15 Estimación puntual Estimación de la Proporción: Tenemos una población dividida en dos subconjuntos, en función de una característica determinada, de forma que la proporción de la población que posee la característica es p, y la de los que no la poseen es 1-p. Tratamos de estimar el valor de p. El estadístico dado por la expresión siguiente, es un estimador centrado y consistente de la proporción poblacional. Demostración:

16 Estimación puntual Ejemplo: Los huevos de la mosca azul producen infecciones al ser depositados en la sangre de un animal. Se efectuó un experimento para controlar el crecimiento de la población de este tipo de moscas. Las pupas fueron sometidas a radiación al objeto de esterilizar al mayor número posible de machos. Cada hembra se emparejó con un único macho. Se estudiaron 500 emparejamientos, de los cuales 415 resultaron estériles. Calcular una estimación puntual de la proporción poblacional de machos estériles. Solución:

17 Estimación por intervalos Una estimación por intervalo de un parámetro poblacional es un intervalo de la forma L 1 < < L 2, donde L 1 y L 2 dependen del valor del estadístico para una muestra particular y también de la distribución muestral de. Un intervalo de confianza al nivel de confianza (1- ) 100% (donde 0 < < 1) para el parámetro poblacional, a partir de una muestra seleccionada, es un intervalo aleatorio tal que: P (L 1 < < L 2 ) = 1 - El intervalo de estimación indica, por su longitud, la precisión de la estimación puntual. El intervalo L 1 < < L 2, que se calcula a partir de la muestra seleccionada, se denomina entonces intervalo de confianza del (1 - ) 100%, la fracción (1- ) recibe el nombre de coeficiente de confianza o grado de confianza, y los puntos extremos L 1 y L 2, se llaman límites de confianza inferior y superior. Ya que muestras distintas generalmente dan valores distintos de y, por tanto, de L 1 y L 2, estos puntos extremos del intervalo son los valores de las variables aleatorias correspondientes L 1 y L 2.

18 Estimación por intervalos A partir de la distribución muestral de será posible determinar L 1 y L 2 tales que P(L 1 < < L 2 ) sea igual para cualquier valor fraccional positivo que se desee especificar. Si, por ejemplo, se encuentran L 1 y L 2 tales que, P (L 1 < < L 2 ) = 1 - para 0 < < 1, entonces se tiene una probabilidad de (1- ) de seleccionar una muestra aleatoria que produzca un intervalo que contenga a. En términos generales, la construcción de un intervalo de confianza para un parámetro desconocido consiste en encontrar un estadístico suficiente y relacionarlo con una v. a. X que involucre a, a, no contenga ningún otro valor desconocido, y cuya distribución en el muestreo sea conocida. Entonces se seleccionan dos valores L 1 y L 2 tales que P(L 1

19 Estimación por intervalos Estimación de la Media, conocida la Varianza: Si la muestra se selecciona de una población normal o, a falta de esto, si n es lo bastante grande, se puede establecer un intervalo de confianza de considerando la distribución muestral de. De acuerdo con el Teorema del Límite Central, es de esperarse que la distribución muestral de sea aproximadamente normal con media y desviación típica Al escribir z /2 para el valor z sobre el cual se encuentra un área de /2, se advierte que: P(-z /2 < Z < z /2 ) = 1 - donde si x 1, x 2,..., x n es una m.a.s. de una población de media y varianza 2 conocida

20 Estimación por intervalos Por tanto: Si es la media de una m.a.s. de tamaño n de una población, aproximadamente normal, con varianza conocida 2, el intervalo de confianza de (1 - ) 100% para la media poblacional es : donde z /2 es el valor de z a la derecha del cual se tiene un área de /2

21 Estimación por intervalos Ejemplo: Los datos siguientes representan los pesos en gramos del contenido de 16 cajas de cereal que se seleccionaron al azar de un proceso de llenado con el propósito de verificar el peso promedio Si el peso de cada caja de cereal es una v. a. normal con una desviación típica = 5 gr., obtener el intervalo de confianza estimado del 95% para la media de llenado de este proceso. Solución: Para el coeficiente de confianza de 95%, =0.05. El valor de z se obtiene de la tabla normal y es de 1.96, ya que P(z >1.96) = A partir de los datos muestrales, se obtiene que: gramos.

22 Estimación por intervalos Entonces, el intervalo de confianza al 95% para la media del proceso de llenado es: L 1 = = * = L 2 = = * = P(L 1 < < L 2 ) = 95%

23 Estimación por intervalos Estimación de la Media Desconociendo la Varianza: La mayoría de las veces no se conoce la varianza de la población de la cual se seleccionan las muestras aleatorias. El valor de S 2 proporciona una buena estimación de 2. ¿Qué le ocurre entonces al estadístico correspondiente (2) si se reemplaza por S 2 ? Si la población de partida era normal, (2) seguía un distribución normal independientemente del tamaño de la muestra. Si ahora sustituimos 2 por S 2, aunque la población de partida sea normal, la distribución del estadístico (3) puede desviarse de la normalidad. En este caso, si la n 30 puede seguir suponiéndose que sigue una distribución normal sin que por ello el error cometido sea muy grande.

24 Estimación por intervalos Sin embargo, si el tamaño de la muestra es pequeño, los valores de S 2 fluctúan considerablemente de muestra a muestra y la distribución de la variable aleatoria (3) se desvía en forma apreciable de la normal estándar, siguiendo entonces una distribución t de Student con (n-1) grados de libertad. Al igual que habíamos visto en el apartado anterior: donde t /2 es el valor t con (n-1) grados de libertad, sobre el cual se encuentra un área de /2. Al multiplicar cada término de la desigualdad por y después de restar y multiplicar por (-1), se obtiene:

25 Estimación por intervalos Si y S son la media y la cuadesviación típica de una muestra aleatoria de una población aproximadamente normal con varianza desconocida 2 (aproximada por el valor de S 2 ), un intervalo de confianza del (1 - ) 100% para es: donde t /2 es el valor t con (n-1) grados de libertad, lo que deja un área de /2 a la derecha.

26 Estimación por intervalos Ejemplo: Los contenidos de 7 recipientes similares de ácido sulfúrico son: 9.8, 10.2, 10.4, 9.8, 10, 10.2, 9.6 litros. Encuentre un intervalo de confianza del 95% para la media de todos los recipientes, suponiendo una distribución aproximadamente normal. Solución: La media muestral y su desviación estándar para los datos que se dan son: = 10 S=0.283 t = para 6 grados de libertad. El intervalo de confianza para es: * < < * lo cual se reduce a: 9.74 < < 10.26

27 Estimación por intervalos Estimación diferencia de medias Varianzas conocidas Varianzas desconocidas Muestras grandes Muestras pequeñas Var. igualesVar. distintas Observaciones pareadas Estimación de la Diferencia de Medias: Seleccionamos dos muestras aleatorias independientes de tamaños n 1 y n 2 de dos poblaciones normales con medias 1 y 2 y varianzas 2 1 y 2 2 respectivamente. El estimador puntual de lo da el estadístico. Se puede esperar que la distribución muestral de esté distribuída aproximadamente en forma normal, con media y desviación típica

28 Estimación por intervalos Varianzas conocidas ( 1 2 Y 2 2 ) La variable normal estándar. caerá entre -z /2 y z /2 con una probabilidad (1 - ). P(-z /2 < Z < z /2 ) = 1 - sustituyendo Z por la expresión anterior y siguiendo los mismos pasos que en casos anteriores, obtenemos: Si y son las medias de muestras aleatorias independientes de tamaños n 1 y n 2 de poblaciones aproximadamente normales, con varianzas conocidas 1 2 y 2 2 respectivamente, un intervalo de confianza de (1 - ) 100% para es: donde z /2 es el valor de z que tiene un área de /2 a la derecha. Si las poblaciones son normales, el grado de confianza es exacto. Para poblaciones que no son normales, el Teorema del Límite Central proporciona una buena aproximación para muestras de tamaño razonable.

29 Estimación por intervalos Varianzas desconocidas y muestras grandes (n 1 + n 2 30 y n 1 n 2 ) Según especialistas estadísticos se puede seguir utilizando la aproximación normal, pero utilizando S 1 2 y S 2 2 en lugar de las varianzas correspondientes. Varianzas desconocidas pero iguales y muestras pequeñas (n 1 + n 2 < 30) Aquí tenemos que pero se desconoce su valor. El estadístico a usar en este caso será: donde S p es La estimación muestral S p de la varianza poblacional debe ser un promediado de las estimaciones muestrales S 1 2 y S 2 2, porque aunque las varianzas poblacionales 1 2 y 2 2 se supongan iguales, sus estimaciones muestrales no tienen por qué serlo, ya que se obtendrán valores diferentes según las muestras tomadas.

30 Estimación por intervalos Si y son las medias de muestras aleatorias independientes, de tamaños n 1 y n 2 respectivamente, de poblaciones aproximadamente normales, con varianzas iguales pero desconocidas, un intervalo de confianza de (1 - ) 100% para es: donde y t /2 es el valor de t con (n 1 + n 2 -2) grados de libertad, con un área /2 a la derecha.

31 Estimación por intervalos Ejemplo: Biólogos marinos están estudiando dos especies de moluscos. Miden la longitud de las conchas para obtener información que les permita comparar las dos especies. Desconocen la variabilidad de la longitud de las conchas, pero tienen motivos para suponer que son iguales en ambas especies. La información de muestra da los resultados: n 1 = 10 n 2 =10 s 1 2 =1.611s 2 2 =1.533 Construya un intervalo de confianza al 95% para la diferencia media entre las longitudes de las conchas de las dos especies. Solución: = S p = (1- )100% = 95% = 0.05 /2 = t 0.025,18 = = = 1.99 Entonces, el intervalo de confianza al 95% para la diferencia de medias es:

32 Estimación por intervalos L 1 = = *0.5607= L 2 = = *0.5607= P(0.812 < ( ) < 3.168) = 95%

33 Estimación por intervalos Varianzas desconocidas y distintas, muestras pequeñas (n 1 + n 2 < 30) El estadístico que con más frecuencia se utiliza en este caso es: que sigue aproximadamente una distribución t con v grados de libertad donde Dado que v rara vez es un entero, se redondea al entero más cercano.

34 Estimación por intervalos Si y y S 1 2 y S 2 2 son las medias y cuasivarianzas de muestras pequeñas independientes de tamaños n 1 y n 2 respectivamente, de distribuciones aproximadamente normales con varianzas diferentes y desconocidas, un intervalo de confianza aproximado del (1 - ) 100% para está dado por: donde t /2 es el valor t con grados de libertad, con un área de /2 a la derecha.

35 Estimación por intervalos Ejemplo: Los siguientes datos representan los tiempos de duración de las películas que producen dos compañías cinematográficas: Calcule el intervalo de confianza del 90% para la diferencia entre los tiempos promedio de duración de las películas que producen las dos compañías. Suponga que el tiempo de duración tiene una distribución aproximadamente normal. Solución: n 1 = 5t 0.05,7 = n 2 = 7= = (1- )100% = 90% = 0.10 /2 = 0.05 s 1 2 = ( )=76.3 s 2 2 = ( )= CompañíaTiempo (min.) I II

36 Estimación por intervalos L 1 = = *12.78= L 2 = = *12.78= P( < ( ) < 11.11) = 90%

37 Estimación por intervalos Observaciones pareadas: En este caso se estima la diferencia de dos medias cuando las muestras no son independientes. Entonces, cada unidad experimental tiene un par de observaciones, una para cada población. Consideramos las diferencias d 1, d 2,..., d n en las observaciones pareadas. Estas diferencias son los valores de una población de diferencias que se asumirá distribuida normalmente, con media d = y varianza Se estima d 2 por S d 2, la varianza de las diferencias que constituyen la muestra. El estimador puntual de d lo representa, la media de las diferencias que constituyen la muestra. Una vez obtenidas las diferencias, su estudio se reduce al caso de estimación de la media desconocida de una población aproximadamente normal, desconocida su varianza (ya visto anteriormente).

38 Estimación por intervalos El estadístico a utilizar en esta ocasión es: que sigue una distribución t con (n-1) grados de libertad. Obtener el intervalo de confianza es la rutina de siempre. Si y S d son la media y la desviación típica de las diferencias normalmente distribuídas de n pares aleatorios de mediciones, un intervalo de confianza del (1 - ) 100% para d = es : donde t /2 es el valor t con (n-1) grados de libertad, con un área de /2 a la derecha.

39 Estimación por intervalos Ejemplo: Investigadores famosos han formulado la hipótesis de que el fuego puede cambiar los niveles de calcio presentes en la tierra y entonces afectar la cantidad de este mineral disponible para los venados. Se seleccionó un área grande de terreno para un incendio controlado. Se tomaron muestras de la tierra de 12 parcelas de la misma área antes del incendio y después de este para verificar su contenido en calcio. Se obtuvieron los resultados indicados en la tabla que sigue. Determine un intervalo de confianza al 95% para la diferencia promedio en el nivel de calcio presente en la tierra antes y después del incendio. Asuma que la distribución de la diferencia de los niveles de calcio es aproximadamente normal.

40 Estimación por intervalos Nivel de calcio ParcelaAntesDespuésDiferencia

41 Estimación por intervalos Solución: = S 2 d = ( ) = S d = = 0.95 = 0.05 /2 = t (n-1),0.025 = t 11, = L 1 = - t /2 = * = L 2 = + t /2 = * =

42 Estimación por intervalos Estimación de la proporción: Un estimador puntual de la proporción p en un experimento binomial está dado por el estadístico = X/n donde X representa el nº de éxitos en n intentos y sigue una distribución binomial de parámetros n y p. y es justo la media muestral de estos n valores. Por el Teorema del Límite Central, para una n lo bastante grande, está distribuida aproximadamente en forma normal, con media: y varianza:

43 Estimación por intervalos Si p no es cercano a 0 ni a 1 y n grande, X N (np, npq) Se puede asegurar que: donde y z /2 es el valor de la curva normal estándar sobre la cual se encuentra un área de /2. Sustituyendo z obtenemos:

44 Estimación por intervalos Multiplicando ambos términos por y después de restar X/n y multiplicar por (-1), se obtiene: Por tanto los extremos del intervalo de confianza que obtenemos, dependerían del parámetro desconocido. ¿Cómo solucionarlo? Cuando n es grande, se introducen muy pocos errores al sustituir la p bajo el signo radical por su estimación puntual =X/n. Entonces se puede escribir:

45 Estimación por intervalos Si es la proporción de éxitos en una muestra aleatoria de tamaño n, un intervalo de confianza aproximado de (1- ) 100% para el parámetro binomial p es: donde z /2 es el valor z con un área /2 a la derecha. Cuando n es pequeño y se cree que la proporción desconocida p se acerca a 0 o a 1, el procedimiento establecido para el intervalo de confianza no es confiable y no debe ser utilizado. Para estos casos se han desarrollado diferentes métodos gráficos y analíticos, en los que no vamos a entrar, para calcular el intervalo de confianza de p.

46 Estimación por intervalos Ejemplo: Los huevos de la mosca azul producen infecciones al ser depositados en la sangre de un animal. Se efectuó un experimento para controlar el crecimiento de la población de este tipo de moscas. Las pupas fueron sometidas a radiación al objeto de esterilizar al mayor número posible de machos. Cada hembra se emparejó con un único macho. Se estudiaron 500 emparejamientos, de los cuales 415 resultaron estériles. Construir un intervalo de confianza al 95% para la proporción poblacional de machos estériles. Solución: 1- = 0.95 = 0.05 /2 = z = 1.96

47 Estimación por intervalos Estimación de Diferencia de Proporciones: Deseamos estimar la diferencia entre dos parámetros binomiales p 1 y p 2. Para establecer un intervalo de confianza para p 1 -p 2 consideraremos la distribución muestral de están distribuidos cada uno en forma aproximadamente normal, con medias p 1 y p 2 y varianzas respectivamente. Al seleccionar muestras independientes de las dos poblaciones, las variables p 1 y p 2 serán independientes y entonces estará distribuida aproximadamente normal con media : y varianza:

48 Estimación por intervalos Por tanto se puede asegurar que donde Siguiendo todos los mismos pasos que en los demás casos, obtenemos: Si y son las proporciones de éxitos en muestras aleatorias de tamaños n 1 y n 2 respectivamente, un intervalo aproximado de confianza del (1- ) 100% para la diferencia entre dos parámetros binomiales p 1 - p 2 es: donde z /2 es el valor de z con un área de /2 a la derecha.

49 Estimación por intervalos Ejemplo: El departamento de tráfico ha preparado dos exámenes para conductores. Se desea determinar la diferencia entre las proporciones de conductores que pasan el examen 1 y los que pasan el examen 2. Su estudio revela lo siguiente: n 1 =250n 2 =300 Construya un intervalo de confianza aproximado del 90% para la verdadera diferencia entre las proporciones de conductores que pasan los dos exámenes. Solución: Con la información suministrada podemos calcular: Además sabemos que 1- = 0.90 = 0.1 /2 = 0.05 z 0.05 = 1.645

50 Estimación por intervalos Estimación de la Varianza: Si se toma una muestra de tamaño n de una población normal con varianza 2 y se calcula la cuasivarianza muestral S 2, esta varianza calculada se puede utilizar como estimación puntual de 2. Para establecer una estimación de intervalo de 2 se utiliza el estadístico que, como ya sabemos, sigue una distribución 2 con (n-1) grados de libertad cuando las muestras se seleccionan de una población normal. Siguiendo todos los mismos pasos que en casos anteriores, obtenemos:

51 Estimación por intervalos Si s 2 es la cuasivarianza de una muestra aleatoria de tamaño n de una población normal, un intervalo de confianza del (1- )100% para 2 es: donde 2 /2 y /2 son valores de una distribución 2 con (n-1) grados de libertad, con áreas de /2 y 1- /2 a la derecha, respectivamente. Un intervalo de confianza del (1- ) 100% para, se obtiene sacando la raíz cuadrada de cada punto extremo del intervalo para 2

52 Estimación por intervalos Ejemplo: El cobre es un micronutriente requerido por la mayoría de las plantas. Su concentración en una planta se mide analizando las cenizas obtenidas al quemarla completamente. En un estudio de la variabilidad de la concentración de cobre en las plantas de la cuenca del Jarama, se seleccionó una muestra de 16 plantas. Se obtuvieron los siguientes datos (en partes por millón): Calcular un intervalo de estimación al 90% para la variabilidad de la concentración. Solución: 1 - = 0.9 = 0.1 /2 = /2 = 0.95 n = 16 El intervalo es (226.41, ) para 2, o bien (15.05, 27.92) para

53 Estimación por intervalos Estimación de la Razón de dos Varianzas: Una estimación puntual del cociente de dos varianzas poblacionales 1 2 / 2 2 está dada por la razón S 1 2 /S 2 2 de las cuasivarianzas muestrales. Si 1 2 y 2 2 son las varianzas de poblaciones normales, se puede establecer un intervalo de estimación de 1 2 / 2 2 utilizando el estadístico: donde S 1 2 y S 2 2 son las cuasivarianzas muestrales obtenidas de muestras aleatorias independientes de tamaños n 1 y n 2 que se sacan de las poblaciones normales con varianzas 1 2 y 2 2. En tal caso el estadístico F anterior, sigue una distribución F de Snedecor con (n 1 -1) y (n 2 -1) grados de libertad.

54 Estimación por intervalos Si s 1 2 y s 2 2 son las cuasivarianzas de muestras independientes de tamaños n 1 y n 2 respectivamente de poblaciones normales, entonces un intervalo de confianza del (1- ) 100% para 1 2 / 2 2 es: donde f /2 (v1,v2) es el valor f con v 1 = (n 1 -1) y v 2 = (n 2 -1) grados de libertad con un área de /2 a la derecha, y f /2 (v2,v1) es un valor similar f con v 2 = (n 2 -1) y v 1 =(n 1 - 1) grados de libertad. Un intervalo de confianza del (1- )100% para 1 / 2 se obtiene al sacar la raíz cuadrada de cada punto extremo del intervalo para 1 2 / 2 2

55 Estimación por intervalos Ejemplo: Determine un intervalo de confianza del 90% para el cociente de varianzas en el ejercicio de las compañías cinematográficas visto para la diferencia de medias. ¿Se debió suponer entonces que las varianzas eran iguales al determinar el intervalo de confianza para la diferencia de medias? Solución: n 1 = 5 n 2 = 7 1- = 0.90 = 0.1 /2 = 0.05 f 0.05 (6,4) = 6.16 S 1 2 = 76.3 S 2 2 = El 1 no cae en el intervalo, por tanto no podemos suponer que las varianzas sean iguales Bien hecho el problema de diferencia de medias

56 Relación entre ambas estimaciones Existe una distinción bastante clara entre los objetivos de las estimaciones puntuales y las estimaciones del intervalo de confianza. Los primeros proveen un número único que se extrae a partir de un conjunto de datos experimentales, y los últimos proporcionan intervalos, dados los datos experimentales, que son razonables para el parámetro, esto es, el 100 (1- )% de tales intervalos calculados "cubren" el parámetro. Sin embargo, a pesar de esta distinción clara, las dos aproximaciones a la estimación se relacionan una con otra. El "hilo común" es la distribución muestral del estimador puntual. Habíamos indicado que una medición de la calidad de un estimador insesgado era su varianza, y el error estándar de un estimador es su desviación típica. El límite de confianza lo podemos relacionar con la estimación puntual, de la siguiente forma.

57 Relación entre ambas estimaciones Para el caso de la estimación de la media concociendo tenemos: Estimador puntual: Distribución del estimador puntual: Varianza del estimador puntual: 2 /n Desviación Típica del est. puntual: Luego, para el caso de X el límite de confianza calculado sería: Si desconocemos y la reemplazamos por S obtenemos: Estimador puntual Distribución del estimador puntual:t n-1 Varianza del estimador puntual:S 2 /n Desviación típica de X:

58 Relación entre ambas estimaciones El intervalo de confianza no es mejor (en términos de anchura) que la calidad de la estimación puntual. Esto significa que los anchos de los intervalos de confianza se hacen menores en la medida en que mejora la calidad de las correspondientes estimaciones puntuales. Se puede argumentar, en definitiva, que un intervalo de confianza es tan sólo una ampliación de la estimación puntual para considerar la precisión de la misma.

59 Tamaño de la muestra Muchas veces estamos interesados en determinar el tamaño de la muestra necesario para obtener, con una confianza del (1- ) 100%, una estimación del parámetro poblacional, de tal manera que el error de estimación no supere un determinado valor de error permitido. Hemos comentado que la anchura del intervalo de confianza, alrededor del estimador puntual del parámetro, nos da una medida de la precisión de este. Por tanto, para la determinación del tamaño muestral en cuestión basta coger la semilongitud del intervalo de confianza e igualarlo al error máximo permitido, despejando cuál será el valor de n que verifique esa igualdad. Si se utiliza como estimación de, se puede tener una confianza del (1- ) 100% de que el error no excederá una cantidad especificada cuando el tamaño de la muestra es:

60 Tamaño de la muestra Queremos que, es decir Con una confianza del (1- ) 100% sabemos que luego Despejando de esa expresión la n obtenemos: Los valores fraccionarios de n se redondean al entero superior.

61 Tamaño de la muestra En la estimación de un intervalo de confianza para la proporción, hemos visto que si se utiliza como una estimación de p, se puede tener una confianza del (1- ) 100% de que el error cometido no excederá de Si deseamos determinar qué tan grande debe ser una muestra para asegurar que el error al estimar p será menor que una cantidad especificada, tendremos que escoger una n, de tal forma que y ese valor de n es:

62 Tamaño de la muestra La expresión anterior puede resultar paradójica ya que para calcular ya debemos conocer n porque. Tenemos entonces dos opciones: a) Obtener una muestra con n 30 valores, a partir de la cual calcular la aproximación y usar esta aproximación para calcular cuantas observaciones serían necesarias para obtener la precisión deseada. b) Establecer un límite superior para el valor de n observando que es como máximo ¼, ya que cae entre 0 y 1. El valor máximo de n sería entonces: Al utilizar el máximo valor de, n aumenta más de lo necesario para el nivel de confianza deseado, y por tanto aumenta también el nivel de confianza.

63 Tamaño de la muestra Ejemplo: Se estudia la efectividad de un nuevo medicamento en el tratamiento de cierta enfermedad. Se suministra el medicamento a 14 pacientes de los cuales 13 reaccionan positivamente. Dar el tamaño de la muestra necesario para obtener una confianza del 99% de que el error de estimación de p no excederá de 2 % (0.02) Solución: Si suponemos que tenemos una buena estimación previa de p:

64 Tamaño de la muestra Si lo hacemos sin considerar la estimación previa de p, sino considerando el máximo: Como podemos apreciar es un tamaño de muestra considerablemente superior al caso anterior.

65 Ejercicios Ejercicio 6.1 Un fabricante de televisores está desarrollando un nuevo modelo de televisor en color, y para este fin se pueden utilizar dos tipos de esquemas transistorizados, cuyos tiempos de vida se suponen normalmente distribuidos. El fabricante selecciona una muestra de esquemas transistorizados del primer tipo de tamaño 12, y otra del segundo tipo de tamaño 11. Los datos muestrales respecto a la vida de cada esquema son los siguientes: Se pide: a) Construir un intervalo de confianza del 95% para la diferencia de vida media de cada tipo de esquema. b) Construir un intervalo de confianza del 90% para el cociente de varianzas de la vida de cada tipo de esquema.

66 Ejercicios Ejercicio 6.2 Una agencia de alquiler de automóviles necesita estimar el número medio de kilómetros diarios que realiza su flota de automóviles; a tal fin, en varios días de la semana toma los recorridos de 100 vehículos de su flota y obtiene que la media muestral es de 165 Km/día, y la cuasidesviación típica muestral de 6 Km/día. Se pide: a) Bajo la hipótesis de normalidad de la característica de estudio (nº de km por día), construir un intervalo de confianza para la media de dicha distribución a un nivel de confianza del 95%. b) Bajo la misma hipótesis de normalidad que en a), construir un intervalo de confianza del 90% para la varianza de dicha distribución.

67 Ejercicios Ejercicio 6.3 En un cruce de Melanogaster se han obtenido 60 moscas con alas vestigiales de un total de 300. Se pide: a) Encontrar un intervalo de confianza al 95% para la proporción de moscas con alas vestigiales entre los individuos resultantes de un gran número de cruces como este. b) Qué número de cruces hay que realizar de modo que la proporción de moscas con alas vestigiales entre los individuos resultantes de un gran número de cruces y la de la muestra difiera en valor absoluto en menos de 0.01 con una probabilidad del 95%?


Descargar ppt "Estimación. Estimación Puntual Propiedades deseables de los estimadores Estimaciones puntuales (media, proporción, varianza) Estimación por intervalos."

Presentaciones similares


Anuncios Google