ESTIMACION En varios pasajes de este libro hemos planteado la dificultad que se confronta en las investigaciones, de llegar a conclusiones sobre una población.

Slides:



Advertisements
Presentaciones similares
DISEÑO DE EXPERIMENTOS EXPERIMENTOS DE COMPARACIÓN SIMPLE
Advertisements

DSITRIBUCION T DE STUDENT.
Intervalos de Confianza para la Media de la Población
ESTIMACION DE PARAMETRO
PRUEBA DE HIPOTESIS Denominada también prueba de significación, tiene como objetivo principal evaluar suposiciones o afirmaciones acerca de los valores.
Estimación. Estimación Puntual Estimación por intervalos
De la muestra a la población
Estimación de parámetros poblacionales
} LISSET BÁRCENAS MONTERROZA
Introducción al tema El único método científico para validar conclusiones sobre un grupo de individuos a partir de la información que nos proporciona un.
KRIGING.
Universidad de Chile Facultad de Ciencias Químicas y Farmacéuticas
INFERENCIA ESTADÍSTICA
ESTIMACION DEL TAMAÑO DE LA MUESTRA.
Estimación por intervalos de confianza.
Estimación por Intervalos de confianza
2. ESTIMACIÓN Depto. Matemáticas – IES Elaios
Nombre: Israel Espinosa Jiménez Matricula: Carrera: TIC Cuatrimestre: 4 Página 1 de 5.
Distribuciones muestrales Procedimientos de muestreo
Diseño Estadístico y Herramientas para la Calidad
Unidad V: Estimación de
ESTADISTICA TEMA 13.
VARIABLE ALEATORIA Y DISTRIBUCION DE PROBABILIDAD
INTERVALO DE CONFIANZA
Elementos Básicos de Probabilidad y Estadística Javier Aparicio División de Estudios Políticos, CIDE Julio 2009
Distribuciones derivadas del muestreo
Estadística Clase 3 Intervalos de confianza.
ESTADISTICA I CSH M. en C. Gal Vargas Neri.
DISTRIBUCIONES DE MUESTREO
ESTADISTICA TEMA 12.
Unidad V: Estimación de
ESTADISTICA TEMA y 223.
ANALISIS DE FRECUENCIA EN HIDROLOGIA (2)
Tema 8: Estimación 1. Introducción.
Distribución Normal o gaussiana
DISTRIBUCION NORMAL Mario Briones L. MV, MSc 2005.
Introducción La inferencia estadística es el procedimiento mediante el cual se llega a inferencias acerca de una población con base en los resultados obtenidos.
Capítulo 7 Estimación de Parámetros Estadística Computacional
ESTIMACION POR INTERVALOS
Inferencia Estadística
Estadística para administradores
ESTIMACIÓN ESTADÍSTICA POR INTERVALO DE CONFIANZA
Unidad V: Estimación de
Capítulo 1. Conceptos básicos de la Estadística
Tema 7: Introducción a la inferencia estadística
Sesión 13: Distribuciones Muestrales y Tamaño de Muestra
Pruebas de hipótesis.
COMPROBACION DE HIPOTESIS SOBRE DOS PROMEDIOS Mario Briones L. MV, MSc 2005.
Elementos Básicos de Probabilidad y Estadística
Estimación y contraste de hipótesis
INTERVALOS DE CONFIANZA
ESTIMACIÓN DE PARÁMETROS
INTERVALO DE CONFIANZA
Prueba de Hipótesis Una hipótesis estadística es un supuesto que se establece sobre las características de una distribución poblacional El estudio se plantea.
MODELOS DE PRONOSTICOS Primer semestre 2010 Modelo de Regresión con dos variables.
Intervalos de confianza
Aspectos generales de la investigación educativa en el SNIT
INFERENCIA ESTADÍSTICA
UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE CIENCIAS ECONOMICAS INFERENCIA ESTADISTICA TEMA: ESTIMACION PUNTUAL, PROPIEDADES DE LAS ESTIMACIONES;
MEDIDAS DE DISPERSIÓN Pedro Godoy Gómez. Miden qué tanto se dispersan las observaciones alrededor de su media. MEDIDAS DE DISPERSIÓN.
TAMAÑO DE LA MUESTRA. Para definir el tamaño de la muestra se debe tener en cuenta los recursos disponibles y las necesidades del plan de análisis, el.
Estimación Estadística Tares # 3. Estimación Estadística Conjunto de técnicas que permiten dar un valor aproximado de un parámetro de una población a.
Intervalos de Confianza M. C. José Juan Rincón Pasaye UMSNH – FIE Mayo de 2003.
Estadística Inferencial
Estimación estadística
ESTIMACION DEL TAMAÑO DE LA MUESTRA. La primera pregunta que un estadístico debe contestar al planear una investigación de muestreo es, casi siempre, el.
TAMAÑO DE LA MUESTRA Alvaro Alfredo Bravo Dpto. de Matemáticas y Estadística Universidad de Nariño - Colombia.
DISTRIBUCIÓN T DE STUDENT
Viviana Acosta Estadística II. Que es Es una distribución de probabilidad que surge del problema de estimar la media de una población normalmente distribuida.
INTERVALO DE CONFIANZA
Transcripción de la presentación:

ESTIMACION En varios pasajes de este libro hemos planteado la dificultad que se confronta en las investigaciones, de llegar a conclusiones sobre una población grande mediante el estudio de la totalidad de sus elementos, lo que hace imperativo la necesidad de seleccionar muestras, de las cuales se obtienen medidas (estadísticos) que vienen a contribuir a la inferencia sobre las medidas de la población (parámetros). La estimación puede ser de dos tipos: Estimación puntual Estimación por intervalo Mediante la estimación puntual se utiliza un estadístico muestral para estimar el parámetro poblacional, la media muestral es un estimador puntual utilizado para estimar el parámetro poblacional en un solo valor o punto. Por ejemplo el gerente financiero de una empresa desea saber cuál es la media de las cuentas por cobrar. De los datos relativos a una muestra de tamaño n = 200 cuentas, se encontró que el monto medio de las cuentas por cobrar es de X = 125,000. Entonces este valor es utilizado como estimador puntual de la media de las cuentas por cobrar de toda la población. LA ESTIMACION POR INTERVALOS Establece que el parámetro de la población se encuentra dentro de un rango, esto es, entre un valor mínimo denominado límite inferior y un valor máximo, denominado límite superior. La estimación por intervalo implica la introducción de un nivel de confianza de que el intervalo contiene el valor del parámetro. Niveles de confianza 90%, 95% y 99% que en realidad son convencionales, usted podría estimar con valores diferentes a estos incluso menores de 90%, claro está, que mientras menor es el nivel de confianza menor será la exactitud de la estimación.

Prosiguiendo con la estimación puntual y a modo de ejemplo, suponga usted que se tienen los siguientes datos referentes al tiempo en minutos que le toma a un auditor auditar unos documentos contables. 30, 40, 38, 36,34, 26, 24, 33, 22, 28 La media X = 30 + 40 + 38 + 36 + 34 + 26 + 24 + 33 + 22 + 28 …….. X = 29.7 minutos 10 X = 29.7 minutos es la media muestral, ahora el cálculo de la varianza muestral, veamos Tiempo (mins.) Xi Xi – X (Xi – X)2 30 40 38 36 34 26 24 33 22 30-29.7 = 0.3 40-29.7 = 10.3 38-29.7 = 8.3 36-29.7 = 6.3 34-29.7 = 4.3 26-29.7 = -3.7 24-29.7 = -5.7 33-29.7 = 3.3 22-29.7 = -7.7 0.09 106.09 68.89 39.69 18.49 13.69 32.49 10.89 59.29 Total (Xi – X)2 = 418.5

Z =  2  2 Z ESTIMACION POR INTERVALOS La media de la población  El procedimiento para determinar el intervalo (a,b) que comprenda un parámetro de la población, en este caso de la media de la población  con cierta probabilidad 1 - , se conoce como estimación por intervalos donde  es la probabilidad de que el intervalo no contenga el valor del parámetro y 1 -  probabilidad de que intervalo incluya el valor del parámetro, se escribe de la siguiente manera. P (a <  < b) = 1 -  donde a y b son dos variables aleatorias y respectivamente son los límite inferior y superior del intervalo. (a,b) es conocido también como intervalo de confianza. Así pues, si la media muestral X es un estimador de la media población , el intervalo de confianza de  viene dado así, P (X  Z X ) = 1 -  P (X - Z X    X + Z X) = 1 -  Donde Límite inferior = X - Z X Límite superior = X + Z X Z = Valor típico de Z que corta cualquiera de las colas por /2 de la distribución. X =  error estándar de la media muestral. n Z =  2  2 Z

E() =  PROPIEDADES DE UN BUEN ESTIMADOR 1) Estimador insesgado Un estimador es insesgado si la media de su distribución muestral es igual al parámetro correspondiente. Esto es, el estimador esperado es igual al parámetro población, esto es, E () =  Ambas colas de la curva tienen la misma longitud. 2) Estimador consistente Un estimador es consistente si, a medida que n aumenta, el valor del estadístico se aproxima al parámetro. 3) Estimador suficiente Un estimador es suficiente si ningún otro estimador puede proporcionar más información sobre el parámetro. 4) Estimador eficiente Dado todo estimador insesgado, es más eficiente aquel que tenga la varianza más pequeña.  E() = 

Prosiguiendo con la construcción del intervalo de confianza, con un nivel de significación del 5%,  = 0.05, esto quiere decir que al estimar la media  de población existe la probabilidad de 5% de que esta no esté dentro del intervalo estimado y un 95% de certeza de que si esté incluido en el intervalo, veamos Asumiendo que la distribución Z, es una distribución normal, la curva que la representa es simétrica y  debe asimismo distribuirse simétricamente, es decir, /2, como se ve en la figura siguiente  = 0.05 = 0.025 2 2  = 0.05 = 0.025 2 2 0.95 Z = 1.96 2 Z = 1.96 2 Z nos indica que la probabilidad debe dividirse entre 2, es decir, 0.95 = 0.4750 2 2 o restarle 0.025 a 0.50 (0.50 – 0.025) = 0.4750, ubicamos este valor o su aproximado y veremos que corresponde a Z = 1.95 de esta forma nuestro intervalo queda así, 2

P(X – 1.95X    X + 1.96 X) = 0.95 Donde Limite inferior = X – 1.96 x Limite superior = X + 1.96 X O también P(X – 19.96     X + 1.96 ) = 0.95 n n Ejemplo Suponga que la media muestral X de una muestral de n = 10 cuentas resultó ser $3000 ¿Cuál es el intervalo de confianza de la media población  con 5% de significación. Suponga que se sabe que la desviación estándar de población es  = 50 P X – 1.96     X + 1.96  = 0.95 n n P 300 – 1.96 50    300 + 1.96 50 = 0.95 10 n P 300 – 1.96 x 50    300 + 1.96 x 50 = 0.95 3.16 3.16 P 300 – 1.96( 15.82)    300 + 1.96 ( 15.82 )= 0.95… P 300 – 31    300 + 31 = 0.95 P 269    331 = 0.95

Esto quiere decir, que con un 95% de confiabilidad, la media de la población está comprendida entre $269 y $331 o entre $269,000 y $331,000 Estimación del intervalo de confianza cuando  es desconocida La solución del problema anterior consistente en la estimación de la media poblacional , supuso el conocimiento de la desviación estándar de la población, pero resulta y viene a ser que regularmente el investigador no dispone o no conoce esta desviación estándar de la población , debiendo calcular y usar la desviación estándar muestral S para obtener el error estándar como una aproximación del error estándar X poblaciónal. La construcción del intervalo es como se aprecia a continuación. Pero como SX = S la construcción puede ser así n P X – Z  SX    X + Z  SX 2 2 = 1 -  P X – Z  SX    X + Z  SX = 1 -  2 2

Ejemplo Suponga que es usted el gerente de auditoria de una empresa y con la finalidad de controlar el tiempo que se gasta en auditar un documento, selecciona una muestra de n = 121 dctos. la cual arroja una duración promedio X = 16.6 mins y una desviación estándar S = 3.63 minutos. Usted puede cambiar al supervisor del grupo a menos que la duración promedio sea a lo sumo de 16 minutos. El nivel de significación es de un 90% para tomar la decisión, ¿Cuál es su decisión? Datos n = 121 X = 16.6 minutos S = 3.63 minutos  = 0.10 Solución P X – Z S    X + Z S = 1 -  n n P 16.6 – 1.65    16.6 + 1.65 = 0.90 P 16.6 – 1.65 x    16.6 + 1.65 x = 0.90  2  2 3.63 121 3.63 121 P { 16.11   17.10 } = 0.90 P 16.6 – 1.65 x 0.33    16.6 + 1.65 x 0.33 = 0.90

Interpretación Con un 90% de probabilidad la verdadera de la población de auditores, se toma entre 16.11 y 17.10 minutos para auditar un documento. Decisión Como la empresa estima máximo 16 minutos promedio para auditar un documento conforme a un estudio de costo / utilidades, se decide cambiar al supervisor de auditoria con la finalidad de eficientizar la labor y obtener mejores resultados. Estimación del intervalo de confianza de la  para muestras pequeñas Investigaciones condujeron a científicos a considerar muestras grandes cuando n =  = 30 y por supuesto cuando n < 30, las muestras son caracterizadas como muestras pequeñas. En los dos ejemplos anteriores, es evidente que las muestras fueron grandes y se hicieron conclusiones utilizando la distribución normal o distribución Z. Pero resulta que no siempre puede ser posible obtener por lo menos 30 observaciones, como por ejemplo encontrar 30 personas o más que quieran prestarse para probar una nueva medicina para curar el SIDA, la hepatitis C, etc. El teorema del límite central asegura normalidad en el muestreo solo si la muestra es grande. Cuando la muestra es pequeña, puede ser suya la necesidad de recurrir a una distribución alternativa, hasta hoy día la distribución “t” of student o sencillamente distribución t.

Las muestra es pequeña, n < 30 Según su autor, ésta distribución se aplica cuando se cumplen las tres condiciones siguientes: Las muestra es pequeña, n < 30  es desconocida La población es aproximadamente normal Igual que la distribución Z, l,a distribución t tiene una media igual a cero, es simétrica respecto de la media y su valor oscila entre - y + . Sin embargo, difieren en que la varianza de Z es 2 = 1 y la varianza de t >1, específicamente esta varianza se obtiene por la siguiente fórmula 2 = n -1 n-3 Esta variación depende de los grados de libertad (gl o df) que es el número de observaciones menos el número de restricciones impuestas sobre tales observaciones, Suponga amigo lector que se tiene que n = 6 observaciones que deben producir una media de 15. Esta media viene a ser una restricción y son n -1, 6 – 1 = 5 grados de libertad. De ahí que se pueden seleccionar 5 observaciones cualquiera, por ejemplo, 15, 12, 14, 16, 11. Después de estos cinco valores, no hay libertad para seleccionar una sexta observación.

n n  Construcción del intervalo con la distribución “t” of student, P X – t x S    X + t x S = 1 -  n n El valor puede ubicarse en la tabla F del anexo, suponiendo que se desea obtener para una muestra n = 15 y un nivel de significación  = 0.01 gl = n -1 = 14, como se asume que la distribución t es aproximadamente normal, el error  = 0.01 , se va a dividir por 2, aludiendo a las dos colas de la curva normal como puede verse en la figura siguiente  2  2  = 0.01 = 0.005 2 2  = 0.01 = 0.005 2 2  t  = 2.977 2 t  = 2.977 2

Entonces si usted se ubica donde se intersecan n -1 = 14 y 0 Entonces si usted se ubica donde se intersecan n -1 = 14 y 0.005, encontrará que Ejemplo Suponga que se desea determinar el monto medio de ventas por establecimiento de venta al detalle de un determinado producto durante el último año. Como la población de este tipo de establecimiento es muy grande, se seleccionó una muestra de tamaño n = 25, dando lugar a una media X = $3,425 y una desviación estándar S = 200. Con un nivel de confianza del 95 por ciento, estime la media  de ventas de todos los establecimientos que expenden este producto. Datos n = 25 X = $3,425 S = $200 y 1 -  = .95 Para 25 – 1 grados de libertad y t  = 2.977 2 t  = 2.064 2  = 0.025 2 En consecuencia el intervalo de confianza es, P 3,425 – 2.064 x 20025    3,425 + 2.064 x 20025 = 0.95 P 3,425.44    3,507.56 = 0.95 Interpretación Con 95 por ciento de confiabilidad el monto medio de ventas de los establecimientos de ventas al detalle oscila entre $3342.44 y $3507.56