Estimación de Parámetros. Un banquero requiere saber sobre el porcentaje de deudas vencidas del banco. Un gerente de recursos humanos necesita conocer.

Slides:



Advertisements
Presentaciones similares
Intervalos de Confianza para la Media de la Población
Advertisements

Intervalos de Confianza para la Varianza de la Población
Estimación de parámetros poblacionales
Inferencia Estadística
} LISSET BÁRCENAS MONTERROZA
Introducción al tema El único método científico para validar conclusiones sobre un grupo de individuos a partir de la información que nos proporciona un.
Universidad de Chile Facultad de Ciencias Químicas y Farmacéuticas
Estimación por intervalos de confianza.
Nombre: Israel Espinosa Jiménez Matricula: Carrera: TIC Cuatrimestre: 4 Página 1 de 5.
INFERENCIA ESTADÍSTICA
MUESTREO DE ACEPTACIÓN DE LOTES POR VARIABLES
Tests de hipótesis Los tres pasos básicos para testear hipótesis son
Inferencia Estadística
Unidad V: Estimación de
Distribuciones derivadas del muestreo
Estadística Administrativa I
ESTIMADOR DE RAZÓN ESTIMADOR DE RAZÓN R = Y/X Juan Manuel Cellini.
Unidad V: Estimación de
ESTADISTICA TEMA y 223.
ESTIMACION En varios pasajes de este libro hemos planteado la dificultad que se confronta en las investigaciones, de llegar a conclusiones sobre una población.
Introducción La inferencia estadística es el procedimiento mediante el cual se llega a inferencias acerca de una población con base en los resultados obtenidos.
ESTIMACION POR INTERVALOS
Resumen y descripci ó n de datos num é ricos Estad í stica Capítulo 3.2.
Inferencia Estadística
Estadística para administradores
Función Densidad Continua (o distribución de probabilidad continua)
Unidad V: Estimación de
Capítulo 1. Conceptos básicos de la Estadística
DISTRIBUCIONES DE PROBABILIDAD
Estimación y contraste de hipótesis
BASES PARA EL RAZONAMIENTO EN ESTADÍSTICA INFERENCIAL
ESTIMACIÓN DE PARÁMETROS
MUESTREO ALEATORIO SIMPLE SIN REEMPLAZO (“mas”)
Aspectos generales de la investigación educativa en el SNIT
CONTRASTE DE HIPÓTESIS Dimensiones Largo275mm. 169 mm 2 Ancho175mm.49 mm 2 Alto175mm.49 mm 2 Peso16 Kg.1 Kg 2. SITUACIÓN PROBLEMA.
INFERENCIA ESTADÍSTICA
Instituto de Nivel Terciario Profesor: ¨Eduardo A. Fracchia¨ Integrantes: Marianela Ramírez. Uliambre Carlos. Farana Marisel. Integrantes: Marianela Ramírez.
NÚMEROS ALEATORIOS DEPARTAMENTO DE INFORMATICA UNSL-2007.
VARIABLE ALEATORIA Y DISTRIBUCIÓN NORMAL
La distribución t es una distribución de probabilidad que surge del problema de estimar la media de una población normalmente distribuida cuando el tamaño.
Danny Rafael Amaya Cotes Marcos Elías López Guerra.
RESUMEN DE LA DISTRIBUCION MUESTRAL PARA LA MEDIA MUESTRAL X INTERVALOS DE CONFIANZA PARA LA MEDIA POBLACIONAL  TIPO DE PROBLEMA ESPERANZA Y VARIANZA.
PRESENTADO POR: JOHANNA ANDREA RODRIGUEZ MORENO.  Descubierta por William S. en 1908, la distribución de T normalmente se llama distribución de t de.
Estimación Estadística Tares # 3. Estimación Estadística Conjunto de técnicas que permiten dar un valor aproximado de un parámetro de una población a.
Experimentos con un solo factor: anÁlIsis de varianza
Intervalos de Confianza M. C. José Juan Rincón Pasaye UMSNH – FIE Mayo de 2003.
Estadística I.
Diagramas de control CONSIDERACIONES BÁSICAS. DIAGRAMAS DE CONTROL  El Control Estadístico de Proceso (Statistical Process Control SPC) es la herramienta.
Estadística Inferencial
Inferencia estadística
Estimación estadística
CÁLCULO DE ÁREA.
Gráficas de Control por Atributos Profesor Walter López.
1 Distribución de Poisson Cuando en una distribución binomial el número de intentos (n) es grande y la probabilidad de éxito (p) es pequeña, la distribución.
C ONCEPTOS BÁSICOS DE I NFERENCIA II 1. Teorema 1. Si X~N(µ, σ) y Y=aX+b donde a y b son constantes, entonces: Teorema 2. Si X1, X2, …, Xn son variables.
BIOESTADÍSTICA Y ESTADÍSTICA BÁSICA CHILLÁN, SEGUNDO SEMESTRE PROF. SOC. M© KEVIN VILLEGAS.
Distribución “t” student
DISTRIBUCIONES DE PROBABILIDAD Por Jorge Sánchez.
INFERENCIA EN LOS MODELOS ARIMA ECONOMETRÍA II CAPÍTULO VI D to de Economía Aplicada Cuantitativa I Basilio Sanz Carnero.
CLARA ESPINO ESTIMULACION ESTADISTICA. Tarea 3. Estimulación puntual Si a partir de las observaciones de una muestra se calcula un solo valor como estimación.
Presentado por : Diana Marcela Oviedo Pardo Diana Marcela Oviedo Pardo.
LOGO Muestreo Pedro Godoy G.. LOGO Inferencia estadística La Inferencia Estadística es aquella rama de la Estadística mediante la cual se trata de sacar.
LOGO Muestreo Pedro Godoy G.. LOGO Inferencia estadística La Inferencia Estadística es aquella rama de la Estadística mediante la cual se trata de sacar.
Taller introducción a los conceptos básicos de Estadística PRIMERA PARTE 2016 Propósito: Introducir algunos conceptos básicos de Estadística por medio.
Paola arias Estadística II.  Fue descrita en 1908 por William sealy gosset  Es una distribución de probabilidad que se emplea comúnmente cuando tenemos.
ANALISIS DE FRECUENCIA EN HIDROLOGIA (3)
INTERVALO DE CONFIANZA
@ Angel Prieto BenitoMatemáticas 2º Bachillerato CS1 INFERENCIA ESTADÍSTICA U.D. 14 * 2º BCS.
Tema 8. Control Estadístico de la Calidad. Parte I. Gráficos de Control Escuela de Ingeniería Forestal. Mención Tecnología de Productos Forestales. Dirección.
PRESENTADO POR : BRIGITTE HERNÁNDEZ PRESENTADO A : ORFIDIA OVALLE GRUPO 3 D.
Transcripción de la presentación:

Estimación de Parámetros

Un banquero requiere saber sobre el porcentaje de deudas vencidas del banco. Un gerente de recursos humanos necesita conocer sobre la remuneración promedio de trabajo especializado en el área de contratación de la compañía. Un gerente de programación televisiva necesita saber del porcentaje de gente que ve cada uno de sus programas. El gerente de un restaurante requiere conocer del porcentaje de clientes que ordenarán el plato del día.

Se tienen múltiples situaciones donde se requieren estimar parámetros poblacionales, los cuales tendrán que efectuarse en base a la toma de una muestra de la población por razones de costo, tiempo y de viabilidad. Se tienen otras situaciones donde se reciben estimados de parámetros poblacionales que deberán ser evaluados antes de basar decisiones en ellos. ¿Fue la muestra suficientemente grande en la estimación del parámetro?¿Cuánta confianza se tiene en el estimado? A continuación se introduce la metodología requerida para desarrollar e interpretar estimaciones estadísticas respecto de valores poblacionales.

Objetivos Distinguir entre una estimación puntual y una por intervalo de confianza. Construir e interpretar un intervalo de confianza para una media poblacional usando la distribución Z o t. Determinar el tamaño de muestra requerido para estimar una media o proporción poblacional con un margen de error específico. Construir e interpretar un intervalo de confianza para una proporción poblacional.

Desarrollo y Cobertura Basado en lo visto respecto de técnicas de muestreo (Tema 1) y de error muestral y distribuciones muestrales (Tema 7). Introduce el uso de estadísticos para estimar parámetros. Dado que la obtención de parámetros puede ser costosa, dilatada y a veces imposible. Intervalos de confianza para la Media Poblacional, μ. Cuando la desviación estándar poblacional σ es conocida. Cuando la desviación estándar poblacional σ es desconocida. Intervalos de confianza para la Proporción Poblacional, π. Determinar el tamaño de muestra requerido para medias y proporciones.

Punto Estimado o Estimado Puntual Un punto estimado es un número, estimado a través de una muestra, y empleado como estimación de un parámetro desconocido. Ejemplo: Para determinar el costo de un producto se selecciona una muestra y cada producto de la muestra es seguido a través de todo el proceso productivo, registrándose los costos en que se incurre. Se indentifica el costo total de cada producto y luego el costo promedio de la muestra. Este costo promedio es un estimado puntual, o punto estimado, del verdadero costo promedio de producción, el cual es un parámetro de la producción.

Puntos Estimados Se puede estimar un parámetro… con un estadístico (un punto estimado) Media Proporción pπ x μ

Punto Estimado o Estimado Puntual La igualdad exacta entre un parámetro y su punto estimado es imposible. Se tiene un error muestral y, a través del estimado puntual, no es posible hacer inferencias respecto del error muestral, cuán lejos está de μ. Para superar esta situación se puede recurrir a la estimación de intervalos de confianza.

Intervalos de Confianza ¿Cuánta incertidumbre está asociada a un punto estimado de un parámetro? Un intervalo estimado proporciona más información acerca de una característica poblacional que un punto estimado Los intervalos estimados son llamados intervalos de confianza

Intervalos de Confianza Un intervalo de confianza proporciona información adicional. Se estima a partir de data muestral y tiene la siguiente estructura: Punto Estimado Límite de Confianza Inferior Límite de Confianza Superior Ancho del intervalo de confianza

Intervalos de Confianza El diseño del intervalo de confianza es tal que si se tomasen todas las muestras posibles de un tamaño determinado, y a partir de ellas se construyesen todos los intervalos posibles de un ancho determinado, un porcentaje de estos (denominado nivel de confianza), incluiría al parámetro poblacional μ.

Intervalos de Confianza Un intervalo da un rango de valores: Toma en consideración la variación de un estadístico de muestra a muestra. Basado en la observación de una muestra. Informa sobre la cercanía a parámetros desconocidos. Expresado en términos de nivel de confianza Nunca 100% seguro.

Proceso de Estimación (media, μ, es desconocida) Población Muestra Aleatoria Media x = 50 Muestra Estoy 95% seguro que μ está entre 40 y 60.

Fórmula General La fórmula general para todos los intervalos de confianza es: Punto Estimado  (Valor Crítico)(Error Estándar) Valor z ( ó t) basado en el nivel de confianza deseado

Nivel de Confianza Confianza en que el intervalo contendrá al parámetro desconocido Un porcentaje (menor al 100%) Los más comunes: 90%, 95%, 99%.

Nivel de Confianza, (1-  ) Suponer un nivel de confianza de 95%. Una interpretación de frecuencia relativa: El 95% de todos los intervalos de confianza que pueden ser construidos contendrá al parámetro desconocido. Un intervalo específico contendrá o no al parámetro. No hay probabilidad involucrada en un intervalo específico. (continuación)

Intervalos de Confianza Media Poblacional σ desconocida Intervalos de Confianza Proporción Poblacional σ conocida

Intervalo de Confianza para μ (σ Conocida) Supuestos Desviación estándar poblacional σ es conocida. Población tiene distribución normal. Si la población no es normal, usar una muestra grande n > 30. Intervalo de confianza: Estimado Punto Valor crítico Error estándar

Intervalo de Confianza para μ (σ Conocida) Media muestral ~ N( μ, σ/√n) (Media muestral – μ)/ σ/√n ~ N(0, 1) z ~N(0,1)Prob(z > z α/2 ) = α/2 z α/2 z ~N(0,1)Prob(z < -z α/2 ) = α/2 -z α/2 (x – μ)/ σ/√n > z α/2 (x – μ)/ σ/√n < -z α/2 Estimado Punto Valor crítico Error estándar

Hallando el Valor Crítico Considerar un intervalo de confianza al 95%: z = -1.96z = 1.96 Punto Estimado Límite de Confianza Inferior Límite de Confianza Superior Z unds.: X unds.: /2 = buscar en la tabla Z

Niveles de Confianza Comunes Los niveles de confianza comúnmente usados son 90%, 95% y 99% Nivel de Confianza Valor Crítico, z % 90% 95% 98% 99% 99.8% 99.9%

Cálculo de un Intervalo de Confianza para la Media (  Conocida) 1.Seleccionar una muestra aleatoria de tamaño n. 2.Especificar el nivel de confianza. 3.Calcular la media muestral. 4.Determinar el error estándar. 5.Determinar el valor crítico (z) de la tabla normal estándar. 6.Calcular el intervalo de confianza.

Ejemplo Una muestra de 11 circuitos de una población normal grande tiene una resistencia media de 2.20 ohms. Se sabe de evaluaciones pasadas que la desviación estándar poblacional es 0.35 ohms. Determinar un intervalo de confianza al 95% para la resistencia media de la población.

Ejemplo Solución: (continuación) Con un 95% de confianza la resistencia media poblacional está aproximadamente entre 1.99 y 2.41 ohms

Interpretación Estamos 95% seguros que la resistencia media poblacional está entre y ohms. Aunque la media poblacional podría estar o no en este intervalo, el 95% de los intervalos formados de esta manera la contendrán.

Interpretación IC-Interpretación.pdf Nivel de confianza: Proporción de todos los posibles intervalos, definidos según distintas muestras de un mismo tamaño, que contendrán el parámetro poblacional.

Discusión Suponga que en base a un nivel de confianza se ha determinado el intervalo de confianza para la media poblacional de: $5, a $5, El texto de Groebner, página 311 afirma: “Basados en los resultados de la muestra, para un nivel de confianza de 90%, se estima que la media poblacional está entre $5, y $5,288.16”. Continúa…….

Discusión Pero luego refiere como “Special Message about Interpreting Confidence Intervals”: Mensaje Especial.pdf ¿En qué quedamos? ¿Se entiende la distinción? El problema se suscita por un enfoque no-Bayesiano del tema, este problema no se tendría bajo un enfoque Bayesiano. Se adoptará un enfoque Bayesiano y no se hará diferencias al respecto.

Margen de Error

Margen de Error (e): Es la cantidad agregada y sustraída al punto estimado para formar el intervalo de confianza Define la relación entre el parámetro (población) y su estadístico (muestra). Medida de la cercanía que se espera que el estimado puntual esté del parámetro poblacional, según el nivel de confianza especificado. Ejemplo: Margen de error para estimar μ, σ conocida:

Factores que Afectan el Margen de Error Dispersión de datos, σ : e cuando σ Tamaño de muestra, n : e cuando n Nivel de confianza, 1 -  : e si 1 - 

Intervalo de Confianza para μ (σ Desconocida)

Si la desviación estándar poblacional, σ, es desconocida, podemos sustituirla por la desviación estándar muestral, s. Esto introduce incertidumbre extra, desde que s varía de muestra a muestra. Entonces usamos la distribución t en vez de la distribución normal estándar. Intervalo de Confianza para μ (σ Desconocida)

Supuestos Desviación estándar poblacional es desconocida. Población tiene distribución normal. Si la población no es normal, usar una muestra grande n > 30. Usar la distribución t (de Student) Intervalo de Confianza: (continuación) Intervalo de Confianza para μ (σ Desconocida)

Las distribuciones t son una familia de distribuciones. El valor t depende de los grados de libertad (gl.) Número de observaciones que son libres de variar después que la media muestral ha sido calculada. gl. = n – 1 Solamente hay n-1 datos independientes en la muestra dado que la media muestral ha sido calculada. Distribución t (de Student)

Si la media de estos tres valores es 8.0, entonces x 3 debe ser 9 (x 3 no es libre de variar) Grados de Libertad (gl) Idea: Número de observaciones que son libres de variar después que la media muestral ha sido calculada Ejemplo: Suponer que la media de 3 números es 8.0 Sea x 1 = 7 Sea x 2 = 8 ¿x 3 es? Aquí, n = 3, entonces los grados de libertad = n -1 = 3 – 1 = 2 (2 observaciones pueden tomar cualquier número, pero el tercero no es libre de variar para una media dada)

Distribución t (de Student) t 0 t (gl = 5) t (gl = 13) Las distribuciones t son simétricas y tienen forma de campana, pero tienen colas más gruesas que la normal Normal Estándar (t con gl =  ) Comparación de distribuciones t con Z cuando n crece Cuando n, el estimado de  se hace mejor y t converge a Z

Tabla t (de Student) Nivel de Confianza gl t El cuerpo de la tabla contiene valores t, no probabilidades Sea: n = 3, gl = n - 1 = 2, nivel de confianza = 90%  /2 = 0.05

Distribución t: Valores Comparación con el valor z Nivel de t t t z Confianza (10 gl) (20 gl) (30 gl) ____ Nota: Comparación de t con z cuando n crece

Ejemplo Una muestra aleatoria de n = 25 tiene x = 50 y s = 8. Construir un intervalo de confianza al 95% para μ gl = n – 1 = 24, entonces El intervalo de confianza es:

Aproximación para Muestras Grandes Como t se parece a z cuando el tamaño muestral crece, una aproximación es usada a veces cuando n es grande. La tabla proporciona valores t hasta los 500 grados de libertad. Hay programas que proporcionan el valor t correcto para cualquier grado de libertad. Fórmula correcta, σ desconocida Aproximación para n grande

Tamaño de la Muestra Lo ideal es tener un alto nivel de confianza, un bajo margen de error y un tamaño de muestra pequeño. Lamentablemente, estos tres objetivos están en conflicto, se requiere un balance entre los mismos.

Determinación del Tamaño de Muestra El tamaño de muestra requerido puede ser hallado considerando un margen de error deseado (e) y un nivel de confianza (1 -  ) Tamaño de muestra requerido, σ conocida:

Tamaño de Muestra Requerido: Ejemplo Si  = 45. ¿Cuál es el tamaño de muestra necesario al 90% de confianza para estar dentro del ± 5? (Siempre redondear hacia arriba) Entonces el tamaño de muestra requerido es n=220

¿Qué si no se conoce la desviación estándar de la población?

Tres alternativas: Considerar un valor d para la DS, tal que se tenga la seguridad que la DS de la población será menor a ese valor d. Tomar una muestra piloto y en base a ella estimar la DS de la población. Los datos de la muestra piloto podrán ser usados más adelante como unidades de la muestra que se recolecte. Emplear el rango de los valores que puede tomar la población, para estimar su DS. Continúa….

Rango de Valores Poblacionales La regla empírica y la distribución normal indican que virtualmente todos los valores de la población están contenidos en el intervalo: μ ± 3σ Por lo tanto, los valores poblacionales están: De μ - 3σ a μ + 3σ Esto es, se tiene un rango: R = ( μ + 3σ ) - ( μ - 3σ ) = 6σ De esta forma, si se conoce el rango poblacional, la DS de la población se puede estimar como: σ ≈ R / 6 oen forma más conservadora: σ ≈ R / 4

Estimación de una proporción poblacional Se ha visto la estimación de una media poblacional, sin embargo hay situaciones en que lo que interesa es la estimación de la proporción de la población que satisface o posee determinado atributo. Ejemplo: La estimación de la proporción de la población de clientes que están satisfechos con el servicio brindado por una empresa.

Se denota con π la proporción de la población que satisface el atributo de interés. Una estimación puntual o un estimado punto de π está dado por la proporción p de objetos de la muestra que satisfacen el atributo en cuestión: p = x / n Donde: p:Proporción muestral x:Número de objetos que satisfacen el atributo n:Tamaño de la muestra

Intervalos de Confianza para la Proporción Poblacional, π Un intervalo estimado para la proporción poblacional ( π ) puede ser calculado agregando y sustrayendo una tolerancia (que expresa la incertidumbre) a la proporción muestral ( p ).

Recordar que la distribución de la proporción muestral es aproximadamente normal si el tamaño de muestra es grande, con desviación estándar Estimación con los datos muestrales: (continuación) np ≥ 5 y n(1-p) ≥ 5 Intervalos de Confianza para la Proporción Poblacional, π

Límites de un Intervalo de Confianza Los límites de confianza, inferior y superior, para la proporción poblacional son calculados con la fórmula Donde z es el valor normal estándar para el nivel de confianza deseado p es la proporción muestral n es el tamaño de muestra

Ejemplo Una muestra aleatoria de 100 personas indica que 25 son zurdos. Construir un intervalo de confianza al 95% para la proporción poblacional de zurdos.

Ejemplo Una muestra aleatoria de 100 personas indica que 25 son zurdos. Construir un intervalo de confianza al 95% para la proporción poblacional de zurdos (continuación)

Interpretación Estamos 95% seguros que el porcentaje de zurdos en la población está entre 16.51% y 33.49% Aunque este rango podría contener o no la proporción poblacional, el 95% de los inter- valos construidos de esta forma y de tamaño muestral 100 la contendrá.

Cambiando el Tamaño de Muestra Incrementos en el tamaño de muestra reducen el ancho del intervalo de confianza. Ejemplo: Si el tamaño de muestra en el ejemplo anterior fuera el doble, 200, y si 50 fueran los zurdos en la muestra, entonces el intervalo todavía seguiría centrado en 0.25, pero con el ancho reducido

Hallando el Tamaño Muestral Requerido en Problemas de Proporción Calcular n: Definir el margen de error: π puede ser estimado con una muestra piloto. Si es necesario ser conservador usar π = 0.50 (máxima variación posible, por lo tanto, máximo tamaño de muestra)

¿Qué Tamaño de Muestra? ¿Cuán grande debería ser una muestra para estimar la proporción de defectuosos en una población grande con margen de error de 3% y 95% de confianza? (Asumir que una muestra piloto da p=0.12)

Solución: Para el 95% de confianza, usar z = 1.96 e = 0.03 p = 0.12, usar esto para estimar π Usar n = 451 (continuación) ¿Qué Tamaño de Muestra?

Resumen Se expuso la estimación puntual. Se introdujo la estimación de intervalos. Se discutió la estimación por intervalos de confianza para la media [σ conocida]. Se discutió la estimación por intervalos de confianza para la media [σ desconocida]. Se expuso la determinación del tamaño de muestra para problemas de media y proporción. Se discutió la estimación por intervalos de confianza para la proporción.