ESTADISTICA APLICADA I UNIDAD: INFERENCIA ESTADISTICA

Slides:



Advertisements
Presentaciones similares
INFERENCIA ESTADISTICA
Advertisements

Introducción La inferencia estadística es el procedimiento mediante el cual se llega a inferencias acerca de una población con base en los resultados obtenidos.
Inferencia Estadística
Límites y Continuidad.
ESTIMACIÓN DE PARÁMETROS
Estimación estadística
ESTADÍSTICA II Ing. Danmelys Perozo MSc. Blog:
PPTCEG049EM32-A16V1 Distribución normal EM-32. Recordemos… -¿Cómo se calcula el valor esperado para una determinada variable aleatoria? -¿Cómo es posible.
PPTCES047MT22-A16V1 Clase Medidas de dispersión y muestreo MT-22.
Bioestadística Distribuciones muestrales para variables cuantitativas.
GENERALIDADES DEL TRABAJO ESTADÍSTICO La Estadística es una de las ramas de la Matemática de mayor universalidad, ya que muchos de sus métodos se han desarrollado.
PRUEBA DE HIPÓTESIS. 1. Una prueba de hipótesis consiste en contrastar dos hipótesis estadísticas. Tal contraste involucra la toma de decisión acerca.
REGRESIÓN Y CORRELACIÓN  REGRESIÓN Es un Proceso estadístico que consiste en predecir una variable a partir de otra utilizando datos anteriores. INGA.
1 Pronósticos, Series de Tiempo y Regresión Capítulo 3: Regresión Lineal Simple.
ESTADÍSTICA Mercedes de la Oliva ESTADÍSTICA INFERENCIAL Teorema Central del límite Distribución de media y proporción muestral.
Recordatorio Estadística Paramétrica Se basa en el conocimiento que los datos presentan una distribución estadística conocida y cada distribución tiene.
Control estadístico de procesos. Francisco Javier Miranda González CAPÍTULO 5.
HERRAMIENTAS ESTADÍSTICAS PARA LA TOMA DE DECISIONES
Valor que toma la variable aleatoria
Capitulo 3 Análisis descriptivo inferencial: comparaciones de muestras
ESCUELA PROFESIONAL CIENCIA POLITICA Y GOBIERNO
ESTADÍSTICAS INFERENCIALES
Muestreo PRUEBAS Y VALIDACION DE HIPOTESIS Carlos Willian Rincón Pérez
Instituto Nacional de Estadística y Geografía
Curso de Elaboración de Pruebas Prof. Gerardo A. Valderrama M
Análisis de Mercados Internacionales
Intervalos de Confianza
puede o no ser verdadero, relativo a una o más poblaciones.
7.1 Procedimientos paramétricos para datos cuantitativos
“Bootstrap” Jaime Mojica Cuevas
UNIDAD 4: ESTADÍSTICA Y PROBABILIDAD
INFERENCIA ESTADÍSTICA
ESTADÍSTICA II Ing. Danmelys Perozo MSc.
INFERENCIA ESTADÍSTICA PARA DOS POBLACIONES
Clase 8: Contraste de Hipótesis
CONCEPTOS BASICOS ESTADISTICA.-Conjunto de métodos que nos permiten tomar decisiones en momentos de incertidumbre (duda). Tiene como objetivo que la información.
¿Cuándo usar esta distribución?
Estimaciones puntuales e intervalos de confianza Estimación puntual: Estadístico calculado a partir de la información obtenida de la muestra y que se usa.
DISTRIBUCIÓN GAMMA. La distribución gamma se deriva de la función gamma. La distribución gamma tiene un caso especial que es la distribución exponencial.
REGRESÍON LINEAL SIMPLE
Estimación de parámetros: Estimación puntual y por intervalos
puede o no ser verdadero, relativo a una o más poblaciones.
DISTRIBUCIÓN MUESTRAL DE UNA MEDIA.
Estimación de volatilidades
Tema: Distribución t-Student para una muestra Curso: Seminario de Estadística Aplicada a la Investigación Educacional UNIVERSIDAD NACIONAL DE EDUCACIÓN.
“Formulación de Hipótesis Estadística”
Principios de Estadística
ANÁLISIS DE REGRESIÓN SIMPLE
Tamaño de muestra Ecología Marina. Una población se define como un conjunto de individuos de una especie que habita un área determinada. Los métodos disponibles.
Ph.D. Dulio Oseda Gago SESIÓN N° 14 Presentado por: MUESTREO PEQUEÑO.
ESTIMACIÓN (Inferencia Estadística) Intervalos de Confianza
Ensayo de Rendimiento DISTRIBUCIÓN DE ESTADÍSTICOS MUESTRALES.
ANALISIS DE VARIANZA
Dr. Carlomagno Araya Alpízar
ICPM050 – ECONOMETRÍA tema 03: ESTIMACIÓN MODELO LINEAL SIMPLE
ESTADISTICA MEDIDAS DE DISPERSIÓN Cristian Gómez Coordinar Técnico Calidad Laboratorio Labsai.
Intervalos de confianza Muestras pequeñas
CONCEPTO DE ESTIMADOR ES UNA REGLA O MÉTODO QUE DICE COMO CALCULAR LA ESTIMACIÓN DE UN PARÁMETRO BASÁNDOSE EN LA INFORMACIÓN DE UNA MUESTRA, GENERALMENTE.
ESTADISTICOS Y DISTRIBUCIONES MUESTRALES
MEDIDAS DE DISPERSIÓN “Medidas de dispersión”. Miden qué tanto se dispersan las observaciones alrededor de su media. MEDIDAS DE DISPERSIÓN.
BIOESTADISTICA I UNIDAD: INFERENCIA ESTADISTICA EJERCICIOS Y PROBLEMAS
Tamaño de muestra.
1 Estimación por Intervalo. 2 Hasta ahora los estimadores estudiados son puntuales, es decir, exhiben un valor como estimación del parámetro de interés.
01/08/ Escuela Nacional de Estadística e Informátia Muestreo I Muestreo Aleatorio Estratificado Prof. Willer David Chanduvi Puicón.
TRATAMIENTO Y EVALUACION DE RESULTADOS ANALITICOS 1.Conceptos generales sobre la medida. Tipos de errores, concepto, componentes, corrección. Distribución.
1 Afectados de cierto grado de INCERTIDUMBRE SIEMPRE HAY UN ERROR EN SU MEDIDA ESTABLECER LA FIABILIDAD DE LOS DATOS ¿Podemos evaluar la magnitud del error.
ESTADÍSTICA APLICADA  ZEUS DE JESÚS RODRÍGUEZ BUDA  GABRIELA MÁRQUEZ TORRES  MARÍA ENRIQUETA GIL CÓRDOVA  ELIÁN ANTONIO GONZALEZ GARCÍA  CRISTELL.
REGRESION LINEAL SIMPLE
Transcripción de la presentación:

ESTADISTICA APLICADA I UNIDAD: INFERENCIA ESTADISTICA EJERCICIOS Y PROBLEMAS 2016

I- INFERENCIA ESTADISTICA La Teoría de la Inferencia Estadística puede definirse como aquellos métodos que permiten hacer inferencias o generalizaciones sobre una población a partir de una muestra. Existen dos métodos para estimar parámetros de la población : El Método Clásico y Método Bayesiano. El Método Clásico .- Se basa estrictamente en la información obtenida en una muestra aleatoria tomada de una población.

El Método Bayesiano.- Utiliza el conocimiento subjetivo previo acerca de la distribución de probabilidades de los parámetros desconocidos junto con la información proporcionada por los datos de la muestra. La Inferencia Estadística puede dividirse en dos áreas principales : Estimación y Prueba de Hipótesis.

2.1 ESTIMACION La Estimación se ocupa del estudio de parámetros de la población y consiste en encontrar o determinar una estadística que constituya una buena estimación del valor de un parámetro desconocido . A esta estadística se le llama estimador del parámetro desconocido  . Estudiaremos la estimación puntual y la estimación por intervalos .

2.1.1 ESTIMACIÓN PUNTUAL La Estimación Puntual de algún parámetro  de la población es un valor simple de una estadística tomada de la muestra. Por ejemplo, si el valor de x es la estadística calculada a partir de una muestra de tamaño n, entonces x es una estimación puntual de  media población, es decir = x y  =. La Estadística que se emplea para obtener una estimación puntual recibe el nombre de “Estimador “.

PROPIEDADES DESEABLES DE LOS ESTIMADORES PUNTUALES a) Estimador insesgado Si tenemos un gran número de muestras de tamaño n y obtenemos el valor del estimador en cada una de ellas, sería deseable que la media de todas estas estimaciones coincidiera con el valor de μ . Se dice que un estimador es insesgado si su esperanza matemática coincide con el valor del parámetro a estimar.

b) Estimador eficiente Se dice que los estimadores son eficientes cuando generan una distribución muestral con el mínimo error estándar ,es decir, entre dos estimadores insesgados de un parámetro dado es má.s eficiente el de menor varianza Es decir si

c) Estimador consistente Un estimador se dice consistente cuando su valor tiende hacia el verdadero valor del parámetro a medida que aumenta el tamaño de la muestra . Es decir, la probabilidad de que la estimación sea el verdadero valor del parámetro tiende a 1.

d) Estimador suficiente Se dice de un estimador que es suficiente cuando es capaz de extraer de los datos toda la información importante sobre el parámetro.  

Ejemplo: Los siguientes datos corresponden a los valores de una muestra de la ley de cobre encontrado en 35 yacimientos de .350 .189 .533 .262 .385 .827 .537 .788 1.925 .307 .372 .898 .449 .767 .571 .610 .3.19 .348 1.177 .971 .521 .603 .413 2.464 .622 .614 .374 .662 .448 .774 .411 .406 .273 .550 1.499

Determinar: La estimación de la media poblacional La estimación de la varianza poblacional Cual es la desviación estándar de la muestra Cual es la estimación del error estándar para la media muestral La proporción de yacimientos que están por debajo del .600 de ley.

1.2 ESTIMACION POR INTERVALOS E n vez de estimar el parámetro  a partir de un valor ( estimación puntual ) ahora se trata de estimar un intervalo [ a, b ] llamado intervalo de confianza que debe contener al parámetro  con una probabilidad dada 1 -  llamado nivel de confianza , en base a una muestra aleatoria y la correspondiente estadística  ; esto es : P ( a    b) = 1 -  

2.2.1 ) INTERVALOS CONFIDENCIALES PARA LA MEDIA POBLACIONAL   a1 ) Cuando  es conocida o n > 30 Sea x   ( ,  2n )  Z = (x -  ) / (  n )   P ( - Z 2 < ( (x -  ) / (  n ) < Z 2 ) = 1 -  P ( x – Z  n <  < x + Z  n ) = 1 -  Por lo tanto  [x – Z  n ] Donde : x : media muestral Z  : se encuentra en la tabla Z n.   : tamaño de la muestra  : desviación estándar conocida  : nivel de significación NOTA.-Cuando n  30 y no se conoce 2 se reemplaza por s2 de la muestra  

Ejemplo Se ha calculado que la media y desviación estándar de una muestra aleatoria de 36 mediciones del contenido de arsénico del agua del reservorio de la Ciudad Universitaria son respectivamente 2.6 y 0.3 …. ¿Encuentre el intervalo de confianza al 95% y al 99% para la media de arsénico de todo el reservorio ?. Solución: x = 2.6 s = 0.3 /2 = 0.025 Z  = 1.96 P ( 2.6 – 1.96 (0.3/36)    2.6 + 1.96 (0.3/36) ) = 95% De donde P( 2.5 <  < 2.7 ) = 95% La probabilidad de que la medición promedio del contenido de arsénico se encuentre entre 2.5 y 2.7 es de 95% .

P ( x - t/2 s /n <  < x + t/2 s/n ) = 1 -  a2) Cuando  es desconocido n  30   Cuando no se conoce la varianza poblacional 2 y es imposible obtener una muestra n 30 pues el costo es un factor que limita el mayor tamaño de muestra. En la medida que la población se distribuye normalmente entonces podemos usar la distribución t. t = (x -  )/ ( s/ n) El procedimiento es el mismo que en el caso anterior excepto que se usa la distribución T en lugar de la normal, luego se puede afirmar: P ( - t/2 < t < t/2 ) = 1 -  P ( x - t/2 s /n <  < x + t/2 s/n ) = 1 -  Por lo tanto  x  t/2 s/n donde t/2 es el valor de t con n – 1 grados de libertad

Ejemplo 1 Lloyd y Mailloux informaron los siguientes datos acerca del peso de la glándula pituitaria en una muestra de 4 ratas de Wistar Furth Media = 9.0 mg error estándar para la media =3 Determinar: La desviación estándar para la muestra Construya un intervalo de confianza de 95% para el peso medio de las glándulas pituitarias para una población similar de ratas .

Ejemplo Los contenidos de ácido sulfúrico en siete recipientes similares son : 9.8 , 10.2 , 10.4 , 9.8 , 10.0 , 10.2 y 9.6 litros. Encuentre un intervalo de confianza al 95% para la media del contenido de todos los recipientes. Suponiendo una distribución aproximadamente normal. Solución:   x = 10 ; s = 0.283 ; t/2 = t (0.025) (6) = 2.447 luego :   x  t/2 s/n  10.0  ( 2.447 ) ( 0.283)/ 7  10.0  0.26 P ( 9.74 <  < 10.26 ) = 95 %

b1) Si 12 , 22 son conocidas y n 1 30 y n2  30 B) INTERVALOS DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS   Si se tiene una población con medias 1 , 2 y varianzas 12 , 22 respectivamente y si se toma muestras n1 y n2 respectivamente, entonces se puede obtener intervalos confidenciales para la diferencia de medias. b1) Si 12 , 22 son conocidas y n 1 30 y n2  30 entonces un intervalo confidencial para 1 - 2 es: P [( x1 --x2 ) - Z   (12 / n1 + 22 /n2 )  1 - 2  (x1 -x2 ) + Z   (12 / n1 + 22 /n2 ) ] = 1 -  por lo tanto ( 1 - 2 )  [( x1 --x2 )  Z   (12 / n1 + 22 /n2 )] Donde x1 ,x2 son las medias muestras aleatorias independientes de tamaño n1 , n2 , tomadas de poblaciones con varianzas conocidas 12 , 22 respectivamente, y - Z  es el valor de la distribución normal estándar.

Ejemplo :   50 Mujeres y 30 hombres se presentaron a un examen de admisión para ocupar un cargo : las mujeres obtienen una calificación promedio de 76 puntos con una desviación estándar de 6 , mientras que los hombres obtienen una calificación promedio de 82 puntos con una desviación estándar de 8. Encuentre un intervalo de confianza del 96% para la diferencia de medias.  SOLUCI0N n1 = 50 n2 = 75 , x1 = 76 y x2 = 82 , s1 = 6 y s 2 = 8 Como n1 , n2 > 30  s1 = 1 y s 2 = 2 Se aplica P [( x1 --x2 ) - Z   (12 / n1 + 22 /n2 )  1 - 2  (x1 -x2 ) + Z   (12 / n1 + 22 /n2 ) ] = 1 -  Remplazando datos se obtiene : P ( 3.42 )  1 - 2  8.58 ) = 95 %

b2 ) Si 12 , 22 son desconocidas y n 1 y n2 30 Donde las medias y varianzas de muestras independientes pequeñas de tamaños n1 y n2 son tomadas de distribuciones aproximadamente normales y t  es el valor de la distribución t con n1 + n2 - 2 grados de libertad:   P [( x1 --x2 ) - t   (s12 / n1 + s22 /n2 )  1 - 2  (x1 -x2 ) + t   (s12 / n1 + s22 /n2 ) ] = 1 -  por lo tanto ( 1 - 2 )  [( x1 --x2 )  t   (s12 / n1 + s22 /n2 )] Ejemplo: Los registros de los últimos 15 años muestran que la precipitación fluvial promedio. durante el mes de mayo es de 4.93 cm. con una desviación estándar 1.14 cm. en Perú, en Chile la precipitación fluvial promedio fue de 2.64 con una desviación estándar de 0.66 durante los 10 años pasados. Encuentre un intervalo confidencial del 95% para la diferencia verdadera de las precipitaciones fluviales promedio en estos países, suponiendo que las muestras se han tomado de poblaciones normales con variancias diferentes.

Solución:   Perú x = 4.93 s = 1.14 n = 15 Chile x = 2.64 s = 0.66 n = 10 .t( 0.025 ) ( 15+10 –2 ) = 2.069. Remplazando en la fórmula se tiene : P [( 0.29 – 2.069 )  (1.142 / 15 + 0.662 /10 )  1 - 2  2.29 + 2.069  (1.142 / 15 + 0.662 /10 ) ] = 1 -  P( 2.02  1 - 2  2.56 ) = 0 95 % Significa que se tiene una confianza del 95% de que el intervalo de 2.02 a 2.56 contenga el verdadero valor promedio de la precipitación fluvial .

los límites de confianza para P, cuando n   se tiene que : C) I NTERVALOS CONFIDENCIALES PARA LAS PROPORCIONES Si la estadística p = x /n es la proporción de éxitos en una muestra de tamaño n extraída de. una distribución binomial en la que P es la proporción de éxitos en la población  los  límites de confianza para P, cuando n   se tiene que : E(p) = P , V(p) = PQ /n por lo tanto también se tiene:   P ( - Z 2 < Z < Z 2 ) = 1 -  Z = (p – P)/  ( PQ /n ) por lo tanto P [ p - Z 2  ( PQ /n ) < P < p +Z 2  ( PQ /n ) ] = 1 -  Luego P  [ p  Z 2  ( PQ /n ) ]

Ejemplo:   En una muestra aleatoria de n = 500 familias de cierta ciudad que poseen televisores, se observó que 340 poseían TV a color. Encuentre un intervalo de confianza del 95% para la proporción real de las familias en dicha ciudad con TV a color. Solución: p = 340/500 = 0.68 Z( 0.025) = 1.96 Usando la fórmula : P [ p - Z 2  ( PQ /n ) < P < p +Z 2  ( PQ /n ) ] = 1 -  P[ 0.68 – 1.96  ( 0.68*0.32) /500 < P < 0.68 + 1.96  ( 0.68*0.32) /500 ] = 95% Por lo tanto P ( 0.64 < P < 0.72 ) = 95 %

(P1 – P2 ) [ ( p1 - p2 )  Z/2 ( p1 q1 /n1 + p2 q2 /n2) ] D) INTERVALOS DE CONFIANZA PARA LA DIFERENCIA DE PROPORCIONES   Dada dos poblaciones binomiales de las cuales se extrae dos muestras aleatorias independientes de tamaños n1, n2 se puede encontrar un intervalo de confianza para la verdadera diferencia de proporciones, es decir P1 , P 2 mediante : P [( p1 - p2 ) - Z/2 ( p1 q1 /n1 + p2 q2 /n2) < P1 – P2 < ( p1 - p2 ) + Z/2 ( p1 q1 /n1 + p2 q2 /n2)] Por lo tanto (P1 – P2 ) [ ( p1 - p2 )  Z/2 ( p1 q1 /n1 + p2 q2 /n2) ] Ejemplo:   En el proceso de fabricación de cierto componente se considera un cambio con el objeto de determinar si el nuevo procedimiento es mejor. Se toma muestras del procedimiento existente y del nuevo si se detecta que 75 de 1500 componentes tomados del procedimiento existente fueron defectuosos, así como 80 de 2000 del nuevo procedimiento fueron defectuosos. Encuentre un intervalo de confianza al 90% para la diferencia real de proporción de componentes defectuosos.

  Solución: p1 = 75/1500 = 0.05 n1 = 1500 p2 = 80/200 = 0.04 n2 = 2000 Z/2 = 1.645 Según fórmula : 0.01       1.645 ( 0.05*0.95/1500 + 0.04*0.96/2000 ) P ( -0-0017 < P1 – P2 < 0.0217 ) = 90 % Como el intervalo contiene el valor 0 no hay razones, que el nuevo componente produzca una disminución significativa en la proporción de componentes defectuosos con respecto al método existente.

Donde s2 es la varianza de la muestra aleatoria n, 2 /2 y 2 1- /2 E) INTERVALOS CONFIDENCIALES PARA LA VARIANZA   Supongamos que tenemos una muestra aleatoria x1 ,x2 , x3, ... xn de una distribución de media  y una varianza 2 , ambas desconocidas luego: n  ( xi - x ) 2 = (n –1 ) s2 i=1 2 2 Tiene una distribución 2 con n-1 grados de libertad cuando las muestras se escogen de una población normal entonces : P (2 /2  2  (2 1- /2 ) = P (2 /2  (n –1 ) s2  (2 1- /2 ) = 1 -  2 P( ( n –1 ) s2  2  (n –1 ) s2 ) = 1 -  2 1- /2 2 /2 Donde s2 es la varianza de la muestra aleatoria n, 2 /2 y 2 1- /2 son valores de la distribución 2 con n – 1 grados de libertad hacia la derecha.

Ejemplo   Un experimentador quiere verificar la variabilidad de un equipo diseñado para medir el volumen de una fuente de audio frecuencia. Tres mediciones independientes registraron con este equipo fueron 4.1 , 5.2 y 10.2. Estime 2 con un coeficiente de confianza de 0.9. Solución   Si se supone normalidad en las mediciones registradas por este equipo, se puede aplicar el intervalos de confianza desarrollado anteriormente . Para los datos ofrecidos, s2 = 10.57 con /2 = 0.05 y n- 1 = 2 grados de libertad , en la tabla de la distribución Chi –cuadrado nos da 2 /2 = 0.103 y 2 1- /2 = 5.959 por lo tanto el intervalo de confianza para 2 es P ( 2*10.57 / 5.991  2  2*10.57 / 0.103 ) = 0.90 P ( 3.53  2  205.24 ) = 0.90 Obsérvese que este intervalo para 2 es muy amplio, básicamente porque n es muy pequeño .

Ejemplo propuesto: Los siguientes valores son los pesos en decigramos de 10 paquetes de semilla distribuidos por cierta compañia : 46.4 , 46.1 , 45.8 , 47.0 , 46.1 , 45.9 , 45.8 , 46.8 , 45.2 y 46.0. Encuentre un intervalo de confianza al 95% para la varianza de dichos paquetes de semilla distribuidos por esta compañia.