La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Inferencia Estadística Estimación de Parámetros. Estimación Buscar valores razonables para los parámetros que caracterizan una distribución Si la distribución.

Presentaciones similares


Presentación del tema: "Inferencia Estadística Estimación de Parámetros. Estimación Buscar valores razonables para los parámetros que caracterizan una distribución Si la distribución."— Transcripción de la presentación:

1 Inferencia Estadística Estimación de Parámetros

2 Estimación Buscar valores razonables para los parámetros que caracterizan una distribución Si la distribución supuesta es normal, los parámetros más buscados son la esperanza o media (µ) y la varianza ( 2 )

3 Ejemplo Una empresa de comercialización de semillas desea estimar la altura promedio de un sorgo forrajero que ha desarrollado. Para ello se toma una muestra de 50 plantas y se calcula la media de la altura, la que resulta ser de 130 cm.

4 Estimación estimación puntual por intervalo de confianza

5 Estimación Puntual su promedio es igual a µ la media muestral es un estimador InsesgadoConsistenteEficiente de la media poblacional está más cerca de µ a medida que crece el tamaño de la muestra es más eficiente que la mediana por tener menor varianza

6 Intervalos de Confianza Encontrar el intervalo cerrado [LI, LS] donde: LI = Límite Inferior LS = Límite Superior Entonces: P(LI LS) = 1-

7 Intervalo de Confianza para µ Si 1- = 0.95, puede interpretarse como: si se tomaran todas las muestras posibles de tamaño n y se construyeran 100 intervalos, 95 incluirán a la verdadera media poblacional µ y sólo 5 no la contendrán

8 Ejemplo Se sabe que =22 cm. Un intervalo para estimar a con una confianza del 95%, es: El verdadero valor de la altura promedio del sorgo estará en este intervalo con un 95% de confianza

9 Ejemplo El verdadero valor de la altura promedio del sorgo estará en este intervalo con un 99% de confianza Un intervalo para estimar a con una confianza del 99%, es:

10 Efecto del cambio en el nivel de confianza Si la confianza es del 95% a= – = 12.1 Si la confianza es del 99% a= – = Sea la amplitud a = LS – LI A mayor confianza mayor amplitud

11 Efecto del cambio en el tamaño de la muestra Si n = 100 Para una confianza del 99% y n = 50 a = – = a = – = A mayor n menor amplitud

12 Conclusión La amplitud de un intervalo de confianza es directamente proporcional a la confianza de la estimación e inversamente proporcional al tamaño de la muestra

13 Intervalos de Confianza Efecto del coeficiente de confianza y del tamaño muestral sobre la amplitud del intervalo Tamaño muestral necesario para estimar un parámetro con una precisión deseada

14 Tamaño de Muestra para estimar a µ con una precisión deseada ¿Cuál debería ser el tamaño mínimo de muestra, para que la amplitud no supere los 12.1 cm, cuando se aumenta la confianza al 99%?

15 Tamaño de Muestra para estimar a µ con una precisión deseada Donde c es la amplitud del intervalo de confianza

16 Ejemplo Se debería tomar una muestra de al menos 88 plantas para que al estimar la altura promedio del sorgo forrajero con una confianza del 99% la amplitud del intervalo no sea mayor a 12,1

17 Intervalos de confianza Bilateral Estimación paramétrica Campos Variable Parám. Estim. E.E. n LI(95%) LS(95%) A profMedia 81,79 2, ,71 86,86 B prof Media 79,43 2, ,77 85,08 Otro ejemplo Se desea utilizar un suelo cuya profundidad no sea inferior a 75cm

18 Intervalos de confianza Unilateral izquierdo Estimación paramétrica Campos Variable Parám. Estim. E.E. n LI(95%) A prof Media 81,79 2, ,63 B prof Media 79,43 2, ,79 Otro ejemplo

19 Inferencia basada en una muestra Contraste de Hipótesis

20 Son proposiciones sobre uno o más parámetros de la distribución de la variable aleatoria en estudio. Hipótesis estadísticas Hipótesis nula (H 0 ) Hipótesis alternativa (H 1 ) niega la hipótesis nula establece valores o relaciones sobre uno o más parámetros H 0 : 75 vs.H 1 : > 75

21 Prueba T para un parámetro Valor del parámetro probado: 75 campos Variable n Media DE LI(95) T p(Unilateral D) A prof 14 81,79 8,79 77,63 2,89 0,0063 B prof 14 79,43 9,80 74,79 1,69 0,0573 Ejemplo profundidad del suelo

22 Inferencia basada en dos muestras Estimación de Parámetros Contraste de Hipótesis

23 Inferencia basada en dos muestras Contrastar hipótesis sobre la diferencia entre dos medias Si el contraste es bilateral: versus

24 Caso Normal-Muestras independientes La inferencia se basa en el siguiente estadístico: Varianzas desconocidas pero iguales prueba T para muestras independientes cuando las varianzas son homogéneas

25 Intervalo de confianza bilateral para la diferencia de medias está dado por: Caso Normal-Muestras independientes Varianzas desconocidas pero iguales

26 Ejemplo Para comparar el contenido promedio de aceites de las semillas de dos variedades de maní, se plantean las hipótesis H 0 : 1 = 2 vs H 1 : 1 2 Se diseña un ensayo en el que para cada variedad se obtienen los contenidos de aceite de 10 bolsas de 1 kg de semillas de maní, extraídas aleatoriamente de distintos productores de semillas.

27 Ejemplo Los resultados del ensayo son los siguientes: VariedadnS2S

28 ¿ Cómo saber si las varianzas son iguales o diferentes? Suponiendo normalidad para las observaciones de las muestras, una prueba de homogeneidad de varianzas se basa en el estadístico:

29 ¿ Cómo saber si las varianzas son iguales o diferentes? versus Bajo H 0 se distribuye como una F con 9 y 9 grados de libertad

30 Prueba F La región de aceptación para un nivel de significación del 5% está delimitada por y 4.03, correspondientes a los cuantiles /2 y (1 - /2) respectivamente

31 Ejemplo Como F=0.96 está en el intervalo (0.248; 4.03) se acepta H 0 : 1 2 = 2 2 Se concluye que no hay diferencias entre las varianzas poblacionales, lo que indica el cumplimiento del supuesto de homogeneidad de varianzas

32 Prueba T para la diferencia de medias

33 Prueba T La región de aceptación para un nivel de significación del 5% está delimitada por y 2.101, correspondientes a los cuantiles /2 y (1 - /2) respectivamente y 18 grados de libertad

34 Como T=-1.42 está en el intervalo (-2.101; 2.101) se acepta H 0 : 1 = 2 Se concluye que no hay diferencias entre las dos variedades de maní considerando el contenido de aceites en la semilla Prueba T

35 Caso Normal-Muestras independientes La inferencia se basa en el estadístico: Varianzas desconocidas y diferentes prueba T para muestras independientes cuando las varianzas no son homogéneas

36 Intervalo de confianza bilateral 1- para la diferencia de medias está dado por: Caso Normal-Muestras independientes Varianzas desconocidas y diferentes

37 Comparar el efecto de la restriccion alimentaria sobre los metabolitos Ca y P. Se realiza un experimento en el cual se seleccionan al azar 10 animales para cada tratamiento: alimentación restrigida y alimentación no restringida. En cada animal se mide el nivel de Ca y de P. Prueba T – Otro ejemplo

38 Clasific Variable Grupo(1) Grupo(2) n(1) n(2) Trat Ca {No Restr} {Restr} 1010 media(1)media(2)LI(95%)LS(95%) 8,87 8,68 -0,71 1,09 Varianza(1) Varianza(2) p(Var.Hom.) T gl 1,33 0,49 0,14900,4518 p prueba 0,6612 Bilateral Prueba T - Muestras independientes

39 Clasific Variable Grupo(1) Grupo(2) n(1) n(2) Trat P {No Restr} {Restr} media(1) media(2) LI(95%)LS(95%) 7,92 8,00 -1,03 0,86 Varianza(1) Varianza(2) p(Var.Hom.) T gl 1,65 0,23 0,0072-0,19 12 p prueba 0,8530Bilateral Prueba T - Muestras independientes

40 ClasificVariableGrupo(1)Grupo(2)n(1) Lecitinalts./dia{CON} {SIN} 9 n(2)media(1)media(2)LI(95%)LS(95%) 8 17,71 14,45 2,30 4,22 Varianza(1)Varianza(2)p(Var.Hom.) 0,75 0,97 0,7215 T gl p prueba 7,2515<0,0001Bilateral Prueba T - Muestras independientes Ejemplo suplemento con lecitina

41 ClasificVariableGrupo(1)Grupo(2) Lecitinalts./dia{CON} {SIN} n(1)n(2)media(1) media(2) LI(95%)LS(95%) ,71 14,45 2,47 sd Varianza(1) Varianza(2) p(Var.Hom.) 0,75 0,97 0,7215 T gl p prueba 7,2515<0,0001UnilatD Prueba T - Muestras independientes Ejemplo suplemento con lecitina

42 Caso Normal- Muestras dependientes Los datos se obtienen de muestras que están relacionadas, es decir, los resultados del primer grupo no son independientes de los del segundo. Por ejemplo, esto ocurre cuando se mide el nivel de un metabolito en cada uno de los individuos de un grupo experimental antes y después de la administración de una droga.

43 Caso Normal- Muestras dependientes El objetivo es comprobar si la droga produce efectos en el nivel del metabolito Los pares de observaciones (antes y después) obtenidas en cada individuo no son independientes ya que el nivel posterior a la administración de la droga depende del nivel inicial.

44 Caso Normal- Muestras dependientes La inferencia se basa en el siguiente estadístico, que depende de la media y la varianza de las diferencias y del valor hipotetizado para el promedio poblacional de las diferencias ()

45 La prueba de hipótesis para la diferencia de medias se conoce como prueba T para muestras apareadas. Intervalo de confianza bilateral 1- para la diferencia de medias () está dado por: Caso Normal- Muestras dependientes

46 ANTESDESPUES DIF 8,69 7,24 1,45 7,13 7,10 0,03 7,79 7,80 -0,01 7,93 7,95 -0,02 7,59 7,50 0,09 7,86 7,79 0,07 9,06 9,00 0,06 9,59 9,48 0,11 Caso Normal- Muestras dependientes Ejemplo

47 Prueba T (muestras apareadas) Obs(1)Obs(2) N media(dif) ANTES DESPUES 8 0,22 DE(dif) LI(95%)LS(95%) T 0,50 -0,19 0,64 1,26 Bilateral 0,2469 Caso Normal- Muestras dependientes Ejemplo

48 Tanto cuando no se rechaza la hipótesis nula como cuando se rechaza, es posible cometer errores Errores en la Prueba de Hipótesis

49 Frente a una hipótesis nula se toma una decisión o Aceptar H 0 Es incorrecto si fuese falsa Rechazar H 0 Es incorrecto si fuese verdadera Errores

50 Error de Tipo I la hipótesis nula es cierta y se rechaza erróneamente La probabilidad de cometer este tipo de error está bajo control del experimentador. Su máximo valor se simboliza con y recibe el nombre de nivel de significación Error de tipo I

51 Error de tipo II Error de Tipo II: la hipótesis nula es falsa y no se rechaza La probabilidad ( ) de cometer este tipo de error queda determinada por: el nivel de significación elegido el tamaño muestral la magnitud de la discrepancia entre la hipótesis postulada y la situación verdadera.

52 Punto crítico 1Punto crítico 2 Zona de aceptación de H 0 Zona de rechazo 0 /2 1 - Zona de rechazo / 2 ( - 0 )/( / n) Error Tipo II

53 Potencia Se define a la potencia como: = 1 - Probabilidad de error de Tipo II Esta probabilidad es una medida de la potencialidad que se tiene en un experimento para detectar que la hipótesis nula es falsa. = 1-

54 Regresión Lineal Modelar la relación entre dos o más variables La variable respuesta es la dependiente y las otras variables son las independientes o regresoras Estimar los parámetros del modelo Probar hipótesis sobre los parámetros Predecir el nivel medio de la respuesta para determinados valores de las regresoras

55 Regresión Lineal Ejemplo Estudiar la relación entre la longitud de la planta y la temperatura

56 Regresión Lineal Modelo propuesto: Variable respuesta (longitud) Ordenada al origen Valor de Y para X=0 Pendiente Tasa de cambio en Y (longitud) ante el cambio unitario en X (temperatura) Variable independiente (temperatura) Error aleatorio

57 Regresión Lineal VariableN R² LP (mm) 190,60 Coeficientes de regresión y estadísticos asociados Coef Est. EE LI(95%) LS(95%) T p-valor const 8,69 2,54 3,3214,06 3,42 0,0033 Temp 0,72 0,14 0,42 1,02 5,04 0,0001 Cuadro de Análisis de la Varianza (SC tipo III) F.V. SC gl CM F p-valor Temp (C°)317, ,86 25,41 0,0001 Error 212, ,51 Total 530,5318

58 Regresión Lineal Modelo ajustado Valor predicho para x= 22 ° C

59 Regresión Lineal

60 VariableN R² LP (mm) 190,60 Valor predictivo del modelo ajustado Proporción de la variabilidad total explicada por el modelo. El 60% de la suma de cuadrados totales de la variable longitud es explicada a través de una relación lineal, por la variación observada en la temperatura.


Descargar ppt "Inferencia Estadística Estimación de Parámetros. Estimación Buscar valores razonables para los parámetros que caracterizan una distribución Si la distribución."

Presentaciones similares


Anuncios Google