La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Inferencia Estadística

Presentaciones similares


Presentación del tema: "Inferencia Estadística"— Transcripción de la presentación:

1 Inferencia Estadística
Estimación de Parámetros

2 Estimación Buscar valores razonables para los parámetros que caracterizan una distribución Si la distribución supuesta es normal, los parámetros más buscados son la esperanza o media (µ) y la varianza (2)

3 Ejemplo Una empresa de comercialización de semillas desea estimar la altura promedio de un sorgo forrajero que ha desarrollado. Para ello se toma una muestra de 50 plantas y se calcula la media de la altura, la que resulta ser de 130 cm.

4 Estimación estimación puntual por intervalo de confianza

5 es más eficiente que la mediana por tener menor varianza
Estimación Puntual la media muestral es un estimador Insesgado Consistente Eficiente su promedio es igual a µ está más cerca de µ a medida que crece el tamaño de la muestra es más eficiente que la mediana por tener menor varianza de la media poblacional

6 Intervalos de Confianza
Encontrar el intervalo cerrado [LI, LS] donde: LI = Límite Inferior LS = Límite Superior Entonces: P(LI ≤  ≤ LS) = 1-

7 Intervalo de Confianza para µ
Si 1- = 0.95, puede interpretarse como: “si se tomaran todas las muestras posibles de tamaño n y se construyeran 100 intervalos, 95 incluirán a la verdadera media poblacional µ y sólo 5 no la contendrán”

8 Ejemplo Se sabe que =22 cm.
Un intervalo para estimar a  con una confianza del 95%, es: El verdadero valor de la altura promedio del sorgo estará en este intervalo con un 95% de confianza

9 Ejemplo Un intervalo para estimar a  con una confianza del 99%, es:
El verdadero valor de la altura promedio del sorgo estará en este intervalo con un 99% de confianza

10 Efecto del cambio en el nivel de confianza
Sea la amplitud a = LS – LI Si la confianza es del 95% a= – = 12.1 Si la confianza es del 99% a= – = 16.03 A mayor confianza mayor amplitud

11 Efecto del cambio en el tamaño de la muestra
Para una confianza del 99% y n = 50 a = – = 16.03 Si n = 100 a = – = 11.34 A mayor n menor amplitud

12 Conclusión La amplitud de un intervalo de confianza es directamente proporcional a la confianza de la estimación e inversamente proporcional al tamaño de la muestra

13 Intervalos de Confianza
Efecto del coeficiente de confianza y del tamaño muestral sobre la amplitud del intervalo Tamaño muestral necesario para estimar un parámetro con una precisión deseada

14 Tamaño de Muestra para estimar a µ con una precisión deseada
¿Cuál debería ser el tamaño mínimo de muestra, para que la amplitud no supere los 12.1 cm, cuando se aumenta la confianza al 99%?

15 Tamaño de Muestra para estimar a µ con una precisión deseada
Donde c es la amplitud del intervalo de confianza

16 Ejemplo Se debería tomar una muestra de al menos 88 plantas para que al estimar la altura promedio del sorgo forrajero con una confianza del 99% la amplitud del intervalo no sea mayor a 12,1

17 Otro ejemplo Se desea utilizar un suelo cuya profundidad no sea inferior a 75cm Intervalos de confianza Bilateral Estimación paramétrica Campos Variable Parám. Estim. E.E. n LI(95%) LS(95%) A prof Media 81, , , ,86 B prof Media 79, , , ,08

18 Otro ejemplo Intervalos de confianza Unilateral izquierdo
Estimación paramétrica Campos Variable Parám. Estim. E.E. n LI(95%) A prof Media ,79 2, ,63 B prof Media , , ,79

19 Inferencia basada en una muestra
Contraste de Hipótesis

20 Hipótesis estadísticas
Son proposiciones sobre uno o más parámetros de la distribución de la variable aleatoria en estudio. Hipótesis nula (H0) Hipótesis alternativa (H1) establece valores o relaciones sobre uno o más parámetros niega la hipótesis nula H0:   vs. H1:  > 75

21 Ejemplo profundidad del suelo
Prueba T para un parámetro Valor del parámetro probado: 75 campos Variable n Media DE LI(95) T p(Unilateral D) A prof ,79 8,79 77,63 2, ,0063 B prof ,43 9,80 74,79 1, ,0573

22 Inferencia basada en dos muestras
Estimación de Parámetros Contraste de Hipótesis

23 Inferencia basada en dos muestras
Contrastar hipótesis sobre la diferencia entre dos medias Si el contraste es bilateral: versus

24 Caso Normal-Muestras independientes
Varianzas desconocidas pero iguales La inferencia se basa en el siguiente estadístico: prueba T para muestras independientes cuando las varianzas son homogéneas

25 Caso Normal-Muestras independientes
Varianzas desconocidas pero iguales Intervalo de confianza bilateral para la diferencia de medias está dado por:

26 Ejemplo Para comparar el contenido promedio de aceites de las semillas de dos variedades de maní, se plantean las hipótesis H0: 1= 2 vs H1: 1  2 Se diseña un ensayo en el que para cada variedad se obtienen los contenidos de aceite de 10 bolsas de 1 kg de semillas de maní, extraídas aleatoriamente de distintos productores de semillas.

27 Ejemplo Los resultados del ensayo son los siguientes: Variedad n S2 1
10 160.4 65.3 2 165.6 67.9

28 ¿Cómo saber si las varianzas son iguales o diferentes?
Suponiendo normalidad para las observaciones de las muestras, una prueba de homogeneidad de varianzas se basa en el estadístico:

29 ¿Cómo saber si las varianzas son iguales o diferentes?
versus Bajo H0 se distribuye como una F con 9 y 9 grados de libertad

30 Prueba F La región de aceptación para un nivel de significación del 5% está delimitada por y 4.03, correspondientes a los cuantiles /2 y (1 - /2) respectivamente

31 Ejemplo Como F=0.96 está en el intervalo
(0.248; 4.03) se acepta H0: 12= 22 Se concluye que no hay diferencias entre las varianzas poblacionales, lo que indica el cumplimiento del supuesto de homogeneidad de varianzas

32 Prueba T para la diferencia de medias

33 Prueba T La región de aceptación para un nivel de significación del 5% está delimitada por y 2.101, correspondientes a los cuantiles /2 y (1 - /2) respectivamente y 18 grados de libertad

34 Prueba T Como T=-1.42 está en el intervalo
(-2.101; 2.101) se acepta H0: 1= 2 Se concluye que no hay diferencias entre las dos variedades de maní considerando el contenido de aceites en la semilla

35 Caso Normal-Muestras independientes
Varianzas desconocidas y diferentes La inferencia se basa en el estadístico: prueba T para muestras independientes cuando las varianzas no son homogéneas

36 Caso Normal-Muestras independientes
Varianzas desconocidas y diferentes Intervalo de confianza bilateral 1- para la diferencia de medias está dado por:

37 Prueba T – Otro ejemplo Comparar el efecto de la restriccion alimentaria sobre los metabolitos Ca y P. Se realiza un experimento en el cual se seleccionan al azar 10 animales para cada tratamiento: alimentación restrigida y alimentación no restringida. En cada animal se mide el nivel de Ca y de P.

38 Prueba T - Muestras independientes
Clasific Variable Grupo(1) Grupo(2) n(1) n(2) Trat Ca {No Restr} {Restr} media(1) media(2) LI(95%) LS(95%) 8, , , ,09 Varianza(1) Varianza(2) p(Var.Hom.) T gl 1, , ,1490 0,45 18 p prueba 0, Bilateral

39 Prueba T - Muestras independientes
Clasific Variable Grupo(1) Grupo(2) n(1) n(2) Trat P {No Restr} {Restr} media(1) media(2) LI(95%) LS(95%) 7, , , ,86 Varianza(1) Varianza(2) p(Var.Hom.) T gl 1, , , ,19 12 p prueba 0,8530 Bilateral

40 Prueba T - Muestras independientes
Ejemplo suplemento con lecitina Clasific Variable Grupo(1) Grupo(2) n(1) Lecitina lts./dia {CON} {SIN} n(2) media(1) media(2) LI(95%) LS(95%) , , , ,22 Varianza(1) Varianza(2) p(Var.Hom.) 0, , ,7215 T gl p prueba 7,25 15 <0,0001 Bilateral

41 Prueba T - Muestras independientes
Ejemplo suplemento con lecitina Clasific Variable Grupo(1) Grupo(2) Lecitina lts./dia {CON} {SIN} n(1) n(2) media(1) media(2) LI(95%)LS(95%) , , ,47 sd Varianza(1) Varianza(2) p(Var.Hom.) 0, , ,7215 T gl p prueba 7,25 15 <0,0001 UnilatD

42 Caso Normal- Muestras dependientes
Los datos se obtienen de muestras que están relacionadas, es decir, los resultados del primer grupo no son independientes de los del segundo. Por ejemplo, esto ocurre cuando se mide el nivel de un metabolito en cada uno de los individuos de un grupo experimental antes y después de la administración de una droga.

43 Caso Normal- Muestras dependientes
El objetivo es comprobar si la droga produce efectos en el nivel del metabolito Los pares de observaciones (antes y después) obtenidas en cada individuo no son independientes ya que el nivel posterior a la administración de la droga depende del nivel inicial.

44 Caso Normal- Muestras dependientes
La inferencia se basa en el siguiente estadístico, que depende de la media y la varianza de las diferencias y del valor hipotetizado para el promedio poblacional de las diferencias ()

45 Caso Normal- Muestras dependientes
La prueba de hipótesis para la diferencia de medias se conoce como prueba T para muestras apareadas. Intervalo de confianza bilateral 1- para la diferencia de medias () está dado por:

46 Caso Normal- Muestras dependientes Ejemplo
ANTES DESPUES DIF 8, , ,45 7, , ,03 7, , ,01 7, , ,02 7, , ,09 7, , ,07 9, , ,06 9, , ,11

47 Caso Normal- Muestras dependientes Ejemplo
Prueba T (muestras apareadas) Obs(1) Obs(2) N media(dif) ANTES DESPUES ,22 DE(dif) LI(95%) LS(95%) T 0, , , ,26 Bilateral 0,2469

48 Errores en la Prueba de Hipótesis
Tanto cuando no se rechaza la hipótesis nula como cuando se rechaza, es posible cometer errores

49 Errores Frente a una hipótesis nula se toma una decisión Aceptar H0
Rechazar H0 o Es incorrecto si fuese falsa Es incorrecto si fuese verdadera

50 la hipótesis nula es cierta y se rechaza erróneamente
Error de tipo I Error de Tipo I la hipótesis nula es cierta y se rechaza erróneamente La probabilidad de cometer este tipo de error está bajo control del experimentador. Su máximo valor se simboliza con  y recibe el nombre de nivel de significación

51 la hipótesis nula es falsa y no se rechaza
Error de tipo II Error de Tipo II: la hipótesis nula es falsa y no se rechaza La probabilidad () de cometer este tipo de error queda determinada por: el nivel de significación elegido el tamaño muestral la magnitud de la discrepancia entre la hipótesis postulada y la situación verdadera.

52 Error Tipo II 1 -  /2  Punto crítico 1 Punto crítico 2
Zona de aceptación de H0 Zona de rechazo /2 1 -  ( -0)/(/n)

53  = 1 - Probabilidad de error de Tipo II
Potencia Se define a la potencia como:  = 1 - Probabilidad de error de Tipo II Esta probabilidad es una medida de la potencialidad que se tiene en un experimento para detectar que la hipótesis nula es falsa.  = 1- 

54 Regresión Lineal Modelar la relación entre dos o más variables
La variable respuesta es la dependiente y las otras variables son las independientes o regresoras Estimar los parámetros del modelo Probar hipótesis sobre los parámetros Predecir el nivel medio de la respuesta para determinados valores de las regresoras

55 Regresión Lineal Ejemplo
Estudiar la relación entre la longitud de la planta y la temperatura

56 Regresión Lineal Modelo propuesto: Variable respuesta (longitud)
Ordenada al origen Valor de Y para X=0 Error aleatorio Variable independiente (temperatura) Pendiente Tasa de cambio en Y (longitud) ante el cambio unitario en X (temperatura)

57 Regresión Lineal Variable N R² LP (mm) 19 0,60
Coeficientes de regresión y estadísticos asociados Coef Est. EE LI(95%) LS(95%) T p-valor const 8,69 2, ,32 14, ,42 0,0033 Temp 0, ,14 0,42 1, ,04 0,0001 Cuadro de Análisis de la Varianza (SC tipo III) F.V SC gl CM F p-valor Temp (C°) 317, , , ,0001 Error , ,51 Total ,53 18

58 Regresión Lineal Modelo ajustado Valor predicho para x= 22 ° C

59 Regresión Lineal

60 Valor predictivo del modelo ajustado
Regresión Lineal Variable N R² LP (mm) 19 0,60 Valor predictivo del modelo ajustado Proporción de la variabilidad total explicada por el modelo. El 60% de la suma de cuadrados totales de la variable longitud es explicada a través de una relación lineal, por la variación observada en la temperatura.


Descargar ppt "Inferencia Estadística"

Presentaciones similares


Anuncios Google