La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Inferencia estadística

Presentaciones similares


Presentación del tema: "Inferencia estadística"— Transcripción de la presentación:

1 Inferencia estadística

2 Temas Prueba de hipotesis
Constrastes para una población (Ejemplo aplicado) Contrastes para dos o más poblaciones (ejemplo aplicado) Contrastes para medias (Distribución t-Student) Contrastes para varianzas (distribución F).

3 Decisiones en Prueba de hipotesis

4 Introducción El hombre reconoce cotidianamente situaciones que le afectan, como la pérdida de cosechas, las enfermedades, las contingencias climáticas, etc. Tomar acciones para evitar o prevenir estos problemas requiere comprender cómo funciona el sistema que los origina.

5 Introducción En el proceso de comprensión existe una etapa de idealización que se llama técnicamente modelación, que tiene por objeto identificar los elementos que son relevantes y plantear sus relaciones

6 Introducción Si el modelo es correcto, en el sentido que representa bien el sistema bajo estudio, se tendrá una herramienta valiosa para planificar acciones en el mundo real, siempre y cuando el modelo sea significativo. Ejemplo: si un modelo de precipitaciones predice que en los primeros 10 días del mes de enero lloverá 60 mm en una localidad y en cambio se registran 40 mm, para un detractor del modelo la diferencia será significativa mientras que para otros no lo será. ¿Cómo ser imparcial en este juicio? ¡prueba estadística, prueba de hipotesis!

7 Hipotesis estadística
Consisten en una afirmación sobre uno o más parámetros de la distribución de la variable aleatoria en cuestión. Ejemplo: para la variable milimetraje de lluvia indicar que la esperanza de la distribución μ = 60 mm. La prueba de hipótesis es sencilla: se examina un conjunto de datos muestrales y a partir de ellos se calcula un estadístico cuya distribución depende de la hipótesis planteada. Sobre la base de la distribución especificada para el estadístico y de su valor observado en la muestra, se decide el rechazo o no de la hipótesis.

8 Prueba de hipotesis

9 Procedimiento de la prueba de hipotesis
Pasos: ¡CUIDADO!: Usualmente se tiene una hipótesis científica y se planifica una experiencia para probarla y una vez obtenidos los datos se trata de formalizar una hipótesis estadística. Debe advertirse que aunque en la práctica es usual este proceder, decididamente no es recomendable, porque a menudo se generan datos on escaso valor estadístico.

10 Plantear las hipótesis nula, alternativa y significancia
Para poder construir una prueba estadística se debe especificar una hipótesis que se supone verdadera llamada hipotesis Nula (Ho). La hipotesis contraria constituye la alternativa (H1), y se asume cuando se rechaza Ho. El nivel de significación normalmente es 0.05. Definición de zona de rechazo y no rechazo (Regla de decisión) La zona de rechazo puede estar a la izquierda o a la derecha de la distribución (unilateral a izquierda, a derecha o bilateral

11 Prueba de hipotesis. Prueba de hipotesis de una cola ¿cuánto?
Prueba de hipotesis de dos colas Si es bilateral se dice que es de dos colas

12 El estadístico de prueba

13 Regla de decisión

14 La prueba de hipotesis acerca de una media puede ser:
Caso 1: Si se conoce la varianza σ2 Caso 2: No se conoce la varianza σ2

15 Ejercicio (Caso 1) Se desea probar si una nueva variedad de soja lograda por un proceso de mejoramiento genético supera la base de 20 Ton/ha, sabiendo que tiene una σ=4 Ton/ha. se planificó una experiencia del cultivo mejorado de soja en 30 parcelas y se obtuvo una media de 25 Ton/ha Paso 1: Planteo de la hipótesis estadística H0: μ ≤ μ0 (20 Ton/ha) H1: μ > μ0 (20 Ton/ha). Paso 2: Se selecciona el nivel de significancia. α=0.05

16 Ejercicio (continuación)
Paso 3: Defino el estadístico de prueba. Como se conoce la media (μ) y desviación estándar (σ) poblacional y n≥30, entonces uso una Normal estándar (Z). Se debe tener en cuenta que es una Normal estándar de una cola a derecha. Paso 4: Se formula la regla de decisión. Se busca en la tabla Z el punto crítico. Teniendo en cuenta que α=0.05, y es a una cola, entonces: Z1-α=1.6

17

18 Ejercicio (continuación)
Paso 5: Se toma una muestra y se decide. Se calcula, Zc= Si Zc > Z1-α, rechazo Ho ¿Que se concluye? ¿Con que confiabilidad?

19 Caso 1 con contraste de dos medias
Como las varianzas son conocidas, la expresión es: Donde: σ21 y σ22 corresponden a las varianzas de las distribuciones y n1 y n2 a los tamaños de las muestras a partir de las cuales se calcularon cada una de las medias.

20 Ejercicio Suponga que se quieren comparar dos variedades de maní, en cuanto al contenido de aceite de las semillas. Para probar las hipótesis anteriores se diseña un ensayo en el que para cada variedad se obtienen los contenidos de aceite de 10 bolsas de 1kg de semillas de maní cada una, extraídas aleatoriamente de un semillero. Tenga en cuenta que las varianzas reportadas por el proveedor son: 65 y 67 respectivamente. Los demás resultados del ensayo son los siguientes:

21 Ejercicio Paso 1: Planteo de la hipótesis estadística H0: μ1= μ2
Paso 2: Se selecciona el nivel de significancia. α=0.05 Paso 3: Defino el estadístico de prueba. Se supone que la media (μ) y desviación estándar (σ) poblacional se conocen, entonces se usa una Normal estándar (Z). Se debe tener en cuenta que es una Normal estándar de dos colas.

22 Ejercicio Paso 4: Se formula la regla de decisión. Se busca en la tabla Z los puntos críticos. Teniendo en cuenta que α/2=0.025 porque es a 2 colas, entonces: Zα/2=2.75 Z (1-α/2)=-2.75 -2.75 2.75

23 Ejercicio (continuación)
Paso 5: Se toma una muestra y se decide. Si Zα/2 > Zc > Z1-α/2, rechazo Ho ¿Que se concluye? ¿Con que confiabilidad? -2.75 2.75

24

25 Ejercicio (Caso 2) Se piensa que la producción promedio de un nuevo cultivar de trigo es superior al rendimiento promedio del trigo que se siembra usualmente, que es de 2000 kg./ha. Para establecer si esto es cierto se procede a realizar una prueba de hipótesis. Para probar esta hipótesis se seleccionan aleatoriamente, dentro de la región de interés, 12 campos de 5 has. cada uno en los que se sembrará el nuevo cultivar, registrándose su rendimiento a cosecha. El rendimiento promedio del nuevo cultivar calculado a partir de las 12 parcelas es 2020 kg./ha y la desviación estándar estimada S = 100.

26 Ejercicio (Caso 2) Paso 1: Planteo de la hipótesis estadística
H0: μ ≤ 2000 kg./ha H1: μ > 2000 kg./ha Paso 2: Se selecciona el nivel de significancia. α=0.05 Paso 3: Defino el estadístico de prueba. Se supone que el rendimiento promedio es una variable aleatoria normal y como la desviación estándar poblacional es desconocida, entonces trabajo con una T de Student con una cola a derecha.

27 Ejercicio (Caso 2) Paso 4: Se formula la regla de decisión
Se busca en la tabla T el punto crítico. cuya región de rechazo queda definida por el intervalo (T(n-1); 1-α , ∞). La probabilidad de esta región bajo Ho es, obviamente, α. Luego el punto crítico es T (12-1) ; 0.95 = 1.8 Acepto Ho Zona de rechazo T11, 0.95= 1.8

28

29 Ejercicio (Caso 2) Paso 5: Se toma una muestra y se decide.
Dado que T = < 1.8, no se rechaza Ho. Se concluye que no hay evidencia de que el nuevo cultivar tenga un rendimiento promedio mayor a 2000 kg./ha Acepto Ho Zona de rechazo T11, 0.95= 1.8

30 Error en las decisiones

31 Definiciones

32 Prueba de hipótesis acerca una varianza (Ejercicio)
Una firma agroindustrial desea incorporar un nuevo mecanismo en las máquinas enfardadoras que fabrica. El ingeniero a cargo del proyecto sospecha que esta innovación puede producir un aumento de la varianza del peso de los fardos. La desviación estándar que se obtiene con la maquinaria sin modificar es de 1.5 kg. Para evaluar el nuevo mecanismo, se realizó un ensayo tomando 10 fardos al azar de un lote de alfalfa. Los pesos de dichos fardos fueron: 28.3; 27.8; 29.3; 30.1; 32.5; 27.2; 25.3; 32.2; 33.6; 30.7, con varianza muestral = 6.87 kg.

33 Ejercicio (prueba de hipotesis de una varianza)
Paso 1: Planteo de la hipótesis estadística Ho:σ2 =2.25 vs. H1:σ2 > 2.25 Paso 2: Se selecciona el nivel de significancia. α=0.05 Paso 3: Defino el estadístico de prueba. El estadístico a utilizar es: que se distribuye como: Χ2(n-1)

34 Ejercicio (prueba de hipotesis de una varianza)
Paso 4: Se formula la regla de decisión Se busca en la tabla Chi-cuadrado (X2) el punto crítico, que es X2(9; 0.05) = 16.92, delimitando así las regiones de no rechazo y rechazo de Ho. Acepto Ho Zona de rechazo X2(9,0.05)=16.92

35 Tabla chi-cuadrado

36 Ejercicio (prueba de hipotesis de una varianza)
Paso 5: Se toma una muestra y se decide. Se evalúa el estadístico (n - 1) S2 / σ2 = (10-1)*6.87/2.25 = 27.48 Dado que está dentro de la región de rechazo, se rechaza H0. Esto implica que el nuevo mecanismo provoca un aumento de la varianza del peso de los fardos. Acepto Ho Zona de rechazo X2(9,0.05)=16.92

37 Prueba de hipotesis para dos varianzas
A veces se quiere comparar las varianzas de dos variables aleatorias con distribución normal. Para ello usualmente se cuenta con muestras independientes, una de cada distribución, de tamaños n1 y n2 respectivamente. Si las varianzas de las poblaciones que se están muestreando son iguales, entonces el cociente S21/S22 se distribuye como una distribución F con (n1-1) y (n2-1) grados de libertad.

38 Distribución F Es una distribución asimetrica y se pude demostrar que:
Bajo Ho la varianza poblacional es igual

39 Ejercicio Se tienen dos lotes de girasol y se toma de cada uno una muestra aleatoria simple de 10 paquetes de 100 semillas cada uno y luego se pesan. Los datos de resumen son los siguientes: Las varianzas muestrales de ambos lotes parecen diferentes. ¿Pero es ésta diferencia significativa?

40 Ejercicio Paso 1: Planteo de la hipótesis estadística
Ho: σ2=σ2 vs H1: σ2=σ2 Paso 2: Se selecciona el nivel de significancia. α=0.05 Paso 3: Defino el estadístico de prueba. El estadístico a utilizar es: que se distribuye como: Fv1,v2

41 Ejercicio Paso 4: Se formula la regla de decisión
Se busca en la F el punto crítico, teniendo en cuenta que es a dos colas, α/2=0.025. FDerecha(9; 9)=4.03, Fizquierda(9,9)=0.25 Delimitando así las regiones de no rechazo y rechazo de Ho. Zona de rechazo a izquierda Zona de rechazo a derecha Acepto Ho F(9,9)=0.025 F(9,9)=4.03

42 Ejercicio Paso 5: Se toma una muestra y se decide.
Se evalúa el estadístico Dado que 0.62 está dentro de la región de aceptación Ho, se dice que no hay evidencias para rechazar Ho. Esto implica que las varianzas son iguales en los dos lotes. Zona de rechazo a izquierda Zona de rechazo a derecha Acepto Ho F(9,9, 0.025)=0.025 F(9,9, 0.975)=4.03

43 Tabla F para α=0.025

44 Gracias


Descargar ppt "Inferencia estadística"

Presentaciones similares


Anuncios Google