Inferencia Estadística

Slides:



Advertisements
Presentaciones similares
DISEÑO DE EXPERIMENTOS EXPERIMENTOS DE COMPARACIÓN SIMPLE
Advertisements

DSITRIBUCION T DE STUDENT.
UNIVERSIDAD NACIONAL DE EDUCACIÓN Alma Máter del Magisterio Nacional
ANOVA DE UN FACTOR.
Intervalos de Confianza para la Media de la Población
Intervalos de Confianza para la Varianza de la Población
MSP César Eduardo Luna Gurrola
DISEÑO DE EXPERIMENTOS
ESTIMACION DE PARAMETRO
La mediana La mediana es el valor tal que el 50 % de las observaciones son menores y 50 % de ellas son mayores a dicho valor. En otra palabras, la mediana.
1 LA UTILIZACION DE LAS TIC EN LAS PYMES GALLEGAS AÑO de Junio de 2005.
Tema 16: Contraste paramétrico de hipótesis I: Pruebas de contraste para un grupo. Pruebas de contraste para dos grupos: independientes o relacionados.
Sesión práctica sobre estimación de parámetros
Evaluar el efecto de un tratamiento (1)
Tema 7: Introducción a la inferencia estadística
Estadística Aplicada a Ecología
Demostración de Asociación
PROBLEMAS DE PRUEBA DE HIPÓTESIS. La lectura de una muestra aleatoria mostraron una media de cm y una desviación estándar de 6.9 cm. Determine un.
Ejemplo Grafico.
© Pedro Juan Rodríguez Esquerdo Departamento de Matemáticas UPR Río Piedras Un experimento.
Pruebas de hipótesis: Media de una población © Pedro Juan Rodríguez Esquerdo Departamento de Matemáticas Recinto de Río Piedras Universidad de.
Inferencia basada en dos muestras
Pruebas de hipótesis.
PRACTICOS.
Estimación. Estimación Puntual Estimación por intervalos
Contraste de Hipótesis
De la muestra a la población
Estimación de parámetros poblacionales
Elementos del Diseño de Experimentos y Análisis de la Varianza
Inferencia Estadística
La Estadística en 37 preguntas
Inferencia estadística
} LISSET BÁRCENAS MONTERROZA
MUESTRARIO 2 Del Diseño 62- al diseño 97. Muestrario 2 Diseño 62Diseño 63.
Estimación I Intervalos de confianza
¡Primero mira fijo a la bruja!
Introducción al tema El único método científico para validar conclusiones sobre un grupo de individuos a partir de la información que nos proporciona un.
Contraste de Hipótesis ETSITGC Madrid Unidad Docente de Matemáticas.
INFERENCIA ESTADISTICA
puede o no ser verdadero, relativo a una o más poblaciones.
Estimación por intervalos de confianza.
Supongamos que seleccionamos al azar a dos alumnos de dos cursos diferentes que llamaremos D8 y C1…
Los números. Del 0 al 100.
Estimación por Intervalos de confianza
Introducción Media y varianza poblacional Sea
INFERENCIA ESTADÍSTICA
Análisis de varianza Análisis de varianza de un factor
Distribución muestral de la Media
Tests de hipótesis Los tres pasos básicos para testear hipótesis son
Inferencia Estadística
Unidad V: Estimación de
Unidad V: Estimación de
ESTIMACION En varios pasajes de este libro hemos planteado la dificultad que se confronta en las investigaciones, de llegar a conclusiones sobre una población.
Introducción La inferencia estadística es el procedimiento mediante el cual se llega a inferencias acerca de una población con base en los resultados obtenidos.
Inferencia Estadística
Estadística para administradores
Análisis y diseño de experimentos
Unidad V: Estimación de
Capítulo 1. Conceptos básicos de la Estadística
Pruebas de hipótesis.
COMPROBACION DE HIPOTESIS SOBRE DOS PROMEDIOS Mario Briones L. MV, MSc 2005.
ESTIMACIÓN DE PARÁMETROS
Prueba de Hipótesis Una hipótesis estadística es un supuesto que se establece sobre las características de una distribución poblacional El estudio se plantea.
Aspectos generales de la investigación educativa en el SNIT
CONTRASTE DE HIPÓTESIS Dimensiones Largo275mm. 169 mm 2 Ancho175mm.49 mm 2 Alto175mm.49 mm 2 Peso16 Kg.1 Kg 2. SITUACIÓN PROBLEMA.
INFERENCIA ESTADÍSTICA
Pruebas paramétricas y no paramétricas
UNIDAD I.- Analisis 3.4 Prueba de Hipotesis.
Bioestadística Inferencia estadística y tamaño de muestra
Estimación estadística
Transcripción de la presentación:

Inferencia Estadística Estimación de Parámetros

Estimación Buscar valores razonables para los parámetros que caracterizan una distribución Si la distribución supuesta es normal, los parámetros más buscados son la esperanza o media (µ) y la varianza (2)

Ejemplo Una empresa de comercialización de semillas desea estimar la altura promedio de un sorgo forrajero que ha desarrollado. Para ello se toma una muestra de 50 plantas y se calcula la media de la altura, la que resulta ser de 130 cm.

Estimación estimación puntual por intervalo de confianza

es más eficiente que la mediana por tener menor varianza Estimación Puntual la media muestral es un estimador Insesgado Consistente Eficiente su promedio es igual a µ está más cerca de µ a medida que crece el tamaño de la muestra es más eficiente que la mediana por tener menor varianza de la media poblacional

Intervalos de Confianza Encontrar el intervalo cerrado [LI, LS] donde: LI = Límite Inferior LS = Límite Superior Entonces: P(LI ≤  ≤ LS) = 1-

Intervalo de Confianza para µ Si 1- = 0.95, puede interpretarse como: “si se tomaran todas las muestras posibles de tamaño n y se construyeran 100 intervalos, 95 incluirán a la verdadera media poblacional µ y sólo 5 no la contendrán”

Ejemplo Se sabe que =22 cm. Un intervalo para estimar a  con una confianza del 95%, es: El verdadero valor de la altura promedio del sorgo estará en este intervalo con un 95% de confianza

Ejemplo Un intervalo para estimar a  con una confianza del 99%, es: El verdadero valor de la altura promedio del sorgo estará en este intervalo con un 99% de confianza

Efecto del cambio en el nivel de confianza Sea la amplitud a = LS – LI Si la confianza es del 95% a= 136.05 – 123.95 = 12.1 Si la confianza es del 99% a= 138.01 – 121.98 = 16.03 A mayor confianza mayor amplitud

Efecto del cambio en el tamaño de la muestra Para una confianza del 99% y n = 50 a = 138.01 – 121.98 = 16.03 Si n = 100 a = 135.67 – 124.33 = 11.34 A mayor n menor amplitud

Conclusión La amplitud de un intervalo de confianza es directamente proporcional a la confianza de la estimación e inversamente proporcional al tamaño de la muestra

Intervalos de Confianza Efecto del coeficiente de confianza y del tamaño muestral sobre la amplitud del intervalo Tamaño muestral necesario para estimar un parámetro con una precisión deseada

Tamaño de Muestra para estimar a µ con una precisión deseada ¿Cuál debería ser el tamaño mínimo de muestra, para que la amplitud no supere los 12.1 cm, cuando se aumenta la confianza al 99%?

Tamaño de Muestra para estimar a µ con una precisión deseada Donde c es la amplitud del intervalo de confianza

Ejemplo Se debería tomar una muestra de al menos 88 plantas para que al estimar la altura promedio del sorgo forrajero con una confianza del 99% la amplitud del intervalo no sea mayor a 12,1

Otro ejemplo Se desea utilizar un suelo cuya profundidad no sea inferior a 75cm Intervalos de confianza Bilateral Estimación paramétrica Campos Variable Parám. Estim. E.E. n LI(95%) LS(95%) A prof Media 81,79 2,35 14 76,71 86,86 B prof Media 79,43 2,62 14 73,77 85,08

Otro ejemplo Intervalos de confianza Unilateral izquierdo Estimación paramétrica Campos Variable Parám. Estim. E.E. n LI(95%) A prof Media 81,79 2,35 14 77,63 B prof Media 79,43 2,62 14 74,79

Inferencia basada en una muestra Contraste de Hipótesis

Hipótesis estadísticas Son proposiciones sobre uno o más parámetros de la distribución de la variable aleatoria en estudio. Hipótesis nula (H0) Hipótesis alternativa (H1) establece valores o relaciones sobre uno o más parámetros niega la hipótesis nula H0:   75 vs. H1:  > 75

Ejemplo profundidad del suelo Prueba T para un parámetro Valor del parámetro probado: 75 campos Variable n Media DE LI(95) T p(Unilateral D) A prof 14 81,79 8,79 77,63 2,89 0,0063 B prof 14 79,43 9,80 74,79 1,69 0,0573

Inferencia basada en dos muestras Estimación de Parámetros Contraste de Hipótesis

Inferencia basada en dos muestras Contrastar hipótesis sobre la diferencia entre dos medias Si el contraste es bilateral: versus

Caso Normal-Muestras independientes Varianzas desconocidas pero iguales La inferencia se basa en el siguiente estadístico: prueba T para muestras independientes cuando las varianzas son homogéneas

Caso Normal-Muestras independientes Varianzas desconocidas pero iguales Intervalo de confianza bilateral para la diferencia de medias está dado por:

Ejemplo Para comparar el contenido promedio de aceites de las semillas de dos variedades de maní, se plantean las hipótesis H0: 1= 2 vs H1: 1  2 Se diseña un ensayo en el que para cada variedad se obtienen los contenidos de aceite de 10 bolsas de 1 kg de semillas de maní, extraídas aleatoriamente de distintos productores de semillas.

Ejemplo Los resultados del ensayo son los siguientes: Variedad n S2 1 10 160.4 65.3 2 165.6 67.9

¿Cómo saber si las varianzas son iguales o diferentes? Suponiendo normalidad para las observaciones de las muestras, una prueba de homogeneidad de varianzas se basa en el estadístico:

¿Cómo saber si las varianzas son iguales o diferentes? versus Bajo H0 se distribuye como una F con 9 y 9 grados de libertad

Prueba F La región de aceptación para un nivel de significación del 5% está delimitada por 0.248 y 4.03, correspondientes a los cuantiles /2 y (1 - /2) respectivamente

Ejemplo Como F=0.96 está en el intervalo (0.248; 4.03) se acepta H0: 12= 22 Se concluye que no hay diferencias entre las varianzas poblacionales, lo que indica el cumplimiento del supuesto de homogeneidad de varianzas

Prueba T para la diferencia de medias

Prueba T La región de aceptación para un nivel de significación del 5% está delimitada por -2.101 y 2.101, correspondientes a los cuantiles /2 y (1 - /2) respectivamente y 18 grados de libertad

Prueba T Como T=-1.42 está en el intervalo (-2.101; 2.101) se acepta H0: 1= 2 Se concluye que no hay diferencias entre las dos variedades de maní considerando el contenido de aceites en la semilla

Caso Normal-Muestras independientes Varianzas desconocidas y diferentes La inferencia se basa en el estadístico: prueba T para muestras independientes cuando las varianzas no son homogéneas

Caso Normal-Muestras independientes Varianzas desconocidas y diferentes Intervalo de confianza bilateral 1- para la diferencia de medias está dado por:

Prueba T – Otro ejemplo Comparar el efecto de la restriccion alimentaria sobre los metabolitos Ca y P. Se realiza un experimento en el cual se seleccionan al azar 10 animales para cada tratamiento: alimentación restrigida y alimentación no restringida. En cada animal se mide el nivel de Ca y de P.

Prueba T - Muestras independientes Clasific Variable Grupo(1) Grupo(2) n(1) n(2) Trat Ca {No Restr} {Restr} 10 10 media(1) media(2) LI(95%) LS(95%) 8,87 8,68 -0,71 1,09 Varianza(1) Varianza(2) p(Var.Hom.) T gl 1,33 0,49 0,1490 0,45 18 p prueba 0,6612 Bilateral

Prueba T - Muestras independientes Clasific Variable Grupo(1) Grupo(2) n(1) n(2) Trat P {No Restr} {Restr} 10 10 media(1) media(2) LI(95%) LS(95%) 7,92 8,00 -1,03 0,86 Varianza(1) Varianza(2) p(Var.Hom.) T gl 1,65 0,23 0,0072 -0,19 12 p prueba 0,8530 Bilateral

Prueba T - Muestras independientes Ejemplo suplemento con lecitina Clasific Variable Grupo(1) Grupo(2) n(1) Lecitina lts./dia {CON} {SIN} 9 n(2) media(1) media(2) LI(95%) LS(95%) 8 17,71 14,45 2,30 4,22 Varianza(1) Varianza(2) p(Var.Hom.) 0,75 0,97 0,7215 T gl p prueba 7,25 15 <0,0001 Bilateral

Prueba T - Muestras independientes Ejemplo suplemento con lecitina Clasific Variable Grupo(1) Grupo(2) Lecitina lts./dia {CON} {SIN} n(1) n(2) media(1) media(2) LI(95%)LS(95%) 9 8 17,71 14,45 2,47 sd Varianza(1) Varianza(2) p(Var.Hom.) 0,75 0,97 0,7215 T gl p prueba 7,25 15 <0,0001 UnilatD

Caso Normal- Muestras dependientes Los datos se obtienen de muestras que están relacionadas, es decir, los resultados del primer grupo no son independientes de los del segundo. Por ejemplo, esto ocurre cuando se mide el nivel de un metabolito en cada uno de los individuos de un grupo experimental antes y después de la administración de una droga.

Caso Normal- Muestras dependientes El objetivo es comprobar si la droga produce efectos en el nivel del metabolito Los pares de observaciones (antes y después) obtenidas en cada individuo no son independientes ya que el nivel posterior a la administración de la droga depende del nivel inicial.

Caso Normal- Muestras dependientes La inferencia se basa en el siguiente estadístico, que depende de la media y la varianza de las diferencias y del valor hipotetizado para el promedio poblacional de las diferencias ()

Caso Normal- Muestras dependientes La prueba de hipótesis para la diferencia de medias se conoce como prueba T para muestras apareadas. Intervalo de confianza bilateral 1- para la diferencia de medias () está dado por:

Caso Normal- Muestras dependientes Ejemplo ANTES DESPUES DIF 8,69 7,24 1,45 7,13 7,10 0,03 7,79 7,80 -0,01 7,93 7,95 -0,02 7,59 7,50 0,09 7,86 7,79 0,07 9,06 9,00 0,06 9,59 9,48 0,11

Caso Normal- Muestras dependientes Ejemplo Prueba T (muestras apareadas) Obs(1) Obs(2) N media(dif) ANTES DESPUES 8 0,22 DE(dif) LI(95%) LS(95%) T 0,50 -0,19 0,64 1,26 Bilateral 0,2469

Errores en la Prueba de Hipótesis Tanto cuando no se rechaza la hipótesis nula como cuando se rechaza, es posible cometer errores

Errores Frente a una hipótesis nula se toma una decisión Aceptar H0 Rechazar H0 o Es incorrecto si fuese falsa Es incorrecto si fuese verdadera

la hipótesis nula es cierta y se rechaza erróneamente Error de tipo I Error de Tipo I la hipótesis nula es cierta y se rechaza erróneamente La probabilidad de cometer este tipo de error está bajo control del experimentador. Su máximo valor se simboliza con  y recibe el nombre de nivel de significación

la hipótesis nula es falsa y no se rechaza Error de tipo II Error de Tipo II: la hipótesis nula es falsa y no se rechaza La probabilidad () de cometer este tipo de error queda determinada por: el nivel de significación elegido el tamaño muestral la magnitud de la discrepancia entre la hipótesis postulada y la situación verdadera.

Error Tipo II 1 -  /2  Punto crítico 1 Punto crítico 2 Zona de aceptación de H0 Zona de rechazo /2 1 -   ( -0)/(/n)

 = 1 - Probabilidad de error de Tipo II Potencia Se define a la potencia como:  = 1 - Probabilidad de error de Tipo II Esta probabilidad es una medida de la potencialidad que se tiene en un experimento para detectar que la hipótesis nula es falsa.  = 1- 

Regresión Lineal Modelar la relación entre dos o más variables La variable respuesta es la dependiente y las otras variables son las independientes o regresoras Estimar los parámetros del modelo Probar hipótesis sobre los parámetros Predecir el nivel medio de la respuesta para determinados valores de las regresoras

Regresión Lineal Ejemplo Estudiar la relación entre la longitud de la planta y la temperatura

Regresión Lineal Modelo propuesto: Variable respuesta (longitud) Ordenada al origen Valor de Y para X=0 Error aleatorio Variable independiente (temperatura) Pendiente Tasa de cambio en Y (longitud) ante el cambio unitario en X (temperatura)

Regresión Lineal Variable N R² LP (mm) 19 0,60 Coeficientes de regresión y estadísticos asociados Coef Est. EE LI(95%) LS(95%) T p-valor const 8,69 2,54 3,32 14,06 3,42 0,0033 Temp 0,72 0,14 0,42 1,02 5,04 0,0001 Cuadro de Análisis de la Varianza (SC tipo III) F.V. SC gl CM F p-valor Temp (C°) 317,86 1 317,86 25,41 0,0001 Error 212,66 17 12,51 Total 530,53 18

Regresión Lineal Modelo ajustado Valor predicho para x= 22 ° C

Regresión Lineal

Valor predictivo del modelo ajustado Regresión Lineal Variable N R² LP (mm) 19 0,60 Valor predictivo del modelo ajustado Proporción de la variabilidad total explicada por el modelo. El 60% de la suma de cuadrados totales de la variable longitud es explicada a través de una relación lineal, por la variación observada en la temperatura.