Descargar la presentación
La descarga está en progreso. Por favor, espere
Publicada porNicolás Olivares Gutiérrez Modificado hace 9 años
1
Clase 17 Introducción a la Estadística Universidad de la República Centro Universitario Regional del Este Pablo Inchausti Licenciatura en Gestión Ambiental
2
Programa del curso: 1. Estadística descriptiva. 2. Introducción a la probabilidad. 3. Estimación de parámetros de funciones de distr. de probabilidades. 4. Pruebas de hipótesis estadísticas. 5. Comparación de pares de medias y de varianzas. 6. Análisis de varianza de un factor. 7. Asociación y relación funcional entre variables. 8. Tests de bondad de ajuste (χ 2 ).
3
Tema 6: Clase 17 Análisis de varianza de un factor. 1. El Análisis de Varianza y el Modelo Lineal General. 2. Tests a posteriori de medias. 3. Suposiciones del Análisis de Varianza y su verificación.
4
1. El Análisis de Varianza y el Modelo Lineal General. arenosoarcillosolimoso 61713 101516 839 61112 141415 171216 91217 11813 71018 111314 Media ± SE La variable dependiente continua Y es el rendimiento. La variable dependiente continua Y es el rendimiento. La variable explicativa discreta i es el tipo de suelo con i=1,2,3.La variable explicativa discreta i es el tipo de suelo con i=1,2,3. El modelo estadístico es Y ij = i + ij, donde: Retomemos el ejemplo de la clase anterior: Se puede escribir: i = – i, donde es la media global y i la media del grupo (=tipo de suelo). 9.911.514.311.9
5
Media del grupo i yiyiyiyi i Media global y Observación j del grupo i y ij Y ij SignificadomuestraPoblación Y ij~ N( i, ) No varía con i El modelo estadístico Y ij = i + ij se puede reescribir como donde los errores aleatorios i~ N(0, ) y los i = ( i ) representan las diferencias entre la media poblacional y i la media del grupo i. Como se indicó en la Clase 14: Las hipótesis estadísticas del Análisis de Varianza son: H 0 =: 1 = 2 =… k H A : al menos una i es diferente de las demás. se pueden re-escribir como: H 0 : 1 = 2 =… k H A : al menos un i es diferente de las demás. El Análisis de Varianza es un caso particular del Modelo Lineal General. Veamos la resolución de este ejemplo como Modelo Lineal General.
6
“Intercept” es la media del 1er nivel (suelo arcilloso) de la variable factorial “suelo” tomado como “referencia”. “suelo[T.arenoso]” es 1 : diferencia entre la media de arcilloso” y la media de “arenoso”. (idem para el otro) Escribiendo: Misma conclusión que antes.
7
2. Tests a posteriori de medias. Las hipótesis estadísticas del Análisis de Varianza son: H 0 : 1 = 2 =… k H 1 : al menos una i es diferente de las demás. En los dos análisis, se rechazó la hipótesis nula: al menos una media es distinta de las otras. ¿CUALES? Para responder a esta pregunta, hay que realizar los TESTS A POSTERIORI del Análisis de Varianza. Estos tests SOLAMENTE SE REALIZAN UNA VEZ QUE SE RECHAZA H 0 y son análogos a pruebas de T para pares de muestras independientes (con al nivel de significancia ajustado para que TOT =0.05)
8
Los resultados son: Hay una diferencia estadísticamente significativa en el rendimiento promedio entre los suelos limoso y arenoso. El IC 95% de esta diferencia NO incluye al cero se rechaza H 0.
9
3. Suposiciones del Análisis de Varianza y su verificación. Las suposiciones del Análisis de Varianza de una vía son: 1.Y tiene una distribución normal. 2.Las muestras son aleatorias e independientes. 3.Las varianzas de cada grupo son homogéneas (no difieren entre sí). Son exactamente las mismas suposiciones que para el test T de medias de dos muestras independientes y de hecho para cualquier otra instancia del Modelo Lineal General. Verificación de la homogeneidad de varianzas entre los grupos (=suelos): p-value > =0.05. Las varianzas intra-grupo son homogéneas entre sí.
10
Verificación de la normalidad de la distribución de Y: OK: la mayoría de los puntos están cerca de la línea recta (de 45º) y dentro de la banda de 95% de confianza definida por las líneas punteadas.
11
De NO cumplirse las suposiciones del modelo del Análisis de Varianza: 1) Se podría transformar Y: la transformación logarítmica resuelve muchos (pero no todos) los problemas de falta de normalidad y homogeneidad de varianza. Se realiza el test con log(Y), no con Y. 2) En muchos casos, emplean Modelos Lineales Generalizados (no serán discutidos en este curso). 3) En otros casos, se utilizan tests estadísticos no paramétricos que no tienen las mismas suposiciones que Modelo Lineal General (no serán discutidos en este curso). El Análisis de Varianza es la base fundamental de todas las ideas de Diseño de Experimentos cuyo objetivo es planear los experimentos de manera que los datos apropiados puedan ser analizados para obtener resultados válidos, objetivos y relevantes. Se dictaría luego un curso de Estadística Avanzada donde se discutirían los aspectos más relevantes del Diseño de Experimentos, así como otros métodos más “avanzados” de análisis de datos.
12
Tema 6: Clase 17 Análisis de varianza de un factor. 1. El Análisis de Varianza y el Modelo Lineal General. 2. Tests a posteriori de medias. 3. Suposiciones del Análisis de Varianza y su verificación.
Presentaciones similares
© 2025 SlidePlayer.es Inc.
All rights reserved.