Descargar la presentación
La descarga está en progreso. Por favor, espere
Publicada porTiburcio Millian Modificado hace 10 años
1
Tema 6: Análisis de la Varianza (1ª parte: ANOVA simple)
2
PROBLEMA 1: Dada una variable cuantitativa continua Y, y una
variable cualitativa F, determínese si entre ambas hay relación, o no. Ejemplos: Tiempo de cura / medicamento utilizado Rendimiento de cosechas / fertilizante Renta familiar / hábito de lectura Número de préstamos / ubicación PROBLEMA 2: Dada una variable cuantitativa continua Y, y varias variables cualitativas F1, F2,…, Fn, determínese cuáles de ellas infuyen en Y, y cuáles no (es decir, cuáles guardan relación con Y). Ejemplos: Tiempo de cura / medicamento utilizado, grupo sanguíneo Número de préstamos / sexo, nivel de estudios, afición al cine
3
PROBLEMA 1: Dada una variable cuantitativa continua Y, y una
variable cualitativa F, determínese si entre ambas hay relación, o no. Y: variable respuesta (numérica) F: factor (cualitativa) ANOVA simple PROBLEMA 2: Dada una variable cuantitativa continua Y, y varias variables cualitativas F1, F2,…, Fn, determínese cuáles de ellas infuyen en Y, y cuáles no (es decir, cuáles guardan relación con Y). Y: variable respuesta (numérica) F1, F2,…, Fn : factores (cualitativas) ANOVA multifactorial
4
Y: variable respuesta (numérica) F: factor (cualitativa)
1. ANOVA simple: idea ¿Son independientes Y y F? ¿Hay relación entre Y y F? ¿Hay diferencias significativas en el valor de Y, según que F tome uno u otro valor? ¿Influye F en el valor de Y? ¿Hay diferencias en los valores de Y, entre los distintos grupos determinados por F? Medias en cada nivel de factor Y µ2 µ1 µ3 F 1 2 3 Niveles de factor
5
Si el valor de F no guarda relación con el de Y… ¿Cómo deberían ser
Y: variable respuesta (numérica) F: factor (cualitativa) Si el valor de F no guarda relación con el de Y… ¿Cómo deberían ser µ1, µ2, µ3? Y Media global µ2 µ1 µ3 F 1 2 3
6
H1: alguna µi es distinta
H0 equivalente a: Y, F son independientes; Y, F no guardan relación; F no influye en el valor de Y; no hay diferencias significativas en Y según distintos valores de F, etc. Rechazar H0 equivale a encontrar dependencia entre F e Y.
7
Pizarra H0: µ1= µ2= … = µn H1: alguna µi es distinta ?
¿Cómo contrastar H0: µ1= µ2= … = µn H1: alguna µi es distinta ? Mala idea: varios contrastes H0: µi=µk H1: µi≠µk Buena idea: descomposición de la variabilidad Error de tipo I se acumula, la confianza “total” es demasiado baja Pizarra
8
Yik: el primer subíndice (i) indica el valor del nivel del factor; el
Residuo del dato Yik: Yik-µi Y Media global µ2 µ1 µ3 F 1 2 3 Yik: el primer subíndice (i) indica el valor del nivel del factor; el segundo (k), el orden que ocupa el dato dentro de los perte- necientes a ese nivel del factor.
9
Varianzas ó cuadrados medios
TABLA DE ANOVA: Fuente de variación Suma de cuadrados Grados de libertad Varianzas ó cuadrados medios Cociente-F Entre-grupos(VE) I-1 Intra-gruposó residual ó no explicada (VNE) N-I Total (VT) N-1 Raíz cuadrada de se2: error experimental
10
TABLA DE ANOVA: SCE: suma de cuadr. explicada o entre-grupos SCR: suma de cuadr. residual o intra-grupos SCT: suma de cuadr. totales
11
(es decir, rechazamos cuando la variabilidad explicada es grande)
H0: µ1= µ2= … = µn H1: alguna µi es distinta ? Rechazamos si p-valor < nivel de significación Intuitivamente, aceptaremos cuando la variabilidad explicada es pequeña (es decir, rechazamos cuando la variabilidad explicada es grande) Statgraphics
12
Resumen: Concepto Valor Estim. Media total μ Media de cada nivel (grupo) μi Efecto de cada nivel (grupo) αi=μi-μ Residuo εij = yii-μi
13
Error experimental (σ)
Concepto Variabilidad total (VT ó SCT) Variab. Residual (VR ó VNE ó SCR) Variab. Explicada (VE ó SCE) Error experimental (σ) Coef. Det. R2 (VE/VT) x 100
14
2. El modelo de ANOVA simple
Descripción del modelo: PIZARRA Requisitos del modelo: 1.- Normalidad en cada nivel de factor. 2.- Homocedasticidad (igual varianza en cada nivel de factor) 3.- Independencia de las observaciones: residuos aleatorios. H0: σ1= σ2= … = σn H1: alguna σi es distinta
15
Se traducen en que los residuos son
Requisitos del modelo: 1.- Normalidad en cada nivel de factor. 2.- Homocedasticidad (igual varianza en cada nivel de factor) 3.- Independencia de las observaciones: residuos aleatorios. Se traducen en que los residuos son aleatorios, y siguen una normal N(0,σ) Error experimental
16
¿Qué hacer si alguna hipótesis falla?
Si falla la homocedasticidad, siempre que no haya grandes diferencias entre el número de observaciones en los distintos grupos (niveles de factor), el ANOVA sigue siendo fiable. - El contraste de ANOVA es robusto frente a la violación del supuesto de normalidad. El no-cumplimiento de esta hipótesis sí puede afectar a la estimación del error experimental. - Transformaciones de los datos…
17
¿Qué hacer si alguna hipótesis falla?
El verdadero problema es la independencia de las observaciones. La violación de este supuesto sí pone en duda las conclusiones del ANOVA; suele ser debido a: 1.- errores en el muestreo (efecto aprendizaje, descuidos, falta de aleatorización, etc.) 2.- existencia de otros factores que también influyen en la variable respuesta, y no han sido tomados en consideración (necesidad de aplicar no un ANOVA con un factor, sino un ANOVA multifactorial)
18
De hecho, la independencia de las observaciones
debería quedar garantizada por el modo en que se ha diseñado el estudio: Modelo correcto: evidencia razonable de que hay un único factor que pueda tener influencia sobre Y. (2) Una correcta recogida de los datos: Principio de aleatorización. “Todos los factores no controlados por el experimentador y que puedan influir en los resultados, deben asignarse al azar a las obser- vaciones” (D.Peña).
19
Statgraphics IMPORTANTE: si se rechaza la hipótesis nula, en
el contraste de ANOVA, eso significa que no todas las medias son iguales. Sin embargo, puede que algunas sí que sean iguales. Para decidir qué grupos tienen medias similares, descomponemos los niveles del factor en grupos homogéneos. Statgraphics
20
3. Contraste de Kruskal-Wallis
- Método no-paramétrico Util si fallan los requisitos del ANOVA (aunque inferior a ANOVA). Realiza un contraste sobre las medianas H0: M1= M2=…= Mn H1: alguna Mi es distinta. - Utiliza la noción de rango. La idea es ordenar de menor a mayor todos los datos (sin atender al nivel del factor del que provienen), asignar rangos, y comparar después los rangos medios correspondientes a los distintos niveles del factor.
Presentaciones similares
© 2025 SlidePlayer.es Inc.
All rights reserved.