La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Tema 6: Análisis de la Varianza

Presentaciones similares


Presentación del tema: "Tema 6: Análisis de la Varianza"— Transcripción de la presentación:

1 Tema 6: Análisis de la Varianza

2 PROBLEMA 1: Dada una variable cuantitativa continua Y, y una variable
cualitativa F, determínese si entre ambas hay relación, o no. Ejemplos: Tiempo de cura / medicamento utilizado Rendimiento de cosechas / fertilizante Renta familiar / hábito de lectura Número de préstamos / ubicación PROBLEMA 2: Dada una variable cuantitativa continua Y, y varias variables cualitativas F1, F2,…, Fn, determínese cuáles de ellas infuyen en Y, y cuáles no (es decir, cuáles guardan relación con Y). Ejemplos: Tiempo de cura / medicamento utilizado, grupo sanguíneo Número de préstamos / sexo, nivel de estudios, afición al cine

3 PROBLEMA 1: Dada una variable cuantitativa continua Y, y una variable
cualitativa F, determínese si entre ambas hay relación, o no. Y: variable respuesta (numérica) F: factor (cualitativa) ANOVA simple PROBLEMA 2: Dada una variable cuantitativa continua Y, varias variables cualitativas F1, F2,…, Fn, determínese cuáles de ellas infuyen en Y, y cuáles no (es decir, cuáles guardan relación con Y). Y: variable respuesta (numérica) F1, F2,…, Fn : factores (cualitativas) ANOVA multifactorial

4 Y: variable respuesta (numérica) F: factor (cualitativa)
1. ANOVA simple: idea ¿Son independientes Y y F? ¿Hay relación entre Y y F? ¿Hay diferencias significativas en el valor de Y, según que F tome uno u otro valor? ¿Influye F en el valor de Y? Y Medias en cada nivel de factor µ2 µ1 µ3 F 1 2 3 Niveles de factor

5 Si el valor de F no guarda relación con el de Y… ¿Cómo deberían ser
Y: variable respuesta (numérica) F: factor (cualitativa) Si el valor de F no guarda relación con el de Y… ¿Cómo deberían ser µ1, µ2, µ3? Y Media global µ2 µ1 µ3 F 1 2 3

6 H1: alguna µi es distinta
H0 equivalente a: Y, F son independientes; Y, F no guardan relación; F no influye en el valor de Y; no hay diferencias significativas en Y según distintos valores de F, etc. Rechazar H0 equivale a encontrar dependencia entre F e Y.

7 Pizarra ¿Cómo contrastar H0: µ1= µ2= … = µn
H1: alguna µi es distinta ? Mala idea: varios contrastes H0: µi=µk H1: µi≠µk Buena idea: descomposición de la variabilidad Error de tipo I se acumula, la confianza “total” es demasiado baja Pizarra

8 Yik Residuo del dato Yik: Yik-µi Y Media global µ2 µ1 µ3 F 1 2 3 Yik: el primer subíndice (i) indica el valor del nivel del factor; el segundo (k), el orden que ocupa el dato dentro de los perte- necientes a ese nivel del factor.

9 TABLA DE ANOVA: SCE: suma de cuadr. explicada o entre-grupos SCR: suma de cuadr. residual o intra-grupos SCT: suma de cuadr. totales

10 (es decir, rechazamos cuando la variabilidad explicada es grande)
H0: µ1= µ2= … = µn H1: alguna µi es distinta ? Rechazamos si p-valor < nivel de significación Intuitivamente, aceptaremos cuando la variabilidad explicada es pequeña (es decir, rechazamos cuando la variabilidad explicada es grande) Statgraphics

11 Statgraphics 2. El modelo de ANOVA simple
Descripción del modelo: PIZARRA Requisitos del modelo: 1.- Normalidad en cada nivel de factor. 2.- Homocedasticidad (igual varianza en cada nivel de factor) 3.- Independencia de las observaciones: residuos aleatorios. H0: σ1= σ2= … = σn H1: alguna σi es distinta Statgraphics

12 3. Contraste de Kruskal-Wallis
Método no-paramétrico Util si fallan los requisitos del ANOVA. Realiza un contraste sobre las medianas H0: M1= M2=…= Mn H1: alguna Mi es distinta. - Utiliza la noción de rango. La idea es ordenar de menor a mayor todos los datos (sin atender al nivel del factor del que provienen), asignar rangos, y comparar después los rangos medios correspondientes a los distintos niveles del factor.

13 4. Anova multifactorial PROBLEMA: Dada una variable cuantitativa continua Y, varias variables cualitativas F1, F2,…, Fn, determínese cuáles de ellas influyen en Y, y cuáles no (es decir, cuáles guardan relación con Y). Y: variable respuesta (numérica) F1, F2,…, Fn : factores (cualitativas) Ejemplo: Y tiempo de cura, F1 medicamento administrado, F2 grupo sanguíneo; Y nº de visitas a una página web, F1 nivel de estudios, F2 sexo. Si Fi influye en el valor de Y (si existen diferencias significativas en Y según los distintos valores de Fi) decimos que Fi es SIGNIFICATIVO. Por tanto, un primer problema consiste en determinar cuáles de los factores considerados en un cierto estudio, son significativos.

14 Dos modelos: 1. Sin interacción: consideramos que los efectos de los factores se suman, sin que la combinación de factores produzca cambios cualitativos. PROBLEMA: Determinar factores significativos. 2. Con interacción: consideramos la posibilidad de que la combinación de factores produzca cambios cualitativos. PROBLEMA 1: Determinar factores significativos. PROBLEMA 2: Determinar la existencia de “interacción” entre factores (es decir, qué combinaciones de factores pueden tener un efecto cualitativo distinto a la mera suma de efectos).

15 Dos modelos: 1. Sin interacción: consideramos que los efectos de los factores se suman, sin que la combinación de factores produzca cambios cualitativos. PROBLEMA: Determinar factores significativos. 2. Con interacción: consideramos la posibilidad de que la combinación de factores produzca cambios cualitativos. PROBLEMA 1: Determinar factores significativos. PROBLEMA 2: Determinar la existencia de “interacción” entre factores (es decir, qué combinaciones de factores pueden tener un efecto cualitativo distinto a la mera suma de efectos). Un intento de visualizar qué implica que un factor sea o no significativo….

16 Y 1 2 F2 B A F1

17 Las medias en A y B parecen muy
diferentes; por tanto, F1 significativo. Y µB µA 1 2 F2 B A F1

18 Las medias en 1 y 2 parecen muy
µ1 Y µ2 1 2 F2 B A Las medias en 1 y 2 parecen muy similares; por tanto, F2 NO significativo. F1

19 Esto es lo que, en este caso, debemos
5. Modelo de ANOVA multifactorial sin interacción Modelo: PIZARRA Requisitos del modelo: suponemos que F1 tiene “a” niveles, y F2 tiene “b” niveles. Por tanto, en total hay a.b subgrupos. 1.- Cada uno de los subgrupos es normal. 2.- La varianza es la misma en todos ellos (Homocedasticidad) 3.- Independencia de las observaciones (residuos aleatorios) = Residuos normales N(0,σ); σ: error experimental Esto es lo que, en este caso, debemos comprobar

20 Idea intuitiva de lo que supone la existencia de interacción…
6. Modelo de ANOVA multifactorial con interacción Decimos que existe INTERACCION si los factores no son indepen- dientes, es decir, si el efecto de alguno de ellos depende del nivel en que esté el otro. Idea intuitiva de lo que supone la existencia de interacción…

21 Y 1 2 F2 B A F1

22 F1 NO significativo. Y 1 2 F2 B A F1

23 F2 NO significativo. Y 1 2 F2 B A F1

24 Sin embargo, para aquellos que tienen el primer factor en A, parece
haber diferencias significativas… Y 1 2 F2 B A F1

25 Y análogamente para los que tienen
el primer factor en B Y 1 2 F2 B A F1

26 Esto es lo que, en este caso, debemos
Modelo: PIZARRA Requisitos del modelo: 1,2,3 como en el caso sin interacción (ojo, los residuos no son los mismos en uno y otro caso). = Residuos normales N(0,σ); σ: error experimental Esto es lo que, en este caso, debemos comprobar Statgraphics


Descargar ppt "Tema 6: Análisis de la Varianza"

Presentaciones similares


Anuncios Google