Tema 6: Análisis de la Varianza

Slides:



Advertisements
Presentaciones similares
DISEÑO DE EXPERIMENTOS EXPERIMENTOS DE COMPARACIÓN SIMPLE
Advertisements

ANOVA DE UN FACTOR.
Análisis de Datos en Economía
Master en Recursos Humanos
KRUSKAL WALLIS Jorge Iván Betancur Marta Isabel Naranjo García
Pronósticos, Series de Tiempo y Regresión
Bloques aleatorizados, cuadrados latinos y diseños relacionados
ANÁLISIS DE LA VARIANZA (ANOVA)
Contraste de Hipótesis ETSITGC Madrid Unidad Docente de Matemáticas.
ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN SOCIAL
Problema de la medición en Psicología
Tema 6: Análisis de la Varianza (1ª parte: ANOVA simple)
ANOVA Modelo I: Comparación entre medias
CURSO DE ESTADÍSTICA BÁSICA
Regresión Lineal Simple
Clases 3 Pruebas de Hipótesis
(niveles o categorías)
CONTRASTE Y VALIDACIÓN DE UN MODELO
Diseño en bloques completamente aleatorizados
ANOVA (Analysis of Variation)
con Dos Criterios de Clasificación
Pronósticos, Series de Tiempo y Regresión
Tema 8: Análisis Multivariante. Conjunto de técnicas aplicables cuando se registran los valores de muchas variables (esencialmente numéricas, pero también.
Universidad de Chile Facultad de Ciencias Químicas y Farmacéuticas
Tema 7: Regresión Simple y Múltiple. EJEMPLO: Aproxima bien el número de préstamos que efectúa una biblioteca a lo largo de su primer año de vida. Nos.
ESTADÍSTICA BÁSICA EN ECOLOGÍA EVOLUTIVA Juan J. Soler Cruz Estación Experimental de Zonas Áridas Almería.
Estadística aplicada a la educación
Tema 7: Regresión Simple
Análisis Cuantitativo de Datos (Básico)
Titular: Agustín Salvia
Normalidad, Variabilidad y estimación del Modelo de Regresión
Tema 6: Análisis de la Varianza (2ª parte: ANOVA multifactorial)
Amarilis García / Omaira De Los Santos.- Caracas, Diciembre 2009 USO DEL “ANÁLISIS DE VARIANZA UNA-VÍA”, PARA: Contrastar la hipótesis sobre, la diferencia.
Análisis de la Varianza
Tema 5: Numéricas en varios grupos
LABORATORIO Sesión 3 COMPARACIÓN DE DOS POBLACIONES.
Tema 5: Contrastes de Hipótesis no-paramétricos
Regresión lineal simple
Regresión lineal múltiple
UNIDAD 1.- EVALUACIÓN DE DATOS ANALITICOS
ESTADISTICA PROBLEMA 1: Queremos comparar los préstamos de dos bibliotecas situadas en zonas similares. 1.- ¿Es “normal” la variable préstamo en cada una.
CO-2124 Análisis de Varianza con Un Criterio de Clasificación En clases anteriores se deseaba determinar si existían diferencias entre las medias de dos.
Análisis y diseño de experimentos
COMPARACION DE MEDIAS Para comparar media utilizando la prueba T hay Ttres opciones diferentes utilizando contrastes de hipotesis sobre : PARA UNA MUESTRA.
USO DEL “ANÁLISIS DE VARIANZA UNA-VÍA”, PARA:
PRUEBAS ESTADISTICAS NO PARAMETRICAS
Análisis y diseño de experimentos
Métodos Cuantitativos
Taller 2 Reflexiones sobre Metodología Cuantitativa: Potencial de la comparación de muestras Germán Fromm R.
PARA LA REGRESIÓN LINEAL SIMPLE
Capitulo 4 Análisis descriptivo inferencial: comparaciones múltiples
Regresión Lineal Simple
BASES PARA EL RAZONAMIENTO EN ESTADÍSTICA INFERENCIAL
CONTRASTES NO PARAMÉTRICOS
DISEÑOS DE EXPERIMENTOS FACTORIALES
Pruebas paramétricas y no paramétricas
DISEÑOS POR BLOQUES ALEATORIZADOS
(niveles o categorías)
Pasos del Método Científico.
REGRESIÓN LINEAL SIMPLE. Temas Introducción Análisis de regresión (Ejemplo aplicado) La ecuación de una recta Modelo estadístico y suposiciones Estimación.
REGRESIÓN LINEAL SIMPLE TEMA INTRODUCCIÓN Determinar la ecuación de regresión sirve para: – Describir de manera concisa la relación entre variables.
Experimentos con un solo factor: anÁlIsis de varianza
MÁS DE DOS MUESTRAS Procedimientos paramétricos. Pruebas de diferencias entre más de dos muestras *Con cálculos diferentes de SC y gl, según el caso.
1 REGRESIÓN CON VARIABLES DICOTÓMICAS TEMA 1 (CONTINUACIÓN)
Análisis de datos: La ordenación de datos. ● En el análisis de datos se define la información recogida ● Se deben seleccionar las propiedades que se han.
METODO DE MAXIMA PENDIENTE
Free and Quick translation of Prof. Anderson's slides1 Analisis de Regresion Multiple y =  0 +  1 x 1 +  2 x  k x k + u 1. Estimacion.
ANALISIS DE VARIANZA.
Comparación no paramétrica de K medias independientes Briana Gómez Ramírez Natalia Zapata López.
Transcripción de la presentación:

Tema 6: Análisis de la Varianza

PROBLEMA 1: Dada una variable cuantitativa continua Y, y una variable cualitativa F, determínese si entre ambas hay relación, o no. Ejemplos: Tiempo de cura / medicamento utilizado Rendimiento de cosechas / fertilizante Renta familiar / hábito de lectura Número de préstamos / ubicación PROBLEMA 2: Dada una variable cuantitativa continua Y, y varias variables cualitativas F1, F2,…, Fn, determínese cuáles de ellas infuyen en Y, y cuáles no (es decir, cuáles guardan relación con Y). Ejemplos: Tiempo de cura / medicamento utilizado, grupo sanguíneo Número de préstamos / sexo, nivel de estudios, afición al cine

PROBLEMA 1: Dada una variable cuantitativa continua Y, y una variable cualitativa F, determínese si entre ambas hay relación, o no. Y: variable respuesta (numérica) F: factor (cualitativa) ANOVA simple PROBLEMA 2: Dada una variable cuantitativa continua Y, varias variables cualitativas F1, F2,…, Fn, determínese cuáles de ellas infuyen en Y, y cuáles no (es decir, cuáles guardan relación con Y). Y: variable respuesta (numérica) F1, F2,…, Fn : factores (cualitativas) ANOVA multifactorial

Y: variable respuesta (numérica) F: factor (cualitativa) 1. ANOVA simple: idea ¿Son independientes Y y F? ¿Hay relación entre Y y F? ¿Hay diferencias significativas en el valor de Y, según que F tome uno u otro valor? ¿Influye F en el valor de Y? Y Medias en cada nivel de factor µ2 µ1 µ3 F 1 2 3 Niveles de factor

Si el valor de F no guarda relación con el de Y… ¿Cómo deberían ser Y: variable respuesta (numérica) F: factor (cualitativa) Si el valor de F no guarda relación con el de Y… ¿Cómo deberían ser µ1, µ2, µ3? Y Media global µ2 µ µ1 µ3 F 1 2 3

H1: alguna µi es distinta H0 equivalente a: Y, F son independientes; Y, F no guardan relación; F no influye en el valor de Y; no hay diferencias significativas en Y según distintos valores de F, etc. Rechazar H0 equivale a encontrar dependencia entre F e Y.

Pizarra ¿Cómo contrastar H0: µ1= µ2= … = µn H1: alguna µi es distinta ? Mala idea: varios contrastes H0: µi=µk H1: µi≠µk Buena idea: descomposición de la variabilidad Error de tipo I se acumula, la confianza “total” es demasiado baja Pizarra

Yik Residuo del dato Yik: Yik-µi Y Media global µ2 µ µ1 µ3 F 1 2 3 Yik: el primer subíndice (i) indica el valor del nivel del factor; el segundo (k), el orden que ocupa el dato dentro de los perte- necientes a ese nivel del factor.

TABLA DE ANOVA: SCE: suma de cuadr. explicada o entre-grupos SCR: suma de cuadr. residual o intra-grupos SCT: suma de cuadr. totales

(es decir, rechazamos cuando la variabilidad explicada es grande) H0: µ1= µ2= … = µn H1: alguna µi es distinta ? Rechazamos si p-valor < nivel de significación Intuitivamente, aceptaremos cuando la variabilidad explicada es pequeña (es decir, rechazamos cuando la variabilidad explicada es grande) Statgraphics

Statgraphics 2. El modelo de ANOVA simple Descripción del modelo: PIZARRA Requisitos del modelo: 1.- Normalidad en cada nivel de factor. 2.- Homocedasticidad (igual varianza en cada nivel de factor) 3.- Independencia de las observaciones: residuos aleatorios. H0: σ1= σ2= … = σn H1: alguna σi es distinta Statgraphics

3. Contraste de Kruskal-Wallis Método no-paramétrico Util si fallan los requisitos del ANOVA. Realiza un contraste sobre las medianas H0: M1= M2=…= Mn H1: alguna Mi es distinta. - Utiliza la noción de rango. La idea es ordenar de menor a mayor todos los datos (sin atender al nivel del factor del que provienen), asignar rangos, y comparar después los rangos medios correspondientes a los distintos niveles del factor.

4. Anova multifactorial PROBLEMA: Dada una variable cuantitativa continua Y, varias variables cualitativas F1, F2,…, Fn, determínese cuáles de ellas influyen en Y, y cuáles no (es decir, cuáles guardan relación con Y). Y: variable respuesta (numérica) F1, F2,…, Fn : factores (cualitativas) Ejemplo: Y tiempo de cura, F1 medicamento administrado, F2 grupo sanguíneo; Y nº de visitas a una página web, F1 nivel de estudios, F2 sexo. Si Fi influye en el valor de Y (si existen diferencias significativas en Y según los distintos valores de Fi) decimos que Fi es SIGNIFICATIVO. Por tanto, un primer problema consiste en determinar cuáles de los factores considerados en un cierto estudio, son significativos.

Dos modelos: 1. Sin interacción: consideramos que los efectos de los factores se suman, sin que la combinación de factores produzca cambios cualitativos. PROBLEMA: Determinar factores significativos. 2. Con interacción: consideramos la posibilidad de que la combinación de factores produzca cambios cualitativos. PROBLEMA 1: Determinar factores significativos. PROBLEMA 2: Determinar la existencia de “interacción” entre factores (es decir, qué combinaciones de factores pueden tener un efecto cualitativo distinto a la mera suma de efectos).

Dos modelos: 1. Sin interacción: consideramos que los efectos de los factores se suman, sin que la combinación de factores produzca cambios cualitativos. PROBLEMA: Determinar factores significativos. 2. Con interacción: consideramos la posibilidad de que la combinación de factores produzca cambios cualitativos. PROBLEMA 1: Determinar factores significativos. PROBLEMA 2: Determinar la existencia de “interacción” entre factores (es decir, qué combinaciones de factores pueden tener un efecto cualitativo distinto a la mera suma de efectos). Un intento de visualizar qué implica que un factor sea o no significativo….

Y 1 2 F2 B A F1

Las medias en A y B parecen muy diferentes; por tanto, F1 significativo. Y µB µA 1 2 F2 B A F1

Las medias en 1 y 2 parecen muy µ1 Y µ2 1 2 F2 B A Las medias en 1 y 2 parecen muy similares; por tanto, F2 NO significativo. F1

Esto es lo que, en este caso, debemos 5. Modelo de ANOVA multifactorial sin interacción Modelo: PIZARRA Requisitos del modelo: suponemos que F1 tiene “a” niveles, y F2 tiene “b” niveles. Por tanto, en total hay a.b subgrupos. 1.- Cada uno de los subgrupos es normal. 2.- La varianza es la misma en todos ellos (Homocedasticidad) 3.- Independencia de las observaciones (residuos aleatorios) 1 + 2 + 3 = Residuos normales N(0,σ); σ: error experimental Esto es lo que, en este caso, debemos comprobar

Idea intuitiva de lo que supone la existencia de interacción… 6. Modelo de ANOVA multifactorial con interacción Decimos que existe INTERACCION si los factores no son indepen- dientes, es decir, si el efecto de alguno de ellos depende del nivel en que esté el otro. Idea intuitiva de lo que supone la existencia de interacción…

Y 1 2 F2 B A F1

F1 NO significativo. Y 1 2 F2 B A F1

F2 NO significativo. Y 1 2 F2 B A F1

Sin embargo, para aquellos que tienen el primer factor en A, parece haber diferencias significativas… Y 1 2 F2 B A F1

Y análogamente para los que tienen el primer factor en B Y 1 2 F2 B A F1

Esto es lo que, en este caso, debemos Modelo: PIZARRA Requisitos del modelo: 1,2,3 como en el caso sin interacción (ojo, los residuos no son los mismos en uno y otro caso). 1 + 2 + 3 = Residuos normales N(0,σ); σ: error experimental Esto es lo que, en este caso, debemos comprobar Statgraphics