Modelos lineales generales y mixtos

Slides:



Advertisements
Presentaciones similares
ANOVA DE UN FACTOR.
Advertisements

DISEÑOS CON MEDIDAS REPETIDAS
DISEÑOS ANIDADOS CON EFECTOS ALEATORIOS: GENERALIZACIÓN
EXPERIMENTACION.
DISEÑO DE EXPERIMENTOS
DISEÑO DE EXPERIMENTOS
Estadísticas Inferenciales Capítulo 10
Introducción al análisis de la varianza
Estimación de los Errores de Muestreo Encuestas de Salud Reproductiva   RHS Usando SPSS 19.
ANÁLISIS EXPLORATORIO DE DATOS
Elementos del Diseño de Experimentos y Análisis de la Varianza
Bloques aleatorizados, cuadrados latinos y diseños relacionados
TEMA VII.
Diseño de Experimentos
Tests de permutaciones y tests de aleatorización
Correlación 1.
Objetivo estadístico comparar
Ejemplo de un diseño de Experimentos
Regresión lineal Es un modelo matemático para predecir el efecto de una variable sobre otra, ambas cuantitativas. Una variable es la dependiente y otra.
SISTEMAS DE SOPORTE PARA LA TOMA DE DECISIONES
LEAN SIGMA – FASE DE ANÁLISIS Propósito y herramientas 1.
ANÁLISIS EXPLORATORIO DE DATOS
INTRODUCCIÓN GENERAL Causalidad e inferencia causal
Regresión lineal. Definición del problema Evaluar la capacidad explicativa de un conjunto de características socio demográficas que inciden en los ingresos.
INSTRUCCIONES SPSS.
Modelos Lineales Julio Di Rienzo
Diseño en bloques completamente aleatorizados
Análisis de experimentos con submuestras balanceadas
Principios del diseño experimental Maestría Ingeniería Industrial
Curso de Bioestadística. ANOVA
Curso de Geoestadística 3. Análisis Estructural
Investigación Experimental
TEMA X.
ESTADÍSTICA BÁSICA EN ECOLOGÍA EVOLUTIVA Juan J. Soler Cruz Estación Experimental de Zonas Áridas Almería.
Análisis de Varianza (I)
Análisis de datos correlacionados
Análisis de Covarianza
Análisis y diseño de experimentos
Planeación de un diseño
Análisis de la Varianza
Estadística Intermedia
Diseño Completamente Aleatorizado: ejemplo
Análisis de Varianza II
TEMA IX.
CO-2124 Análisis de Varianza con Un Criterio de Clasificación En clases anteriores se deseaba determinar si existían diferencias entre las medias de dos.
USO DEL “ANÁLISIS DE VARIANZA UNA-VÍA”, PARA:
Análisis y diseño de experimentos
DISEÑO ESPERIMENTAL EXPERIMENTACI ÓN AGRÍCOLA Investigación Agrícola IMPORTANTE FORMA DE INVESTIGACIÓN AGRÍC EXPERIMENTACIÓN EN COND PARECIDAS A LAS NATURALES.
PARA LA REGRESIÓN LINEAL SIMPLE
Inferencia Estadística Antonio Núñez, ULPGC. Estadística Física/Tecnología y Estadística  Fenómenos, procesos y sistemas macroscópicos  Indeterminación,
Ingeniería Industrial. Estadística III Henry Lamos Díaz
CUADRADOS LATINOS HENRY LAMOS
La naturaleza del control
LICENCIATURA EN MATEMÁTICAS INFERENCIA ESTADÍSTICA GUÍA DE LECCIONES Y ACTIVIDADES UNIDAD 2: Pruebas de Hipótesis.
Clase 17 Introducción a la Estadística Universidad de la República Centro Universitario Regional del Este Pablo Inchausti Licenciatura en Gestión Ambiental.
DISEÑOS POR BLOQUES ALEATORIZADOS
(niveles o categorías)
REGRESIÓN LINEAL SIMPLE. Temas Introducción Análisis de regresión (Ejemplo aplicado) La ecuación de una recta Modelo estadístico y suposiciones Estimación.
Diseño experimental I.
UNIVERSIDAD NACIONAL DE LA PLATA F ACULTAD DE CIENCIAS AGRARIAS Y FORESTALES Modelos Lineales Generalizados Aplicados a las Ciencias Biológicas Diciembre.
ANÁLISIS DE COVARIANZA En algunas circunstancias, un experimento está afectado por la intervención de un factor muchas veces imprevisible y que no puede.
Experimentos con un solo factor: anÁlIsis de varianza
DISEÑOS EXPERIMENTALES RELACIONADOS CON UN SOLO FACTOR DE ESTUDIO
Modelamiento en mineral
DISEÑO FACTORIAL. En muchas situaciones experimentales resulta de interés estudiar los efectos producidos por dos o más factores simultáneamente; esto.
ANALISIS DE VARIANZA.
Diseño Experimental 1 Santiago Ulloa.
ANAVA a un factor con bloques
ANÁLISIS DE COVARIANZA (ANCOVA)
Transcripción de la presentación:

Modelos lineales generales y mixtos

El modelo lineal mixto DBCA

Varianza de (Y)

Estimación

BLUEs-BLUPs

Pruebas F en modelos mixtos http://www.otago.ac.nz/sas/stat/chap41/sect23.htm#mixedmmt Theory and Computational Methods for LME Models 2.4 Hypothesis Tests and Confidence Intervals pag. 91 v=N-Rango(X|Z) (usualmente)

Pruebas F en modelos mixtos Theory and Computational Methods for LME Models 2.4 Hypothesis Tests and Confidence Intervals pag. 91 v=N-Rango(X|Z) (usualmente)

Análisis de diseños experimentales clásicos mediante modelos mixtos

Yij=  + i + j + ij i=1,...,a; j=1,...,b El modelo clásico Efectos de tratamiento Efectos de bloque Yij=  + i + j + ij i=1,...,a; j=1,...,b a:número de tratamientos, b: número de bloques

DBCA Suposiciones sobre los errores ¿Son los bi efectos fijos o aleatorios? Fijos: inferencia restringida Aleatorios: extensión de la inferencia

DBCA ZGZ’+ R

DBCA

DBCA ZGZ’ R

Costo de la inferencia extendida Varianzas Bloques fijos Bloques aleatorios Costo de la inferencia extendida

Efecto de la fertilización sobre la resistencia de la fibra de algodón Ejemplo Efecto de la fertilización sobre la resistencia de la fibra de algodón

Modelando la heteroscedasticidad Modelo lineal general

Ejemplo Rendimientos de Maíz de 8 híbridos comerciales Diseño completamente aleatorizado con tres repeticiones Datos D1 1496.7 1585.0 1583.0 D2 1540.0 1446.3 1490.0 N1 1790.0 1884.9 1712.0 N2 1581.4 1593.8 1633.5 M1 1617.5 1708.6 1767.1 M2 1688.7 1620.0 1590.0 S1 1304.0 1690.0 1463.5 S2 1350.0 1740.0 1698.0

Si queremos ver la matriz de diseño la sentencia es: model.matrix(Rinde14~Hib,data=datos) Una visualización interesante de los efectos de un factor de clasificación se obtiene con: plot.design(Rinde14~Hib,data=datos)

¿Heteroscedasticidad?

¿Heteroscedasticidad? CRITERIOS DE AGRUPAMIENTO

¿Heteroscedasticidad? modelo1=gls(Rinde14~Hib-1,data=datos) modelo2=gls(Rinde14~Hib-1,data=datos,weight=varIdent(form=~1|Hib)) anova(modelo1,modelo2)

varFunc() varFixed(form) varIdent(value, form,fixed) varPower(value=0,form=~fitted,fixed) varExp(value=0,form=~fitted,fixed) varConstPower(const=1,power=0,form=~fitted,fixed) varComb(lista de funciones de varianza)

varFixed(form) Ejemplo: varFixed(~edad)

varIdent(value,form,fixed) Ejemplo: varIdent(form=~1|Estratos) value=c(1,..,1) fixed=NULL

varPower(value,form,fixed) Ejemplo: varPower(form~fitted(.)|Estratos) value=value=c(0,..,0) fixed=NULL

Ejemplo con datos de diálisis

varExp(value,form,fixed) Ejemplo: varExp(form~edad|Estratos) value=c(0,..,0) fixed=NULL

varConstPower(const,power,form,fixed) Ejemplo: varConstPower(form~fitted(.)|Estratos) const=1,power=0 fixed=list(const,power)

varComb(value,form,fixed) Ejemplo: varComb(varIdent(form~1|Estrato1),varExp(form~edad|Estrato2))

Modelando la correlación

Ejemplo de DBCA analizado utilizando la correlación espacial Para ejemplificar la modelación de la correlación espacial, utilizaremos el archivo Variación Espacial El encabezamiento de este archivo se presenta a continuación:

Ejemplo correlación espacial El diseño es un diseño en bloque para evaluar comparativamente el rendimiento de un número grande de variedades de un cultivo…. La inclusión de los bloques como efecto aleatorio para dar cuenta de la variabilidad entre parcelas no parece ayudar a distinguir entre variedades.

Modelos lineales generales y mixtos modeloRend_0_REML<-lme(Rend~1+Variedad ,random=list(Bloque=pdIdent(~1)) ,method="REML" ,na.action=na.omit ,data=R.data) Variable dependiente:Rend Medidas resumen AIC BIC logLik Sigma 516.77 550.46 -240.39 28.73 Tabla de ANOVA (suma de cuadrados marginal) numDF denDF F-value p-value (Intercept) 1 45 16.75 0.0002 Variedad 15 45 0.38 0.9783 Parámetros de los efectos aleatorios Modelo de covarianzas de los efectos aleatorios: pdIdent Formula: ~1|Bloque Desvíos estándares relativos al residual y correlaciones (Intercept) (Intercept) 7.8E-05

Levelplot de los residuos en función de la posición de la parcela

Modelos de correlación No serial Simetría compuesta (corCompSymm) Serial Desestructurada (corSymm) Autorregresivo de orden 1 (corAR1) AR continuo de orden 1 (corCAR1) Autorregresivo-Medias móviles (corARMA) Espacial (isotrópica) Exponencial (corExp) Gaussiano (corGaus) Lineal (corLin) Rational quadratic (corRatio) Esférica (corSpher)

Simetría compuesta La correlación entre cualquier par de errores dentro de un estrato es la misma. Ejemplo especificado en R (nlme) correlation=corCompSymm(form = ~ 1 | Estrato ) Form=~1 implica que R va a calcular una correlación común para todas las observaciones dentro del estrato Si hay 4 observaciones por estrato y la correlación intraclase es 0.3 la matriz de correlación resultante es:

Modelos de correlación Serial Desestructurada (corSymm) Autorregresivo de orden 1 (corAR1) AR continuo de orden 1 (corCAR1) Autorregresivo-Medias móviles (corARMA)

Desestructurada En este modelo todas las correlaciones pueden ser diferentes Es el modelo más complejo Requiere la estimación de un número grande de parámetros

Desestructurada Ejemplo especificado en R (nlme) correlation=corSymm(form=~1|Estrato). form=~1 implica que R toma la posición de las observaciones en el archivo para calcular las correlaciones Si tengo 4 observaciones en el grupo i-ésimo, y sus correlaciones son: 12=0.2, 13= 0.1, 14=-0.1, 23=0,24=0.2, 34= 0

Autoregresivo de orden 1 kjj’ representa la separación entre las observaciones en una secuencia, usualmente, temporal  es la correlación entre cualquier par de errores cuyas observaciones están “separadas” una unidad (k=1). La correlación entre errores decrece con k

Autoregresivo de orden 1 Ejemplo especificado en R (nlme) correlation=corAR1(form = ~ 1 | Subject ) Form=~1 implica que R toma la posición de las observaciones en el archivo para calcular la separación k. De otra forma hay que especificar una covariable que indica el orden de observación. Si =0.8 y tengo 4 observaciones en el grupo o estrato i-ésimo, su matriz de correlación sería:

Auto-regresivo continuo En este caso sjj’ representa la “separación” entre observaciones en una escala, usualmente, temporal. sjj’ puede variar en una escala continua, a diferencia con el modelo autoregresivo “clásico” que lo hace en una escala entera.

Auto-regresivo continuo Ejemplo especificado en R (nlme) correlation=corCAR1(form = ~ x| Estrato ) Form=~x | Estrato, implica que R toma los valores observados en x para calcular la separación sjj’ dentro del estrato correspondiente. Si =0.8 y tengo 4 observaciones en un grupo su matriz de correlación sería:

Modelo ARMA(p,q) El modelo ARMA es la combinación de un modelo autoregresivo de orden p -AR(p)- y un modelo de medias moviles de orden q -MA(q)-.

Modelo AR(p) En un modelo AR(p) el error en la posición t de la secuencia se modela como: donde at es un término independiente con esperanza cero La función de correlación de un AR(p) se define recursivamente como:

Modelo MA(q) En un modelo MA(q) el error en la posición t de la secuencia se modela como: donde at es un término independiente con esperanza cero La función de correlación de un MA(q) se define recursivamente como:

ARMA(p,q)

Modelo ARMA(1,1) Ejemplo especificado en R (nlme) correlation=corARMA(form =~1|Estrato, p=1, q=1 ) Form=~1 implica que R toma la posición de las observaciones en el archivo para calcular la separación k Si ’=(0.8, 0.4) y tengo 4 observaciones en un grupo su matriz de correlación sería:

Modelos de correlación espacial

Modelos de correlación espacial (isotrópicos) Exponencial (corExp) Gaussiano (corGaus) Lineal (corLin) Rational quadratic (corRatio) Esférica (corSpher)

Semivariograma Still Varianza de la diferencia/2 Nugget h(s, ρ) es la función de correlación, ρ es el parámetro de correlación y “s” la distancia h(0, ρ) = 1 γ(0, ρ) = 0. Still Varianza de la diferencia/2 Nugget Distancia entre parcelas (s)

Semivariogramas de la Correlación espacial

corExp corExp(form = ~ x + y, metric=“man”, nugget = T ) si range=1 y nugget=0.2 la matriz de covarianzas podría ser la siguiente

corGaus corLin corRatio corSpher

Modelos alternativos para la covarianza Los modelos no son directamente comparables mediante la prueba del cociente de verosimilitudes Los criterios de Akaike o de Schwarz se pueden usar para selección de modelo

Ejemplo de DBCA analizado utilizando la correlación espacial Para ejemplificar la modelación de la correlación espacial, utilizaremos el archivo Variación Espacial El encabezamiento de este archivo se presenta a continuación:

Ejemplo correlación espacial El diseño es un diseño en bloque para evaluar comparativamente el rendimiento de un número grande de variedades de un cultivo…. La inclusión de los bloques como efecto aleatorio para dar cuenta de la variabilidad entre parcelas no parece ayudar a distinguir entre variedades.

Modelos lineales generales y mixtos modeloRend_0_REML<-lme(Rend~1+Variedad ,random=list(Bloque=pdIdent(~1)) ,method="REML" ,na.action=na.omit ,data=R.data) Variable dependiente:Rend Medidas resumen AIC BIC logLik Sigma 516.77 550.46 -240.39 28.73 Tabla de ANOVA (suma de cuadrados marginal) numDF denDF F-value p-value (Intercept) 1 45 16.75 0.0002 Variedad 15 45 0.38 0.9783 Parámetros de los efectos aleatorios Modelo de covarianzas de los efectos aleatorios: pdIdent Formula: ~1|Bloque Desvíos estándares relativos al residual y correlaciones (Intercept) (Intercept) 7.8E-05

Levelplot de los residuos en función de la posición de la parcela

La especificación en R Modelos lineales generales y mixtos modeloRend_9_REML<-gls(Rend~1+Variedad ,correlation=corGaus(form=~PosX+PosY ,metric="euclidean" ,nugget=FALSE) ,method="REML" ,na.action=na.omit ,data=R.data)

Variable dependiente:Rend Medidas resumen AIC BIC logLik Sigma 436.16 469.84 -200.08 21.26 Tabla de ANOVA (suma de cuadrados marginal (tipo III)) numDF F-value p-value (Intercept) 1 63.25 <0.0001 Variedad 15 17.90 <0.0001 Estructura de correlación Modelo de correlacion: Gaussian spatial correlation Formula: ~ PosX + PosY Metrica: euclidean Parámetros del modelo Estimación range 1.55

La correlación entre parcelas como función de la distancia es

Medidas ajustadas y errores estándares para Variedad Variedad Medias E.E. F 73.98 7.34 A G 71.09 6.63 A B J 69.97 6.63 A B N 68.37 6.93 A B C M 68.10 6.91 A B C L 67.39 7.39 A B C D O 64.39 6.64 A B C D C 64.33 7.05 A B C D E 64.04 6.91 B C D H 61.68 7.16 B C D E I 59.73 6.93 C D E D 57.67 6.80 C D E P 57.59 6.95 C D E K 57.38 6.63 D E A 52.05 6.54 E B 51.82 6.67 E Letras distintas indican diferencias significativas(p<= 0.05

El mejor ajuste obtenido por la modelación de la correlación espacial podría haberse obtenido igualmente incluyendo como efectos fijos la posición x e y de la parcela actuando como regresoras. No siempre, sin embargo, es posible corregir tan fácilmente las respuesta utilizando un modelo de efectos fijos.

Otro ejemplo de correlación espacial Los datos en el archivo Otra variación espacial presenta un caso similar al anterior pero donde el patrón de variación espacial es menos regular. Aquí la modelación de la correlación es una clara ventaja.